XML-pohjaiset rakennemäärittelyt



Samankaltaiset tiedostot
Paikkatiedot ja Web-standardit

XML johdanto, uusimmat standardit ja kehitys

W3C-teknologiat ja yhteensopivuus

3 Verkkosaavutettavuuden tekniset perusteet

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

Sisältö. XML, XHTML ja CSS XML XML. XML:n ja HTML:n ero. XML kieliä XML XHTML CSS XSL. T Hypermediadokumentin laatiminen 2002

W3C ja alueellinen standardointi

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

W3C, Web-teknologiat ja XML

3 Verkkosaavutettavuuden tekniset perusteet

7 DTD ja entiteetit: dokumentin fyysinen rakenne

W3C, Web-teknologiat ja Semanttinen Web

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

XML standardeja. nimiavaruudet, namespaces XHTML XML Schema linkitys Jaana Holvikivi 1

XML, XHTML ja CSS. T Hypermediadokumentin laatiminen. Mikko Pohja

W3C: teknologia ja (tieto)yhteiskunta

Rakenteisten dokumenttien jatkokurssi, syksy 2006

Vaasan yliopiston toimintaa tukevat informaatiopalvelut ovat käytettävissä WWW:n kautta.

WWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys

W3C ja Web-teknologiat

2. PEHMEÄ XHTML XRAJAHTML

7 DTD ja entiteetit: dokumentin fyysinen rakenne

Digitaalisen median tekniikat. JSP ja XML Harri Laine 1

Digitaalisen median tekniikat. JSP ja XML

W3C & verkkojulkaisun standardit

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

W3C ja Web-teknologiat

Dokumenttien tietosisällön hallinta

Luento 12: XML ja metatieto

3.27 "Tuotantoesimerkkien" rakenne ja viittaukset (1/2)

Avoimet standardit ja arkistointi

Luento 1: Johdanto merkintäkieliin

Yhteentoimivuutta edistävien työkalujen kehittäminen

XML-tietojenkäsittely

3.11 HTML-dokumentin ulkoasu?

XML / DTD / FOP -opas Internal

XML kielioppi. Elementtien ja attribuuttien määrittely. Ctl230: Luentokalvot Miro Lehtonen

Sisällys. Valtion tietotekniikan rajapintasuosituksia. XML:n rooleja sähköisen asioinnin tavoitearkkitehtuurissa. dbroker - asiointialusta

Johdatus XML teknologioihin

XML-evoluutio ja kestävä kehitys

Proseduraalinen dokumentti: sisältö, rakenne ja ulkoasu yhdessä, esim. worddokumentti

XML-saatavuuskysely. XML-tiedoston kuvaus. versio

XML-metakieli, k

6 Semanttinen Web 101

XML, standardointi ja kehitys

NELLI-Tunnis. Käyttäjän tunnistus NELLI-tiedonhakuportaalissa yleisissä kirjastoissa. Versio Ere Maijala Kansalliskirjasto

9.16 XSLT ja nimiavaruudet (1/3): literaali oletusnimiavaruus

Johdatus rakenteisiin dokumentteihin

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

W3C ja Web-teknologiat

Tutkitaan sitten HTML-dokumenttien anatomiaa, jotta päästään käsiksi rakenteisten dokumenttien käsitteistöön esimerkkien kautta.

6 Semanttinen Web 101

2 XML Schema: johdanto ja rakenteiden perusteet

RDF ja RDFS. 8 RDF ja RDFS

13 Tiedostot, dokumentit, tieto (&h-media)

6 Semanttinen Web 101

Hohde Consulting 2004

XML Technologies and Applications - harjoitustyö -

HTML & CSS. HTML (HyperText Markup Language) Antti Koivisto. ! HTML on sivujen kuvauskieli.

2 XML Schema: johdanto ja rakenteiden perusteet

Verkkopalveluiden saavutettavuus

Heikki Helin Metatiedot ja tiedostomuodot

10 Ohjelmoinnista Semanttisessa Webissä

W3C, XML ja tietojenkäsittely: Ihmisen ja tietokoneen yhteinen ymmärrys suoritettavasta tehtävästä ja XML-standardien merkitys tietosysteemeissä (MH)

Mikä on semanttinen web?

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

H T M L eli kuinka laadin itselleni päheät kotisivut. Janne Käki

XML - mahdollisuudet ja kehitys

Sisällönhallinnan menetelmiä

XPages käyttö ja edut Jarkko Pietikäinen toimitusjohtaja, Netwell Oy

XML ja Web Services update

Poikkeusinfo XML-rajapinnan kuvaus, rajapinnan versio 2 Seasam Group

Metatiedot organisaatioiden sisällönhallinnassa

XML prosessori. XML prosessointi. XML:n kirjoittaminen. Validoiva jäsennin. Tapahtumaohjattu käsittely. Tapahtumaohjattu käsittely.

Opiskeluoikeudet. Kaaviokuva

XML-merkkaus. Merkkidata, prosessointikomennot, kommentit

13 Tiedostot, dokumentit, tieto (&h-media)

2.17 Esimerkki järkevän relaatiotietokannan rakenteesta

Verkkosisällön saavutettavuusohjeet 2.0: hyviä ohjeita monimuotoisen sisällön suunnitteluun ja arviointiin

10 Tiedostot, dokumentit, tieto (&h-media)

Yleistä. Dokumentin mallintaminen. Dokumentin analysointi. Desktop publishing vs. XML. Tietokantakaavion analysointi. Dokumentin osien analysointi

Verkkojulkaiseminen Minna Väisänen. HTML5-tehtävä

Neoxen Systems on suomalainen ohjelmistotalo. Olemme erikoistuneet tiedon- ja oppimisen hallinnan ratkaisuihin.

Arkistoaineistojen sisällönkuvailu

Digitaalisen median tekniikat xhtml - jatkuu Harri Laine 1

The OWL-S are not what they seem

Avoimet standardit ja asiakirjamuodot Suomen julkisessa hallinnossa: teoriasta käytäntöön

Code Camp for Girls. Sanna Nygård. Lokakuussa

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

StanForD-XML. Juha-Antti Sorsa, Tapio Räsänen, Vesa Imponen

Sosiaalihuollon asiakirjastandardi kehittyy. Konstantin Hyppönen Erikoissuunnittelija Tietojenkäsittelytieteen laitos Kuopion yliopisto

Luento 7: XML-ohjelmointirajapinnat

XHTML - harjoitus. Tehtävä1: Tee xhtml tiedosto käyttäen notepad (muistio) ohjelmaa. Tiedoston tallennus notepad (muistio) ohjelmassa:

Interfacing Product Data Management System

12 Dokumenttiluokan toteuttamisesta

Ulkopuolisen tyylitiedoston käyttö

Suvi Remes Miika Alonen Petri Mustajoki Totti Tuhkanen

Verkkosaavutettavuuden tekniset perusteet. 3.1 Välisoitto

Kurssin aloitus. AS XML-kuvauskielten perusteet Janne Kalliola

Transkriptio:

-pohjaiset rakennemäärittelyt Ossi Nykänen Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Esitelmä Hyvin lyhyt versio: -perustainen kommunikointi edellyttää sopimuksia käytettyjen tietorakenteiden muodosta ja tulkinnasta. Perustekniikka ei kuitenkaan käytännössä vielä riitä: tarvitaan myös sovelluskohtaisia, :n varaan rakentuvia sopimuksia. Pidempi versio, otsikoita: tiedon välittäjänä esimerkkejä -tekstiformaateista tyyppimäärittelyn tekniset perusteet dokumentti- ja datalähtöiset sovellukset, sanastotyö Esityksen tavoite: luonnehtia yhteensopivan perustekniikan ja -sovellusten suhdetta 2

Mitä tietoa välittää ja miten?

Eri sovellukset tarvitsevat erilaista tietoa siis tarjoaa rajapinnan tiedon välittämiseen...mutta pelkkä ei kerro mitä tietoa tietorakenteessa on esitetty ja miten (sanasto ja sen käyttö) SVG XHTML DC RDF EDI SOAP Tarvitaan siis -merkkauksen varassa toimivia dokumentti- ja viestistandardeja, sopimuksia kerättävistä metatiedoista, jne. 4

Dokumentin (elementin) tyyppi Mekaanisen tietojenkäsittelyn perusta on dokumentin tyypistä sopiminen (etukäteen sovitut tietorakenteet) Käytännössä dokumentin tyyppimääritys sisältää useita osia, ainakin formaalin tietorakenteen määritys (muotti) kuvaus rakenteen merkityksestä sovelluksessa (muotin selitys) Tuttu esimerkki: XHTML kirjoitusprosessi on tyyppiä index.html DTD XHTML 1.0 Strict validointi (yksittäisen dokumentin rakenteen tarkistus) osaa lukea ja toteuttaa (DTD = Document Type Definition) 5

Johdattelevia esimerkkejä yleisesti tunnetuista tekstiformaateista

Esimerkki: XHTML & CSS XHTML-dokumentin esitystapa voidaan asettaa esim. CSS-tyyliohjeen avulla (Cascading Style Sheet): body { background: yellow; /* Pohja */ font-family: "Arial", sans-serif; color: rgb(0,0,50); } p { text-align:right; } p a { background: white; font-size: 150%; } a:active { background: black; color: white; } <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/tr/xhtml1/dtd/xhtml1- strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en"> <head> <title>virtual Library</title> <link rel="stylesheet" type="text/css" href="pc-yell.css"/></head> <body> <p>check <a href="http://example.org/">example.org</a>.< /p> </body> </html> <!-- Mod. --> (Vrt. modulaarinen XHTML ja XHTML Basic) 7

Esimerkki: Scalable Vector Graphics 8

Esimerkki: SMIL Synchronized Multimedia Integration Language (multimediaesitykset) Kuva ja esimerkki: C. Forno 9

Esimerkki: WML Kuva ja esimerkki: ThinkBurst Media 10

Esimerkki: SOAP ja palveluväylän idea Simple Object Access Protocol -pohjainen viestiformaatti ("-kirjekuori") Ts. tiedonvälitys ilman "esittämisen" ideaa <SOAP-ENV:Envelope xmlns:soap-env="http://schemas.xmlsoap.org/soap/envelope/" SOAP- ENV:encodingStyle="http://schemas.xmlsoap.org/soap/encoding/"> <SOAP-ENV:Body> <m:getlasttradeprice xmlns:m="http://example.org/trade"> <m:id>dis</m:id> </m:getlasttradeprice> </SOAP-ENV:Body> </SOAP-ENV:Envelope> Kuva: W3C. 2004 11

Esimerkki: Resource Description Format -pohjainen esitystapa standardin RDF-tietomallin mukaiselle tiedolle Huom. tietorakenne () vs. tietomalli (RDF & SemWeb) <?xml version="1.0"?> <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:contact="http://www.w3.org/2000/10/swap/pim/contact#"> <contact:person rdf:about="http://www.w3.org/people/em/contact#me"> <contact:fullname>eric Miller</contact:fullName> <contact:mailbox rdf:resource="mailto:em@w3.org"/> <contact:personaltitle>dr.</contact:personaltitle> </contact:person> </rdf:rdf> Kuva: W3C. 2004 12

Dokumentin tyypin määrittely teknisesti: DTD ja Schema

Dokumentin formaalin tyypin määrittely -standardiperhe tarjoaa -dokumentin tyypin määrittelyyn kaksi menetelmää DTD (Document Type Definition -kieli, sisältyy 1.0/1.1:een) Schema -skeemakieli (Primer, Structures, Datatypes) Molempien perusidea on sama tyyppimääritys kuvaa säännöt joita tietyntyyppisen dokumentin (elementin) tulee noudattaa dokumentti, joka noudattaa tyyppimäärittelyä se-ja-se, on tätä tyyppiä (...tulkitsija voi luottaa että ainakin rakenne on sovittu) Keskeisiä eroja -skeemat on ilmaisuvoimaisempi kuin DTD DTD-kieli sisältää välineitä myös dokumentin fyysisen rakenteen määrittelyyn (ns. entiteetiit) 14

Esimerkki DTD-määrittelystä Määritellään tyyppimääritys muistio.dtd <!ELEMENT muistio (otsikko, asia?, huom+) > <!ATTLIST muistio pvm CDATA #REQUIRED > <!ATTLIST muistio henk (on jfk th) #IMPLIED > <!ELEMENT otsikko (#PCDATA) > <!ELEMENT asia (#PCDATA) > <!ELEMENT huom (#PCDATA) >...johon sitten viitataan dokumenteissa <?xml version="1.0" encoding="iso-8859-1"?> <!DOCTYPE muistio SYSTEM "muistio.dtd" > <muistio pvm="2005-01-20"> <otsikko>-koulutus</otsikko> <asia>muista ilmoittautua koulutukseen 16.2.2005.</asia> <huom>siis Radisson SAS, Hki.</huom> </muistio> 15

Esimerkki -skeemamäärittelystä Sama idea, mutta rikkaampi, -pohjainen kieli <xsd:schema xmlns:xsd="http://www.w3.org/2001/schema"> <xsd:element name="muistio" type="muistiotype"/> <xsd:complextype name="muistiotype"> <xsd:sequence> <xsd:element name="otsikko" type="xsd:string"/> <xsd:element name="asia" type="xsd:string" minoccurs="0"/> <xsd:element name="huom" type="xsd:string" maxoccurs="unbounded"/> </xsd:sequence> <xsd:attribute name="pvm" type="xsd:date" use="required"/> <xsd:attribute name="henk" type="henkilottype" use="optional"/> </xsd:complextype> <xsd:simpletype name="henkilottype"> <xsd:restriction base="xsd:string"> <xsd:enumeration value="on"/> <xsd:enumeration value="jfk"/> <xsd:enumeration value="th"/> </xsd:restriction> </xsd:simpletype> </xsd:schema> 16

Huomautuksia -skeemojen määrittely tarjoaa DTD:tä enemmän eväitä tietorakenteiden suunnitteluun sääntöjen mutkikkuus, (johdettujen) tietotyyppien käyttö, nimiavaruudet...ja aivan kuten esim. tietokantasuunnittelussa, tyyppimääritys vain kirjaa suunnittelutyön lopputuloksen Hyvän tyyppimäärityksen suunnittelu on yleensä vaativaa työtä joka vaatii niin sovellusosaamista kuin teknistä ammattitaitoakin suunnittelun tavoitteet, reunaehdot ja rajoitteet tiedon (uudelleen-) käyttö mallintaminen tekninen kirjoittaminen 17

Dokumentit vs. data, sanastotyö

Dokumentit tiedon välittäjinä Dokumentti on "ihmisen ymmärtämäksi tarkoitettu kokonaisuus joka käsittää rajatun määrän rakenteista tai ryhmiteltyä tietoa tietovälineessä" Data puolestaan on "tietoa luettavassa, viestittävässä tai käsiteltävässä muodossa" Rajanveto dokumentti- ja datalähtöisten sovellusten välillä ei ole tarkka, koska kaikki tieto on luettavissa dokumenteista myös paloittain datasta (tietueista, fragmenteista, entiteeteistä,...) voidaan myös sopivien kuvailujen avulla koostaa dokumentteja Erot löytyvät lähinnä... tiedon tuottamisen ja hallinnan tavasta ja dynaamisuudesta työhön käytettävistä välineistä ja tekniikoista (esim. muunnokset vs. kyselyt) 19

Dokumenttien käsittelystä: hallintaprosessi Dok. käsittely vaiheittaisina prosesseina sisältöä on usein kätevintä mallintaa ja tuottaa melko isoissa loogisissa osissa koko prosessi kuvattu ylätasolla; yksittäisiin käsittelyvaiheisiin tuodaan tuodaan juuri niin vähän teknistä informaatiota tietoa kuin tarpeen...optimointia prosessin hallittavuuden ja sisällön kuvailutyön välillä esim. 20

Datan koostamisesta: syndikointi Tyyppiesimerkkejä datalähtöisistä sovelluksista ovat useat Semanttisen Webin sovellukset, esim. RSStekniikan varassa julkaistut "ilmoitukset" (tietolistat)...kuvattu metatiedoin, tarkoitettu yhdisteltäväksi ja haettavaksi osana muita sovelluksia (uutiset, päivityspaketit, ruokalistat,...) ks. esim. http://www.oreillynet.com/meerkat/ organisaation A tiedotteet ja verkkouutiset organisaation B tiedotteet ja verkkouutiset saatavilla olevia tietolistoja yhdistelevä ja suodattava sovellus organisaation C tiedotteet ja verkkouutiset (RSS (1.0) = RDF Site Summary) 21

Skeemamäärittelyt vs. sanastotyö Datalähtöiset sovellukset eivät voi toimia ilman yleiskäyttöisiä kuvailusanastoja esim. RSS-kanavat pitää tietenkin kuvata yhteensopivilla käsitteillä ja julkaista yhteisen tietomallin puitteissa Sanastotyössä voidaan erottaa useita tasoja, esim. sovelluskohtaiset käsitemallit (esim. kirjastoalan käsitteistö) käsitteitä, yksilöitä ja näiden suhteita kuvaavat sanastot (esim. Dublin Core) sopimukset sanastojen predikaattien käytöstä ja tulkinnasta (esim. luokitukset) Sanastotyö on monessa mielessä esim. laaja-alaisten datalähtöisten sovellusten haastavin osa-alue! 22

Välitilinpäätös ennen seuraavaa esitystä...

Yhteenveto tarjoaa yhteensopivan perustan mitä moninaisemmille sovelluksille ja välineitä sovelluskohtaisten tietorakenteiden määrittelyyn Rakennemäärittelyjen reunaehtoina toimivat mm. teknisen kirjoittamisen reunaehdot käsittelyn välineet ja tekniikat aihepiirin standardisanastot ja -sovellukset Kysymyksiä, kommentteja? 24

Liite 1: lähteitä ja lisälukemista W3C Interaction domain (XHTML, SVG,...) http://www.w3.org/interaction/ Schema http://www.w3c.org//schema Cover Pages: Extensible Markup Language () http://xml.coverpages.org/xml.html + etsi termejä : www.google.fi, www.xml.com, jne 25

Liite 2: monikanavajulkaiseminen General processing based on the declarative domain concepts Specific processing based on the publishing media Authoring [guides] Manuscript schema [produces] 0..n [produces] Retouch Media object Manuscript Select media for deliverables [media X] Publishing pre-processing [produces] Formatting objects [used for] Formatting [generates] [enhanced with expicit] [guided by] metadata domain ontology Product Postprocessing Authoring deliverables in format X 26