Semanttinen Web ja XMLlinkitys



Samankaltaiset tiedostot
W3C ja Web-teknologiat

W3C: teknologia ja (tieto)yhteiskunta

W3C ja Web-teknologiat

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

W3C ja alueellinen standardointi

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

W3C-teknologiat ja yhteensopivuus

Paikkatiedot ja Web-standardit

W3C ja Web-teknologiat

W3C & verkkojulkaisun standardit

XML johdanto, uusimmat standardit ja kehitys

XML-evoluutio ja kestävä kehitys

W3C, Web-teknologiat ja XML

Luento 12: XML ja metatieto

W3C, XML ja tietojenkäsittely: Ihmisen ja tietokoneen yhteinen ymmärrys suoritettavasta tehtävästä ja XML-standardien merkitys tietosysteemeissä (MH)

XML ja Web Services update

XML - mahdollisuudet ja kehitys

3 Verkkosaavutettavuuden tekniset perusteet

Semanttinen Web ja Webteknologiat

Avoimet standardit ja arkistointi

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

W3C, Web-teknologiat ja Semanttinen Web

Verkkosisällön saavutettavuusohjeet 2.0: hyviä ohjeita monimuotoisen sisällön suunnitteluun ja arviointiin

Tutkitaan sitten HTML-dokumenttien anatomiaa, jotta päästään käsiksi rakenteisten dokumenttien käsitteistöön esimerkkien kautta.

Dokumenttien tietosisällön hallinta

XML, standardointi ja kehitys

Verkkopalveluiden saavutettavuus

Johdatus rakenteisiin dokumentteihin

Mikä on semanttinen web?

Metatiedot organisaatioiden sisällönhallinnassa

Heikki Helin Metatiedot ja tiedostomuodot

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Sisällönhallinnan menetelmiä

Rakenteiset dokumentit Mitä hyötyä niistä on?

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

XHTML - harjoitus. Tehtävä1: Tee xhtml tiedosto käyttäen notepad (muistio) ohjelmaa. Tiedoston tallennus notepad (muistio) ohjelmassa:

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

StanForD-XML. Juha-Antti Sorsa, Tapio Räsänen, Vesa Imponen

Hohde Consulting 2004

Semanttinen web ja sukututkimus

Web-teknologiat. XML-datan kysely Topi Sarkkinen

Rakenteisten dokumenttien jatkokurssi, syksy 2006

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

WWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys

10 Nykyaikainen WWW-arkkitehtuuri

Suomen Lions-liitto ry Käyttäjätunnus ja sisäänkirjautuminen MyLCI - Käyttäjäohje Versio

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Luento 1: Johdanto merkintäkieliin

XPages käyttö ja edut Jarkko Pietikäinen toimitusjohtaja, Netwell Oy

Semanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen

The OWL-S are not what they seem

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

XML-pohjaiset rakennemäärittelyt

W3C, XML ja sovellukset

XML-pohjaisten standardien kehitystyö W3C:ssä: poimintoja tulevasta

Paikannimirekisteri linkitettynä tietona

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

6 Semanttinen Web 101

Johdatus XML teknologioihin

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

URI:n muodostamisen prosessi (suositusluonnoksen liite 1)

XML-tietojenkäsittely

XML Finland seminaari : Office 2007 XML dokumenttituotannossa

Sisältöjen hallinta verkottuneessa tietoympäristössä

Internet jolla on merkitystä

Metatiedot lainsäädäntötiedon hallinnassa

XHTML+RDFa-standardin soveltuvuus osaksi sosiaalihuollon asiakirjastandardia

6 Semanttinen Web 101

Laajuus 5 op Luennot: 12 x 2t Harjoitukset: 7 viikkoharjoitusta harjoitusten tekemiseen saatavissa apua 2 ryhmää / harjoitus

è è è RDF-perusteet 7 RDF-perusteet

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

XML prosessori. XML prosessointi. XML:n kirjoittaminen. Validoiva jäsennin. Tapahtumaohjattu käsittely. Tapahtumaohjattu käsittely.

6 Semanttinen Web 101

Suvi Remes Miika Alonen Petri Mustajoki Totti Tuhkanen

Avoimet standardit ja asiakirjamuodot Suomen julkisessa hallinnossa: teoriasta käytäntöön

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Uutisjärjestelmä. Vaatimusmäärittely. Web-palvelujen kehittäminen. Versio 1.3

Kirjastoverkkopäivät Marja-Liisa Seppälä Kansalliskirjasto

Paikkatietojen yhteiskäyttö - mitkä mahdollisuudet!

Metatietojen merkitys tiedonhallinnassa

RDF-TIETOMALLI TOIMINTAPROSESSIN TIEDONHALLINNAN TUKENA

Paikkatietojen tietotuotemäärittely

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Profium. Smart Information Router (SIR) Janne Saarela Profium Oy. Profium perustettu Pioneeri sisällönhallinnan ratkaisujen kehityksessä

10 Ohjelmoinnista Semanttisessa Webissä

Verkkosivut perinteisesti. Tanja Välisalo

Neoxen Systems on suomalainen ohjelmistotalo. Olemme erikoistuneet tiedon- ja oppimisen hallinnan ratkaisuihin.

Paikkatietojen tietotuotemäärittely

Metatietojen merkitys tiedonhallinnassa

Sosiaalihuollon asiakasasiakirjojen tietomallinnus Tietomallit teknisen asiakirjamäärittelyn näkökulmasta

Tieto matkaa maailmalle

Yrityssuomi.fi:n toiminnallisuus ja ontologian hyödyntäminen Yritys-Suomen verkkopalveluissa. Eeva Koivisto, Yritys-Suomen verkkotoimitus 1.11.

Syntysähköisten. Markus Merenmies / Kansallisarkisto

Yhteentoimivuusvälineistö

Sosiaalihuollon avoin asiakastietomalli ja sen kehittämisessä ja soveltamisessa käytetyt standardit

Transkriptio:

Semanttinen Web ja XMLlinkitys Ossi Nykänen Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Esitelmä Hyvin lyhyt versio: W3C on kansainvälinen konsortio joka asettaa Webin universaaleja teknologioita standardoivia suosituksia Semanttinen Web on sopimus "metatietojen" esitystavasta XML mahdollistaa tiedon monipuolisen linkityksen. Ratkaisut perustuvat Web-arkkitehtuurin ja XML-perheen erityispiirteisiin Pidempi versio, otsikoita: W3C ja universaalit standardit Semanttinen Web Metatiedot XML: linkitys ja osoittaminen Lähteitä Tavoite: esittää tiivis yleiskuva em. teknologioista 2

W3C ja Universaalit Standardit

World Wide Web Consortium (W3C) W3C kehittää yhteensopivia teknologioita (spesifikaatioita, ohjeita ja ohjemistoja) ja siten ohjaa Webin kehittymistä täyteen mittaansa 3 päätstoa, 14 aluetstoa, n. 400 jäsenorganisaatiota Jäseneksi? ks. http://www.w3c.tut.fi/joining.html 4

W3C:n olemus ja tuotteet Vaikutusvaltainen foorumi Suositukset XML-perhe, XHTML-perhe, SVG, RDF, Semanttinen Web, Webpalvelut... Ohjelmistot Validaattorit, testiaineistot, open source,... Ohjeet ja yhteydet WAI, aluetoimistot,... Jäsenorganisaatiot 5 Is : Information, Image, Involvement, Influence, and Impact A B 5

W3C:n (nykyiset) toimialueet ja aktiviteetit ( ) (Ks. http://www.w3.org/consortium/activities.) 6

Yhteensopivuus syntyy kokonaisuudesta Kuvalähde. W3C, http://www.w3c.org/consortium/ 7

Semanttinen Web

Nykyinen Web Tietoverkko välittää, ihmiskäyttäjä tulkitsee esitystapa ja tulkinta sekoittunut suuri määrä erilaisia tietorakenteita tiedon poiminta datan seasta vaikeaa tiedon yhdistely vaikeaa Mutta toisaalta... tietoverkko valmiina URI-nimikäytäntö valmiina XML-nimiavaruudet valmiina XML-metakieli ja modulaarisuus valmiina Kuvalähde. Koivunen & Miller, W3C, http://www.w3.org/2001/12/semweb-fin/w3csw 9

Semanttinen Web Tietoverkko välittää, käyttäjä TAI kone tulkitsee asiasisältö kenties ennallaan tietosisältö kuvaillaan RDF-mallin avulla valmiiksi pureskellussa muodossa metatietoajattelu...koneellinen käsittely ei tekoälyuskovaisuutta(!) vaan konkreettinen väline käsittelykelpoisen tiedon esittämiseen agentit Kuvalähde. Koivunen & Miller, W3C, http://www.w3.org/2001/12/semweb-fin/w3csw 10

SW:n rakenne ja perusidea Semanttisen Webin perusidea on yksinkertainen kuka tahansa voi sanoa mitä tahansa mistä tahansa perusteet yksinkertaisia, haasteet syntyvät sovellusten suunnittelusta ja esim. metatietosanastojen valinnasta OWL RDF XML tekninen infrastruktuuri URI Semanttinen Web ei korvaa Webiä, vaan laajentaa sitä SW on olennaisesti sopimus "metatietojen" ja niiden käyttöä ohjaavien skeemojen ja ontologioiden "kirjoitustavasta" 11

Yksinkertainen (vapaamuotoinen) esimerkki http://www.w3c.tut.fi http://www.w3c.tut.fi/staff/ossi nimi: Ossi Nykänen sähköposti: ossi@w3.org kirjoittaja: viimeksi päivitetty: 2003-12-15 luokitus: standardointi otsikko: uutisia, joulukuu uutisotsikko1: uutisotsikko2:... uutisotsikko3:...... otsikko: XForms 1.2 Mobile teksti: W3C julkaisi uuden version... Lisäksi: - mitä sanoja käytetään (std-predikaateista sopiminen) - miten sanoja käytetään (skeemat) - "mitä sanat tarkoittavat tietyissä sovelluksissa" (ontologiat) 12

SW:ssä keskeistä on tiedon yhdistäminen Hyödyntäminen: metatietoihin perustuvat haut (tai pelkän metatiedon hakeminen) eri lähteiden yhdistäminen (standardi tapa julkaista "metatietoa") tiedon koostaminen, päättely, yms. tiedon julkaisija eri lähteiden valinta tiedon tulkitsija Kuvalähde. Berners-Lee, W3C, http://www.w3.org/2003/talks/0922-rsoc-tbl/overview.html 13

RDF-lausuminen rakenne teknisesti Resource Description Framework (RDF): graafidiagrammi (perustuu resurssien URI-nimiin) RDF on sopimus "mallinnus- ja kirjoitustavasta", metatiedot kirjoitetaan XML-tiedostoiksi (RDF/XML) Haaste: sanastoista (predikaateista) sopiminen (RDF ei määrittele MITÄ sanotaan vaan MITEN sanotaan) Kuvalähde. Manola et al. W3C, http://www.w3.org/tr/rdf-primer/ 14

Huomautus: mikä on metatietoa? Metatieto on tietoa jota ei löydy tai jota ei voida helposti poimia itse resursseista tms. (myös kone voi tuottaa!) Metatieto ja tieto -erottelua ei ole pakko lainkaan tehdä dokumenttien tyyppitiedot tekstiformaatti ja ko. formaatin kontrolloitu sanasto lisätty, kuvaileva (meta)tieto metatiedon käyttöä ohjaava skeema (tms.) sovellusalueen ontologia tyyppi käsikirjoitus Mediaobjektit Huom: (meta)tietoa ei aina ole tarkoituksenmukaista ylläpitää siinä formaatissa jossa sitä julkaistaan viimeksi muokattu: 2003-11-26 Se päivämäärä jolloin tietosisältö viimeksi muuttui, tyyppi: xsd:date paperikoneen käyttöohjeen tuotantoprosessi 15

XML: linkitys ja osoittaminen

Extensible Markup Language (XML) XML on tapa rakenteisen tekstitiedon esittämiseen (XML-dokumentit) metakieli (esim. XHTML, SVG, RDF, SOAP,...) perhe teknologioita ja menetelmiä (XML 1.0, XML NS, XLink,...) Peruskäsite on XML-dokumentti, esim. <?xml version="1.0"?> <muistio pvm="2003-12-01"> <otsikko>pikkujoulut</otsikko> <asiat id="asialista"> <asia>tarjottavat...</asia> <asia>ohjelma...</asia> </asiat> </muistio> Merkkausrakenne aina sama (XML 1.0 + XML NS) Loogisen rakenteen sanasto ja kielioppi sovelluksen mukaan (muistio, XHTML, SVG,...) tallennus tekstitiedostoon 17

Hyperlinkkien perusteet ja XML-perhe Yksisuuntaisen hyperlinkin peruskäsitteet: alku (lähde) loppu (kohde) XML-teknologioissa linkitys perustuu yleisesti URI-nimiin ("kokonaisten resurssien osoittaminen") ja dokumentin loogiseen rakenteeseen ("elementtiin osoittaminen esim. attribuutin perusteella") sekä kenties hakuehtoon ("...tai muuhun rakenteeseen osoittaminen") XML-linkit voivat olla myös aidosti monensuuntaisia linkkejä voidaan myös tyypittää (esim. "huomautus") ja niihin voidaan liittää "toiminnallisuutta" (esim. korvaa lähde) linkkejä ei ole pakko kirjoittaa dokumentteihin a la HTML (!) 18

Linkitys ja osoittamiskeinot: lähde Linkin alkupään asettaminen (lähde) sovelluksen sanaston avulla (esim. XHTML, <a>-elementti) universaalin XLinkin avulla (mikä tahansa elementti voi toimia linkkinä JA linkin alkupää voidaan myös ilmoittaa viittauksella) Huom: kaikki sovellukset (esim.) selaimet eivät vielä tue XLinklinkkejä Loppukäyttäjän selaimen (tms.) ei välttämättä tarvitsekaan ymmärtää XLink-linkkejä linkitys voi tapahtua tuotantojärjestelmässä, jonka tiedoista prosessoidaan tavallisia XHTML-sivuja loppukäyttäjille 19

Linkitys ja osoittamiskeinot:kohde Linkin loppupään asettaminen (kohde) yleisin tapaus: URI-viittaus + ns. fragmentti (a la XHTML), esim. http://www.esim.org/muistio12.html#asialista XPointer-osoitin (mahdollistaa lisäksi esim. hakuehdon) Huom: kaikki Web-palvelimet eivät vielä tue XPointer-osoitteita 20

Tässäkö kaikki? Ei Linkitysmekanismi voidaan suunnitella myös sovelluksessa halutuksi oma toteutus (ohjelmointia...) Web-arkkitehtuuri asettaa rajat käytännössä (URI, fragmentit & HTTP) Käytännössä XML tukee myös "muuntyyppisiä" hyperlinkkejä sovitut assosiaatiot (esim. HTML-dokumentista CSS-tyyliin) assosiaatiot dokumentin esiintymän ja sen tyyppimäärittelyn välillä viittaukset XML-dokumentin sisällä (ID/IDREF-attribuutit) entiteettiviittaukset yleiset assosiaatiot (esim. Web-osoite metatiedossa)... 21

Huomioita Web-arkkitehtuurista ja URI-nimistä Webin yleisarkkitehtuuri Kuvalähde (URI, Resource, Representation). Ian Jacobs et al., W3C, http://www.w3.org/tr/2003/wd-webarch-20031209/ 22

Huomioitavaa linkityksestä Koodaus: XHTML: linkin alkupää koodataan (lähde)dokumenttiin, loppupää joudutaan koodaamaan vain jos viitataan dokumentin sisään XLink & XPointer: linkin alku- ja loppupää voidaan koodata joko dokumentteihin tai kokonaan erilliseen linkkikantaan Linkityksessä pulmia tyypillisesti aiheuttavat resurssien saatavuus (esim. Web-palvelin off-line) muutokset URI-nimissä (siirtäminen, tms. nimen muuttaminen) muutokset dokumenttien sis. rakenteessa (fragmenttiosoitteet)...johtopäätös: linkitys Webissä edellyttää suunnittelua linkitysmekanismi (teknologian valinta) dokumenttien rakenne JA dokumenttien sijoittelu ja nimeäminen (arkistointi, muutokset yms. aikakehitys) Huomaa resurssin ja representaation välinen ero 23

Lopuksi

Lisää SW/XML/linkitys-teknologioista Semanttinen Web ("metatietokehys Webille") http://www.w3.org/2001/sw/ XML ("rakenteinen tieto") http://www.w3.org/xml/ XHTML ("esimerkki linkityksestä ja tyypityksestä") http://www.w3.org/markup/ XLink ("linkkien liittäminen mv. XML-sovelluksiin") ja XPointer ("monipuoliset linkin loppupäät") http://www.w3.org/xml/linking Web-arkkitehtuuri ("Web-infrastruktuurin puitteet") http://www.w3.org/tr/2003/wd-webarch-20031209/ 25

Kiitos! Jäikö joku W3C-asia mietityttämään? Allekirjoittaneen tavoittaa helposti: http://www.w3c.tut.fi Ossi@w3.org The bane of my existence is doing things that I know the computer could do for me." -- Dan Connolly, The XML Revolution 26

Liite 1: lisätietoja ja osoitteita eteenpäin W3C http://www.w3.org/ (kotisivu) http://www.w3c.tut.fi/ (W3C Suomen toimiston kotisivu) W3C-aktiviteetit http://www.w3.org/consortium/activities (yleiskuva) W3C:n suositukset ja raportit sekä teknistä tietoa http://www.w3c.org/tr/ (specs) http://www.w3.org/qa/thematrix (spec-tietoa jäsennettynä) Jäseneksi! http://www.w3c.tut.fi/joining.html http://www.w3.org/consortium/prospectus/joining 27