Luento 12: XML ja metatieto



Samankaltaiset tiedostot
Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Paikkatiedot ja Web-standardit

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

W3C-teknologiat ja yhteensopivuus

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Semanttinen Web ja Webteknologiat

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Metatiedot organisaatioiden sisällönhallinnassa

Sisällönhallinnan menetelmiä

Semanttinen web ja sukututkimus

Paikannimirekisteri linkitettynä tietona

RDF-TIETOMALLI TOIMINTAPROSESSIN TIEDONHALLINNAN TUKENA

è è è RDF-perusteet 7 RDF-perusteet

SÄHKE-hanke. Abstrakti mallintaminen Tietomallin (graafi) lukuohje

Hohde Consulting 2004

6 Semanttinen Web 101

Internet jolla on merkitystä

6 Semanttinen Web 101

W3C ja alueellinen standardointi

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Mikä on semanttinen web?

6 Semanttinen Web 101

RDF ja RDFS. 8 RDF ja RDFS

The OWL-S are not what they seem

Profium. Smart Information Router (SIR) Janne Saarela Profium Oy. Profium perustettu Pioneeri sisällönhallinnan ratkaisujen kehityksessä

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Resource Description Framework (RDF) -konsepti. Lauri Antikainen

Tutkitaan sitten HTML-dokumenttien anatomiaa, jotta päästään käsiksi rakenteisten dokumenttien käsitteistöön esimerkkien kautta.

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

1. Lähtökohta ja taustat

W3C, Web-teknologiat ja XML

Sisällys. Valtion tietotekniikan rajapintasuosituksia. XML:n rooleja sähköisen asioinnin tavoitearkkitehtuurissa. dbroker - asiointialusta

Käsitemallit muistiorganisaatioiden kuvailun yhdenmukaistamisen välineenä

TIETOTEKNIIKAN OSASTO. Jari Kahelin. Semanttisen tiedon esittäminen virtuaalimaailmoissa

METATIETOSKEEMA LAINSÄÄDÄNTÖPROSESSIN ASIAKIRJOILLE

3 Verkkosaavutettavuuden tekniset perusteet

Yhteentoimiva.suomi.fi - palvelukokonaisuuden ja työkalujen esittely

XHTML+RDFa-standardin soveltuvuus osaksi sosiaalihuollon asiakirjastandardia

Rakenteisten dokumenttien jatkokurssi, syksy 2006

Verkkopalveluiden saavutettavuus

Kirjastoverkkopäivät Marja-Liisa Seppälä Kansalliskirjasto

W3C ja Web-teknologiat

Graafitietokannan visualisointi- ja hallintatyökalu

Hohde Consulting 2004

Semanttisen webin tekniikoiden soveltaminen Wikisovelluksissa

XML johdanto, uusimmat standardit ja kehitys

URN: NBN:fi-fe

XHTML - harjoitus. Tehtävä1: Tee xhtml tiedosto käyttäen notepad (muistio) ohjelmaa. Tiedoston tallennus notepad (muistio) ohjelmassa:

URI:n muodostamisen prosessi (suositusluonnoksen liite 1)

W3C ja Web-teknologiat

10 Nykyaikainen WWW-arkkitehtuuri

Julian graafinen annotointityökalu ja erityisontologioiden editori. Jaason Haapakoski P Kansanterveyslaitos , 28.3.

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Semantic Web Sisältötuotannon ja palveluiden tulevaisuus

Avoimet standardit ja arkistointi

Ensi askeleet semanttiseen webiin: tuotantoprojektin kokemuksia

Verkkosisällön saavutettavuusohjeet 2.0: hyviä ohjeita monimuotoisen sisällön suunnitteluun ja arviointiin

WWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys

Logiikkapohjainen lähestymistapa RDF-tietolähteen esittämiseksi. Tuomas Räsänen

Johdatus rakenteisiin dokumentteihin

Metatietojen merkitys tiedonhallinnassa

Semanttinen Web ja XMLlinkitys

XML prosessori. XML prosessointi. XML:n kirjoittaminen. Validoiva jäsennin. Tapahtumaohjattu käsittely. Tapahtumaohjattu käsittely.

Semantic Web käytännön sovelluksissa. TkT Janne Saarela Profium Oy

JHS XML suositus. XML Finland tapahtuma Mikael af Hällström ylitarkastaja, Verohallinto JHS XML työryhmän vetäjä

Semanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Rakenteiset dokumentit Mitä hyötyä niistä on?

Vaatimusdokumentti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Metatietojen merkitys tiedonhallinnassa

Terveys- ja yrityspalvelutyöpajan tutkimus Eero Hyvönen, Mikko Salonoja, Reetta Sinkkilä, Osma Suominen, Antti Tani

Tieto matkaa maailmalle

Järjestelmäarkkitehtuuri (TK081702) Järjestelmäarkkitehtuuri. Järjestelmäarkkitehtuuri

W3C ja Web-teknologiat

Tiedonhallinta ja tietopalvelu sähköisessä ympäristössä

10 Tiedostot, dokumentit, tieto (&h-media)

Arkistoaineistojen sisällönkuvailu

Avoin data ja semanttinen verkko yhdessä kohti älykkäämpää internetiä. Hannu Lohtander

W3C: teknologia ja (tieto)yhteiskunta

Juha Hakala Kansalliskirjasto

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Median digitalisoituminen ja yhdistetty tieto - Svenska.yle.fi

10 Ohjelmoinnista Semanttisessa Webissä

Asiakirjojen sailytysvaatimukset, toimitusjohtaja Antero Ensio, Ensitieto Oy

W3C, Web-teknologiat ja Semanttinen Web

Toiminnalliset ja ei-toiminnalliset vaatimukset Tunnus (ID) Vaatimus Vaatimuksen

Metatiedot lainsäädäntötiedon hallinnassa

Kysy kirjastonhoitajalta. Syksy 2008

FuturaPlan. Järjestelmävaatimukset

OWL 2 -profiilit. Antti Hietasaari. Helsinki HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Luento 1: Johdanto merkintäkieliin

Tarkennukset kuvatietokannan vaatimusmäärittelyssä erityismerkityksessä esiintyville termeille

Kirjaston vastaus informaatioympäristön muutokseen : Semanttinen web, ontologiat ja standardit osana kirjastojen tiedonhallinnan infrastruktuuria

Semanttiset verkot ja niiden web-sovellukset

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

12 Case: "hajautettu kauppapaikka"

Avoin data Avoin kirjasto Kuvailupäivät

Transkriptio:

Luento 12: XML ja metatieto AS-0.110 XML-kuvauskielten perusteet Janne Kalliola XML ja metatieto Metatieto rakenne sanasto Resource Description Framework graafikuvaus XML Semanttinen Web agentit 2 1

Metatieto Metatieto on tietoa tiedosta tarkoituksena kuvata sisältöä sovitulla tavalla luodaan kontekstia tiedolle metatiedon avulla voidaan ryhmittää samankaltaisia sisältöjä arvioida sisällön sopivuutta tietylle kohderyhmälle hakea sisältöjä arkistosta Ilman metatietoa tietomassat ovat käyttökelvottomia koneet eivät ymmärrä semantiikkaa 3 Tieto ja metatieto Metatieto voi kuvata periaatteessa minkä tahansa muotoista sisältöä tekstit, kuvat, audio, video Metatieto täytyy kytkeä tietoon jollakin tavalla toinen viittaa toiseen tieto sisältää metatiedon Yleensä tiedon ja metatiedon välillä on yksi-yhteen suhde periaatteessa tietosirpale voi viitata useampaan metatietosirpaleeseen ja yksi metatietosirpale voi määrittää useampaa tietosirpaletta 4 2

Metatiedon rakenne Metatieto koostuu yleensä avain-arvopareista avain on jokin tietoa kuvaavan tyypin nimi muutospäivämäärä kirjoittaja, hyväksyjä, toimittaja yms. arvo on avaimeen sidottu kuvaus yhdellä avaimella voi olla yksi tai useita arvoja riippuu avaimen määritelmästä 5 Sanasto Sanasto määrittää sallittujen avainten joukon myös avainten arvoille voidaan määrittää rajoituksia edistyneemmissä sanastoissa on perintämahdollisuuksia nopeuttaa uusien avain-arvoparien laadintaa 6 3

RDF Resource Description Framework Määrittelykieli W3C:n suositus standardiksi esityskieliriippumaton yksi esitysmalli pohjautuu tällä hetkellä XML:en Metatieto esitetään lausekkeilla kuvaavat dokumenttien ominaisuuksia ja keskinäisiä suhteita dokumenttia kutsutaan resurssiksi voi sisältää mitä tahansa tietoa, kunhan on viitattavissa URI:lla 8 4

RDF:n tarkoitus Määritellä yleinen mekanismi, jolla resursseja voidaan kuvata ilman oletuksia aihe- tai sovellusalueesta ei ota kantaa käytettyyn sanastoon sanastoa kutsutaan RDF Schemaksi RDF on itsessään abstrakti ja formaali määrittely, jolla voidaan kuvata avoimia metatietorakennelmia perustuu yksinkertaiseen graafimalliin 9 RDF:n rakenne RDF-metatieto koostuu kolmikoista (triplet): subjekti määrittelyn kohde objekti määrittelyn arvo predikaatti määriteltävä ominaisuus Kolmikossa objekti sidotaan subjektiin predikaatilla eli objekti määrittää subjektia predikaatti määrittää määrityksen tyypin objekti voi olla myös toinen subjekti tällöin syntyy puu 10 5

RDF:n graafiesitys RDF-lauseke voidaan piirtää alla olevana graafina nuoli on aina subjektista objektiin 11 Määrittelyt Subjekti voi olla joko URI-viittaus tai tyhjä solmu Objekti voi olla URI-viittaus, literaali tai tyhjä solmu Predikaatti on URI-viittaus URI-viittauksen avulla RDF:ssa voidaan viitata määritettäviin asioihin URI-viittauksia täytyy ajatella sanastoina RDF määrittää joukon URI-viittauksia metatietosanasto määrittää metatiedossa käytettävät URIviittaukset 12 6

Graafiesimerkki URI:en kanssa Tyhjä subjekti kokoaa yhteen osoitteen 13 Toinen graafiesimerkki 14 7

RDF ja XML W3C on määrittelyt RDF:n abstraktin mallin lisäksi erillisen RDF-XML sarjallistuksen RDF:lla kuvattu malli kirjoitetaan XML-dokumenttina URI-viittaukset muuttuvat nimiavaruuksiksi RDF käyttää tämän lisäksi XML Schemassa määriteltyjä tietotyyppejä 15 XML-esimerkki <?xml version="1.0"?> <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:ex="http://example.org/stuff/1.0/"> <rdf:description rdf:about="http://www.w3.org/tr/rdf-syntax-grammar" dc:title="rdf/xml Syntax Specification (Revised)"> <ex:editor> <rdf:description ex:fullname="dave Beckett"> <ex:homepage rdf:resource="http://purl.org/net/dajobe/" /> </rdf:description> </ex:editor> </rdf:description> </rdf:rdf> 16 8

XML-esimerkki graafina 17 RDF:n käyttö RDF-dokumentit luetaan koneellisesti XML-muodossa graafit ovat pitkälti ihmisiä varten RDF-dokumentti lisää koneymmärrettävää tietoa määrittämäänsä dokumenttiin tai muuhun resurssiin käytetty sanasto (ts. URI-viittaukset) vaihtelevat käyttötarkoituksesta toiseen RDF-dokumentin pohjalta sovellus voi esimerkiksi kytkeytyä toiseen palveluun tai korostaa dokumentin esitystä jollakin tavalla RDF ei ota itsessään kantaa siihen, kuinka sitä pitää käyttää Tällä hetkellä RDF-tuki on vielä kovin hajanaista verkossa on kuitenkin useita mielenkiintoisia RDF:a käyttäviä projekteja, kuten www.foaf-project.org 18 9

RDF ja WWW RDF-dokumentteja voidaan helposti siirtää WWWympäristössä RDF-määritykset voidaan myös sisällyttää toiseen dokumenttiin esimerkiksi XHTML-dokumentti voi sisältää RDFmäärityksiä nämä määritykset eivät näy välttämättä koskaan käyttäjälle, mutta selain tai plug-in osaa tulkita niitä ja muokata toimintaansa 19 Semanttinen Web 10

Semanttinen web Semanttinen web on kehys (framework), jonka avulla tietoa voidaan jakaa helposti sovellusten välillä yritysten välillä yhteisöjen välillä Semanttisen webin ajatuksena on mahdollistaa koneiden välinen tiedonvaihto metatiedon avulla metatieto kuvataan RDF:na käytetään erilaisia luokitteluja (ontologia) Yleensä siirrettävät dokumentit ovat XML-pohjaisia 21 Semanttisen webin käyttöympäristö Semanttinen web ei ole sama WWW-ympäristö, johon olemme tottuneet periaatteessa esimerkiksi puhelin ja stereot voivat keskustella semanttisen webin yli: stereot hiljentävät äänenvoimakkuutta puhelimen soidessa stereot ja puhelin eivät välttämättä ole kuitenkaan sovitettu puhumaan keskenään Oleellista on välittää riittävästi semanttista tietoa (rakennetta ja metatietoa), jotta kone pystyy tulkitsemaan vastaanottamaansa tietoa sama tietosisältö voidaan esittää myös ihmisele ihminen osaa tulkita sisällön suoraan 22 11

Agentit Agentit ovat ohjelmia, jotka tekevät pieniä (ja myöhemmin ehkä suuriakin) toimintoja ihmisten puolesta toiminta pohjautuu metatietoon palvelusta käyttäjästä (ihmisestä, agentin isännästä) agentti pystyy tekemään yksinkertaisia valintoja esimerkiksi valitsemaan sopivan erikoisruokavalion lennolle Tällaiset toimenpiteet vaativat nykyistä tiukempaa turvallisuutta ja siksi digitaaliset allekirjoitukset ovat tärkeä osa semanttista webiä 23 Kysymyksiä? Kommentteja? 12