Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Samankaltaiset tiedostot
Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Semanttinen Finlex Visio ja sen toteutus

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Paikannimirekisteri linkitettynä tietona

Luento 12: XML ja metatieto

Avoin data Avoin kirjasto Kuvailupäivät

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

Sonja Kniivilä, Sari Lindblom-Ylänne & Anne Mäntynen

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

SOSIAALI- PEDAGOGIIKKA

Semanttisen webin käsikirja (luonnos)

Internet jolla on merkitystä

W3C-teknologiat ja yhteensopivuus

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

6 Semanttinen Web 101

Sisällönhallinnan menetelmiä

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

6 Semanttinen Web 101

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

6 Semanttinen Web 101

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

12 Pari sanaa sovelluskehityksestä

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

HAKEMISTO 261. existential quantifier (eksistentiaalikvanttori). 155 expert system (asiantuntijajärjestelmä).222 explanation (selitys)...

Semanttisen webin käsikirja (luonnos)

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

Terveys- ja yrityspalvelutyöpajan tutkimus Eero Hyvönen, Mikko Salonoja, Reetta Sinkkilä, Osma Suominen, Antti Tani

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Paikkatiedot ja Web-standardit

Mikä on semanttinen web?

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Linked Data Finland: visio, missio ja toteutus

Kansallinen koodistojen siirtoformaatti

Yleinen suomalainen ontologia YSO

Korkeakoulujen yhteentoimivuusmalli

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

è è è RDF-perusteet 7 RDF-perusteet

FinnONTO-infrastruktuurin esittely

SPARQL-workshop. Sini Pessala Kirjastoverkkopäivät KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Julkistustilaisuus , SKS, Juhlasali, Helsinki

Semanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen

Semanttisen webin käsikirja (luonnos)

3 Verkkosaavutettavuuden tekniset perusteet

Rakennustietomallien hallinta linkitettynä tietona

The OWL-S are not what they seem

Tiedon mallintaminen ja esillesaanti. Web Ontology Language OWL Daniel Lillqvist

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

Logiikkapohjainen lähestymistapa RDF-tietolähteen esittämiseksi. Tuomas Räsänen

Ensi askeleet semanttiseen webiin: tuotantoprojektin kokemuksia

Automaattinen semanttinen annotointi

10 Ohjelmoinnista Semanttisessa Webissä

Käsitemallit muistiorganisaatioiden kuvailun yhdenmukaistamisen välineenä

RDF ja RDFS. 8 RDF ja RDFS

RDF-muotoisen tiedon hallinta

Yhteyshaku semanttisessa webissä

EUROOPAN PORTEILLA TURVAPAIKKAPOLITIIKAN VAIKEAT VAIHEET

Avoin data, avoimet rajapinnat ja tietojen linkitys. Osma Suominen Suomi.fi

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

Vaatimusdokumentti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Semanttinen web ja sukututkimus

10 Nykyaikainen WWW-arkkitehtuuri

12 Case: "hajautettu kauppapaikka"

Semantic Web Sisältötuotannon ja palveluiden tulevaisuus

Juuli - julkaisutietoportaali. Asiantuntijaseminaari, Helsinki Jyrki Ilva (jyrki.ilva@helsinki.fi)

URI:n muodostamisen prosessi (suositusluonnoksen liite 1)

Lainsäädäntö avoimena datana Semanttinen Finlex-palvelussa data.finlex.fi. Aki Hietanen, oikeusministeriö

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Semanttisen webin käsikirja (luonnos)

Media- ja kulttuuripalvelut. Eetu Mäkelä

Open > Link > GO Avointa linkitettyä dataa kirjastomaailmassa

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

Resource Description Framework (RDF) -konsepti. Lauri Antikainen

Miten avoin yhdistetty tieto saadaan verkkoon: kansallinen Linked Data Finland -hanke-ehdotus

Järjestelmäarkkitehtuuri (TK081702)

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

TerveSuomi.fi portaalin suunnittelu ja tekninen toteutus

Finto palveluiden toteuttamisen alustana

Suvi Remes Miika Alonen Petri Mustajoki Totti Tuhkanen

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

Uusi käsitemalli IFLA LRM

Julkaisuportaali ja yliopistojen julkaisutiedot

Semanttinen Web ja Webteknologiat

Muusa ja KDK:n asiakasliittymä

Tieto matkaa maailmalle

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

Profium. Smart Information Router (SIR) Janne Saarela Profium Oy. Profium perustettu Pioneeri sisällönhallinnan ratkaisujen kehityksessä

Kohti suomalaisen semanttista webiä -- ontologioita, palveluita ja sovelluksia

Tekninen alusta. Tavoitteet ja näkökulmia maankäyttöpäätöksiin Jani Kylmäaho, osahankepäällikkö Maanmittauslaitos

Juha Hakala Kansalliskirjasto

Alussa oli MURHA JOHTOLANKOJA RIKOS KIRJALLISUUTEEN. Paula Arvas & Voitto Ruohonen

Transkriptio:

Eero Hyvönen Semanttinen web Linkitetyn avoimen datan käsikirja

WSOY:n kirjallisuussäätiö on tukenut teoksen kirjoittamista Copyright 2018 Eero Hyvönen & Gaudeamus Gaudeamus Oy www.gaudeamus.fi Kansi: Pekka Krankka KL: 61.72 UDK: 004 ISBN 978-952-495-460-0 Painopaikka: Printon Trükikoda, Tallinna 2018

Sisällys 1 Johdanto 15 I KOHTI SEMANTTISTA WEBIÄ 17 2 Webin kehityssuuntia 19 2.1 Web julkaisukanavana....................... 19 2.2 Tiedon avoimuus Open Data.................. 21 2.3 Tiedon yhteisöllisyys Web 2.0.................. 23 2.4 Tiedon määrä Big Data..................... 24 2.5 Tieto palveluina Web Services.................. 25 2.6 Tiedon verkko Web of Data................... 26 3 Tiedonhaun haasteita 32 3.1 Perinteinen tekstihaku....................... 33 3.2 Haun haasteita........................... 34 3.3 Selailun haasteita.......................... 38 3.4 Ratkaisuna tiedon semantiikka.................. 39 II LINKITETTY DATA 49 4 Linkitetyn datan esittäminen 51 4.1 Tiedon esitys semanttisena verkkona............... 52 4.1.1 Verkko kaaviona...................... 52 4.1.2 Verkon esittäminen kolmikkoina............. 52

4.1.3 Verkon looginen tulkinta.................. 53 4.1.4 Verkko tekstinä....................... 54 4.2 Semanttisen webin tekninen perusta............... 55 4.2.1 HTML-kieli......................... 56 4.2.2 HTTP-protokolla...................... 56 4.2.3 Yhtenäiset osoitteet ja tunnisteet: URI.......... 57 4.2.4 Resurssien ja literaalien esittäminen........... 62 4.2.5 Datan linkitys tietojoukkojen välillä........... 64 5 RDF-verkon esittämiskielet 67 5.1 Data kolmikkoina: N-Triples.................... 67 5.2 Yksinkertaisempaa koodia: Turtle................. 69 5.2.1 Nimiavaruudet....................... 69 5.2.2 Monta samaa ominaisuutta................ 72 5.2.3 Eri ominaisuudet samalla kertaa............. 72 5.2.4 Ominaisuuden arvo omilla ominaisuuksilla........ 72 5.2.5 Tietotyypit......................... 74 5.3 Verkon esittäminen RDF/XML-kielellä.............. 76 5.4 Esimerkki tietojen yhdistämisestä................. 76 5.5 Muita RDF:n ominaisuuksia.................... 81 5.5.1 Säiliöt............................ 81 5.5.2 Kokoelmat......................... 82 5.5.3 Reifikaatio.......................... 83 5.6 JSON-LD.............................. 84 6 Tiedon haku ja ylläpito: SPARQL 89 6.1 SPARQL-datapalvelun perustaminen............... 90 6.2 Peruskyselyt............................. 92 6.2.1 Tiedon haku: SELECT.................. 93 6.2.2 Tiedon testaaminen: ASK................. 98 6.2.3 Resurssin kuvaus: DESCRIBE.............. 99 6.2.4 Uuden RDF-verkon luominen: CONSTRUCT...... 99 6.3 Laajennuksia peruskyselyihin................... 100 6.3.1 Ominaisuuspolut...................... 100 6.3.2 Arvosijoitus......................... 101

6.3.3 Aggregaattikyselyt..................... 102 6.3.4 Alikyselyt.......................... 106 6.3.5 Federoitu kysely...................... 106 6.4 Graafien hallinta ja päivitys.................... 107 6.5 Graafin datan päivittäminen................... 108 7 Linkitetyn datan julkaiseminen 110 7.1 Linkitetyn datan neljä periaatetta................ 110 7.2 HTTP-kutsujen dereferointi.................... 111 7.3 URI-tunnisteiden sisältöneuvottelu................ 113 7.4 Datajulkaisujen tähtiluokitus................... 115 7.5 Datan julkaiseminen WWW-sivuilla............... 116 III TIETÄMYKSEN ESITTÄMINEN 121 8 Metadata ja ontologiat 123 8.1 Metadatan käsite ja muodot.................... 124 8.2 Dublin Core -malli......................... 126 8.3 CIDOC CRM: datan harmonisointi................ 129 8.4 Ontologian käsite.......................... 133 9 RDF Schema 135 9.1 Luokat ja yksilöt.......................... 135 9.2 Luokkien hierarkia......................... 136 9.3 Ominaisuuksien hierarkia..................... 136 9.4 Alue- ja arvorajoitteet....................... 137 10 SKOS Simple Knowledge Organization System 139 10.1 Käsitemalli............................. 140 10.2 Käsitteen nimikkeet........................ 140 10.3 Notaatiot.............................. 143 10.4 Semanttiset relaatiot........................ 144 10.5 Ryhmittelevät termit........................ 146 10.6 SKOS-sanastojen siltaaminen................... 147 10.7 Dokumentointiominaisuudet.................... 148

10.8 Päättelysäännöt ja integriteettiehtoja.............. 148 11 Web Ontology Language OWL 150 11.1 Johdatus logiikkaan........................ 151 11.1.1 Logiikan idea........................ 151 11.1.2 Lauselogiikka........................ 152 11.1.3 Predikaattilogiikka..................... 154 11.2 OWL-kielen syntaksit....................... 159 11.3 Ontologiadokumentti........................ 161 11.4 Luokkien määrittely........................ 162 11.4.1 Samuus ja eriys....................... 163 11.4.2 Luokkien määrittely joukko-opillisesti.......... 164 11.4.3 Luokkien määrittely joukko-opilla............ 167 11.5 Ominaisuuksien määrittely.................... 167 11.5.1 Objektiominaisuudet.................... 168 11.5.2 Tietotyyppiominaisuudet................. 170 11.5.3 Annotointiominaisuudet.................. 171 11.6 OWL-profiilit............................ 171 11.6.1 OWL 2 EL......................... 172 11.6.2 OWL 2 QL......................... 172 11.6.3 OWL 2 RL......................... 173 12 Päättelysäännöt 174 12.1 Semanttisen webin looginen tulkinta............... 174 12.2 Sääntöjen käyttö.......................... 177 12.2.1 Hornin logiikan suhde kuvailulogiikoihin......... 180 12.2.2 Suljetun maailman oletus................. 183 12.2.3 Yksikäsitteisten nimien oletus............... 184 12.2.4 Yhteenveto......................... 185 12.3 Käyttötapauksia säännöille.................... 185 IV SOVELLUKSET JA INFRASTRUKTUURI 187 13 Sovellusten kehittäminen 189 13.1 Yleiset ja alakohtaiset sovellukset................. 190

13.2 Semanttisen portaalin osat..................... 192 14 Portaalimalli yhteisölliseen julkaisemiseen 195 14.1 Kulttuuriaineistot verkossa.................... 195 14.2 Hajautettu haku ja tiedon aggregointi.............. 197 14.3 Edut käyttäjille........................... 203 14.4 Edut julkaisijoille.......................... 203 14.5 Uusia haasteita........................... 204 15 Sisällöntuotanto 205 15.1 Tekstin tunnistaminen (OCR)................... 206 15.2 Datamuunnokset ja linkitys.................... 207 15.3 Merkitysten erottelu........................ 209 15.4 Datan semanttinen validointi................... 210 16 Webin tietoinfrastruktuurit 212 16.1 Tietoinfrastruktuurin osat..................... 213 16.2 Ontologiapalvelut.......................... 216 16.3 Työn arviointia........................... 222 16.4 Linkitetyn datan palvelut..................... 223 17 Sovellusesimerkki: Sotasampo 226 17.1 Tavoitteet ja käyttötapaukset................... 227 17.2 Aineistot ja tiedon tuottajayhteisö................ 228 17.3 Metadata ja ontologiat....................... 229 17.4 Entiteettien automaattinen linkitys................ 232 17.5 Portaalisovellus Sotasampo.fi................... 236 17.6 Datapalvelu Sotasampo...................... 242 17.7 Uutuusarvo ja jatkokehitys.................... 242 Liite: Esimerkki OWL-ontologiasta 245 Kirjallisuutta 251 Kirjoittaja 271