Semanttinen web 13.4.2012

Samankaltaiset tiedostot
Semanttisen webin idea

Eero Hyvönen professori, tutkimusjohtaja. Semantic Computing Research Group (SeCo) Aalto-yliopisto ja Helsingin yliopisto

Yhteisöllinen semanttinen web 2.0 FinnONTO 2.0 -hankkeen visio ja tulokset

Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari , Kotus, Helsinki

KOKO kick-off -seminaari

Miksi asiasanastoista pitäisi siirtyä ontologioihin? Prof. Eero Hyvönen

Miten avoin yhdistetty tieto saadaan verkkoon: kansallinen Linked Data Finland -hanke-ehdotus

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO ja sen sovellukset. Prof. Eero Hyvönen

Eero Hyvönen

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

FinnONTO-infrastruktuurin esittely

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Ontology Work in Finland: National Semantic Web Infrastructure FinnONTO. Prof. Eero Hyvönen

Suomalainen sisältöinfrastruktuuri semanttisessa webissä käytettävissänne

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

KIRJASAMPO. Jyväskylä

Semantic Web Sisältötuotannon ja palveluiden tulevaisuus

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Julkistustilaisuus , SKS, Juhlasali, Helsinki

Paikkatiedon semanttinen mallinnus, integrointi ja julkaiseminen Case Suomalainen ajallinen paikkaontologia SAPO

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Kulttuurisampo suomalainen kulttuuri semanttisessa webissä

Linked Data Finland: visio, missio ja toteutus

Ontologiakirjasto ONKI-Paikka

Suomalainen kulttuuri ja semanttinen web

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

TIEKE Verkottaja Service Tools for electronic data interchange utilizers. Heikki Laaksamo

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

Sisältö. Miten hyötypalveluja Webiin saadaan? Mitä hyötyä on Webistä? Kehityksen este Webissä? Miten Webistä tulee älykkäämpi?

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

Semanttinen Finlex Visio ja sen toteutus

Luento 12: XML ja metatieto

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Case digitaaliset ihmistieteet

Mikä on semanttinen web?

Collaborative & Co-Creative Design in the Semogen -projects

Kim Viljanen

Ontologiat: standardeja, työkaluja

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Johdanto: Semanttinen Kalevala projekti

Molempien kehityssuuntien edellytys. Ontologiat: semanttisen webin ydinteknologia. Webin kehityssuuntia. WWW:n tulevaisuus? Ontology: perspectives

Sisältö. Semanttinen Web ja Web palvelut Sisältötuotannon ja palveluiden tulevaisuus Internetissä. WWW:n perusta. WWW tänään

Internet jolla on merkitystä

TerveSuomi terveystieto semanttisessa webissä

Avoin data, avoimet rajapinnat ja tietojen linkitys. Osma Suominen Suomi.fi

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Ontologioiden yhdistäminen YSO:oon

Mikä on Kulttuurisampo?...

Sotasampo. Visio, missio ja toteutus. Talvi- ja jatkosota semanttisessa webissä

Sisältö. Semanttinen Web. WWW:n perusta. WWW tänään. WWW tänään: palvelut ja tiedonhaku. Toiminnalliset palvelut: ongelmia

Dublin Core metadataformaatin suomalainen versio. Kansalliskirjasto

7. Product-line architectures

Kulttuurisampo. Joeli Takala. Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

W3C-teknologiat ja yhteensopivuus

The OWL-S are not what they seem

FinnONTO-hanke loi ontologisen perustan kansalliselle webin tietoinfrastruktuurille

Avoin data Avoin kirjasto Kuvailupäivät

Bridging Ontology Versions SAPO (Suomen Ajallinen PaikkaOntologia)

Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Kohti suomalaista semanttista webiä

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Profium. Smart Information Router (SIR) Janne Saarela Profium Oy. Profium perustettu Pioneeri sisällönhallinnan ratkaisujen kehityksessä

Avoimet standardit ja arkistointi

Sanastot ja niiden teknisen infrastruktuurin ylläpito Juha Hakala Kansalliskirjasto

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Kohti suomalaisen semanttista webiä -- ontologioita, palveluita ja sovelluksia

7.4 Variability management

MS. Kirjastot.fi 2012

Kohti suomalaista semanttista webiä

Sisältö. Semanttinen Web - tulevaisuuden Internet? WWW:n perusta. WWW tänään. WWW tänään: palvelut ja tiedonhaku. Toiminnalliset palvelut: ongelmia

WWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys

MuseoSuomi: Suomen museot semanttisessa webissä

Efficiency change over time

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

W3C ja Web-teknologiat

Julkaistun kokoelman kuvailun muokkaaminen/poistaminen Klikkaa vasemmasta palkista "Edit this Item" (Kuva 1.)

SEMANTTINEN WEB JA PAIKKATIETOIHIN PERUSTUVAT PALVELUT

Miten ja miksi asiasanastoista kehitetään ontologioita

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Kulttuurisampo.fi Suomalainen kulttuuri ja semanttinen web mitä, miksi ja miten?

Georef KDK-seminaari

Missä mennään BI? Mikko Kontio

Yleisen suomalaisen ontologian kehitystyö

Paikannimirekisteri linkitettynä tietona

MUSEOT KULTTUURIPALVELUINA

Transkriptio:

Semanttinen web Prof. Eero Hyvönen Aalto-yliopisto, mediatekniikan laitos Helsingin yliopisto, tietojenkäsittelytieteen laitos Semantic Computing Research Group http://seco.tkk.fi/ 13.4.2012

Sisältö Semanttinen webin idea Semanttisen webin ytimessä Metadata, ontologiat, päättely Katsaus keskeisimpiin uusiin ratkaisuihin ja standardeihin Sovellusalueita

Semanttisen webin idea

Kehityksen este Webissä WWW-palvelu kone auttaa ihmistä» Edellyttää sisältöjen koneellista "ymmärtämistä" WWW:n sisällöt ovat ihmislukijaa varten» HTML, PDF, JPEG, Kone ei ymmärrä WWW:n sisältöjä» Hakukoneet, ostoagentit, verkkomönkijät jne.» Periaatteessa kaikki WWW-sovellukset => Perustavaa laatua oleva ristiriita

Miten Webistä tulee älykkäämpi? 1. Älykkäämmät sovellukset Sisältö pysyy samana Koneesta tehdään ihmismäisempi 2. Älykkäämmin esitetty sisältö Sisältö helpommin ymmärrettäväksi Kone pysyy tyhmempänä Käytännössä molempia tapoja tarvitaan Yhä älykkäämmät järjestelmät käsittelevät yhä älykkäämmin esitettyjä tietoja

Ratkaisumalli 1: Älykkäämmät sovellukset Kielen automaattisen tulkinnan vaikeus Dokumenttien vapaamuotoisuus Sisällön semantiikka Ei-tekstuaaliset sisällöt Kuva, ääni, musiikki, video, ohjelmisto, Miten tulkita algoritmisesti? Tulkintaan ei riitä itse dokumentti Tarvitaan konteksti, common sense Tekoälyn perusvaikeuksia, ihmiselle helppoa! Suuria tieteellisteknisiä haasteita

Ratkaisumalli 2: Älykkäämmin esitetty sisältö Semantic Webin lähtökohta Talletetaan tieto niin, että tyhmempikin sen ymmärtää! Ihminen tulee konetta vastaan Kone voi auttaa ihmistä itsensä auttamisessa Kehitystyö käynnistyi 2000-luvun alussa W3C:n Semantic Web Activity 2001 W3C:n Web Services Activity 2002

Webin sukupolvia 1G WWW:» WWW-sivut ihmisen tulkittavaksi» HTML-kieli 2G WWW:» Rakenteet ihmisen/koneen tulkittavaksi» XML-kieli 3G WWW: Semantic Web» Merkitykset ihmisen/koneen käytettäväksi» RDF(S)-kieli => Uusi perusta älykkäille WWW-palveluille» Kansainvälinen yhteistyö (W3C, ISO, FIPA, ym. )

Limitations of Non-semantic Web Case MuseumFinland <artifact> <id> NBA:H26069:467 </id> <target> cup and plate </target> <material> porcelain </material> <creationlocation> Germany </creationlocation> <creator> Meissen </creator> </artifact> This metadata cannot answer the following questions: Find all vessels? Find all ceramic products? Find artifacts manufactured in Europe? Does the city of Meissen manufacture ceramics?

Semantic Web Solution: Ontologies NBA-H26069-467 :object cup and plate ; :object_concept object:cup ; :object_concept object:plate ; :material porcelain ; :material_concept object:porcelain ; :creationplace Germany ; :creationplace_concept place:germany ; :creator Meissen :creator_concept actor:meissen. Find all vessels? Find all ceramic products? Find artifacts manufactured in Europe? Does the city of Meissen manufacture ceramics? NBA-H26069-467 place:germany creationlocation_concept object_concept object_concept material_concept... material:porcelain place ontology loc:partof object:cup place:europe place:meissen rdfs:subclassof object:plate... object ontology... object:vessel rdfs:subclassof actor ontology material ontology actor:meissen

Case Rijksmuseum Amsterdam: CHIP Demonstrator Example in N3Turtle notation VRA metadata schema (extension of Dublin Core) (Aroyo et al., 2007) A resource in the TGN ontology / vocabulary

Amsterdam in TGN

An Ontology Concept Hierarchy: Standard Upper Merged Ontology SUMO

Semanttisen webin teknologiapohja

Semanttisen webin teknologiakakku-malli Sanasto/ ontologia Metadata Päättely/ logiikka (Tim Berners-Lee)

Metadata level

Miksi XML ei riitä semanttisen webin perustaksi? Jokaisen XML-kielen tulkinta joudutaan määrittelemään tapauskohtaisesti Kahden eri XML-kielen merkintöjen yhdistäminen on hyvin hankalaa Tarvitaan tiedon merkkauskieli, jonka tulkinta on yhteisesti sovittu sovellusalueiden rajat ylittävä koneen ymmärtämä XML:n semantiikka on vain nahkakansissa, ei peltikuoressa <OSOITE> <NIMI>Onni Ohjelmoija</NIMI> <PUHELIN> 123 456 </PUHELIN> </OSOITE> <OSOITE> <NIMI > >Onni Ohjelmoija </NIMI> <PUHELIN> 123 456 </PUHELIN> <//OSOITE>

Semanttisen webin ratkaisumalli: RDF Resource Description Framework Yleinen verkkoresurssien metadatan kuvaamiskieli Relaatiotietomalli, ei syntaksi kuten XML» RDF-kuvaus = suunnattu verkko Semantiikka määritelty logiikan avulla Syntaksi/serialisointi» XML:n avulla (erityisesti koneille)» Yksinkertaisina kolmikoina (N3, Turtle, N-triples) ihmisille Standardoitu ja yleisessä käytössä» W3C draft 1999» W3C recommendation 10.2.2004

RDF Vocabulary Description Language: RDF Schema RDF-kuvausten sanaston määrittely Olioajattelu WWW-kuvauksiin» Luokat, yksilöt, ominaisuudet» Käsitehierarkiat, periytyminen (Class/subClass/type)» Rajoitteet ominaisuuksille (domain, range) RDF(S):n tulkinta määritellään logiikan avulla» Mahdollistaa päättelyn W3C draft 2000, recommendation 10.2.2004

RDF(S) Example (Maedche, 2002)

Metadataskeemat Standardoituja muotoja metadata ilmaisemiseen Metadata on kokonaisuus, jolla» joukko elementteja/ominaisuuksia ja» näillä määrämuotoisia arvoja Eri sisältötyypeille tarvitaan yleensä erilaisia ominaisuuksia Esimerkiksi: kirja vs. musiikkikappale vs. museoesine Ongelmia Miten ilmaistaan elementtien arvot?» Tarja Halonen vs. Halonen T.» 11.9.2001 vs. Sept 11, 2001 vs. 2001/09/11 Mitä arvot tarkoittavat?» lasi, nokia, Pyhäjärvi Miten erimuotoiset skeemarakenteet voidaan yhdistää?» kirjoittaja vs. valmistaja

Esimerkki: Dublin Core Geneerinen 15 ominaisuuden joukko eri sisällöille DCMI Element Set (ISO Standard 15836)» Title» Creator» Subject» Description» Publisher» Contributor» Data» Type» Format» Identifier» Relation» Source» Language» Coverage» Rights

Kentille määritelty lisäksi kymmeniä tarkennettuja (qualifier/refinement) muotoja, jotka rajoittavat yhden elementin semantiikkaa Esim. accessrights < Rights Dumb-down periaate Tarkennettu muoto voidaan aina korvata yleisemmällä elementillä» Ts. tarkenne voi vain rajoittaa elementin merkitystä Kenttien arvoille vakioituja koodausmuotoja Vocabulary encoding scheme» Sanaston termit Syntax encoding scheme» Esim. päiväys 2001-09-11

Sovellusprofiilit (Application Profile) Käytettävä DC elementtien ja tarkenteiden joukko + arvojen ilmaisutavat Mahdolliset omat laajennukset Esim. Visual Resources Association Core 4.0» Uusia elementtejä kuten measurements http://www.vraweb.org/projects/vracore4/index.html

Metadata Schema in HealthFinland

Maijan lasit pdf-dokumentti webissä

Maijan lasit: metatieto RDF-muodossa

Ontology level

Ontologian käsite Ontologia on formaali, eksplisiittinen määrittely yhteisestä käsitteistöstä (Gruber, 1993)» Formaali: jämpti» Eksplisiittinen: konekin ymmärtää» Yhteinen: kommunikaatio mahdollista Kuvaa sovellusmaailmassa olevat käsitteet/oliot Ensimmäinen edellytys sille, että ihmiset ja koneet voivat ymmärtää toisiaan

ONTOLOGY TYPES Machine understandable Human understandable Numbers Thesaurus - relations - NT, BT, RT etc. Glossary - word list - little structure Taxonomy - relations - inheritance - constrains Axiomatized theory - formal system - logic-based Philosophical text Ontological complexity/depth

IEEE Standard Upper Merged Ontology (SUMO) Goals Automated reasoning support in knowledge-based applications Interoperability» Define new data elements using SUMO and obtain mutual interoperability» Interoperability between applications using domain specific ontologies (that use SUMO)» Neutral interchange format for different systems Application areas E-commerce E-learning Natural language understanding tasks

Standard Upper Merged Ontology

SUMO Principal Distinctions

SUMO Object:

Cyc ontology

OpenCyc Nx100,000 concepts Nx1,000,000 assertions Connected with Linked Data Available for download

AAT Art & Architecture Thesaurus - Paul Getty -säätiön thesaurus - 7 pääluokkaa, 125 000 käsitettä MAO abstraktit käsitteet toimijat tapahtumat materiaalit ja aineet esineet arkisto- ja kirjastoaineisto organismit ympäristöt

Universal List of Artist Names ULAN on ONKI People Server 120,000 instances 293,000 names

Geonames http://www.geonames.org Classes: 9 feature classes, 645 feature codes Instances: 8 million geographical names, 6.5 million unique features, 2.2 million populated places, 1.8 million alternate names Registries and Wiki used for populating the ontology

TGN Thesaurus of Geographical Names 912,000 records 1.1 million names, place types, coordinates, and descriptive notes Places important for the study of art and architecture

Finnish Ontologies: ONKI http://www.onki.fi/

class-def animal class-def plant subclass-of NOT animal class-def tree subclass-of plant class-def branch slot-constraint is-part-of has-value tree class-def leaf EXAMPLE OF AN slot-constraint is-part-of has-value branch OIL ONTOLOGY class-def defined carnivore subclass-of animal slot-constraint eats value-type animal class-def defined herbivore subclass-of animal slot-constraint eats value-type plant OR (slot-constraint is-part-of has-value plant) class-def herbivore subclass-of NOT carnivore class-def giraffe subclass-of animal slot-constraint eats value-type leaf class-def lion subclass-of animal slot-constraint eats value-type herbivore class-def tasty-plant subclass-of plant slot-constraint eaten-by has-value herbivore, carnivore

OWL Web Ontology Language W3C Recommendation 2004 Next level above RDF(S) Based on formal (description) logic Inference, consistency Subsumption: find objects satisfying a description Subset of predicate logic» Optimized for subsumbtion relation & decidability Human-friendly tools being developed RDF(S) is produced by the machine Based on USA: DAML EU: OIL

Why OWL? Terminology logics for defining ontologies Usage Design phase» Check consistency» Derive subsumption hierarchy Data integration» Detect inconsistenties and unintendent relations Deployment» Term expansion and inference, e.g. in information retrieval» Using descriptions in applications Generic tools for cross-domain applications E.g. Protégé OWL Plugin Open standard W3C Recommendation

OWL example: Lion rdf:resource= #carnivore />

WHAT IS NEW? PROGRAMMING Object-oriented modeling ARTIFICIAL INTELLIGENCE Description logic semantics XML-syntax, e.g., RDF(S) WWW-TECHNOLOGIES

Metadata + Ontologiat = Linked Data (Web of Data)

Biografiakeskus ja kirjastot keräävät henkilöhistoriaa henkilö nimi ammatti syntymapaikka... H1 Akseli Gallen-Kallela taiteilija Lemu H2 Gustaf Mannerheim marsalkka Askainen... nimi Akseli Gallen-Kallela ihminen tyyppi H1 ammatti s-paikka Lemu taiteiija tyyppi nimi Gustaf Mannerheim H2 ammatti marsalkka s-paikka Askainen

Museo luetteloi maalauksia teos nimi tekijä aika aihe... T1 Mannerheimin muotokuva Akseli Gallen-Kallela 1929 Gustaf Mannerheim T2 Aino-triptyykki Akseli Gallen-Kallela 1891 Aino, Kalevala... nimi Akseli Gallen-Kallela tekijä T1 tyyppi maalaus... aika 1929 aihe nimi Gustaf Mannerheim

Maanmittauslaitos ylläpitää paikkarekistereitä kunta Askainen Helsinki Lemu Turku... lääni Varsinais-Suomen lääni Uudenmaan lääni Varsinais-Suomen lääni Varsinais-Suomen lääni kunta Lemu tyyppi tyyppi lääni part-of tyyppi part-of... part-of Varsinais-Suomen lääni Suomi Askainen Turku part-of

FinnONTO kehittää ontologioita KOKO-ontologia pysyvä yläluokka yläluokka käsite muuttuva yläluokka abstrakti fyysinen objekti yläluokka yläluokka ajanjakso ammatti paikka yläluokka kunta ihminen taiteiija lääni maalaus marsalkka

Semanttinen RDF-verkko yhdistää kaiken: Web of Data käsitteet pysyvä yläluokka muuttuva yläluokka abstrakti yläluokka fyysinen objekti yläluokka paikka yläluokka yläluokka ajanjakso ammatti kunta nimi Akseli Gallen-Kallela tyyppi ihminen tyyppi tyyppi H1 ammatti taiteiija s-paikka Lemu tekijä tyyppi maalaus T1 tyyppi lääni yläluokka tyyppi... aihe aika 1929 part-of Varsinais-Suomen lääni part-of Suomi H2 nimi Gustaf Mannerheim ammatti marsalkka part-of part-of s-paikka Askainen Turku

Linked Data Web of Data Hajautetun työn hyödyntäminen Laajojen ja monialaisten sisältöjen koostaminen Linked Open Data ajattelu Semanttiset portaalit http://linkeddata.org

Rule level

Sääntöjen idea RDF/OWL-semantiikka perustuu logiikkaan Logiikan idea: uutta tietoa voidaan johtaa vanhasta päättelemällä

SUMO Knowledge Representation Developed in KIF (Knowledge Interchange Format) A version of first order predicate logic Other versions exist (e.g. OWL) Size 1006 terms 4142 axioms 814 rules

Rule Markup Language RuleML Standardized XML notation for rules

Sovellusesimerkki: MuseoSuomi.fi suosittelee Päättelysäännöt kertovat koneelle maailmasta Esim. että ylioppilaslakit liittyvät juhliin Esim. että asia liittyvät toisiinsa jos niiden yläkäsitteet liittyvät toisiinsa jne. Kone voi metadata+ontologia-verkon avulla päätellä kiinnostavia uusia yhteyksiä museokokoelmien esineiden välille ja tarjota ne loppukäyttäjälle suosittelulinkkeinä

Application Example

Semanttisen webin sovellusalueita Yhteentoimivuus (interoperability) Informaation haku (information retrieval) Suosittelujärjestelmät (recommender systems) Tietämyksen hallinta (knowledge management) Sähköinen liiketoiminta ja web services Personointi Esim. Aallossa kehitettyjä sovellusdemoja http://www.museosuomi.fi http://www.kulttuurisampo.fi

Vireä kehityssuunta juuri nyt: Yhdistetty avoin tieto -- Linked Open Data

Avoin tieto Open Data Tieto vapaaksi! Kansalaisilla on oikeus avoimeen tietoon Avoimelle tiedolle syntyy itsestään hyötysovelluksia Tiedon arvo kasvaa sitä jakamalla Yhden organisaation ja kokonaisuuden edut puntarissa Tuotannon tehokkuus kasvaa Miksi tuottaa uudelleen jo tuotettua tietoa? Avoimuus parantaa yhteistyötä ja työnjakoa Esim. Wikipedia Avoimuus edistää yhteentoimivuutta Keskinen kustannustekijä tietotekniikassa Avoimuus asettaa haasteita mm. lainsäädännölle Henkilösuoja, vapaa kilpailu, tekijänoikeudet, tietoturva,...

Tiedon vapauttaminen ei yksin riitä! Open Data ei ota kantaa julkaisutapaan Tietotekninen näkökulma puuttuu Open Data ei ota kantaa yhteistyöhön Web 2.0 -näkökulma puuttuu Open Data avaa tiedon vain ihmiskäyttäjälle Semanttisen webin näkökulma puuttuu» Koneiden pitää ymmärtää avointa tietoa! Linked Data on moderni ratkaisumalli Kehitysyhteisö http://linkeddata.org Tukijoina mm. W3C

Linked Data: Idea Nykyinen web on verkko joka linkittää sivuja: Web of Pages Voidaan hakea/selailla perinteisellä selaimelle Linked Data on semanttinen käsiteverkko: Web of Data Voidaan hakea/selailla myös semanttisella sovelluksella Uusi (semanttinen) web koostuu molemmista verkoista Web of Pages (ihmiselle)» WWW World Wide Web Web of Data (koneelle)» GGG Giant Global Graph Web of Pages WWW Web of Data GGG

Linked Data + Open Data = Linked Open Data

Kansainvälinen ja kotimainen tahtotila tiedon avaamiseen

Perinteinen malli: tiedon erilliset siilot + hankalaa ja kallista

Solution: Linked (Open) Data Ecosystem Public Sector Companies Linked Open Data Humans Ontologies Metadata Schemas Data Models Machines Scientific Research Social Media

1 +1 > 2 M.O.T.

Britanniassa: http://data.gov.uk

Runsaasti sovelluksia verkossa

Linked Open Data esimerkkisovellus: BBC

USA:ssa http://www.data.gov

Opengov.XX portaalit eri maissa: opengov.fi, opengov.se,...

Linked Open Data Story so Far Starting 2005 (Tim Berners-Lee)

New Datasets Linked with Others (Tim Berners-Lee)

(Tim Berners-Lee)

Linked Open Data 2009 (linkeddata.org, 2009)

Linked Open Data Cloud 2010: http://linkeddata.org

Linked Open Data Cloud 2010: http://linkeddata.org

LOD Cloud Statistics (Heath, Bizer, 2011)

Suomessa on kansallinen tahtotila tiedon avaamiseen Valtiovarainministeriö ValtIT:n Valtiotason tietoarkkitehtuurit -loppuraportti Tietohallintolaki ( FinnONTO-laki ) on juuri hyväksytty eduskunnassa Liikenne- ja viestintäministeriö Hallituksen periaatepäätös tiedon avaamisesta Avoin data mukana uudessa hallitusohjelmassa Opetus- ja kulttuuriministeriö Tutkimuksen tietoaineistot selvitys Kansallinen digitaalinen kirjasto hanke ICT-teolllisuus ICT-klusteri Tivitin Data to Intelligence -ohjelma (2012-)? HS Open, Apps4Finland, Avoimen datan foorumi, Tutkimus (tietotekniikka) Kansallinen FinnONTO-hanke (2003-2012) Linked Data Finland (2012-2014)

Kansallinen FinnONTO-visio ja -infrastruktuuri

FinnONTO Vision 2003-2012 Semantic Web needs a content infrastructure Like traffic needs roads Like energy service needs powerlines Like mobile phones need GSM or 3G-networks Especially useful in Cross-domain applications Collaborative Web 2.0 applications Let s create it together on a national level Based on W3C s generic standards

FinnONTO Industrial & Public Organization Consortium FinnONTO 2003-2004» 14 funding organizations 2004-2005» 16 funding organizations 2005-2006» 30 funding organizations 2006-2007» 37 funding organizations FinnONTO 2.0 2008-2010» 38 funding organizations 2010-2012» 35 funding org. 1.52 MEUR 2010-2012 Semantic UBICOM-services 17 funding org 0,55MEUR Linked Data Finland 2012-2014» 21 funding organizations

40+ partners in FinnONTO (2003-2012) Research mainly by Aalto and University of Helsinki Antikvaria-ryhmä

FinnONTO Results Linked open ontology infrastructure KOKO ontology cloud Data registries (e.g. persons, places, history events) International vocabularies National ontology library service ONKI http://onki.fi Case applications (based on reusable tools) eculture: MuseumFinland, CultureSampo, BookSampo, TravelSampo ehealth: HealthFinland, ActiveFinland ebusiness: CorporateFinland, case Wärtsilä, case Rautaruukki, egoverment: Semantic Suomi.fi, DataFinland, case Finnish Defense Forces, Everything open source

Linked Open Ontologies: KOKO Ontology Cloud Aligning ONKI ontologies Leikkaavat ontologiat Yhteisten ekvivalenttien käsitteiden määrä YSO + TAO 1990 YSO + MAO 2330 YSO + VALO 950 MAO + TAO 1190 YSO Your ontology?... AFO VALO MAO TAO... KOKO [Hyvönen et al., ESWC 2009]

KOKO sovelluskäyttäjän näkökulmasta

KOKOs Component Ontologies 2/2011 Thesaurus-based Ontologies in the KOKO Ontology System Name Ontology domain Underlying thesaurus Size Organization 1 YSO General domain General Finnish Thesaurus YSA, Allärs 23700 National Library, Åbo Academy 2 MUSO Music Musiikin asiasanasto MUSA, CILLA 1000 National Library 3 MAO Museum domain Museoalan asiasanasto MASA 6800 National Board of Antiquities 4 AFO Agriculture, foresty Agriforest-asiasanasto 5500 Viikki Science Library TAO Applied arts Käsi- ja taideteollisuuden asiasanasto 2600 University of Eastern Finland, 5 Library of TAIK VALO Photography Valokuvakirjallisuuden asiasanasto, 1900 Finnish Museum of Photography et 6 Valokuvaustekniikan asiasanasto al. MERO Seafaring, shipping Merenkulkun asiasanasto 1400 Liikennevirasto et al. 7 8 KAUNO Literature subjects Kaunokki, Bella 4900 Public Libraries, Kirjastot.fi 9 JUHO Public goverment Valtioneuvoston asiasanasto VNAS 6400 Ministry of Finance 10 TERO Health promotion YSA, HPMulti, MeSH, Stameta 22000 National Inst. of Health and Welfare 11 KITO Literature research Kirjallisuuden tutkimuksen asiasasanasto 900 SKS 12 KULO Culture research Kulttuurien tutkimuksen asiasanasto 1600 SKS 13 KTO Linguistics Kielitieteen asiasanasto 1000 Kotus 14 PUHO Defense Puolustushallinnon asiasanasto Puolustusvoimat 15 POIO Points of interest TGN, Geonames, LDG, SUO Aalto Univerisity TOTAL 79700

Biological Namelists of Finnish Museum of Natural History in ONKI (10/2011) vuosi alue ryhmä taksoneita joista lajeja Catalogus Lepidopterorum. Fenniae et regionum adiacentium. 1. Macrolepidoptera. 1962 Suomi Perhoset 313 161 Suomen perhosten luettelo 1977 Suomi Perhoset 256 120 The Lepidoptera of Europe. A Distributional Checklist 1996 Skandinavia Perhoset 12256 9804 Checklist of Finnish Lepidoptera 2002 Suomi Perhoset 265 126 Suomen perhosten luettelo - päivitetty versio 2008 Suomi Perhoset 4573 2987 Norwegian Lepidoptera 2008 Norja Perhoset 3244 2210 Luoteis- Catalogue of the Lepidoptera of Russia (only NW parts) 2008 Venäjä Perhoset 3251 2171 Estonian Lepidoptera. Catalogue 2008 Viro Perhoset 3477 2389 The Fly Fauna of Finland (Draft) 2008 Suomi Kärpäset 6351 4800 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 1. heimo Ichneumonidae, alaheimot Pimplinae, Poemeniinae, Rhyssinae ja Diacritinae - A check list of Finnish Hymenoptera, Parasitica. Part 1 1995 Suomi Loispistiäiset 282 210 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 2. alaheimot Tryphoninae, Eucerotinae, Adelognathinae, Xoridinae ja Agriotypinae - A check list of Finnish Hymenoptera, Parasitica. Part 2 1999 Suomi Loispistiäiset 398 311 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 3. alaheimo Cryptinae - A check list of Finnish Hymenoptera, Parasitica. Part 3 1999 Suomi Loispistiäiset 919 727 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 4. heimo Ichneumonidae, alaheimot Lycorinae, Neorhacodinae, Stilbopinae, Banchinae ja Ctenopelmatinae - A Check list of Finnish Hymenoptera, Parasitica. Part 4 2000 Suomi Loispistiäiset 786 646 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 5. heimo Ichneumonidae, alaheimot Tersilochinae, Ophioninae, Anomalinae, Paxylommatinae, Cremastinae ja Campopleginae - A check list of Finnish Hymenoptera, Parasitica. Part 5 2003 Suomi Loispistiäiset 733 587 Suomen ripsiäisten luettelo - Checklist of Finnish Thysanoptera 2008 Suomi Ripsiäiset 219 140 Suomen nivelkärsäisten luettelo - Check-list of Finnish Hemiptera 2008 Suomi Nivelkärsäiset 2690 1697 Verkkosiipiset ja Suomen verkkosiipiset ja kärsäkorennot - The Neuroptera s.l. and Mecoptera of Finland 2008 Suomi kärsäkorennot 113 72 Maailman lintujen suomenkieliset nimet (Finnish Names of the Birds of the World) 2010 Maailma Linnut 12125 9740 Nisäkkäiden nimilista (beta) 2008 Maailma Nisäkkäät 6062 4629 Suomen myrkkypistiäisten luettelo 2010 Suomi Myrkkypistiäiset 1048 664

International Ontologies in ONKI http://onki.fi/ Art and Architecture Thesaurus (AAT) (culture) Library of Congress Subject Headings (LCSH) (library) UNSPSC (products and services) IPSV (egov) MeSH (medical) Iconclass (culture)

Muita ontologioita Paikkaontologiat Maanmittauslaitoksen paikannimirekisteri Suomen ajallinen paikkaontologia ONKI Geo Henkilöt ONKI People Historialliset tapahtumat Aineistona historiantutkijoiden yhteisön Agricola-aikajana

Kansallinen ontologiakirjastopalvelu ONKI http://onki.fi/

ONKI-palvelukonseptin idea ONKI tarjoaa kansalliset keskitetyt sanasto/ontologiapalvelut valmiina toiminnallisuuksina, jotka voidaan integroida kustannustehokkaasti osaksi sovelluksia Käsitteiden haku, selailu, valinta, laajennus, kääntäminen Hieman vastaavaan tapaan kuin esimerkiksi Google Maps tarjoaa karttapalvelut sovellusten käyttöön Käyttötapaukset Tiedon indeksointi sisältöä tuotettaessa» Museot, virastot, kirjastot, mediayritykset, kansalaiset... Tiedon haku» Esim. synonyymit, kyselyn laajentaminen, monikielisyys Sanastojen kehittämisen ja julkaisemisen tuki

ONKI:n käyttöönottotilanne 9 / 2011 Prototyyppi Living Laboratory ympäristössä 2009-2011 Ihmiset: 15 000+ uniikkia käyttäjää / kk (domain) Koneet: 310 rekiströitynyttä käyttäjää (domain) ONKI konsortio valmisteilla ONKI:n ylläpito FinnONTO:n jälkeen (2012-) Kansalliskirjasto ryhtymässä vetäjäksi (suunnitelma) Hakemus arvioitavana OKM:ssä ja VM:ssä

What is the Semantic Web? Content perspective: A new metadata layer on the web describing its contents in terms of shared vocabularies, i.e. ontologies» Web as a global database system» Web of Pages vs. Web of Data Application perspective: Machine understandable web» The meaning (semantics) of contents accessible to machines» Enables human usage Intelligent web services Semantic interoperability Techological perspective: Next layers above XML» W3C standards: RDF, OWL etc. Metadata Ontology Rules