Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO ja sen sovellukset Prof. Eero Hyvönen Helsinki University of Technology (TKK) and University of Helsinki Semantic Computing Research Group (SeCo) http://www.seco.tkk.fi/
Sisältö Mikä on FinnONTO? FinnONTO:n visiot FinnONTO-infrastruktuuri Sovellukset
Mikä on FinnONTO? Tahtotila Tarvitaan kansallinen semanttisen webin infrastruktuuri! Kuin tieverkosto, sähkö/puhelinverkko, Internet,... Kansallinen yhteisö Aalto-yliopiston TKK:n, HY:n ja TaY:n ja 38 julkisen organisaation ja yrityksen tutkimuskonsortio Tutkimushankkeiden jatkumo 2003-2012 Semanttisen webin infrastruktuurin pilottijärjestelmä Pilottivaiheessa oleva kansallisten käsitteistöjen ontologiainfrastruktuuri Mukana useissa pilottisovelluksissa MuseoSuomi, Kulttuurisampo, TerveSuomi, ToimintaSuomi, YritysSuomi, Kirjasampo,...
FinONTO Industrial & Public Organization Consortium FinnONTO 2003-2004» 14 funding organizations 2004-2005» 16 funding organizations 2005-2006» 30 funding organizations 2006-2007» 37 funding organizations FinnONTO 2.0 2008-2010» 38 funding organizations 2010-2012» 35 funding org. 1.52 MEUR FinnONTO spin-off-project Semantic UBICOM-services 17 funding org., 2010-2011 0,55MEUR
Antikvaria-ryhmä Kiitos!
FinnONTO:n visiot
Visio 1: Webin älykkyyden nostaminen semantiikan avulla Semanttinen web: palvelun älykkyys edellyttää, että kone ymmärtää verkkosisältöjä Suomalaisen semanttisen webin perustana ovat W3C.n standardien lisäksi kansalliset käsitteistöt, sisällöt ja kielet
Semantic Search Limitations of Non-semantic Web Case MuseumFinland (2002-2004) NBA-H26069-467 :object cup and plate ; :material porcelain ; :creationplace Germany ; :creator Meissen. This metadata cannot answer the following questions: Find all vessels? Find all ceramic products? Find artifacts manufactured in Europe? Does the city of Meissen manufacture ceramics?
Semantic Web Solution: Ontologies NBA-H26069-467 :object cup and plate ; :object_concept object:cup ; :object_concept object:plate ; :material porcelain ; :material_concept object:porcelain ; :creationplace Germany ; :creationplace_concept place:germany ; :creator Meissen :creator_concept actor:meissen. Find all vessels? Find all ceramic products? Find artifacts manufactured in Europe? Does the city of Meissen manufacture ceramics? NBA-H26069-467 place:germany creationlocation_concept object_concept object_concept material_concept... material:porcelain place ontology loc:partof object:cup place:europe place:meissen rdfs:subclassof object:plate... object ontology... object:vessel rdfs:subclassof actor ontology material ontology actor:meissen
A key question: What about the metadata and ontologies? Objects Materials Actors Places Times Events Animals Plants Geography Physics Chemistry History...
Visio 2: Webin yhteentoimivuuden parantaminen Semanttinen web: yhteiset ontologiat, metadataskeemat, palvelurajapinnat
Kansallinen semanttisen webin FinnONTO-infrastruktuuri 12
Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO Kansallinen ontologiakirjastopalvelu ONKI -Ontologiat ja niihin liittyvät palvelut -Metadatastandardit ja niihin liittyvät palvelut Alakohtaiset sisältöstandardit ja käytännöt Sovellusriippumattomat standardit ja käytännöt Ontologiat ja peilaukset (mapping) Kansallinen ontologiajärjestelmä KOKO Muut kotimaiset ontologiat, luokitukset ja sanastot Kansainväliset ontologiat, luokitukset ja sanastot W3C:n ym. - sovellusriippumattomat web standardit - parhaat käytännöt Metadata - Sisältökohtaiset metadatastandardit - Kotimaiset JHS- ym. suositukset Dublin Core ym. sovellusriippumattomat metadatastandardit Työvälineet ja parhaat käytännöt
Prototyypin ydinosia Kansallinen ontologiajärjestelmä KOKO Kansallinen ontologiakirjastopalvelu ONKI
Kansallinen ontologiajärjestelmä KOKO
Why Thesauri are Not Enough but Ontologies are needed? Example from the YSA-thesaurus: Solar system BT Comet BT Halleys comet Solar system partof Comet type Halleys comet Celestial body subclassof The machine is confused: Is Halley s comet an individual or a class of them, such as Comet? Can there be many Halley s comets or only one? Is Comet a kind of Solar system or a part of a solar system. Is it a part as a concept or are all individual comets a part of some solar system? What does part of mean: real part of, contained in, member of, made of, connected to. Do comets have properties of solar systems (e.g. own planets) based on BT Searching Solars systems would retrieve comets although comets are not solar systems...
Asiasanaston muuntaminen ontologiaksi kaaviomerkinnät Asiasanastot / terminologiset sanastot geneerinen suhde / hierarkkinen suhde partitiivinen suhde / koostumussuhde assosiaatiosuhde / assosiatiivinen suhde / funktiosuhde Ontologiat geneerinen suhde / hierarkkinen suhde / subclass of luokan ja yksilön välinen geneerinen suhde partitiivinen suhde / koostumussuhde assosiaatiosuhde / assosiatiivinen suhde / funktiosuhde yksilö luokka suhdetyyppi alakäsite yläkäsite kokonaisuus osa esimerkkiin lisätty asiasana <ei käytetä asiasanoitukseen>
Asiasanaston muuntaminen ontologiaksi alustava pääluokkajako <muuttuva> prosessi tapahtuma toiminta <ajanjakso> <fyysinen objekti> ilmiö <pysyvä> <aineeton tuotos> <abstrakti> paikka ominaisuus järjestelmä
Asiasanaston muuntaminen ontologiaksi toimintojen pääluokat prosessi tapahtuma <spontaani tapahtuma> <järjestetty tapahtuma> toiminta <havainnointi ja aistiminen> <keskinäinen toiminta> <kulutus ja käyttö> <liikkuminen ja liikuttaminen> <luonti> <omistus ja omistuksen siirtäminen> <oleminen> <muuttaminen> <muutos> <mentaalinen toiminta>
Asiasanaston muuntaminen ontologiaksi merkitysten erittely lapset (perheenjäsenet) perheenjäsenet ikäryhmät sosioekonomiseen ryhmään liittyvä rooli lapset (ikäryhmät) lapset (rooli) tyttäret ainoa lapsi vauvat tytöt katulapset kasvattilapset
Asiasanaston muuntaminen ontologiaksi koostumussuhteiden erottelu korkeakoululaitos korkeakoulut yliopistot kielikeskukset ammattikorkeakoulut kauppakorkeakoulut taidekorkeakoulut tiedekunnat teknilliset korkeakoulut teknilliset yliopistot
Asiasanaston muuntaminen ontologiaksi koostumussuhteiden erottelu korkeakoulut taidekorkeakoulut ammattikorkeakoulut yliopistot kielikeskukset tiedekunnat kauppakorkeakoulut teknilliset yliopistot (teknilliset korkeakoulut) korkeakoululaitos
A Key Point of Ontologies: Using URIs, not Keywords! Each concept will have a globally unique URI (across all domains) URI = Universal Resource Identifier» URL web addresses are a special case of URIs A keyword is not enough for indexing the meaning:»e.g. Nokia : = Nokia as a company? = Nokia as a city in Finland? = Nokia a character in a F.E. Sillanpää s novel? = Nokia as an animal?» E.g. Pyhäjärvi as a location There 49 Pyhäjärvi lakes, villages etc. in Finland The URIs are globally shared among users
KOKO-luokkaontologioita Nimi Ontologian ala Pohjana oleva asiasanasto Koko YSO Yleinen suomalainen ontologia Yleinen suomalainen asiasanasto YSA. 20 600 Yleiskäsitteet, monialainen Kansalliskirjasto. http://vesa.lib.helsinki.fi/ MAO Museoalan ontologia Museoalan asiasanasto MASA. Museovirasto (Leskinen, 1997). AFO Maa- ja metsätalouden ontologia. Maa ja metsätalous 6800 Agriforest tesaurus. Viikin tiedekirjasto. 5500 TAO Taideteollisuusalan ontologia Käsi- ja taideteollisuuden asiasanasto (Krogerus et al., 1997) VALO Valokuvausalan ontologia Valokuvakirjallisuuden asiasanasto (Ulla Karttunen). Valokuvaustekniikan asiasanasto. Suomen valokuvataiteen museo. 2600 1900
KOKO ontologian kehittäjän näkokulmasta YSO Leikkaavat ontologiat Yhteisten ekvivalenttien käsitteiden määrä YSO + TAO 1990 YSO + MAO 2330 YSO + VALO 950 MAO + TAO 1190... AFO VALO MAO TAO KOKO...
KOKO sovelluskäyttäjän näkökulmasta
KOKO: yhteisöllinen kokonaisontologia Kehitystyön periaatteita Perustan hyödyntäminen uudelleen eri yhteyksissä Päällekkäisen työn eliminointi ja koordinointi Avoin lähdekoodi kansallisille ydinsisällöille Käytön edistäminen maksuttomuudella Yhteistyöverkoston rakentaminen ja tukeminen Moniarvoisuus ja virheiden sietäminen Minimaalinen ontologinen sitoutuminen
Kansallinen ontologiakirjastopalvelu ONKI http://www.yso.fi/
ONKI: käyttäjäryhmät 1.Ontologian kehittäjät ja julkaisijat - Itsenäiset eri alojen asiantuntijaryhmät - Yhteisöllinen ontologioden peilaus - Versioinnin ja päivitysten tuki 2. Tiedon hakijat ja soveltajat - Merkitysten tunnistus ja valinta - Kyselyiden lavennus - Käsitteiden määritelmät - Ontologioiden jakelu Nokia: Kaupunki vai yritys? 3. Sisällön kuvailijat - Käsitteiden haku ja selaus - Merkitysten tunnistus ja valinta - Tietojen siirto indeksointijärjestelmään - Muut sisällönkuvailupalvelut
ONKI prototyyppi pähkinänkuoressa Palvelimet ONKI SKOS sanastoille ja yksinkertaisille ontogioille ONKI Geo paikkaontologioille ONKI People henkilö- ja organisaatioontologioille Sisällöt Luokkaontologiat» KOKO-ontologiat» Muut ontologiset rakenteet Yksilöontologiat» Paikkaontologiat» Henkilöt ja organisaatiot Asiasanastot SKOS-muodossa Palvelut Ihmisille» ONKI-selain» ONKI-valitsin Sovelluksille» AJAX-rajapinta» REST-rajapinta» Web Service -rajapinta
Visio 3: Yhteisöllinen avoin sisällöntuotanto ja julkaiseminen Hajautetun työn hyödyntäminen Laajojen ja monialaisten sisältöjen koostaminen Linked Open Data ajattelu, Web of Data Semanttiset portaalit http://linkeddata.org
Biografiakeskus ja kirjastot keräävät henkilöhistoriaa henkilö nimi ammatti syntymapaikka... H1 Akseli Gallen-Kallela taiteilija Lemu H2 Gustaf Mannerheim marsalkka Askainen... nimi Akseli Gallen-Kallela ihminen tyyppi H1 ammatti s-paikka Lemu taiteiija tyyppi nimi Gustaf Mannerheim H2 ammatti marsalkka s-paikka Askainen
Museo luetteloi maalauksia teos nimi tekijä aika aihe... T1 Mannerheimin muotokuva Akseli Gallen-Kallela 1929 Gustaf Mannerheim T2 Aino-triptyykki Akseli Gallen-Kallela 1891 Aino, Kalevala... nimi Akseli Gallen-Kallela tekijä T1 tyyppi maalaus... aika 1929 aihe nimi Gustaf Mannerheim
Maanmittauslaitos ylläpitää paikkarekistereitä kunta Askainen Helsinki Lemu Turku... lääni Varsinais-Suomen lääni Uudenmaan lääni Varsinais-Suomen lääni Varsinais-Suomen lääni kunta Lemu tyyppi tyyppi lääni part-of tyyppi part-of... part-of Varsinais-Suomen lääni Suomi Askainen Turku part-of
FinnONTO kehittää ontologioita KOKO-ontologia pysyvä yläluokka yläluokka käsite muuttuva yläluokka abstrakti fyysinen objekti yläluokka yläluokka ajanjakso ammatti paikka yläluokka kunta ihminen taiteiija lääni maalaus marsalkka
Semanttinen RDF-verkko yhdistää kaiken: Web of Data käsitteet pysyvä yläluokka muuttuva yläluokka abstrakti yläluokka fyysinen objekti yläluokka paikka yläluokka yläluokka ajanjakso ammatti kunta nimi Akseli Gallen-Kallela tyyppi ihminen tyyppi tyyppi H1 ammatti taiteiija s-paikka Lemu tekijä tyyppi maalaus T1 tyyppi lääni yläluokka tyyppi... aihe aika 1929 part-of Varsinais-Suomen lääni part-of Suomi H2 nimi Gustaf Mannerheim ammatti marsalkka part-of part-of s-paikka Askainen Turku
Linked Open Data: perusideoita Kansalaisilla on oikeus tietoon Kertaalleen tuotettua tietoa ei kannata tuottaa aina uudelleen Tietoa yhdistämällä kaikkien tiedot rikastuvat Joku muu voi tehdä datalle hyödyllisen sovelluksen, jos tieto on saatavilla helposti Yhden organisaation pienen edun paikallinen tavoittelu voi tulla kalliiksi kokonaisuudelle Julkisin varoin tuotettu tieto pitää vapauttaa!
Linked Open Datan kehittyminen (Tim Berners-Lee, 2009)
(Tim Berners-Lee, 2009)
(Tim Berners-Lee, 2009)
LOD-verkossa jo miljardeja kaaria (RDF triple) (linkeddata.org, 2009)
Runsaasti sovelluksia verkossa
LOD esimerkkisovellus: BBC
San Franciscon kaupunki
Opengov.fi
Työkalut SAHA 3 -metadataeditori, HAKO-hakukone, POKA-tiedoneristin,...
Yhteisölliset semanttiset portaalit Kulttuurisampo, TerveSuomi, ToimintaSuomi, Yrityssuomi, Case Rautaruukki, Case Wärtsilä,...
Case: CultureSampo - Finnish Culture on the Semantic Web 2.0 http://www.kulttuurisampo.fi/
Cultural Content Compexity: Heterogenous and Interlinked Artifacts Maps Encyclopedia Videos Buildings Narratives Literature Music Cultural sites Biographies Fine arts
Cultural Content Production: Distributed and Independent
Case CultureSampo in a Nutshell Content Providers Semantic Metadata National Ontology Infrastructure
Yhteenveto Semanttinen web toimii! MuseoSuomi, TerveSuomi, KulttuuriSampo, Opas, Opintie, Orava,... Tarvitsemme kansallisen sisältöinfrastruktuurin Yhteisölliset ontologiat yhteentoimivuutta varten Ontologiapalvelut kustannustehokkuutta varten FinnONTO on kehittänyt tähän ratkaisumallin ja prototyypin Tervetuloa ONKI Living Laboratoryn pilottikäyttäjäksi!
Lisätietoja Yhteenveto suomeksi FinnONTO-ontologiavisiosta Eero Hyvönen: FinnONTO-malli kansallisen semanttisen webin sisältöinfrastruktuurin perustaksi - visio ja sen toteutus. Julkistustilaisuuden esitelmä, TKK, 12.9.2008. http://www.seco.tkk.fi/publications/2008/hyvonen-onkiyleisesitys-2008.pdf Yhteenveto suomeksi Kulttuurisamposta Eero Hyvönen: Kulttuurisampo - suomalainen kulttuuri semanttisessa webissä. Muistiorganisaatioiden ja kansalaisten yhteisöllinen kansallinen julkaisujärjestelmä Julkistustilaisuuden esitelmä, TKK, 25.9.2008. http://www.seco.tkk.fi/publications/2008/hyvonen- Kulttuurisampo-2008.pdf Julkaisuja, prototyyppejä yms. http://www.seco.tkk.fi/