Eero Hyvönen professori, tutkimusjohtaja Semantic Computing Research Group (SeCo) Aalto-yliopisto ja Helsingin yliopisto http://www.seco.tkk.fi/
Sisältö Mitä on yhdistetty avoin tieto (Linked Open Data)? Kansainvälinen ja kotimainen tahtotila tiedon avaamiseen Kansallinen FinnONTO-visio (2003-2012) ja -infrastruktuuri
Mitä on yhdistetty avoin tieto (Linked Open Data)?
Avoin tieto Open Data Tieto vapaaksi! Kansalaisilla on oikeus avoimeen tietoon Avoimelle tiedolle syntyy itsestään hyötysovelluksia Tiedon arvo kasvaa sitä jakamalla Yhden organisaation ja kokonaisuuden edut puntarissa Tuotannon tehokkuus kasvaa Miksi tuottaa uudelleen jo tuotettua tietoa? Avoimuus parantaa yhteistyötä ja työnjakoa Esim. Wikipedia Avoimuus edistää yhteentoimivuutta Keskinen kustannustekijä tietotekniikassa Avoimuus asettaa haasteita mm. lainsäädännölle Henkilösuoja, vapaa kilpailu, tekijänoikeudet, tietoturva,...
Tiedon vapauttaminen ei yksin riitä! Open Data ei ota kantaa julkaisutapaan Tietotekninen näkökulma puuttuu Open Data ei ota kantaa yhteistyöhön Web 2.0 -näkökulma puuttuu Open Data avaa tiedon vain ihmiskäyttäjälle Semanttisen webin näkökulma puuttuu» Koneiden pitää ymmärtää avointa tietoa! Linked Data on moderni ratkaisumalli Kehitysyhteisö http://linkeddata.org Tukijoina mm. W3C
Linked Data: Idea Nykyinen web on verkko joka linkittää sivuja: Web of Pages Voidaan hakea/selailla perinteisellä selaimelle Linked Data on semanttinen käsiteverkko: Web of Data Voidaan hakea/selailla myös semanttisella sovelluksella Uusi (semanttinen) web koostuu molemmista verkoista Web of Pages (ihmiselle)» WWW World Wide Web Web of Data (koneelle)» GGG Giant Global Graph Web of Pages WWW Web of Data GGG
Linked Data + Open Data = Linked Open Data
Kansainvälinen ja kotimainen tahtotila tiedon avaamiseen
Perinteinen malli: tiedon erilliset siilot + hankalaa ja kallista
Solution: Linked (Open) Data Ecosystem Public Sector Companies Linked Open Data Humans Ontologies Metadata Schemas Data Models Machines Scientific Research Social Media
1 +1 > 2 M.O.T.
Britanniassa: http://data.gov.uk
Runsaasti sovelluksia verkossa
Linked Open Data esimerkkisovellus: BBC
USA:ssa http://www.data.gov
Opengov.XX portaalit eri maissa: opengov.fi, opengov.se,...
Linked Open Data Story so Far Starting 2005 (Tim Berners-Lee)
New Datasets Linked with Others (Tim Berners-Lee)
(Tim Berners-Lee)
Linked Open Data 2009 (linkeddata.org, 2009)
Linked Open Data Cloud 2010: http://linkeddata.org
Linked Open Data Cloud 2010: http://linkeddata.org
LOD Cloud Statistics (Heath, Bizer, 2011)
Suomessa on kansallinen tahtotila tiedon avaamiseen Valtiovarainministeriö ValtIT:n Valtiotason tietoarkkitehtuurit -loppuraportti Tietohallintolaki ( FinnONTO-laki ) on juuri hyväksytty eduskunnassa Liikenne- ja viestintäministeriö Hallituksen periaatepäätös tiedon avaamisesta Avoin data mukana uudessa hallitusohjelmassa Opetus- ja kulttuuriministeriö Tutkimuksen tietoaineistot selvitys Kansallinen digitaalinen kirjasto hanke ICT-teolllisuus ICT-klusteri Tivitin Data to Intelligence -ohjelma (2012-)? HS Open, Apps4Finland, Avoimen datan foorumi, Tutkimus (tietotekniikka) Kansallinen FinnONTO-hanke (2003-2012) Linked Data Finland (2012-2014)
Kansallinen FinnONTO-visio ja -infrastruktuuri
FinnONTO Vision 2003-2012 Semantic Web needs a content infrastructure Like traffic needs roads Like energy service needs powerlines Like mobile phones need GSM or 3G-networks Especially useful in Cross-domain applications Collaborative Web 2.0 applications Let s create it together on a national level Based on W3C s generic standards
FinnONTO Industrial & Public Organization Consortium FinnONTO 2003-2004» 14 funding organizations 2004-2005» 16 funding organizations 2005-2006» 30 funding organizations 2006-2007» 37 funding organizations FinnONTO 2.0 2008-2010» 38 funding organizations 2010-2012» 35 funding org. 1.52 MEUR 2010-2012 Semantic UBICOM-services 17 funding org 0,55MEUR Linked Data Finland 2012-2014» 21 funding organizations
40+ partners in FinnONTO (2003-2012) Research mainly by Aalto and University of Helsinki Antikvaria-ryhmä
FinnONTO Results Linked open ontology infrastructure KOKO ontology cloud Data registries (e.g. persons, places, history events) International vocabularies National ontology library service ONKI http://onki.fi Case applications (based on reusable tools) eculture: MuseumFinland, CultureSampo, BookSampo, TravelSampo ehealth: HealthFinland, ActiveFinland ebusiness: CorporateFinland, case Wärtsilä, case Rautaruukki, egoverment: Semantic Suomi.fi, DataFinland, case Finnish Defense Forces, Everything open source
Linked Open Ontologies: KOKO Ontology Cloud Aligning ONKI ontologies Leikkaavat ontologiat Yhteisten ekvivalenttien käsitteiden määrä YSO + TAO 1990 YSO + MAO 2330 YSO + VALO 950 MAO + TAO 1190 YSO Your ontology?... AFO VALO MAO TAO... KOKO [Hyvönen et al., ESWC 2009]
KOKO sovelluskäyttäjän näkökulmasta
KOKOs Component Ontologies 2/2011 Thesaurus-based Ontologies in the KOKO Ontology System Name Ontology domain Underlying thesaurus Size Organization 1 YSO General domain General Finnish Thesaurus YSA, Allärs 23700 National Library, Åbo Academy 2 MUSO Music Musiikin asiasanasto MUSA, CILLA 1000 National Library 3 MAO Museum domain Museoalan asiasanasto MASA 6800 National Board of Antiquities 4 AFO Agriculture, foresty Agriforest-asiasanasto 5500 Viikki Science Library TAO Applied arts Käsi- ja taideteollisuuden asiasanasto 2600 University of Eastern Finland, 5 Library of TAIK 6 VALO Photography Valokuvakirjallisuuden asiasanasto, Valokuvaustekniikan asiasanasto 1900 Finnish Museum of Photography et al. 7 MERO Seafaring, shipping Merenkulkun asiasanasto 1400 Liikennevirasto et al. 8 KAUNO Literature subjects Kaunokki, Bella 4900 Public Libraries, Kirjastot.fi 9 JUHO Public goverment Valtioneuvoston asiasanasto VNAS 6400 Ministry of Finance 10 TERO Health promotion YSA, HPMulti, MeSH, Stameta 22000 National Inst. of Health and Welfare 11 KITO Literature research Kirjallisuuden tutkimuksen asiasasanasto 900 SKS 12 KULO Culture research Kulttuurien tutkimuksen asiasanasto 1600 SKS 13 KTO Linguistics Kielitieteen asiasanasto 1000 Kotus 14 PUHO Defense Puolustushallinnon asiasanasto Puolustusvoimat 15 POIO Points of interest TGN, Geonames, LDG, SUO Aalto Univerisity TOTAL 79700
Biological Namelists of Finnish Museum of Natural History in ONKI (10/2011) vuosi alue ryhmä taksoneita joista lajeja Catalogus Lepidopterorum. Fenniae et regionum adiacentium. 1. Macrolepidoptera. 1962 Suomi Perhoset 313 161 Suomen perhosten luettelo 1977 Suomi Perhoset 256 120 The Lepidoptera of Europe. A Distributional Checklist 1996 Skandinavia Perhoset 12256 9804 Checklist of Finnish Lepidoptera 2002 Suomi Perhoset 265 126 Suomen perhosten luettelo - päivitetty versio 2008 Suomi Perhoset 4573 2987 Norwegian Lepidoptera 2008 Norja Perhoset 3244 2210 Luoteis- Catalogue of the Lepidoptera of Russia (only NW parts) 2008 Venäjä Perhoset 3251 2171 Estonian Lepidoptera. Catalogue 2008 Viro Perhoset 3477 2389 The Fly Fauna of Finland (Draft) 2008 Suomi Kärpäset 6351 4800 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 1. heimo Ichneumonidae, alaheimot Pimplinae, Poemeniinae, Rhyssinae ja Diacritinae - A check list of Finnish Hymenoptera, Parasitica. Part 1 1995 Suomi Loispistiäiset 282 210 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 2. alaheimot Tryphoninae, Eucerotinae, Adelognathinae, Xoridinae ja Agriotypinae - A check list of Finnish Hymenoptera, Parasitica. Part 2 1999 Suomi Loispistiäiset 398 311 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 3. alaheimo Cryptinae - A check list of Finnish Hymenoptera, Parasitica. Part 3 1999 Suomi Loispistiäiset 919 727 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 4. heimo Ichneumonidae, alaheimot Lycorinae, Neorhacodinae, Stilbopinae, Banchinae ja Ctenopelmatinae - A Check list of Finnish Hymenoptera, Parasitica. Part 4 2000 Suomi Loispistiäiset 786 646 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 5. heimo Ichneumonidae, alaheimot Tersilochinae, Ophioninae, Anomalinae, Paxylommatinae, Cremastinae ja Campopleginae - A check list of Finnish Hymenoptera, Parasitica. Part 5 2003 Suomi Loispistiäiset 733 587 Suomen ripsiäisten luettelo - Checklist of Finnish Thysanoptera 2008 Suomi Ripsiäiset 219 140 Suomen nivelkärsäisten luettelo - Check-list of Finnish Hemiptera 2008 Suomi Nivelkärsäiset 2690 1697 Verkkosiipiset ja Suomen verkkosiipiset ja kärsäkorennot - The Neuroptera s.l. and Mecoptera of Finland 2008 Suomi kärsäkorennot 113 72 Maailman lintujen suomenkieliset nimet (Finnish Names of the Birds of the World) 2010 Maailma Linnut 12125 9740 Nisäkkäiden nimilista (beta) 2008 Maailma Nisäkkäät 6062 4629 Suomen myrkkypistiäisten luettelo 2010 Suomi Myrkkypistiäiset 1048 664
International Ontologies in ONKI http://onki.fi/ Art and Architecture Thesaurus (AAT) (culture) Library of Congress Subject Headings (LCSH) (library) UNSPSC (products and services) IPSV (egov) MeSH (medical) Iconclass (culture)
Muita ontologioita Paikkaontologiat Maanmittauslaitoksen paikannimirekisteri Suomen ajallinen paikkaontologia ONKI Geo Henkilöt ONKI People Historialliset tapahtumat Aineistona historiantutkijoiden yhteisön Agricola-aikajana
Kansallinen ontologiakirjastopalvelu ONKI http://onki.fi/
ONKI-palvelukonseptin idea ONKI tarjoaa kansalliset keskitetyt sanasto/ontologiapalvelut valmiina toiminnallisuuksina, jotka voidaan integroida kustannustehokkaasti osaksi sovelluksia Käsitteiden haku, selailu, valinta, laajennus, kääntäminen Hieman vastaavaan tapaan kuin esimerkiksi Google Maps tarjoaa karttapalvelut sovellusten käyttöön Käyttötapaukset Tiedon indeksointi sisältöä tuotettaessa» Museot, virastot, kirjastot, mediayritykset, kansalaiset... Tiedon haku» Esim. synonyymit, kyselyn laajentaminen, monikielisyys Sanastojen kehittämisen ja julkaisemisen tuki
ONKI:n käyttöönottotilanne 9 / 2011 Prototyyppi Living Laboratory ympäristössä 2009-2011 Ihmiset: 15 000+ uniikkia käyttäjää / kk (domain) Koneet: 310 rekiströitynyttä käyttäjää (domain) ONKI konsortio valmisteilla ONKI:n ylläpito FinnONTO:n jälkeen (2012-) Kansalliskirjasto ryhtymässä vetäjäksi (suunnitelma) Hakemus arvioitavana OKM:ssä ja VM:ssä
A FinnONTO application CultureSampo Finnish Culture on the Semantic Web 2.0
Käytännön esimerkki mahdollisuuksista: FinnONTO:n Kulttuurisampo (2005-) Kulttuurisampo suomalainen kulttuuri semanttisessa Web 2.0:ssa Kansallinen kulttuurialan yhteisöllinen julkaisukanava Linked Open Data hengessä Museot, kirjastot, arkistot Kansalaiset http://www.kulttuurisampo.fi Finnish Content Providers 1 Agricola Suomen historiaverkko 2 Espoon kaupunginmuseo 3 Helsingin kaupunginkirjasto 4 Hiihtomuseo 5 Jyväskylän yliopisto, musiikin laitos 6 Kansallisbiografia 7 Kansallismuseo 8 Kuopion kulttuurihistoriallinen museo 9 Laatokan-Karjalan museo 10 Lahden kaupunginmuseo 11 Museovirasto 12 Pohjois-Karjalan museo 13 Radio- ja TV-museo 14 Seurasaaren ulkomuseo 15 Suomalaisen Kirjallisuuden Seura SKS 16 Suomen maatalousmuseo Sarka 17 Suomen merimuseo 18 Taideteollisen korkeakoulun kirjasto 19 Valtion taidemuseo 20 Veljekset Karhumäki Oy 21 Viipurin historiallinen museo 22 Yleisradio Oy International Content Providers 1 Geonames 2 Google (Maps) 3 Iconclass (vocab.) 4 Panoramio 5 Paul J. Getty Foundation (vocab.) 6 Wikipedia
Haaste 1: Kulttuurisisältöjen tuotanto Hajautettu, ei yhteisöllisyyttä, ei koordinaatiota
Haaste 2: Kulttuurisisältöjen monimuotoisuus Erilaiset, mutta toisiinsa liittyvät sisällöt Artifacts Maps Encyclopedia Videos Buildings Narratives Literature Music Cultural sites Biographies Fine arts
Kulttuurisammon ratkaisu pähkinänkuoressa Content Providers Semantic Metadata National FinnONTO Ontology Infrastructure
Biografiakeskus ja kirjastot keräävät henkilöhistoriaa henkilö nimi ammatti syntymapaikka... H1 Akseli Gallen-Kallela taiteilija Lemu H2 Gustaf Mannerheim marsalkka Askainen... nimi Akseli Gallen-Kallela ihminen tyyppi H1 ammatti s-paikka Lemu taiteiija tyyppi nimi Gustaf Mannerheim H2 ammatti marsalkka s-paikka Askainen
Museo luetteloi maalauksia teos nimi tekijä aika aihe... T1 Mannerheimin muotokuva Akseli Gallen-Kallela 1929 Gustaf Mannerheim T2 Aino-triptyykki Akseli Gallen-Kallela 1891 Aino, Kalevala... nimi Akseli Gallen-Kallela tekijä T1 tyyppi maalaus... aika 1929 aihe nimi Gustaf Mannerheim
Maanmittauslaitos ylläpitää paikkarekistereitä kunta Askainen Helsinki Lemu Turku... lääni Varsinais-Suomen lääni Uudenmaan lääni Varsinais-Suomen lääni Varsinais-Suomen lääni kunta Lemu tyyppi tyyppi lääni part-of tyyppi part-of... part-of Varsinais-Suomen lääni Suomi Askainen Turku part-of
FinnONTO kehittää ontologioita KOKO-ontologia pysyvä yläluokka yläluokka käsite muuttuva yläluokka abstrakti fyysinen objekti yläluokka yläluokka ajanjakso ammatti paikka yläluokka kunta ihminen taiteiija lääni maalaus marsalkka
Semanttinen RDF-verkko yhdistää kaiken: Web of Linked Open Data (GGG) käsitteet pysyvä yläluokka yläluokka muuttuva yläluokka abstrakti fyysinen objekti yläluokka paikka yläluokka yläluokka ajanjakso ammatti kunta nimi Akseli Gallen-Kallela tyyppi ihminen tyyppi tyyppi H1 ammatti taiteiija s-paikka Lemu tekijä tyyppi maalaus T1 tyyppi lääni yläluokka tyyppi... aihe aika 1929 part-of Varsinais-Suomen lääni part-of Suomi H2 nimi Gustaf Mannerheim ammatti marsalkka part-of part-of s-paikka Askainen Turku
Initial Culture Sampo RDF Knowledge Base (March 17, 2009) Metadata 134,000 cultural collection items (artifacts, books, videos etc.) 285,000 other resources (places, persons etc.) 204 property types in metadata Ontologies KOKO ontologies (ca. 37,000 concepts) Additional international vocabularies» AAT, ULAN, Iconclass 253 property types in ontologies Size 11,4 million triples (arcs in the RDF graph) New datasets (2011) contain billions of triples
Yhteenveto (Meta)tieto kannattaa avata semanttisesti yhteentoimivasti Oma tieto yhdistyy muiden tietoihin Oma (ja muiden) tieto rikastuu semanttisesti Semantiikka mahdollistaa älykkäät sovellukset W3C.n semanttiset web teknologiat tarjoavat standardin ratkaisumallin ja kansainvälisen LOD-viitekehyksen FinnONTO:n tulokset ovat käytettävissä avoimesti Tutkimustyö jatkuu: Linked Data Finland (2012-)
Lisätietoja Yhteenveto suomeksi FinnONTO-ontologiavisiosta Eero Hyvönen: FinnONTO-malli kansallisen semanttisen webin sisältöinfrastruktuurin perustaksi - visio ja sen toteutus. Julkistustilaisuuden esitelmä, TKK, 12.9.2008. http://www.seco.tkk.fi/publications/2008/hyvonen-onkiyleisesitys-2008.pdf Yhteenveto suomeksi Kulttuurisampo-visiosta Eero Hyvönen: Kulttuurisampo - suomalainen kulttuuri semanttisessa webissä. Muistiorganisaatioiden ja kansalaisten yhteisöllinen kansallinen julkaisujärjestelmä Julkistustilaisuuden esitelmä, TKK, 25.9.2008. http://www.seco.tkk.fi/publications/2008/hyvonen- Kulttuurisampo-2008.pdf FinnONTO-projekti, Semantic Computing Research Group, Aalto ja Helsingin yliopisto: http://www.seco.tkk.fi/projects/finnonto/