Linked (Open) Data Finland - visio ja sen toteutus

Samankaltaiset tiedostot
Linked Data Finland: visio, missio ja toteutus

Miten avoin yhdistetty tieto saadaan verkkoon: kansallinen Linked Data Finland -hanke-ehdotus

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

Semanttinen Finlex Visio ja sen toteutus

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

FinnONTO-infrastruktuurin esittely

Sotasampo. Visio, missio ja toteutus. Talvi- ja jatkosota semanttisessa webissä

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

Avoin data Avoin kirjasto Kuvailupäivät

Paikkatiedon semanttinen mallinnus, integrointi ja julkaiseminen Case Suomalainen ajallinen paikkaontologia SAPO

Case: Helsinki Region Infoshare - pääkaupunkiseudun tiedot avoimiksi

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Tervetuloa AVOIN*-hankkeen seminaariin

Suomalainen kulttuuri ja semanttinen web

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Johdanto: Semanttinen Kalevala projekti

Yhteisöllinen semanttinen web 2.0 FinnONTO 2.0 -hankkeen visio ja tulokset

Semanttinen Finlex Arttu Oksanen ( )

Ontologiakirjasto ONKI-Paikka

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Case digitaaliset ihmistieteet

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Asiakasystävällinen ja ylläpidettävä verkkopalvelu tarua vai totta

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

Julkistustilaisuus , SKS, Juhlasali, Helsinki

Suomalainen sisältöinfrastruktuuri semanttisessa webissä käytettävissänne

Esittely: Helsinki Region Infoshare Seudun tietovarannot avoimiksi. Ville Meloni ja Pekka Vuori

Helsinki Region Infoshare Pääkaupunkiseudun tiedon avaaminen

Georef KDK-seminaari

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Avoin data, avoimet rajapinnat ja tietojen linkitys. Osma Suominen Suomi.fi

Automaattinen semanttinen annotointi

Kohti suomalaista semanttista webiä

Kim Viljanen

Helsingin kaupunginhallituksen iltakoulu Asta Manninen, Pekka Vuori Yhteistyö: Tieke ja FVH, Ville Meloni Helsinki, Espoo, Vantaa,

Kansallinen digitaalinen kirjasto

Media- ja kulttuuripalvelut

Arjen tietoyhteiskunta: Tiedon saatavuuden edistäminen

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

W3C ja alueellinen standardointi

Avoimen tiedon ja yhteentoimivuuden palvelu. Avoindata.fi. Koulutus Paikkatiedon infrastruktuurin hyödyntäminen Kristiina Puharinen, Valtori

Kohti suomalaisen semanttista webiä -- ontologioita, palveluita ja sovelluksia

JHS 145 Palvelutietojen ryhmittely ja osoitteet asiointia varten monta toimialaa kattavissa julkisen sektorin portaaleissa suosituksen päivittäminen

Avointa dataa Helsingin seudulta

Helsinki Region Infoshare 2013

Avoimen tiedon ohjelma Anne Kauhanen-Simanainen

Kokemuksia datan avaamisesta ja esimerkkejä avoimesta ympäristödatasta pääkaupunkiseudulta

Juridiset aineistot ja avoin tieto Anne Kauhanen-Simanainen Säätytalo

W3C: teknologia ja (tieto)yhteiskunta

Avoimen datan löytäminen, käyttöönotto ja jakaminen. Havainnolliset analyysit avoimella paikkatiedolla ProGIS ry ja Poligon, 11.4.

Avoimet lakitietopalvelut muuttuva Finlex. Aki Hietanen, oikeusministeriö Säätytalo

Avoin tiede ja tutkimus (ATT-hanke)

W3C-teknologiat ja yhteensopivuus

Skene. Games Refueled. Muokkaa perustyyl. for Health, Kuopio

Kaupunkimallit ja CityGML

Yhteentoimivuutta edistävien työkalujen kehittäminen - JulkICTLab pilottiehdotus

W3C ja Web-teknologiat

Yleinen suomalainen ontologia YSO

Paikkatiedot ja Web-standardit

Eero Hyvönen professori, tutkimusjohtaja. Semantic Computing Research Group (SeCo) Aalto-yliopisto ja Helsingin yliopisto

Kokemuksia datan avaamisesta pääkaupunkiseudulla. Projektipäällikkö Ville Meloni - Forum Virium Helsinki Open Data Tampere Region Kick-off 20.2.

Eurooppalaiset lainsäädännön ja oikeuskäytännön standardit. Aki Hietanen, oikeusministeriö

Median digitalisoituminen ja yhdistetty tieto - Svenska.yle.fi

Kulttuurisampo suomalainen kulttuuri semanttisessa webissä

Yhteentoimivuusvälineistö: Sanastoeditorin esittelytilaisuus klo Väestörekisterikeskus, Lintulahdenkuja 4, Helsinki

Erikoiskirjastot somessa. Päivikki Karhula, johtava tietoasiantuntija Eduskunnan kirjasto

XML johdanto, uusimmat standardit ja kehitys

JulkICT Lab ja Dataportaali Avoin data ja palvelukokeilut

Kulttuurisampo.fi Suomalainen kulttuuri ja semanttinen web mitä, miksi ja miten?

ASIAKASLIITTYMÄ. Erikoiskirjastokokous Ari Rouvari Kansalliskirjasto

Valtion uudet yhteentoimivuuspalvelut: dataportaali, palvelutietovaranto ja yhteentoimivuus.fi v.2

1 MIKSI LAINSÄÄDÄNTÖ PITÄÄ JULKAISTA AVOIMENA DATANA?

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Kokonaisarkkitehtuuri. YKN Matti Sarmela

Yhteentoimivuutta edistävien työkalujen kehittäminen - JulkICTLab jatkohakemus

Tietovarannot. Anna Eteläaho. Analyysi ja yhteenveto avoimen datan innovaatiokilpailun kilpailutöistä. Intressiryhmän 2. kokous 27.2.

Lainsäädäntö avoimena datana Semanttinen Finlex-palvelussa data.finlex.fi. Aki Hietanen, oikeusministeriö

KIRJASAMPO. Jyväskylä

The OWL-S are not what they seem

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO ja sen sovellukset. Prof. Eero Hyvönen

Tutkimuksen tietoaineistojen saatavuuden. kokonaisarkkitehtuuri

Internet jolla on merkitystä

W3C ja Web-teknologiat

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Paikannimirekisteri linkitettynä tietona

Terveys- ja yrityspalvelutyöpajan tutkimus Eero Hyvönen, Mikko Salonoja, Reetta Sinkkilä, Osma Suominen, Antti Tani

Semantic Web käytännön sovelluksissa. TkT Janne Saarela Profium Oy

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

Katsaus tietoarkkitehtuurityöhön

voimen tiedon ohjelma

AVOIN DATA AVAIN UUTEEN Seminaarin avaus Kansleri Ilkka Niiniluoto Helsingin yliopisto

tarua vai totta Esitelmän pitäjän nimi Mirjam Heikkinen Helsingin kaupunki

Kansalliskirjaston ATThankkeet

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Transkriptio:

Linked (Open) Data Finland - visio ja sen toteutus Eero Hyvönen professori, tutkimusjohtaja Semantic Computing Research Group (SeCo) Aalto-yliopisto ja Helsingin yliopisto http://www.seco.tkk.fi/

Sisältö Linked (Open) Data / Web of Data Kansainvälinen infrastruktuuri ja sovelluksia Linked (Open) Data Finland Kansallinen infrastruktuuri ja sovelluksia TTA:n Linked Data -pilotointi

Trends: Linked Open Data

Web of Data: mitä se on?

Mitä on Web of Data? Nykyinen web on verkko joka linkittää sivuja: Web of Pages Voidaan hakea/selailla perinteisellä selaimelle Linkit yhdistävät sivuja Webin sisään on syntynyt tietoverkko: Web of Data Voidaan hakea/selailla semanttisella sovelluksella Linkit yhdistävät tietoa (esim. harakka -> lintu) Uusi (semanttinen) web koostuu molemmista verkoista Web of Pages (ihmiselle)» WWW World Wide Web Web of Data (koneelle)» GGG Giant Global Graph» Google Knowledge Graph» Microsoft Satori Web of Pages WWW Web of Data GGG

Ydinkäsitteitä Yhdistetty avoin tieto = Linked Open Data Käytännöllinen/yksinkerttainen data-perustainen web Perustuu W3C:n semanttisen webin standardeihin Linked Data = Web of Data Mukana myös ei-avoin tieto Semantic Web Mukana myös mutkikas semantiikka ja tekoäly Big data Isojen erimuotoisten datamassojen hyödyntäminen

Linked Data Content Creation Creating datasets (RDF graphs) Linking datasets together (joining graphs) Cross-referencing data in other datasets» E.g. place Finland to president Niinistö Identifying same concepts in different datasets» E.g Helsinki in Geonames.org vs. DBPedia.org Light weight Semantic Web technologies used http://linkeddata.org

Linked Open Data Story so Far Starting 2005 (Tim Berners-Lee)

New Datasets Linked with Others (Tim Berners-Lee)

(Tim Berners-Lee)

Linked Open Data 2009 (linkeddata.org, 2009)

Linked Open Data Cloud 2010: http://linkeddata.org

Linked Open Data Cloud 2011: http://linkeddata.org onki.fi: Suomen kunnat

Googlen GGG: Knowledge Graph Microsoft: Satori

Linked Data Finland Metatiedon tuotanto, yhdistäminen ja sovellukset

Linked Data Finland Perusta: Kansainvälinen Linked Data / Web of Data megatrendi W3C:n standardipino ja semanttisen webin teknologiat FinnONTO-hankkeen (2003-2012) tulokset Kehityskohteet Metadatan kustannustehokas tuotanto Metadatan laatu ja luotettavuus Metadatajoukkojen yhdistäminen Demonstraatiot hyötykäytöstä Käytännön arviot teknologian merkityksestä

Carrier Projects: FinnONTO & SUBI & LDF Industrial & Public Organization Consortium FinnONTO 2003-2004 14 funding organizations 2004-2005 16 funding organizations 2005-2006 30 funding organizations 2006-2007 37 funding organizations FinnONTO 2.0 2008-2010 38 funding organizations FinnONTO 2.0 35 funding org., 2010-2012 1,52MEUR Semantic UBICOM-services (SUBI) 17 funding org., 2010-2012 0,55MEUR Linked Data Finland (LDF) 19 funding org., 2012-2013 0,49 MEUR

FinnONTO -> Linked Data Finland FinnONTO 2003-2012 Ontologies Metadata RDF Linked Data Finland 2012- Data

FinnONTO Google semantic Image Search Perspective

Johtoryhmän kokoonpano (20.5.2013) Yritys / organisaatio Jäsen Varajäsen 1 Citynomadi Oy Merja Taipaleenmäki 2 Connexor Oy Pasi Tapanainen Mirkka Tapanainen 3 CSC - Tieteen tietotekniikan keskus Oy Pirjo-Leena Forsström 4 Edita Publishing Oy Jari Linhala Päivi Helander 5 Kansalliskirjasto Juha Hakala Esa-Pekka Keskitalo 6 Sanastokeskus TSK Katri Seppälä 7 Sanoma News Oy Esa Mäkinen 8 Suomalaisen Kirjallisuuden Seura SKS Lauri Harvilahti 9 Suomen Asiakastieto Oy Pertti Vahermaa 10 Svenska Litteratursällskapet SLS Karola Söderman 11 Talentum Media Oy Stina Wikberg 12 Tieto Oyj Lasse Akselin Heimo Hänninen 13 Yleisradio Oy Sami Kallinen 1 Oikeusministeriö Aki Hietanen Silja Rekomaa 2 Liikenne- ja viestintäministeriö Taru Rastas 3 Valtiovarainministeriö Jukka Uusitalo Anne Kauhanen-Simanainen 4 Helsingin kaupunginkirjasto Erkki Lounasvuori Matti Sarmela 5 Helsingin kaupunki Mirjam Heikkinen Leila Oravisto 6 Suomenlinnan hoitokunta Maire Mattinen Asiantuntijajäsenet 7 W3C Suomen toimisto Ossi Nykänen Tutkimustahot 8 Aalto-yliopisto Eero Hyvönen 9 Helsingin yliopisto Mika Wahlroos Päärahoittaja 10 Tekes Keijo Silventoinen

Projektin tilanne Rahoituksesta 50% saatiin ja se on käytetty 31.12.2013 mennessä Jatkohakemusta laaditaan parhaillaan Tekesin ns. rinnakkaishanke, jossa mukana Aallon ydinhanke ja siihen liittyviä yritysten Tekes-hankkeita

Työpajat pilottien mukaan

Ydinteknologiat ja työkalut Automaattisen annotoinnin työkalut Teksti sisään -> ontologinen metadata ulos ARPA-järjestelmä / palvelu Metadatan siltausvälineet Samojen resurssien (URI) tunnistaminen» Esim. henkilöt, paikat, Metadatamallien yhdistäminen Semanttiset haku- ja suosittelupalvelut EMO-triplestore (käytössä mm. Kulttuurisampo.fi ja Kirjasampo.fi) Datan validointi ja kollaboratiivinen korjaus SAHA-editori+ARPA

Automatic annotation in ARPA using Connexor Machinese and MAUI Lemmatization Weighting / ranking The autonomous Åland regional government has inked a deal with a local brewery, Stallhagen, to reproduce the beer found in a shipwreck back in 2010. At the time, divers recovered several bottles of aged champagne as well as five bottles of beer. The schooner is believed to have gone down in the 1840s but its origin and exact age are still being determined. Åland brewery to reproduce shipwreck beer, Yle News, 14th March 2013 government breweries beer shipwrecks time divers bottles champagne schooner origin age 0.15 0.35 0.30 0.40 Vocabulary

Esimerkki soveltajasta: YLE Svenska RDFa-merkkauksia KOKO-ontologiasta (onki.fi)

Case Laki : Suomalainen lakitieto semanttisena palveluna Finlexin seuraava julkaisu Linked Data RDF-kantana Avoin tieto + rajapinnat Säädökset ja oikeustapaukset pilottina Metatietojen harmonisointi ja linkitys Lakisanastojen harmonisointi ja ontologisointi Oikeusministeriö, tuomioistuimet, eduskunta, Talentum, Edita Publishing, YSO Edilex Säädösten ONKI-palvelu Demo semanttisesta hausta ja linkityksestä YSO (25893) Suomen Laki Suomen Laki 1622 (3778) Edilex 1648 1696 (3974) Asseri Asseri 3000 1839 1801 (5862)

Case Media : Mediayrityksen sisällönhallinta ja datajournalismi Kansallinen media LOD-palveluna Casena uutiset YLE, Asiakastieto, Edita, Semanttinen Kansallisbiografia Biografisen tiedon koostaminen ja julkaiseminen» SKS:n ja SLS:n biografiapalvelut (6000+ elämänkertaa)» Kulttuurisampo-aineistot» Wikipediat» Helsingin Sanomien HS Open tilaisuudet Datan tutkiminen, analyysi ja visualisointi

Case Yritys Yritystietojen semanttinen rikastaminen uutisilla Yritysten ja niiden toimijoiden luotettavuuden ym. liiketoimintaan liittyvien seikkojen arvioinnin tukeminen Idea: Kovan (viranomais)tiedon yhdistäminen pehmeään verkon tietoon Fokuksena erityisesti uutiset

Case Yritys Yritystietojen semanttinen rikastaminen uutisilla Yritysten ja niiden toimijoiden luotettavuuden ym. Liiketoimintaan liittyvien seikkojen arvioinnin tukeminen Kovan (viranomais)tiedon yhdistäminen pehmeään verkon tietoon

Case Palvelu Semanttinen palvelukartta JHS 183 Julkisen hallinnon palvelujen tietomalli ja ryhmittely verkkopalveluissa Ensimmäinen semanttinen JHS-malli Pääkaupunkiseudun palvelukartta Matkailusampo semanttinen web taskussasi Matkakohteiden ja reittien semanttinen kuvailu & palvelut http://www.matkailusampo.fi/

Metadata Models: JHS 183 Recommendation

TTA + LDF?

Visio 1 Datan avaaminen ei riitä Data pitää avata mahdollisimman hyödyllisellä tavalla Miten tieteellinen tieto pitäisi avata eri tilanteissa?

Visio 2 Linkittyvää tieteellisestä tietoa kannattaa avata Linked Data -periaatteella! Toisiinsa liittyvät tiedot rikastuttavat toisiaan» Vrt. Kulttuurisampo kulttuuridatan alueella Esimerkiksi ympäristöön liittyvä erilainen tieto» Ilmakehä, vesistöt, biosfääri, päästöt, Avointa dataa saatavilla yhä enemmän RDF-muodossa Linked Datan tutkiminen, analyysi ja visualisointi Joustava skeematon RDF-tietomalli Standardit SPARQL- ym. rajapinnat Tiedon automaattinen rikastaminen ja älykkäät palvelut Semantiikan avulla käyttökelpoisempia palveluita Knowledge discovery

Tästä on päästävä eroon: tiedon siiloja + hankala käyttö

Julkinen sektori on jo vauhdissa (hallinnon data)

Britanniassa: http://data.gov.uk

Runsaasti sovelluksia verkossa

http://www.kulttuurisampo.fi Linked Data Cultural Heritage Finnish museum, library, and archieve collections (1.3 million data items) on the semantic web since 2008-

http://www.kirjasampo.fi Fiction literature on the semantic web since 2011-

Helsinki Region Infoshare hri.fi (but only one dataset from 1023 in RDF)

Sama idea toimii tieteellisellekin tiedolle: Linked Science

TTA- ja LDF-yhteistyö CSC mukana LDF-hankkeessa Casena TTA:n KATA-datakatalogi Semanttisen metatietomallin kehittäminen Annotointipalvelut Uutena tavoitteena jatkossa LD-lähestymistavan pilotointi myös datan esittämisessä (ei vain datajoukkojen metadatan)

Viiden tähden Linked Open Data julkaiseminen: Miten avoin tieto kannattaa julkaista? http://5stardata.info/ (Tim Berners-Lee)

Rajapinnat Data lataus (download) Linked Data -rajapinta URI sisään -> RDF tai HTML ulos SPARQL-rajapinta Semanttisen webin standardi kyselykieli

Lisää tähtiä tarvitaan: LDF:n 7-tähden malli Datan ja sen skeeman dokumentointi (automaattinen) Datan laadun automaattinen validointi (ja korjailu) Lisäksi kehitetään korkeamman tasoisia palvelurajapintoja mash-up sovelluksia varten

Kansallinen Linked Open Data -infrastruktuuri

Linked (Open) Data Ecosystem Public Sector Companies Humans Linked Open metadata and data Ontologies Metadata Schemas Data Models Machines Scientific Research Social Media

Pilotointi: Tutkimuksen tietoaineistot Prototyyppi semanttiselle datan avaamiselle Pilotoidaan 7:n tähden mallia tutkimusdatalla Biogiset havaintotietokannat + säädata» Haliaksen Hankoniemen lintuaseman havaintoaikasarjat + säätiedot n. 30 vuoden ajalta Muissa selvityksen alla olevissa TTA:n datajulkaisuissa Datan semanttisen haun, tutkimisen ja visualisoinnin välineitä datajulkaisun rajapinnan päälle Hanke aloitettu Dataa on jo myllätty ja visualisointeja kehitelty Tarvitaan vielä rahoitusta LDF-hankkeen 2. osassa SeCo-ryhmän muita pilotteja hyödyntäen Aalto-yliopiston avoin datapalvelu http://data.aalto.fi/ Kulttuuri-, palvelu-, terveys-, luonto- ym. datapalvelut

http://data.aalto.fi

Questions?! http://www.seco.tkk.fi/ http://www.seco.tkk.fi 55