Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä 2010. Juha Hakala Kansalliskirjasto.



Samankaltaiset tiedostot
Avoin data, avoimet rajapinnat ja tietojen linkitys. Osma Suominen Suomi.fi

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

Sanastot ja niiden teknisen infrastruktuurin ylläpito Juha Hakala Kansalliskirjasto

Avoin data Avoin kirjasto Kuvailupäivät

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

FinnONTO-infrastruktuurin esittely

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Pysyvät tunnukset ja niiden hyödyntäminen

Ennakkometadata - ONIX Maarit Huttunen

Kirjastoverkkopäivät Marja-Liisa Seppälä Kansalliskirjasto

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

KIRJASAMPO. Jyväskylä

W3C: teknologia ja (tieto)yhteiskunta

Sisällönhallinnan menetelmiä

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Juha Hakala Kansalliskirjasto

Julkishallinnon metatietoarkkitehtuuri Anne Kauhanen-Simanainen & Juha Hakala

Bibframe, ISO TC 46/SC 4 & julkishallinnon metatietopalvelu. Metatietoverkoston infotilaisuus Juha Hakala KIRJASTOVERKKOPALVELUT

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Käyttöoikeuksien metatieto

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

TIEKE Verkottaja Service Tools for electronic data interchange utilizers. Heikki Laaksamo

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

JHS 145 Palvelutietojen ryhmittely ja osoitteet asiointia varten monta toimialaa kattavissa julkisen sektorin portaaleissa suosituksen päivittäminen

Open > Link > GO Avointa linkitettyä dataa kirjastomaailmassa

TTA, PAS ja julkishallinnon standardisointi

Avoimet standardit ja arkistointi

Kirjaston vastaus informaatioympäristön muutokseen : Semanttinen web, ontologiat ja standardit osana kirjastojen tiedonhallinnan infrastruktuuria

Kansalliset kehittämishankkeet: Etenemissuunnitelmat

W3C ja Web-teknologiat

Semanttinen Finlex Visio ja sen toteutus

Myynnin robotisaatio Kokemuksia protojen toteuttamisesta

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus

W3C ja Web-teknologiat

Paikannimirekisteri linkitettynä tietona

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Mikä on semanttinen web?

Paikkatiedon semanttinen mallinnus, integrointi ja julkaiseminen Case Suomalainen ajallinen paikkaontologia SAPO

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

Hyödynnetään avointa, omaa ja yhteistä tietoa

Internet jolla on merkitystä

Finna ja ontologiat tms.

W3C ja Web-teknologiat

Auktoriteettitietokanta

Valtioneuvoston tietosisältöjen semanttinen yhteentoimivuus

Semanttinen web. miksi "normi-web" ei riitä? Petri Tonteri, ,

RDA (Resource Description and Access) & FRBR-käsitemalli

JHS XXX Paikkatiedon yksilöivät tunnisteet

Miten avoin yhdistetty tieto saadaan verkkoon: kansallinen Linked Data Finland -hanke-ehdotus

YSAsta YSOon kirjastoissa: miksi ja miten

Sanastotyö THL:SSÄ Sanastotyö THL:ssä / Outi Meriläinen 1

BIBFRAME-hankkeen tilannekatsaus

Linked Data Finland: visio, missio ja toteutus

Capacity Utilization

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

W3C ja alueellinen standardointi

Uusi Ajatus Löytyy Luonnosta 4 (käsikirja) (Finnish Edition)

URN ja muut PID-tunnukset

Semanttinen Finlex Arttu Oksanen ( )

Erikoiskirjastot somessa. Päivikki Karhula, johtava tietoasiantuntija Eduskunnan kirjasto

Yleisten kirjastojen kuvailutyön kansallinen viitekehys. Yleisten kirjastojen neuvosto Anu Jäppinen

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Rakennustietomallien hallinta linkitettynä tietona

Paikkatiedon yksilöivät tunnukset. Pekka Sarkola

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

FINTO-PROJEKTIN PROJEKTISUUNNITELMA VUODELLE 2015

CC0-lisenssi: case Finna

Kim Viljanen

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Avoimen ja jaetun tiedon hyödyntäminen. Juha Ala-Mursula BusinessOulu

Tunnisteet ja viittaukset sähköisessä tutkimusympäristössä. Jessica Parland-von Essen Informaatiotutkimuksen päivät

1. Lähtökohta ja taustat

Miten ja miksi asiasanastoista kehitetään ontologioita

Voice Over LTE (VoLTE) By Miikka Poikselkä;Harri Holma;Jukka Hongisto

Suomalainen sisältöinfrastruktuuri semanttisessa webissä käytettävissänne

Tapahtumankäsittely Semanttisen Webin Menetelmillä

Collaborative & Co-Creative Design in the Semogen -projects

Suositus asiasanastojen, luokitusjärjestelmien ja ontologioiden käytöstä luetteloinnissa Suomen museoissa

JHS-järjestelmä ja yhteentoimivuus

Tutkimuksen tietoaineistojen saatavuuden. kokonaisarkkitehtuuri

JHS XML suositus. XML Finland tapahtuma Mikael af Hällström ylitarkastaja, Verohallinto JHS XML työryhmän vetäjä

MS. Kirjastot.fi 2012

Metatieto mihin ja miten? Juha Hakala Helsingin yliopiston kirjasto

Kansallinen yhteisluettelo kirjastojen luettelointiyhteistyön tukena. Pori Nina Hyvönen

Asteri-auktoriteettitietokannan esittely. Minttu Hurme / KVP, tietojärjestelmät Kuvailun tiedotuspäivät

Korkeakoulujen yhteentoimivuusmalli

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Nuku hyvin, pieni susi -????????????,?????????????????. Kaksikielinen satukirja (suomi - venäjä) ( (Finnish Edition)

Teknologinen muutos ja yliopistojen tulevaisuus. Tievie-seminaari Helsinki Antti Auer

Kansallinen digitaalinen kirjasto

Transkriptio:

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä 2010 Juha Hakala Kansalliskirjasto Sisältö Semanttinen Web ja kirjastot yleistä W3C Libraries and Semantic Web Incubator Group Semanttinen Web käytännössä: resurssien tunnistaminen ja ontologiat JHS Sanastot -työryhmä Vocabulary Mapping Framework 1

Semanttisen Webin visio Tim Berners-Lee: I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web the content, links, and transactions between people and computers (1999). Semantic web could bring about a revolution in how, for example, scientific content is managed throughout its life cycle (2006). Kirjastojen kannalta semanttinen Web on merkittävä vaikka se toteutuisi vain osittainkin Kattava toteutus voisi olla ongelma: Please-rob-me palvelu; henkilövaaka ja jääkaappi Semanttisen Webin käytäntö Visiot ovat muuttuneet käytännöksi hitaasti SW-sateenvarjon alla voidaan tehdä järkeviä ja käytännöllisiä asioita, kunhan tavoitteet asetetaan realistisesti W3C Libraries and Semantic Web Incubator group The goal is to help lowering the barriers of Semantic Web adoption in the library community Esimerkkejä sovelluskohteista: Resurssien tunnistaminen Ontologioiden ja rakenteisen metadatan soveltaminen Kirjastojen kannalta asioissa sinänsä ei ole mitään mullistavaa, mutta asioiden toteuttamistapa ja toiminnan tavoitteet ovat uudenlaisia 2

Resurssien tunnistaminen: linked data Tim Berner-Lee (taas): 1. Use URIs as names for things 2. Use HTTP URIs so that people can look up those names. 3. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) 4. Include links to other URIs, so that [the users] can discover more things. URIen käytöstä: cool URI vs PID Kaksi koulukuntaa: Resurssien tunnistamiseen voidaan käyttää URL:ää, kunhan huolehditaan nimipalvelun avulla siitä että se ei koskaan muutu Aurinko-termin cool URI on http://www.yso.fi/onto/ysa/y100928 Resurssien identifiointiin on paras käyttää PIDtunnistetta (URN, DOI, etc), joka linkitetään dokumentin URL-osoitteeseen / -osoitteisiin Kontiainen, Pekka: Living on voles plastic life of the Ural owl julkaisun URN on http://urn.fi/urn:isbn:978-952-10-6114-1 3

Cool URI & PID: vertailua Cool URI-ratkaisu on teknisesti yksinkertainen, koska se ei edellytä tunnisteen linkkaamista URL-osoitteeseen ns. resoluutiopalvelussa PID-ratkaisu on toiminnallisesti parempi, koska yksi PID voidaan linkittää useisiin URL-osoitteisiin jos dokumentista on useita kopioita resoluutiopalvelulta voidaan pyytää erilaisia asioita (dokumentti; sitä koskevat metatiedot; luettelo osoitteista joista dokumentti löytyy) PID-ratkaisu on luotettavampi, koska domain-nimet voidaan myydä Cool URI:a ei voi erottaa tavallisesta URL:stä Nykytilanne Kirja-ala ja kirjastot käyttävät PID-tunnisteita, suosituimmat vaihtoehdot ovat DOI ja URN Mahdollisuus valvoa tunnisteen käyttöä PersID-hanke W3C ja useimmat semanttisen Webin hankkeet nojaavat cool URI tunnisteisiin Tiedon lisäksi myös tunnisteiden jakaminen vapaata Berners-Leen tavoitteet (use URIs as names of things; use HTT URIs so that people can look up those names) toteutuvat molemmilla tavoilla 4

Ontologiat Merkittävä rooli semanttisen Webin toteuttamisessa, niin Suomessa kuin muualla Laajapohjainen lähestymistapa a la FinnONTO on toimivin ratkaisu, koska tarvitaan muun muassa: Toimijaontologia (eli nimiauktoriteetit) Paikkaontologia (maantieteelliset nimet) Yleinen (suomalainen) ontologia ja sitä täydentäviä erikoisalojen ontologioita Lisäksi tarvitaan näiden ontologioiden jatkuvaa ylläpitoa ja sille tekninen alusta Ontologioiden soveltamisesta YSAn ja siihen pohjautuvien erikoisalojen sanastojen vuosikymmeniä jatkunut käyttö antavat hyvän pohjan suomalaiselle semanttiselle Webille, mutta sanastojen/ontologioiden käyttöä on kyettävä laajentamaan koko julkishallintoon VM:n valmisteilla oleva FinnONTO-laki Kirjastot tarvitsevat erillisen nimiauktoriteettitietokannan, mutta sen lisäksi tarvitaan vielä julkishallinnon yhteinen järjestelmä 5

JHS 170 & JHS 180(?) JUHTA (Julkisen hallinnon tietohallinnon neuvottelukunta) on valmstellut suositukset Julkishallinnossa tiedonsiirtoon käytettävistä XMLskeemoista (JHS 170) sekä Julkisen hallinnon sanastotyöprosessista (vielä julkaisematon teksti, luultavasti JHS 180) JHS 180 kuvaa prosessin jolla julkisen hallinnon toimijoiden tarvitsemat käsitteet kuvataan Tavoitteena on julkisen hallinnon yhteisen metadatarekisterin luonti Julkisen hallinnon sanastotyöprosessista Tavoitteena ei ole perinteisten sanastojen ylläpitoprosessin vaan metadataelementtien määrittelyprosessin kuvaaminen Miten toimitaan silloin, kun halutaan määritellä ne tietoelementit, joita tarvitaan henkilötietojen siirtämiseen julkisen hallinnon toimijoiden välillä? Perustetaan työryhmä, joka Siirrettävän tiedon syntaksi määritellään JHS 170:ssä, tietosisältöjen määrittelyprosessi JHS 180:ssa Tavoitteena on vähentää julkisessa hallinnossa tehtävää päällekkäistyötä esimerkiksi henkilöiden tietojen tallennuksessa ja parantaa tietojen koneymmärrettävyyttä 6

Metadatan ontologisointi Yksi Semanttisen webin haasteista on, että metadataa on tallennettu hyvin monissa eri muodoissa Kansallinen digitaalinen kirjasto hankkeessa käytetään 12 eri vaihtoformaattia; miten saamme kaiken tämän metatiedon yhtenäistetyksi siten, että se saadaan tehokkaasti haettavaksi yhteen järjestelmään? Yksi vaihtoehto on Vocabulary Mapping Framework- eli VMF-hankkeen tulosten soveltaminen VMF:n lähtökohdat 1. Bibliographic and heritage metadata is becoming increasingly diverse and complex and will require increasing interoperability for re-use and discovery 2. Members of the JISC community have increasingly diverse, complex and unpredictable metadata requirements 3. Metadata from producers/providers/publishers will become increasingly important as a substantial component of metadata in the JISC community Kaikki nämä ovat relevantteja myös Suomessa 7

VMF matrix VMF matrix a tool which can be used to automatically compute the "best fit" mappings between terms in controlled vocabularies in difference metadata schemes Matriisi on ontologia johon sisältyy toistatuhatta termiä; on olemassa myös versio jossa termeihin on linkitetty muutamien formaattien (esim. MARC21, ONIX, DC) elementtejä, mikä mahdollistaa mappausten teon Ontologia tultaneen asentamaan ONKI-palveluun, jossa siihen on mahdollista linkittää lisää metadataformaatteja; käyttö Suomessa on vielä auki 8