Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset



Samankaltaiset tiedostot
Miten ja miksi asiasanastoista kehitetään ontologioita

Asiasanastosta ontologiaksi

Ontologioiden yhdistäminen YSO:oon

Kohti Yleistä suomalaista ontologiaa (YSO)

Yleinen suomalainen ontologia YSO

Yleisen suomalaisen ontologian kehitystyö

Sisällönkuvailun tulevaisuus: YSA vai YSO?

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

YLEINEN SUOMALAINEN ONTOLOGIA YSO

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

YSAsta YSOon kirjastoissa: miksi ja miten

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO ja sen sovellukset. Prof. Eero Hyvönen

Finto-palvelu ja ontologioiden kehitystyön tuki Suomessa

Kirjasampo [lyhyt oppimäärä]

ASIASANASTON MUUTTAMINEN ONTOLOGIAKSI YLEINEN SUOMALAINEN ONTOLOGIA

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

Kirjasampo. Kaunokki-ontologia & TKK / Dipoli. Kansalliskirjaston ontologia-seminaari Kaisa Hypén

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Taustamuistio 1 (6) Yhteinen tiedon hallinta -hanke. Taustatietoa Sanaston metatietomallin määrittely -työpajan keskusteluun

Pysyvä ja muuttuva A:sta O:hon sisällönkuvailussa. Mirja Anttila Kansalliskirjasto

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Onko luettelointitermillä. väliä? Kokoelmaseminaari Suvi Kettula Espoon kaupunginmuseo

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Prosessikuvauksesta vauhtia taideteollisuusalan ontologia TAOn ensiaskeleihin

Finton hyödyntäminen ministeriöiden palveluissa. erityisasiantuntija Pilkkuniina Brandt, VNK

Suositus asiasanastojen, luokitusjärjestelmien ja ontologioiden käytöstä luetteloinnissa Suomen museoissa

VESAsta Fintoon ja YSAsta YSOon: Mikä muuttuu ja miksi?

Ontologisointi käytännön tasolla

Ontologioiden huomioiminen uuden kirjastojärjestelmän suunnittelussa. Tommi Jauhiainen Helsinki

Susanna Nykyri

ASIASANASTON MUUTTAMINEN ONTOLOGIAKSI YLEINEN SUOMALAINEN ONTOLOGIA

Finto-tilannekatsaus. Asiantuntijaseminaari KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Kohti suomalaista semanttista webiä

Semanttisen webin hyödyntäminen terveystiedon löydettävyydessä

FinnONTO-infrastruktuurin esittely

Mikä on Kulttuurisampo?...

Finto-projektin tilannekatsaus

Päällekkäisyys ja AFO-ontologia Tulevaisuus? YSO + AFO KOKO?

Kulttuurisampo. Joeli Takala. Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Terminologia, tesaurus vai ontologia? Carita Bjon, FM Kela

Sanastot ja niiden teknisen infrastruktuurin ylläpito Juha Hakala Kansalliskirjasto

Finton jatko vuosina

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

Suomi.fi palvelutietovaranto

The OWL-S are not what they seem

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

Yhteentoimivuusvälineistö: Sanastoeditorin esittelytilaisuus klo Väestörekisterikeskus, Lintulahdenkuja 4, Helsinki

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

SELVITYS ERIKOISKIRJASTOJEN KÄYTTÄMISTÄ ASIASANASTOISTA JA LUOKITUKSISTA. Anne Holappa, STKS:n Erikoiskirjastojen työryhmä Tieteiden talo

Sanastosta ontologiaksi

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

ONKI Light -ontologiaselaimen käytettävyystestaus: ensimmäinen testikierros

Ontologisointi käytännön tasolla

Kulttuurisampo.fi Suomalainen kulttuuri ja semanttinen web mitä, miksi ja miten?

Miksi asiasanastoista pitäisi siirtyä ontologioihin? Prof. Eero Hyvönen

Suomi.fi-palvelutietovaranto

YSA ja lääke- ja hoitotieteen termit. Eeva Kärki Kansalliskirjasto

Automaattinen semanttinen annotointi

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

JHS 145 Palvelutietojen ryhmittely ja osoitteet asiointia varten monta toimialaa kattavissa julkisen sektorin portaaleissa suosituksen päivittäminen

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

YHTEISET TIEDON HALLINNAN SANASTOPALVELUT tutkimus- ja kehittämishankkeen toimintasuunnitelma 2017

Mitä on sisällönkuvailu

Taloustieteet ja YSA. Eeva Kärki Kansalliskirjasto

Ontology Work in Finland: National Semantic Web Infrastructure FinnONTO. Prof. Eero Hyvönen

ARTIKKELITIETOKANNAT JA OMANELLI PIRJO POHJOLAINEN

CIRI Ontologiaperustainen tiedonhakuliittymä

Taustaa. FinnONTO -- Suomalaiset semanttisen webin ontologiat ( )

HOIDOKKI hoitotieteellinen asiasanasto. Kristiina Junttila sanastotyöryhmän jäsen / SHKS kehittämispäällikkö / HUS

Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet

ONKI- projektin ontologiaeditorien vertailuraportti

LAADUKAS SISÄLLÖNKUVAILU -SUOSITUS

KAM-sektori paikkatiedon kansallisessa ekosysteemissä. Mikko Lappalainen Nimitietopalvelua ja paikkatietopalvelua koskeva seminaari, 30.1.

Yrityssuomi.fi:n toiminnallisuus ja ontologian hyödyntäminen Yritys-Suomen verkkopalveluissa. Eeva Koivisto, Yritys-Suomen verkkotoimitus 1.11.

TESAURUKSET JA ONTOLOGIAT

Ontologian arviointi OntoClean-menetelmällä. Katariina Nyberg [ , Espoo]

Älykkäät keltaiset sivut ( Intelligent Web Services ( IWebS ) )

YHTEISET TIEDON HALLINNAN SANASTOPALVELUT tutkimus- ja kehittämishankkeen toimintasuunnitelma 2016

Tieto matkaa maailmalle

FinnONTO-hanke loi ontologisen perustan kansalliselle webin tietoinfrastruktuurille

Transkriptio:

Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset Katri Seppälä, TKK, mediatekniikan laitos Helsingin yliopisto, tietojenkäsittelytieteen laitos Sanastokeskus TSK 1

Sisältö Mihin ontologioita tarvitaan? Mikä Yleinen suomalainen ontologia (YSO) on? Asiasanaston sisällön muuntaminen ontologiaksi Erikoisalojen asiasanastoista yhdistelmäontologioihin Mihin ontologioita voidaan käyttää? 2

Mihin ontologioita tarvitaan? ongelma: semanttisen webin tekniikat mahdollistavat älykkäiden palvelujen kehittämisen, mutta palvelujen tarvitsemaa käsitetietoa ei ole tarjolla tietokoneen ymmärtämässä muodossa aineistojen kuvailussa käytettävät asiasanastot on tarkoitettu ihmisen käyttöön sisältävät monitulkintaisuutta eivät aina anna riittävästi tietoja käsitteiden yksilöimiseksi eivät aina anna riittävän monipuolisesti tietoa käsitesuhteista ratkaisu FinnONTO 1 ja 2 -projekteissa: kehitetään Kansalliskirjaston ylläpitämä Yleinen suomalainen asiasanasto (YSA) ja sitä täydentävät erikoisalojen asiasanastot sekä ihmisen että koneen käyttöön soveltuviksi ontologioiksi tavoite: ontologioiden saaminen julkiseen ja avoimeen käyttöön kehityskustannusten säästämiseksi 3

Mikä Yleinen suomalainen ontologia (YSO) on? Yleiseen suomalaiseen asiasanastoon (YSA) pohjautuva ontologia sisältää n. 20 000 ontologisoitua käsitettä nykyinen sisältö vastaa YSAn vuoden 2005 lopun tilannetta kielet: suomi (ruotsi ja englanti mukana ilman tarkistusta) käsitteiden väliset suhteet yläluokka-alaluokkasuhde (subclass of) osa-kokonaisuussuhde (part of) assosiatiivinen suhde (associative relation) jokaisella käsitteellä on oma URI (Uniform Resource Identifier) esitetty owl-kielellä (Web Ontology Language) rakenne SKOSin (Simple Knowledge Organisation System) mukainen muokkauksessa käytetty työkaluna Protégé-ontologiaeditoria 4

Yleisen suomalaisen ontologian laajennukset YSO on jo yhdistetty seuraaviin erikoisalojen ontologioihin Valokuvausalan ontologia (VALO) Taideteollisuusalan ontologia (TAO) Museoalan ontologia (MAO) Terveyden edistämisen ontologia (TERO) Agriforest-ontologia (AFO) lisäksi Merenkulkualan asiasanaston Kaunokirjallisuuden asiasanaston ontologisointi on käynnissä 5

Asiasanaston muuntaminen ontologiaksi vaatimukset asiasanastoa ontologisoitaessa käsitesuhdetiedot on tarkistettava, jotta ne soveltuisivat koneellisen päättelyn perustaksi oleellista tietoa käsitteiden suhteista ei voi jättää pois» ontologiassa jokaisella käsitteellä tulee olla oma paikkansa yhtenäisessä käsitehierarkiassa (luokkarakenteessa) yhtenäisen hierarkian rakentamiseen tarvitaan pääluokkamalli ja apukäsitteitä hierarkian eri tasoille asiasanojen luonnollisen kielen mukaiset merkityserot on eriteltävä yksiselitteisesti korit [00] Yleistermit; ruotsinkielinen asiasana: korgar, karosserier risti [00] Yleistermit, [53] Uskonto. Teologia. Uskontotiede; ruotsinkielinen asiasana: korset / ristit [53] Uskonto. Teologia. Uskontotiede, [94] Taideteollisuus. Sisustustaide; ruotsinkielinen asiasana: kors käsitesuhteiden käytön on oltava systemaattista 6

Asiasanaston muuntaminen ontologiaksi mahdollisuudet tarvittaessa käsitteet voidaan esittää useasta näkökulmasta eri keinoin: ensisijaisesti käytetään assosiatiivisia suhteita ja rooleja» erityyppiset assosiatiiviset suhteet, esim. (toiminnan) väline, (toiminnan) tulos» roolit, esim. aine: energialähteenä, rakennusmateriaalina myös useamman kuin yhden hierarkkisen yläkäsitteen käyttö (moniperintä) on mahdollista, esim. valotusmittari: valokuvausväline ja mittari lisäämällä toimintaa kuvaaviin käsitteisiin assosiatiivisia suhteita, voidaan linkittää toisiinsa erityyppisiä käsitteitä ja hyödyntää tätä tietoa tiedonhaussa esim. toiminta toimija väline kohde tulos 7

Asiasanaston muuntaminen ontologiaksi kaaviomerkinnät Asiasanastot / terminologiset sanastot geneerinen suhde / hierarkkinen suhde partitiivinen suhde / koostumussuhde assosiaatiosuhde / assosiatiivinen suhde / funktiosuhde Ontologiat geneerinen suhde / hierarkkinen suhde / subclass of luokan ja yksilön välinen geneerinen suhde partitiivinen suhde / koostumussuhde assosiaatiosuhde / assosiatiivinen suhde / funktiosuhde yksilö luokka suhdetyyppi alakäsite yläkäsite kokonaisuus osa esimerkkiin lisätty asiasana <ei käytetä asiasanoitukseen> 8

Asiasanaston muuntaminen ontologiaksi pääluokkamalli <muuttuva> prosessi tapahtuma toiminta <ajanjakso> <fyysinen objekti> ilmiö <pysyvä> <aineeton tuotos> <abstrakti> paikka ominaisuus järjestelmä 9

Asiasanaston muuntaminen ontologiaksi merkitysten erittely orgaaninen rakenne konkreettinen eloton objekti kilvet (orgaaninen rakenne) kilvet (konkreettinen eloton objekti) varusteet kilvet (varusteet) 10

Asiasanaston muuntaminen ontologiaksi merkitysten erittely lapset (perheenjäsenet) perheenjäsenet ikäryhmät sosioekonomiseen ryhmään liittyvä rooli lapset (ikäryhmät) lapset (rooli) tyttäret ainoa lapsi vauvat tytöt katulapset kasvattilapset 11

Asiasanaston muuntaminen ontologiaksi merkitysten erittely kasvatus aikuiskasvatus arvokasvatus ammattikasvatus puunkasvatus kalanviljely 12

Asiasanaston muuntaminen ontologiaksi merkitysten erittely toiminta keskinäinen toiminta toisenlaiseksi muuttaminen kasvullinen luonti kasvatus (ihmisen) kasvatus (kasvien tai eläinten) viljely (tuottaminen) kalanviljely (kalankasvatus) taimikasvatus hevosten kasvatus aikuiskasvatus arvokasvatus ammattikasvatus puunkasvatus tapakasvatus 13

Asiasanaston muuntaminen ontologiaksi koostumussuhteet korkeakoululaitos korkeakoulut yliopistot taidekorkeakoulut ammattikorkeakoulut kielikeskukset kauppakorkeakoulut tiedekunnat teknilliset korkeakoulut teknilliset yliopistot 14

Asiasanaston muuntaminen ontologiaksi koostumussuhteet korkeakoulut taidekorkeakoulut ammattikorkeakoulut yliopistot kielikeskukset tiedekunnat kauppakorkeakoulut teknilliset yliopistot (teknilliset korkeakoulut) korkeakoululaitos 15

Asiasanaston muuntaminen ontologiaksi suhteiden tarkistus lämmityslaitteet kamiinat kiukaat uunit lämmityskattilat lämmityspatterit takat kaakeliuunit masuunit kiertoilmauunit mikroaaltouunit 16

Asiasanaston muuntaminen ontologiaksi suhteiden tarkistus tekninen objekti laitteet koneet lämmityslaitteet kodinkoneet kamiinat kiukaat uunit takat kiertoilmauunit lämmityskattilat lämmityspatterit mikroaaltouunit kaakeliuunit masuunit 17

Erikoisalojen asiasanastoista yhdistelmäontologioihin Yleisellä suomalaisella asiasanastolla (YSA) ja erikoisalojen asiasanastoilla on huomattava määrä yhteisiä käsitteitä ja erikoisalojen asiasanastojen rinnalla käytetään usein YSAa käsitteiden väliset suhteet eivät kuitenkaan aina ole yksiselitteisiä yhdistelmäontologiat, joissa YSOa on käytetty rakenteellisena mallina ja linkkinä erikoisalojen käsitteistöön selkeyttävät eri ontologioiden yhteiset käsitteet tuovat esiin monimerkityksiset termit ja niiden taustalla olevat eri käsitteet helpottavat kokonaisuuden käyttöä ja kehitystä» auttavat välttämään turhaa päällekkäisyyttä ja mahdollistavat entistä paremmin omaan käsitteistöön keskittymisen 18

Yhdistelmäontologioiden kehitystyö etsitään koneen avulla kahden asiasanaston yhtenevät asiasanat vertailemalla merkkijonoja tarkistetaan pitääkö merkkijonon perusteella ehdotettu ekvivalenssi paikkansa vai onko sanoja käytetty eri ontologioissa eri merkityksessä» esim. kaavat, esteettömyys onko aineistosta jäänyt puuttumaan ekvivalenssimerkintöjä erilaisten synonyymien takia?» esim. applikaatiotyöt/applikointityöt, ympäristöystävälliset tuotteet / ympäristöä säästävät tuotteet mihin ei-ekvivalentit erikoisalan ontologian käsitteet sijoittuvat YSO:n hierarkiassa? onko mahdollista tarkentaa erikoisalan ontologian sisäistä hierarkiaa? 19

Yhdistelmäontologioiden kehitystyö Mikä on pergamentti? Yleinen suomalainen asiasanasto: pergamentti» Kuuluu ryhmiin: [82] Kustannustoiminta. Julkaisutoiminta. Kirjapainoala» Ruotsinkielinen asiasana: pergament Muotoilun ja viestinnän asiasanasto: pergamentti» KT rumpunahka» LT nahka Museoalan asiasanasto: pergamentti» LT paperi 20

Yhdistelmäontologioiden kehitystyö pergamentti (YSA) ~pergamentti_kooste (YSO) paperi (MASA) pergamentti (paperi) (YSO) pergamentti (nahka) (YSO) nahka (MVA) pergamentti (MAO) pergamentti (TAO) 21

Yhdistelmäontologioiden kehitystyö nahka (YSO) paperi (YSO) boksinahka (TAO) haljasnahka (TAO) kiiltonahka (MAO) pergamentti (nahka) (YSO) = pergamentti (TAO) pergamentti (paperi) (YSO)= pergamentti (MAO) 22

Mihin ontologioita voidaan käyttää? aineistojen entistä tarkempaan, koneymmärrettävään sisällönkuvailuun asiasanojen aiempaa tarkempi ja yhdenmukaisempi käyttö on mahdollista» erikielisten vastineiden antaminen helpottuu yhdellä hakusanalla saadaan entistä tarkempia hakutuloksia kuvailua hyödyntävien älykkäiden (tiedonhaku)palvelujen kehittämiseen, esim. seuraavilla keinoilla käsiteperustainen haku tietojen yhdistely ja yhteentoimivuus hakutulosten järjestäminen 23

Yhteenveto laajan aineiston tasapuolinen ja riittävän tarkka käsittely sekä kompromissit esitettävän tiedon valinnassa asettavat haasteita > ei ole olemassa vain yhtä oikeaa tapaa kuvata käsitteitä, mutta eri näkökulmia voidaan esittää rinnakkain ja esitystavoista sopia ontologioita on ylläpidettävä sitä mukaa kuin kuvailussa tarvittava käsitteistö kehittyy > luotettavien ontologioiden laatiminen edellyttää laajaa yhteistyötä, johon osallistuu sekä ontologiatyön että käsiteltävän aihealueen asiantuntijoita tietoja ontologioista http://www.seco.tkk.fi/ontologies/» ONKI-palvelimella julkaistut ontologiat: http://www.yso.fi/ sisältötyön menetelmistä: Sanastokeskus TSK, http://www.tsk.fi/ Protégé-ontologiaeditorista: http://protege.stanford.edu/index.html 24