Miten ja miksi asiasanastoista kehitetään ontologioita



Samankaltaiset tiedostot
Yleinen suomalainen ontologia YSO

Ontologioiden yhdistäminen YSO:oon

Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset

Asiasanastosta ontologiaksi

Yleisen suomalaisen ontologian kehitystyö

Kohti Yleistä suomalaista ontologiaa (YSO)

Sisällönkuvailun tulevaisuus: YSA vai YSO?

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

YLEINEN SUOMALAINEN ONTOLOGIA YSO

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

Onko luettelointitermillä. väliä? Kokoelmaseminaari Suvi Kettula Espoon kaupunginmuseo

Finto-projektin tilannekatsaus

Kirjasampo. Kaunokki-ontologia & TKK / Dipoli. Kansalliskirjaston ontologia-seminaari Kaisa Hypén

Ontologioiden huomioiminen uuden kirjastojärjestelmän suunnittelussa. Tommi Jauhiainen Helsinki

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Pysyvä ja muuttuva A:sta O:hon sisällönkuvailussa. Mirja Anttila Kansalliskirjasto

ASIASANASTON MUUTTAMINEN ONTOLOGIAKSI YLEINEN SUOMALAINEN ONTOLOGIA

Suositus asiasanastojen, luokitusjärjestelmien ja ontologioiden käytöstä luetteloinnissa Suomen museoissa

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Ontologisointi käytännön tasolla

Semanttisen webin hyödyntäminen terveystiedon löydettävyydessä

Finton hyödyntäminen ministeriöiden palveluissa. erityisasiantuntija Pilkkuniina Brandt, VNK

YSAsta YSOon kirjastoissa: miksi ja miten

Suomi.fi palvelutietovaranto

Finto-palvelu ja ontologioiden kehitystyön tuki Suomessa

Kirjasampo [lyhyt oppimäärä]

SELVITYS ERIKOISKIRJASTOJEN KÄYTTÄMISTÄ ASIASANASTOISTA JA LUOKITUKSISTA. Anne Holappa, STKS:n Erikoiskirjastojen työryhmä Tieteiden talo

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Sanastot ja niiden teknisen infrastruktuurin ylläpito Juha Hakala Kansalliskirjasto

Suomi.fi-palvelutietovaranto

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

Kohti suomalaista semanttista webiä

Kohti suomalaista semanttista webiä

Mikä on Kulttuurisampo?...

Finto-tilannekatsaus. Asiantuntijaseminaari KANSALLISKIRJASTO - Kirjastoverkkopalvelut

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Automaattinen semanttinen annotointi

Finton jatko vuosina

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Kulttuurisampo. Joeli Takala. Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

VESAsta Fintoon ja YSAsta YSOon: Mikä muuttuu ja miksi?

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Prosessikuvauksesta vauhtia taideteollisuusalan ontologia TAOn ensiaskeleihin

Susanna Nykyri

HOIDOKKI hoitotieteellinen asiasanasto. Kristiina Junttila sanastotyöryhmän jäsen / SHKS kehittämispäällikkö / HUS

Kansallinen digitaalinen kirjasto

ASIASANASTON MUUTTAMINEN ONTOLOGIAKSI YLEINEN SUOMALAINEN ONTOLOGIA

Onki-projektin ohjausryhmän kokous

Taustamuistio 1 (6) Yhteinen tiedon hallinta -hanke. Taustatietoa Sanaston metatietomallin määrittely -työpajan keskusteluun

ONKI Light -ontologiaselaimen käytettävyystestaus: ensimmäinen testikierros

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Kulttuurisampo.fi Suomalainen kulttuuri ja semanttinen web mitä, miksi ja miten?

Finto-tilannekatsaus. Osma Suominen Kansalliskirjaston asiantuntijaseminaari

KAMUT: Muistiorganisaatioiden tietovarannot yhteiskäyttöön. ÄLYÄ VERKOSSA - WEB INTELLIGENCE Tiedekeskus Heureka, Vantaa

Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet

Ontologisointi käytännön tasolla

ARTIKKELITIETOKANNAT JA OMANELLI PIRJO POHJOLAINEN

YSA ja lääke- ja hoitotieteen termit. Eeva Kärki Kansalliskirjasto

Mitä on sisällönkuvailu

Taloustieteet ja YSA. Eeva Kärki Kansalliskirjasto

FinnONTO-infrastruktuurin esittely

KAM-sektori paikkatiedon kansallisessa ekosysteemissä. Mikko Lappalainen Nimitietopalvelua ja paikkatietopalvelua koskeva seminaari, 30.1.

Yrityssuomi.fi:n toiminnallisuus ja ontologian hyödyntäminen Yritys-Suomen verkkopalveluissa. Eeva Koivisto, Yritys-Suomen verkkotoimitus 1.11.

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

Sisällönhallinnan menetelmiä

FinnONTO-hanke loi ontologisen perustan kansalliselle webin tietoinfrastruktuurille

Kulttuurisampo suomalainen kulttuuri semanttisessa webissä

Päällekkäisyys ja AFO-ontologia Tulevaisuus? YSO + AFO KOKO?

Finton käsite-ehdotuslomake

The OWL-S are not what they seem

Ontologiakirjasto ONKI-Paikka

Taustaa. FinnONTO -- Suomalaiset semanttisen webin ontologiat ( )

Museoaineistojen sisällönkuvailu ja Museoiden luettelointiohjeet

Sisällönkuvailun asiantuntijaverkoston kokous

FINTO-PROJEKTIN PROJEKTISUUNNITELMA VUODELLE 2015

Ilmiöprojektin tiedonhankinta

Finto palveluiden toteuttamisen alustana

Sanastosta ontologiaksi

Metatiedon yhteentoimivuutta edistävät palvelut ja projektit. Missä mennään -webinaari

Kohti suomalaisen semanttista webiä -- ontologioita, palveluita ja sovelluksia

Kirjastojen kansallinen metatietovaranto -hanke Yleisten kirjastojen projekti

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Tieto matkaa maailmalle

KAM-sektori yhteisen tiedon hallinnan edelläkävijänä. KDK-tietoarkkitehtuuriryhmän seminaari Jaana Kilkki, Kansallisarkisto

Erikoisontologioiden kuulumisia. Finto-projekti: Laajennetun projektiryhmän kokous Tuomas Palonen, tietoasiantuntija

JHS 145 Palvelutietojen ryhmittely ja osoitteet asiointia varten monta toimialaa kattavissa julkisen sektorin portaaleissa suosituksen päivittäminen

Transkriptio:

Miten ja miksi asiasanastoista kehitetään ontologioita Katri Seppälä Semanttisen laskennan tutkimusryhmä (SeCo) Teknillinen korkeakoulu, mediatekniikan laitos; Helsingin yliopisto, tietojenkäsittelytieteen laitos; Sanastokeskus TSK ry http://www.seco.tkk.fi/ 1

Mihin ontologioita tarvitaan? ongelma: semanttisen webin tekniikat mahdollistavat älykkäiden palvelujen kehittämisen, mutta palvelujen tarvitsemaa käsitetietoa ei ole tarjolla tietokoneen ymmärtämässä muodossa aineistojen kuvailussa käytettävät asiasanastot on tarkoitettu ihmisen käyttöön sisältävät monitulkintaisuutta eivät aina anna riittävästi tietoja käsitteiden yksilöimiseksi eivät aina anna riittävän monipuolisesti tietoa käsitteiden välisistä suhteista ontologiat soveltuvat sekä ihmisen että koneen käyttöön 2

Mihin ontologioita tarvitaan? tavoite: ontologioiden saaminen julkiseen ja avoimeen käyttöön kehityskustannusten säästämiseksi, etuina mm. koneymmärrettävä sisällönkuvailu asiasanojen aiempaa tarkempi ja yhdenmukaisempi käyttö» erikielisten vastineiden antaminen helpottuu tarkemman kuvailun ansiosta tarkempia hakutuloksia haku perustuu käsitteeseen pelkän merkkijonon sijaan» helpottaa eri tavoin tuotettujen tietojen yhdistelyä ja yhteentoimivuutta mahdollisuus ryhmitellä hakutuloksia tai muokata tiedonhakuperusteita käsitetiedon pohjalta 3

Miksi asiasanastoista kehitetään ontologioita? Yleinen suomalainen asiasanasto YSA ja erikoisalojen asiasanastot kuten Museoalan asiasanasto, Valokuvan asiasanasto, Muotoilun ja viestinnän asiasanasto ja Agriforestasiasanasto ovat pitkään olleet laajassa käytössä aineistoja kuvailtaessa YSA ja erikoisalojen asiasanastot täydentävät toisiaan asiasanastot sisältävät pohjatietoja käsitteistä, joten niitä muokkaamalla ja täydentämällä voidaan saada aikaan ontologioita, jotka sisältävät asiasanastojen käyttäjille tuttuja elementtejä ja näin ollen helpottavat ontologioiden käyttöönottoa 4

Miten asiasanastoista kehitetään ontologioita? Esimerkkinä YSO perustuu Yleiseen suomalaiseen asiasanastoon (YSA) sisältää n. 20 000 ontologisoitua käsitettä (YSAn vuoden 2005 lopun tilanne) jokaisella käsitteellä on tunnisteena yksilöllinen URI (Uniform Resource Identifier) kielet: suomi ruotsi ja englanti mukana ilman ontologista tarkistusta ontologian käsitteiden väliset suhteet yläluokka-alaluokkasuhde osa-kokonaisuussuhde assosiatiivinen suhde 5

Miten asiasanastoista kehitetään ontologioita? Esimerkkinä YSO YSOn suomenkielistä käsitteistökokonaisuutta varten on rakennettu pääluokkamalli, jotta saataisiin aikaan koneelliseen päättelyyn tarvittava yhtenäinen hierarkia käsitteet on sijoitettu pääluokkiin perustuvaan yhtenäiseen hierarkiaan monimerkityksisten sanojen taustalla olevia käsitteitä on eritelty» myös asiasanaston mukaiset tarkentamattomat käsitteet ovat ontologian ohessa koostekäsitteinä käsitteistöön on lisätty rakenteen tueksi apukäsitteitä yläluokka-alaluokka suhteiden oheen on otettu käyttöön osa-kokonaisuussuhteita asiasanastosta periytyvä ja täydennetty hierarkia on tarkistettu karkealla tasolla 6

Miten asiasanastoista kehitetään ontologioita? Esimerkkinä YSO <muuttuva> <ajanjakso> <pysyvä> prosessit <fyysinen kokonaisuus> <fyysinen tapahtumat toiminta objekti> <henkiset tuotokset> ilmiöt <abstrakti> paikka ominaisuudet järjestelmät 7

Miten asiasanastoista kehitetään ontologioita? Esimerkkinä YSO joukkoviestimet (YSA) lehdistö radio televisio aikakauslehdet sanomalehdet 8

Miten asiasanastoista kehitetään ontologioita? Esimerkkinä YSO joukkoviestimet (YSO) lehdistö radio televisio aikakauslehdet sanomalehdet 9

Miten asiasanastoista kehitetään ontologioita? Esimerkkinä YSO 10

Asiasanastoista yhdistelmäontologioita Yleisellä suomalaisella asiasanastolla (YSA) ja erikoisalojen asiasanastoilla on huomattava määrä yhteisiä käsitteitä ja erikoisalojen asiasanastojen rinnalla käytetään usein YSAa käsitteiden väliset suhteet eivät kuitenkaan aina ole yksiselitteisiä yhdistelmäontologiat, joissa YSOa on käytetty rakenteellisena mallina ja linkkinä erikoisalojen käsitteistöön selkeyttävät eri ontologioiden yhteiset käsitteet tuovat esiin monimerkityksiset termit ja niiden taustalla olevat eri käsitteet helpottavat kokonaisuuden käyttöä ja kehitystä» auttavat välttämään turhaa päällekkäisyyttä ja mahdollistavat entistä paremmin omaan käsitteistöön keskittymisen 11

Asiasanastoista yhdistelmäontologioita koneella tehtävä (asia)sanojen (label) merkkijonopohjainen vertailu kerätään vertailtavien ontologioiden asiasanat ja muutetaan ne perusmuotoon etsitään eri ontologioiden yhteiset asiasanat ja merkitään käsitteet yhteneviksi (owl:equivalent) yhteisten asiasanojen perusteella» yhtenevien käsitteiden etsinnässä on mahdollista käyttää ensisijaisten asiasanojen lisäksi myös korvattuja asiasanoja/synonyymeja (altlabel) tai erikielisiä asiasanoja yhdistelyssä käsitellään aina vain kahta ontologiaa kerrallaan, vaikka lopullisena tavoitteena olisi useamman ontologian yhdistäminen 12

Asiasanastoista yhdistelmäontologioita käsityönä tehtävä tarkistus pitääkö ehdotettu ekvivalenssi paikkansa?» onko sanaa käytetty eri ontologioissa samassa merkityksessä? onko aineistosta jäänyt puuttumaan ekvivalenssimerkintöjä» käytetäänkö eri ontologioissa eri synonyymeja? esim. ympäristöystävälliset tuotteet /ympäristöä säästävät tuotteet mihin ei-ekvivalentit erikoisalan ontologian käsitteet sijoittuvat YSOn hierarkiassa? onko mahdollista tarkentaa erikoisalan ontologian sisäistä hierarkiaa? 13

Asiasanastoista yhdistelmäontologioita Esimerkkinä TAO Mikä on pergamentti? Yleinen suomalainen asiasanasto: pergamentti» Kuuluu ryhmiin: [82] Kustannustoiminta. Julkaisutoiminta. Kirjapainoala» Ruotsinkielinen asiasana: pergament Muotoilun ja viestinnän asiasanasto: pergamentti» KT rumpunahka»lt nahka Museoalan asiasanasto: pergamentti»lt paperi 14

Asiasanastoista yhdistelmäontologioita Esimerkkinä TAO pergamentti (YSA) ~pergamentti_kooste (YSO) paperi (MASA) pergamentti (paperi) (YSO) pergamentti (nahka) (YSO) nahka (MVA) pergamentti (MAO) pergamentti (TAO) 15

Asiasanastoista yhdistelmäontologioita Esimerkkinä TAO nahka (YSO) paperi (YSO) boksinahka (TAO) haljasnahka (TAO) kiiltonahka (MAO) pergamentti (nahka) (YSO) = pergamentti (TAO) pergamentti (paperi) (YSO)= pergamentti (MAO) 16

Ontologiayhteistyötä YSO Kansalliskirjasto: Juha Hakala, Tuula Haapamäki, Laila Heinemann ja Eeva Kärki SeCo-tutkimusryhmä: mm. Anu Ylisalmi, Mirja Anttila, Eeva-Liisa Leppänen, Matias Frosterus, Eetu Mäkelä, Tuukka Ruotsalo, Tomi Kauppinen ja Osma Suominen Helsingin kaupunginkirjasto: Erkki Lounasvuori TAO Taideteollinen korkeakoulu: Ellen Karhulampi MAO Espoon kaupunginmuseo, Suvi Kettula Museovirasto 17