Asiasanastosta ontologiaksi Katri Seppälä Semanttisen laskennan tutkimusryhmä (SeCo), http://www.seco.tkk.fi/ Aalto-yliopiston perustieteiden korkeakoulu, mediatekniikan laitos Sanastokeskus TSK, http://www.tsk.fi/
Mihin ontologioita tarvitaan? ongelma: semanttisen webin tekniikat mahdollistavat älykkäiden palvelujen kehittämisen, mutta palvelut edellyttävät käsitetietoa tietokoneen ymmärtämässä muodossa perinteisesti aineistojen kuvailussa käytettävät asiasanastot on tarkoitettu ihmisen käyttöön sisältävät monitulkintaisuutta eivät aina anna riittävästi tietoja käsitteiden yksilöimiseksi eivät aina anna riittävän monipuolisesti tietoa käsitesuhteista ratkaisu FinnONTO 1 ja 2 -projekteissa: kehitetään Kansalliskirjaston ylläpitämä Yleinen suomalainen asiasanasto (YSA) ja sitä täydentävät erikoisalojen asiasanastot sekä ihmisen että koneen käyttöön soveltuviksi ontologioiksi tavoite: ontologioiden saaminen julkiseen ja avoimeen käyttöön kehityskustannusten säästämiseksi
Miten ontologia eroaa asiasanastosta? perusyksikkö on käsite käsite ei ole monimerkityksinen kaikille käsitteille on annettu hierarkkinen yläkäsite käytössä on yksi yhtenäinen hierarkia useiden pienten hierarkiakokonaisuuksien sijaan yhtenäinen hierarkia mahdollistaa koneellisen päättelyn: se mikä pätee yläkäsitteeseen, pätee myös alakäsitteisiin keskeisin rakenne on käsitteiden yhteisiin piirteisiin perustuva hierarkia, ei käsitteille yhteinen aihepiiri, vaikka myös aihe voi vaikuttaa hierarkian muodostumiseen hierarkia tukee käsitteiden ymmärtämistä ja johdonmukaista käyttöä, esim. runot / pilkkarunot hierarkia tuo yhteen eri alojen samankaltaisia käsitteitä, mikä edesauttaa käsitteiden selkeää nimeämistä ja käyttöä, esim. inhibiitit (kemia) / inhibiittorit (lääketiede)
Miten ontologia eroaa asiasanastosta? tietyt asiasanastojen rakenteelliset piirteet eivät sovi ontologiaan jos halutaan säilyttää kaikki mitä asiasanastossa on esitetty erillisinä yksiköinä, ei aina voida noudattaa sääntöä, jonka mukaan kunkin käsitteen tulisi olla ontologiassa vain yhteen kertaan esim. elektroniset julkaisut / sähköiset julkaisut asiasanastossa suositettavan ja korvatun termin välinen suhde on toisinaan synonyyminen, toisinaan ei KT-suhteesta ei voida tehdä kaikissa tapauksissa yhteneviä päätelmiä esim. palokalusto / KT alkusammutusvälineet, sammutuskalusto synonyymeista olisi hyötyä tiedonhaussa, mutta asiasanastot sisältävät suhteellisen vähän synonyymeja
Miten ontologia eroaa asiasanastosta? tietyt asiasanastojen rakenteelliset piirteet eivät sovi ontologiaan asiasanasta ei aina voida päätellä, missä merkityksessä sanaa pitäisi käyttää esim. risti / ristit ontologiassa sanan merkitystä tarkentaa hierarkia, johon käsite on sijoitettu asiasanaan sulkujen avulla liitetty tarkenne mahdollinen kuvaus käsitteen sisällöstä käsitteiden kuvauksia ei voida kerätä yhden sanan merkitysten selitykseksi ilman, että tarkistetaan selitysten yhtenevyys / toisiaan täydentävyys
Yleinen suomalainen ontologia (YSO) Yleiseen suomalaiseen asiasanastoon (YSA) pohjautuva ontologia n. 24 000 ontologisoitua käsitettä sisältää YSAn päivitykset marraskuulle 2009 asti vuoden 2010 YSA-päivitysten käsittely käynnissä kielet: suomi, ruotsi, englanti ruotsi tarkistettu Åbo Akademissa v. 2010 englanti: Helsingin kaupunginkirjasto ja FinnONTO jokaisella käsitteellä on oma URI (Uniform Resource Identifier) esim. sanastot http://www.yso.fi/onto/yso/p7407 käsitteiden väliset suhteet keskeisimpänä kehityskohteena: yläluokka-alaluokkasuhde pääosin asiasanastojen mukaan: assosiatiivinen suhde uutena: osa-kokonaisuussuhde
Yleinen suomalainen ontologia (YSO) hierarkian esikuvia: CYC, http://www.opencyc.org Dolce, http://www.loa-cnr.it/dolce.html WordNet, http://wordnet.princeton.edu/ käsitteet voidaan tarvittaessa esittää useasta näkökulmasta eri keinoin: ensisijaisesti käytetään assosiatiivisia suhteita ja rooleja assosiatiiviset suhteet, esim. (toiminnan) väline, (toiminnan) tulos roolit, esim. aine kuten puu: energialähteenä, rakennusmateriaalina myös useamman kuin yhden hierarkkisen yläkäsitteen käyttö (moniperintä) on mahdollista, esim. valotusmittari: valokuvausväline ja mittari
YSOn pääluokkamalli <muuttuva> prosessi tapahtuma toiminta <ajanjakso> <fyysinen objekti> ilmiö <pysyvä> <aineeton tuotos> <abstrakti> paikka ominaisuus järjestelmä
Mitä YSO ei ole? kaikenkattava maailmankuva koska taustalla on asiasanasto, käsitevalikoima on muotoutunut asiasanoituksen tarpeiden mukaan hierarkialtaan täydellinen hierarkia on tehty karkealla tasolla ja sitä voidaan korjata ja täydentää yksilöityjen tarpeiden mukaan ainoa oikea ratkaisu vaikka asioita voidaan tarkastella monesta näkökulmasta, voidaan silti sopia yhteisesti käytettävästä mallista esimerkiksi yhdistelmäontologioissa esiin tuleva erikoisalojen näkökulma käsitteistä voi olla erilainen kuin YSOssa näkökulmien tulee kuitenkin olla yleispäteviä ja ristiriidattomia ei: bioindikaattorit jäkälät ; vaan: sienet jäkälät (+ jäkälät toimivat bioindikaattoreina) ok: hedelmät ananas; trooppiset hedelmät ananas
Erikoisalojen asiasanastoista yhdistelmäontologioihin Yleisellä suomalaisella asiasanastolla (YSA) ja erikoisalojen asiasanastoilla on huomattava määrä yhteisiä käsitteitä ja erikoisalojen asiasanastojen rinnalla käytetään usein YSAa käsitteiden väliset suhteet eivät kuitenkaan aina ole yksiselitteisiä yhdistelmäontologiat, joissa YSOa on käytetty rakenteellisena mallina ja linkkinä erikoisalojen käsitteistöön selkeyttävät eri ontologioiden yhteiset käsitteet tuovat esiin monimerkityksiset termit ja niiden taustalla olevat eri käsitteet helpottavat kokonaisuuden käyttöä ja kehitystä auttavat välttämään turhaa päällekkäisyyttä ja mahdollistavat entistä paremmin omaan käsitteistöön keskittymisen
Ontologian käsitesuhteet: hierarkia asusteet huivit kapalot käsineet kaulukset päähineet laukut hatut solmiot lakit myssyt vyöt viuhkat sukat käsilaukut matkalaukut
Ontologian käsitesuhteet: hierarkia + assosiatiiviset suhteet yritykset sukat Nanso kaupunki valmistaja toimipaikka Nokia
Miten ontologiaa käytetään? asiasanastopohjainen ontologia soveltuu samaan käyttöön kuin asiasanastokin eli aineistojen kuvailuun käsitteet poimitaan aineiston metatietoihin ontologiasta käsitteiden poimimisen helpottamiseksi ONKI-ontologiakirjastossa julkaistu ontologia voidaan yhdistää metatietomalliin ONKIvalitsimen avulla kuvailevat käsitteet voidaan poimia metatietoihin käsityönä tai apuna voidaan käyttää oppivia ohjelmia, jotka ehdottavat sopivia asiasanoja käyttöön valittaviksi kun aineisto on kuvailtu ontologian käsitteiden avulla, voidaan semanttisessa haussa hyödyntää ontologian hierarkiaa haun saannin tehostamiseksi ontologian mahdollisia assosiatiivisia suhteita esimerkiksi suositusten antamisen ontologian monikielisyyttä hakujen tekemiseen millä tahansa ontologian kielellä, vaikka kuvailu olisi tehty vain yhdellä kielellä
Yhteenveto ontologioita rakennettaessa laajan aineiston tasapuolinen ja riittävän tarkka käsittely sekä kompromissit esitettävän tiedon valinnassa asettavat haasteita ei ole olemassa vain yhtä oikeaa tapaa kuvata käsitteitä, mutta eri näkökulmia voidaan esittää rinnakkain ja esitystavoista sopia ontologioita on ylläpidettävä sitä mukaa kuin kuvailussa tarvittava käsitteistö kehittyy luotettavien ontologioiden laatiminen edellyttää laajaa, eri alojen välistä yhteistyötä, johon osallistuu sekä ontologiatyön että käsiteltävän aihealueen asiantuntijoita FinnONTOn ontologioilla ja ONKI-palvelulla on luotu pohja ontologioiden helpolle rinnakkaiskäytölle ja yhteisölliselle kehitykselle tietoja ONKI-palvelimella julkaistut ontologiat: http://www.yso.fi/ ONKI-valitsimen käyttöönotto: http://www.yso.fi/onkiselector/ sisältötyön menetelmistä: Sanastokeskus TSK, http://www.tsk.fi/