Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Samankaltaiset tiedostot
Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

FinnONTO-infrastruktuurin esittely

Ontologioiden yhdistäminen YSO:oon

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

ASIASANASTON MUUTTAMINEN ONTOLOGIAKSI YLEINEN SUOMALAINEN ONTOLOGIA

Kohti Yleistä suomalaista ontologiaa (YSO)

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Kohti suomalaisen semanttista webiä -- ontologioita, palveluita ja sovelluksia

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Kohti suomalaista semanttista webiä

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Yleinen suomalainen ontologia YSO

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Semanttisen webin hyödyntäminen terveystiedon löydettävyydessä

ASIASANASTON MUUTTAMINEN ONTOLOGIAKSI YLEINEN SUOMALAINEN ONTOLOGIA

Miten ja miksi asiasanastoista kehitetään ontologioita

Miksi asiasanastoista pitäisi siirtyä ontologioihin? Prof. Eero Hyvönen

FinnONTO-hanke loi ontologisen perustan kansalliselle webin tietoinfrastruktuurille

YLEINEN SUOMALAINEN ONTOLOGIA YSO

The OWL-S are not what they seem

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Suositus asiasanastojen, luokitusjärjestelmien ja ontologioiden käytöstä luetteloinnissa Suomen museoissa

Ontology Work in Finland: National Semantic Web Infrastructure FinnONTO. Prof. Eero Hyvönen

Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

Asiasanastosta ontologiaksi

Kulttuurisampo.fi Suomalainen kulttuuri ja semanttinen web mitä, miksi ja miten?

Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Johdanto: Semanttinen Kalevala projekti

Keltaisten sivujen palveluiden kuvaaminen ontologioiden avulla

Viestintätekniikka AS-tutkinto-ohjelmassa. Eero Hyvönen

Yhteisöllinen semanttinen web 2.0 FinnONTO 2.0 -hankkeen visio ja tulokset

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO ja sen sovellukset. Prof. Eero Hyvönen

Älykäs semanttinen web tietämyksenhallinnan rajoja siirtämässä

TESAURUKSET JA ONTOLOGIAT

Kulttuurisampo. Joeli Takala. Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Semanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen

Automaattinen semanttinen annotointi

Ontologiakirjasto ONKI-Paikka

Kielellisten merkitysten tilastollinen ja psykologinen luonne: Kognitiivisia ja filosofisia näkökulmia. Timo Honkela.

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Kirjasampo [lyhyt oppimäärä]

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Älykkäät keltaiset sivut ( Intelligent Web Services ( IWebS ) )

Sisällönhallinnan menetelmiä

TerveSuomi.fi portaalin suunnittelu ja tekninen toteutus

Semanttinen Web Mitä se on käytännössä?

Terveys- ja yrityspalvelutyöpajan tutkimus Eero Hyvönen, Mikko Salonoja, Reetta Sinkkilä, Osma Suominen, Antti Tani

HOIDOKKI hoitotieteellinen asiasanasto. Kristiina Junttila sanastotyöryhmän jäsen / SHKS kehittämispäällikkö / HUS

Onko luettelointitermillä. väliä? Kokoelmaseminaari Suvi Kettula Espoon kaupunginmuseo

Mikä on Kulttuurisampo?...

Yleisen suomalaisen ontologian kehitystyö

Suomi.fi palvelutietovaranto

12 Case: "hajautettu kauppapaikka"

YSA ja lääke- ja hoitotieteen termit. Eeva Kärki Kansalliskirjasto

Yhteentoimivuusvälineistö

Semantic Web Sisältötuotannon ja palveluiden tulevaisuus

Luento 12: XML ja metatieto

Ontologioiden huomioiminen uuden kirjastojärjestelmän suunnittelussa. Tommi Jauhiainen Helsinki

Finto-palvelu ja ontologioiden kehitystyön tuki Suomessa

VESAsta Fintoon ja YSAsta YSOon: Mikä muuttuu ja miksi?

SELVITYS ERIKOISKIRJASTOJEN KÄYTTÄMISTÄ ASIASANASTOISTA JA LUOKITUKSISTA. Anne Holappa, STKS:n Erikoiskirjastojen työryhmä Tieteiden talo

Käsitemallit muistiorganisaatioiden kuvailun yhdenmukaistamisen välineenä

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Kohti suomalaista semanttista webiä

Internet jolla on merkitystä

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

FinnONTO-malli kansallisen semanttisen webin sisältöinfrastruktuurin perustaksi - visio ja sen toteutus

MALog-projekti kehittää oppimateriaalia matemaattiseen logiikkaan. Insinöörikoulutuksen foorumi

Suomalainen kulttuuri ja semanttinen web

Ontologian arviointi OntoClean-menetelmällä. Katariina Nyberg [ , Espoo]

Paikkatiedot ja Web-standardit

Finton hyödyntäminen ministeriöiden palveluissa. erityisasiantuntija Pilkkuniina Brandt, VNK

Miten avoin yhdistetty tieto saadaan verkkoon: kansallinen Linked Data Finland -hanke-ehdotus

Agentit ja semanttinen web. Pekka Halonen

Suomi.fi-palvelutietovaranto

Kim Viljanen

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

Kirjasampo. Kaunokki-ontologia & TKK / Dipoli. Kansalliskirjaston ontologia-seminaari Kaisa Hypén

Taloustieteet ja YSA. Eeva Kärki Kansalliskirjasto

Mikä on semanttinen web?

Verkkopalvelun sisällöntuotanto

Transkriptio:

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita? Prof. Eero Hyvönen TKK Viestintätekniikka ja Helsingin yliopisto Semantic Computing Research Group (SeCo) Lähde: E. Hyvönen: Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita? TKK Viestintätekniikka, 2005.http://www.cs.helsinki.fi/group/seco/ontologies/AsiasanastoistaOntologioihin.pdf 1

Sisältö Miksi asiasanastot eivät riitä semanttisen webin tarpeisiin? Miten asiasanasto (tesaurus) voidaan muuttaa ontologiaksi? 2

Perusongelma Nykyisten tesaurusten idea (tyyppiä YSA, MUSA, MASA, ) Asiasanojen avulla tiedon etsinnän tarkkuus (precision) ja saanti (recall) paranevat Semanttinen rakenne (aakkosellisen lisänä) helpottaa tiedon indeksoijaa asiasanojen löytämisessä Semanttinen rakenne hyödyllinen tietoteknisissä sovelluksissa Esimerkiksi MuseoSuomi ym. semanttisen webin portaalit» Termien laajennus kyselyissä» Sanaston tarjoaminen hierarkioina loppukäyttäjälle» Sisältöjen yhdistäminen ja suosittelulinkit» Hakutulosten ryhmittely» Käsitteiden visualisointi 3

Indeksoija pystyy ymmärtämään tietämyksensä avulla käsitteiden väliset merkitykset ja suhteet Tietokoneella ei ole maailmankuvaa, vaan kaikki pitää kertoa eksplisiittisesti semanttisina rakenteina Tietokone ei pysty hyödyntämään kunnolla nykyisiä sanastoja, sillä niissä ei semantiikkaa kuvata koneen kannalta riittävän täsmällisesti 4

Käytännöllinen kysymys Miten asiasanasto muutetaan ontologiaksi? Miten asiasanasto pitäisi laatia, jotta myös tietokone voisi sitä käyttää? 5

Asiasanatesauruksen rakenne Ekvivalenssisuhteet Hierarkkiset suhteet Assosiatiiviset suhteet 6

Esimerkki: Yleinen suomalainen asiasanasto YSA Noin 23.000 termiä 179 aluetta Aluesuunnittelu Anatomia Antropologia Arkeologia 61 aluejoukoista koostuvaa ryhmää Ryhmä 11: Maantiede. Kartografia. Kartoitus. Geodesia. Geologia. Paleontologia Perinteiset semanttiset suhteet LT/ST, RT, KÄYTÄ, KORVAA Taksonomiat vain osittaisia 7

Tesauruksen ontologisoiminen 1. Ekvivalenssisuhteiden esittäminen 2. Hierarkkisten suhteiden esittäminen 3. Assosiatiivisten suhteiden esittäminen 8

1. Ekvivalenssisuhteiden kehittäminen Kaksi ratkaisutyyppiä Termit luetellaan käsitteen ominaisuuksina» Ongelma: Joskus runsaasti nimiä Esim. eri kielet, translitteroinnin jne. Termit voivat riippua tilanteesta Esim. eri museoiden luettelointitavat, eri indeksointiajat jne. 9

Esimerkki: ULAN (Union List of Artist Names, Getty-säätiö) 10

Termeille kehitetään erilliset ontologiat, joista viitataan käsitteisiin» Ongelma: Useamman ontologian ylläpito» Esim. MuseoSuomen eri museoiden termikortit Termikorttiluokan yksilö kertoo sanaan liittyvän käsitteen ontologiassa onko sana suositeltu monikon ja yksikön (esim. ooppera vs. oopperat) 11

Merkitysten erottelu Esimerkki: YSA:n termi johtaminen Termillä on kuitenkin monia merkityksiä johtaminen (musiikki) johtaminen (liiketalous) johtaminen (sähkötekniikka) johtaminen (matematiikka) Johtaminen asiasanalla hakeminen johtaa suureen sekaannukseen Ratkaisumalli: eri merkityksille oman URI-tunnisteet» esim. http://yso.fi/johtaminen# näihin voidaan viitata sanoilla, esim. johtaminen indeksointi on tehtävä URI-tunnisteilla eikä monimerkityksisillä sanoilla 12

2. Hierarkkisten suhteiden esittäminen Yksilöiden erottaminen luokista Partitiivisten ja geneeristen suhteiden erottelu Hierarkioiden täydellistäminen 13

Yksilöiden erottaminen luokista Olio-perustainen (object oriented) mallinnus ja ohjelmointi keskeistä tietotekniikassa Luokka määrittelee sen yksilöiden ominaisuudet» Luokalla voi olla myös omia ominaisuuksia Esim. luokan yksilöiden määrä Yksilö perii ominaisuudet luokaltaan ja sen yläluokilta Esimerkki YSA:sta Halleyn komeetta LT komeetat Ongelma: Halleyn komeetta on yksilö luokasta komeetat, mutta kone ei voi tietää sitä» Voi olla useita eri komeettoja, joilla on komeetat -luokan ja sen yläluokkien ominaisuudet» Ei voi olla useita Halleyn komeettoja» Yksilö ei ehkä voi olla kuin yhden luokan (ja sen yläluokkien) yksilö Tämä oletus tehdään esim. Protege-editorissa 14

Partitiivisten ja geneeristen suhteiden erottelu LT/ST suhteella on monia merkityksiä Ihmiset niiden ymmärtävät eron mutta koneet eivät Esimerkki YSA:sta sairaalat LT terveydenhuoltolaitokset komeetat LT aurinkokunnat Kone hämmentyy säikähtäen» sairaalat subclassof terveydenhuoltolaitokset OK: sairaalat perivät terv.huoltolaistosten ominaisuudet» komeetat subclassof aurinkokunnat? Väärin: komeetta ei ole aurinkokunta, sillä ei esim. ole keskustähteä, planeettoja jne. Ratkaisumalli: sairaalat subclassof terveydenhuoltolaitokset komeetat ispartof aurinkokunnat 15

Partitiivisen suhteen alatyyppejä 16

Hierarkioiden transitiivisuuden esittäminen Esimerkki YSA:sta mäntyöljy LT öljy polttoöljy LT öljy öljy LT kaivannaiset Ongelma: mäntyöljy EI OLE kaivannainen, mutta polttoöljy on» Kone ei voi tajuta miksi tämän esitysmuodon perusteella, vaikka ihminen voikin Ratkaisu oikealla öljy 2 mäntyöljy rdfs:subclassof öljy 1 kaivannaiset polttoöljy raskas polttoöljy malmit 17

Hierarkioiden täydellistäminen Kaikilla käsitteillä on oltava yläkäsite Poikeuksena kaiken juuri käsite Esimerkki Museoalan asiasanaston MASA muunnoksesta Museoalan ontologiaksi MAO MASA:ssa n. 2600 käsitettä ilman yläluokkaa! Käsitteiden jako ortogonaalisiin pääfasetteihin 18

Esimerkki: MAO-hierarkiat 19

3. Assosiatiivisten suhteiden esittäminen 20

Assosiaatioiden esittäminen Semanttinen erottelutarkkuus riippuu sovelluksesta Suhteiden esittämismalleja Kuten taulukossa» Ongelmana suhteiden suuri määrä ja niiden merkityksen epämääräisyys Kehyspohjainen esitystapa, jossa suhteiden merkitys yritetään palauttaa joukkoon primitiivejä 21

Kehysperustainen ratkaisumalli Assosiaatiot muodostuvat verbityyppisten kehystapahtumien kautta (frame) Käsitteet toimivat eri temaattisissa rooleissa (thematic role)» Esim. myymis/ostamistapahtumassa agentti (agent) kohde (patient) hyötyjä (benefactor)» myyminen ja ostaminen määritellään saman kehyksen avulla Tekoälyssä ym. käytetty mallinnustapa» Esimerkiksi. FrameNet USA:ssa Esimerkki YSA:sta aurinkotuuli RT revontulet Aiheuttaminen_1 agentti aurinkotuuli tulos revontulet 22

Lopputulos Perinteisen tesauruksen kevyt ontologisointi Yksilöiden erottelu Päämerkitysten erottelu Partitiivinen suhde erotettu geneerisestä Täydelliset hierarkiat Transitiivisuus toimii Semantiikka perustuu W3C:n RDFS-standardiin Tämän pohjalta voi laatia pidemmälle meneviä ontologioita Ks. esimerkiksi W3C:n Web Ontology Language OWL 23