Yleisen suomalaisen ontologian kehitystyö



Samankaltaiset tiedostot
Miten ja miksi asiasanastoista kehitetään ontologioita

Ontologioiden yhdistäminen YSO:oon

Yleinen suomalainen ontologia YSO

Asiasanastosta ontologiaksi

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset

Kohti Yleistä suomalaista ontologiaa (YSO)

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Ontologisointi käytännön tasolla

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

Ontologisointi käytännön tasolla

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

SELVITYS ERIKOISKIRJASTOJEN KÄYTTÄMISTÄ ASIASANASTOISTA JA LUOKITUKSISTA. Anne Holappa, STKS:n Erikoiskirjastojen työryhmä Tieteiden talo

YSA ja lääke- ja hoitotieteen termit. Eeva Kärki Kansalliskirjasto

Päällekkäisyys ja AFO-ontologia Tulevaisuus? YSO + AFO KOKO?

Taloustieteet ja YSA. Eeva Kärki Kansalliskirjasto

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

Pysyvä ja muuttuva A:sta O:hon sisällönkuvailussa. Mirja Anttila Kansalliskirjasto

Suositus asiasanastojen, luokitusjärjestelmien ja ontologioiden käytöstä luetteloinnissa Suomen museoissa

Onko luettelointitermillä. väliä? Kokoelmaseminaari Suvi Kettula Espoon kaupunginmuseo

Finton hyödyntäminen ministeriöiden palveluissa. erityisasiantuntija Pilkkuniina Brandt, VNK

Kirjasampo. Kaunokki-ontologia & TKK / Dipoli. Kansalliskirjaston ontologia-seminaari Kaisa Hypén

Ontologioiden huomioiminen uuden kirjastojärjestelmän suunnittelussa. Tommi Jauhiainen Helsinki

HOIDOKKI hoitotieteellinen asiasanasto. Kristiina Junttila sanastotyöryhmän jäsen / SHKS kehittämispäällikkö / HUS

Erikoisontologioiden kuulumisia. Finto-projekti: Laajennetun projektiryhmän kokous Tuomas Palonen, tietoasiantuntija

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Suomi.fi palvelutietovaranto

Semanttisen webin hyödyntäminen terveystiedon löydettävyydessä

Finto-tilannekatsaus. Osma Suominen Kansalliskirjaston asiantuntijaseminaari

Finton jatko vuosina

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

Finto-palvelu ja ontologioiden kehitystyön tuki Suomessa

Finto-tilannekatsaus. Asiantuntijaseminaari KANSALLISKIRJASTO - Kirjastoverkkopalvelut

YSAsta YSOon kirjastoissa: miksi ja miten

Kansalliset kehittämishankkeet: Etenemissuunnitelmat

YLEINEN SUOMALAINEN ONTOLOGIA YSO

VESAsta Fintoon ja YSAsta YSOon: Mikä muuttuu ja miksi?

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

ASIASANASTON MUUTTAMINEN ONTOLOGIAKSI YLEINEN SUOMALAINEN ONTOLOGIA

Finto-projektin tilannekatsaus

FinnONTO-infrastruktuurin esittely

Taustamuistio 1 (6) Yhteinen tiedon hallinta -hanke. Taustatietoa Sanaston metatietomallin määrittely -työpajan keskusteluun

YSAn auktorisointi - Helka-tietokanta. Ville Huhtala, Helsingin yliopiston kirjasto Sisällönkuvailupäivä

ARTIKKELITIETOKANNAT JA OMANELLI PIRJO POHJOLAINEN

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Suomi.fi-palvelutietovaranto

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Paikkatietoyhteistyö. Mikko Lappalainen Finto-projektin laajennetun projektiryhmän kokous, KANSALLISKIRJASTO

Susanna Nykyri

Sanastot ja niiden teknisen infrastruktuurin ylläpito Juha Hakala Kansalliskirjasto

YHTEISET TIEDON HALLINNAN SANASTOPALVELUT tutkimus- ja kehittämishankkeen toimintasuunnitelma 2016

Finton käsite-ehdotuslomake

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Prosessikuvauksesta vauhtia taideteollisuusalan ontologia TAOn ensiaskeleihin

Kirjasampo [lyhyt oppimäärä]

Kulttuurisampo. Joeli Takala. Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Mikä on Kulttuurisampo?...

Sisällönhallinnan menetelmiä

Auktoriteettitietokanta

YHTEISET TIEDON HALLINNAN SANASTOPALVELUT tutkimus- ja kehittämishankkeen toimintasuunnitelma 2017

ONKI Light -ontologiaselaimen käytettävyystestaus: ensimmäinen testikierros

Näin sisällönkuvailen. Sisällönkuvailupäivä Liisa Virtanen Kansalliskirjasto

Sanastosta ontologiaksi

Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet

Miksi asiasanastoista pitäisi siirtyä ontologioihin? Prof. Eero Hyvönen

KAM-sektori paikkatiedon kansallisessa ekosysteemissä. Mikko Lappalainen Nimitietopalvelua ja paikkatietopalvelua koskeva seminaari, 30.1.

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

YLIOPISTOJEN YHTEISHAKU JA SÄHKÖINEN HAKUJÄRJESTELMÄ asiasanasto / täydentävien tietojen keruu / opiskelukieli

Jatko-opintoja englannista kiinnostuneille

Tietotermit tiedonhallintaan Säätytalo

Yhteisöllinen semanttinen web 2.0 FinnONTO 2.0 -hankkeen visio ja tulokset

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

HALLITUKSEN ESITYS LIITON KIELISTRATEGIAKSI

FINTO-PROJEKTIN PROJEKTISUUNNITELMA VUODELLE 2015

Lataa Lääketieteen termit 1-2. Lataa

Sisällönkuvailun asiantuntijaverkoston kokous

Ehdotusjärjestelmä. Henri Ylikotila. Finto-projektin laajennetun projektiryhmän kokous Esityksen kalvot:

Medical Subject Headings

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Skosmos 0.6 esittely. Osma Suominen ONKI-projektin laajennetun projektiryhmän kokous

Vinkkejä musiikin tiedonhakuun OUTI-verkkokirjastossa

Yrityssuomi.fi:n toiminnallisuus ja ontologian hyödyntäminen Yritys-Suomen verkkopalveluissa. Eeva Koivisto, Yritys-Suomen verkkotoimitus 1.11.

Finna ja ontologiat tms.

Kysy kirjastonhoitajalta. Syksy 2008

KAMUT: Muistiorganisaatioiden tietovarannot yhteiskäyttöön. ÄLYÄ VERKOSSA - WEB INTELLIGENCE Tiedekeskus Heureka, Vantaa

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

Infotilaisuus koulutusuudistuksen siirtymäajan päättymisestä

MOT-PALVELU OHJE MOT-SANAKIRJAN KÄYTTÖÖN

Kielten oppiminen ja muuttuva maailma

Transkriptio:

Yleisen suomalaisen ontologian kehitystyö Tuomas Palonen ja Katri Seppälä Semanttisen laskennan tutkimusryhmä (SeCo) Teknillinen korkeakoulu, mediatekniikan laitos http://www.seco.tkk.fi/ 1

Mihin ontologioita tarvitaan? mahdollisuus kehittää asiasanastoja ja laajentaa niiden käyttöä ontologiamuodossa kun asiasanastot muokataan koneen tulkittaviksi ontologioiksi niiden» monitulkintaisuutta karsitaan» käsitteiden yksilöimiseksi tarvittavaa ja käsitteiden välisiä suhteita selventävää tietoa lisätään mahdollisuus tarjota uusia palveluja nykyisten rinnalla semanttisen webin tekniikat mahdollistavat älykkäiden palvelujen kehittämisen esimerkiksi niin, että sanojen/merkkijonojen sijaan hyödynnetään ontologian kautta määriteltyjä käsitteitä 2

Millainen Yleinen suomalainen ontologia (YSO) on? perustuu Yleiseen suomalaiseen asiasanastoon (YSA) voidaan käyttää rakenteellisena mallina ja liittymäkohtana erikoisalojen ontologioihin 8 suomalaista erikoisalan ontologiaa on jo liitetty YSOon sisältää n. 23 000 ontologisoitua käsitettä YSAn päivitykset toukokuulle 2009 asti sisältyvät YSOon kielet: suomi englannin ja ruotsin vastineiden (Allärs) täydentäminen ja tarkistus on käynnissä ontologian käsitteiden väliset suhteet yläluokka-alaluokkasuhde osa-kokonaisuussuhde assosiatiivinen suhde 3

YSO käsitteistön yhteen liittävä hierarkia <muuttuva> <ajanjakso> <pysyvä> prosessit <fyysinen kokonaisuus> <fyysinen tapahtumat toiminta objekti> <henkiset tuotokset> ilmiöt <abstrakti> paikka ominaisuudet järjestelmät 4

KOKO-ontologia: n. 37 000 käsitettä YSO Leikkaavat ontologiat Yhteisten ekvivalenttien käsitteiden määrä YSO + TAO 1990 YSO + MAO 2330 YSO + VALO 950 MAO + TAO 1190... AFO VALO MAO TAO KOKO...

Mitä YSO ei ole? kaikenkattava maailmankuva käsitevalikoima on muotoutunut asiasanoituksen tarpeiden mukaan hierarkialtaan täydellinen hierarkia on tehty karkealla tasolla ja sitä voidaan korjata ja täydentää yksilöityjen tarpeiden mukaan ainoa oikea ratkaisu vaikka asioita voidaan tarkastella monesta näkökulmasta, voidaan silti sopia yhteisesti käytettävästä mallista esimerkiksi yhdistelmäontologioissa esiin tuleva erikoisalojen näkökulma käsitteistä voi olla erilainen kuin YSOssa 6

Mitä hyötyä YSOsta on? mahdollistaa uudenlaisten palveluiden tarjoamisen mahdollisuus semanttiseen tiedonhakuun käsitelähtöisyys ja ontologian monikielisyys mahdollistavat kielten joustavan käytön hakutilanteessa riippumatta siitä, millä kielellä kuvailu on tehty helpottaa käsitteiden valintaa ja yhtenäistä käyttöä aineistoja kuvailtaessa, koska käsitteet on eritelty hierarkian avulla ontologian avulla kuvailtaessa riittää, että kuvailuun valitaan samasta hierarkiasta vain yksi, sopivan tarkka käsite vähentää eri aloilla tehtävän työn päällekkäisyyttä, kun erikoisalojen ontologioita kehitetään entistä tiiviimmin suhteessa YSOon 7

YSOn käännös englantiin YSOssa käännettävänä alunperin n. 8000 asiasanaa; tällä hetkellä kääntämättä n. 2000 asiasanaa kääntämätön osuus muodostui seuraavista osista: YSAn 6000 HKLJ:ssa kääntämätöntä asiasanaa + 2000 myöhemmin YSAan lisättyä asiasanaa käännöstyö alkoi huhtikuussa 2009 ja päättyy joulukuussa 2009; työtä on tehnyt pääosin Tuomas Palonen apunaan Katri Seppälä ja Anu Ylisalmi käännöstyö edennyt arviolta 70 käsitteen päivävauhtia jotkin asiasanat helposti käännettäviä, toiset huomattavasti vaikeampia 8

Käännöksen apuvälineet painetut sanakirjat: lääketieteen, biologian, lakikielen ja talouselämän sanakirjat jne. nettisanastot: MOT-sanakirjat, IATE-termipankki, opetushallinnon, Eduskunnan kirjaston ja Sanastokeskuksen sanastot, terveydenhuollon Metatesaurus Rex jne. muut nettilähteet: Fennica, Wikipedia, Tilastokeskus, International Standard Classification of Occupations, EU-asiakirjat, lakikäännökset, Google (termien yleisyys) jne. asiantuntija-apu tarvittaessa 9

Käännösongelmia käsitteet, joille ei ole vastinetta englantia puhuvassa maailmassa: viileä vyöhyke, kestävyyslajit, hirvikoirat jne; sosiaalialan termit: erikoisnuorisotyö, lähikasvattajat jne. termit eivät aina hahmotu samalla tavalla eri kielissä: verolautakunta = tax committee, metsälautakunta = forest board, kunnallislautakunta = local council suomalaisen kulttuurin spesifit käsitteet: kalterijääkärit, korpelalaisuus, heimoaate erisnimet: Olhavan taistelu, Pyhän Elian kirkko, Sanoja & Säveliä ammatit ja oppiarvot: hallintopäälliköt, kunnanlääkärit, kandidaatit, leipurimestarit 10

Käännösratkaisuja selvitetään, mikä on käsitteen asiasisältö VESAssa ja käyttökonteksti Fennicassa, monitulkintaisten sanojen kohdalla tämä on erityisen tärkeää etsitään mahdollisimman luotettava käännöslähde; harrastelijakäännökset eivät kelpaa tarkistetaan, että suomen kielen asiasana ja englannin vastine viittaavat samaan käsitteeseen jos sopivia vaihtoehtoja on useita, tarkistetaan yhtäältä, mikä englannin käsitteistä vastaa tarkimmin suomen käsitettä ja toisaalta mikä englannin käsitteistä on yleisimmin käytössä 11

Kehitettävää yhä HKLJ-käännösten tarkistus: käännöksissä ei ole otettu huomioon ontologiahierarkiaa eikä monimerkityksisyyttä vaikeiden, kääntämättä jääneiden asiasanojen kääntäminen mahdollinen WordNetin ja YSOn automaattisen siltaamisen kartoitus ja aiempien YSOkäännösten tarkistus 12

Yhteenveto YSOlla on keskeinen asema eri ontologioiden yhdistäjänä englannin kieli on monilla aloilla tärkeä linkki kotimaisen kieliyhteisön ulkopuolelle kuten asiasanastot, ontologiat edellyttävät jatkuvaa kehitys- ja ylläpitotyötä ollakseen toimivia ontologioiden ylläpito on mahdollista toteuttaa hyvin organisoidulla yhteistyöllä lisätietoja ja sovellusten esittelyitä SeCo-ryhmän kotisivulta http://www.seco.tkk.fi/ ONKI-palvelu: http://www.yso.fi/