ASIASANASTON MUUTTAMINEN ONTOLOGIAKSI YLEINEN SUOMALAINEN ONTOLOGIA



Samankaltaiset tiedostot
Miten ja miksi asiasanastoista kehitetään ontologioita

ASIASANASTON MUUTTAMINEN ONTOLOGIAKSI YLEINEN SUOMALAINEN ONTOLOGIA

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Yleinen suomalainen ontologia YSO

Ontologioiden yhdistäminen YSO:oon

Kohti Yleistä suomalaista ontologiaa (YSO)

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset

FinnONTO-hanke loi ontologisen perustan kansalliselle webin tietoinfrastruktuurille

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

Yleisen suomalaisen ontologian kehitystyö

Asiasanastosta ontologiaksi

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

FinnONTO-infrastruktuurin esittely

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

YLEINEN SUOMALAINEN ONTOLOGIA YSO

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Finto-projektin tilannekatsaus

Finton jatko vuosina

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Suositus asiasanastojen, luokitusjärjestelmien ja ontologioiden käytöstä luetteloinnissa Suomen museoissa

Finto-tilannekatsaus. Osma Suominen Kansalliskirjaston asiantuntijaseminaari

Finto palveluiden toteuttamisen alustana

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

YSAsta YSOon kirjastoissa: miksi ja miten

Ontologisointi käytännön tasolla

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Kohti suomalaista semanttista webiä

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Finto-palvelu ja ontologioiden kehitystyön tuki Suomessa

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

Ontology Work in Finland: National Semantic Web Infrastructure FinnONTO. Prof. Eero Hyvönen

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

Finton hyödyntäminen ministeriöiden palveluissa. erityisasiantuntija Pilkkuniina Brandt, VNK

Taustamuistio 1 (6) Yhteinen tiedon hallinta -hanke. Taustatietoa Sanaston metatietomallin määrittely -työpajan keskusteluun

KAM-sektori paikkatiedon kansallisessa ekosysteemissä. Mikko Lappalainen Nimitietopalvelua ja paikkatietopalvelua koskeva seminaari, 30.1.

Automaattinen semanttinen annotointi

VESAsta Fintoon ja YSAsta YSOon: Mikä muuttuu ja miksi?

Semanttisen webin hyödyntäminen terveystiedon löydettävyydessä

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Pysyvä ja muuttuva A:sta O:hon sisällönkuvailussa. Mirja Anttila Kansalliskirjasto

Sanastot ja niiden teknisen infrastruktuurin ylläpito Juha Hakala Kansalliskirjasto

YHTEISET TIEDON HALLINNAN SANASTOPALVELUT tutkimus- ja kehittämishankkeen toimintasuunnitelma 2017

Media- ja kulttuuripalvelut

Miksi asiasanastoista pitäisi siirtyä ontologioihin? Prof. Eero Hyvönen

YSA ja lääke- ja hoitotieteen termit. Eeva Kärki Kansalliskirjasto

Taloustieteet ja YSA. Eeva Kärki Kansalliskirjasto

YHTEISET TIEDON HALLINNAN SANASTOPALVELUT tutkimus- ja kehittämishankkeen toimintasuunnitelma 2016

SEMANTTINEN WEB JA PAIKKATIETOIHIN PERUSTUVAT PALVELUT

Tieto matkaa maailmalle

Onko luettelointitermillä. väliä? Kokoelmaseminaari Suvi Kettula Espoon kaupunginmuseo

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Paikkatietoyhteistyö. Mikko Lappalainen Finto-projektin laajennetun projektiryhmän kokous, KANSALLISKIRJASTO

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

JHS 145 Palvelutietojen ryhmittely ja osoitteet asiointia varten monta toimialaa kattavissa julkisen sektorin portaaleissa suosituksen päivittäminen

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Yhteisöllinen semanttinen web 2.0 FinnONTO 2.0 -hankkeen visio ja tulokset

The OWL-S are not what they seem

Kohti suomalaista semanttista webiä

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Ontologioiden huomioiminen uuden kirjastojärjestelmän suunnittelussa. Tommi Jauhiainen Helsinki

Kansalliset kehittämishankkeet: Etenemissuunnitelmat

Ontologisointi käytännön tasolla

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO ja sen sovellukset. Prof. Eero Hyvönen

Taustaa. FinnONTO -- Suomalaiset semanttisen webin ontologiat ( )

Finto-tilannekatsaus. Asiantuntijaseminaari KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Prosessikuvauksesta vauhtia taideteollisuusalan ontologia TAOn ensiaskeleihin

Kirjasampo. Kaunokki-ontologia & TKK / Dipoli. Kansalliskirjaston ontologia-seminaari Kaisa Hypén

Suomi.fi palvelutietovaranto

Kulttuurisampo.fi Suomalainen kulttuuri ja semanttinen web mitä, miksi ja miten?

Linked Data Finland: visio, missio ja toteutus

Skosmos 0.6 esittely. Osma Suominen ONKI-projektin laajennetun projektiryhmän kokous

HOIDOKKI hoitotieteellinen asiasanasto. Kristiina Junttila sanastotyöryhmän jäsen / SHKS kehittämispäällikkö / HUS

Erikoisontologioiden kuulumisia. Finto-projekti: Laajennetun projektiryhmän kokous Tuomas Palonen, tietoasiantuntija

FINTO-PROJEKTIN PROJEKTISUUNNITELMA VUODELLE 2015

Historialliset paikat ja kartat

Kohti suomalaisen semanttista webiä -- ontologioita, palveluita ja sovelluksia

PAIKANNIMISTÄ PAIKKATIETOON Kansalliskirjaston paikannimisanastojen nykytilanne ja uudistustarpeet

Yhteentoimivuusvälineistö

Finna ja ontologiat tms.

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Kirjastoverkkopäivät Marja-Liisa Seppälä Kansalliskirjasto

Älykäs semanttinen web tietämyksenhallinnan rajoja siirtämässä

Sisällönhallinnan menetelmiä

Semanttinen Finlex Arttu Oksanen ( )

Suomi.fi-palvelutietovaranto

Transkriptio:

ASIASANASTONMUUTTAMINENONTOLOGIAKSI YLEINENSUOMALAINENONTOLOGIA ESIMERKKINÄFINNONTO-HANKKEENMALLISTA KatriSeppälä,SanastokeskusTSK EeroHyvönen,Aalto-yliopistojaHelsinginyliopisto KansalliskirjastoTutkimuskirjasto ISBN978-952-10-9883-3

ESIPUHE Aalto-yliopiston ja Helsingin yliopiston Semanttisen laskennan tutkimusryhmän (SeCo) vetämässä FinnONTO-hankkeidensarjassaluotiinvuosina2003-2012prototyyppikansallisestasemanttisenwebininfrastruktuurista,jokasisältääerialojenontologioita,ONKI-ontologiapalvelunjavisionprosessista,jollamonialainenontologiatyövoitaisiinSuomessajatkossajärjestääjavakinaistaa.Hankkeeneri vaiheitarahoittitekesjayhteensän.50suomalaistayritystäjajulkistensektorinorganisaatiota. Ontologioiden kehittämisestä sekä ONKI-ontologiapalvelusta vastasi vuoden 2013 loppuun Aaltoyliopiston mediatekniikan laitoksella ja Helsingin yliopiston tietojenkäsittelytieteen laitoksella SemanttisenlaskennantutkimusryhmäSeCo.Vuoden2014alussakeskeinenosaFinnONTOnontologiatyöstätyöstäjaontologioistasiirtyiKansalliskirjastonylläpidettäviksijaedelleenkehitettäviksiFintonimisenäuutenapalveluna.SenteknologiapohjanaonFinnONTOssakehitettyONKILight-palvelinja keskeisimpään tietosisältöön kuuluu joukko FinnONTOssa kehitettyjä ontologioita, erityisesti asiasanastoistakehitetytyleiskäsitteitäsisältäväyleinensuomalainenontologiaysojasiihenliittyvät erikoisalojen ontologiat eli ns. KOKO-ontologiapilvi. FinnONTOssa ehdotetun ONKI-konsortiomallin mukaanontologioidenkehittämistävoitaisiinjatkossaorganisoidayhteisöllisestisiten,ettäkansalliskirjastokehittääjärjestelmänytimessäolevaaysoajasiihenliittyviäomiaontologioitaanjakoordinoi yhteistyötä,jossaerikoisontologioitakehitetäänalakohtaistenasiantuntijaryhmientoimesta. Tämän raportin tavoitteena on edistää tätä työtä kiteyttämällä ja dokumentoimalla suomen kielellä niitäperiaatteita,joitafinnonto-hankkeessakehitettiinsuomalaistenasiasanastojenmuuttamisesta semanttisen webin ontologioiksi, sekä tästä työstä saatuja kokemuksia. Esimerkkinä periaatteiden soveltamisesta käytäntöön, esitellään tapaustutkimuksena Yleisen Suomalaisen Asiasanaston YSA muunnosprosessiayleiseksisuomalaiseksiontologiaksiyso,jokamuodostaakoko-ontologianylärakenteenjatärkeimmänkomponentin.tämäfinnonto-ontologiatyönkuvausonlaadittukansalliskirjaston erillisestä toimeksiannosta, ja Kansalliskirjaston Finto-palvelun kehittäjät ovat osallistuneet kuvauksen laatimiseen antamalla palautetta kirjoitusprosessin aikana. Kiitokset kuuluvat raportin kirjoittamistaaktivoineelletuomaspalosellesekäraporttiaystävällisestikommentoineillehenkilöille: MirjaAnttila,Esa-PekkaKeskitalo,SusannaNykyri,MikkoLappalainen,LiisaVirtanenjaHenriYlikotila. Mahdollisista tekstiin jääneistä epätarkkuuksista ja virheistä samoin kuin raportissa esitetyistä ehdotuksistavastaavatkuitenkinkirjoittajat. Raportinpohja-aineistonaonkäytettyFinnONTOnaikanamuistiinkirjattujahavaintojajaohjeita.Katri Seppälä osallistui keskeisellä tavalla kaikkien FinnONTO-hankkeessa kehitettyjen ontologioiden kehitystyöhön, joiden perustana olivat asiasanastot, ja aivan erityisesti YSAn muuttamiseen YSOksi. Eri osaontologioiden kehittäminen tapahtui usein yhteistyössä hankkeeseen osallistuneiden organisaatioidenasiantuntijoidenkanssasiten,ettäfinnontontutkijatopastivatkehitystyössäjatarjosivat sille teknisen tuen. Sisältötyötä koskevaa ohjeistusta on monikielisten ontologioiden osalta tuolloin kirjoittanutmyöstuomaspalonen.finnonto-hankesyntyieerohyvösenaloitteestajahänmyösjohti hankettaalustaloppuunsaakka. LukuisatSeCo-tutkimusryhmäntutkijatAalto-yliopistossajaHelsinginyliopistossasekähankekonsortioneriorganisaatioissaovatolleetmukanatässäraportissaesiteltävässäontologiatyössä,kuten(aakkosjärjestyksessä) Mirja Anttila (YSO), Johanna Eerola (TERO), Maria Forsén (ALLSO), Eeva-Liisa Haanpää (KITO), Outi Hietanen (MERO), Kaisa Hypén (KAUNO), Esa Hämäläinen (PUHO), Anne Isomursu (VALO), Ellen Karhulampi (TAO), Suvi Kettula (MAO), Anna-Liisa Kristiansson (KTO), Eeva- 1

LiisaLeppänen(YSO),PäiviLipsanen(AFO),KatariinaNyberg(MUSO),KristiinaNäyhö(KULO),TuomasPalonen(JUHO),RingaSandelin(ALLSO),SatuSavia(VALO),AlexSpåre(KAUNO),TimoViitanen (ALLSO) ja Anu Ylisalmi (YSO, LIITO). Tekniseen kehittämiseen osallistuivat eri aikoina mm. Matias Frosterus, Tomi Kauppinen, Ville Komulainen, Eetu Mäkelä, Sini Pessala, Tuukka Ruotsalo, Reetta Sinkkilä,OsmaSuominen,JouniTuominen,ArttuValojaKimViljanen.EevaKärjenapuYSA-sanastoon liittyvissä kysymyksissä oli hankkeen onnistumisen kannalta tärkeää. Kiitos kaikille yhteistyöstä ja mukanaolosta. Espoossa13.3.2014 KatriSeppäläjaEeroHyvönen 2

ESIPUHE 1 1 KANSALLINENONTOLOGIAINFRASTUKTUURIFINNONTO 5 1.1 Ontologiat yhdistävät tietoa ja tarkentavat sisällönkuvailua 5 1.2 Kansallinen haaste: ontologiat 6 1.3 Ontologiainfrastruktuurin osat 7 2 ONTOLOGIATYÖNTAVOITTEET,PERIAATTEETJARAJOITTEET 10 2.1 KOKO-joukko toisiinsa yhdistettyjä eri alojen ontologioita 10 2.2 Yhteentoimivuus olemassa oleviin asiasanastoihin 12 2.3 Keskittyminen ensin olennaisimpiin ontologisiin periaatteisiin 13 2.4 Luokkahierarkia ja sen täydentämien 14 2.5 Luokkien ja yksilöiden erottaminen 16 2.6 Laajempi/suppeampi termi -suhteiden tarkentaminen 17 2.7 Yksilö-luokka-suhteiden transitiivisuuden tarkistaminen 18 2.8 Monimerkityksisten sanojen taustalla olevien käsitteiden erottelu 18 2.9 Standardiformaatin valinta: RDF(S), OWL ja SKOS 19 2.10 Käsitteiden nimeäminen 19 2.11 Moniarvoisuus 20 2.12 Avoin yhdistetty tieto 20 3 TESAURUKSESTAONTOLOGIAKSI:CASEYSO 21 3.1 Hierarkian pääluokat 21 3.1.1 Abstrakti (abstract) 22 3.1.2 Pysyvä (endurant) 22 3.1.3 Muuttuva (perdurant) 26 3.2 Hierarkian rakentaminen 27 3.2.1 Hierarkiapalojen yhteensovittaminen 28 3.2.2 Koostumussuhteiden käsittely 28 3.2.3 Korvattujen termien käsittely 29 3.2.4 Assosiatiivisten suhteiden käsittely 29 3.2.5 Asiasanaketjujen käsittely 29 3

3.2.6 Hierarkkisten alakäsitteiden ryhmittely 29 3.2.7 Moniperinnän käyttö 30 3.3 Assosiatiivisten suhteiden käyttö 31 3.4 Roolien käyttö 32 3.5 Monimerkityksisten asiasanojen käsittely 32 3.5.1 Koostekäsitteet 34 3.6 Monikielisen ontologian rakentaminen 34 3.6.1 Monikielisen ontologian haasteet 36 3.6.2 Ruotsinkieliset asiasanat 37 3.6.3 Asiasanojen englanninkieliset vastineet 38 3.7 Ontologioiden päivitys 39 3.7.1 Asiasanaa koskevat muutokset 39 3.7.2 Käsitteen hierarkiaa koskevaa muutokset 40 3.7.3 Käsitteen assosiatiivisissa suhteissa tapahtuneet muutokset 40 3.7.4 Ontologian käsitekokonaisuuteen liittyvät muutokset 40 3.8 Ehdotuksia jatkotoimenpiteiksi 41 4 YHTEENVETO 42 5 LÄHTEITÄ 43 LIITE:KESKEISIÄKÄSITTEITÄ 46 4

1 KANSALLINENONTOLOGIAINFRASTUKTUURIFINNONTO 1.1 Ontologiatyhdistävättietoajatarkentavatsisällönkuvailua Asiasanojakäytetäänyleisestitiedonkuvailussakirjastoissa,museoissa,arkistoissa,mediayhtiöissäjne.Kontrolloidunsanastonkäytöllävoidaanparantaajayhdenmukaistaatiedonindeksointia, jollointiedonhaussa(baeza-yates,ribeiro-neto,2011)päästäänmyöhemminparempaatarkkuuteen(precision)jasaantiin(recall).asiasanojaonorganisoituperinteisestimerkitystenperusteellaasiasanastoiksi(tesauruksiksi)(aitchisonetal.,2000),jollointermeihinmerkityksenperusteellaliittyvättoisettermitvoidaanlöytäähelpomminkuinesimerkiksiaakkosellisestahakemistosta. Asiasanastojaonalettukehittääontologioiksi(Staab,Studer,2009)erityisestisemanttisenwebin (SemanticWeb)tutkimuksenpiirissä.Semanttinenweb(Antoniou,vanHarmelen,2008)onwebin kehitystäkoordinoivanw3c-järjestönv.2001käynnistämäkehityssuunta,jonkapyrkimyksenäon täydentää perinteistä, sivujen verkosta muodostuvaa webiä siinä esiintyvien käsitteiden ja (meta)tietojenmuodostamallasemanttisellatietoverkolla 1 Kehityssuunnastakäytetäännykyisinmyös nimityksiäwebofdatajalinkeddata(heath,bizer,2011).ideanaon,ettäyhteistenkansainvälistenstandardienjatällaisentietojenverkonavullavoidaanyhdistääerialojentietosisältöjäyhälaajemmiksijarikkaammiksikokonaisuuksiksi.semanttisenwebinkäsiteverkkoaymmärtävätpaitsi ihmisetmyösverkkosovellukset,ts.tietokoneet,mikämahdollistaaaiempaaälykkäämpienjakeskenään yhteentoimivampien (interoperable) verkkosovellusten kehittämisen. Semanttinen tarkoittaatässäyhteydessätietoa,jokaonesitettysellaisessamuodossa,ettäsentulkintaonmahdollistatietokoneellahyvinmääritellyllätavalla(tässäkäytetäänhyväksilogiikkaa).semanttisenwebinkeskeisenkomponentinja selkärangan muodostavatyhdistetyntiedon(linkeddata)sisällönkuvailussakäytettävätontologiat,joidenkauttaaineistotyhdistyvättoisiinsa. Oletetaan,ettäetsit helsinkiläisiäravintoloita tietojärjestelmästä.perinteinentiedonhakujärjestelmä toimii siten, että se vertailee hakutermejä helsinki ja ravintola tietokantaantiedon tallennusvaiheessa indeksoituihin kuvailutermeihin ja palauttaa hakutuloksena vastaavat tietueet. Hakuperustuumerkkijonojenvertailuun;joshakusanaavastaavaamerkkijonoaeilöydytietueesta sopivasta paikasta saadaan tyhjä tulos. Jos esimerkiksi tietokantaan on talletettu indeksointivaiheessavain Kalliossa oleva pizzeria,eiselöydyhakusanoilla Helsinki ja ravintola,elleikäyttäjä osaa muotoilla kyselyään tarkemmin kaupunginosa- ja ravintolatyyppikohtaisesti, mikä on usein hankalaa. Tässä ei auta sanojen taivutusmuotojen tai synonyymien huomioiminenkaan. Myös kielimuurit ovat perinteisen merkkijonohaun haasteena: ravintolalla haettaessa ei restaurant löydy. Ontologiaperustainen hakupalvelu sen sijaan ymmärtää tarjota tuloksena Kalliossa sijaitsevaa pizzeriaa,koskaindeksoinninja/taihaunapunakäytetäänmaailmankäsitteitäkuvaaviaontologioita.nekertovat,että Kallio onosahelsinkiäjaettä Kallio tässäyhteydessäeitarkoitaluonnonmuodostelmaataipresidenttikyöstikalliota.samoin pizzeria voidaantunnistaaeräänlaiseksi ravintolan alatyypiksi.myöskielimuuritluhistuvat,silläontologinenindeksointijahakuperus- 1http://www.w3.org/standards/semanticweb/ 5

tuvatkieliriippumattomiintunnisteisiineikäkielellisiinilmauksiin.ontologistenviittaustenkautta tietoyhdistyyluontevastitoisiintietoihin:esimerkissämmejärjestelmävoitarjotalisätietoapizzakulttuuristawikipediankautta,mikälihakupalvelussakäytetäänsamojakäsitteitäkuinwikipedian ontologisessa versiossa DBpedia 2 Voidaan myös luoda linkki lähellä olevan teatterin Italiaaiheistarevyytäkäsitteleväänartikkeliin,koskapizzaonitalialainenruokalaji,taitarjotamatkapuhelimeennavigointipalveluKallioon. Tällaisten älykkäiden palveluiden kehittämisen edellytyksenä on, että verkossa toimivien järjestelmienkäytettävänäonyhteisestisovittuja,tietokoneen ymmärtämässä muodossamääriteltyjä käsitteitä ja näiden välisiä suhteita, kuten käsiteluokka kaupunginosa ja siihen kuuluva yksilö Kallio,jokaonosakaupunki-luokanyksilöänimeltä Helsinki.Käsitteitäjaniidenvälistensuhteidenmäärittelyverkkojakutsutaanontologioiksi. 1.2 Kansallinenhaaste:ontologiat Suomessa semanttisen webin ontologioita alettiin kehittää laajamittaisemmin MuseoSuomijärjestelmän 3 yhteydessäv.2002alussa(hyvönenetal.,2005).työssätarvittiinkäsitteistöjämm. museoesineille,materiaaleille,henkilöille,paikoillejatapahtumille.hankkeessakävihetiilmi,ettei käytettävissä ollut ontologioita ja ettei kansainvälisiä järjestelmiä voitu sellaisinaan hyödyntää suomen kielestä sekä kansallisista sisällöistä ja käytännöistä johtuen. Tästä havainnosta kypsyi ajatus siitä, että maamme tarvitsee avoimeen dataan perustuvansemanttisenwebin ontologisen sisältöinfrastruktuurin,jonkavaraanesimerkiksimuseosuomenkaltaisetjulkisetjayksityisetpalvelutvoitaisiinrakentaakustannustehokkaasti.työvoitaisiinperustaaerialoillasisällönkuvailua vartenkäytössäoleviinasia-jamuihinsanastoihin,kutentässätapauksessamuseoalanasiasanastoonmasa(leskinen,1998).näinontologiatolisivathetiyhteentoimivampiaaiemminindeksoitujentietokantojensisältöjenkanssa. KokemuksestaviisastuneenaSuomessakäynnistyiv.2003semanttisenwebintietoinfrastruktuurihankeFinnONTO 4 jokaolitiettävästiensimmäinenkansallisentasonhankemaailmassa.senyhtenäydintavoitteenaolierialojenydinsanastojenontologisoiminenjasiltaaminen(align,link)eri alatylittäväksiharmoniseksikokonaisuudeksi,jokaolisikaikkienkäytettävissäavoimenadatana erityistenontologiakirjastopalveluidenkautta.hankettatoteuttamaankoottiinaluksi14yrityksen jajulkisenorganisaationrahoittajakonsortio,jakehitystyökäynnistyitekesintuella.vuosienkuluessafinnonto-hankkeenkokokasvoisuurimmillaan39rahoittajaantehdenprojektistatiettävästi Tekesin historian laajimman hankkeen rahoittajakonsortion koolla mitattuna. FinnONTOhankettavetiAaltoyliopistonjaHelsinginyliopistonSemanttisenlaskennantutkimusryhmäSeCo 5 jonkasuojissamyöspääosatutkimustyöstäontehty. Webin muuttuminen vähitellen yhä semanttisemmaksi asettaa kansainvälisen haasteen standardointityölle.w3c-järjestönpiirissätehdyntyönkeskeisimpinätuloksinaonotettukäyttöönjoukko standardejaliittyen(meta)datan,sanastojenjaontologioidenesittämiseensekäpäättelyynjatie- 2http://dbpedia.org/ 3http://www.museosuomi.fi/ 4http://www.seco.tkk.fi/projects/finnonto/ 5http://www.seco.tkk.fi/ 6

donhakuun 6 NäistätärkeimmätovatResourceDescriptionFrameworkRDFjaRDFSchema 7 SimpleKnowledgeOrganizationSystemSKOS 8 (Isaac,Summers,2009),WebOntologyLanguageOWL 9 ja SPARQL-kyselykieli 10 Nämä standardit määrittelevät yleisiä, yhteentoimivuuden ja päättelyn kannaltakeskeisiätietomalleja, esitysmuotojajasemanttisiaperiaatteita,joitanoudattamallase- manttistawebiänykyisinrakennetaan.esimerkiksirdfschema-suosituksessamääritellylläsub- ClassOf-suhteellavoidaanilmaistakäsitettäyleisempikäsite,esimerkiksiettäleijonatovatkissaeläimiä. W3C:nstandarditeivätkuitenkaanotakantaaontologioidentaimetadataformaattienvarsinaiseen sisältöön, vaan ovat luonteeltaan sovellusriippumattomia ja perustuvat logiikkaan. Esimerkiksi subclassof-suhdemahdollistaaleijonanjakissaeläimenvälisensuhteenilmaisemisen,muttavarsinaiseeneläinlajientaksonomianmuodostamiseeneiotetakantaa.sisältö-jaontologiatyöonjätettykunkinalanasiantuntijatahojenjasovellustenkehittäjientehtäväksi.finnonto-hanketarttui tähänhaasteeseentavoitteenaankansallisen,monialaisenontologiainfrastruktuurinkehittäminen maahammejateknologianpilotointihyötysovelluksissa. 1.3 Ontologiainfrastruktuurinosat Ajatustasemanttisenwebinontologiainfrastruktuurista(Hyvönen,2008)voiverratatie-,sähkö-ja puhelinverkkojenmuodostamiinperinteisiininfrastruktuureihin.semanttistenkäsitteidenverkostoonluonnollisestiabstraktijanäkymätön,muttamahdollistaahiemanvastaavaantapaanyhteyksiäkuinvaikkapatie-taipuhelinverkko.visionaon,ettäjosfinnonto-infrastruktuurinpelisäännöillätuotettusisältöjulkaistaanverkossa,voidaansekytkeäjahyödyntääautomaattisestimuiden toimijoiden semanttisissa verkostoissa hieman vastaavaan tapaan, kuin uusi maantienpätkä tieverkostonosana.kantavaajatuson,ettäuudensisällönarvorikastuu ilmaiseksi infrastruktuurin avullaverkonmuustasisällöstä(vastaavastikuinuudentieosuudenarvosyntyysenkytkeytymisestämuihinteihin),jatoisaaltamuidenverkonjulkaisijoidensisältöjenarvorikastuuuudentiedonsirpaleenavulla(vastaavastikuinuusitieparantaamuidenteidenkeskinäistäsaavutettavuutta).sekäitseinfrastruktuuriettäsiinäjoolevatietovoidaanhyödyntäätoisissasovelluksissajopa sellaisenaan,mikäsäästäämerkittävästijärjestelmienkehityskustannuksia. FinnONTO-hankkeessa kehitetyn ratkaisumallin mukaan sisältöinfrastruktuurin keskeisiä komponenttejaovatontologiat,niidenhyödyntämistävartentarvittavatontologiapalvelutsekäontologiajärjestelmänjatkuvaylläpitoprosessi: Ontologiat Joukko toisiinsa sillattuja, kansalliseen käsitteistöön perustuvia ontologioita, joilla on siltauksia myös kansainvälisiin sanastoihin ja tietosisältöihin. Näin suomalaiset kulttuurisisällötsaadaankuvattuasemanttisestijakytkettyäsekätoisiinsaettäkansainvälisiinaineistoihinjapalveluihin,kutenlinkedopendata-pilvendatajoukkoihin 11 6http://www.w3.org/standards/semanticweb/ 7http://www.w3.org/standards/techs/rdf#w3c_all 8http://www.w3.org/standards/techs/skos#w3c_all 9http://www.w3.org/standards/techs/owl#w3c_all 10http://www.w3.org/standards/techs/sparql#w3c_all 11http://linkeddata.org/ 7

Ontologiapalvelut Ontologiakirjastopalveluiden ONKI 12 kautta ajantasaiset ontologiat voidaanottaakustannustehokkaastikäyttööneriorganisaatioissa(tuominenetal.,2009; Viljanenetal.,2009;Suominenetal.,2012).Tällainenpalvelukannattaatoteuttaakeskitetystiperusteluinakustannussäästöt,ajantasaisuusjayhteentoimivuus.KeskitettyjäONKIpalveluita on pilotoitu useita vuosia ONKI Living lab -ympäristössä 13 ja sen seurauksena esimerkiksikymmenienmuseoidenluettelointijärjestelmätonjokytkettyonkiin. Ontologiajärjestelmän ylläpitoprosessi Systemaattinen ja koordinoitu kansallinen organisaatiojamekanismi,jokakantaavastuunerialoillatarvittaviensanastojenyhteisöllisestä kehittämisestä jatkossa. Tässä tarvitaan keskitettyä koordinointia, mutta ontologiatyökannattaahajauttaatarpeenmukaansinne,missäsiihenonparasasiantuntemusjaresurssejakäytettävissä. KansallinenONKI-ontologiapalveluonollutverkossavuodesta2008jasilläonollutn.14000ihmiskäyttäjää kuukaudessa. Palvelun rajapintoja on rekisteröitynyt käyttämään yli 400 eri tahoa. Vuoden 2014 alusta ONKI-palvelun vakiintuneimmat ja käytetyimmät osat ja toiminnallisuudet siirtyivätkansalliskirjastonylläpitämäksikansalliseksipalveluksifinto-nimisenä 14 Ontologiainfrastruktuurissa tarvittavia ontologioita voidaan ryhmitellä seuraavasti (Hyvönen, 2013): 1) Yleiskäsiteontologiat Nämä ontologiat vastaavat käsitteistöltään karkeasti nykyisiä asiasanastoja,kutenysa 15 jamasa,ilmanvapaitaindeksoinnintermejä(esimerkiksipaikannimet).yleiskäsitteidenmääräonkohtuullisenpienijalasketaanyleensätuhansissatai kymmenissä tuhansissa. Esimerkiksi museoalan tiettävästi laajimmassa yleiskäsitesanastossa, Getty-säätiön Art and Architecture Thesauruksessa 16 on yli 51000 käsitettä ja 269000termiä,jossamukanaonhyvinkinyksityiskohtaisiakäsitteitä,esimerkiksierilaisia tuolityyppejä. 2) ToimijaontologiatToimijaontologiat(Kurki,Hyvönen,2009)ovathenkilö-jaorganisaatiorekistereitä,janemuistuttavatkirjastoissakäytettyjäns.auktoriteettitietokantoja.Toimijaontologian avulla samannimiset toimijat voidaan yksilöidä ja erottaa toisistaan eri tunnisteilla ja lisätietojen avulla, esimerkiksi henkilökaimat syntymävuoden ja -paikan avulla.toimijaontologioissavoiollaerittäinpaljonyksilöitä,muttaluokkarakenneonyksinkertainen ja perustuu yleiskäsiteontologioihin. Esimerkiksi taiteilijoihin keskittyvässä Getty-säätiönUnionListofArtisitNames(ULAN)-sanastossa 17 onn.120000toimijaa(kuten Akseli Gallen-Kallela), joilla on n. 293,000 erilaista nimeä, ja toimijoita on luokiteltu kansallisuudenjaammatinmukaan,joidenmäärälasketaansadoissa. 12http://www.onki.fi/ 13http://www.onki.fi/ 14http://finto.fi/ 15http://vesa.lib.helsinki.fi/ysa/ 16http://www.getty.edu/research/tools/vocabularies/aat/ 17http://www.getty.edu/research/tools/vocabularies/ulan/ 8

3) Paikkaontologiat Paikkaontologiat vastaavat kansallisten maanmittauslaitosten ylläpitämiä paikannimirekistereitä. Niiden avulla voidaan yksilöidä paikat, sijoittaa ne koordinaatistoonjatallentaapaikkoihinliittyviälisätietojakutenpaikkatyyppi(kylä,järvi,asemajne).paikkaontologioissavoiollaerittäinpaljonyksilöitä(miljoonia),muttaluokkarakenneontoimijaontologioidentapaanyksinkertainenjaperustuuyleiskäsitteisiin.esimerkiksi Getty-säätiön Thesaurus of Geographical Names (TGN) -sanastossa 18 on n. 912 000 historiallistapaikkaajageonames-sanastossa 19 ylimiljoonaanykypaikkaa. 4) Aikaontologiat Monella alalla keskeistä on ajan esittäminen. Lineaarisen kalenteriajan ohellavoidaanviitatamyöspäivänjavuodenkierronaikoihin(kevät,aamu)sekänimettyihin aika- ja tyylikausiin (esim. rauta-aika, valistuksen aika, art deco). Aikakäsitteitä ja -jaksojaeiolekovinsuuriamääriä.ajanesittämisenhaasteenaonmm.epätäsmällisen(historiallisen)aikatiedonesittäminenjatulkintasekäepäsäännöllistensyklistenaikojenesittäminen,kutenesimerkiksiaukioloajat. 5) TapahtumaontologiatTapahtumatliittävättoisiinsahenkilöitä,paikkoja,aikojajatoisia tapahtumia,jamahdollistavatkulttuuristenhistoriallistenilmiöidensekäkokoelmienprovenienssitietoonliittyvientietojenkuvaamisensemanttisestiyhteentoimivallatavalla.tästäjohtuenmm.cidoc-crm-järjestelmän 20 perustaksionvalittutiedonesittäminentapahtumina,eikäesimerkiksidublincoren 21 dokumenttiperustaistatietomallia.jottakaksisisältökohdetta voidaan yhdistää toisiinsa yhteisen tapahtuman kautta, pitää olla käytössä keinoviitatatapahtumiinyksikäsitteisestisamalla tavallakuinhenkilöihintaipaikkoihin. Tapahtumaontologiaan(Hyvönen,etal.,2012)tallennetaantähäntarvittavaviitetietohistoriallisistatapahtumista,kuten toinenmaailmansota tai Napoleoninkruunajaiset. 6) NimistöontologiatMonillatieteenaloillaonkäytössälaajojanimistöjä,joitavoidaanliittää yleisontologioihin. Tällaisia ovat esimerkiksi biologian eliöiden lajilistat, geologian mineraalit,lääketieteentauditjalääkeaineet,kielitieteenkieletyms.koskatällaisiayksityiskohtaisiakäsitteitäsaattaaollakäytössäsuuriamääräjaniidenkäyttöfokusoituuerikoisaloille,ontarkoituksenmukaistatoteuttaanimistöontologioitaerillisinäontologioina,jotkaon kuitenkin sillattu (ripustettu) yleisempään käsitteistöön. Esimerkiksi FinnONTOn YSOontologiankäsite linnut laveneekattavaksi,yli10000maailmanlintulajintaksonomiaksi AVIO-nimistöontologiankautta(Tuominenetal.,2013). TässäraportissakäsitelläänvainFinnONTOnyleiskäsiteontologioihinliittyvääontologiatyötä.Laajemmankuvanhankkeestajulkaisuineensaahelpoitenhankkeenkotisivun 22 kautta. 18http://www.getty.edu/research/tools/vocabularies/tgn/ 19http://www.geonames.org/ 20http://www.cidoc-crm.org/ 21http://dublicore.org/ 22http://www.seco.tkk.fi/projects/finnonto/ 9

2 ONTOLOGIATYÖNTAVOITTEET,PERIAATTEETJARAJOITTEET TässäluvussaesitelläänlyhyestiFinnONTOnontologisointityöntavoitteet,käytetytyleisetperiaatteet ja rajoitteet, joita on sovellettu KOKO-ontologiapilveen kuuluvien ontologioiden muuntamisessaasiasanastoista.nämäonsyytäarvioidajapitäämielessäontologioihintutustuttaessa,kun nytvastaalkuunsaatettualaajaatyötäjatketaankehittämällänykyisiäontologioita,kokonrakennettasekälisäämälläuusiaontologioitakoko-pilveen. 2.1 KOKOjoukkotoisiinsayhdistettyjäerialojenontologioita MaammekäytetyinasiasanastoKansalliskirjastonYSAsisälsiFinnONTO-hankkeenalussavuonna 2003 reilusti yli 20000 käsitettä eri aloilta. Sanaston laajentaminen oli edelleen tarpeen, mutta kaikkienerialojenasiantuntemuksensaaminensanastotyöhönolihaasteellista,vaikkakinylläpitoavartenoliolemassamonialainentyöryhmä.samaanaikaanmaassammeolikäytössäjakehitettiin lukuisia YSAn kanssa erityisesti yleisempien käsitteiden osalta päällekkäisiä sanastoja, mikä tuntuimonestitarpeettomaltamoninkertaiseltatyöltä.yhtenä lisähaasteenaoli, ettäsamannimisilläkäsitteilläsaattoiollaerisanastoissaerilainenmerkitys. YSA:nkehitystyönjatkuessaperinteiseentapaanFinnONTOtarttuinäihinsisällöllisiinjaorganisatorisiinhaasteisiinesittämälläkansallisestikoordinoituamallia,jossasanastotyövoitaisiinyhteistuumin jakaa eri alojen sanastojen kehittäjäryhmien kesken ja yhdistää tulokset lopulta yhdeksi laajaksi,erialatkattavaksiontologiaksi.visionmukaantämäedistäisimerkittävästierialojentietosisältöjensemanttistayhteentoimivuuttajasäästäisisamallakehityskustannuksiapäällekkäisen työnvähentyessä. TyöntuloksenasyntyiprototyyppiKOKO-ontologiasta,jokaoneri alojenontologioidenmuodostamalinkeddataontologiapilvi.senytimenäonysastakehitettyyso-ontologia,jokamuodostaa KOKOnyläontologian(upperontology,topontology)sisältäenmerkitysalaltaanlaajimmatkäsitehierarkian käsitteet. Erikoisalojen tarkempi käsitteistö ripustuu sitten YSOn eri haaroihin hierarkioitasyventäen.kuva2.1havainnollistaamallia.finnonto-hankkeenaikanaysonperustana olleeseenysaantehtiinkansalliskirjastontoimestatuhansiamuutoksia,joitaonsittenpäivitetty YSO-ontologiaanFinnONTOntutkijoidentoimesta. Kuva2.1.YhteisöllinenkokonaisontologiaKOKOkoostuuyläontologiastaYSOjasitätarkentavista alaontologioista,joillaonyhteisiäkäsitteitäysonjatoistenalaontologioidenkanssa.ontologioiden keskinäisetleikkauksetkuvassaovatvainviitteellisiäjatarkoitettuyleiskuvanhavainnollistukseksi. 10

KOKO-ontologiapilveenkuuluiv.2013lopullataulukossa2.1luetellut15ontologiaa,yhteensäyli 71000käsitettä,jauusiaontologioitaollaanottamassamukaan. Taulukko 2.1 Suomalaisista asiasanastoista tuotettuja FinnONTO-ontologioita, yhteensä n. 71 150käsitettä,jotkaonsillattu(align)toisiinsayläontologianYSOkauttaKOKO-ontologiapilveksi. Lähes jokainen KOKO-pilven ontologia perustuu suoraan maassamme jo aiemmin kehitettyyn asiasanastoon,jokaonontologisoitutässäraportissaesitettävällätavalla.kokonjakoperusteeri aloihinjasanastoihinonsiispuhtaastihistoriallinen.onilmeistä,etteialojentaityöryhmienjako taulukonmukaisestioleoptimaalinen,vaanesimerkiksimoniapienempiätoisiinsaliittyviäontologioitakannattaajatkossayhdistäälaajemmiksikokonaisuuksiksi.finnonto-hankkeenpuitteissa tähäneikuitenkaanhaluttuottaakantaavaanainoastaankootaerialojenväkiyhteen,jottaprosessityönorganisoimiseksisaataisiinkäyntiinensimmäisenprototyypinpohjalta. FinnONTOssaeimyöskäänkajottuKOKO-ontologioidenpäällekkäisyyksienpoistamiseen,jokajätettiin niin ikään sanastojen vastuutahojen asiaksi. Ontologiapilven analyysiä ja hallintaa varten kehitettiinkuitenkinerilaisiatyökaluja(pessalaetal.,2011;frosterusetal.,2013). KOKOnosaontologiatontätäkirjoitettaessaalustavastisillattuvainyhteiseenYSO-ontologiaanpareittainsiten,ettäluokkahierarkioidentoimivuusontarkistettuyliontologiarajojen(esimerkiksi JUHO+YSO, KAUNO+YSO jne.). Siltausta varten kullekin ontologiaparille luotiin oma Protégéontologiaeditorin 23 projekti, jossa oli mukana YSO ja siihen sillattava erillisontologia omissa nimiavaruuksissaan. Tällaiset yhdistelmät on julkaistu ONKI-palvelussa. Poikkeuksena kokeiltiin myössillatatoisiinsaläheisestiliittyväontologiakolmikkoyso,maojataoomanaprojektinaan. Silloinhaasteeksimuodostuivatkäsitteidenmonimutkaistuvatriippuvuudeteriontologioidenvälillä. 23http://protege.stanford.edu/ 11

tällaiset käsitteet ovat useimmiten merkitysalaltaan yleisiä (niitähän käytetään ainakin kahdenosaontologianalalla)ja käsitteenhallintakahdessaeriontologiassaonhankalampaakuinyhdessä. TavoitteenaolisitämänmukaanluodaKOKO-pilvi,jossa: Jatkokehityksen kannalta yhtenä keskeisenä kohteena tämänhetkisissä siltauksissa ovat sellaiset osaontologioidenvälisetyhteisetkäsitteet,jotkaeivätolemukanaysossa.näidenkäsitteidenhierarkiatontarkistettuerikseenosaontologioidenjaysonsuhteen,muttatarkistamattaon,onkoontologiarajanylimuodostuviinuusiinhierarkkisiinpolkuihinvoinutsyntyämissämäärinvirheitä. Työhypoteesinaonollut,ettätällaistenriippuvuuksieneliminointivoisitoimiajatkossametodologisena periaatteena KOKO-pilven jatkokehityksessä: osa-ontologioiden keskenään jakamat käsitteetkannattaisiluultavastisiirtääysoon,koska eiolisimoniperintää(multipleinheritance)eriosa-ontologioidenkautta osaontologioidenvälisetriippuvuudetperustuvatvainysonkauttajaettuihinyhteisiinkäsitteisiin(muitajaettujakäsitteitäeiolisi) Poikkeustapauksetvoitaisiinkäsitelläerikseen.TämäntyöhypoteesintestaamistaehdotammejatkossaKOKO-pilveäkehittävälleONKI-konsortiolle.Aivanselvääeiole,millaisiahaasteitaylläpidon minimointitällätavoinmahdollisestiaiheuttaaosaontologioidensisältötyölle. 2.2 Yhteentoimivuusolemassaoleviinasiasanastoihin Maassammeonvahvatraditiokäyttääsisältöjenkuvailussajatiedonhaussahyväksiasiasanastoja, jotenniidenavullaindeksoituatietoaonrunsaastisaatavilla.finnontossalähdettiinsiksihyödyntämäänjokäytössäoleviaasiasanastoja,jakoko-ontologiapilvenläheskaikki15ontologiaaperustuvatsuoraanolemassaoleviinasiasanastoihin.finnonto-hankkeentavoitteenaolivainmuokata niidenrakennettajakehittämisperiaatteitasemanttisenwebinaikakauttajasovelluksiavarten. Yhteentoimivuudentavoitetarkoittisitä,ettätyönaikanakaikkiaiemmatasiasanastojensanatpyrittiinsijoittamaanuuteenontologiseenstruktuuriintietoahävittämättä.Mikälityöolisialoitettu puhtaaltapöydältä,lopputulosnäyttäisivarmastierilaiselta,silläuusienperiaatteidensoveltaminentoisillaperiaatteillamuodostettuunsanastooneiainaolesuoraviivaistaeikävalitettavastiaina johdaluontevimpaanratkaisuun.samakonservatiivinenperiaateolikäytössämyösuusientermienlisäämisessä:ontologioitatäydennettiinlähtökohtaisestivainpakonedessä,kunsetuntuivälttämättömältä.tavoitteenaeisiisollutkehittääsanastojaeteenpäinsisällönosaltavaanrakenteistaa olemassa olevia sanastoja hyödyllisempään muotoon. Työn aikana sanastoihin on kuitenkin tullut paljon lisäyksiä erityisesti silloin, kun monimerkityksisiä sanoja on jouduttu erittelemään samansananerimerkitystenperusteella.esimerkiksiysassaonkäsite lapset,jokavoitarkoittaa mm.ikäluokkaataiperhesuhdettaaikuisetkinovatomienvanhempiensalapsia.mikälimerkitystenerotteluaeitavallataitoisellatietojärjestelmässätehdä,saattaaseesimerkiksisuositellaaikuisilletarpeettomastilastenkirjojaluettavaksitaikäyntiälastenlääkärillä. Ontologioihinonlisättymyösjonkinverranryhmitteleviäkäsitteitä,joidenavullahierarkioistaon pyritty tekemään ihmisen kannalta helpommin jäsennettäviä. Näitä käsitteitä ei ole tarkoitettu käytettäväksi sisällönkuvailussa. Luontevat jaottelut lisäävät ontologian käyttökelpoisuutta esimerkiksisovellustenkäyttöliittymissäkutennykyisinpaljonkäytetyissäfasettihakujärjestelmissä (faceted search). Työ on tältä osin kuitenkin vasta saatettu alkuunsa. Joillain käsitteillä voi olla kymmeniäalakäsitteitä,joitakannattaisijatkossaryhmitelläedelleenpienemmiksikokonaisuuk- 12

siksi.finnonto-hankkeessahaluttiinkuitenkintietoisestivältellätällaistasisältötyötäjapäätöksentekoa,jostavastuukuuluuluontevimminkutakinsanastoaylläpitävälleasiantuntijayhteisölle. Eräidenontologioidenosaltaprojektinkäytettävissäolialanasiantuntijajapäätettiinsamassayhteydessä laajentaa myös itse ontologiaa systemaattisesti. Esimerkiksi museoalan asiasanastoa MASAlaajennettiinn.tuhannellauudella,erityisestitekstiilialankäsitteelläMuseoalanontologiaksi MAO (Kettula, 2009). Tällaisissakin tapauksissa uusien käsitteiden yhteentoimivuus olemassa olevaan sanastoon voitiin säilyttää, koska uudet termit linkittyvät semanttisessa verkossa aiempiin. Tärkeää on, ettei vanhentuneita käsitteitä poisteta kokonaan ontologiasta, korkeintaan ne kannattaasiirtäärakenteessasyrjäänindeksointikäytöstä. Yksihaasteyhteentoimivuudenkannaltaontologisoinnissaon,ettäkunkäsitteetesitetäänuudessa struktuurissa,jokaviimekädessämääritteleeniidenmerkityksen,käsitteidenmerkityksetväistämättä muuttuvat jonkin verran ontologisoinnin seurauksena. Tätä ongelmaa yritettiin lieventää seuraavillaratkaisumalleilla: 1. LinkitysalkuperäisiinsanastoihinOntologiatontarvittaessalinkitettyalkuperäisiinsanastoihin, jotka on muunnettu suoraan RDF(S) tai SKOS-muotoon ja ovat myös saatavilla. Näin selviäätarvittaessatermienalkuperäinenmerkitys. 2. KoostekäsitteetMonimerkityksisetsanat,joidentaustallaolevatkäsitteetoneriteltyontologiassa,onesitettyontologiassamonestins.koostekäsitteinä.Näidenmerkitysonkuvattulinkittämällä ne käsitteisiin, joilla on yhteinen nimitys. Esimerkiksi YSAn lapset on edelleen YSOssa, vaikka sitä ei ole mahdollista sijoittaa luokkahierarkiaan. Sen sijaan tätä vastaava koostekäsite,jokavoijoskusollahyödyllinen,onkuvattuhierarkianulkopuolisenakäsitteenä. Näin esimerkiksi hakusanaa lapset käytettäessä voidaan tunnistaa sanan monimerkityksisyys, kysyä kenties käyttäjältä tarkennusta ja hakea tietokannasta sekä aiemmalla lapset - termillä että uudemmilla tarkemmilla merkityksillä (kuten lapset (perheenjäsenet) ) indeksoituatietoa. 2.3 Keskittyminenensinolennaisimpiinontologisiinperiaatteisiin FinnONTOssatyönallaolleetasiasanastotsisälsivätyli71000käsitettälaskemattamukaankäännöksiäerikielille(vrt.taulukko2.1).KoskaTekesinpääosinrahoittamassateknologialähtöisessä FinnONTO-tutkimushankkeessa oli käytettävissä vain vähän resursseja sisältötyöhön, päätettiin asiasanastojen ontologisoinnissa keskittyä metodologian ja teknisten ratkaisujen kehittämiseen, joitasittenpilotoitaisiinvalituissaasiasanastoissa.ensimmäiseksikohteeksiotettiinasiasanastoistasuurinjakäytetyinelikansalliskirjastonyleinensuomalainenasiasanastoysa,jokamuutettiin Yleiseksi Suomalaiseksi Ontologiaksi YSO. Jo aiemmin oli MuseoSuomi-hankkeessa kokeiltu MuseoalanasiasanastonMASAontologisointia.Sisältötyössäkeskityttiinvainolennaisimpienontologisten muunnosten tekoon, esimerkinomaiseen pilotointiin ja innostamaan sanastoja kehittäviä yhteisöjäjatkamaantyötä.työnjatkuvuudentakaamiseksiasiasanastonjaontologiankehittäminenonjatkuvaprosessivoitaisiinsuunnitelmanmukaanhyödyntääasiasanastojenkehittämiseen jokäytössäoleviaresurssejasiirtämälläniitäkehittämäänperinteistenasiasanastojensijastaontologisoitujaasiasanastoja. Suomessakäytettävienasiasanastojenrakenneonyksinkertainen,janiidenmuuttaminensyntaktisestijateknisestiontologiseenW3C:nstandardienmukaiseenmuotoononperiaatteessayksinkertaista:asiasanatvoidaanmuuttaaluokiksi(class)tainäidenyksilöiksi(instance,individual)ja asiasanojen väliset suhteen näitä yhdistäviksi ominaisuuksiksi (property). Lisäksi on sovittava käytännöistä,joillanäinsyntyvänsemanttisenverkonsolmutjakaareteliresurssit(resource)ni- 13

metäänyksikäsitteisestiuri-tunnisteilla(tailaajempaamerkistöäkäyttävilläiri-tunnisteilla).nykyiset W3C:n formaatit ontologioiden esittämiseen ovat RDF(S), OWL ja SKOS. Projektin alussa vuonna2003rdf(s)jaowleivätolleetvielälopullisestistandardoituja,janykyisinhyvinsuosittu,rdf(s)-jaowl-perustainenskos-formaattiolitäysintuntematon.formaatiksivalittiintuolloinenitenkäytetty,vuonna2004standardoiturdf(s)-muoto,jonkakäsittelemiseenolimyössaatavillalaajassakäytössäolevaontologiaeditori,stanfordinyliopistonprotégé.hankkeenloppuvaiheessakäyttöönotettiinmyösskos,kunsenstandardivalmistui. Varsinaisenahaasteenaontologisoinnissaonasiasanastonsemanttisenrakenteentäsmentäminen niin,ettäsiinätoteutuvatkoneellisessapäättelyssä,esimerkiksikyselynlaajentamisessa,tarvittavatperiaatteet.keskeisimmätontologisetmuutoksetjatarkistukset,joihintyössäkeskityttiin,olivat: 1. Luokkahierarkian täydentäminen. Ontologisen luokkahierarkian muodostaminen ja täydentäminenniin,ettäkaikillakäsitteillä(kaikkeinylinpoislukien)onainakinyksiyläkäsite. Tämä parantaa käsitteiden linkitettävyyttä ja mahdollistaa mm. päättelyä ja kyselynlaajentamista. 2. Yksilö-luokka-suhteiden transitiivisuuden tarkistaminen Keskeinen ontologioissa käytettyperiaateluokkahierarkianmuodostamisessaon,ettäkaikkienluokkienyksilöiden tuleeollasamanaikaisestikaikkienyläluokkiensayksilöitä.tämäominaisuusonhyödyllinen koneellisessa päättelyssä, esimerkiksi ominaisuuksien periytymisessä ja kyselyn laajentamisessa. 3. Monimerkityksisten asiasanojen taustalla olevien käsitteiden erottelu Asiasanastojenmonimerkityksistenkäsitteidenmerkitystenjakaminenerikäsitteiksitarpeenmukaan niin,ettänevoidaansijoittaaluokkahierarkiaan. 4. Laajempi/suppeampi termi -suhteiden tarkentaminen. Asiasanastoissa käytettyjen LT/ST-suhteiden tarkentaminen yläluokkasuhteiksi (rdfs:subclassof), osa-kokonaisuussuhteiksitaiassosiatiivisiksisuhteiksi.työssäkeskityttiinvainsubclassofsuhteidenkehittämiseen, mutta olemassa olevien suhteiden tarkennuksen seurauksena ontologioihin lisättiinmyösosa-kokonaisuus-jaassosiatiivisiasuhteita,jottaolemassaolevaatietoaeiolisihävitetty. Työeteniniin,ettäensinsanastomuutettiinautomaattisestiRDF(S)muotoon,jonkajälkeentarkistuksetjakorjauksettehtiinkäsityönäProtégé-editorilla. Seuraavassa kuvataan ja perustellaan hieman tarkemmin tässä työssä tehtyjä yleisiä valintoja ja käytettyjäperiaatteita. 2.4 Luokkahierarkiajasentäydentäminen Jottakaikillekäsitteilleolisimahdollistaosoittaaomayksilöllinenpaikkansahierarkiassa,järjestelmäänluotiinasiasanastoistapuuttuvapääluokkarakenne,jokayhdistääosittaintoisistaanirrallaanolevatkäsitteetyhdeksikokonaisuudeksi.TämärakennelisättiinYSO/Allsoon,jokamuodostaaKOKO-järjestelmänyläontologian(upperontology).TarpeenluokkarakenteenmuodostamiselleonmäärittänytYSA/Allärsinkäsitteistö,jokalaajanajaerierikoisalojenkäsitteitäkattavanaaineistonasopiihyvinhierarkiantoimivuudentestaamiseen. YSO:nluokkarakenteenylimmäntasonkolmijakomalli(kuva2.2)onsamakuinhiemanaiemmin julkaistussaalkuperäisessädolce-mallissa(gangemietal.,2002),muttaalemmillahierarkiantasoilla YSO/Allso muodostaa oman mallinsa, joka on muotoutunut käytännön ontologisointityön tarpeiden perusteella sijoitettaessa Yleisen suomalaisen asiasanaston käsitteitä yhtenäiseen hie- 14

rarkiaan.yso:neivarsinaisestitoteutadolce-mallia 24 muttaseonsaanutvaikutteitasiitämm. ylärakenteenkeskeisimpienluokkienosalta.käsitteille onpyrittyluomaanyhtenäinenhierarkia, jossaluokkienvälilläolisimahdollisimmanvähänpäällekkäisyyksiä(esim.kulttuurisetluonnontieteellisetmentaalisettaloudellisetjayhteiskunnallisetilmiöt),muttajossaluokatmuodostavatkattavankokonaisuudenmyöskullakinhierarkianalemmallatasollaniin,etteiniidenulkopuolellejäisiepätarkemminluokiteltujakäsitteitä(muutilmiöt). <muuttuva> <pysyvä> <abstrakti> prosessit tapahtumat toiminta <ajanjakso> <fyysinen kokonaisuus> <fyysinen objekti> ilmiöt <henkiset tuotokset> ominaisuudet järjestelmät paikka KUVA2.2.YSO:NPÄÄLUOKKAJAKOPERUSTUENALKUPERÄISENDOLCE-MALLIIN YlimmälläeritellyllätasollapääluokkarakenteenluokatjakautuvatalkuperäisessäDOLCE-mallissa luokkiinabstraktipysyväjamuuttuvanäitäylimmäntasonluokkiaeioletarkoitettukäytettäväksi aineistojen kuvailussa, sillä ne ovat liian laajoja tiedonkuvailussa ja -haussa käytettäviksi. Sama koskeemyösmuitapääluokkia,elleivätneolemukanamyösysa/allärsissa.kuvassaonerotettu kulmasulkeillanepääluokat,joitaeioletarkoitettukäytettäväksiasiasanoina. Vaikka pääluokkia ei ole tarkoitus käyttää asiasanoina, niillä on kuitenkin käyttöä erityisesti silloin, kun ohjataan indeksoijaa tai tiedonhakijaa ylhäältä alas (top-down) kohti merkitysalaltaan tarkempialuokkia.dolce-mallinontologisiintarkasteluihinperustuvakolmijakoeiolevälttämättäontologianloppukäyttäjänkannaltaluontevinvaihtoehto.pääluokkajaottelustalaadittiinsecotutkimusryhmässäsiksimyöhemminvuonna2013myöstoinen,käytönkannaltaluontevampiversio,jokaonesitettykuvassa2.3.siinäonviisipääluokkaa:prosessitfyysisetkäsitteetabstraktitkäsitteet sekä paikkoihin ja aikoihin liittyvät käsitteet. Aiemmalle pääluokalle abstrakti on annettu sen sisältöä paremmin kuvaava nimi suureet ja yksiköt Intuitiivisuutensa ohella tämä jaottelu myös heijastelee luvussa 1.3 esiteltyjä ontologioiden perustyyppejä tapahtumaontogiat (prosessit), paikkaontologiat (paikka) ja aikaontologiat (ajanjakso). Esimerkiksi erilaiset prosessiluokat voisivat muodostaa luokkahierarkian, jonka avulla on mahdollista luoda tapahtumaontologian ydinaineistonaoleviayksittäisiätapahtumia. 24http://www.loa.istc.cnr.it/old/DOLCE.html 15

Kuvan2.3jaottelupitääsisälläänsamatluokatkuinkuvan2.2versiojaonluonteeltaankosmeettinen,silläainoastaanylätasonryhmittelyäonmuutettukäyttäjänkannaltaintuitiivisempaanmuotoon.UuttarakennettaeiotettuSeCo-ryhmäntoimestakäyttöön,koskasamaanaikaanolijokäynnistynytontologioidensiirtäminenKansalliskirjastonylläpidettäviksialkuperäisenrakenteenpohjalta.UskoaksemmeYSO:nrakennettatullaanjatkossakehittämäänmerkittävästihierarkiankaikillatasoilla,monestijuurinykyistenjaotteluidentekemiseksiintuitiivisemmiksiloppukäyttäjille. Samassayhteydessäkannattaapohtiamyösylärakenteenjaotteluja. käsitteet prosessit -tapahtumat -toiminnat <fyysiset käsitteet> -<fyysinen kokonaisuus> -<fyysinen objekti> <abstraktit käsitteet> paikka -ilmiöt -henkiset tuotokset -järjestelmät -suureet ja yksiköt (entinen abstrakti) -ominaisuudet ajanjakso KUVA2.3.KÄYTTÄJÄLÄHTÖINENPÄÄLUOKKAJAKO Pääluokkarakenteen lisäksi ontologiaan on hierarkkisen rakenteen tarkentamiseksi lisätty myös apukäsitteitä, jotka voidaan nimetä yleis- tai ammatti/erikoiskielen käytössä olevalla sanalla tai sanaliitolla,muttajoitaeioletarvittuasiasanoituksessa,eikäsiksisisällytettyasiasanastoon.esimerkiksi asema (ilmiöt) -käsite on lisätty hierarkkiseksi yläkäsitteeksi muun muassa käsitteille ammattiasemasosiaalinenasemajayhteiskunnallinenasema 2.5 Luokkienjayksilöidenerottaminen Tutkimissamme suomalaisissa asiasanastossa eitehdä eroa luokkien ja yksilöiden välillä, vaikka mahdollisuus standardeissa periaatteessa on olemassa (Aichison et al., 2000). Esimerkiksi YSAn suhteessa Halleyn komeetta LT komeetat Halleynkomeettaonsamanlainenasiasanakuinkomeetatvaikkaontologisessamielessäkyseon yhdestäerityisestäkomeetta-yksilöstä.ysa-sanastosisältään.6000paikannimeä,joillaviitataan yksittäisiinpaikkoihinjajonkinverranmuitakinyksilökäsitteitä,kutenpähkinäsaarenrauha Yksilöidenjaluokkienvälisenerontekeminenontologiassavoiollahaastavaajatulkinnanvaraistakin,mutkistaarakenteita,jaerottelussatehdyttulkinnatsaattavathaitataontologianuudelleen käyttöä tilanteissa, joissa haluttaisiin tehdä toisenlainen luokka-yksilö-tulkinta. MuseoSuomihankkeenyhteydessäesimerkiksipohdittiin,olisivatkomateriaalitkutenterästaivillayksilöitävai luokkia. Jokainen museokokoelman villatakki on samaan luokkaan kuuluvaa materiaalia, mutta kuitenkaanmateriaalieiolefyysisestisamaavaanesimerkiksivillaonkerittyerieläimistä.erivillatakkienmateriaalitvoidaanjaitseasiassapitääkinpäättelykoneidenparhaitenhyödynnettävissä olevissaowl-profiileissakuvatavilla-luokanyksilöinä,mikäkuitenkintuntuutarpeettomanmonimutkaiseltaverrattunasiihen,ettämateriaalikentänarvonaolisivainviittausvilla-luokkaansamaantapaankuinperinteisiäasiasanojakäytettäessä. 16

Erotteluntekemisestäonkinolemassa erilaisiakäsityksiäjakäytäntöjä 25 Esimerkiksinykyisessä SKOS-standardissa kaikki asiasanat muutetaan yleisen käsiteluokan (Concept tai GroupConcept) yksilöiksi,eikämuodostetaomialuokkiakutenvillardf(s)jaerityisestiowl-standardeissataas luokkienjayksilöidenkäyttöpäättelyssäonkeskeistäjahyödyllistä. Koskakaikkiintilanteisiinsopivaapatenttiratkaisuaei ole,finnonto-projektinalussapäätettiin jättää päätös luokkien ja yksilöiden erottamisesta ja käsittelystä sovelluksissa tehtäväksi vähäisimmänsitoutumisenjajoustavuudenperiaatteidenmukaisesti(leastcommitment).niinpäyksilöluokka-jakoa ei ole tehty, vaan esimerkiksi Halleyn komeetta esitettiin luokkana samalla tavalla kuinkomeetatajatuksenakuitenkinon,että(yksilö)luokastahalleynkomeettavoidaantarvittaessa luoda uniikki yksilö. Näin ontologiaa voidaan tulkita tarpeen mukaan joko luokkahierarkian kautta tai vastaavaan tapaan kuin SKOS-standardissa asiasanaston sanojen rakenteen käyttökelpoisessa standardimuodossa esittävänä RDF-verkkona. Tätä voidaan sitten tulkita koneellisesti käyttötilanteenmukaan. YSOn osalta huomattava muutos YSAan nähden on kuitenkin se, että YSOon ei otettu mukaan YSAssa olevia paikannimiä. Syynä on se, että paikkaontologiat ovat luonteeltaan hyvin erilaisia kuinyleiskäsiteontologiatjaniidenkehittämistävartenfinnontossaoliomatutkimushaaransa. Sentuloksenajulkaistiinmm.Maanmittauslaitoksenn.800000suomalaistapaikkaasisältäväPaikannimirekisteri ensi kertaa RDF-muodossa ja otettiin koekäyttöön erillisenä ONKI Geo -palveluna 26 (Lindroos, 2008). Historiallisten paikkojen osalta valmistui kuntahistorian kuvaava SuomalainenajallinenpaikkaontologiaSAPO(Kauppinen,Hyvönen,2007;Hyvönen etal.,2011), jokajulkaistiinonki-palvelussa. 2.6 Laajempi/suppeampitermi-suhteidentarkentaminen Semanttisen webin ontologioiden selkärankana on mahdollisimman hyvin määritelty luokkahierarkia.ideanaon,ettäluokka(class)kuten peili onkuvaussenyksilöidenyhteisistäominaisuuksista ja edustaa ilmentymiään eli yksilöitään (instance, individual), kuten vaikkapa museon kokoelmassaolevaatiettyäpeiliä.työnalleotettujenasiasanastojensanatviittaavatpääosinyleiskäsitteisiin,joilletällainenluokkatulkintaonpääosinluontevajailmeneekinsuomessakäytetyissä monikollisissatermimuodoissa.esimerkiksiysan oopperat viittaayksittäisiinoopperateoksiin. Yksikössäoleviensanojenosaltatilanneeioleniinselkeä.EsimerkiksiYSAssaonmyössana ooppera,jokatarkoittaaoopperaataidelajinajasaattaavaikuttaataidelajiluokanyksilöltä.myöställaisetkäsitteetvoidaankuitenkintulkitaluokkina,joillakentiesonkuitenkinvainyksiilmentymä. Asiasanastojentermejäjaniidensuhteitaalunperinluotaessaeiolevarsinaisestiajateltutietojenkäsittelytieteenpiirissä yleisesti käytettäviä luokkia ja yksilöitä ja näiden välisiäsuhteita. LT/ST suhde voi tarkoittaa yksilö-luokka-suhdetta, alaluokka-suhdetta ja lisäksi myös mm. osakokonaisuus-suhdetta.esimerkiksiysansuhteessa komeetat LT aurinkokunta eiväitetä, eikäoletarkoituskaanväittää,komeettojenolevanaurinkokuntia(luokkasuhde),vaan ettäkomeetatesiintyvätaurinkokunnassa.asiasanastonajatuksenaon,ettätiedonhaussakomee- toistakiinnostuneenkannattaisikentiesyrittäähakeamyösasiasanallaaurinkokunnatjaaurinko- 25http://www.w3.org/TR/swbp-classes-as-values/ 26http://www.seco.tkk.fi/services/onkipaikka/ 17

kunnistakiinnostuneenkentieskomeetallahakuatarkentaen.asiasanastojentarkoituksenaonlähinnäohjataihmistätoisaaltatiedonindeksoinnissajatoisaaltatiedonhaussaindeksoinnissakäytettyihinhakusanoihin. Sen sijaan seuraavassa esimerkiksi LT-suhde tarkoittaa yläluokka-suhdetta eikä osakokonaisuussuhdetta: peilit LT huonekalut Tiedonhaun haasteena on tulkita samalla tavalla esitetty mutta eri asiaa tarkoittava rakenne oikein,kunsenavullatehdäänpäättelyä.finnontossaongelmaratkaistiintarkentamallalt-suhteet joko luokkasuhteiksi (geneerisyys, yleisin tapaus), osa-kokonaisuussuhteiksi (partitiivisuus) tai assosiatiivisiksisuhteiksi,jotkamuodostavatasiasanastoissajaontologioissakäytettävienmerkityssuhteidenkolmepääluokkaa. meikkipeilit LT peilit peilit LT huonekalut 2.7 Yksilö-luokka-suhteidentransitiivisuudentarkistaminen Keskeinenhaasteluokkahierarkiaamuodostettaessaontaatase,ettäalaluokkienyksilötovatpaitsiomanluokkansaniinmyöstransitiivisestikaikkienyläluokkiensayksilöitä 27 Tarkastellaanedellistäpeili-esimerkkiälisäämälläsiihenuusiyläkäsitesuhde: Tämänmukaanmeikkipeilitovatpeilejäjatoisaaltapeilitovathuonekaluja,mikäkuulostaajärkevältä,muttatransitiivisuusmolempiensuhteidenylitseeitoimi,sillämeikkipeiliteivätolehuonekaluja.JosLT-suhteetmuutetaanmekaanisestiluokkasuhteiksi(rdfs:subclassOf)seurauksenaon, ettähaettaessahuonekalujahakutulokseenvoitullavirheellisestimukaanmeikkipeilejä. Transitiivisuuden tarkistaminen on erityisen haastavaa KOKO-ontologiapilvessä, kun luokkahierarkiatkulkevateriontologioidenkautta.tässäeiriitäsamanoloistenkäsitteidenmekaaninen parittainen siltaaminen owl:sameas-ominaisuuksilla, vaan syytä on tarkastella myös käsitteiden laajempaahierarkiakontekstiayhdistettävissäontologioissa,sillätransitiivisuudenpitäätoimiayli ontologiarajojen. 2.8 Monimerkityksistensanojentaustallaolevienkäsitteidenerottelu Luokkahierarkianmuodostaminenedellähahmotetullatavallaonkeskeisinontologianrakentamisessakäytettäväsemanttinenperiaate.Olemassaolevaaasiasanastoatähänmuotoonmuutettaessayhtenähaasteenaovatsanastoissaesiintyvätmonimerkityksisetsanat,joitaeiolemonimerkityksisyytensäjohdostamahdollistasijoittaahierarkiaanmihinkäänpaikkaan. Ratkaisumallejaongelmaankaksi: 1. Moniperintä.Käsitteellevoidaanantaauseampiayläluokkiaerimerkityksiinliittyen.Esimerkiksivalotusmittarivoisiollasamanaikaisestivalokuvausvälinejamittari.Moniperintääeiontologioissakuitenkaansuosita,koskaseeivarsinaisestiselkeytämonimerkityksiä käsitteitä ja johtaa vaikeasti ylläpidettäviin asyklisiin hierarkioihin yksinkertaisempien 27Tietotekniikassatehdääntarkkaeroyksilöiden janiidenluokkienvälillä.terminologiantermistössäon alakäsite/yläkäsitejayksilökäsite/yleiskäsite,muttasekäyksilö-ettäyleiskäsitteetvoivatollaalakäsitteitä. 18

puumaisten hierarkioiden sijaan. Yleisenä pyrkimyksenä alalla on moniperinnän minimointi. 2. MonimerkityksistensanojentaustallaolevienkäsitteidenerotteluMerkitystenerotteluonvallallaolevaperusratkaisuontologioissa.Käsitteeterotellaanjapyritäänsijoittamaan mahdollisimman yksinkertaisiin puumaisiin rakenteisiin, joita sitten voidaan semanttisestirikastaapäättelynavulla.haasteenatässälähestymistavassaon,ettäkäsitteidenmääräkasvaa,eikäoleainaselväämitenpitkällemerkitystenjaossaonsyytämennä. Esimerkiksilukemattomiaesineitävoidaankäyttääleikkikaluina(leikkiautot,leikkipyssyt, leikkiastiastot, leikkihatut jne.). Pitäisikö näille kaikille luoda omat luokkansa? Ontologisessatyössäongelmanratkaisemiseenonmuitakinmahdollisuuksiakuinluokkarakenteen paisuttaminen.esimerkiksiporkkanankäsitettäeitarvitsejakaakahtiaporkkanaksikasvinajaporkkanaksiruoka-aineena,vaankäyttöruoka-aineenavoidaanilmaistaassosiatiivisellasuhteella.ontologioidensuunnitteluonsidoksissaniidenkäyttötapaanmetatietomalleissa,jaongelmaavoidaanlähestyämyössisällönkuvailunkautta.esimerkiksiesineenkuvailutietoihin voidaan liittää tieto sen käytöstä leikkikaluna. Tämän takia kovin pitkälle meneviäjaottelujaontologioissaonsyytävälttää,ts.vähäisensitoutumisenperiaateonhyväpitäämielessätässäkin. PalammekäsitteidenjakamisenproblematiikkaantarkemminYSOnesittelynyhteydessä. 2.9 Standardiformaatinvalinta:RDF(S),OWLjaSKOS FinnONTO-ontologiat on kehitetty Protégé-editorin tukemassa RDF(S)-(ja sittemmin OWL-) formaatissa. Kun W3C:n SKOS-standardi projektin kuluessa kehitettiin ja valmistui, FinnONTOhankkeessa kehitettiin automaattinen muunnin RDF/OWL-muodon ja SKOS-muodon välille sekä muodon tarkistin ja korjain (Skosify-työkalu) (Suominen, Hyvönen, 2012; Suominen, Mader, 2013).KansalliskirjastonFinto-palvelussasiirryttiintukemaanvainSKOS-standardinmukaistarakennetta.SKOS-standardiontarkoitettuyksinkertaistensanastojenrakenteenkuvaamiseenjase perustuujaintegroituuyleiskäyttöisempiinrdf(s)-jaowl-standardeihin. 2.10 Käsitteidennimeäminen Sanastojenkehittäjienkeskuudessaon erilaisiakäsityksiäsiitä,pitäisiköasiasanojenollamonikkomuodossa, kuten YSAssa on pääsääntöisesti tehty, vai yksikkömuotoisia. Suomalaisissa asiasanastoissakäytetäänmonikkoja,muttaesimerkiksilääketieteensanastoissa,terminologisissa sanastoissajasemanttisenwebinontologioissakäytetäänpääasiassayksiköllisiämuotoja.kokoontologiassatähänkäytäntööneiolepuututtu,vaanonmukauduttualkuperäisensanastonkäytäntöön. Käytäntöjen harmonisoimiseksi sanastoon voidaan varsin helposti generoida tarpeen mukaanyksikkö-taimonikkomuotoisianimikkeitä,muttatällöinon huomioitavayksikkö-monikkojaollamahdollisestitehtysemanttinenmerkitystenerottelu. Omakäsityksemmemukaankannattaisijatkossasiirtyäkäyttämäänyksiköllisiämuotojakansainvälisen yleisimmän käytännön mukaisesti. Tällöin esimerkiksi YSAn termit ooppera ja oopperat voidaanesittäästandardinmukaisestitarkenteen(qualifier)avullaesimerkiksimuodossaooppera (taidemuotona)jaooppera(teoksena)tarkenteidenkäyttönimikkeissäonhyväkäytäntö,koskase kertooloppukäyttäjälleselkeämminkäsitteenmerkityksen. Tavoitteellisena käytäntönä KOKO-ontologiassa on, että sen käsitteidennimikkeet ovat kielikohtaisesti yksikäsitteisiä, ts. missään sen osaontologioissa ei käytetä samaa nimeä samalla kielellä kahdesta eri käsitteestä. Tämä vaatimus tulee suoraan yksittäisten asiasanastojen käytännöstä, mutta laajennetaan KOKOssa koskemaan myös ontologioiden yhdistelmää. Merkitykset suositte- 19