Verkkopohjaisten ontologiaeditorien vertailu

Samankaltaiset tiedostot
Finton jatko vuosina

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

ONKI- projektin ontologiaeditorien vertailuraportti

Erikoisontologioiden kuulumisia. Finto-projekti: Laajennetun projektiryhmän kokous Tuomas Palonen, tietoasiantuntija

Skosmos 0.6 esittely. Osma Suominen ONKI-projektin laajennetun projektiryhmän kokous

Finto-tilannekatsaus. Asiantuntijaseminaari KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Yhteentoimivuusvälineistö: Sanastoeditorin esittelytilaisuus klo Väestörekisterikeskus, Lintulahdenkuja 4, Helsinki

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

YHTEISET TIEDON HALLINNAN SANASTOPALVELUT tutkimus- ja kehittämishankkeen toimintasuunnitelma 2017

Taustaa. FinnONTO -- Suomalaiset semanttisen webin ontologiat ( )

Taustamuistio 1 (6) Yhteinen tiedon hallinta -hanke. Taustatietoa Sanaston metatietomallin määrittely -työpajan keskusteluun

Finto-projektin tilannekatsaus

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

Finto-tilannekatsaus. Osma Suominen Kansalliskirjaston asiantuntijaseminaari

Finto-palvelu ja ontologioiden kehitystyön tuki Suomessa

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

Projektiraportti. SPT2014 Selvitysprojekti projektihallinnan työkaluista. Versio 1.0. apj2014 Projektiraportti 1 (9)

Testausraportti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Päällekkäisyys ja AFO-ontologia Tulevaisuus? YSO + AFO KOKO?

YHTEISET TIEDON HALLINNAN SANASTOPALVELUT tutkimus- ja kehittämishankkeen toimintasuunnitelma 2016

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

Suvi Remes Miika Alonen Petri Mustajoki Totti Tuhkanen

Miten ja miksi asiasanastoista kehitetään ontologioita

Vianovan Tuotteet Roadmap Ville Herva Novapoint Käyttäjäpäivät, Vantaa

Yhteisrakentamisverkoston uutiskirje 02/2018

Yleinen suomalainen ontologia YSO

Korkeakoulujen kansallinen julkaisuportaali. OKM:n bibliometriikkaseminaari, Jyrki Ilva

Sähköistä asiointia graafisen alan yritysverkostossa - projektin yhteenveto - Ismo Heikkilä, VTT

Suomen virtuaaliammattikorkeakoulu Teknillinen mekaniikka monivalinta aihio > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

VirtuaaliAMK Potilaan polku tietojärjestelmässä v.2ver8 > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Keskustelusivusto. Suunnitteludokumentti

Avoin data Avoin kirjasto Kuvailupäivät

Web-sisällönhallintajärjestelmät. Sisältö. Mitä on web-sisällönhallinta?

Kansalliset kehittämishankkeet: Etenemissuunnitelmat

Sosiaalinen media. Sosiaalinen media? Yhteisöllisen työskentelyn kolmio

Finto palveluiden toteuttamisen alustana

Osoitteena O365. Toimisto ja yhteydet pilvestä

Suomen virtuaaliammattikorkeakoulu Teknillinen mekanikka fem tutorials > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Finton hyödyntäminen ministeriöiden palveluissa. erityisasiantuntija Pilkkuniina Brandt, VNK

Suomen virtuaaliammattikorkeakoulu Teknillinen mekaniikka templateaihio > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Julkisen rajapinnan testausohje Swaggerin kautta

Suomen virtuaaliammattikorkeakoulu VPN peli > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Pysyvä ja muuttuva A:sta O:hon sisällönkuvailussa. Mirja Anttila Kansalliskirjasto

Project-TOP QUALITY GATE

Nelli-portaali ja verkko-oppimisympäristöt

Liite 1: KualiKSB skenaariot ja PoC tulokset. 1. Palvelun kehittäjän näkökulma. KualiKSB. Sivu 1. Tilanne Vaatimus Ongelma jos vaatimus ei toteudu

Finna ja ontologiat tms.

Julkaisutiedot läpinäkyviksi: julkaisuportaali. Tampereen teknillinen yliopisto, Jyrki Ilva

Taloustieteet ja YSA. Eeva Kärki Kansalliskirjasto

Suomen virtuaaliammattikorkeakoulu Vetokoe v.0.5 > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Suomen virtuaaliammattikorkeakoulu XML_mark_up_language > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Vastauksia palvelukyselyn palautteisiin

Korkeakoulujen prosessipalvelin: mallintajan palvelinohje Versio 0.2

ONKI3 vs. ONKI Light. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Web-sisällönhallintajärjestelmät

Innokylän verkkopalvelun konsepti

Tiedostonhallinta. Yleistä

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Diakonia ammattikorkeakoulu Päihdetyön historia > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Opponointitestaus VYM -> LiKe

Ontologioiden yhdistäminen YSO:oon

NTG CMS. Julkaisujärjestelm. rjestelmä

Visma Fivaldi -käsikirja Tehtävienhallinta- ohje käyttäjälle

Suomen virtuaaliammattikorkeakoulu The XML Dokuments > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Edustoren käyttökoulutus. Vesa Linnanmäki Kuntien Tiera Oy

Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset

Ohjelmistotuotteen hallinnasta

KYMENLAAKSON AMMATTIKORKEAKOULU Tietotekniikan koulutusohjelma / Tietoverkkotekniikka. Joni Korjala APACHE WWW-PALVELIN Seminaarityö 2012

Virtuaaliammattikorkeakoulu Seksuaaliterveyden edistäminen v. 0.9 > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Suomen virtuaaliammattikorkeakoulu Boolen operaattorit v. 0.5 > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Semanttinen Finlex Arttu Oksanen ( )

KY TOMMI: toimintajärjestelmä energia-alalle. Energiapäivät, Tampere ( )

Autentikoivan lähtevän postin palvelimen asetukset

Sanastotyö THL:SSÄ Sanastotyö THL:ssä / Outi Meriläinen 1

EDC TYÖMAAJÄRJESTELMÄ

SOSIAALIHUOLLON ASIAKASTIETOMALLI. Erja Ailio Kehittämispäällikkö

- kaikki tekstieditorit tulee saada suuremmiksi, jotta erityisesti pitkien dokumenttien ja taulukkojen työstäminen on helpompaa

NETTISIVUOHJE. MUITA OHJEITA käyttäjän lisääminen, mediakirjasto, sähköpostien lisääminen

Vuoden 2012 julkaisudata Juulissa

VESAsta Fintoon ja YSAsta YSOon: Mikä muuttuu ja miksi?

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

SPARQL-workshop. Sini Pessala Kirjastoverkkopäivät KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Kuopio Testausraportti Asiakkaat-osakokonaisuus

Tehokasta palkanlaskentaa

Mikä on WordPress? itse ylläpidettävä (self-hosted) WordPress.com: ilmainen 3. osapuolen ylläpitämä pilvipalvelu (Cloud-hosted)

Sikarodut > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Maiju Mykkänen Susanna Sällinen

WEIKKA. Asennus opas. Hannu-Matti Lemettinen HML Productions

Accelerating Your Success. PlanMill 16. Uusi PlanMill 16 käyttöliittymä Infopaketti

Suomen virtuaaliammattikorkeakoulu Kestävää kehitystä etsimässä v. 0.9 > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Informaatiotekniikan kehitysyksikkö

KDK-ajankohtaispäivä museoille

Transkriptio:

Verkkopohjaisten ontologiaeditorien vertailu 29.4.2016 Tuomas Palonen, Osma Suominen, Sini Pessala Vertailusta ja editoreista Finto-projekti teki 2013 vertailuraportin ontologiaeditoreista. Päädyimme vertailun jälkeen käyttämään TopBraid Composer Standard Edition -editoria, joka on maksullinen ja koneelle asennettava ontologiatyökalu. Käynnistimme vuonna 2015 editorien vertailun uudestaan arvioidaksemme tuoreempia editoreja. Vertailua jatkettiin vuoteen 2016 yhtäältä Finto-projektin henkilöstömuutosten, toisaalta editorien versiopäivityksen vuoksi. Vertailu keskittyi koneelle asennettavien editorien sijaan selainpohjaisiin, verkossa käytettäviin editoreihin. Näissä useampi käyttäjä pystyy yhtäaikaisesti muokkaamaan samaa ontologiatiedostoa verkkoympäristössä, jolloin muokattava ontologia on kaikille päivittäjille jatkuvasti ajantasainen ja identtinen. Finto-projektilla on kasvavaa kiinnostusta tällaisen editorin käyttöön: työskentely kollektiivisesti, yhteisessä ja avoimessa editointiympäristössä helpottaisi Finto-yhteistyöverkoston ja KOKO-ontologian parissa tehtävää työtä, joka ulottuu myös Kansalliskirjaston ulkopuolelle. Vertailuun valittiin seuraavat editorit: THL-editori, VocBench ja PoolParty. THL-editori on Terveyden ja hyvinvoinnin laitoksen (THL) tekemä avoimen lähdekoodin editori heidän omien sanastojensa ja luokitustensa ylläpitoon. VocBench on samoin avoimeen lähdekoodiin perustuva, alunperin FAO:n ylläpitämän Agrovoc-tesauruksen muokkaamiseen kehitetty editori, joka oli mukana myös 2013 vertailussa. PoolParty on itävaltalaisen Semantic Web Companyn editori, joka oli niin ikään mukana 2013 vertailussa, jossa se todettiin varsin käyttökelpoiseksi joskin kalliiksi. Tässä raportissa ei oteta kantaa kustannuskysymyksiin; PoolParty tarjoaa joka tapauksessa mahdollisuuden ilmaisten ja kaupallisten editorien vertailuun laadun, käytettävyyden ynnä muiden ominaisuuksien suhteen. Mikään vertailuun valituista editoreista ei taipunut testikäyttöön täysin ongelmitta. Jotta testattavana ollut YSO saatiin editorin käyttöön, oli ontologian dataa muokattava editorille sopivaksi ja editorien ylläpitoa konsultoitava. Tämä ei tarkoita, että editorien käyttö edellyttäisi jatkuvaa teknistä resurssia tai yhteyttä editorin ylläpitoon, mutta testeistä opimme, että editorin pystytysvaiheessa kannattaa varata aikaa teknisille haasteille. Yleishuomiona mainittakoon, että kumpikaan ilmaisista editoreista ei vielä tässä vaiheessa täytä niitä kriteerejä, joiden perusteella sitä voisi pitää suositeltavana työkaluna Fintoyhteistyöverkoston piirissä tapahtuvaan ontologioiden muokkaamiseen. Eikä PoolPartykaan ole toiminnallisuudeltaan puutteeton. Erikoisontologioiden kannalta olennaista ontologioiden välistä linkittämistä päästiin testaamaan kunnolla vain PoolPartyllä. Kaikkia editoreja kuitenkin

päivitetään säännöllisesti ja uusi selainpohjaisten editorien vertailu on varmasti pian ajankohtainen. THL-editori THL-editori on varsin pelkistetty, perustoimintoihin rajautuva sanastotyökalu. Sen vahvuus muihin editoreihin nähden on nopeus: esim. hakutoiminto on poikkeuksellisen nopea. Käyttöliittymä on yksinkertainen ja editorissa on keskitytty vain kaikkein keskeisimpiin sanastotyössä tarvittaviin toimintoihin. Yksinkertaisuuden kääntöpuolena on YSOn ja KOKOn kaltaisten ontologioiden ylläpidon kannalta se, että joitakin olennaisia ominaisuuksia puuttuu. THL-editori ei tue yhdistelmäontologioiden editointia: editori ei kerro, mihin ontologiaan mikäkin käsite liittyy eikä se huomioi käsitteiden välistä ekvivalenssia. THL-editorin nykyversiossa tietomalli ei ole kiinteä, vaan sen pystyy määrittelemään uudelleen. Kokeilimme THL-editoria kuitenkin vain SKOStietomallin mukaisena, jolloin se ei sellaisenaan tue erilaisia käsitetyyppejä, joita esim. YSOssa on useita. SPARQL-kyselykielen käyttö ei onnistu editorissa. Käyttöliittymässä on lisäksi muutama käytännön työtä häiritsevä seikka: haku tapahtuu eri näkymässä kuin käsitteen tietojen selailu, samoin käsitteen muokkaus. THL-editorin puutteet ovat YSO- ja KOKO-työn kannalta kriittisiä. Editorissa on kuitenkin potentiaalia. Mikäli editoria jatkokehitetään, kriittisten ominaisuuksien sisällyttäminen editoriin ei välttämättä olisi erityisen iso urakka. Vaikka puutteita siis löytyy, kriittisten puutteiden korjaaminen tekisi editorista käyttökelpoisen ja toiminnallisuudeltaan riittävän Finto-palvelun ja - yhteistyöverkoston ontologiatyöhön. Kuva 1. THL-editori

VocBench Vuoden 2013 vertailussa todettiin VocBenchistä seuraavaa: Vaikka editorin perustoiminnallisuus on kunnossa, ei VocBench ole web--pohjaisten editorien suositeltavimmasta päästä. VocBenchistä heikkouksiksi todettiin mm. hitaus ja se, että käsitteen ominaisuudet näkyivät hankalasti eri välilehdiltä. Editoria pidettiin kuitenkin kiinnostavana ja sen jatkokehitystä seuraamisen arvoisena. Nyt testattiin VocBenchin tuoretta versiota 2.3. VocBench on THL-editoria yleiskäyttöisempi ja monipuolisempi. Siitä löytyy mm. SPARQL-tuki, joka THL-editorista puuttuu. VocBench tarjoaa monen käyttäjän yhteistyöhön suunnitellun työympäristön, jossa voi luoda eri käyttäjäryhmiä ja antaa käyttäjille erilaisia muokkausoikeuksia. Muiden käyttäjien muokkauksia on helppo seurata ja niitä voi myös kommentoida, hyväksyä ja hylätä. Yleisenä haasteena testeissä oli VocBenchin hitaus, mikä hankaloitti testaamista monella tapaa. Hitaus liittyi niin hakuun kuin käsitteen muokkaukseenkin. Teoriassa VocBench näytti kuitenkin ominaisuuksiltaan monipuoliselta ja merkittävänä kehitysaskeleena on sanastojen välisen käsitteiden linkittämisen mahdollisuus. Linkittämisen toimivuutta ei kuitenkaan päästy testeissä kunnolla kokeilemaan editorin hitauden ja epävakauden vuoksi. Toiseen sanastoon linkittäminen tapahtuu erilaisilla match-suhteilla. VocBenchissä ei toisaalta ole mahdollista valita yläkäsitettä toisesta sanastosta, mikä on erikoisontologioiden kannalta ongelmallista. Aiemman version kanssa havaittu epäkäytännöllisyys vaivasi edelleen: käsitteen kaikkia tietoja ei ole mahdollista nähdä kerralla, vaan ne on kaivettava eri välilehdistä. Lisäksi esim. yläkäsitteen lisääminen on monimutkaista ja vaatii useita hiirenklikkauksia. VocBench tukee eri käsitetyyppejä, mutta tätä ei YSOn osalta testattu koska eri käsitetyyppejä ei ole erotettu YSOn SKOS-versiossa. Kuva 2. Vocbench 2.3.

VocBenchistä on vastikään julkaistu versiot 2.4 ja 2.4.1, joissa hitausongelmiin on tehty jonkin verran korjauksia. Nämä versiot eivät kuitenkaan ehtineet mukaan tähän testikierrokseen. Jatkossa VocBenchin kehitys suuntautuu versioon 3, jossa käyttöliittymä uudistuu kokonaan ja mm. erillisistä välilehdistä ollaan tämän hetken tietojen mukaan luopumassa. PoolParty PoolParty-editori edustaa vertailussa kaupallista vaihtoehtoa. Se valittiin mukaan vertailuun erityisesti kahdesta syystä: a) projektin 2013 tehdyssä vertailussa PoolParty todettiin varsin laadukkaaksi editoriksi ja b) se tarjoaa vertailumahdollisuuden ilmaisten ja kaupallisten editorien välille. Lähtökohtaisesti Poolparty on tarkoitettu hieman eri tyyppisten resurssien editointiin kuin mitä Finto-palvelussa julkaistut sanastot edustavat. Testausvaiheessa oltiinkin yhteydessä valmistajaan, joka avusti kiitettävästi. PoolParty on todettiin testin myötä helppokäyttöiseksi, nopeaksi ja monipuoliseksi työkaluksi. Siitä löytyy suurin piirtein samat toiminnallisuudet kuin VocBenchistä, mutta se on helppokäyttöisempi ja huomattavasti vakaampi. Käsitteiden muokkaus on helppoa: mm. eri kielisille termeille on omat kenttänsä. Haku toimi nopeasti, mutta hakutulosten järjestyksessä on vielä kehittämisen varaa: vaatteet-haulla ensimmäinen tulos on alusvaatteet. Tosin muissakin editoreissa oli vastaava ongelma hakutulosten suhteen. PoolParty tarjoaa periaatteessa tuen SPARQL:lle, mutta testeissä sitä ei päästy kokeilemaan. Kuva 3. Poolparty

Käsitteiden linkittäminen muihin sanastoihin onnistuu Project Linking -toiminnolla, mutta Poolpartyssä yläkäsitettä ei voi valita toisesta sanastosta. Muihin editoreihin verrattuna PoolPartyssä oli vähemmän merkittäviä puutteita. Jos muutama kriittinen puute (esim. yläkäsite toiseen sanastoon) korjautuu, sitä voisi käyttää työkaluna Fintossa julkaistavien ontologioiden ylläpidossa. PoolPartyn Advanced-version hinnoittelu lähtee 25000 euron kertamaksusta (asennus omalle palvelimelle). Vaihtoehtoisesti sen voi ostaa pilvipalveluna alkaen 1249 euroa/kk. Advancedversioon kuuluu useita ontologiakehityksessä tarvittavia toimintoja, jotka perusversiosta puuttuvat. Yhteenveto Kuten edellä todettiin, ilmaiset editorit eivät tällä hetkellä ole suositeltavia työkaluja. Kriittisiä puutteita on liikaa. PoolParty sen sijaan on käyttökelpoisempi ja soveltuisi ontologioiden ylläpitoon muutaman lisäominaisuuden myötä. Editorien ominaisuuksia on eritelty tarkemmin yhteenvedon jälkeisessä taulukossa. VocBench on kuitenkin muuttunut paremmaksi vuoden 2013 vertailuun nähden ja on tietyiltä osin jopa PoolPartyä monipuolisempi työkalu. Epävakaus on kuitenkin sitä luokkaa, että VocBenchiä ei voi pitää suositeltavana. THL-editori taas on vakaa, mutta toiminnoiltaan liian suppea. Kaikkia kolmea editoria kehitetään joka tapauksessa lähitulevaisuudessa ja Finto-projekti seuraa tilannetta myös jatkossa. Tiedotamme sidosryhmiä, mikäli ilmaisissa editoreissa tapahtuu merkittäviä muutoksia ja ne kehittyvät siinä määrin, että niitä voisi suositella käytettäväksi Fintossa julkaistavien ontologioiden ylläpitoon. Vertailutaulukko THL-editori VocBench 2.3. PoolParty Näkymä Epäkäytännöllinen. Hierarkian selailu, haku ja käsitteen muokkaus tehdään kaikki erillisellä sivulla. Muuten selkeähkö, mutta käsitteen muokkaus epäkäytännöllistä: käsitteen ominaisuudet omissa välilehdissään. Testiryhmän selkein ja käyttökelpoisin näkymä Haku Nopea. Tulokset listautuvat epäkäytännöllisesti. Monipuolinen, mutta hidas. Tulokset listautuvat epäkäytännöllisesti. Monipuolinen ja nopeahko. Tulokset listautuvat epäkäytännöllisesti. Käsitteen muokkaus Pelkistetty, mutta nopea. Kaikkea tarpeellista ei Tarvittavat toiminnot löytyvät, mutta muokkaus Käyttöliittymä on helppo

tarjolla. hidasta ja uhkaa jumittaa selaimen. Muokkausten seuranta Yksinkertaiset muokkaustiedot. Monipuolisesti toteutettu. Muokkauksia voi mm. kommentoida. Muokkaustiedot näkyvät. Tuki eri käsitetyypeille Selailtavissa, mutta muokkausmahdollisuudet rajalliset. Tukee, erillisellä välilehdellä Ei tukea tällä hetkellä. Sanastojen linkitys Ei tue varsinaisesti tällä hetkellä Linkitys onnistuu, mutta yläkäsitesuhde toiseen sanastoon ei. Linkitys onnistuu. Yläkäsitesuhde toiseen sanastoon ei. Puutteita Ei tue SPARQL:ää. Hitaus ja alttius jumittumiseen. Yleisarvio Liikaa kriittisiä puutteita Paperilla kiinnostava, mutta epävakauden ja hitauden vuoksi ei suositeltava Vähemmän puutteita kuin verrokeissa. Testiryhmän toimivin kokonaisuus.