Finto nyt Sisällönkuvailupäivä 20.11.2014 Finto-tiimi, sis. Susanna Nykyri, YTT, tietoasiantuntija Finto-palvelu, Kansalliskirjasto
ONKI-projekti Kansalliskirjaston projekti, jota rahoittavat valtiovarainministerö sekä opetus- ja kulttuuriministeriö 2013-2016(?) Projektin jälkeen osaksi Kansalliskirjaston perustoimintaa Perustuu Aalto-yliopistossa ja Helsingin Yliopistossa toimineeseen FinnONTO-projektiin (2003-2012) YSO perustuu edelleen YSAan 2
Sisällys Finton ja YSO-työn tarkoituksesta ja taustasta Finto ja YSO nyt Finto ja YSO vuoden-kahden kuluttua
Finto O1 O2 O3 Julkaisu Ohjeita ja 7etoa Finto YSO Selailu Rajapinnat Käyttäjäryhmät: Ontologia- kehi;äjät Kuvailijat Sovellus- kehi;äjät Loppu- käy;äjät 5
Avoin linkitetty data & semanttinen web tietovarantojen avaaminen + linkittäminen metadata vs./& dokumentit, myös tiedottamiskysymys KK: digiaineistoja, auktoriteettidataa (yhteisöt, henkilöt, asiasana-auktoriteetit) samalla haulla päästään käsiksi useisiin tietovarantoihin voidaan yhdistellä ja käyttää dataa myös uudenlaisilla tavoilla 6
Hindsberg, Mikael (Yle): Median digitalisoituminen ja yhdistetty tieto, URL: http://urn.fi/urn:nbn:fi-fe2014091644714 7
Jos eri sovellusalat ja niillä toimivat organisaatiot käyttävät tiedon indeksoinnissa samoja käsitetunnisteita (URI) samoista asioista, niin järjestelmien sisällön integrointi helpottuu. 8
Yksilöivät tunnisteet Myös käsitteiden välisillä suhteilla on yksilöivä tunniste Suhteesta itsestään voidaan kertoa tietoja koneymmärrettävästi Esim: http://www.w3.org/2004/02/skos/ core#closematch 9
Kuvaileva metadata Sanasto Sanasto Sanasto Kuvailu Kuvailu Kuvailu Kuvailija Aine isto Kuvailija Aine isto Kuvailija Aine isto 10
Ontologia Ontologia Sanasto Kuvailu Kuvailu Kuvailu Kuvailija Aine isto Kuvailija Aine isto Kuvailija Aine isto 11
Mitä Fintossa on? ks. finto.fi 12
Finto-tietopaketti projektin julkisessa wikissä https://wiki.helsinki.fi/display/onki/tietoa +Fintosta+ja+ontologioista 13
GitHub Projektiin liittyvää ontologiakehitystä tehdään avoimesti GitHub -projektissa, josta löytyvät ontologiat ja niihin liittyvät kehitystehtävät, sekä kehityksen dokumentaatio: https://github.com/ NatLibFi/Finto-data
YSAsta YSOon : merkkijonoista käsitteisiin
YSAsta YSOon YSA ja siten YSO perustuvat nykyisellään vahvasti kirjallisuustakuu-ajatteluun sanastojen käsitteistö on päivittynyt melko hitaasti, ja se ei ole välttämättä heijastanut dynaamista ja kirjavaakin käyttäjädiskurssia koska YSO on perustunut käsitteistöltään jo todennettuun sisällönkuvailutarpeeseen (pääasiallisena kontekstinaan suomalaiset kirjastotietokannat), on se varsin kaukana ontologioista merkityksessä maailmaa mallintava käsitteistö Siksi
YSAn ja YSOn erot: semanttisia ja teknisiä
1/4 YSOssa kaikenkattava ylähierarkia (vrt. YSA, jossa rakenne on paikoin hyvin litteä)
2/4 vahva käsitepohjaisuus: termit ovat vain nimityksiä käsitteille, jotka yksilöidään URI-tunnisteella (vrt. YSA, jossa pääsääntöisesti käytetään termejä)
3/4 monikielisyys: YSOn rakenne perustuu suomalaiseen kulttuuriin (ml. ruotsin kieli) ja käsitteet nimetään suomeksi, ruotsiksi ja englanniksi (vrt. YSAn yksikielisyys, jota Allärs täydentää ruotsin kielen osalta)
4/4 semanttisen webin ja linkitetyn datan teknologia-alusta: tieto esitetään ensisijaisesti RDF-muodossa käyttäen mm. SKOS-mallinnustapaa (vrt. YSAn termit MARC-tietueita), mikä mahdollistaa mm. automaattisen laadunvalvonnan sekä linkitetyn datan julkaisun ja rajapintapalvelut
YSOn kehitystyöstä
YSOn sidosryhmien käytännöistä ja toiveista ja niihin vastaamisesta sisällönkuvailijat taustaltaan aiempaa heterogeenisempia toimijoita yleinen asenne myönteinen ja optimistinen linked open data toimintamalli pitää sisällään ajatuksen siitä, että aineistoja voidaan yhdistellä yli organisaatiorajojen asiasanastoista ei oltu juurikaan siirrytty ontologioihin ja tehdyt ontologiat olivat jääneet käyttämättä, mutta nyt aktivoitumista! kehittämisen ja käyttöönoton yleinen este resurssipula ontologioihin siirtyminen vaatii asennetyötä ja perehdyttämistä 25
YSOn sidosryhmien käytännöistä ja toiveista ja niihin vastaamisesta 2/2 Lisää, ks. Nykyri, Susanna; Palonen, Tuomas 2014: Ontologioiden käytön moninaisuudesta ja tulevaisuusnäkymistä: Finto-palvelun sidosryhmien ontologiapalvelulle kohdistamat kehitystoiveet http://urn.fi/urn:nbn:fi-fe201402111454 26
YSOn ja YSO-työn luonne 1/2 1) yleinen 2) suomalainen 3) ontologia KK:n kehitystyössä keskiössä sanaston ajateltu käyttötarkoitus -> lisätään temaattisuutta ja intuitiivisuutta kuitenkin monikielinen ja kattaa asiasanastoltaan esim. Fennicaan sisällönkuvailtavat väitöskirjat 27
YSOn ja YSO-työn luonne 2/2 tavoite ei ole kattaa kaikenlaisia tarpeita: on myös erikoisalojen sanastoja, tesauruksia ja ontologioita (ks. esim. Fintossa olevat) ei mallinna maailmaa, vaan ennalta määriteltyjä sisällönkuvailutarpeita tavalla, jonka tulee palvella tiedonhakua 28
Mitä me teemme? - lisäämme käsitetarkkuutta (aura) - määrittelemme hierarkisointityössä keskeiset käsitepiirteet ottaen painokkaammin huomioon tiedonhaun ja sisällönkuvailun tarpeet (siirto (puretaan), salaisuus) - käsitteistöllä ns. aineistotakuu (viikonpäivät) - sisällytämme enemmän myös ns. ei-ammattilaisten tapoja ilmaista asia (esim. yks. vs. mon.) - rikastamme temaattisuutta (esim. ryhmittelemällä ja assosiatiivisilla suhteilla) 29
Pertti Jarla, Fingerpori, HS 28.10.2014
FINTOssa YSO-versio YSA-versio
Monikielisyys Tietoisia valintoja, myös arvokysymyksiä YSOn käyttötarkoitus Avoimen datan maailma
Moninaisuus myös kielensisäinen ilmiö! 36
37
Kielistä Ruotsi: Allfon taustalla Allärs Ontologisointi ja ylläpito Åbo Akademissa Englanti: Valmiita käsitteitä tällä hetkellä n. 8 000, noin joka kolmannelle löytyy siltausvastine LCSH:sta. Tarkistus ja siltaus tekemättä n. 18 000 käsitteelle -> Suurin osa tarkistettavista käännöksistä tehty ennen ontologian rakentamista ja ilman hierarkian tuomaa kontekstia. -> Sisäisen yhtenäisyyden tarkistaminen eri aikoina tehtyjen käännösten välillä. Arvioitu valmistumisaika loppuvuosi 2015.
Ruotsi: käsitteenmuodostuskieli eli osallistuu hierarkian rakentamiseen kaikilla käsitteillä yksilöivät preflabelit (=termit)
Englanti: käännöskieli, välittää suomalaisen kulttuurin käsitteistön vieraan kulttuurin kielelle sama preflabel usealla käsitteellä sallittua, joskaan ei suositeltavaa (esim. uudenaikaistaminen ja modernisaatio kääntyvät molemmat modernisation)
Haasteita kielten välillä eväät = packed lunch (ei tarkkaa vastinetta, kuvaava käännös) joet = älvar, åar, floder laitteistot, varusteet, kalusto, tarvikkeet, välineet -> voisivat kaikki kääntyä jossain yhteydessä equipment -> miten tehdä eroa?
Haasteita kulttuurien välillä Kieli heijastelee kulttuurin ja yhteiskunnan erilaisia rakenteita, esim. koulujärjestelmään yms. liittyvä sanasto. virvoitusjuomateollisuus = soft drink industry = soft drink industry -> virvoitusjuoman määritelmä riippuu lainsäädännöstä lukio = general upper secondary school high schools kihlakunnat = jurisdictional districts puukkojunkkarit = puukkojunkkarit SN: A term used of troublemakers who were active in the Southern Ostrobothnia region of Finland in the 19th century.
Haasteita sanastojen välillä diskotanssit = disco dances = disco dancing vaalirahoitus = election funding campaign funds
Kontekstista fundamentalismi = fundamentalism eri merkitys: aate vs. protestanttinen liike fundamentalism kuona-aineet = waste products waste products eri konteksti: biologia vs. tuotantomenetelmä lastentaudit = children s diseases Children Diseases eri laajuus, mutta: haimataudit = pancreatic diseases = Pancreas-- Diseases
Haasteista huolimatta Nykyajan linkittyvässä ja globaalissa ympäristössä (open linked data, semantic web) tarvitaan eri ajassa ja paikassa laadittujen, sisällönkuvailtujen ja tarjolle saatettujen aineistojen yhteiskäytön mahdollistavia yhteisiä - tai yhdistäviä - käsitteistöjä ja sanastoja. -> Yhdellä kielellä asiasanoitettu aineisto on haettavissa myös toisella kielellä, ja että samanaiheiset aineistot ovat löydettävissä yhteisten portaalien kautta riippumatta siitä, missä ja kuka ne on sisällönkuvaillut. YSO-ALLFO-työssä pyritty säilyttämään eri kielten ilmaisuvoimaisuus niin pitkälle kuin se monikielisessä dokumentaatiokielen sanastossa on käytännössä mahdollista ja tarkoituksenmukaista.
Sisällönkuvailu ja tiedonhaku Perinteisessä termipohjaisessa sisällönkuvailussa (YSA ja VESA) termien tarkka muoto äärimmäisen tärkeää <-> kuvailtavan tietueen yhteys sanastoon ja muihin samaan asiaan liittyviin tietueisiin edellyttää auktorisoidun kirjoitusasun noudattamista. Käsitepohjaisessa sisällönkuvailussa yhteys tietueiden ja sanaston välillä perustuu pysyviin tunnisteisiin (YSOn URItunnisteet). Vaikka käsite muuttuisi (esim. suositeltavan termin vaihtuessa), sen tunniste pysyy samana. Termit ovat edelleen tärkeitä tarttumapintoja käsitteille, mutta ne eivät enää tietojärjestelmien tasolla toimi linkkeinä.
Käsitepohjainen silti haastavaa YSOn sisältötyöläisille päänvaivaa aiheuttavat mm.
Yleisiä haasteita Käsitteiden nimeäminen ja intuitiivisuus konkreettinen eloton objekti -> elottomat objektit kasvullinen luonti; koneellinen luonti; materiaalista luonti Vieruskäsitekokonaisuudet eivät aina mielekkäitä keskinäinen toiminta eläinrääkkäys, kosinta, kylmä sota, äänestäminen jne. Assosiatiivisten suhteiden vähäisyys koirankopit koirat; kalastus kalastajat Käsitteiden jakaminen vs. monihierarkia lapset (ikään liittyvä rooli), lapset (perhesuhteisiin liittyvä rooli), lapset (sosioekonomiseen ryhmään liittyvä rooli)
Hierarkisoinnin haasteita Hierarkian tulisi päteä loppuun asti > ammatilliset oppilaitokset > taideoppilaitokset (ammatilliset oppilaitokset) > musiikkioppilaitokset > musiikkileikkikoulut Yläkäsite tuo usein yhteen alakäsitteitä, jotka eivät ole keskenään yhteismitallisia toiminnan johtaminen orkesterin johtaminen, pedagoginen johtaminen, etäjohtaminen
Kieliasu on usein vaikuttanut luokitteluun, esim. siirto (periytyy YSAsta)
Muutakin muutettavaa, kohteita esim. toimintatavat ja -kulttuuri kirjallisuustakuu ontologisointi-yhteistyö käsitteiden ja termimuotojen ehdotusjärjestelmä kontekstina nyt avoin linkitetty data
Tapaus aura YSA YSO tiedonhaku
Jippii! Mutta, kun, sitten - siis lisäksi 60
61
Hakujärjestelmät ja aiempi sisällönkuvailutapa eivät vielä tue! 62
Haku Finnassa: aura (s/s Aura, Illiminsky Kurt. 1933 1942) 63
Asiasanahaku Melindassa: 64
Käsitetasolla kuitenkin yhtenäisempää ja linkittyvämpää ja myös hakujärjestelmiä kehitetään! 65
Paljon muutakin tulossa, mm. metatietosanasto ISNI (International Standard Name Identifier, ISO 27729), 2015 (ks. Huttunen, Maarit: Nimien kansainvälisen standarditunnuksen käyttöönotto, URL: http:// www.kansalliskirjasto.fi/kirjastoala/tiet olinja/0212/ isnihanke.html) SAPO jne linkitettyä ajallista+paikallista yksilöivää metatietoa, 2014/2015 66
Trendejä - asiasanoituksen ilmaisutasolla käyttäjälähtöisyys & diskurssien moninaisuus - toimintatavoissa harmonisointi ja linkittyvyys järjestelmien, aineistojen ja palveluiden integroitavuus - haut yli tarjoaja-rajojen : ei tiedetä eikä välitetä siitä kuka palvelun ja datan tarjoaa Massat (lue: joukko yksilöitä) tulevat - erottelu- ja yhdistelykyky (lue: laadukas metadata) tarpeen! Täydellisen tavoittelun ei kuitenkaan kannata olla avoimuuden este! 67
Finto-projektin tiekartta 2013 2017 Etapit Organisaatioiden välinen integraatio Integraatio organisaatioiden sisällä Integraatio KK:n järjestelmiin alkaa Fintopalvelu aloittaa Projekti alkaa 2017 2016 2015 2014 2013 Ø Eri organisaatioiden tietovarantoja aletaan linkittämään ontologioiden kautta Ø KOKO vastaa sille asetettuja vaatimuksia Ø Finto-palvelua kehitetään kentän tarpeiden mukaan Ø Siirrytään YSOon Fennicassa ja Melindassa (Melinda, Kilda) Ø YSOn läpikäynti on valmis Ø Ontologiapilvi KOKOn kehitys tiivistyy ja sille luodaan apuvälineitä Ø Finton taustalla toimivasta Skosmos-ohjelmistosta julkaistaan 1.0 versio Ø Pilotoidaan KDK:n nimitietopalvelua Fintossa (Finna, AHAA) Ø YSOn käsitteiden kehitys 2/3 valmis ja englanninkäännös valmis Ø Suunnitelma URI/URN-tunnisteisiin siirtymisestä auktoriteettien osalta Melindassa (Melinda) Ø Verkkosanasto VESA lakkautetaan ja sen käyttö ohjataan Fintoon Ø Ontologioiden ja linkitettyjen sanastojen hyödyntäminen ja käytettävyys (Finna, AHAA, Museo 2015) ü Finton uusi ulkoasu julkaistiin ja ONKI-palveluun tulevat rajapintakutsut ohjattiin Fintoon ü Palvelun nopeus ja luotettavuus kehitettiin vaadittavalle tasolle ja luotiin kehitystä tukevat yksikkötestit ü YSOn ylärakenne uudistettiin ja YSOn systemaattinen kehittäminen aloitettiin ü YSOn englanninkäännös saatiin valmiiksi aiemmin kääntämättömien osalta ü Ontologiapalvelu pystytettiin Kansalliskirjaston hallintaan ja aloitti pilottitoimintansa ü Selvitettiin laajalti ontologioiden käyttöä Suomessa sekä niille esitettyjä odotuksia ja toiveita ü Yleisen suomalaisen ontologian (YSO) tila selvitettiin ja luotiin kehittämissuunnitelma ü YSOn ylläpito ja kehitystyö Kansalliskirjastossa aloitettiin sisältäen ruotsinkielisen ylläpidon sekä englannin käännöksen ja siltaamisen Library of Congress Subject Headings (LCSH) -sanastoon
Kiitos! susanna.nykyri@helsinki.fi onki-posti@helsinki.fi 69