Kulttuurisampo. Joeli Takala. joeli.takala@tkk.fi. Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu http://www.seco.tkk.



Samankaltaiset tiedostot
Mikä on Kulttuurisampo?...

Ontologiat Kulttuurisampo.fi-palvelussa

Kulttuurisampo.fi Suomalainen kulttuuri ja semanttinen web mitä, miksi ja miten?

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Ontologioiden yhdistäminen YSO:oon

Miten ja miksi asiasanastoista kehitetään ontologioita

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Sisällönkuvailun tulevaisuus: YSA vai YSO?

FinnONTO-infrastruktuurin esittely

Media- ja kulttuuripalvelut

Kulttuurisampo suomalainen kulttuuri semanttisessa webissä

Onko luettelointitermillä. väliä? Kokoelmaseminaari Suvi Kettula Espoon kaupunginmuseo

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Historialliset paikat ja kartat

Yleisen suomalaisen ontologian kehitystyö

Ensi askeleet semanttiseen webiin: tuotantoprojektin kokemuksia

Media- ja kulttuuripalvelut. Eetu Mäkelä

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Kim Viljanen

Ontologiakirjasto ONKI-Paikka

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Kirjasampo [lyhyt oppimäärä]

Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset

Kohti suomalaista semanttista webiä

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Yleinen suomalainen ontologia YSO

Suositus asiasanastojen, luokitusjärjestelmien ja ontologioiden käytöstä luetteloinnissa Suomen museoissa

YLEINEN SUOMALAINEN ONTOLOGIA YSO

Älykkäät keltaiset sivut ( Intelligent Web Services ( IWebS ) )

Kulttuurisampo. Eetu Mäkelä. Semantic Computing Research Group UNIVERSITY OF HELSINKI HELSINKI UNIVERSITY OF TECHNOLOGY

Pysyvä ja muuttuva A:sta O:hon sisällönkuvailussa. Mirja Anttila Kansalliskirjasto

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

Asiasanastosta ontologiaksi

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Semanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen

Johdanto: Semanttinen Kalevala projekti

KIRJASAMPO. Jyväskylä

Paikkatietoyhteistyö. Mikko Lappalainen Finto-projektin laajennetun projektiryhmän kokous, KANSALLISKIRJASTO

Semanttisen Webin mahdollisuudet yrityksille

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO ja sen sovellukset. Prof. Eero Hyvönen

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Kohti suomalaista semanttista webiä

Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet

SELVITYS ERIKOISKIRJASTOJEN KÄYTTÄMISTÄ ASIASANASTOISTA JA LUOKITUKSISTA. Anne Holappa, STKS:n Erikoiskirjastojen työryhmä Tieteiden talo

SEMANTTINEN WEB JA PAIKKATIETOIHIN PERUSTUVAT PALVELUT

Finto-tilannekatsaus. Asiantuntijaseminaari KANSALLISKIRJASTO - Kirjastoverkkopalvelut

KAMUT: Muistiorganisaatioiden tietovarannot yhteiskäyttöön. ÄLYÄ VERKOSSA - WEB INTELLIGENCE Tiedekeskus Heureka, Vantaa

Kohti Yleistä suomalaista ontologiaa (YSO)

Finto-projektin tilannekatsaus

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

Erikoisontologioiden kuulumisia. Finto-projekti: Laajennetun projektiryhmän kokous Tuomas Palonen, tietoasiantuntija

KAM-sektori paikkatiedon kansallisessa ekosysteemissä. Mikko Lappalainen Nimitietopalvelua ja paikkatietopalvelua koskeva seminaari, 30.1.

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

Prosessikuvauksesta vauhtia taideteollisuusalan ontologia TAOn ensiaskeleihin

Ontologioiden huomioiminen uuden kirjastojärjestelmän suunnittelussa. Tommi Jauhiainen Helsinki

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Projektinhallintaa paikkatiedon avulla

Korkeakoulujen yhteentoimivuusmalli

Kirjasampo. Kaunokki-ontologia & TKK / Dipoli. Kansalliskirjaston ontologia-seminaari Kaisa Hypén

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Kulttuurisampo suomalainen kulttuuri semanttisessa webissä

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Paikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com

Finto-tilannekatsaus. Osma Suominen Kansalliskirjaston asiantuntijaseminaari

Internet jolla on merkitystä

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

Miksi asiasanastoista pitäisi siirtyä ontologioihin? Prof. Eero Hyvönen

Kokoelmahallintajärjestelmän Vesa Hongisto

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Luento 12: XML ja metatieto

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

Yhteisöllinen semanttinen web 2.0 FinnONTO 2.0 -hankkeen visio ja tulokset

Avoin data, avoimet rajapinnat ja tietojen linkitys. Osma Suominen Suomi.fi

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

Miten avoin yhdistetty tieto saadaan verkkoon: kansallinen Linked Data Finland -hanke-ehdotus

Kansalliset kehittämishankkeet: Etenemissuunnitelmat

Älykäs semanttinen web tietämyksenhallinnan rajoja siirtämässä

Suomalainen sisältöinfrastruktuuri semanttisessa webissä käytettävissänne

Pitkäaikaistallennus. CSC - Tieteen tietotekniikan keskus IT2008 Ari Lukkarinen

Vaatimusdokumentti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Georef KDK-seminaari

Ontology Work in Finland: National Semantic Web Infrastructure FinnONTO. Prof. Eero Hyvönen

Kansallinen digitaalinen kirjasto

The OWL-S are not what they seem

Finna ja ontologiat tms.

KDK: Finna ja pitkäaikaissäilytys

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

Sosiaalihuollon asiakasasiakirjojen tietomallinnus Tietomallit teknisen asiakirjamäärittelyn näkökulmasta

Arkistoaineistojen sisällönkuvailu

Järjestelmäarkkitehtuuri (TK081702) Avoimet web-rajapinnat

ARTIKKELITIETOKANNAT JA OMANELLI PIRJO POHJOLAINEN

Bryk & Wirkkala -katseluvarasto. Henna Paunu Intendentti, kokoelmat EMMA Espoon modernin taiteen museo

Transkriptio:

Kulttuurisampo Joeli Takala joeli.takala@tkk.fi Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu http://www.seco.tkk.fi Maakuntakirjastokokous 26.3.2009

Sisältö Semanttisten tekniikoiden hyödyt: Kulttuurisampo.fi palvelun esittely Kulttuurisammon ontologiat: älykkään toiminnallisuuden / aineiston yhtenäistämisen perusta Tiedon integrointi semanttisessa webissä: Kulttuurisammon sisällöntuotantoputki

Kulttuurisampo.fi mistä on kyse? Kulttuurisampo on keskitetty web portaali, joka esittelee semanttisen webin teknologioista saatavaa lisäarvoa monimuotoisten ja monilähteisten kulttuurisisältöjen yhteisöllisessä julkaisussa Tutustu itse! www.kulttuurisampo.fi

Kulttuurisammon teknologia mahdollistaa: Eri toimijoiden eri tyyppisiä objekteja sisältävien tietokantojen yhdistämisen kustannustehokkaasti ja mielekkäästi Moniaineistoselailun ja suosittelun Kalevalan tekstistä kuvien kautta maalarin elämänkertaan Paremmat hakutoiminnot Historialliset paikat, Ontologinen tekstihaku Yhteyksien löytämisen ja visualisoinnin Mitä yhteistä on Akseli Gallen Kallelalla ja Napoleonilla? Aineiston jäsentelyn ja esitysten muodostamisen Näyttely, aikajana, karttanäkymä Kaikki tämä ihmisen ymmärtämien merkitysten tasolla, kielestä riippumatta

Kulttuurisampo.fi mitä siellä on? Museoesineet (Espoon kaupunginmuseo, Lahden kaupunginmuseo, Kansallismuseo, Pohjois Karjalan museo, Suomen maatalousmuseo Sarka) Ilmavalokuvat (Veljekset Karhumäki Oy) Henkilöt ja organisaatiot (Getty Union List of Artist Names) Biografiat (Kansallisbiografia, SKS) Maalaukset, veistokset, piirustukset ja muu esittävä ja abstrakti taide (Valtion taidemuseo) Kaunokirjallisuus (Helsingin kaupunginkirjasto) Historialliset tapahtumat (Agricola Suomen historiaverkko) Taidot (Taideteollisen korkeakoulun kirjasto, Suomen maatalousmuseo Sarka) Videot (Espoon kaupunginmuseo) WWW tietosivut (Wikipedia) Runot (ml. Kalevala) (Suomen kansan vanhat runot, SKS) Rakennetut kohteet (Espoon kaupunginmuseo) Muinaismuistokohteet (Museovirasto) Kalevalan paikat ja henkilöt Historialliset kylät ja kartat Kansansävelmät (Jyväskylän yliopiston musiikin laitos ja SKS)

Kulttuurisammon teknologia mahdollistaa: Eri toimijoiden eri tyyppisiä objekteja sisältävien tietokantojen yhdistämisen kustannustehokkaasti ja mielekkäästi Moniaineistoselailun ja suosittelun Kalevalan tekstistä kuvien kautta maalarin elämänkertaan Paremmat hakutoiminnot Historialliset paikat, Ontologinen tekstihaku Yhteyksien löytämisen ja visualisoinnin Mitä yhteistä on Akseli Gallen Kallelalla ja Napoleonilla? Aineiston jäsentelyn ja esitysten muodostamisen Näyttely, aikajana, karttanäkymä Kaikki tämä ihmisen ymmärtämien merkitysten tasolla, kielestä riippumatta

Kulttuurisammon teknologia mahdollistaa: Eri toimijoiden eri tyyppisiä objekteja sisältävien tietokantojen yhdistämisen kustannustehokkaasti ja mielekkäästi Moniaineistoselailun ja suosittelun Kalevalan tekstistä kuvien kautta maalarin elämänkertaan Paremmat hakutoiminnot Historialliset paikat, Ontologinen tekstihaku Yhteyksien löytämisen ja visualisoinnin Mitä yhteistä on Akseli Gallen Kallelalla ja Napoleonilla? Aineiston jäsentelyn ja esitysten muodostamisen Näyttely, aikajana, karttanäkymä Kaikki tämä ihmisen ymmärtämien merkitysten tasolla, kielestä riippumatta

Kulttuurisammon teknologia mahdollistaa: Eri toimijoiden eri tyyppisiä objekteja sisältävien tietokantojen yhdistämisen kustannustehokkaasti ja mielekkäästi Moniaineistoselailun ja suosittelun Kalevalan tekstistä kuvien kautta maalarin elämänkertaan Paremmat hakutoiminnot Historialliset paikat, Ontologinen tekstihaku Yhteyksien löytämisen ja visualisoinnin Mitä yhteistä on Akseli Gallen Kallelalla ja Napoleonilla? Aineiston jäsentelyn ja esitysten muodostamisen Näyttely, aikajana, karttanäkymä Kaikki tämä ihmisen ymmärtämien merkitysten tasolla, kielestä riippumatta

Kulttuurisammon teknologia mahdollistaa: Eri toimijoiden eri tyyppisiä objekteja sisältävien tietokantojen yhdistämisen kustannustehokkaasti ja mielekkäästi Moniaineistoselailun ja suosittelun Kalevalan tekstistä kuvien kautta maalarin elämänkertaan Paremmat hakutoiminnot Historialliset paikat, Ontologinen tekstihaku Yhteyksien löytämisen ja visualisoinnin Mitä yhteistä on Akseli Gallen Kallelalla ja Napoleonilla? Aineiston jäsentelyn ja esitysten muodostamisen Näyttely, aikajana, karttanäkymä Kaikki tämä ihmisen ymmärtämien merkitysten tasolla, kielestä riippumatta

Hyötyä myös koneille: Kulttuurisammon Web 2.0 arkkitehtuuri Suuri osa Kulttuurisammon sekä toiminnallisuudesta että käyttöliittymistä on rakennettu yleisistä, uudelleenkäytettävistä ja konfiguraatiotasolla yhteenkytkettävistä komponenteista Tästä johtuen lähes kaikki Kulttuurisammon toiminnallisuus on kenen tahansa omaan palveluun liitettävissä halutulla tasolla: omasta tietojärjestelmästä kutsuttavana palvelurajapintana (Web Services / Ajax) tai Javascriptillä kevyesti webbisivuun kytkettävänä valmiina web widgetinä http://www.seco.tkk.fi/applications/kulttuurisampo/ Tulevia käyttäjiä mm. yleisten kirjastojen kaunokirjallisuusportaali (Kirjasampo.fi), SmartMuseum EU hanke

Kulttuurisammon ohjelmistoarkkitehtuuri ja semanttisen webin teknologioiden yleisyys Kehitetty MIT open source lisenssillä, muttei vielä julkisesti saatavilla Valtaosa koodista yleisiä palveluita joita voi käyttää millä tahansa datalla halutunlaisen älykkään semantic web käyttöliittymän rakentamiseen ~60 000 Kulttuurisampo spesifistä koodiriviä ~540 000 yleiskäyttöistä koodiriviä n. 20 miljoonan yksilön ja n. 200 miljoonan kolmikon Linked Open Dataaineisto imautui suoraan järjestelmään ollen heti käytettävissä ja haettavissa Toiminnallisuutta voidaan parantaa tekemällä dataan itseensä RDF tasolla lisäintegraatiomäärittelyjä

Sisältö Semanttisten tekniikoiden hyödyt: Kulttuurisampo.fi palvelun esittely Kulttuurisammon ontologiat: älykkään toiminnallisuuden / aineiston yhtenäistämisen perusta Tiedon integrointi semanttisessa webissä: Kulttuurisammon sisällöntuotantoputki

Päättelyn ontologinen perusta: KOKO N. 30 000 käsitettä, n. 45 000 käsitteiden välistä suhdetta Sisältää seuraavat alaontologiat: Yleinen suomalainen ontologia YSO Museoalan ontologia MAO Taideteollisuusalan ontologia TAO Valokuvausalan ontologia VALO Mediataideontologia MEDIA Viikin tiedekirjaston ontologia AFO (maa ja metsätalous, ympäristö) Sekä käyttöliittymän että päättelyn perusta, johon kaikki aineisto liitetään www.yso.fi Käytetään suoraan integrointiin aineistoissa jotka on indeksoitu KOKO:n pohjana olevilla sanastoilla (YSA, MASA, Agriforest,...)

Päättelyn ontologinen perusta: Erityisontologiat Kulttuurisammon paikkaontologia (tulevaisuuden KOKO Paikka) Suomalainen paikkaontologia SUO (n. 800 000 suomalaista nykypaikkaa koordinaatein, n. 5 miljoonaa kansainvälistä paikkaa) Suomen ajallinen paikkaontologia SAPO (historialliset paikat ja muutoshistoria) Kulttuurisammon materiaalista tuotetut historialliset ja nykyiset lisäpaikat Henkilö ja organisaatio ontologia TOIMO Getty Union List of Artist Names ULAN (n. 290 000 kansainvälistä taiteen suurnimeä, näiden välisiä suhteita ja muuta tietoa) Kulttuurisammon materiaalista tuotetut lisähenkilöt ja organisaatiot Kulttuurisammon aineistosta tuotettu aika ontologia Mahdollistaa päättelyn myös epätarkkojen aikajaksojen kuten n. 1810 ja 1800 luvun alku suhteen Empiirisesti Kulttuurisammon tapauksessa ontologioiden pohjalta tehtävä päättely noin kymmenkertaistaa tietomäärän: 784 246 kohdetietoa 9 852 964 kohdetietoa

Automaattisen päättelyn hyöty: syli on avara ja lämmin Kulttuurisampoon liitetyt uudet asiasanastot eivät itsessään mahdollista koneellista päättelyä, mutta: Peilataan edellämainittuihin ontologioihin, joten voidaan käyttää kyseisellä luokituksella tai aineistolla indeksoidun aineiston tuomiseen Kulttuurisammon älyn piiriin Voidaan myös käyttää suoraan aineiston selailuun portaalissa Peilatut sanastot: Esittävän taiteen Iconclass luokitus sekä luokkiin liittyvät asiasanat Kaunokirjallisuuden Kaunokki asiasanasto KOKO ontologioiden pohjalla olevat asianastot YSA, MASA, Agriforest,...

Sisältö Semanttisten tekniikoiden hyödyt: Kulttuurisampo.fi palvelun esittely Kulttuurisammon ontologiat: älykkään toiminnallisuuden / aineiston yhtenäistämisen perusta Tiedon integrointi semanttisessa webissä: Kulttuurisammon sisällöntuotantoputki

Mitä tiedon integrointi oikein on? RDF tietomallin avulla kaikki tieto on semanttisessa webissä koodattu yhdenmukaisesti. Tiedon esittämismuodon suhteen integraatiota ei siis tarvita. Maailmanlaajuisesti yksikäsitteisinä URI tunnisteet mahdollistavat periaatteessa sen että kaikki puhuisivat samoista asioista samoilla nimillä. Käytännössä näin ei kuitenkaan usein ole Tässä vaiheessa semanttisen webin kehityskaarta useimmille asioille ei vielä ole riittävän kehittyneitä standardisanastoja/skeemoja Eri toimijoilla voi legitiimisti olla eri näkökulmia jotka vaativat eri sanastoja tai skeemoja Historian painolasti on suuri, sillä olemassaolevat kokoelmat on jo indeksoitu jollakin: YSA vs MASA Yksinkertaisilla tempuilla päästään kuitenkin hyvin pitkälle

Ontologioiden yhteydessä tarvittavia integraatiomuotoja Skeemaintegraatio=ominaisuusintegraatio (samaistus, aliominaistus) valmistuspaikka/rakennuspaikka/kuvauspaikka/luontipaikka Sanasto/instanssi integraatio (samaistus, aliluokitus) Nokia/Nokia/Nokia kalastusvälineet/atraimet Rakenteellisten arvojen esitysmuotojen yhtenäistäminen (esim. aika, nimet) n. 1900 luvun alussa/n. 1900 1920 Gallen Kallela, Akseli/Akseli Gallen Kallela/Axel Gallén Käsin / koneelisesti?

Esimerkki 1: Vanhan XML aineiston tuominen Kulttuurisampoon (SMOL) Esimerkkinä SMOL muunnin Muunnin Suomen Museot Online XML muodosta suoraan Kulsa skeemaan Yhdistää asiasanat, paikat, toimijat, yms. muihin ontologioihin 90% koodista (n. 800 riviä) tarvitaan muunnokseen SMOLformaatista RDF:ään SMOL formaatin ongelmien takia: Löyhästi määritelty Arvoalueita ei määritelty Arvot eivät ole yksikäsitteisiä Käytännöt vaihtelevat lähteittäin Kaikki SMOL tiedostot eivät edes ole SMOL skeeman mukaisia tai edes XML:ää! Koneluettavuus kärsii, käsittelyyn tarvitaan käsityötä

No, mikä sitten siinä on niin hankalaa? Paikat, Suomi, Karjala, Viipurin pitäjä, Hanhijoki, asuinrakennus Marokko, Sus (Sous) Lappi Päivämäärät/vuodet 1768, jälk. 1300 luku, keskiaika 1870 1960, 1870 n.1960, n. 1965 talvi 1976 77 Esineiden osien tiedot Jaettu detaljitietoihin eri kenttiin ilman selkeitä suhteita toisiinsa Haastavaa käsitellä automaattisesti ilman virheitä

Esimerkki 2: Nykyaikaisen RDF mallin tuominen Kulttuurisampoon (YLE elävä arkisto) 1) Metadataskeeman liittäminen Kulttuurisampon skeemaan 1) Ominaisuuksien samaistus ja ripustaminen ominaisuushierarkiaan käsityönä, 16 ripustusta 2) Sisältötyyppien samaistus ja ripustaminen sisältötyyppihierarkiaan käsityönä, 3 ripustusta 2) Viitearvojen linkitys 1) Asiasanastojen samaistus KOKOon automaattisesti nimen perusteella 2) Henkilöiden samaistus TOIMOon (pitänee tarkistaa käsin, ei vielä tehty) 3) Arvoesityksen yhdenmukaistus 1) Aikojen samaistus Kulttuurisammon aikoihin sekä uusien aikahahmojen luonti jos aikaa ei vielä löydy Yhteensä tähän meni aikaa n. 11 2 työpäivää