Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet



Samankaltaiset tiedostot
Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

MuseoSuomi Suomen museot semanttisessa webissä

Semanttinen Web Mitä se on käytännössä?

Automaattinen semanttinen annotointi

Onko luettelointitermillä. väliä? Kokoelmaseminaari Suvi Kettula Espoon kaupunginmuseo

Suomalainen kulttuuri ja semanttinen web

MuseoSuomi: Suomen museot semanttisessa webissä

Miten ja miksi asiasanastoista kehitetään ontologioita

Kim Viljanen

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Keltaisten sivujen palveluiden kuvaaminen ontologioiden avulla

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Kohti suomalaista semanttista webiä

Käsitemallit muistiorganisaatioiden kuvailun yhdenmukaistamisen välineenä

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

Ensi askeleet semanttiseen webiin: tuotantoprojektin kokemuksia

Ontologioiden yhdistäminen YSO:oon

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Ontologiakirjasto ONKI-Paikka

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Johdanto: Semanttinen Kalevala projekti

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Älykkäät keltaiset sivut ( Intelligent Web Services ( IWebS ) )

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Yhteisöllinen semanttinen web 2.0 FinnONTO 2.0 -hankkeen visio ja tulokset

Mikä on semanttinen web?

Yleisen suomalaisen ontologian kehitystyö

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Miksi asiasanastoista pitäisi siirtyä ontologioihin? Prof. Eero Hyvönen

Suositus asiasanastojen, luokitusjärjestelmien ja ontologioiden käytöstä luetteloinnissa Suomen museoissa

Kulttuurisampo. Joeli Takala. Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

YLEINEN SUOMALAINEN ONTOLOGIA YSO

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

Paikkatiedon semanttinen mallinnus, integrointi ja julkaiseminen Case Suomalainen ajallinen paikkaontologia SAPO

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

Kulttuurisampo.fi Suomalainen kulttuuri ja semanttinen web mitä, miksi ja miten?

Museoalan ontologia MAO ja MuseoSuomen sisält

KIRJASAMPO. Jyväskylä

Arkistoaineistojen sisällönkuvailu

FinnONTO-infrastruktuurin esittely

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

Suomalainen sisältöinfrastruktuuri semanttisessa webissä käytettävissänne

Älykäs semanttinen web tietämyksenhallinnan rajoja siirtämässä

Metatiedot organisaatioiden sisällönhallinnassa

Tieto matkaa maailmalle

Semanttisen webin hyödyntäminen terveystiedon löydettävyydessä

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Semanttisen Webin mahdollisuudet yrityksille

W3C-teknologiat ja yhteensopivuus

Internet jolla on merkitystä

Semanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen

Mikä on Kulttuurisampo?...

Kohti suomalaista semanttista webiä

Sisällönhallinnan menetelmiä

Paikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Pikaohje formaatin valmistamiseen

Kulttuurisampo suomalainen kulttuuri semanttisessa webissä

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO ja sen sovellukset. Prof. Eero Hyvönen

Asiasanastosta ontologiaksi

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Finton jatko vuosina

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

SVM osallistuu Museoviraston vetämään hankkeeseen valokuvaaineistojen

Yleinen suomalainen ontologia YSO

Semantic Web käytännön sovelluksissa. TkT Janne Saarela Profium Oy

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

Tapahtumakalenteri ja terveyspalveluhakemisto

TerveSuomi.fi portaalin suunnittelu ja tekninen toteutus

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Vaatimusdokumentti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Museo 2015 järjestelmä ja Museoiden luettelointiohjeet

Semanttinen Finlex Visio ja sen toteutus

Kirjasampo. Kaunokki-ontologia & TKK / Dipoli. Kansalliskirjaston ontologia-seminaari Kaisa Hypén

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

The OWL-S are not what they seem

SEMANTTINEN WEB JA PAIKKATIETOIHIN PERUSTUVAT PALVELUT

Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset

Kohti yhteistä toimijoiden kuvailua. KDK-tietoarkkitehtuuriryhmän seminaari Miia Herrala Kansallisarkisto

Julian graafinen annotointityökalu ja erityisontologioiden editori. Jaason Haapakoski P Kansanterveyslaitos , 28.3.

Kotitalous- ja käsityötieteiden laitoksen julkaisuja 21

FinnONTO-hanke loi ontologisen perustan kansalliselle webin tietoinfrastruktuurille

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

TerveSuomi-portaalin esittely

Skosmos 0.6 esittely. Osma Suominen ONKI-projektin laajennetun projektiryhmän kokous

Valokuva lähteenä - museoaineiston kuvailua

CIRI Ontologiaperustainen tiedonhakuliittymä

Yhteentoimivuuden eri näkökulmat

Kirjasampo [lyhyt oppimäärä]

Mikä on Finna-ikkuna/widget? Skosmoksen uusi ominaisuus joka julkaistiin Finton päivittyessä versioon 1.6

Luento 12: XML ja metatieto

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

Transkriptio:

Semantic Computing Research Group University of Helsinki Kokoelmatietojen siirto MuseoSuomi-järjestelmään Mirva Salminen mirva.salminen@cs.helsinki.fi Semantic Computing Research Group (seco) University of Helsinki & Helsinki Institute for Information Technology (HIIT) http://www.cs.helsinki.fi/group/seco/ Esityksen sisältö 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet 2. Sisällöntuotannon perusratkaisu 3. Sisällön syntaktinen yhteensopivuus 4. Sisällön semanttinen yhteensopivuus 5. Annotointiprosessin kulku 6. Yhteeveto: käytäntö ja ongelmat 1

Sisällöntuotannon lähtökohdat Kokoelmatiedot ovat heterogeenisiä: 1. Rakenteeltaan Eri museoiden tietokannat ovat erillisiä Eri museot käyttävät erilaisia tietokannan hallintajärjestelmiä MS SQLServer, Oracle, jne. Tietokantojen loogiset rakenteet taulut, kentät, tietotyypit, jne. - eroavat 2. Sisällöltään Erilaiset kokoelmat sisältävät erilaista tietoa Esim. Muinaismuistoista on erilaista tietoa kuin huonekaluista tai valokuvista Eri kokoelmia kuvaillaan eri tavoin ja eri sanastoilla Esim. Toisaalla käytetään lelu-sanaa ja toisaalla leikkikalu-sanaa Esim. Toisaalla krikettipelistä kerrotaan tarkalleen jopa pallojen, porttien ja mailojen lukumäärät Esim. Ajan 1995-1999 voi kuvata myös määreellä 1990-loppupuoli tai 1990 lp Sisällöntuotannon tavoitteet MuseoSuomi tarjoaa: Yhtenäisen julkaisukanavan webiin erilaisille kokoelmille museoesineille, taideteoksille, valokuville, muinaismuistoille Sisältöperustaisen semanttisen tiedonhaun Semanttisen suosittelun Sisällöntuotannon tavoitteena on: Tuottaa kokoelmatiedoista sellainen paketti, joka mahdollistaa MuseoSuomen tarjoaman toiminnallisuuden 2

Sisällöntuotannon tavoitteet (2) Esityksen sisältö 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet 2. Sisällöntuotannon perusratkaisu 3. Sisällön syntaktinen yhteensopivuus 4. Sisällön semanttinen yhteensopivuus 5. Annotointiprosessin kulku 6. Yhteenveto: käytäntö ja ongelmat 3

Ratkaisu: Museon tietokannasta MuseoSuomeen Resource Description Framework MuseoSuomen käyttämä tietomuoto extensible Markup Language Valinta, mitä tietoja otetaan mukaan Tietojen esitys samanlaisessa muodossa Museon tietokanta Kaikki tiedot Erilaiset tietokannat Erilainen terminologia Museon tietokanta Semanttinen yhdistäminen Eri terminologioiden yhdistäminen Esim. Pikkupöydät ovat pöytiä ja lenkkarit ovat lenkkitossuja Resurssien tunnistaminen Syntaktinen yhdistäminen Erilaisista tietokannoista samanlaiseen muotoon Esitettävien tietojen valinta Esityksen sisältö 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet 2. Sisällöntuotannon perusratkaisu 3. Sisällön syntaktinen yhteensopivuus 4. Sisällön semanttinen yhteensopivuus 5. Annotointiprosessin kulku 6. Yhteenveto: käytäntö ja ongelmat 4

Syntaktinen yhteensopivuus Mukaan valittiin sellaisia tietoja, jotka Liittyvät olennaisesti esineisiin Tuovat esille eri tietoja esineistä Todennäköisesti kiinnostavat museovierasta Ovat todennäköisesti yhteenlinkittyneitä eri esineiden välillä Valitut tiedot: MS kortti: ominaisuudet: Kohdetiedot Käyttötiedot - kohde (ArtifactType, ATW) - kayttaja (UsageActor, UAW) - materiaali (ArtifactMaterial, AMW) - kayttopaikka (UsageLocation, ULW) - kuva Kokoelmatiedot - asiasanat (ArtifactDescription, ADM) - museo - mitat - kokoelma (MuseumCollection, MCW) - kuvailu Tekotiedot - tekija (CreationActor, CAW) - valmistupaikka (CreationLocation, CLW) - valmistusaika (CreationTime, CTW) Syntaktinen yhteensopivuus (2) -muoto: Esim. <esinekortti created="2004-2-17 12:32:30"> <numero><arvo>nba:su5098:5</arvo> </numero> <kohde> <arvo>jalkineet</arvo> <arvo>kallokkaat</arvo> </kohde> <materiaali><arvo>turkis; poro</arvo> </materiaali> <mitat> <arvo>korkeus, suurin:19cm</arvo> <arvo>leveys, suurin:7cm</arvo> <arvo>pituus, suurin:26cm</arvo> </mitat> <kuvailu> <arvo>tavallisen malliset kallokkaat. Kappaleet ommeltu useammista, epäsäännöllisistä kappaleista. Jalkineen suulla epäsäännöllisen levyinen, lyhytkarvaiseksi leikattu vyöhyke.</arvo> </kuvailu> </esinekortti> 5

Esityksen sisältö 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet 2. Sisällöntuotannon perusratkaisu 3. Sisällön syntaktinen yhteensopivuus 4. Sisällön semanttinen yhteensopivuus 5. Annotointiprosessin kulku 6. Yhteenveto: käytäntö ja ongelmat Semanttinen yhteensopivuus Semanttinen yhteensopivuus merkitsee, että: Eri termistöt ovat yhteismitallisia (Esim. pikkupöydät tunnistetaan pöydiksi) Termien semanttinen epävarmuus ratkaistaan (Esim. homonymia - silkki) Yhteisiin resursseihin voidaan tunnistaa yksikäsitteisesti (Esim. paikat, toimijat) Tarkoituksena saada kokoelmien kuvailut yhteismitallisiksi sillä tavalla, että konekin ymmärtää kokoelmien väliset yhteydet ja kuvailujen sisällöt Semanttisen yhteensopivuuden kautta voidaan löytää ei vain sanojen, vaan myös käsitteiden ja esineiden väliset erilaiset yhteydet 6

Semanttinen yhteensopivuus (2) NBA ECM Materiaali: Puuvilla Asiasana: Kansallispuku Esine: leskenlakki merimieshattu Käyttäjä: Joonas Valmistusaika: Käyttöpaikka: Lahti 1991 1980-l.lp. - 1995 n. ECM Kuvien lähteet: Espoon kaupunginmuseo (ECM), Kansallismuseo (NBA) ja Lahden kaupunginmuseo () Rikastuttaminen ontologioilla Ratkaisuna on kokoelmatietojen linkittäminen ontologioihin Toisin sanoen sisältöä rikastutetaan ontologisilla metatiedoilla Yhdistäminen ontologioihin tuo: Yhteismitallisuutta nimityksiin Yhteisten resurssien yksikäsitteisen tunnistamisen Liitoksen käsiteverkkoon. Samalla kun esine liitetään yhteen käsitteeseen, se liittyy koko käsiteverkkoon ja saa samat yhteydet muihin käsitteisiin, kuin liitoskäsitteelläkin jo on. Yhteyden toisiin esineisiin. Esine liittyy käsitteiden kautta muihin esineisiin, jotka on jo liitetty käsiteverkkoon Merkitysten ja tarkoitusperien ymmärtämisen. Ontologisilla yhteyksillä voidaan kuvata käsitteiden lisäksi merkityksiä ja tarkoituksia, kuten liittää esineet tiettyihin käyttötilanteisiin tai tarkoituksiin 7

Rikastuttaminen ontologioilla (2) Puuvilla lakki Päähine hattu Kansallispuku Joonas Lahti MuseoSuomen ontologiat 8

Ontologiset ominaisuudet MS kortti: ominaisuudet: Kohdetiedot - kohde (ArtifactType, ATW) - materiaali (ArtifactMaterial, AMW) - kuva - asiasanat (ArtifactDescription, ADM) - mitat - kuvailu Tekotiedot - tekija (CreationActor, CAW) - valmistupaikka (CreationLocation, CLW) - valmistusaika (CreationTime, CTW) Käyttötiedot - kayttaja (UsageActor, UAW) - kayttopaikka (UsageLocation, ULW) Kokoelmatiedot -museo - kokoelma (MuseumCollection, MCW) MS kortti: ontologioihin sidotut ominaisuudet: Kohdetiedot - kohde (ArtifactType, ATW) - materiaali (ArtifcatMaterial, AMW) - asiasanat (ArtifactDescription, ADM) Tekotiedot - tekija (CreationActor, CAW) - valmistupaikka (CreationLocation (CLW) - valmistusaika (CTW) Käyttötiedot - kayttaja (UsageActor, UAW) - kayttopaikka (UsageLocation, ULW) - kayttotilanne (UsageEvent, UEW) Kokoelmatiedot - kokoelma (MuseumCollection, MCW) Esityksen sisältö 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet 2. Sisällöntuotannon perusratkaisu 3. Sisällön syntaktinen yhteensopivuus 4. Sisällön semanttinen yhteensopivuus 5. Annotointiprosessin kulku 6. Yhteenveto: käytäntö ja ongelmat 9

Annotointiprosessin kulku eli semanttisen metatiedon tuottaminen Ontologisten ripustusten luonti tehdään, kun tiedot ovat syntaktisesti yhtenäisiä Prosessissa tarvitaan esineiden kuvailut, ontologiat sekä ns. termiontologia Prosessissa kuvauskieli muuttuu monipuolisemmaksi: Prosessiin on tehty avuksi työkalut: Terminaattori ja Annomobiili Annotointiprosessin kulku (2) - yksinkertaisimmillaan Terminologia Ontologiat 10

Annotointiprosessin kulku (3) Annotation Creation Domain Ontology Creation DB ECM DB NBA DB DB2 DB2 DB2 ECM NBA 2 (Annomobile) ECM NBA Domain Ontologies Actors Locations Collections Times Artifacts Materials Events Upper Ontology DB2S MAO MuseumFinland (S) Knowledge Base Terms Rule Base 2 (Terminator) ECM Terms NBA Terms Terminology S2 Upper Ontology Creation Terminology Creation Annotointiprosessin kulku (4) ihmisen tehtävät osat Term Creation Process OUTPUT Advise log Cards Terminator: Term Extraction Unknown Terms Human Term Card Edit MF Global Terms Local Terms Ontologies Annomobile: 2 Advise log Human Card Edit Check Cards Cards Artifact Record Creation Process Cards 11

Esityksen sisältö 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet 2. Sisällöntuotannon perusratkaisu 3. Sisällön syntaktinen yhteensopivuus 4. Sisällön semanttinen yhteensopivuus 5. Annotointiprosessin kulku 6. Yhteenveto: käytäntö ja ongelmat Yhteenveto: Käytännön prosessi 1. Kokoelmatietojen saaminen -muotoon Tietojen valinta. Mitkä tiedot tietokannasta otetaan mihinkin -pohjan kenttään, missä järjestyksessä ja millaisessa esitysmuodossa? Miten saada tiedot tietokannasta? Luettelointimuodosta julkaisukelpoiseen asuun: tietojen monimuotoisuus ja korjaaminen, eri luetteloijilla erilaiset käytännöt Tietojen julkaisuoikeudet 2. Termien erottaminen Erottaminen hoituu automaattisesti -tiedoista: Terminaattori Erotettujen termien annotoiminen eli ripustaminen ontologioihin Mitä tehdä, jos kaikkia haluttuja käsitteitä ei löydy ontologiasta? Ontologioiden täydentäminen 3. Kokoelmatietojen ripustaminen ontologioihin Annotointiin on väline: Annomobiili Tarkastetaan Annomobiilin tuottama tulos Korjataan monimerkityksellisyydet 12

Päätös Kiitos kuuntelemisesta 13