Media- ja kulttuuripalvelut



Samankaltaiset tiedostot
Media- ja kulttuuripalvelut. Eetu Mäkelä

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

Johdanto: Semanttinen Kalevala projekti

Terveys- ja yrityspalvelutyöpajan tutkimus Eero Hyvönen, Mikko Salonoja, Reetta Sinkkilä, Osma Suominen, Antti Tani

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Kulttuurisampo. Joeli Takala. Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Finna ja ontologiat tms.

Kulttuurisampo.fi Suomalainen kulttuuri ja semanttinen web mitä, miksi ja miten?

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Kirjasampo - kaunokirjallisuuden verkkopalvelu

Automaattinen semanttinen annotointi

Kohti suomalaista semanttista webiä

Kirjasampo. Kaunokki-ontologia & TKK / Dipoli. Kansalliskirjaston ontologia-seminaari Kaisa Hypén

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

Mikä on Kulttuurisampo?...

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

Terveys- ja yrityspalveluosaprojektin tilannekatsaus

Miten avoin yhdistetty tieto saadaan verkkoon: kansallinen Linked Data Finland -hanke-ehdotus

Kirjasampo [lyhyt oppimäärä]

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

Finto-tilannekatsaus. Asiantuntijaseminaari KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Miten ja miksi asiasanastoista kehitetään ontologioita

Kim Viljanen

SPARQL-workshop. Sini Pessala Kirjastoverkkopäivät KANSALLISKIRJASTO - Kirjastoverkkopalvelut

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Semanttinen Finlex Visio ja sen toteutus

ARTIVA-pilotointi. KVP asiantuntijaseminaari Lassi Lager

Sisällönkuvailu Fennicassa. Mirja Anttila Sisällönkuvailupäivä

Juuli - julkaisutietoportaali. Asiantuntijaseminaari, Helsinki Jyrki Ilva (jyrki.ilva@helsinki.fi)

TerveSuomi.fi portaalin suunnittelu ja tekninen toteutus

Kirjastoverkkopäivät 2017 Erkki Tolonen

Finto-tilannekatsaus. Osma Suominen Kansalliskirjaston asiantuntijaseminaari

JUSTUS - Theseus integraatio

Finto palveluiden toteuttamisen alustana

FINMARC -> Marc 21 järjestelmätoimittajan puheenvuoro. Helsinki Seppo Lindström varatoimitusjohtaja

Yksinaruinen keinu. - Kirjasampo ja kaunokirjallisuuden tiedontallennus Kaunokirjallisuuden sisällönkuvailupäivä.

Kansallinen digitaalinen kirjasto Käyttöliittymä Finna Aki Lassila / Kehittämispäällikkö / Kirjastoverkkopalvelut

FinnONTO-infrastruktuurin esittely

Kuvailutyön uudet välineet ja käytännöt, case Kirjasampo

Juulin kehittäminen: tilannekatsaus

Juuli-julkaisutietoportaali

Yleinen suomalainen ontologia YSO

Historialliset paikat ja kartat

KDK-asiakasliittymä ja museot. Museo hankkeen aloitusseminaari Tapani Sainio, Kansalliskirjasto

Auktoriteettitietokanta

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Semanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen

Ontologioiden yhdistäminen YSO:oon

Linked Events. Tapahtumarajapinta. Aleksi Salonen

Juuli-julkaisutietoportaali: tilannekatsaus

Sanastot ja niiden teknisen infrastruktuurin ylläpito Juha Hakala Kansalliskirjasto

Infran omaisuudenhallinnan rajapintahanke (ja tietoportaali) Saara-Maija Pakarinen Espoon kaupunki SKTY syyspäivät 2017

Finna Johtava avoimen kulttuurin ja tieteen hyödyntämisen väylä

Finton jatko vuosina

Kansallinen digitaalinen kirjasto

Finnaa arkistoille. Aki Lassila Arkistot

WEBINAARIN ISÄNNÄT. Jarno Wuorisalo Cuutio.fi. Petri Mertanen Superanalytics.fi. Tomi Grönfors Brandfors.com

Kirjastojen kansallinen metatietovaranto KDK 2012 seminaari Terhi Mikkola, Kansalliskirjasto

Onki-projektin ohjausryhmän kokous

Paikkatietoalustahanke (MMM)

Paikkatietoyhteistyö. Mikko Lappalainen Finto-projektin laajennetun projektiryhmän kokous, KANSALLISKIRJASTO

Inspire-prosessin tilannekatsaus 01 / 2012

Yleisen suomalaisen ontologian kehitystyö

Kirjastojen kuvailutiedot Finnassa

KIRJASAMPO. Jyväskylä

YSAsta YSOon kirjastoissa: miksi ja miten

SEMANTTINEN WEB JA PAIKKATIETOIHIN PERUSTUVAT PALVELUT

PAIKANNIMISTÄ PAIKKATIETOON Kansalliskirjaston paikannimisanastojen nykytilanne ja uudistustarpeet

Erikoisontologioiden kuulumisia. Finto-projekti: Laajennetun projektiryhmän kokous Tuomas Palonen, tietoasiantuntija

Linkitetyn semanttisen paikkatiedon käyttö ja käyttöliittymät. Eetu Mäkelä

Valtakunnallinen kehittämistehtävä Matti Sarmela

Paikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com

Testausraportti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Pysyvä ja muuttuva A:sta O:hon sisällönkuvailussa. Mirja Anttila Kansalliskirjasto

Linked Data Finland: visio, missio ja toteutus

Millainen on menestyvä digitaalinen palvelu?

ONKI3 vs. ONKI Light. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

KAMUT: Muistiorganisaatioiden tietovarannot yhteiskäyttöön. ÄLYÄ VERKOSSA - WEB INTELLIGENCE Tiedekeskus Heureka, Vantaa

Semanttisen Webin mahdollisuudet yrityksille

Avoin data, avoimet rajapinnat ja tietojen linkitys. Osma Suominen Suomi.fi

ARTOn / ARTIVAn hyödyntäminen julkaisutiedonkeruussa

Kansalliset kehittämishankkeet: Etenemissuunnitelmat

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Kansallinen yhteisluettelo kirjastojen luettelointiyhteistyön tukena. Pori Nina Hyvönen

FinnONTO-hanke loi ontologisen perustan kansalliselle webin tietoinfrastruktuurille

Maankäyttöpäätöksethanke. Paikkatiedon Palvelualusta

Yhteisöllinen semanttinen web 2.0 FinnONTO 2.0 -hankkeen visio ja tulokset

Yhteenvetoa RDA-koulutuspäivistä. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.fi

Yhteentoimivuusvälineistö

Internet jolla on merkitystä

WEBINAARI Mitä Tag Management on käytännössä ja miten se vaikuttaa analytiikkaan?

Liikenneverkot-tietotuote

Kirjastojen kansallinen metatietovaranto -hanke Yleisten kirjastojen projekti

Transkriptio:

Media- ja kulttuuripalvelut Eetu Mäkelä Harri Hämäläinen, Joonas Laitio, Aleksi Lindblad, Katariina Nyberg, Tuomas Palonen, Ville Piiparinen, Reetta Sinkkilä, Osma Suominen

Tutkimussuunnitelmassa asetetut teemat / tavoitteet Media/kulttuurialan sanasto- ja skeemainfrastruktuurin yhdistäminen ja tuotanto FinnONTO:oon Kulttuuripalveluiden hyödyntäminen matkailualalla ja mobiilisti --Kulttuurisampo semanttisena palvelualustana Linked Datan ja Wikipedian kaltaisen yhteisöllisten avointen aineistojen hyödyntäminen yritysten ja julkisten organisaatioiden palveluissa Caset: Kirjasampo, KOMEA, CultureGuide (SUBI) Muut teemat ja tavoitteet: elämäkerrat, MarcXML-muunnin, semanttinen tapahtumakalenteri

Media/kulttuurialan sanasto- ja skeemainfrastruktuuri Valmiita: Aikakausilehtisanasto Kaunokirjallisuuden sisällönkuvailuontologia KAUNO Kulttuurintutkimuksen ontologiat KTO/KITU/KULA Suomen ajallinen paikkaontologia SAPO Paikka/POI-tyyppiontologia Elämäkertaontologia, skeema ja aineistoja (Tuomas, Katariina) Kulttuurialueen skeemat (Harri, Eero) Paikkarekisteri Toimijatyyppiontologia Toimijarekisteri

Kulttuurisampo semanttisena palvelualustana Tehty & tuotannossa Kirjasampo&SUBI-caseissa: LOD-selailurajapinta SPARQL-rajapinta ONKI-WS-rajapinta teksti/moninäkymähaku-rajapinta Leijukerajapinta georajapinta Hakurajapintojen kehitys Kirjasampo&SUBI-casejen tarpeiden mukaan (Eetu)

Linked Datan ja Wikipedian kaltaisten yhteisöllisten avointen aineistojen hyödyntäminen Tehty: Aineisto (300 miljoonaa kohdetta, 4 miljardia tietoalkiota) ladattu & käytössä Kirjasampo & SUBI-caseissa (erityisesti paikka- ja toimija-aineisto) Aineiston analyysi ja erotus sekä lisäaineiston muunto SUBI&KOMEAcasejen tarpeisiin (Harri) EMO/SAHA-kytkentä, SAHA validointi- ja korjausvälineenä (Joonas) Väline, joilla viitekäsitteissä esiintyviä ongelmia (samasta käsitteestä monta versiota, monta käsitettä virheellisesti yhdistetty, puuttuvat viitekäsitteet) voidaan annotoinnin yhteydessä ratkoa

Case Kirjasampo Tehty: Tietomalli Sisällön syöttö Selailurajapinta Ensimmäinen versio hakurajapinnasta (Eetu) Kansikuvatallennuksien uudelleentoteutus (Eetu) Aineistoon tehtävät korjausajot (Eetu, Mysema) Hakurajapinnan viilaus (Eetu) BTJ-sisällöntuotantoputken integrointi (Eetu) [demo]

Case KOMEA Tehty: Relevantin aineiston haravointi LOD-aineistosta, uuden liittyvän aineiston haalinta (RKY, muinaismuistorekisteri) (Harri) Skeemojen viimeistely SAHA-projektin pystyttäminen

Case CultureGuide (SUBI) Tehty: Aineistojen haalinta Käyttöliittymien ja toiminnallisuuksien suunnittelu Päivittyvien tapahtuma-aineistojen päivitys- ja rikastusputki ja raportointi (Osma) Integrointi-, käyttöliittymä- ja algoritmityö (Eetu, Aleksi) Lisätuki aineiston integrointiin Laadukkaiden skeemojen viimeistely ja laadukkaan esimerkkiaineiston syöttö käsin

Elämäkerrat Tehty: Annotoidaan esimerkkitapahtumia (Tuomas ja Katariina) Mietitään ihmisen elämän olennaiset tapahtumatyypit (syntymä, naimisiinmeno, koulutus, palkinnot ja tunnustukset, ) ja kehitetään tästä tyyppiontologia Mietitään tapahtumien olennaiset tekijät (paikka, aika, muut yhteydet...) ja kehitetään tästä skeema Yritetään päätellä tapahtumia automaattisesti tekstistä (kansallisbiografia,...)

SKS:n 6000 biografiassa 100 useiten esiintyvää verbiä

Semanttinen tapahtumakalenteri Tehty: Aineistonlouhintaohjelmat Tapahtumaskeema Automaattinen sisällönkuvailu (Joonas, Reetta, Osma) Aineistojen päivitysinfrastruktuuri & raportointi (Osma) EvenemaX-aineiston tarkempi käsittely, erityisesti eri kieliversioiden suhteen

MarcXML-muunnin Tehty: MarcXML->RDF muunnin HelMet-aineistojen muunnos Arto- ja Helka-aineistojen muunnos (Ville) Muuntimen viimeistely ja muunnoksen analyysi

MarcXML-muunos aineistoista Helmet Pääkaupunkiseudun kirjastojen aineistotietokanta ~1,9Gb ~681 000 tietuetta ~200 käytössä olevaa kenttää Arto Kotimainen artikkeliviitetietokanta ~0,7Gb ~250 000 tietuetta ~100 käytössä olevaa kenttää Helka Helsingin yliopiston kirjaston aineistotietokanta ~1,0Gb ~360 000 tietuetta ~150 käytössä olevaa kenttää

MarcXML-muunos ongelmista Ongelmia kaikissa aineistoissa Helkassa vähiten, Helmetissä eniten Sulkeet ja pilkut nimissä yms. <datafield tag="260" ind1=" " ind2=" "> <subfield code="a">helsinki :</subfield> <subfield code="b">kuva ja sana,</subfield> <subfield code="c">2000</subfield> <subfield code="e">(saarijärvi :</subfield> <subfield code="f">saarijärven offset)</subfield> </datafield> Kenttien väärinkäyttö Esim. kentät 321 ja 310 kertovat nykyisestä ja aikaisemmasta julkaisutiheydestä. Alikentän a pitäisi sisältää julkaisutiheys ja alikentän b kertoa milloin julkaisutiheys on ollut voimassa Kuitenkin aineistoissa kentässä 310a on esim. kaksi kertaa vuodessa ; 1992- kerran vuodessa. Alikenttää b käytetty vain Helkassa, ja sielläkin vain kuusi kertaa

Bonus: YLE Elävän Arkiston asiasanat Testattu asiasanojen automaattista peilausta SeCon ontologia- ja LOD-käsitteistöihin 16661:sta asiasanasta 11153 löysi vähintään yhden vastineen (67%). Vastineettomista suuri osa nimiä ja ruotsinkielisiä asiasanoja Vastineet: KOKO 8200 vastinetta (arkkitehdit, globalisaatio, hanuristit, asbesti, arvonimi, ruoho, haaparousku, haikara, hankiralli) DBPedia 12878 vastinetta (Che Guevara, Amos Andersonin taidemuseo, Amorphis, Anni Swan, Ardennien taistelu, globalisaatio, asbesti, arvonimi, haikara, hankiralli, asana) SUO 1092 vastinetta SAPO 315 vastinetta Geonames 2900 vastinetta Ei vastineita: Hannu Taanila, Hannu Taanilan sävelradio, handsfree, handdocka, handarbete, grädde, glada sångballong, Gin Long Drink, funktionalismi