Open > Link > GO Avointa linkitettyä dataa kirjastomaailmassa

Samankaltaiset tiedostot
Avoin data Avoin kirjasto Kuvailupäivät

TP1: Metatietovaranto-konsepti muuttuvassa ympäristössä

Kirjastoverkkopäivät Marja-Liisa Seppälä Kansalliskirjasto

Juha Hakala Kansalliskirjasto

BIBFRAME-hankkeen tilannekatsaus

RDA, BIBFRAME, Melinda kuinka kuvailutyö uudistuu

Bibframe, ISO TC 46/SC 4 & julkishallinnon metatietopalvelu. Metatietoverkoston infotilaisuus Juha Hakala KIRJASTOVERKKOPALVELUT

Tieto matkaa maailmalle

Auktoriteettitietokanta

ISNI-järjestelmä. Sähköisten sisältöjen aamupäivä Maarit Huttunen. KANSALLISKIRJASTO - Tutkimuskirjasto

DATAN AVAAJAN PIKAOPAS

Fennica linkitettynä datana tilannekatsaus. Osma Suominen Tietomalliryhmän kokous

Avoin tieto kirjastojen, arkistojen ja museoiden mahdollisuutena. To infinity & beyond

Semanttinen Finlex Arttu Oksanen ( )

Kansallinen yhteisluettelo kirjastojen luettelointiyhteistyön tukena. Pori Nina Hyvönen

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Tavoite : Yhteinen metatietovaranto kaikille Suomen kirjastoille

DATAN AVAAJAN PIKAOPAS

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

Kuvailevan metatiedon sisällöllinen muutos

Asteri-auktoriteettitietokannan esittely. Minttu Hurme / KVP, tietojärjestelmät Kuvailun tiedotuspäivät

Kirjastojen kansallinen metatietovaranto -hanke Yleisten kirjastojen projekti

Kansallisen metatietovarannon (yhteisluettelo) tilannekatsaus. Nina Hyvönen Linnea2-konsortio

YSAsta YSOon kirjastoissa: miksi ja miten

Kirjastojen kansallinen metatietovaranto KDK 2012 seminaari Terhi Mikkola, Kansalliskirjasto

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Kansallinen metatietovaranto sisältöjä ja jaettua osaamista. Nina Hyvönen

Metatieto mihin ja miten? Juha Hakala Helsingin yliopiston kirjasto

ASIAKASLIITTYMÄ. Erikoiskirjastokokous Ari Rouvari Kansalliskirjasto

Kansallinen yhteisluettelo tilannekatsaus ja toimintasuunnitelma Nina Hyvönen

CC0-lisenssi: case Finna

Kuvailusäännöt, formaatti ja kirjastojärjestelmä

Linked Events. Helsingin tapahtumarajapinta. Aleksi Salonen

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

Valtion uudet yhteentoimivuuspalvelut: dataportaali, palvelutietovaranto ja yhteentoimivuus.fi v.2

Muutosten vuosikymmen

Yhteenvetoa RDA-koulutuspäivistä. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.fi

Uudet kuvailusäännöt (RDA) tulevat. Erikoiskirjastojen neuvoston kokous Marja-Liisa Seppälä

Katsaus kansainväliseen ja kansalliseen tunnistetilanteeseen (ISBN, ISSN, ISNI)

E-aineisto Melindassa

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

RDA-käyttöönoton tuomat muutokset. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.fi

Käsitemallit RDA-sääntöjen taustalla. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.fi

Yhteentoimiva.suomi.fi - palvelukokonaisuuden ja työkalujen esittely

Nimiauktoriteetit Nimien tunnisteet. Kuvailun tiedotuspäivä Maarit Huttunen

Kuvailun muutoksen visualisointi Marja-Liisa Seppälä / Kansalliskirjasto

Teokset Fennicassa. Osma Suominen

KDK: Finna ja pitkäaikaissäilytys

Luento 12: XML ja metatieto

Aineistoentiteettien ensisijaiset suhteet. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.fi

Kansallinen yhteisluettelo tilannekatsaus ja toimintasuunnitelma Nina Hyvönen

Avoimet lisenssit. Katsaus Creative Commons -lisensointiin. Työelämäpedagogiikan webinaari

Kirjaston vastaus informaatioympäristön muutokseen : Semanttinen web, ontologiat ja standardit osana kirjastojen tiedonhallinnan infrastruktuuria

SPARQL-workshop. Sini Pessala Kirjastoverkkopäivät KANSALLISKIRJASTO - Kirjastoverkkopalvelut

FINMARC AUKTORITEETTIFORMAATTI

Linked Events. Tapahtumarajapinta. Aleksi Salonen

Kansalliset kehittämishankkeet: Etenemissuunnitelmat

UKJ nyt. FUCIO:n kevätkokous Ari Ahlqvist

RDA (Resource Description and Access) & FRBR-käsitemalli

UUSI ARKKITEHTUURI PAREMMAT PALVELUT. Järjestelmäarkkitehtuurihankkeet

Kirjastoverkkopalvelut A V A I N L U V U T

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Kansallinen digitaalinen kirjasto missä mennään? Kristiina Hormia-Poutanen

Arkistolaitos ja avoin tieto. Kohti avointa ja kestävää tietoa -seminaari Mikkelin ammattikorkeakoulu Tytti Voutilainen

Aihe-entiteettien ominaisuuksien ja suhteiden merkitseminen. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.

Fennican RDF-konversio. Osma Suominen

Fennica Melindassa. Melinda-tietoisku Kiti Vilkki-Eriksson Kansalliskirjasto

RDA-kuvailun keventäminen. Melinda-päivä Marja-Liisa Seppälä Kuvailusääntöpalvelu

ISNI-järjestelmän ja Asteritietokannan

Avoin data, avoimet rajapinnat ja tietojen linkitys. Osma Suominen Suomi.fi

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

CASE HELSINKI: PALVELUTIETOVARANTO (PTV) JA PALVELUNÄKYMÄN KARTTAIKKUNA

Käyttöoikeuksien metatieto

Ohjelmien lisensoinnista

YSAn auktorisointi - Helka-tietokanta. Ville Huhtala, Helsingin yliopiston kirjasto Sisällönkuvailupäivä

Lauri Roine. BIBLIOGRAFISEN VALVONNAN UUSIA TUULIA: RDA-luettelointisäännöstön ja Bibframe-luettelointiformaatin nykytilanne ja tulevaisuudennäkymiä

KOKOELMIEN AVAAMINEN VERKOSSA

KOPIOLUETTELOINTI KANSALLISKIRJASTON TIETOKANNOISTA

Avoin data ja Tampereen paikkatietoinfrastruktuuri

Kansallinen digitaalinen kirjasto - toiminnan säädöspohja. Tekijänoikeusneuvos Viveca Still

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Pikaperehdytys Nelli-palveluihin

RDA mitä, miten, milloin. Asiantuntijaseminaari Marja-Liisa Seppälä

FINMARC -> Marc 21 järjestelmätoimittajan puheenvuoro. Helsinki Seppo Lindström varatoimitusjohtaja

Kansallisen metatietovarannon (yhteisluettelo) tilannekatsaus. Nina Hyvönen OKM Kirjastopäivät

MS. Kirjastot.fi 2012

Avoin tiede ja tutkimus TURUN YLIOPISTON JULKAISUPOLITIIKKA

Kirjastojen uuden taustajärjestelmän hankinta Mitä Voyagerin jälkeen? Päivikki Karhula Eduskunnan kirjasto

Kansallinen digitaalinen kirjasto Käyttöliittymä Finna Aki Lassila / Kehittämispäällikkö / Kirjastoverkkopalvelut

Kirjastoverkkopalvelut Tulokset, avainluvut ja kohokohdat KANSALLISKIRJASTO

Julkaisuarkistojen yhteentoimivuus

Marianne Hacklin MARC-LUETTELOINTIFORMAATIN JA BIBFRAME-LUETTELOINTIMALLIN VERTAILEVA ANALYYSI

OJS-palvelun kehittäminen. Artiva-seminaari Johanna Lilja

Semanttinen web. miksi "normi-web" ei riitä? Petri Tonteri, ,

Kansallinen digitaalinen kirjasto KDK Miten se palvelee?

labs.kirjastot.fi Antti Pakarinen Timo Tuominen

Kuntien yhteentoimivuusseminaari. Tietomallien laatiminen Taina Nurmela projektipäällikkö, Helsingin kaupunki

Transkriptio:

Open > Link > GO Avointa linkitettyä dataa kirjastomaailmassa Kirjastoverkkopäivät, 25.10.2012 Laila Heinemann Tietojärjestelmäasiantuntija, Kansalliskirjasto/Kirjastoverkkopalvelut laila.heinemann (at) helsinki.fi

Kirjastoissa avattavaa dataa? Osoite- ja aukiolotiedot Palvelutiedot (lukusali, satutunnit, musiikkiosasto, kotipalvelu jne.) Tapahtumatiedot Bibliografinen metatieto Auktoriteettitiedot (asiasanastot, tekijät jne.) Digitoidut aineistot (HUOM! tekijänoikeus) Lainaustiedot (HUOM! anonyymit)

Avoin linkitetty data AVOIN DATA LINKI- TETTY DATA

Avoin data = Open data tarkoittaa yksinkertaisesti dataa, joka on vapaasti käytettävissä ja kierrätettävissä avoimella lisenssillä Creative Commons 0, CC Attribution 3.0, ODC-BY tms. periaatteellinen/poliittinen kysymys Valtioneuvoston suositus Julkishallinnon tietoluovutusten periaatteet ja käytännöt: http://www.vm.fi/vm/fi/04_julkaisut_ja_asiakirjat/01_julkaisut/076_ict/20120208julkis/name.jsp

Linkitetty data = Linked data tarkoittaa tietoelementtejä, jotka on linkitetty toisiinsa on seuraava askel internetin loogisessa jatkumossa linkitetyt palvelimet > linkitetyt dokumentit > linkitetyt tiedot tietomalli ja sen tekniset toteutukset tekninen kysymys

Avoin linkitetty data = Linked open data (LOD) dataa, joka on avattu sellaisessa muodossa, että myös muut järjestelmät pystyvät hyödyntämään sitä sitä voidaan laajentaa, kierrättää ja yhdistellä edelleen eri sovelluksissa toiminnallinen kysymys

Kuva: http://www.cafepress.com/w3c_shop.480759174

Viiden tähden avoin data saatavilla verkossa avoimella lisenssillä saatavilla koneluettavassa rakenteisessa muodossa (esim. excel-taulukkona eikä vain kuvana siitä) saatavilla koneluettavassa rakenteisessa ja järjestelmäriippumattomassa formaatissa (esim. CSVnä eikä excelinä) MARC edellisen lisäksi on käytetty avoimia standardeja (RDF ja SPARQL) identifioimaan tietoja, niin että julkaistuun dataan voidaan viitata Kaiken edellisen lisäksi: data on linkitetty muiden dataan jotta se liittyy oikeaan kontekstiin

Datan avaamisen esteitä?

Oikeudet Tekijänoikeudet Liittyy kokoteksteihin ja digitaalisiin objekteihin Metatietoon ei Suomen lainsäädännön mukaan ole tekijänoikeuksia Omistusoikeudet Kokonaiseen tietokantaan voi olla tietokantaoikeus > ei saa imuroida/jakaa edelleen huomattavaa osaa Metatieto-oikeuksia voi olla rajoitettu ulkopuolisen tiedontuottajan kanssa solmituissa sopimuksissa (esim. vain käyttöoikeus, mutta ei luovutusoikeutta)

Raha (Meta)tieto ei synny itsestään kuka kustantaa sen tuottamisen? Valtionhallinnossa tahtotila, että valtion olisi katettava budjettivaroin julkisen avoimen tiedon tuotantokustannukset (ei vielä käytännössä toteutunut kattavasti) Ei ota kantaa kaupallisen toimijan tuottaman datan ostokustannuksiin

RDA ja BIBFRAME : 2 askelta kohti linkitettävyyttä

RDA-tietomalli Perustuu tietoelementtien linkitykseen = sama logiikka kuin RDF-mallinnuksessa Otetaan tuotantokäyttöön pilottikirjastoissa jo 2013 Kongressin kirjasto 31.3.2013 British Library, Deutsche Bibliothek Hanke käynnistynyt Kansalliskirjastossa > käyttöön 2015? Ongelmana vanhentuneet kirjastojärjestelmät, jotka eivät pysty hyödyntämään täysimittaisesti Sanastoa ja tunnisteet: http://rdvocab.info/

Esimerkki RDF-mallinnuksesta (Osa URI-tunnisteista kuvitteellisia) Kuva: Autio-Tuuli & Seppälä, Tietolinja 2/2010 http://urn.fi/urn:nbn:fi-fe201012143106

FINMARC > MARC 21 > BIBFRAME?? Nykyinen MARC-formaatti ei sellaisenaan sovellu linkittämiseen, mm. Liian karkea rakenne Kielisidonnaisia määreitä Kaikki tieto yhdessä tietueessa Bibliographic Framework Transition Initiative = BIBFRAME Pyrkimys luoda FRBR/RDA-pohjainen formaatti RDF-yhteensopiva Tiedot voidaan konvertoida vanhasta MARCista ilman hävikkiä http://www.loc.gov/marc/transition/

Deconstructing MARC Identifying MARC Resources (MARCR) Kuva: Sally McCallum, IGeLU 2012 http://igelu.org/wp-content/uploads/2012/09/igelu-sally-mccallum.pptx

Kuva: Sally McCallum, IGeLU 2012

Muna vai kana? Kannattaisiko odottaa ensin uutta luettelointiformaattia? Toistaiseksi (lähes) kaikki ovat keksineet oman pyöränsä Uutta luettelointiformaattia testaavat ensimmäiseksi ne kirjastot, jotka ovat jo julkaisseet dataansa linkitettynä

Avoimesti ja linkitettävästi julkaistua (kirjasto)maailmalla

Europeana Yhteiseurooppalainen kulttuuriaineistojen portaali Mukana satoja kirjastoja, museoita, arkistoja ja muita kulttuurialan toimijoita Suomessa KDK-hanke välittää sisältöjä myös Europeanaan Data on julkaistu kahden RDF-syntaksin mukaisesti: RDF/XML ja N- Triples. Europeana-portaalissa se on myös RDFa-muodossa http://www.pro.europeana.eu/web/guest/re-use-data

OCLC Julkaistu WorldCatin bibliografisista tietueista yleisimmät (= teos vähintäin 250 kirjaston kokoelmissa) Yhteensä 1,2 miljoonaa tietuetta > n. 80 miljoonaa triplettiä Seuraavassa vaiheessa julkaistaan Dewey Decimal Classification System, FAST (Faceted Application of Subject Terminology) ja VIAF (Virtual International Authority File) Data on julkaistu RDF-muodossa käyttäen Schema.org ontologiaa sekä sen laajennuksia, jotka on rakennettu itse yhdessä yhteistyökumppanien kanssa http://www.oclc.org/us/en/news/releases/2012/201252.htm

Library of Congress Tarjoaa Kongressin kirjaston tuottamia standardeja ja sanastoja, jotka ovat jo olleet avoimesti selattavissa auktoriteettitietoja: subject headings, nimet, luokitukset, maantieteelliset alueet jne. Seuraavassa vaiheessa tulossa lisää sanastoja jotka liittyvät PREMIS-, MARC-, MODS-, METS-, ja MIX-standardeihin. http://id.loc.gov/

LC:n palvelu tarjoaa käyttäjille (sekä inhimillisille että koneellisille) Ilmaisen pääsyn dataan Rakenteisen pääsyn yksittäisiin tietoelementteihin Mahdollisuuden ladata kokonaisia sanastoja ja niiden arvojoukkoja erilaisissa formaateissa Mahdollisuuden linkittää omia metatietoja Kongressin kirjaston tietoelementteihin Yksinkertaisen REST-rajapinnan, jonka kautta aineistoja voi hakea verkon yli Selkeät lisenssi- ja käyttöehdot jokaiselle sanastolle Yhteisen kanavan, jonka kautta pääsee käsiksi kaikkien Kongressin kirjaston osastojen dataan Mahdollisuuden visualisoida käsitteiden ja arvojoukkojen välisiä suhteita

Bibliothèque National de France Tarjoaa valikoituja FRBR entiteettejä: tekijät, teokset ja aiheet Palvelu oli alunperin tarkoitettu ihmisluettavia selaimia varten, mutta samalla toimii myös koneluettavasti Kaikki datasetit ovat ladattavissa RDF-dumppeina Linkitetty sekä BNF:n omiin aineistoihin (yleiskokoelman luettelo, arkistoaineistojen ja käsikirjoitusten luettelo, Gallica jne.) että ulkopuolisiin (Ranskan tieteellisten kirjastojen yhteisluettelo Sudoc, WorldCat, Wikipedia jne.) http://data.bnf.fr/semanticweb-en

BNF:n tietomalli yksinkertaistettuna Kuva: http://data.bnf.fr/semanticweb-en

British Library Tarjoaa version kansallisbibliografiasta Toistaiseksi julkaistut monografiat ja kausijulkaisut Tulevaisuudessa kate laajennetaan myös muihin teoksiin ja julkaisujen ennakkotietoihin Noin 2,8 miljoonaa tietuetta, joista on generoitu noin 87.700.000 triplettiä Julkaistu Talisin alustalla http://www.bl.uk/bibliographic/datafree.html

British Libraryn malli monografioille Lähde: http://www.bl.uk/bibliographic/pdfs/bldatamodelbook.pdf

Muita (esim.) Deutsche Bibliothek Gemeinsame Normdatei (= Auktoriteettitietokanta) ja bibliografinen metadata http://www.dnb.de/en/service/digitaledienste/linkeddata/linkeddata_node.html Dansk Bibliotekscenter Tekninen ratkaisu sama kuin British Librarylla

Kansalliskirjaston avoin data Asiasanastot (YSA, Allärs, MUSA/Cilla) Saatavana RDF- ja SKOS-muodossa ONKI-palvelun kautta http://onki.fi/fi/browser/ Tulossa Nimiauktoriteetit (kunhan ensin saadaan ylipäätään tuotantoon) Selvitettävänä Metatietovarannon bibliografinen data

Lisätietoa Open Bibliographic Data Guide: http://obd.jisc.ac.uk/ Open Knowledge Foundation (OKF) Working Group on Open Bibliographic Data: http://wiki.okfn.org/wg/bibliography W3C Library Linked Data Incubator Group: http://www.w3.org/2005/incubator/lld/