Bibframe, ISO TC 46/SC 4 & julkishallinnon metatietopalvelu Metatietoverkoston infotilaisuus 2013-06-18 Juha Hakala
Sisältö Kongressin kirjaston BIBFRAME-hanke ISO TC 46/SC 4 ja BIBFRAME:n (mahdollinen) standardointi Metadatarekisteri ja metatietoformaatit julkishallinnon metatietopalvelussa
BINFRAME-tiivistelmä Yli 40 vuotta käytössä olleelle MARC-formaatille ollaan kehittämässä seuraajaa BIBFRAME:stä on tarkoitus tulla alaspäin yhteensopiva MARCin kanssa -> siirtymäkausi voi olla pitkäkin (mutta ei loputtoman pitkä) Kansalliskirjasto koordinoi BIBFRAME:n käyttöönottoa Suomessa ja osallistuu formaatin kehittämiseen mahdollisuuksien mukaan
BIBLIOGRAPHIC FRAMEWORK TRANSITION INITIATIVE Kongressin kirjaston hanke, 2011- Toistaiseksi mukana vain pieni joukko edelläkävijäkirjastoja, mutta ryhmää on tarkoitus kasvattaa työn edetessä Euroopasta British Library ja Saksan kansalliskirjasto Projekti on rajattu MARC 21:een, muiden MARC-formaattien mahdollinen mukaantulon on auki (ISO:n rooli?) Projektista vastaa LoC:n Network Development and Standards Office, jolla on myös MARC 21 vastuu (ja lukuisia muita formaattivastuita) Myös MARC 21:stä kehitetään edelleen; sitä ei jäädytetä, ei todennäköisesti vielä silloinkaan kun BIBFRAME on valmis, koska maailman kaikkien kirjastojärjestelmien ja kirjastotietokantojen konvertointi vie hyvin paljon aikaa
BIBFRAME, RDA ja FRBR Uuden formaatin pitää olla aidosti RDA- ja FRBR-yhteensopiva (jota MARC 21 ei ole) BIBFRAME ei käytä FRBR-terminologiaa, koska FRBR-malli otettaneen käyttöön vain kirjastoissa Neutraalilla terminologialla houkutellaan muita RDA:n soveltajia BIBFRAME-käyttäjiksi: [BIBFRAME] is designed to integrate with and engage in the wider information community while also serving the specific needs of its maintenance community Mihin wider information community viittaa?
BIBFRAME-tietomalli Teos (Work) Suunnilleen sama kuin FRBR:n teos + ekspressio Manifestaatio (Instance) Teoksen yksittäinen aineellinen ilmentymä Auktoriteetti (Authority) Henkilö, organisaatio, paikka, asiasana tms. jolla on selkeästi määritelty suhde teokseen tai sen manifestaatioon Liitännäistiedot (Annotation) Esim. kirja-arvostelu, kirjan kansikuva Sekä malli että sen suomennos ovat luonnoksia; etenkin suomenkieliset käsitteet voivat vielä elää
Liitännäistiedot BIBFRAME Annotation Model luonnos julkistettiin 30.4.2013; teksti on vielä hyvin keskeneräinen Teoksen metatietoihin voidaan linkittää arvosteluja, tekijän tietoja, sisällysluettelo, otteita tekstistä yms.; manifestaatioon kansikuva tai kustantajan tietoja Harkittavana: sisällönkuvailu, varastotiedot, provenanssi, manifestaation kunnon ja siihen kohdistuneiden tapahtumien tai (konservointi)toimenpiteiden kuvaus BIBFRAME soveltaa W3C:n RDF-määritystä, joten perinteinen selvärajainen tietue korvautuu ratkaisulla, jossa jokainen tietoelementti on linkitettävissä muualle Webiin
MARC 21 ja BIBFRAME: linjauksia MARC 21 tietue pitää voida konvertoida häviöttömästi BIBFRAME-tietueeksi, ja MARC 21 tietoelementit pitää voida konvertoida häviöttömästi BIBFRAME-tietueesta takaisin MARC 21- tietueeksi BIBFRAME-formaatista tullee MARC 21:stä hienojakoisempi (esim. suku- ja etunimelle omat tietoelementit) BIBFRAME:en tulee sellaisiakin tietoelementtejä, joita MARCformaatissa ei ainakaan vielä ole (niitä voidaan lisätä MARCformaattiin tarpeen mukaan)
MARC 21 ja BIBFRAME: avoimia kysymyksiä Osakohteet Oletan että osakohteita tuetaan jatkossakin, mutta (XML/RDFpohjainen) tekninen ratkaisu voi poiketa siitä mihin olemme tottuneet Tasojen määrää ei ole pakko rajata kahteen BIBFRAME-formaattien määrästä ei ole päätöstä Mahdollisesti vain yksi (joka kattaisi kaikki MARC 21 formaatit) Liitännäistietojen rooli Hallinnollinen metatieto Tietojen päällekkäisestä tallennuksesta eri formaatteihin (MARC 21, teknisen metadatan MIX yms., pitkäaikaissäilytyksen metatiedon PREMIS) olisi hyvä päästä eroon
BIBFRAME ja MARC 21: avoimia kysymyksiä BIBFRAME-tietueessa voi olla sellaisia tietoelementtejä, joita ei voi konvertoida ainakaan nykyiseen MARC 21 tietueeseen Lisätäänkö MARC 21:een kaikki BIBFRAME-elementit? Muutetaanko nykyisiä MARC 21 kenttiä; esimerkiksi etunimi ja sukunimi erilleen? Kongressin kirjasto rakentaa MARC 21 BIBFRAME MARC 21 konvertterit, mutta ovatko ne riittävän nopeita ja laadukkaita kopioluettelointiin? Z39.50-standardin rikastaminen BIBFRAME-piirteillä?
BIBFRAME ja MARC 21: avoimia kysymyksiä (2) Mitä tapahtuu kun metatietoja poimitaan FRBR-mallia noudattavasta järjestelmästä perinteiseen järjestelmään tai päinvastoin? Sovellusten pitää tietää, mitkä tietoelementit kuuluvat teos/ekspressiotasolle, mitkä manifestaatiotasolle Sovellusten pitää osata luoda teostietue manifestaation tiedoista, ja manifestaation kuvauksen perusta teostason tiedoista
BIBFRAME:n XML/RDF-ratkaisu BIBFRAME ei tule käyttämään hyväksi olemassa olevia RDFskeemoja, vaan sille rakennetaan oma skeema hallittavuuden maksimoimiseksi (esim. skeeman laajentaminen on helppoa) BIBFRAME-skeema on saatavilla osoitteessa http://bibframe.org/vocab.rdf Mappaukset BIBFRAME-skeemasta esim. FOAF-, SKOS- tai Dublin Coreen RDF-skeemoihin laaditaan myöhemmin Kirjastojen pilottihankkeissa on yleensä käytetty valmiita skeemoja kuten FOAF:ia, koska se helpottaa määrittelytyötä ja tietojen vaihtoa Mappaamalla BIBFRAME-skeema muihin skeemoihin päästään samaan tulokseen, mutta mutkan kautta
Projektin tilanne BIBFRAME-hanke on ollut käynnissä reilut puolitoista vuotta, mutta tekemistä on jäljellä paljon On melko varmaa ettei uusi formaatti valmistu vuoden 2013 lopussa, kuten on ollut tarkoitus Muiden MARC-formaattien suhdetta BIBFRAME:en ei ole tutkittu (NISO:n Roadmap-hanke?) Järjestelmätoimittajien kiinnostus BIBFRAME:en on ollut varsin vähäistä (poikkeuksina OCLC ja VTLS) Meillä ei ole arvioita siitä, miten paljon työtä uuden formaatin tekninen toteuttaminen vaatii (eikä sellaista voi vielä tehdäkään) Kirjastot ovat ns. odottavalla kannalla, osin tiedon puutteen vuoksi (ei tiedetä esim. miten pian formaatti valmistuu)
BIBFRAME:n soveltamisesta MARC-pohjaisen järjestelmän modernisointi BIBFRAME:lle sopivaksi voi olla iso työ, riippuen BIBFRAME-tuen luonteesta Karvalakkimalli: systeemi kykenee lukemaan ja tuottamaan BIBFRAMEa, mutta on sisäisesti MARCia Välitaso: järjestelmän sisäisestä formaatista voi tuottaa sekä BIBFRAMEa että MARCia; tietomallin tuki vain osittainen Häviötön konversio MARC 21 BIBFRAME - MARC 21 antaa toimittajille armonaikaa; siirtymäkausi voi olla pitkä mutta vaikka BIBFRAME MARC 21 konversio on häviötön, datan avoimuus vähenee muunnoksessa Antaako BIBFRAME riittävästi uusia ominaisuuksia? UKJ-hankkeen linjaukset?
Kansalliskirjaston rooli Kansalliskirjastoa on alustavasti pyydetty mukaan hankkeeseen siinä vaiheessa kun projektiryhmä laajenee KK vastaa uuden formaatin sopeuttamisesta Suomen oloihin ja käyttöönotosta (sekä RDA:n ja FRBR:n käyttöönotosta) Varmistamme sen, että formaatti on suomalaisten kirjastojen kannalta toimiva ja että valmiit konversio-ohjelmat toimivat kunnolla myös Suomessa tuotetulla MARC 21 metatiedolla Varaudumme siihen että käytännön toimiin päästään jo 2014 Tulemme informoimaan kirjastoja BIBFRAME:n edistymisestä mutta olisi hyvä saada enemmän tietoa projektista Hankkeen tiedotuslinja on ollut niukahko
ISO TC 46/SC 4 ISO:n tekninen komitea 46:n alakomitea 4 Technical interoperability vastaa kirjastoalan metatietoformaateista ja tiedonsiirtostandardeista Z39.50, ISO ILL (ja kohta SRU ja uusi ILL-standardi) ISO 2709 & MarcXchange (vaihtomuotostandardit) Dublin Core ( 15 core elements ) Tulossa Dublin Coren kaikki tietoelementit,lisäksi selvitetään mahdollisuuksia / tarvetta hallinnollisen metatiedon formaattien (PREMIS, MIX, textmd) standardointiin
ISO:n standardiprosessista Komitean (äänivaltainen) jäsenvaltio voi esittää uusia työkohteita (NWIP), joista äänestetään (yes / no / abstain); samalla jäsen kertoo osallistuuko se standardin kehittämiseen Jos työkohde hyväksytään ja tarpeeksi vapaaehtoisia löytyy, komitean pj voi nimittää työryhmän ja sille vetäjän oikeiden jäsenten ja vetäjän löytäminen oleellista Standardointiprosessi voi kestää viisikin vuotta NWIP CD DIS FDIS IS Olemassaoleva valmis standardi voidaan hyväksyä Fast track prosessina, joka alkaa FDIS-vaiheesta Standardin normatiivisiin osiin ei tehdä mitään muutoksia
BIBFRAMEn standardoinnista Standardointi (ISO:ssa) voidaan / on tarkoitus aloittaa sen jälkeen kun formaatti on valmis MARC kehitettiin aikanaan LoC:n hankkeena, kansallinen ja kv. standardointi hoidettiin jälkikäteen Kongressin kirjasto halusi kehittää MARCin seuraajankin ns. in house projektina Standardoidaanko pelkkä skeema eli metatiedon vaihtomuoto (vrt. ISO 2709 ja MARC 21) vai koko formaatti tietoelementteineen vai jotain muuta? Koko formaatti on hyvin laaja ja muuttuva dokumentti
NISO:n Roadmap-hanke NISO käynnisti (Kongressin kirjaston pyynnöstä huolimatta) vuonna 2012 Roadmap-hankkeen, jonka tavoitteena on mm. selvittää muiden MARC-formaattien ja BIBFRAME:n suhdetta Kongressin kirjastoa pyydettiin projektiin mukaan, mutta huonolla menestyksellä Projektiryhmä on iso, ja sen jäsenillä on erilaisia intressejä joiden yhdistäminen ei ole helppoa Huhtikuussa 2013 pidetystä kokouksesta ei ole vieläkään saatu yhteenvetoa; oma mielikuvani tapaamisesta on että yhteinen pohja on melko kapea Jos tuloksena on pelkkä raportti, mikä on sen painoarvo?
Julkishallinnon metatietopalvelu Metatietopalvelulla pyritään edistämään: julkisen hallinnon tietojärjestelmien (semanttista) yhteentoimivuutta, tiedon avointa saatavuutta, sähköisessä muodossa olevan tiedon löytymistä ja pitkäaikaista säilyttämistä sekä tietojärjestelmäsuunnittelun tehokkuutta. Esiselvityksen tavoitteena oli määritellä toimintamalli, organisointi ja tarvittavat palvelut
Metatietopalvelun sisältö Sanastot (tesaurukset + ontologiat) ONKI-palvelut Sanastojen ylläpito ja käyttö Ontologiapalvelut: ontologioiden julkaiseminen verkossa sekä niiden käytön mahdollistavat rajapinnat Tietorakennekirjasto JHS-sanasto, tietoelementit ja ne yhdistävä metadatarekisteri ja koodistopalvelu Skeemakirjasto Tietorakennekirjaston tietoelementeistä johdetut XMLskeemat
Metadatarekisteri Julkishallinnon metadatarekisterin perustana voisi olla esimerkiksi Vocabulary Mapping Framework eli VMF-ontologia ONKI tekniseksi alustaksi? Kuka ylläpitää KK vaiko joku muu? VMF:ään tulisi lisätä BIBFRAME:n ja kaikkien KDK:ssa käytettävien metatietoformaattien tietoelementit Formaattien tietoelementtien suhteiden määrittely helpottaa metatietojen vaihtoa sektorirajojen yli ja esim. Finnan ylläpitoa
Lisätietoja BIBFRAME-hanke + (aktiivinen) keskustelulista: http://bibframe.org/ http://listserv.loc.gov/listarch/bibframe.html Esimerkkejä BIBFRAME-tietueista ja konversioohjelma: http://bibframe.org/demos/ http://bibframe.org/tools/ Uuden sukupolven kirjastojärjestelmät: http://dx.doi.org/10.3789/isqv24n4.2012