Julkaisuarkiston OAI-yhteensopivuus

Samankaltaiset tiedostot
Julkaisuarkistojen yhteentoimivuus

CERN Workshop on Innovations in Scholarly Communication (OAI4) the OAI-PMH

Metadatasuositus julkaisuarkistojen tekstiaineistoille

JYX yliopiston palvelujen keskiössä. Pekka Olsbo Julkaisukoordinaattori Jyväskylän yliopiston kirjasto

Tutkimus vapaaksi verkkoon! seminaari, Helsingin yliopisto, Jyrki Ilva

ARTIVA-seminaari

W3C-teknologiat ja yhteensopivuus

Kirjastoverkkopäivät 2017 Erkki Tolonen

Kansalliskirjaston julkaisuarkistopalvelut. Jyrki Ilva Erikoiskirjastojen neuvosto,

Heikki Helin Metatiedot ja tiedostomuodot

OpenSearch-, RSS- ja ATOM-feedit Kansalliskirjaston julkaisuarkistoissa

PAS-tilanne ja julkaistujen opinnäytteiden pitkäaikaissäilytykseen liittyvä prosessi ja edellytykset

HY:n alustava ehdotus käyttäjähallintotuotteesta

Open Journal Systems digitoitujen aineistojen tallennusalustana ANTTI-JUSSI NYGÅRD SUUNNITTELIJA, TIETEELLISTEN SEURAIN VALTUUSKUNTA

OPEN ACCESS HELSINGIN YLIOPISTOSSA

XML Finland seminaari : Office 2007 XML dokumenttituotannossa

OpenSearch-, RSS- ja ATOM-feedit Kansalliskirjaston julkaisuarkistoissa

TIEKE Verkottaja Service Tools for electronic data interchange utilizers. Heikki Laaksamo

- kaksi vuotta amkien yhteisen julkaisuarkiston koordinointia

Action Request System

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Järjestelmäarkkitehtuuri (TK081702)

Sähköisten materiaalien käyttö tableteilla

KDK-ajankohtaispäivä museoille

Käyttöohje. MAITO metadatan hallintatyökalu. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

THL:N NÄKÖKULMIA TUTKIMUSAINEISTOJEN SÄILYTTÄMISEEN

Digitaalisen median tekniikat xhtml - jatkuu Harri Laine 1

Talonmiehen tuokio klo KANSALLISKIRJASTO

Tutkimusdatan pitkäaikaissäilytys ATT-hankkeessa.

MichaelPlus. Hankkeen esittely Mikael Vakkari Suunnittelija MichaelPlus hanke

Digitaalisen median tekniikat xhtml - jatkuu

OJS-palvelun kehittäminen. Artiva-seminaari Johanna Lilja

Summon tehokas monihaku

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

HY:n ehdotus käyttäjähallintotuotteesta

Written by Administrator Monday, 05 September :14 - Last Updated Thursday, 23 February :36

Muusa ja KDK:n asiakasliittymä

Mitä on Julkaisuarkisto

in condition monitoring

Kirjastoverkkopäivät, DSpace-sessio, Jyrki Ilva

egradu & Muuntaja Ylemmän tutkintovaiheen opinnäytetöiden elektroninen arkistoiminen ja esilletuonti

KODAK EIM & RIM VIParchive Ratkaisut

Nelli-portaali ja verkko-oppimisympäristöt

ASIAKASLIITTYMÄ. Erikoiskirjastokokous Ari Rouvari Kansalliskirjasto

Koordinaattimuunnospalvelu

Digitaalisen median tekniikat xhtml - jatkuu

Tieto matkaa maailmalle

Kirjastojen kuvailutiedot Finnassa

Rinnakkaistallennuksen arkea, haasteita ja mahdollisuuksia

W3C ja Web-teknologiat

INSPIRE Toimeenpanosääntö ja tekninen ohje Muunnospalvelu Koordinaattimuunnospalvelu


Alkuraportti. LAPPEENRANNAN TEKNILLINEN YLIOPISTO TIETOJENKÄSITTELYN LAITOS Ti Kandidaatintyö ja seminaari

TSV:N AJANKOHTAISTA JULKAISEMISESSA -PÄIVÄ SÄHKÖKIRJOJEN TUOTANTO -TYÖPAJA epub aloittelijoille

ja Jyväskylän yliopisto

2. PEHMEÄ XHTML XRAJAHTML

Metatieto mihin ja miten? Juha Hakala Helsingin yliopiston kirjasto

TTA, PAS ja julkishallinnon standardisointi

Tekstinkäsittelystä. H4: Tekstinkäsittelyn perusharjoitus. Toimisto ohjelmista

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Open access Suomessa 2013? Avoin tiede -keskustelutilaisuus, Jyrki Ilva

Järjestelmäriippumattomia siivousohjeita

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus

Open Journal Systems digitoitujen aineistojen tallennusalustana ANTTI-JUSSI NYGÅRD SUUNNITTELIJA, TIETEELLISTEN SEURAIN VALTUUSKUNTA

Neoxen Systems on suomalainen ohjelmistotalo. Olemme erikoistuneet tiedon- ja oppimisen hallinnan ratkaisuihin.

COUNTER-tilastosuositukset - Code of Practice for Journals and Databases, Release 3 - Code of Practice for Books and Reference Works, Release 1

HY:n alustava ehdotus käyttäjähallintotuotteesta

W3C ja alueellinen standardointi

Kansallinen digitaalinen kirjasto ja arkistopalvelut

Kokemuksia. aineistojen paketoinnin piloteista. KDK-pitkäaikaissäilytys seminaari

Johdatus rakenteisiin dokumentteihin

Putteri Käyttöliittymä ja ulkoasu

ARTOn / ARTIVAn hyödyntäminen julkaisutiedonkeruussa

Järjestelmäarkkitehtuuri (TK081702) Web Services. Web Services

Kansainvälinen Open Access -viikko avoimuuden asialla. Holopainen, Mika.

Laitteessa tulee olla ohjelmisto tai uudempi, tarvittaessa päivitä laite

Miten voin selvittää säästömahdollisuuteni ja pääsen hyötymään niistä?

Attribuutti-kyselypalvelu

Tikon Ostolaskujenkäsittely versio SP1

Digitaaliseen säilytykseen hyväksyttävät tiedostoformaatit

Avoin tiede ja tutkimus TURUN YLIOPISTON JULKAISUPOLITIIKKA

Uloskirjautuminen Shibbolethissa

Julkaisuarkistot ja tutkimustietojärjestelmät

3 Verkkosaavutettavuuden tekniset perusteet

KYSELYPALVELU HARAVA. Tietoisku. Dimenteq Oy. Julkinen Dimenteq Oy 2012

Contents AdsML ympäristö... 2 AdsML Testi ympäristö... 2 AdsML tuotantoympäristö... 2 AdsML käyttöliittymä... 3 Kirjautuminen...

10 Nykyaikainen WWW-arkkitehtuuri

Julkaisuarkistot ja rinnakkaisjulkaiseminen

Julkaisujen, aktiviteettien ja uutisten tietojen tallennus LaCRISjärjestelmään

Avoimen tieteen palvelujen kehittäminen Tampereen yliopiston kirjastossa. Tampereen kirjastopäivät

Helsingin yliopisto/tktl DO Tietokantojen perusteet, s 2000 Johdanto & yleistä Harri Laine 1. Tietokanta. Tiedosto

TEEMA 3 TEKSTIDATAN KÄSITTELY JA JULKAISEMINEN LUENTO 5 TEKSTINKÄSITTELY

Open access FinELibin neuvotteluissa: Tutkijan näkökulma

Sivuston tiedotmysiteworthcheck.com

T Hypermediadokumentin laatiminen. Sisältö. Tavoitteet. Mitä on www-ohjelmointi? Arkkitehtuuri (yleisesti) Interaktiivisuuden keinot

Paikkatietotuotteet ja niiden määrittely

Office ohjelmiston asennusohje

Järjestelmäriippumattomia siivousohjeita

Versionhallintaa. Versionhallinnan käyttöönotto SAS ympäristössä

Mitä PAS-järjestelmä tarkoittaa museoille?

Transkriptio:

Julkaisuarkiston OAI-yhteensopivuus Rita Voigt Teknillisen korkeakoulun kirjasto Avoimet julkaisuarkistot seminaari Dipoli, Espoo 14.1.2005

OAI Open Archives Initiative Historiaa: Juuret 1999/2000-vaihteessa Alunperin eprint-arkistojen kehittämiseen (esim. arxiv, RePEc...) Miten saadaan tiedot julkaisuista paremmin näkyville ja parannettua niiden löytyvyyttä Tutkimustieto tallennettu eri arkistoihin, joilla kaikilla oma hakuliittymä ja toiminta loppukäyttäjälle hankala, haluttiin yksi yhteinen käyttöliittymä Haku vai keruu? Haku hajautetuista arkistoista (esim. Z39.50) hankalaa, kun arkistoja on paljon Siispä metadatan keruu eri arkistoista yhteiseen tietokantaan Määriteltiin tapa, miten tämä tehdään OAI-protokolla

jatkuu... 26.2.2001 OAI Open Day in Europe, Berliini Julkistettiin OAI-protokollan versio 1.0 Euroopassa Nykyinen versio 2.0 käytössä kesäkuusta 2002 lähtien Stabiili, vain hyvin pieniä muutoksia Koordinointi: Carl Lagoze ja Herbert Van de Sompel

Erilaiset toimijat OAI-mallissa Data Provider tiedontuottaja Service Provider palveluntuottaja (palveluntarjoaja) Aggregator tiedon kokoaja/välittäjä

Aggregators Data providers Aggregator Service providers OAI Workshop - 24.05.2003 Uwe Müller, Heinrich Stamerjohanns

OAI-PMH OAI Protocol for Metadata Harvesting Protokolla, standardi Kerätään metadataa, ei dataa. Kokoteksteistä linkki alkuperäiseen sijaintipaikkaan. Menetelmä metatietojen keruuseen, ei hakuun Tavoite: helppo, ei liian monimutkainen, matala kynnys käyttöönotolle Kohteet laajassa mielessä digitaalisia objekteja (ei rajoitu enää e-printteihin)

jatkuu... Kyselyt: HTTP GET/POST Vastaukset: hyvinmääriteltyjä (= skeeman mukaisia) XML-tietueita, merkistö: UTF-8 (Unicode) Metadataformaatti: (ainakin) unqualified Dublin Core Palveluntuottaja jalostaa kerätyt tietueet sopivaksi katsomallaan tavalla

The Open Archives Initiative (OAI) Basic functioning Service Metadata Harvester Request (based on HTTP) Metadata (encoded in XML) Repository Metadata (Documents) Service Provider Data Provider OAI Workshop - 24.05.2003 Uwe Müller, Heinrich Stamerjohanns

Protokollan osat 6 kyselytyyppiä Identify ListMetadataFormats ListSets ListIdentifiers ListRecords GetRecord Lisäksi: virheenkäsittely, aikaleimat, tunnisteet, tietovirran kontrolli, (tiedon tiivistys)

Data Provider Data Provider Repository Images e-print Data Provider Identify OPAC e-print Data Provider Requests: e-prints e-print Museum Data Provider OAI-PMH: Structure Model Archive e-print ListMetadataformats ListSets ListIdentifiers ListRecords Repository GetRecord Service Provider Harvester Repository Data Provider Responses: General information Metadata formats Repository e-print Set structure Record identifier Metadata Repository OAI Workshop - 24.05.2003 Uwe Müller, Heinrich Stamerjohanns

Minkälainen on palveluntuottaja? Kerää kiinnostavista OAI-tietovarastoista tietueet (kaikki tai osan) omaan tietokantaan. Ei välttämättä aivan yksinkertaista (tuplakontrolli, ajoitukset, validointi, yhdenmukaistaminen yms.) Tarjoaa hakuliittymän tuohon tietokantaan Esittää haun tuloksena saadut tietueet miellyttävässä muodossa (yksinkertaisimmillaan tekee XSLtyylitiedoston kerätyille XML-muotoisille tietueille). Keräilyohjelma + tietokanta + hakuliittymä + XSL

Keskustelukysymys: Onko Suomessa tarvetta luoda OAI Service Provider (tai Aggregator), jonne kerätään yhteen eri organisaatioiden julkaisutuotantoa? Hmm...

DP/SP yhteistyötarpeita DC-metadatan semantiikka/yhteensopivuus Set-rakenteen käyttökelpoisuus, yhteensopivuus Rikkaammat metadataformaatit (suositellaan) Ala-/yhteisökohtaiset metadataformaatit (suositellaan) Aineistokohtaiset metadataformaatit (suositellaan) Tietojen mappaus DC-muotoon ei ole yksiselitteistä ja yleensä hävittää jotain tietoa. Lopputulos on siksi usein vain pienin yhteinen nimittäjä.

Julkaisuarkiston perustaminen Miettikää, mitä aineistoa haluatte tarjota? Onko jotain tiettyjä palvelutarjoajia, joille haluatte tarjota aineistoanne? Onko syytä luokittaa aineisto setteihin? Mitä metadataformaatteja käytätte? Onko teillä aineisto jo valmiiksi jossain julkaisurekisterissä? Saisiko sen suoraviivaisesti OAI-yhteensopivaksi? Vai haluatteko aloittaa puhtaalta pöydältä?

Vaihtoehtoisia tapoja Meillä on/tulee olemaan käyttökelpoinen julkaisutietokanta Kirjoita siihen OAI-liittymä. Käytä olemassa olevia työkaluja hyväksesi, muokkaa niitä tarvittaessa. Asenna joku tarjolla olevista avoimen koodin pakettiratkaisuista. Muokkaa tarvittaessa. Syötä/siirrä julkaisujen metadata ohjelmiston tietokantaan. Osta lisenssi jostakin tarjolla olevista kaupallisista pakettiratkaisuista. Jos tulee muutostarpeita, ota osaa myyjäyrityksen määrittelemään parannusehdotusprosessiin. Syötä/siirrä julkaisujen metadata ohjelmiston tietokantaan.

Julkaisuarkiston minimitavoite Julkaisuarkisto, jonka sisältö vapaasti ja helposti saatavilla. Tarvitaan siis julkaisurekisteri / -tietokanta (tai XML-tiedosto) jonne on tallennettu elektronisten julkaisujen metadataa jossakin laajuudessa mm. linkki julkaisun kokotekstiin (mieluiten pysyvä) ja tähän tietokantaan OAI-liittymä Rekisteröi julkaisuarkistosi sopiviin paikkoihin!

Lisätarpeita? Julkaisujärjestelmä Työkaluja kirjoittajille (esim. tyylipohjia) Julkaisemisen työkaluja (konvertoinnit, versiointi, julkaisun kulku järjestelmän läpi, esim. väitöskirjan tarkastusvaiheet...) Kytkennät työnkulkuun. Työprosessien ja työnkulun uudelleenorganisointi Tarvepainatus Alkuperäisen datan uusiokäyttö Metadatan tietovirrat muihin järjestelmiin Metadata-standardit, yhteensopivuus Pitkäaikaissäilytys Eheys Pysyvä identifikaatiotunnus (URN, joku muu?) Arkistointikysymykset

Valmiin IR-ohjelmiston käyttö Tarjolla vasta vähän aikaa (n. 2 v.) Eivät ole valmiita, kehittyvät jatkuvasti, vaativat ylläpitoa Voi ottaa käyttöön ilman syvällistä OAI-protokollan tuntemusta Alunperin luotu tietyn organisaation tiettyyn tarpeeseen, siitä laajentuneet yleiskäyttöisiksi, isoja paketteja Huomioitavaa: järjestelmävaatimukset, koodauskieli, hakuominaisuudet, tiedostomuodot, metadataformaatit, yhteensopivuudet... + merkistövaihtoehdot, monikielisyys Archimede, ARNO, CDSware, DSpace, Eprints, Fedora, i-tor, MPG edoc, MyCoRe, OPUS, (ETD-db) DiVA

OAI:n implementointi on helppoa, mutta... Tarjolla olevat työkalut/ohjelmat 1. olettavat, että kyselyt tehdään relaatiotietokantaan, joka ymmärtää SQL:ää 2. edellyttävät web-palvelimen, jossa voidaan ajaa CGIskriptejä TKK:n kirjasto ei saa asentaa skriptejä korkeakoulun web-palvelimelle TKK:n kirjastolla on valmiiksi käytössä TRIPjärjestelmä. TRIP ei ole relationaalinen tkhj eikä se ole SQL-yhteensopiva

TKK OAI-tiedontuottajana Implementaatio-skripti perustuu PHP OAI Data Provider työkaluun (Univ. Oldenburg) Suurimmat muutokset: kokonaan uusi tietokantaliittymä, tehty kuitenkin vain hyvin ohut rajapinta TRIP-järjestelmään Metadataa on runsaasti: yli 160 kenttää Metadataformaatit: unqualified Dublin Core, DCQ, Marc21, tarvittaessa muunlaisia (esim. xhtml-dc )... Sets: pub-types, doc-types, subjects, departments > 450 väitöskirjaa, jonkun verran muuta materiaalia, laajenemassa Julkaisuilla pysyvä identifikaatiotunnus (urn:nbn:fi:tkk-...) Kaikki julkaisuarkiston dokumentit vapaasti luettavissa ja tulostettavissa Avoin julkaisuarkisto (institutional repository)

Reuse of original data TKKdoc (internal format) Web-based input form (or internal input format TRIP tform) OAI Data provider - Dublin Core (simple + DCQ...) - Marc21, others on request... Marc record Web pages - Front page (XHTML with DC meta tags) - Lists: current dissertations etc. - Browsing: by year / department / name... - Search interface PDF documents - Press release - UMI registration form Other export formats URN resolving Templates - Front + back matter of the fulltext document - (Fulltext) Word, LaTeX... Emails Service providers Union Catalog etc. Library catalog

Kiitos! Lista hyödyllisistä linkeistä tulee verkkoon tämän esityksen yhteyteen. http://lib.hut.fi/oai/linkit.html rita.voigt@tkk.fi