Kokemuksia. aineistojen paketoinnin piloteista. KDK-pitkäaikaissäilytys seminaari

Samankaltaiset tiedostot
Ympäristötutkimuksen aineistoja tietoarkistossa

Juomatapatutkimus ja muut alkoholiaineistot tietoarkistossa

Tietoarkisto palveluksessanne. Avoin tutkimusdata ja aineistonhallinta ihmistieteissä Hannele Keckman-Koivuniemi

Pitkäaikaissäilytyksen toteutuksen erityispiirteet. TTA:n pitkäaikaissäilytyksen keskustelutilaisuus Kimmo Koivunen

Digitaalisten aineistojen pitkäaikaissäilytys. OKM:n toimialan tietohallinnon yhteistyökokous. Kimmo Koivunen CSC Tieteen tietotekniikan keskus Oy

Palveluportaali Aila

Aineistojen paketoinnin pilotit PAS-seminaari 2013 Kuisma Lehtonen

Lapset ja nuoret tietoarkistossa Tampereen yliopisto helena.laaksonen (at) uta.fi

Tietoarkiston palvelut ja arkistointiprosessi. Annaleena Okuloff Tieteenala-asiantuntija

Palveluportaali Ailan käyttö

Tutkimusdatan pitkäaikaissäilytys ATT-hankkeessa.

KDK: Finna ja pitkäaikaissäilytys

PAS-tilanne ja julkaistujen opinnäytteiden pitkäaikaissäilytykseen liittyvä prosessi ja edellytykset

Missä ollaan pitkäaikaissäilytyksen toteuttamisessa? KDK:n arkistosektorin yhteistyöverkoston seminaari Kimmo Koivunen CSC Tieteen

Kolme vuotta digitaalista pitkäaikaissäilytystä

AVOIN DATA AVAIN UUTEEN Seminaarin avaus Kansleri Ilkka Niiniluoto Helsingin yliopisto

TUTKIMUSDATAN KUVAILU. Kuvailun tiedotuspäivä Tieteenala-asiantuntija, FT Katja Fält

Miten tutkimuksen tietovarannot liittyvät etiikkaan ja viestintään? Tutkimusaineiston elinkaari

Metodiopetuksen tuki verkossa: menetelmäopetuksen tietovaranto

Lapset ja nuoret tietoarkistossa Tampereen yliopisto helena.laaksonen (at) uta.fi

Mitä PAS-järjestelmä tarkoittaa museoille?

KVANTITATIIVISEN TUTKIMUSAINEISTON KUVAILU

Heikki Helin Metatiedot ja tiedostomuodot

THL:N NÄKÖKULMIA TUTKIMUSAINEISTOJEN SÄILYTTÄMISEEN

KDK-ajankohtaispäivä museoille

Data Management Plan Hyvä datanhallinta alkaa suunnittelusta. Minna Ahokas CSC

Aineistonhallinta pähkinänkuoressa METODIFESTARIT TAMPEREEN YLIOPISTO ARJA KUULA-LUUMI

Pitkäaikaissäilytyksen toiminta ja ylläpito

KANSALLISEN DIGITAALISEN KIRJASTON KOKONAISARKKITEHTUURI. V3.0 Tiivistelmä

Mitä tiedon pitkäaikaissäilytys tarkoittaa?

Fairdata PAS-palvelu

Keskitetty digitaalisen säilyttämisen palvelu osana KDK arkkitehtuuria Kimmo Koivunen CSC Tieteen tietotekniikan keskus

KDK:n pitkäaikaissäilytyksen suunnittelun tilanne ja vastaanotettavan aineiston vaatimukset DigiWiki-seminaari Kimmo Koivunen CSC Tieteen

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus. Anssi Kainulainen / CSC

Digitointiprojektin käytäntö ja ongelmat. Esimerkkinä Porin taidemuseon digitointiprojekti 2014

Henkilötietoja sisältävän datan käsittely ja avaaminen TIETOSUOJA TUTKIJAN ARJESSA HY ARJA KUULA-LUUMI

T.E.H.D.A.S. Arkisto. Kokemuksia performanssitaiteen arkistoinnista. Juha Mehtäläinen

Tutkimusdatan hallinnan kansalliset välineet IDA, Etsin, AVAA. Stina Westman, ATT-hanke, CSC

Ailan käyttö ja aineistovarannot

Ailan käyttö ja aineistovarannot

Julkisrahoitteisten tutkimusaineistojen avoimuus ja kansainvälinen tilanne OECD:n Open Access ohjeistus

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus

Kansallisarkiston päätökset opinnäytteiden pysyvästä säilyttämisestä

Tutkimusaineiston hallinta. Annaleena Okuloff Terveystieteiden tieteenala-asiantuntija

Miksi tutkimusaineistoja halutaan avattavan? Jyrki Hakapää, Suomen Akatemia

Pitkäaikaissäilytyksen toteuttaminen KDK:ssa Kimmo Koivunen CSC Tieteen tietotekniikan keskus Oy

CSV - XML ohjelman käyttöohje

JHS-suositusluonnos: Tiedonohjaussuunnitelman rakenne

Taideyliopiston tutkimusaineistopolitiikka Toteuttamissuunnitelma

Tutkimuksen aineistonhallinnan eettisiä ulottuvuuksia. Tutkimusetiikkaseminaari, Tampereen yliopisto Arja Kuula-Luumi

Tutkimusrahoittajien ja tiedejulkaisujen vaatimukset aineistonhallinnalle

Datanhallinnan oppaan esittely mitä ovat IDA, AVAA, KATA, PAS, REMS? Johanna Blomqvist, CSC - Tieteen tietotekniikan keskus

KVANTITATIIVNEN DATA JA SEN AVAAMINEN. Eliisa Haanpää, Tietoarkisto Metodifestivaali, Jyväskylä

Tervetuloa AVOIN*-hankkeen seminaariin

Digitaalisten aineistojen pitkäaikaissäilytys - Tiedostoformaattien standardointi

YLEISESITTELY: MITÄ ON AVOIN TIEDE? Ilkka Niiniluoto Helsingin yliopisto OKM:n seminaari

Aineistonhallinta ARJA KUULA-LUUMI ALAIKÄISIIN KOHDISTUVAN TUTKIMUKSEN ETIIKKAA -SEMINAARI TUTKIMUSEETTINEN NEUVOTTELUKUNTA, HELSINKI

Ailan käyttö ja aineistovarannot

Tekninen alusta. Tavoitteet ja näkökulmia maankäyttöpäätöksiin Jani Kylmäaho, osahankepäällikkö Maanmittauslaitos

Pitkäaikaissäilytys osana yhteentoimivaa ja vaikuttavaa kulttuuriperintöä

TTA Tietoinfrastruktuurin suunnittelu. Tutkimuksen tietoaineistot Esa-Pekka Keskitalo

Toiminnalliset ja ei-toiminnalliset vaatimukset Tunnus (ID) Vaatimus Vaatimuksen

Millainen on menestyvä digitaalinen palvelu?

Kimmo Koivunen CSC Tieteen tietotekniikan keskus

Kolme vuotta digitaalista pitkäaikaissäilytystä

Aineistojen paketoinnin pilotti KDK-PITKÄAIKAISSÄILYTYS 2013 SEMINAARI

HELSINGIN YLIOPISTON TUTKIMUSDATAN TUTKIJAPALVELUT. Mari Elisa Kuusniemi, Tutkimuksen palvelut, Helsingin yliopiston kirjasto, Helsingin Yliopisto

AV-muotojen migraatiotyöpaja - video. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja

Kokemuksia PDF/A:sta Arkistolaitoksen VAPApalvelussa

Kirjasto yliopiston tutkimusaineistopolitiikan toteuttajana. Pekka Olsbo Julkaisukoordinaattori Jyväskylän yliopiston kirjasto

Yhteentoimivuusalusta ja sen hyödyntäminen kuntien/maakuntien taloushallinnossa Petri Tenhunen, VRK

Potilastiedon arkiston tilannekatsaus

Rajapintojen avaaminen ja hyödyntäminen. Matkalla muutoksessa seminaari , Martin Johansson

Tutkimuksen rahoittajien ja julkaisijoiden sekä tutkimusorganisaatioiden politiikkasuositukset. Yleiskatsaus nykytilanteeseen.

Tutkimuksen pitkäaikaissaatavuuden palvelukokonaisuus

ATT-viitearkkitehtuuri

Kansallinen digitaalinen kirjasto Kokonaisarkkitehtuuri v3.0

Kansallinen digitaalinen kirjasto

FSD3225. Kauppa- ja tietojenkäsittelytieteiden opiskelijoiden hyvinvointi Aineisto-opas

Kansallinen digitaalinen kirjasto ja arkistopalvelut

JulkICT Arkkitehtuuripankki - QPR EnterpriseArchitect asennusohje

Terveystieteellisten aineistojen erityispiirteitä. Annaleena Okuloff

Tutkimusdata. Tutkijat verkoilla kurssi Helsingin yliopisto

Sosiaalihuollon asiakasasiakirjojen standardointi

Tutkimuksen avoimuus - yhteistyön ja palveluiden lähtökohdat 2018

YKSA(2) ( Käyttäjän ohje

TTA-hankkeen esittely. Pirjo-Leena Forsström TTA-hankkeen pääsihteeri

Tuottavatko pilotoinnit tuloksia riittävän nopeasti käytännön hankkeiden kokemuksia

KDK Kansallinen digitaalinen kirjasto

Avoimen tieteen osaajakoulutus Työpaja: Avoin tiede ja tietohallinto

Tutkimuksen elinkaariajattelu ja aineiston käytön avoimuuden rajat Sami Borg, johtaja (vv.) Yhteiskuntatieteellinen tietoarkisto FSD Tutkimus,

Sähköisen arkistoinnin reunaehdot

Kansallinen digitaalinen kirjasto: Digitaalinen pitkäaikaissäilytys

KDK-asiakasliittymä linjauksia KDK-seminaari Kristiina Hormia-Poutanen

Avoimen tieteen ja tutkimuksen edistäminen periaatetasolta käytännön toimiin

Digitoinnin työpaja 3a/4 Äänitteiden digitoinnin perusteita

Osaamiskartta pikaopas

Avoimen ja yhteisen rajapinnan hallintasuunnitelma v.1.4

Tietoarkisto on FAIR. Avoimen tieteen kevätpäivät 2019 Tampere Hannele Keckman-Koivuniemi tietopalvelupäällikkö

Transkriptio:

Kokemuksia aineistojen paketoinnin piloteista. KDK-pitkäaikaissäilytys 2013 -seminaari

2 Yhteiskuntatieteellinen tietoarkisto OKM:n rahoittama valtakunnallinen palveluresurssi erillisyksikkö Tampereen yliopiston yhteydessä - perustettu jo 1999 toimikenttä laaja, ei vain yhteiskuntatieteet Tehtävä: sähköisten tutkimusaineistojen pitkäaikaissäilytys ja toimittaminen jatkokäyttöön kvantitatiivisia aineistoja ~1200, kvalitatiivisia ~150 2012 toimitti lähes 700 aineistoa tutkijoille, opettajille ja opiskelijoille

3 Yhteiskuntatieteellinen tietoarkisto Toiminnan perustana asiantunteva, nopea, tasapuolinen ja maksuton palvelu apua tutkimusaineistojen haussa ja käytössä neuvoja aineistojen tietosuojakysymyksissä ohjeita aineistonhallintaan ja pitkäaikaissäilytykseen palvelee kansallisesti ja kansainvälisesti verkostoitunut kansallisesti ja kansainvälisesti mukana KDK:ssa 2008 alkaen, TTA:ssa 2012

4 Osana KDK:ta FSD Eroaa perinteisestä arkistosta aineiston laadun suhteen: tutkimuspainotus, datamatriisit käsittelyprosessin suhteen: aineistoja muokataan, originaali ei useinkaan säilyttämisen arvoinen Silti aineisto poikkeaa tiedostomuodoiltaan sangen vähän KDK:ssä määritellyistä.doc(x),.pdf,.rtf,.por,.xml,.html,.jpg,.txt laadullinen aineisto sisällöltäänkin kulttuurista

5 Pilotti syksyllä 2012 Alkuperäinen tavoite: tunnistaa tarpeelliset metadataelementit aineistojemme kuvauksista ja muodostaa manuaalisesti luovutuspaketti arvioida METS- yms. määrityksiä tutkimusaineistojen näkökulmasta Ja lopputulemana: muodostettiin luovutuspaketti ohjelmallisesti tutkimusaineistonäkökulma ei noussut keskeiseksi kysymykseksi pilotoinnissa

6 Pilotin eteneminen Elementtien tunnistaminen oli melko helppoa, ja pakolliset elementit saatavilla metadatasta silti perusteltua kerätä enemmän metadataa, esim. teknistä ja/tai aineiston käsittelyä kuvaavaa - Millä ohjelmalla tai sen versiolla aineistoa on käsitelty? Kuka sen teki?!? - Mitä tiedostopääte lopultakin kertoo tiedoston laadusta? metadatan hallinta korostuu, mitä enemmän sitä on

7 Pilotin eteneminen Ei pilotoitu käyttöoikeustietojen upottamista ei saatavilla kattavaa ohjeistusta Ei pilotoitu METS-paketin provenienssipuolta (säilytyssuunnitelmaa) ei vielä valmista ohjeistusta olisi keskeinen osa sekä teknisenä että sopimusluontoisena asiakirjana! suunnitelma reflektoi osallistuvan organisaation tarpeita, aineistoa, metadataa ja asiakkuuksia

8 Pilotin eteneminen Pilottiin panostettiin reilut kolme työviikkoa päästy selvyyteen siitä, mitä METS on syönyt ja mitä sille pitää syöttää päätös siitä, mitä tallennetaan ja mistä - paketoitiin 8 aineiston näyte laadittu pilottia varten ohjelma, joka koosti luovutuspaketin joukosta esimerkkiaineistoja Onnistuu tässä ajassa, kun käytettävissä XMLasiantuntija muuten jatkuisi vielä!

9 Pilotin tuloksista Tutkittiin laajasti ja kriittisesti saatavilla olevia määrittelydokumentteja Ajatus: jos näistä on lähdettävä, niin virheitä tai ristiriitaisuuksia, tai sisäpiirin ymmärrystä vaativia osia ei saisi olla. Havainto: asiakirjat vielä raporttimaisia, eivät hyödyntäjälle helppoja. Myös asiakirjojen väliset suhteet vaativat tarkennusta. Terminologia vaatii tarkennuksia, ja määrittelyssä on vielä puutteita. näitä korjattu/korjataan uusiin versioihin

10 Poimintoja pilotin tuloksista Vaihtoehtoisia esitystapoja pitäisi karsia selkeyttää, kun on vain yksi tapa tehdä Luovutuspaketin elinkaaren jokainen versio tulee olla uniikisti tunnistettavissa tunniste + aikaleima KDK-METS skeema ei vielä valmis sen hyödyntäminen tuonee esille uusia haasteita, myös osallistujaorganisaatioissa

11 Luovutuspaketti Koostettu paketti lähetettiin onnistuneesti Mukana por- ja rtf-tiedostoja, jotka tiedettiin eisallituiksi tietoinen valinta Virhe terminologian tulkinnassa: Seurauksena luovutuspaketti oli sijoitettu zip-paketin juureen, ei ensimmäisen tason juurihakemistoon korostaa täsmällisyyden tarvetta spesifikaatiossa!

12 Johtopäätökset Hyödyllinen seikkailu perehtyminen METSiin ja PREMISiin bonusta oman metadataformaattimme (DDI) peilaaminen näitä määrityksiä vasten, sekä sen validointi periaatekeskustelu siitä, mikä on uniikkia pitkäaikaissäilytettävää, ja mikä kenties työekonomisista syistä säilytettävää, vaikka uudelleentuotettavissa - esimerkiksi alkuperäisaineiston käännös

13 Säilytettävän aineiston valinta Pilotissa helppoa, mutta perustuttava tietoiseen valintaan Tietoarkiston ohjaava asiakirja on arkistonmuodostussuunnitelma jota vasten, tai jota päivittäen, säilytyssuunnitelma tulee laatia www.fsd.uta.fi/fi/hallinto/asiakirjat/ams/ams_index.html

14 Takaisin johtopäätöksiin METADATAA Lisää! Parempaa! Hallittavassa muodossa! Koneellisesti käsiteltävissä! Standardien mukaista! Koko elinkaaren ajan! Palvelut, ohjelmistot ja apuvälineet luovutuspaketin muodostamiseen vain n. 70 Mt, alle 1000 tiedostoa: silti tuhansia rivejä METS-pakettissa Ei känsäisin käsin tuotettavissa. Rajapintojen merkitys korostuu

15 Kiitos! Arkistoinnin, pitkäaikaissäilyttämisen ja uudelleen hyödyntämisen onnistuminen edellyttää aineiston hyvää hallintaa koko elinkaaren ajan. Tietoarkisto turvaa aineistosi sekä tukee tutkimusdatan avointa saatavuutta ja informoitua jatkokäyttöä. Tuomas J. Alaterä tuomas.alatera@uta.fi