PAS-tilanne ja julkaistujen opinnäytteiden pitkäaikaissäilytykseen liittyvä prosessi ja edellytykset Kirjastoverkkopäivät 24.10.2017 Opinnäytteiden arkistointi työpaja Lassi Lager (lassi.lager@helsinki.fi)
Opinnäytteet ja opinnäytteisiin liittyvät tiedot 1. Verkossa (avomissa julkaisuarkistoissa) julkaistut opinnäytteet KK:n lakisääteinen velvoite arkistoida edustava ja monipuolinen otos verkkoaineistosta, organisaatioiden arkistointivelvoite kattava. Miten nämä tavoitteet saadaan yhdistettyä? 2. opinnäytteisiin liittyvät tiedot (opinnäyte osana opiskelijatietojen elinkaaren hallintaa) 3. opinnäytteet joita ei julkaista verkossa (ei tekijän suostumusta, käyttörajoitetut, salassapidettävät jne)
Avoimissa julkaisuarkistoissa julkaistut opinnäytteet Kansalliskirjasto haravoi säännöllisesti Kulttuuriaineistolain nojalla digitaaliset kopiot talteen ja toimittaa haravoidut opinnäytteet ja niiden metatiedot KDK:n PAS-palveluun Edellyttää, että opinnäytteet on julkaistu avoimessa julkaisuarkistossa ja sieltä haravoitavissa (OAI-PMH) ja tiedostot ovat sellaisenaan PASsiirtokelpoisia Jos opinnäytteeseen tulee muutoksia tai se poistetaan julkaisuarkistosta, korkeakoulun velvollisuus varmistaa, että opinnäyte kuitenkin arkistoituu (PAS-siirroista lokitiedot tms?) Muuten voidaan olettaa, että arkistointi/pitkäaikaissäilytys hoituu Kansalliskirjaston kautta Opinnäytejulkaisun metatiedoissa on riittävät perustiedot (tekijä, ajankohta, korkeakoulu), joiden avulla esim. tutkintoon/opiskelijaan liittyvät muut arkistoitavat tiedot voidaan löytää muista tietojärjestelmistä. Tarvittaessa julkaisuarkistoissa olevia metatietoja voidaan kehittää, ottaa käyttöön eri tietojärjestelmissä ja arkistoissa olevat tiedot yhdistävä tunniste tms. PAS-siirrot käynnistynevät 2017-2018
Opinnäytteisiin liittyvät tiedot (joihin liittyy arkistointivelvollisuus) Arvostelutiedot, opintosuoritukseen liittyvät tiedot, muut opiskeluun/valmistumiseen liittyvät tiedot joita itse opinnäytteestä ei välttämättä löydy Tietojen arkistointi korkeakoulujen vastuulla Yhteisiä toimintatapoja ja suosituksia voidaan kehittää yhdessä Kansallisarkiston kanssa
Opinnäytteet joita ei julkaista verkossa Arkistointivastuu korkeakouluilla Yhteisiä toimintatapoja ja suosituksia voidaan kehittää yhdessä Kansallisarkiston kanssa Pimeä arkisto palveluna?
Julkaistujen opinnäytteiden pitkäaikaissäilytys ja -saatavuus
Julkaisemisen hyvät käytännöt ja PAS PAS: Säilytys- ja siirtokelpoiset tiedostomuodot http://www.kdk.fi/fi/pitkaaikaissailytys/maeaerittely-ja-dokumentit Esim. PDF/A säilytyskelpoinen, PDF siirtokelpoinen (tarkemmin määrityksissä) Tiedostojen validointi ja hyvien käytäntöjen noudattaminen jo julkaisuvaiheessa voi taata säilytettävän julkaisun paremman laadun (esim. verapdf.org) Metadatasuositus julkaisuarkistojen tekstiaineistolle https://www.kiwi.fi/display/julkaisuarkistopalvelut/metadatasuosit us+julkaisuarkistojen+tekstiaineistolle Pysyvien tunnisteiden käyttö Opinnäytteissä esim. URN (https://www.kiwi.fi/display/urn)
Julkaisuarkistot pitkäaikaissäilytykseen Syyskuussa 2017 OKM:ltä uusi PAS-myöntö KK:lle, eli lisätallennustilaa CSC:n PAS-palvelusta mm. Kulttuuriaineistolain nojalla kerättyjä verkkoaineistoja varten Kotimaiset avoimet julkaisuarkistot osa tätä aineistoa Myös avoimissa julkaisuarkistoissa julkaistujen opinnäytteiden pitkäaikaissäilytys hoidetaan PAS-palvelussa tällä mandaatilla (OKM:n tahto)
Rajaukset Opinnäyte on julkaistu avoimessa, haravoitavissa olevassa julkaisuarkistossa Opinnäyte on riittävän pitkän ajan julkaisuarkistossa esillä, jotta se ehditään haravoida Julkaisuarkistoon opinnäytteitä ja muuta sisältöä tallentava korkeakoulu vastaa julkaisujen sisällöstä Julkaisemattomat opinnäytteet? Muut kuin teksti/kuvamuotoiset opinnäytteet? Opinnäytteeseen/tutkintoon liittyvät tiedot tallennetaan muualle, mutta ne olisi hyvä pystyä linkittämään esim. tunnisteen avulla varsinaiseen opinnäytetyöhön
Ennen kuin kaikki on pitkäaikaissäilytyksessä Kansalliskirjaston rooli mm. paketointi ja toimittaminen PASpalveluun Julkaisuarkistot uusi PAS-palveluun lähetettävä aineisto Lokakuussa alettu testata CSC:n kehittämän paketointityökalun käyttöä aineistojen paketointiin. Pilotointi loppuvuodesta 2017 Varsinaiset siirrot käyntiin vuoden 2018 aikana Jo kertyneiden aineistojen paketoiminen ja siirto vie aikaa Aineistoissa voi myös tulla vastaan odottamattomia ongelmia (PASmääritysten kannalta virheellisiä tiedostoja tms), joiden selvittely vie aikaa Väliaikaina syytä varmistaa, että julkaisuarkistot on varmistettu riittävän hyvin ja niissä noudatetaan hyvää tietoturvaa
Kuinka varmistetaan arkistoinnin kattavuus? Alustava suunnitelma: KK haravoi avoimet julkaisuarkistot omalle vapaakappale-instanssille (käytössä vapaakappaletyöasemilla) Kuinka usein julkaisuarkistot kannattaa haravoida? Kuinka pitkään opinnäytteitä säilytetään julkaisuarkistoissa? ( Pysyvästi vai ei?) Miten menetellään julkaisuarkistoista poistettavien opinnäytteiden kanssa? (Kerran verkossa julkaistu opinnäyte voidaan lähtökohtaisesti tarjota asiakaskäyttöön vapaakappaletyöasemilla ja lähettää pitkäaikaissäilytykseen)
Julkaisuarkistoaineistojen pitkäaikaissäilytykseen liittyviä kysymyksiä Lopullinen versio ja mahdolliset muutokset? Kuinka pian julkaisun jälkeen aineisto kannattaa (aikaisintaan) lähettää pitkäaikaissäilytykseen, jotta julkaisusta saadaan yleensä kerralla lopullinen versio, jota ei yleensä enää muokata (päivittyvät julkaisut asia erikseen)? Dublin Core -metatiedot? Dublin Coren käytössä eroja eri julkaisuarkistoissa ja esim. OAI-PMHharavointi ei tuo täydellisiä metatietoja (dc.contributor-tarkenteet saattavat puuttua yms.) Metatietojen myöhempiä muutoksia ei välttämättä lisätä aiemmin pitkäaikaissäilytykseen lähetettyihin PAS-paketteihin PDF-formaatti? PDF on siirtokelpoinen tiedostomuoto, joka nykymääritysten mukaan muunnetaan säilytyksessä PDF/A:ksi. Validointi saattaa epäonnistua, jos PDF jo itsessään epävalidi Muunnoksessa voidaan menettää joitain PDF:n ominaisuuksia Ohjeet ja hyvät käytänteet tallentamiseen PDF- tai PDF/A-muodossa, tarjotaanko mahdollisuus validoida tiedostomuoto (esim. http://verapdf.org/)
Opinnäytteiden arkistointivastuu viime kädessä korkeakoululla. Miten arkistoitumisen PAS-palvelussa voi tarkistaa? PAS-siirtopakettien lähetyslokit julkisiksi/korkeakoulujen käyttöön? Tieto yksittäisten lähetettyjen siirtopakettien tunnisteista (tunnisteet muodostetaan lähtökohtaisesti URNin tai muun pysyvän tunnisteen pohjalta) ja aikaleimat (haravointiaika, lähetetty/vastanotettu PAS-palveluun) (CSC/KK?) Varsinkin alkuvaiheessa tieto PAS-palveluun lähetyistä kokoelmista/julkaisuarkistoista ja pvm (KK) Ainoastaan KK:lla oikeus hakea lähettämiään aineistoja tai niiden metatietoja PAS-palvelusta. Saatavilla olevat lokitiedot mahdollistaisivat sen, ettei rutiinikyselyjä tarvitsisi lähettää KK:n kautta
Pitkäaikaissaatavuus? KDK:n PAS-palvelua ei ole suunniteltu ensisijaisesti käyttöä varten Ainoastaan lähettävä organisaatio (tässä tapauksessa Kansalliskirjasto) voi hakea aineistoja PAS-palvelusta Paljon käytetystä aineistosta tarvitaan käytännössä vielä käyttökopio taustajärjestelmässä (vapaakappalekopio käytössä vain vapaakappaletyöasemilla) Jos käyttökopio ja sen varmuuskopiot tuhoutuvat, oikeuksienhaltijalle (tai häntä edustavalle organisaatiolle) on mahdollista luovuttaa PAS-kopio. Miten käytännössä tapahtuu (erityisesti muut kuin KK:n ylläpitämät julkaisuarkiistot)? Ovatko julkaisuluvan/-sopimuksen ehdot riittävät? Entä jos jos tekijältä julkaisuluvan saanut organisaatio lakkaa olemasta?
Kiitos! lassi.lager@helsinki.fi