Kokemuksia PDF/A:sta Arkistolaitoksen VAPApalvelussa PDF-seminaari 16-17.1.2013 Markus Merenmies
Esityksen teemat Aiheet PDF/A aineistojen vastaanotto Vastaanoton yhteydessä tehtävät tarkistukset Näkökulmia Miten organisaatioita on ohjeistettu toimimaan Miten aineisto saadaan vastaanotettua Pitkäaikaissäilyttämisen tarpeet
VAPA Arkistolaitoksen tarjoama sähköisen säilyttämisen palvelu Siirtää aineiston säilytysvastuun organisaatiolta arkistolaitokselle Varmistaa siirrettävän asiakirja-aineiston todistusvoimaisuuden, alkuperäisyyden, käytettävyyden ja eheyden. Tarjoaa organisaatiolle mahdollisuuden käyttää ja hyödyntää siirrettyjä asiakirjoja omassa toiminnassaan. Käyttö edellyttää sähköisen säilyttämisen lupaa tai aineiston sähköistä säilytysmuotoa koskevaa päätöstä
Vastaanotettava aineisto Organisaatioiden pysyvästi säilytettäviä asiakirjoja, jotka täyttävät SÄHKE-normin vaatimukset (prosessi ja rakenne) Aineiston metatiedot ja tiedostomuodot arkistolaitoksen vaatimusten mukaisesti Lisäksi rekisteri- ja tietokantatietoja sovellusriippumattomassa muodossa Digitoitu aineisto on erillisessä Digitaaliarkistojärjestelmässä.
Asiakirjat siirtokuntoon Natiivimuodot : Eivät yksin kelpaa säilytykseen, tukevat aktiiviaikaista siirretyn aineiston hyödynnettävyyttä. Pitkäaikaissäilytyksen muodot Konvertointi säilytysmuotoon mahdollisimman aikaisin TIFF (rev 5 ja rev6) PDF/A-1b, myös PDF/A-1a Fonttien tulee olla vapaasti käytettävissä Ei saa olla linkkejä tai riippuvuutta ulkoisista elementeistä.
Haasteita ja kokemuksia Organisaatiossa harvoin ohjeistettu käyttämään vain sellaisia tiedostomuotoja, jotka voidaan konvertoida arkistolaitoksen edellyttämiin pitkäaikaissäilytyksen muotoihin Hyödynnettävien toimisto formaattien käytön monimuotoisuus (taulukkolaskenta ja esitystiedostot) Formaattimuunnosten massa-ajot riskialttiita. Muunnosten laadunvarmistus usein puutteellista. Muunnosten (työkalujen) integrointi taustajärjestelmiin puuttuu. Käytännön kokemuksen puute migraatioista ja pitkäaikaissäilyttämisestä Kokemuksia saatu yhteistyöstä Kansallisessa Digitaalisessa Kirjastossa. Formaattien haasteet yhteisiä eri aineistolajeissa.
VAPA Ingest workflow Prepare Workflow S2 Integrity Check Sender authorizati on XIP Integrity Checking Metadata Integrity Store Store AIP Virus Check Metadata Integrity Copy XIP Package Content Integrity Transfer Agreement Check Store Metadata Delete SIP (extranet) Key Content Integrity Normal flow SIP format/content error Characteri se Validate AIP Ingest report Create Ingest Report Send Ingest Report Halted workflow The workflow is also set to halted state if any other error occurs (implements VAPA administrator notification) submitter@organization_a.org
Vastaanoton vaiheet Tunnista: Mikä on tiedoston muoto? DROID + PRONOM Myös iteratiivinen tunnistaminen niissä tapauksissa, jossa formaatti on kapseloitu toisen sisään (TIFF ja PDF/A) Tarkasta: Onko tiedosto määrityksensä mukainen? JHOVE Tallenna: Tekniset ja tunnistamisen metatiedot talteen SDB + METS ja Premis Tarkkaile Tiedostojen eheyden säilyminen Tiedostomuotojen käytettävyyden säilyminen
Säilytyksen suunnittelu Määriteltävä ne ominaisuudet, jotka halutaan säilyvän Luettavuus, visuaalisuus, tarkkuus, värit? Preservation Plan (Plato) Ohjaa tiedostojen migraatiota Taustalla formaattikirjastot, jotka seuraavat formaattien muuntumista ja migraatiotarpeita Formaattien muuttuessa säilytettäviksi valittujen ominaisuuksien tulee säilyä
Lisätietoja Aineiston tallennusmuodot ja siirrettävyys Markus Merenmies 050 4094011 VAPA-palvelusta ja sen käyttöönotosta www.arkisto.fi/vapa Aineiston arvonmääritys ja seulonta Mikko Eräkaski 050 363 5769 Markku Leppänen 050 593 4246 email. Etunimi.sukunimi@narc.fi