Digitaalisten aineistojen pitkäaikaissäilytys - Tiedostoformaattien standardointi

Samankaltaiset tiedostot
Heikki Helin Metatiedot ja tiedostomuodot

KDK: Finna ja pitkäaikaissäilytys

Pitkäaikaissäilytyksen toiminta ja ylläpito

Mitä tiedon pitkäaikaissäilytys tarkoittaa?

Missä ollaan pitkäaikaissäilytyksen toteuttamisessa? KDK:n arkistosektorin yhteistyöverkoston seminaari Kimmo Koivunen CSC Tieteen

Pitkäaikaissäilytyksen toteutuksen erityispiirteet. TTA:n pitkäaikaissäilytyksen keskustelutilaisuus Kimmo Koivunen

Digitaalisten aineistojen pitkäaikaissäilytys. OKM:n toimialan tietohallinnon yhteistyökokous. Kimmo Koivunen CSC Tieteen tietotekniikan keskus Oy

Kansallisarkiston päätökset opinnäytteiden pysyvästä säilyttämisestä

Pitkäaikaissäilytyksen toteuttaminen KDK:ssa Kimmo Koivunen CSC Tieteen tietotekniikan keskus Oy

Digitaaliseen säilytykseen hyväksyttävät tiedostoformaatit

Kimmo Koivunen CSC Tieteen tietotekniikan keskus

KDK:n pitkäaikaissäilytyksen suunnittelun tilanne ja vastaanotettavan aineiston vaatimukset DigiWiki-seminaari Kimmo Koivunen CSC Tieteen

Keskitetty digitaalisen säilyttämisen palvelu osana KDK arkkitehtuuria Kimmo Koivunen CSC Tieteen tietotekniikan keskus

Kansallinen digitaalinen kirjasto

PAS-tilanne ja julkaistujen opinnäytteiden pitkäaikaissäilytykseen liittyvä prosessi ja edellytykset

Museoaineiston digitointi. Museovirasto, Tiedonhallintakeskus Vesa Hongisto

Mitä PAS-järjestelmä tarkoittaa museoille?

Tutkimusdatan pitkäaikaissäilytys ATT-hankkeessa.

Datanhallinnan oppaan esittely mitä ovat IDA, AVAA, KATA, PAS, REMS? Johanna Blomqvist, CSC - Tieteen tietotekniikan keskus

Museoaineiston digitointi

TTA-PASin etenemissuunnitelma ja kustannukset

Digitointiprojektin käytäntö ja ongelmat. Esimerkkinä Porin taidemuseon digitointiprojekti 2014

Kokemuksia. aineistojen paketoinnin piloteista. KDK-pitkäaikaissäilytys seminaari

Kolme vuotta digitaalista pitkäaikaissäilytystä

KDK:n PAS-palvelun palvelukuvaus

TTA, PAS ja julkishallinnon standardisointi

Kokemuksia PDF/A:sta Arkistolaitoksen VAPApalvelussa

KDK/PAS: Mitä kuvien luetteloinnissa tulee ottaa huomioon pitkäaikaissäilytyksen näkökulmasta? Esityksen sisältö

Tutkimuksen pitkäaikaissaatavuuden palvelukokonaisuus

Kolme vuotta digitaalista pitkäaikaissäilytystä

Digitaalinen pitkäaikaissäilytys

Aineistojen paketoinnin pilotit PAS-seminaari 2013 Kuisma Lehtonen

Tutkimuksen avoimuus - yhteistyön ja palveluiden lähtökohdat 2018

AV-muotojen migraatiotyöpaja - video. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

Sähköisen arkistoinnin reunaehdot

W3C ja alueellinen standardointi

W3C ja Web-teknologiat

T.E.H.D.A.S. Arkisto. Kokemuksia performanssitaiteen arkistoinnista. Juha Mehtäläinen

Syntysähköisten. Markus Merenmies / Kansallisarkisto

Saavutettavat verkkosivut Miten ne tehdään?

Palvelukuvaus v Alkujaan digitaalisen aineiston vastaanoton ja säilyttämisen palvelu

W3C ja Web-teknologiat

KDK-ajankohtaispäivä museoille

W3C: teknologia ja (tieto)yhteiskunta

Suoramaksu- migraatio

Sähköinen säilyttäminen

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus. Anssi Kainulainen / CSC

Kansallisarkiston sähköisen säilyttämisen palvelut kuntien teknisen sektorin käyttöön. Markus Merenmies

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

Kansallinen digitaalinen kirjasto KDK Miten se palvelee?

Kansalliskirjaston ATThankkeet

1. Skannaus ja tekstintunnistus (OCR) verkkoskannerilta

KDK ja asiakasliittymä - tilannekatsaus. Tampereen kaupungnkirjasto, maakuntakirjastokokous Tapani Sainio, Kansalliskirjasto

Digi-tv vastaanottimella toteutetut interaktiiviset sovellukset

Pitkäaikaissäilytys osana yhteentoimivaa ja vaikuttavaa kulttuuriperintöä

Kokoelmahallintajärjestelmän Vesa Hongisto

Fairdata PAS-palvelu

Verkkosisällön saavutettavuusohjeet 2.0: hyviä ohjeita monimuotoisen sisällön suunnitteluun ja arviointiin

KANSALLISEN DIGITAALISEN KIRJASTON KOKONAISARKKITEHTUURI. V3.0 Tiivistelmä

Yhteentoimiva.suomi.fi - palvelukokonaisuuden ja työkalujen esittely

PAS-RATKAISUN PALVELUKUVAUS

Seuraavat tasot sisältävät alueita ja pisteitä samassa tasossa. o Asemakaavat o Kaavayksiköt o Kiinteistöt

Tutkimuksen tietoaineistot

Verkkopalveluiden saavutettavuus

KDK Kansallinen digitaalinen kirjasto

Kanta-palveluihin tallennettavia asiakirjoja koskevien määrittelyjen versiointikäytännöt

Kansallinen digitaalinen kirjasto Kokonaisarkkitehtuuri v3.0

Tutkimuksen tietoaineistot

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Nokia Nseries PC Suite painos

Theseuksen tulevaisuudennäkymiä

Luku 7 Uusien Mallien Tiedostot

Ennakkometadata - ONIX Maarit Huttunen

IDA-tallennuspalvelun esittely. CSC Tieteen tietotekniikan keskus Oy

Videoiden digitointi Nuorisoasiainkeskuksessa

Kansallinen digitaalinen kirjasto ja arkistopalvelut

Käyttöoikeuksien metatieto

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

W3C ja Web-teknologiat

Theseus ja rajatun käytön aineistot

Digitaalinen pitkäaikaissäilytys Kimmo Koivunen CSC Tieteen tietotekniikan keskus Oy

FAIRDATA -KOKONAISUUDEN PALVELUKUVAUS

ASIAKASLIITTYMÄ. Erikoiskirjastokokous Ari Rouvari Kansalliskirjasto

Pikaopas. Valintanauhan näyttäminen tai piilottaminen Avaa valintanauha napsauttamalla välilehteä, tai kiinnitä se pysyvästi näkyviin.


Saavutettavuus > Tapio Haanperä Saavutettavuusasiantuntija tel

Muutokset suoran sanoma-asioinnin web servicepalvelun

Luento 12: XML ja metatieto

Laki digitaalisten palvelujen tarjoamisesta Digitaalisten palvelujen saavutettavuus Koulutus tiedottajille ja verkkotoimittajille, HAUS

Fairdata-palvelut. Säilytä, kuvaile, hae, pitkäaikaissäilytä

Museoiden digitointiavustus

KAM-sektori yhteisen tiedon hallinnan edelläkävijänä. KDK-tietoarkkitehtuuriryhmän seminaari Jaana Kilkki, Kansallisarkisto

ODF-standardin käyttö julkishallinossa

Luonnos hallituksen esitykseksi eduskunnalle laiksi julkisen hallinnon tiedonhallinnasta sekä eräiksi siihen liittyviksi laeiksi

Kokoelmahallintajärjestelmän

Paikkatiedot ja Web-standardit

W3C-teknologiat ja yhteensopivuus

Kansallinen digitaalinen kirjasto: katsaus kokonaisuuteen

MuseumPlus RIA - kokoelmahallintajärjestelmä taidemuseotyön kehittämisessä

Ääni%eiden digitoin, Kansalliskirjastossa

Transkriptio:

Digitaalisten aineistojen pitkäaikaissäilytys - Tiedostoformaattien standardointi Valtakunnalliset kuva-arkistopäivät 4.-5.11.2013 Vesa Hongisto Miksi tiedostoformaatteja standardoidaan Digitaalisen pitkäaikaissäilytyksen tasot Bittien säilyttäminen: Alkuperäinen bittijono voidaan toistaa nykyaikaisilla laitteilla, mutta ei takeita siitä voidaanko sisältöä tulkita. Säilyttämisen perusta ja optio tulevaisuuteen: antaa mahdollisuuden nostaa vaatimustasoa myöhemmin jos tarvetta ja rahaa on. Sisällön ymmärrettävyyden säilyttäminen: Teksti, kuvat ja muu olennainen sisältö voidaan tulkita. Ymmärrettävyys riippuu myös kohdeyleisöstä. Käytön ja uuden tiedon tuottamisen kannalta yleensä tärkein taso. Alkuperäisen käyttökokemuksen säilyttäminen: Kalvoesityksen tehosteet toistuvat alkuperäisessä muodossaan. Vanha tietokonepeli näyttää ja kuulostaa samalta kuin 30 vuotta sitten. Vaativin, mutta tutkimuksen kannalta mielenkiintoinen taso. 5.11.2013 / Vesa Hongisto 2

Miksi tiedostoformaatteja standardoidaan Digitaalisen pitkäaikaissäilytyksen tasot Sisällön ymmärrettävyyden säilyttämiseksi Bittien säilyttäminen: Alkuperäinen bittijono voidaan toistaa tiedostot nykyaikaisilla on muutettava laitteilla, mutta kunakin ei takeita siitä voidaanko sisältöä tulkita. ajanhetkenä käytössä oleviin formaatteihin. Säilyttämisen perusta ja optio Tiedostoformaattien tulevaisuuteen: antaa mahdollisuuden muunnossa nostaa häviää vaatimustasoa myöhemmin jos tarvetta ja rahaa on. aina jonkin verran informaatiota. Sisällön ymmärrettävyyden säilyttäminen: Teksti, kuvat ja muu olennainen sisältö voidaan tulkita. Ymmärrettävyys riippuu myös kohdeyleisöstä. Käytön ja uuden tiedon tuottamisen kannalta yleensä tärkein taso. Alkuperäisen käyttökokemuksen säilyttäminen: Kalvoesityksen tehosteet toistuvat alkuperäisessä muodossaan. Vanha tietokonepeli näyttää ja kuulostaa samalta kuin 30 vuotta sitten. Vaativin, mutta tutkimuksen kannalta mielenkiintoinen taso. 5.11.2013 / Vesa Hongisto 3 HKDK:n tuottamat ohjaavat dokumentit 5.11.2013 / Vesa Hongisto 4

Säilytyssuunnitelma Jokaiselle pitkäaikaissäilytykseen tulevalle aineistolle tehdään säilytyssuunnitelma Säilytyssuunnitelmassa määritellään mitkä ovat ne ominaisuudet jotka eivät saa muuttua migraatiossa Jos on käytettävissä vaihtoehtoisa tedostoformaattejavalitaan se, joka parhaiten takaa halutun ominaisuuden säilymisen Esimerkkejä: Asiakirjassa voi riittää, että informaatiosisältö, teksti, säilyy, asettelu voi muuttua Taidevalokuvassa on oleellista, että myös värisävyt säilyvät 5.11.2013 / Vesa Hongisto 5 Tiedostoformaattien arviointikriteerit Avoimuus Kuinka helppoa tiedostomuodosta on saada tietoja? Käyttö PAS-standardina Missä määrin tiedostomuoto on muodollisesti hyväksytty pitkäaikaissäilytyksen välineeksi kansalliskirjastoissa, kansallisarkistoissa ja muissa alan laitoksissa? Vakaus / yhteensopivuus (a) Missä määrin tiedostomuoto on eteen- ja taaksepäin yhteensopiva? (b) Missä määrin tiedostomuoto on suojattu tiedoston korruptoitumista vastaan? (c) Kuinka usein tiedostomuodosta julkaistaan korvaavia versioita? Riippuvuudet / yhteentoimivuus Missä määrin tiedostomuoto on sidottu esimerkiksi tiettyyn laitteistoon tai ohjelmistoon? Standardisuus Missä määrin tiedostomuoto on käynyt läpi perusteellisen standardointiprosessin? 5.11.2013 / Vesa Hongisto 6

Tiedostoformaattien arviointi 1. Avoimuus Määritykset saatavissa yhdeltä tai useammalta seuraavista: (a) (b) avoimen jäsenyyden järjestö [kuten W3C (World Wide Web Consortium) tai OMG (Object Management Group)] Kansainvälinen standardointijärjestö (esim. ISO) (c) Tuotannonalan avoimen jäsenyyden järjestö Määritykset saatavilla vain maksusta A Määritykset mahdollisesti saatavilla useista lähteistä (ei saatu vahvistettua) B Määrityksiä jakelee tai niiden jakelua valvoo yksi kaupallinen toimija tai pieni C kaupallisten toimijoitten joukko. A 5.11.2013 / Vesa Hongisto 7 Tiedostoformaattien arviointi 2. Käyttö PASstandardina Merkittävä osa (yli puolet) organisaatioista käyttää tai aikoo käyttää tiedostomuotoaa säilytyskelpoisena tiedostomuotona Jotkut organisaatioista (alle puolet) käyttävät tai aikovat käyttää tiedostomuotoab säilytyskelpoisena tiedostomuotona Yksikään organisaatio ei käytä eikä aio käyttää tiedostomuotoa säilytyskelpoisenac tiedostomuotona 5.11.2013 / Vesa Hongisto 8

Tiedostoformaattien arviointi 3. Vakaus / yhteen-sopivuus (a) Alas-/ ylöspäin yhteensopivuuden taso Tiedostomuodon versio on alaspäin yhteensopiva, jos se sisältää kaikki aiemman version toiminnallisuudet Tiedostomuodon versio on ylöspäin yhteensopiva, jos sen avulla voi ongelmitta tallentaa sisältöä, joka on tarkoitettu tiedostomuodon uudemmalle versiolle (kääntäen: ohjelmisto, joka on suunniteltu tulkitsemaan tai näyttämään tiedostomuodon aiempaa versiota pystyy tulkitsemaan tai näyttämään myös tiedostomuodon nykyistä versiota). Hyväyhteensopivuus tiedostomuotoonyhteensopivaniinylös-kuinalaspäinkin. A Kohtalainen yhteensopivuus tiedostomuoto on vain alaspäin yhteensopiva. B Huonoyhteensopivuus tiedostomuotoeioleyhteensopivaylös-eikäalaspäin. C 5.11.2013 / Vesa Hongisto 9 Tiedostoformaattien arviointi 3. Vakaus / yhteen-sopivuus (b) Korruptoitumisen sieto Korruptoitumisen sieto tarkoittaa sitä, että tiedostomuoto sietää sisällön bitti- tai tavutason satunnaisia muutoksia. Hyvä sietokyky Muutokset eivät juurikaan tai lainkaan vaikuta tiedostomuodona näyttämiseen tai tulkintaan; tai tiedostomuoto sisältää menetelmiä, joilla muutokset havaitaan ja/tai korjataan Kohtalainen sietokyky Muutokset vaikuttavat tiedostomuodon näytettävyyteen B mutteivät tulkittavuuteen; tiedostomuoto voi jossakin määrin palautua muutoksista. Huonosietokyky Kaikkimuutoksetvaikuttavat näytettävyyteenjatulkittavuuteen. C 5.11.2013 / Vesa Hongisto 10

Tiedostoformaattien arviointi 3. Vakaus / yhteen-sopivuus (c) Versiopäivitysten määrä Tiedostomuodon vakaus ilmaistuna uusien versioiden tai laajennusten lukumääränä; tiedostomuodon käyttö johdannaisissa ja/tai tuotannonalakohtaisissa sovelluksissa. Suuri vakaus A Keskitason vakaus B Epävakaus C 5.11.2013 / Vesa Hongisto 11 Tiedostoformaattien arviointi 4. Riippumattomuus / yhteentoimivu us Korkea riippumattomuus& yhteentoimivuus Korkea riippumattomuus& keskitason yhteentoimivuus Keskitason riippumattomuus& korkea yhteentoimivuus Korkea riippumattomuus& alhainen yhteentoimivuus Keskitason riippumattomuus& yhteentoimivuus Keskitason riippumattomuus& alhainen yhteentoimivuus Alhainen riippumattomuus& yhteentoimivuus Alhainen riippumattomuus& keskitason yhteentoimivuus Alhainen riippumattomuus& korkea yhteentoimivuus A B C 5.11.2013 / Vesa Hongisto 12

Tiedostoformaattien arviointi 5. Tiedostomuotoa sääntelee jonkin seuraavista hallitsema muodollinen prosessi: A Standardisuus Avoimen jäsenyyden organisaatio (W3C, OMG yms.) Kansainvälinen standardiorganisaatio (esim. ISO) Tuotannonalakohtainen avoimen jäsenyyden organisaatio Tiedostomuotoa sääntelee dokumentoitu prosessi, jonka on luonut yksittäinenc kaupallinen toimija tai pieni kaupallisten toimijoiden joukko; tai tiedostomuotoa koskevia prosesseja ei ole dokumentoitu. 5.11.2013 / Vesa Hongisto 13 Säilytyskelpoiset tiedostomuodot Tiedostoformaatit Säilytyskelpoisiksi hyväksytään sellaiset tiedostomuodot, joissa tietosisällön säilyminen ja ymmärrettävyys voidaan taata pidemmällä aikavälillä. Siirtokelpoiset tiedostomuodot Siirtokelpoisiksi hyväksytään vain sellaisia tiedostomuotoja, joita käytetään useassa KDK:nPAS-järjestelmäähyödyntävässä organisaatiossa ja joissa pitkäaikaissäilytettävää aineistoa on runsaasti tallennettu. KDK:n PAS-ratkaisu muuntaa säilytyssuunnitelman asettamien vaatimusten ja ehtojen mukaisesti siirtokelpoisessa muodossa vastaanotetut tiedostot säilytyskelpoiseen tiedostomuotoon ennen säilyttämisen aloittamista. 5.11.2013 / Vesa Hongisto 14

Tiedostoformaatit 5.11.2013 / Vesa Hongisto 15 Tiedostoformaattien pakolliset metatiedot Aineistoja digitaaliseen pitkäaikaissäilytykseen vietäessä on tiedostoista annettava riittävän tarkka kuvaus niiden teknisistä ominaisuuksista, jotta myöhempi muunto uusiin formaatteihin on mahdollista KDK-hankkeessaon määritelty joidenkin aineistotyypin osalta pakolliset tekniset metatiedot Määrittely on tehty muutoksina suhteessa USA:n kongressin kirjaston eri tiedostotyyppien skeemoihin Esimerkki: tekstitiedostoissa täytyy mainita käytetty merkistö Teknisissä metatiedoissa on myös käytettävä samoja yksikäsitteisiä ilmaisuja esimerkiksi mittayksiköissä 5.11.2013 / Vesa Hongisto 16

Formaattikirjasto KDK:ssakäytetään pääsääntöisesti tiedostomuodoille PRPNOM formaattikirjaston tunnisteita KDK ylläpitää kontrolloitua sanastoa jossa määritetään miten kukin formaatti ja sen versio ilmaistaan 5.11.2013 / Vesa Hongisto 17 Tiedostomuotojen migraatiossa huomioitavat ominaisuudet Esimerkki tiedostomuunnoksessa säilyvistä, muuttuvista ja katoavista ominaisuuksista 5.11.2013 / Vesa Hongisto 18

Kiitos! vesa.hongisto@nba.fi www.nba.fi http://www.kdk.fi/fi/pitkaaikaissailytys/maeaerittely-jadokumentit/5-suomi/pitkaeaikaissaeilytys/141-kdknsaeilytys-ja-siirtokelpoiset-tiedostomuodot