Heikki Helin Metatiedot ja tiedostomuodot

Samankaltaiset tiedostot
KDK/PAS: Mitä kuvien luetteloinnissa tulee ottaa huomioon pitkäaikaissäilytyksen näkökulmasta? Esityksen sisältö

Keskitetty digitaalisen säilyttämisen palvelu osana KDK arkkitehtuuria Kimmo Koivunen CSC Tieteen tietotekniikan keskus

Digitaalisten aineistojen pitkäaikaissäilytys - Tiedostoformaattien standardointi

Asiakirjojen pitkäaikaissäilytys. Osmo Palonen Mikkelin Ammattikorkeakoulu

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

Kolme vuotta digitaalista pitkäaikaissäilytystä

Missä ollaan pitkäaikaissäilytyksen toteuttamisessa? KDK:n arkistosektorin yhteistyöverkoston seminaari Kimmo Koivunen CSC Tieteen

Mitä tiedon pitkäaikaissäilytys tarkoittaa?

Pitkäaikaissäilytyksen toteutuksen erityispiirteet. TTA:n pitkäaikaissäilytyksen keskustelutilaisuus Kimmo Koivunen

AV-muotojen migraatiotyöpaja - video. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

Digitaaliseen säilytykseen hyväksyttävät tiedostoformaatit

Kolme vuotta digitaalista pitkäaikaissäilytystä

Kansallisarkiston sähköisen säilyttämisen palvelut kuntien teknisen sektorin käyttöön. Markus Merenmies

Aineistojen paketoinnin pilotit PAS-seminaari 2013 Kuisma Lehtonen

Sähköiset aineistot ja arvonmääritys rakenteelliset ja tekniset kriteerit. Projektipäällikkö Osmo Palonen, Mikkelin ammattikorkeakoulu

TTA-PASin etenemissuunnitelma ja kustannukset

PAS-tilanne ja julkaistujen opinnäytteiden pitkäaikaissäilytykseen liittyvä prosessi ja edellytykset

Digitaalisten aineistojen pitkäaikaissäilytys. OKM:n toimialan tietohallinnon yhteistyökokous. Kimmo Koivunen CSC Tieteen tietotekniikan keskus Oy

Kansallisarkiston päätökset opinnäytteiden pysyvästä säilyttämisestä

Mitä PAS-järjestelmä tarkoittaa museoille?

W3C-teknologiat ja yhteensopivuus

Unelmat ja todellisuus: saatavuus ja säilyminen. Osmo Palonen Mikkelin Ammattikorkeakoulu

KDK:n pitkäaikaissäilytyksen suunnittelun tilanne ja vastaanotettavan aineiston vaatimukset DigiWiki-seminaari Kimmo Koivunen CSC Tieteen

Syntysähköisten. Markus Merenmies / Kansallisarkisto

KDK: Finna ja pitkäaikaissäilytys

Tutkimusdatan pitkäaikaissäilytys ATT-hankkeessa.

Muistio. Att:Videokerho Monitori ry:n jäsenet SUB: ÄÄNI-KUVA- JA VIDEOTIEDOSTOFORMAATIT. 1 Tiedostojärjestelmistä

KDK:n PAS-palvelun palvelukuvaus

KDK-ajankohtaispäivä museoille

Digitointiprosessin työskentelyohjeistus

Pitkäaikaissäilytyksen toteuttaminen KDK:ssa Kimmo Koivunen CSC Tieteen tietotekniikan keskus Oy

TTA, PAS ja julkishallinnon standardisointi

Sähköinen säilyttäminen

KANSALLISEN DIGITAALISEN KIRJASTON KOKONAISARKKITEHTUURI. V3.0 Tiivistelmä

Digitointiprojektin käytäntö ja ongelmat. Esimerkkinä Porin taidemuseon digitointiprojekti 2014

3 Verkkosaavutettavuuden tekniset perusteet

Kokemuksia PDF/A:sta Arkistolaitoksen VAPApalvelussa

Kansallinen digitaalinen kirjasto

Metadata ja hyvät käytännöt

Käyttöoikeuksien metatieto

Kimmo Koivunen CSC Tieteen tietotekniikan keskus

ODF-standardin käyttö julkishallinossa

Pitkäaikaissäilytyksen toiminta ja ylläpito

Tutkimuksen pitkäaikaissaatavuuden palvelukokonaisuus

ARKISTOLAITOS. Asiakirjahallinnon keskeiset standardit. Pekka Henttonen ylitarkastaja.

L A TEX, pdfl A TEX ja grafiikka

Äänen digitointi. Juha Korvenpää. Kansalliskirjasto Kansallinen digitointikeskus, Mikkeli

THL:N NÄKÖKULMIA TUTKIMUSAINEISTOJEN SÄILYTTÄMISEEN

sfrm software for requirements management

Kansallinen digitaalinen kirjasto Kokonaisarkkitehtuuri v3.0

TIEDOSTOFORMAATIT. Lyhyt selostus erilaisista tiedostoformaateista

Kokemuksia. aineistojen paketoinnin piloteista. KDK-pitkäaikaissäilytys seminaari

SÄHKE-hanke. Tekninen mallintamisen Siirtotiedoston metatietokuvaukset

Juha-Pekka Ruuska BITTIKARTTAGRAFIIKKA, BITTIKARTTAKUVAT ELI RASTERIKUVAT...2

TTA-hankkeen esittely. Pirjo-Leena Forsström TTA-hankkeen pääsihteeri

Datanhallinnan oppaan esittely mitä ovat IDA, AVAA, KATA, PAS, REMS? Johanna Blomqvist, CSC - Tieteen tietotekniikan keskus

Tekstinkäsittelystä. H4: Tekstinkäsittelyn perusharjoitus. Toimisto ohjelmista

XML johdanto, uusimmat standardit ja kehitys

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Paikkatiedot ja Web-standardit

T.E.H.D.A.S. Arkisto. Kokemuksia performanssitaiteen arkistoinnista. Juha Mehtäläinen

W3C: teknologia ja (tieto)yhteiskunta

W3C ja Web-teknologiat

Palvelukuvaus v Alkujaan digitaalisen aineiston vastaanoton ja säilyttämisen palvelu

Juha Henriksson. Digitaalinen äänentallennus Dr. Juha Henriksson Finnish Jazz & Pop Archive

Yhteentoimiva.suomi.fi - palvelukokonaisuuden ja työkalujen esittely

Keski-Suomen museo. Kuva-arkisto ja tutkimusarkisto. Kuva: Olga Oksanen, Keski-Suomen museo. Keski-Suomen museo

FAIRDATA -KOKONAISUUDEN PALVELUKUVAUS

JHS-järjestelmä ja avoimet teknologiat. Tommi Karttaavi

ASIAKASLIITTYMÄ. Erikoiskirjastokokous Ari Rouvari Kansalliskirjasto

Kirjastot, arkistot ja museot yhteentoimivuuden kehittämisen keskiössä

Sähköisen arkistoinnin ja säilyttämisen palvelukokonaisuus

SÄHKE- ja Moreqvaikutukset. dokumenttienhallinnan järjestelmäkehitykseen. Juha Syrjälä, Affecto Finland Oy

Paikkatietotuotteen määrittely

Digitaalinen pitkäaikaissäilytys Kimmo Koivunen CSC Tieteen tietotekniikan keskus Oy

Valmiustaitoja biokemisteille

TTA-hankkeen esittely

Finna-kehitystyön painopisteet vuonna 2014

TUTKIMUSAINEISTOJEN TIEDOSTOMUODOT JA PITKÄAIKAISSÄILYTYSKELPOISUUS SELVITYKSEN LOPPURAPORTTI

Muutokset suoran sanoma-asioinnin web servicepalvelun

Suomen luontokeskus Haltia Graafinen ohjeisto Hahmo Design Oy

KAM-sektori yhteisen tiedon hallinnan edelläkävijänä. KDK-tietoarkkitehtuuriryhmän seminaari Jaana Kilkki, Kansallisarkisto

Digi-tv vastaanottimella toteutetut interaktiiviset sovellukset

W3C & verkkojulkaisun standardit

Paikkatietotuotteet ja niiden määrittely

PITKÄAIKAISSÄILYTYKSEN AINEISTOJEN PAKETOINNIN PILOTIN SUUNNITELMA

Tutkimuksen tietoaineistot

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

AINEISTOJEN JA NIIDEN METATIETOJEN PAKETOINTI PITKÄAIKAISÄILYTYKSEEN

Avoimet standardit ja asiakirjamuodot Suomen julkisessa hallinnossa: teoriasta käytäntöön

Kansallinen digitaalinen kirjasto: Digitaalinen pitkäaikaissäilytys

Fairdata PAS-palvelu

Tutkitaan sitten HTML-dokumenttien anatomiaa, jotta päästään käsiksi rakenteisten dokumenttien käsitteistöön esimerkkien kautta.

Sähköisen arkistoinnin reunaehdot

Kansallinen digitaalinen kirjasto

HL7 Clinical Document Architecture. Seminaari: Tiedonhallinta terveydenhuollossa Riku Niittymäki

Hyvät käytännöt ja pitkäaikaissäilytyksen huomioiminen digitoinnissa FT István Kecskeméti, sektorijohtaja, Kansallisarkisto

MAASEUDUN SIVISTYSLIITON GRAAFINEN OHJEISTO 1.1. Maaseudun Sivistysliiton graafinen ohjeisto 1.1

Sisältö. XML, XHTML ja CSS XML XML. XML:n ja HTML:n ero. XML kieliä XML XHTML CSS XSL. T Hypermediadokumentin laatiminen 2002

KDK Kansallinen digitaalinen kirjasto

Transkriptio:

Heikki Helin 6.5.2013 Metatiedot ja tiedostomuodot

KDK:n metatiedot ja tiedostomuodot KDK:n tekniset määritykset ja niiden väliset suhteet Aineistojen valmistelu ja paketointi on hyödyntäville organisaatioille näkyvin osa pitkäaikaissäilytystä PASratkaisun alkuvaiheessa Tätä ohjataan yhteisillä määrityksillä, jotka KDK:n arkkitehtuurin mukaisesti rinnastuvat standardisalkkuun. Määritykset laadittu yhteistyössä KDK:ssa mukana olevien organisaatioiden kanssa

KDK:n (PAS) määritykset

KDK:n (PAS) määritykset

Standardisalkku

Standardisalkku Kuvaa yhteisesti käytetyt standardit ja määritykset perusteluineen Metatiedot, rajapinnat, Mahdollistaa yhtenäisten palveluiden tarjoamisen ja aineistojen yhdisteltävyyden sekä metatietojen kehittämisen Semanttinen yhteismitallisuus Soveltamisohjeet määritellään tarvittaessa erikseen

METS & metatiedot

METS (Metadata Encoding and Transmission Standard) Digitaalisiin objekteihin liittyy erilaista metatietoa Kuvailevaa, teknistä, käyttöoikeus, historia, METS mahdollistaa näiden liittämisen digitaalisiin objekteihin Kokonaisuuden siirtäminen PAS-järjestelmään (ja takaisin taustajärjestelmään) Digitaalisten objektien välisten suhteiden kuvaaminen Rakenteellinen metatieto

KDK/METS yleiset linjaukset Kunkin asian voi ilmaista vain yhdellä tavalla Erilaiset rakenteet monimutkaistavat tarpeettomasti validointia ja säilyttämistä Laajentavat rakenteet sallitaan, mutta niiden ymmärrettävyyttä ei säilytetä Laajennetut metatiedot lisäävät dokumentin käyttöarvoa ja parantavat sen käyttöarvoa Laajentavat metatietorakenteet eivät saa sotkea tai tarpeettomasti monimutkaistaa muita elementtejä Monimutkaistuminen lisää riskiä validoinnin tai säilytyksen epäonnistumiselle

METS rakenne

KDK-METS profiili Määrittelee pakolliset ja suositeltavat metatiedot Miten ja missä ne ilmaistaan METS dokumentissa Mahdollistaa (XML) skeeman käyttämisen validoinnissa KDK METS skeema julkaistaan KDK:n www-sivuilla lähiaikoina

Käyttörajoitukset Käyttö- ja näyttörajoituksien ilmaisemiseen on olemassa valmiita ratkaisuja, mutta Eivät sovellu KDK:n tarpeisiin Puutteellisia (esim. ajan ilmaiseminen, lakiin viittaaminen) Käyttötarkoitus eri (näkökulma) KDK:ssa päätetty kehittää oma ratkaisu KDK:n tarpeisiin

Tiedostomuodot

Tiedostomuodot KDK:n säilytys- ja siirtokelpoiset tiedostomuodot määritys määrittelee Säilytyskelpoiset tiedostomuodot Siirtokelpoiset tiedostomuodot Kontrolloidun sanaston tiedostomuotojen ilmaisemiseen Vaatimukset teknisille metatiedoille Myöhemmin määritellään Soveltamisohjeet Migraatiopolut

Säilytyskelpoiset tiedostomuodot Tiedostomuotojen arvioidaan olevan käyttökelpoisia vielä pitkään Tällä hetkellä tiedostomuotoja: Teksti/toimisto-ohjelmistot: 7 tiedostomuotoa Ääni: 5 tiedostomuotoa Kuva: 4 tiedostomuotoa Eläväkuva: 1 tiedostomuoto

Siirtokelpoiset tiedostomuodot Tiedostomuotoja, joita arvioidaan olevan hyödyntävillä organisaatiolla runsaasti, mutta jotka eivät sovellu pitkäaikaiseen säilyttämiseen Yhteiset suunnitelmat migraatiolle Tällä hetkellä tiedostomuotoja: Teksti/toimisto-ohjelmistot: 2 tiedostomuotoa Ääni: 3 tiedostomuotoa Kuva: 3 tiedostomuotoa Eläväkuva: 3 tiedostomuotoa

Arviointikriteerit Avoimuus Käyttö PASstandardina Vakaus/ yhteensopivuus Riippuvuudet / yhteentoimivuus Standardisuus Kuinka helppoa tiedostomuodosta on saada tietoja? Missä määrin tiedostomuoto on muodollisesti hyväksytty pitkäaikaissäilytyksen välineeksi? (a) Missä määrin tiedostomuoto on eteen- ja taaksepäin yhteensopiva? (b) Missä määrin tiedostomuoto on suojattu tiedoston korruptoitumista vastaan? (c) Kuinka usein tiedostomuodosta julkaistaan korvaavia versioita? Missä määrin tiedostomuoto on sidottu esimerkiksi tiettyyn laitteistoon tai ohjelmistoon? Missä määrin tiedostomuoto on käynyt läpi perusteellisen standardointiprosessin?

Avoimuuss Käyttö PAS-standardina Alas-/ylöspäin yhteensopivuuden taso Korruptoitumisen sieto Versiopäivi tysten määrä Riippumattomuus / yhteentoimivuus Standardisuus Yhteenveto arvioinnista: Säilytyskelpoiset tiedostomuodot Vakaus / yhteensopivuus Electronic Publications (EPUB) A B B A A A Extensible Hypertext Markup Language (XHTML) A B B A A A Extensible Markup Language (XML) A A A A A A Hypertext Markup Language (HTML) A A B A A A Open Document Format (ODF) A A B B A A PDF for long-term preservation (PDF/A) A A B A A A Tekstitiedosto (plain text) A A B A A A Audio Interchange File Format (AIFF), PCM-koodattu A A A A A A Broadcast Wave Format (BWF) A A A A A A Free Lossless Audio Codec (FLAC) A B A A A A A MPEG-4 AAC Advanced Audio Coding (AAC) A B A A A Waveform Audio Format (WAV) A A A A A A JPEG 2000 sekvenssi A A A A A A A Joint photographic experts group (JPEG) A A A A A Joint photographic experts group JPEG 2000 (JP2) A A A A A Tagged Image File Format (TIFF) A A A A A Portable network graphics (PNG) A A A A A A

Määritykset julkisia Määritykset saatavilla KDK:n www-sivuilla http://www.kdk.fi/fi/pitkaaikaissailytys/maeaerittely-jadokumentit Standardisalkku: 14.2.2013 Hallinnolliset ja rakenteelliset metatiedot ja aineiston paketointi: v1.2 (28.2.2013) Säilytys- ja siirtokelpoiset tiedostomuodot: v1.2 (8.4.2013) Määritykset päivittyvät erityisesti PASratkaisun käyttöönoton alkuvaiheessa mutta ne eivät koskaan ole valmiita

Kiitos