PITKÄAIKAISSÄILYTYSJÄRJESTELMÄN TOIMINNALLINEN VAATIMUSMÄÄRITTELY Arto Teräs (projektipäällikkö), Pirjo-Leena Forsström, M. Minna Laine, Sami Salonen CSC - Tieteen tietotekniikan keskus Oy Editio 0.9 0.3.2009 Tämä alustava toiminnallinen vaatimusmäärittely on osa Opetusministeriön Kansallinen digitaalinen kirjasto -hanketta (hankenumero OPM039:00/2008)
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 2(62) Sisällysluettelo Merkinnät...4. Taustaa...4.. Kansallinen digitaalinen kirjasto -hanke...4.2. Dokumentin lähtökohdat...5.3. Pitkäaikaissäilytyksen linjaukset...6 2. Pitkäaikaissäilytyksen kokonaisuus...6 2.. Organisatorinen rakenne ja vastuut...8 2.2. PAS-järjestelmän suhde olemassaoleviin toimintoihin...0 2.2. PAS-järjestelmässä säilytettävä digitaalinen informaatio... 2.2.2. Digitaalisen informaation luovutus pitkäaikaissäilytykseen...3 2.2.3. Olemassaolevien taustajärjestelmien liittäminen PAS-järjestelmään...4 2.2.4. Esimerkki taustajärjestelmien liittämisestä: VAPA...5 2.3. PAS-järjestelmän toiminta...5 2.3.. Looginen kokonaisuus...5 2.3.2. Tekninen toteutus...7 2.4. PAS-organisaatioon liittyvä vaatimusmäärittely (TRAC A)...8 2.4.. Kestävä hallinnointi...8 2.4.2. Kestävä toimintamalli...20 2.4.3. Sopimukset, lisenssit ja vastuut...20 3. PAS-järjestelmän yleiset vaatimukset...2 3.. Toimintaprosessit ja käyttötapaukset...22 4. Digitaalisen informaation hallinta...24 4.. Vastaanoton toimintojen ja rajapintojen määrittely...24 4.2. Sisältötiedon kerääminen (TRAC B)...26 4.2.. Luovuttajan digitaaliseen informaatioon luovutuksen yhteydessä liittämä tieto, luovutuspaketti (SIP) ja sen muokkaaminen säilytyspaketiksi (AIP)...26 4.2.2. Digitaalisen informaation luovutus PAS-järjestelmään...28 4.2.3. Vastaanoton valvonta...28 4.2.4. Tapahtumaloki (audit trail)...29 4.3. Säilytyspaketin (AIP) luominen (TRAC B2)...29 4.3.. Tietorakenne...3 4.3.2. Kokoelmat ja suhteet...3 4.4. Säilytyksen suunnittelu (TRAC B3)...3 4.4.. Säilyttävä kopiointi ja muunnokset...3 4.4.2. Aineiston versiointi...32 4.4.3. Tilastot...33 4.5. Arkistointi, säilytys ja säilytyspaketin hallinta (TRAC B4)...34 4.5.. Pitkäaikaissäilytettävän tiedon siirto...34 4.5.2. Muuttumattomuus...35 4.6. Tiedon hallinta (TRAC B5)...35 4.6.. Metatiedot...36 4.6.2. Digitaalisen informaation haku ja selaus...36 4.6.3. Säilytyspakettien valmistelu käytettäväksi...37 4.6.4. Aineiston esittäminen...37 4.7. Pääsyn hallinta (TRAC B6)...38 4.7.. Suojaus...39
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 3(62) 4.7.2. Käyttöoikeudet...39 5. Teknologia ja tekninen infrastruktuuri...40 5.. Ominaisuudet ja toteutusvaihtoehdot...40 5.2. Kapasiteetti ja suorituskyky...42 5.3. Tekniseen infrastruktuuriin liittyvä vaatimusmäärittely (TRAC C C2)...43 5.3.. Kokonaisarkkitehtuuri ja soveltuvat teknologiat...43 5.3.2. Tallennus ja eheys...44 6. Turvallisuus...46 6. Lait ja normit...46 6... Lainsäädäntö...46 6..2. Turvallisuuteen liittyvät ohjeet ja määräykset:...46 6.2. Riskit ja niiden minimointi...47 6.3. Turvallisuuteen liittyvä vaatimusmäärittely...49 6.3.. Riskienhallinta ja varautuminen (TRAC C3)...49 6.3.2. Lokitietojen kerääminen...50 7. Määritelmät ja käytetyt lyhenteet...5 8. Lähteet...60 9. Dokumentin muutoshistoria...62
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 4(62) Merkinnät Taulukoissa on käytetty seuraavia merkintöjä: Nro: Vaatimuksen numero. Vaatimus: Vaatimuksen teksti. Joissakin kohdissa varsinaiseen vaatimukseen on lisätty esimerkki tai muu selitys kursiivilla. Kr: Vaatimuksen kriittisyys. Sitä kuvataan numeroarvoin: : Välttämätön ("must") 2: Suositeltava ("should") 3: Hyödyllinen / mahdollinen ("may") Viitteet: Viittaukset standardeihin, Kansalliskirjaston vuonna 2007 laatiman vaatimusmäärittelyn ([KK_PAS]) sekä Kansallisarkiston VAPA-järjestelmän vaatimusmäärittelyn ([VAPA]) numerointiin. Monia vaatimuksia on muokattu alkuperäisistä, mutta viitteet on silti säilytetty. Avainsanaa TARKENNETTAVA käytetään kohdissa, joissa tätä alustavaa vaatimusmäärittelyä on tarkennettava (usein teknisen vaatimusmäärittelyn yhteydessä).. Taustaa.. Kansallinen digitaalinen kirjasto -hanke Opetusministeriö on perustanut Kansallinen digitaalinen kirjasto (KDK) -hankkeen. Kansallinen digitaalinen kirjasto -hankkeen tavoitteet ovat kirjastojen, arkistojen ja museoiden keskeisten kansallisten tietovarantojen saatavuuden ja käytettävyyden edistäminen tietoverkoissa sekä sähköisten kulttuuriperintöaineistojen pitkäaikaissäilytysratkaisujen kehittäminen. Sähköisillä kulttuuriperintöaineistoilla tarkoitetaan sekä digitoituja että digitaaliseen muotoon suoraan tuotettuja kulttuuriperintöaineistoja: lakisääteisen säilyttämisen piiriin kuuluvia sähköisiä kulttuuriaineistoja, kansalliseen kulttuuriperintöön kuuluvaa sähköistä asiakirjallista aineistoa sekä aineellisen ja henkisen kulttuuriperinnön säilyttämisestä vastaavien, opetusministeriön hallinnonalalla toimivien organisaatioiden muita pitkäaikaissäilytyksen piiriin kuuluvia sähköisiä tietovarantoja. Mukaan on valittu kattava edustus kirjastoista, arkistoista ja museoista. Kansallinen digitaalinen kirjasto -hankkeen painopistealueet ovat. yhteisen hakupalvelun kehittäminen kirjastojen, arkistojen ja museoiden keskeisille sähköisille tietovarannoille; 2. kirjastojen, arkistojen ja museoiden keskeisten, priorisoitujen aineistojen digitointi ja liittäminen osaksi yhteistä hakupalvelua; 3. sähköisten kulttuuriperintöaineistojen pitkäaikaissäilytysratkaisujen tuottaminen; sekä 4. kulttuuri- ja kulttuuriperintöaineistojen digitointia ja sähköistä saatavuutta sekä sähköisten kulttuuriperintöaineistojen pitkäaikaissäilytystä koskevan osaamisen lisääminen. Tavoitteiden saavuttamiseksi toteutetaan yhteisen hakupalvelun ja sähköisen pitkäaikaissäilyttämisen kehittämishankkeet sekä muita toimenpiteitä. Tämä pitkäaikaissäilytyksen (PAS) alustava toiminnallinen vaatimusmäärittely on osa pitkäaikaissäilyttämisen kehittämishanketta (painopistealue 3), jonka on tilannut KDK:n pitkäaikaissäilytys-jaosto. Pitkäaikaissäilytys-jaoston tehtävänä on ohjata sähköisten kulttuuriperintöaineistojen pitkäaikaissäilyttämisen kehittämishanketta. Hanke keskittyy ensisijaisesti tuottamaan pitkäaikaissäilytyksen kansalliset toteuttamisratkaisut, jotka koskevat opetusministeriön hallinnonalalla toimivien, henkisen ja aineellisen kulttuuriperinnön säilyttämisestä vastaavien organisaatioiden sähköisiä kulttuuriperintö-
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 5(62) aineistoja. Lisäksi jaoston tehtävänä on parantaa muilla toimenpiteillä sähköisten kulttuuriperintöaineistojen pitkäaikaissäilytystä. Yhteinen asiakasliittymä (viitetieto ja kokoteksti) Digitoitava aineisto Taustajärjestelmät Kirjastot Arkistot AV -arkistot Museot Digitaaliseen muotoon syntyvä aineisto Kuva : Kansallisen digitaalisen kirjaston pitkäaikaissäilytyksen kokonaiskuva [OPM_WWW]..2. Dokumentin lähtökohdat PAS-järjestelmän tulee tarjota rajapintapalveluita sekä aineiston vastaanottoon organisaatioiden tiedonhallintajärjestelmiltä että säilytettävän informaation jakeluun taustajärjestelmille. Alustavan toiminnallisen vaatimusmäärittelyn tulee tarjota: Pitkäaikaissäilytysjärjestelmä (metatieto ja dokumentit) riittävä ja kattava pohja KDK:n teknisen jaoston tehtävänä olevan tätä toiminnallista vaatimusmäärittelyä täydentävän teknisen vaatimusmäärittelyn laatimiselle, kokonaisnäkemys PAS-järjestelmään siirrettävistä ja siellä käsiteltävistä aineistoista sekä PASjärjestelmässä olevan aineiston hallinnoinnista ja käytöstä, sekä kuvaus PAS-järjestelmän toiminnasta ja rajapinnoista, joiden perusteella KDK:n PASjaostossa voidaan kehittää yhtenevä toimintomalli aineiston hallinnasta ja palveluista. Toiminnallisessa vaatimusmäärittelyssä on huomioitava yleiset standardit, suositukset sekä käytännöt ja selvittää miten muissa kansainvälisissä hankkeissa on vastaavia kysymyksiä lähestytty. Tämän lisäksi hahmotellaan organisatorisia vaatimuksia, jotka pitkäaikaissäilyttäminen asettaa jatkuvuuden ja toimintamandaattien takaamiseksi. Linjaukset näihin tulee tehdä korkean tason ohjausryhmässä. Tämän vaatimusmäärittelyn pohjana on käytetty TRAC-tarkistuslistaa (Trustworthy Repositories Audit & Certification: Criteria and Checklist, v..0, helmikuu 2007, [TRAC]) ja Kansalliskirjaston vuonna 2007 laatimaa vaatimusmäärittelyä [KK_PAS]. Kansalliskirjaston määrittelyssä esiintyvät viittaukset MoReq-malliin (Model Requirements Specification for the Management of Electronic Records) on tarkistettu ja päivitetty uudemman version, v..04:n [] mukaisiksi. Vaatimusten kriittisyys on arvioitu vasta alustavasti. Vaatimusmäärittely noudattaa pääosin TRAC:n loogista esittämisjärjestystä. Huomioon on otettu myös Arkistolaitoksen sähköisen arkistointi- ja tietopalvelujärjestelmän VAPAn toiminnallinen vaatimusmäärittely [VAPA], ja taustatietoina on käytetty lausuntovaiheessa olevaa SÄHKE2-normia [SÄHKE2], vaikka sen sovellusalue onkin Kansallisesta digitaalisesta kirjastosta poikkeava. Kaikki
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 6(62) edellämainitut ottavat huomioon Reference Model for an Open Archival Information System -viitemallin [OAIS]. OAIS-mallia sovelletaan laajasti pitkäaikaissäilytyshankkeissa ja se on myös ISO-standardi (ISO 472:2003). Lisäksi on käytetty pitkäaikaissäilytyksen kansainvälisissä konferensseissa esitettyä materiaalia ja artikkeleita, jotka on lueteltu lähdeluettelossa..3. Pitkäaikaissäilytyksen linjaukset PAS-järjestelmän toiminnallisuuden määrittämisen tueksi tarvitaan: sähköisen pitkäaikaissäilytyksen missio ja visio (KDK-ohjausryhmä laatii, seurantaryhmä hyväksyy) sähköisten aineistojen pitkäaikaissäilytyksen periaatteet (ohjaa PAS-organisaation toimintaa; PAS-organisaatio laatii, KDK-ohjausryhmä hyväksyy) sähköisten aineistojen pitkäaikaissäilytyksen hallinnan periaatteet (ohjaa PAS-järjestelmää ylläpitävän tahon toimintaa; PAS-järjestelmää ylläpitävä taho laatii, PAS-organisaatio hyväksyy) kirjatut säilytysstrategiat (mm. strategia muunnoksiin, säilytyspakettien tallentamiseen; PASorganisaatio laatii, PAS-järjestelmä toteuttaa) aineistojen tekijänoikeuksien selvitys nykyisten taustajärjestelmien ja palveluiden sekä kansallisen digitaalisen kirjaston palveluiden yhteyden selkeä määrittäminen (PAS-jaosto tai sen valtuuttama taho laatii, KDK-ohjausryhmä hyväksyy) riskianalyysi ja strategia riskien hallintaan (PAS-jaosto tai sen valtuuttama taho laatii, KDKohjausryhmä hyväksyy) Eri toimijoiden tarkemmat kuvaukset ovat kohdassa 2.. 2. Pitkäaikaissäilytyksen kokonaisuus PAS-kokonaisuutta voidaan hahmottaa OAISin toiminnallisen mallin pohjalta. OAISin mukaisia toimintoja ovat vastaanotto, säilytys, tiedonhallinta, hallinnointi, säilytyksen suunnittelu ja käyttö, jotka on kuvattu tarkemmin alla. PAS-järjestelmän hallinnointia varten täytyy määritellä OAIS:n mukaisten toimijoiden roolit. Tähän on laadittu ehdotus kohdassa 2.. Säilytyksen suunnittelu L U O V U T T A J A SIP Vastaanotto Tiedonhallinta kuvailutiedot Säilytys AIP Hallinnointi Käyttö haut tulokset tilaukset DIP A S I A K A S JOHTO Kuva 2: Pitkäaikaissäilytyksen kokonaisuus OAIS:n toiminnallisen mallin pohjalta.
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 7(62) OAIS-mallin mukaisesti käytetään termejä luovutuspaketti (Submission Information Package, SIP), säilytyspaketti (Archival Information Package, AIP) ja jakelupaketti (Dissemination Information Package, DIP). Tietopaketti on yleistermi edellämainituista. Vastaanotto tarjoaa palvelut ja toiminnot, joissa vastaanotetaan luovutuspaketti ja muokataan sen sisältö järjestelmän hallintaan ja hallinnointiin sopivaksi. Luovuttaja kokoaa luovutuspaketin sisällöltään sopivaksi ja siirtää sen vastaanottoon. Vastaanottotoimintoihin kuuluu luovutuspakettien vastaanottaminen, niiden laadun varmistaminen, arkiston tallennusja dokumentointivaatimuksia vastaavan säilytyspaketin luominen, kuvailutiedon irrottaminen säilytyspaketista lisättäväksi arkistotietokantaan sekä datan- ja tiedonhallinnan päivittäminen koordinoidusti. Säilytys sisältää palvelut ja toiminnot säilytyspakettien tallentamista, ylläpitoa ja hakua varten. Säilytyksen toimintoihin kuuluu säilytyspakettien siirtäminen vastaanotosta pysyvään säilytykseen, tallennustietohierarkian ylläpitäminen, tallennusvälineiden päivittäminen ja uudistaminen, virheentarkastus osana normaalia toimintaa ja poikkeustilanteissa, toipuminen virhetilanneista sekä säilytyspakettien toimittaminen käyttöä varten. Tiedonhallintaan kuuluvat palvelut ja toiminnot, joilla täydennetään, ylläpidetään ja käytetään kuvailutietoa ja arkiston hallinnoinnissa tarvittavaa tietoa. Kuvailutiedolla identifioidaan ja tunnistetaan säilytyksessä olevat aineistot. Tiedonhallintaa ovat tietokannan ylläpitotoiminnot (skeemojen ja näkymien määrittely sekä viite-eheyden ylläpitäminen), tietokannan päivittäminen (uusien kuvailu- tai hallintatietojen lataaminen), kyselyjen tekeminen tiedoista, tulosjoukkojen generointi ja raporttien tekeminen tulosjoukoista. Hallinnointi tarkoittaa PAS-organisaation ja PAS-järjestelmän toimintaan liittyviä toimintoja ja palveluita. Tähän kuuluu mm. luovutussopimusten tekeminen tietojen luovuttajien kanssa ja luovutusten seuranta, jolla varmistetaan että luovutukset vastaavat vaatimuksia. Hallinnointiin kuuluu myös PAS-järjestelmän laitteiston ja ohjelmiston ylläpito, sekä PAS-järjestelmän seuranta kehittämistoimineen. Näiden avulla seurataan ja parannetaan arkiston toimintaa, kirjataan ja raportoidaan arkiston sisällöstä ja sisällön muunnoksista (katso tarkemmin 4.4..) sekä muusta järjestelmään liittyvästä päivittämisestä. Hallinto vastaa lisäksi pitkäaikaissäilytyksen toimintaperiaatteiden määrittelemisestä, asiakastuen organisoinnista ja palvelupyyntöjen seurannasta. Säilytyksen suunnittelu sisältää palvelut ja toiminnot, joilla seurataan PAS-järjestelmän toimintaympäristöä ja laaditaan suosituksia toimista, joilla varmistetaan PAS-järjestelmässä olevan informaation säilyminen kohdeyhteisön käytössä, myös alkuperäisen käyttöympäristön poistuttua. Säilytyksen suunnitteluun kuuluu arkiston sisällön arviointi ja suositusten tekeminen sen ajoittaisista muunnoksista, toimintaperiaatteita ja vaatimuksia koskevien ehdotusten laatiminen sekä teknologian kehityksen ja kohdeyhteisön tarpeiden ja tietämyspohjan seuranta. Säilytyksen suunnittelua on informaatiopakettien mallien luominen, avustaminen niiden soveltamisessa erilaisiin luovutuksiin sekä tuloksena syntyvien luovutusja säilytyspakettien tarkastaminen. Säilytyksen suunnittelussa laaditaan lisäksi kopiointi- ja muunnossuunnitelmia, ohjelmistoprototyyppejä ja testausohjelmia, joiden avulla hallinnoinnin asettamat tavoitteet voidaan toteuttaa. Käyttö tarjoaa palvelut ja toiminnot, jotka auttavat asiakkaita selvittämään PAS-järjestelmässä olevan informaation olemassaolon, kuvaukset, sijainnin ja saatavuuden ja joiden avulla asiakkaat voivat pyytää ja saada informaatiosisältöjä. Käytön toimintoihin kuuluu viestintä vastaanotettaessa asiakkaiden tilauksia, käyttörajoitusten asettaminen suojattavalle informaatiolle, tilauksiin vastaamisen koordinointi, sekä jakelupakettien, tulosjoukkojen ja raporttien tuottaminen ja toimittaminen asiakkaille. Yllä kuvattujen toimintojen lisäksi tarvitaan erilaisia yleisiä palveluja, jotka muodostavat mallissa yhden toimintakokonaisuuden lisää. Yleisiä palveluja ovat OAIS-mallin mukaan käyttöjärjestelmä-
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 8(62) palvelut, verkkoyhteyspalvelut ja tietoturvapalvelut. Ne liittyvät siinä määrin kaikkeen PASjärjestelmässä ettei niitä ole selvyyden vuoksi merkitty kuvioon. Voidaan tarvita myös lisäpalveluja, jotka riippuvat toimijoiden erityisistä tarpeista (kuten metatiedon tuottamisen työkalutarve) tai ulkoisista vaatimuksista (kuten Valtionhallinnon Kokonaisarkkitehtuurista). Lisäpalveluja ei ole vielä tarkemmin määritelty, vaan ne tarkentuvat hankkeen aikana yhteistyössä sidosryhmien kanssa. 2.. Organisatorinen rakenne ja vastuut Pitkäaikaissäilytyksen toimijat koostuvat useasta eri organisaatiosta. Yhteistoiminnan pohjaksi on tärkeää luoda organisatorinen rakenne, joka selkeyttää roolit ja vastuut eri tahojen kesken, sekä laatia toimintamallit. Jatkossa käytetään termiä PAS-organisaatio tarkoittamaan koalitiota, joka ohjaa, vastaa ja osallistuu KDK-hankkeen pitkäaikaissäilytykseen. PAS-järjestelmä on kokonaisuus jolla pitkäaikaissäilytys toteutetaan. PAS-järjestelmää ylläpitävä taho on tämän organisaation valitsema toimija(t), jo(t)ka vastaa(vat) operatiivisista palveluista. Luovuttaja on kirjasto, arkisto, museo tai muu taho, joka on laatinut sopimuksen PAS-organisaation kanssa luovuttamisesta ja on näin auktorisoitu luovuttaja. PAS-kokonaisuus tarkoittaa näiden neljän tahon yhteistoiminnan kokonaisuutta. Kohdeyhteisö on PAS-organisaation määrittämä asiakas, jolle PAS-järjestelmän tulee kyetä tarjoamaan säilytyksessä olevaa digitaalista informaatiota. Käyttökopio tarkoittaa tässä sisällöltään alkuperäistä vastaavaa online-kopiota luovutetusta digitaalisesta informaatiosta. PAS-organisaation vastuulla on: Laatia luovuttajien kanssa sopimukset säilytettävistä informaatiosisällöistä. Hankkia pitkäaikaissäilytyksen edellyttämät oikeudet luovutettuun informaatioon. Laatia riskianalyysi ja valita toimenpiteet uhkien minimoimiseksi Varmistaa luovuttajien riittävä koulutus, osaaminen sekä työkalujen saatavuus luovutuspakettien tuottamiseen. Valita luotettava PAS-järjestelmää ylläpitävä taho. Määritellä joko itse tai yhteistyökumppaneiden kanssa PAS-järjestelmän kohdeyhteisö, jonka on kyettävä ymmärtämään arkiston tarjoamaa informaatiota. Varmistaa että säilytetty informaatio on kohdeyhteisön itsenäisesti ymmärrettävissä. Toisin sanoen kohdeyhteisön pitäisi kyetä ymmärtämään informaatio ilman sen tuottaneiden asiantuntijoiden tukea. Tähän liittyy myös pitkäaikaissäilytykseen hyväksyttävien tiedostomuotojen valinta ja seuranta, sekä muunnosprosessien käynnistäminen tiedostomuotojen vanhentuessa. Määritellä muunnosten vaatimustasot. Tällä tarkoitetaan sitä, onko vaatimuksena säilyttää esimerkiksi vain tekstin ja kuvien informaatiosisältö vai myös alkuperäisen aineiston ulkoasu ja käyttökokemus. Varmistaa, että kohdeyhteisö pystyy etsimään ja tunnistamaan PAS-järjestelmässä säilytettävää digitaalista informaatiota. Tämän varmistamiseksi on tärkeää asettaa riittävät minimivaatimukset metatiedolle yhteistyössä luovuttajien ja kohdeyhteisön kanssa. PAS-järjestelmän ja sitä ylläpitävän tahon vastuulla on: Tarjota luovuttajalle riittävät työkalut luovutuspakettien tuottamiseen. Ottaa vastaan luovutuspaketit, muodostaa niistä säilytyspaketit ja siirtää ne PAS-järjestelmään. Noudattaa dokumentoituja toimintaperiaatteita ja -menetelmiä, jotka varmistavat informaation säilymisen kaikkia tunnettuja uhkia vastaan sekä sen, että informaatiota voidaan jakaa joko todennettuina kopioina, tai alkuperäiseen dokumenttiin palautettavissa olevina versioina. Suorittaa muunnokset muodosta toiseen tiedostomuotojen vanhentuessa.
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 9(62) Tarjota säilytetty informaatio kohdeyhteisön käyttöön. Luovuttajan vastuulla on: Asettaa minimivaatimukset metatiedolle, jotta PAS-järjestelmässä säilytettävää digitaalista informaatiota voidaan etsiä ja tunnistaa. (Yhteistyössä PAS-organisaation ja kohdeyhteisön kanssa.) Tuottaa ja koota sopimuksen mukaisesti luovutuspaketti sisällöltään sopivaksi. Varmistaa luovutuspaketin eheys, kattavuus ja oikeellisuus. Siirtää luovutuspaketti sovitulla tavalla PAS-järjestelmän vastaanottoon. Ylläpitää luovutuspakettien informaatiosisältöä ja luovutuspaketteihin liittyvää kokoelmatietoa niin omaan kuin asiakasliittymän käyttöön Vastata taustajärjestelmiensä liittymistä PAS-järjestelmään Kohdeyhteisön vastuulla on: Asettaa minimivaatimukset metatiedolle, jotta PAS-järjestelmässä säilytettävää digitaalista informaatiota voidaan etsiä ja tunnistaa. (Yhteistyössä PAS-organisaation ja luovuttajien kanssa.) PAS-organisaation tulee siis luoda PAS-järjestelmän hallinnointiin selkeät linjaukset, ja sen tulee rakenteeltaan olla kestävä toiminnan jänteen pitkäaikaisuuden turvaamiseksi. Tämän pitkän aikajänteen takia PAS-järjestelmään liittyvissä ratkaisuissa täytyy tasapainottaa jo mahdollisimman varhaisessa vaiheessa riskit ja investoinnit, ja se onkin yksi PAS-organisaation tärkeimpiä tehtäviä. PAS-organisaation tulee laatia riskianalyysi ja sen pohjalta PAS-järjestelmän päätavoitteet ja vaatimukset, suunnitelmat PAS-järjestelmän tulevista ominaisuuksista, sekä pitää huolta järjestelmään liittyvän osaamisen hankkimisesta. PAS-järjestelmän tulee tarjota säilytyksessä olevat digitaaliset objektit metatietoineen niitä luovuttaneille organisaatioille, sekä käyttökopiot taustajärjestelmiin. Aineiston vastaanottojärjestelmiä on syytä kehittää siten, että yksi järjestelmä palvelisi kaikkia tai mahdollisimman montaa luovuttajaa. Näin kirjastot, arkistot ja museot voisivat keskittyä ydinosaamiseensa eli tallennettavaan sisältöön ja sen hyödyntämiseen. Käytännössä tämä voi tarkoittaa erillisen, luovutuspaketin kokoamiseen tarkoitetun työkalun tarjoamista luovuttajille. Informaation lähettäminen PAS-järjestelmään on kriittinen vaihe säilytysprosessissa. Siinä digitaalisen objektin sisältö, metatiedot, konteksti ja alkuperä täytyy koota oikein yhteen. Tästä tehtävästä tulee usein hyvin monimutkainen, koska joudutaan yhdistelemään informaatiota useista eri lähteistä. Luovutuspaketin (SIP) virheetön tuottaminen on siis oleellinen koko pitkäaikaissäilytyksen onnistumiselle, ja siihen tulee kiinnittää erityistä huomiota. SIP-rajapintaan liittyvät toiminnot ja roolit on kuvattu tarkemmin kappaleessa 4.. Informaation hakupalvelun toteuttaja voi olla kirjasto, arkisto, museo, PAS-järjestelmän toimittaja tai kolmas osapuoli, kuitenkin siten että palvelu on varsinaisen PAS-järjestelmän (aikajänne kymmeniä tai satoja vuosia) ulkopuolella. Käytännön toteutuksessa on syytä pyrkiä yhtenäistämään liittymiä siten, että yksi tai enintään muutama hakupalvelu ja käyttöliittymä pystyisi palvelemaan kaikkia organisaatioita. Hakupalvelun teknisen toteutuksen valinnassa kannattaa huomioida kansainväliset hankkeet ja pyrkiä yhtenäiseen ratkaisuun, jota voidaan myöhemmin soveltaa myös kansainvälisten digitaalisten kirjastojen hakupalvelussa. TARKENNETTAVA: Vastuualueet on kuvattu vasta karkeasti ja niitä on täsmennettävä. On esimerkiksi sovittava, kuka varsinaisesti seuraa tiedostomuotojen ajantasaisuutta ja valmistelee tarvittavat muunnokset. PAS-organisaatiolla on kokonaisvastuu, mutta seuranta ja valmistelu voidaan sopia joko keskitetysti PAS-järjestelmää ylläpitävän tahon tehtäväksi tai hajautetusti luovuttajien tehtäviksi.
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 0(62) 2.2. PAS-järjestelmän suhde olemassaoleviin toimintoihin Kokonaisuus vaatii palveluiden, nykyisten arkistojen ja taustajärjestelmien sekä rakennettavan PASjärjestelmän järkevää työnjakoa ja yhteentoimintaa. Eri toimintatasojen ratkaisuilla on erilainen elinikä, ja sen täytyy heijastua järjestelmien suunnittelun periaatteissa ja toteutuksessa. PASjärjestelmän toiminnallisten periaatteiden tulee kestää ajan hammasta, ja huolehtia että säilytettävää digitaalista informaatiota voidaan tarjota kohdeyhteisölle hyvin pitkän aikaa. Tämän takia PASjärjestelmän palvelut eivät voi muuttua nopeasti muuttuvien asiakastarpeiden mukaan, vaan peruspalvelu on sama: säilytykseen luovutetun digitaalisen informaation tarjoaminen kohdeyhteisölle ymmärrettävässä muodossa. Yhteiskunta Asiakasliittymät Tuotantojärjestelmät PAS Digitaalinen Tuotantojärjestelmät Media objekti Laitteet Media Ohjelmistot 0-00 v 5-0 v Aika -5 v Nopeita muutoksia Järjestelmän hallinta Hallinnointi Kuva 3: Pitkäaikaissäilytyksen kerroksellinen malli. Mitä rikkaampaa metatietoa luovutuspaketteihin laitetaan, sitä laajemmat mahdollisuudet säilytettävän digitaalisen informaation käyttöön tulevaisuudessa mahdollistetaan. Metatietojen semantiikan yhtenäistäminen eri toimijoiden aineistojen välillä edistää sekä käyttöä että säilytettävyyttä.
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu (62) 2.2. PAS-järjestelmässä säilytettävä digitaalinen informaatio Kansallinen digitaalinen kirjasto -hankkeessa on mukana useita eri organisaatioita, joiden pitkäaikaissäilytettävän informaation määrä ja tyyppi sekä valmiudet poikkeavat selvästi toisistaan. Esimerkiksi kansallisarkistolla ja kansalliskirjastolla on jo runsaasti digitoitua aineistoa ja sen käsittelyyn tarvittavat taustajärjestelmät, kun taas monet pienet museot vasta valmistautuvat digitaalisen informaation käsittelyyn. Seuraavassa taulukossa on esitetty alustava kartoitus eri kirjastojen, arkistojen ja museoiden hallussa olevasta pitkäaikaissäilytykseen siirrettävästä informaatiosta. TARKENNETTAVA: Taulukosta puuttuu vielä kokonaan aineistosta tallennettujen metatietojen sekä käytettyjen metatieto- ja pakettistandardien kartoitus, joka on tehtävä myöhemmin. Organisaatio Säilytettävä informaatio Tiedostomuoto Arkistolaitos, Digitaaliarkisto Maakuntien ja kirkon vanhoja asiakirjoja tiff Kansalliskirjasto Suomalaisen internetin sisältöä; vanhoja sanomalehtiä ja kausijulkaisuja, monografioita, suomalaisen kirjallisuuden, nuottien ja äänitteiden luettelo, ym. jpg, pdf, mahdollisesti useita Kansallinen audiovisuaalinen arkisto (KAVA) Yhteiskuntatieteellinen tietoarkisto Elinkeinoelämän keskusarkisto (ELKA) Teksti, ääni, kuva, elävä kuva, multimedia "Raaka" tutkimusaineisto (datamatriisit, teksti, puhe, kuva) Yritysten, elinkeinoelämän järjestöjen ja elinkeinoelämässä vaikuttaneiden henkilöiden pysyvästi säilytettäviä asiakirjoja useita SPSS Portable useita (tiff, jpg, wav, mpeg2,...) Yksityiset keskusarkistot Yksityisiä asiakirjoja, valokuvia, perinneainestoja, ääni- ja kuvatallenteita,karttoja, piirustuksia useita ((tiff, jpg, wav, mpeg2,...) Tilastokeskus Luonnontieteellinen keskusmuseo Museovirasto Suomen viralliset tilastot, julkaisut, arkistot; alkuperäistilastot pääosin luottamuksellisia; Arkistolaitos säilöö Eläin- ja kasvinäytteet, luonnontieteellinen havaintoaineisto, kulttuuriaineisto (matkamuistiinpanot ym.) Kulttuurihistoriallisten museoiden ja erikoismuseoiden kokoelmat xml -> pdf, html + vanhat järjestelmät mm. xml (standardi) mahdollisesti useita Valtion taidemuseo / Kirjasto, taidehistorialliset asiakirjat -arkisto, kuvataiteen keskusarkisto kuva-arkisto, äänitearkisto mahdollisesti useita, mm. wav Valokuvataiteen museo Digitaalisia valokuvia, tekstimuotoisia sisältöjä tietokannoissa mahdollisesti useita
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 2(62) Säilytettävän informaation kohdeyhteisö on laaja. Alustavassa kartoituksessa löydettiin seuraavat tahot: Organisaatio Arkistolaitos, Digitaaliarkisto Kansalliskirjasto Kansallinen audiovisuaalinen arkisto (KAVA) Yhteiskuntatieteellinen tietoarkisto Elinkeinoelämän keskusarkisto (ELKA) Asiakkaat Sukututkijat, historian tutkijat, yksityishenkilöt, viranomaiskäyttäjät, selvitystyöryhmät, yrityskäyttäjät, esim. asianajajatoimistot Humanististen ja yhteiskuntatieteiden tutkijat ja opiskelijat, kirjastot, korkeakoulut Tallettajat (lakisääteiset ja vapaaehtoiset), elokuvan- ja ohjelmantekijät, tutkijat, toimittajat, kirjailijat, kansalaiset yleensä STAKES, KTL, Tilastokeskus, KTK; akatemia erit. ihmis-ja sosiaalitieteet; kansainväliset tutkimusohjelmat (mm. World Values Survey, European Social Survey, International Social Survey Programme, Eurobarometrit) Arkistojen luovuttajat, historiantutkijat, museot, eri alojen harrastajat, sukututkijat, dokumenttien tekijät, näyttelyiden suunnittelijat Yksityiset keskusarkistot Arkistojen luovuttajat, kulttuuri-, historian- ja perinnetutkijat, museot, eri alojen harrastajat, kotiseutu- ja sukututkijat, dokumenttien tekijät, näyttelyiden suunnittelijat Tilastokeskus Luonnontieteellinen keskusmuseo Museovirasto Laajasti eri yhteiskuntaryhmät ja yksityiset henkilöt Suomesta ja ulkomailta Kotimaiset ja ulkomaiset tutkijat Museoammattilaiset (tutkimus, näyttelyiden suunnittelu ja toteuttaminen, kokoelman hallinta), tutkijat (laaja kirjo opiskelijoista, sukututkijoista, kylähistorioiden tekijöistä väitöskirjatutkijoihin ja historioitsijoihin), perusopetus (koulut, opettajat), viranomaiset (kunnat, maankäytön suunnittelu), yritykset (metsäyhtiöt, sähköyhtiöt, infrastruktuurin rakentajat, kulttuurimatkailu) sekä yksittäiset kansalaiset (opiskelu, vapaaajanvietto). Valtion taidemuseo / Museot, opiskelijat, kansalaiset, Valtion taidemuseon oma henkilökunta, kuvataiteen keskusarkisto koti- ja ulkomaiset kuvankäyttäjät Valokuvataiteen museo Museon sisäinen kokoelmanhallinta mm. näyttelytyön ja tutkimuksen tarpeisiin; museon tutkija-asiakkaat; suuri yleisö, jolle tarjotaan katselukuvia verkossa; kuvapalvelupyynnöt julkaisukäyttöön (koskevat pääasiassa digitaalisia kuvia)
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 3(62) Huomioita: Monenlaista aineistoa skannatuista dokumenteista multimediaan, tiedostomuodot moninaisia Määrä useita miljoonia tietueita, tavumäärän arviointi kesken Digitoinnin aste vielä pieni; raha ja työläys ongelmana Hyvin laaja kohdeyhteisö: sekä yksityishenkilöitä että organisaatioita, niin Suomessa kuin maan rajojen ulkopuolellakin Osa aineistoista luottamuksellisia, osa myydään, osa tilataan, osa kaikille avointa TARKENNETTAVA: Pitkäaikaissäilytettävän informaation määrää on vielä vaikea arvioida. Tarpeet tulee myöhemmin kartoittaa tarkemmin ja sopia pitkäaikaissäilytykseen hyväksyttävistä tiedostomuodoista. 2.2.2. Digitaalisen informaation luovutus pitkäaikaissäilytykseen Digitaalisen informaation luovuttaminen pitkäaikaissäilytykseen koostuu useista palveluista ja toiminnoista. PAS-järjestelmään voi luovuttaa aineistoa, kun on solminut siitä sopimuksen PASorganisaation kanssa. Kirjasto, arkisto tai museo on PAS-järjestelmän kannalta luovuttaja. Luovuttaja vastaanottaa aineistoa asiakkailtaan (tai tuottaa sitä itse), tarkistaa sen virheettömyyden sekä tarvittaessa muokkaa ja täydentää aineistoa niin, että se on valmis pitkäaikaissäilytettäväksi. Sen jälkeen luovuttaja lähettää digitaalisen informaation (aineiston ja siihen liittyvät metatiedot) luovutuspaketteina PAS-järjestelmään tai asettaa sen PAS-järjestelmän saataville. PAS-järjestelmän vastaanotto tarkistaa luovutuspakettien eheyden ja oikeellisuuden ja tekee virustarkistuksen. Luovutuspakettiin lisätään aikaleima, tieto sen lähettäneestä organisaatiosta ja muu luovutustieto. Lopulta digitaalinen informaatio siirtyy säilytykseen ja luovuttaja (kirjasto, arkisto tai museo) saa siitä vahvistuksen, joka toimii samalla kuittina ja juridisesti siirtää säilytysvastuun PASjärjestelmää ylläpitävälle taholle. Kuva 4 havainnollistaa tarvittavia toimintoja luovuttajan näkökulmasta. Oranssit laatikot ja kuvan osuus hallinnoinnista kuuluvat luovuttajan vastuualueeseen, keltaiset laatikot PAS-järjestelmää ylläpitävän tahon vastuualueeseen. Luonnollisesti myös PAS-järjestelmää ylläpitävällä taholla on oma hallinnointinsa sekä prosessinsa aineiston tarkistukseen ja luovutusinformaation lisäämiseen, mutta niitä ei ole esitetty kuvassa. Aineiston lähetys Kuittaus lähetyksestä Lähetyksen vastaanotto Lähetetty aineisto Ongelmat lähetyksessä Lähetetty aineisto (valvontaa varten) Digitaalisen informaation lähetys PAS-järjestelmään Digitaalinen informaatio (Muokattu aineisto, sis. metatiedot) Luovutettava digitaalinen informaatio Vahvistus (kuitti) Virheet PAS-järjestelmän vastaanotto (sisältää tarkistukset ja aikaleiman lisäyksen) Hyväksytty digitaalinen informaatio Kirjastolle, arkistolle tai museolle aineistoa luovuttava asiakas Aineiston tarkistus Virheet Aineisto Muokattu aineisto (valvontaa varten) Aineiston muokkaus pitkäaikaissäilytykseen Tarkastuksen tulokset Luovutuksen tulokset (kuitti tai virhe) Standardit menettelytavat Säilytys Hallinnointi Kuva 4: Luovutuksen palvelut ja toiminnot. Kuva muokattuna lainattu Kansalliskirjaston vaatimusmäärittelystä [KK_PAS].
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 4(62) TARKENNETTAVA: Luovutuksen kulku ei välttämättä ole täsmälleen kuvan 4 mukainen kaikissa organisaatioissa. Isot ja pienet toimijat saattavat tarvita erilaisia ratkaisuja. Aineisto voidaan poimia automatisoidusti taustajärjestelmistä sovittuun muotoon paketoituna tai mahdollisesti lähettää metatietoineen suoraan PAS-järjestelmän vastaanottopalvelimelle. On syytä pyrkiä mahdollisimman yhtenäiseen ratkaisuun kuitenkin huomioiden erilaiset tarpeet. Kun sähköinen asiakirja on ainoa ja siten alkuperäinen asiakirja, sen aitous ja eheys on pystyttävä varmistamaan ja todistamaan elinkaaren kaikissa vaiheissa. Tämä on suuri haaste sekä aineistoa kirjastoille, arkistoille ja museoille luovuttaville tahoille (mm. valtion virastot ja yritykset), kirjastoille, arkistoille ja museoille (jotka säilyttävät informaatiota jonkin aikaa ja luovuttavat sen jälkeen PAS-järjestelmään) että PAS-järjestelmää ylläpitävälle taholle. Kansallinen Sähke-normi [SÄHKE2] -määrittelee tietyt vaatimukset. Muutosten turvalliseen kirjaamiseen on olemassa erilaisia teknisiä menetelmiä (kts. [Hasan2009]), joita on syytä testata ja soveltuvin osin ottaa käyttöön. Open Provenance -malli [OpenProvenance] puolestaan tähtää historia- ja alkuperätietojen siirrettävyyteen eri järjestelmien välillä. 2.2.3. Olemassaolevien taustajärjestelmien liittäminen PAS-järjestelmään Valtionhallinnossa kehitetään yleisiä palveluita (esimerkiksi sähköinen tilausjärjestelmä). Nämä palvelut kommunikoivat rajapintojen kautta esimerkiksi kirjastojen, arkistojen ja museoiden taustajärjestelmien (VAPA, RTVA, etc.) kanssa. Taustajärjestelmät puolestaan kommunikoivat PASjärjestelmän kanssa saadakseen tilatun digitaalisen informaation pitkäaikaissäilytyksestä. Pyyntö välittyy teknisen järjestelmän operatiiviselle tasolle, ja se haetaan esimerkiksi nauhalta. Digitaalinen informaatio metatietoineen siirretään tämän jälkeen rajapintojen kautta tulkittuna tilaajalleen. Kuvassa 5 on hahmoteltu eri tasoja esimerkein. Palvelut (esim. tilausjärjestelmä, VIRTU ) Arkistot (esim. VAPA, RTVA ) PAS (digitaalisen objektin hallinta) Tekninen infrastruktuuri PAS-järjestelmää olisi järkevää pilotoida operatiivisten taustajärjestelmien kanssa (kuten RTVA ja VAPA). Tällöin heti PAS-järjestelmän toimituksen ja asennuksen jälkeen se voidaan kytkeä taustajärjestelmään. Siirto tulee tehdä vaiheittain. Koko PAS-järjestelmä voidaan rakentaa skaalautuvasti eli se kasvaa alkuvaiheessa digitaalista informaaatiota luovuttavien taustajärjestelmien lisäyksen ja myöhemmin tietopakettimäärän kasvun vuoksi. PAS-järjestelmään kannattaa lisätä taustajärjestelmiä siinä järjestyksessä kuin ne ovat OAISyhteensopivia (kts. [OAIS], luku 3.) ja kykenevät määritellyllä tavalla kommunikoimaan PAS-järjestelmän rajapintojen kanssa. OAISyhteensopivia järjestelmiä tulee vaiheittain, ensimmäiset vuoden 2009 aikana. Ensimmäisinä yhteensopivia ovat tai tulevat olemaan Kansalliskirjaston verkkoarkisto, Kansalliskirjaston digitoinnin ohjausjärjestelmä docworks sekä Arkistolaitoksen vastaanotto- ja palvelujärjestelmä VAPA. Kuva 5: Pitkäaikaissäilytyksen tasot.
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 5(62) 2.2.4. Esimerkki taustajärjestelmien liittämisestä: VAPA Arkistolaitoksen vastaanotto- ja palvelujärjestelmän VAPAn osalta PAS-järjestelmä voisi tarjota VAPAn Tallennuspalvelut. VAPAn tallennuspalveluiden tehtävänä on vastata sähköisen ja sähköisten hybridiaineistojen sekä näiden metatietojen turvallisesta säilyttämisestä. Palvelut kattavat sekä online-, että offline-kopioiden hallinnan. VAPAn säilytyspalveluita ovat: Säilytysjärjestelmän ja säilytykseen käytettyjen tallennusvälineiden operointi ja hallinta Säilytysobjektin tallennus säilytykseen käytetyille tallennusvälineille Säilytysobjektien siirto online-tallennusvälineiltä offline-tallennusvälineille Sähköisten hybridiasiakirjojen säilytysinformaation hallinta Siirtotiedostojen väliaikainen säilyttäminen ja hävittäminen Varmistuspalvelut Palautuspalvelut Siirtoon käytettyjen offline-tallennusvälineiden turvallinen tuhoaminen Tallennuspalveluiden odotetaan generoivan toimistaan lokitiedostoja. Nämä kaikki palvelut voidaan tarjota PAS-järjestelmän palveluina. Tarve VAPA-palvelulle kasvaa vaiheittain. Vastaanoton arvioidaan alkavan täysimittaisesti vuonna 205 (VAPA: Sähköisen säilyttämisen palvelut). Tätä ennen VAPAa pilotoidaan ja siirrytään vaiheittain aineistoja lisäämällä laajaan tuotantokäyttöön. PAS-järjestelmän eteneminen ja VAPA-pilotointi voitaisiin toteuttaa vaiheittain seuraavasti: PAS-järjestelmän kilpailutus samanaikaisesti VAPAn toteutusvaiheen kanssa. PAS-järjestelmän laitehankintojen kilpailutus PAS-järjestelmän toteutusvaiheen kanssa VAPA-pilotointi heti PAS-järjestelmän alustavan laitekokoonpanon käyttöönoton jälkeen PAS-järjestelmän skaalautuva käyttöönotto ja VAPA-käyttöönotto tahdistettuna 2.3. PAS-järjestelmän toiminta 2.3.. Looginen kokonaisuus PAS-järjestelmän kokonaisuus muodostuu sinne luovutettavasta digitaalisesta informaatiosta (luovutuspaketit) ja tähän kohdistuvista säilytystoimenpiteistä, sekä kyseisen informaation tarjoamisesta käyttöön. Luovuttajat koostavat luovutuspaketit (katso myös 4..). Luovutuspaketteihin tallennetaan metatietoa, joka koostuu seuraavista osista: Tulkintatiedon (representation information) muodostaa aineiston luettavuuden mahdollistava tulkintatieto, tiedostomuodon kuvaus, semantiikka ja muu tieto, jolla tiedoston bittijonot voidaan muokata ihmisen tai koneen luettavaan ja ymmärrettävään muotoon. Saadaan luovuttavan organisaation tiedoista. Paketointitieto (packaging information) kertoo alkuperäisen aineiston tiedostonimet ja hakemistorakenteen, mikäli se sisältää aineiston ymmärrettävyyden vuoksi oleellista tietoa, jonka tulisi seurata aineistoa. Viitetieto (reference information, pysyvä tunniste (ID), bibliografinen tieto yms.), joka saadaan luovuttavan organisaation tietokannasta. Taustatieto (context information) kuvaa tietoa mahdollisimman rikkaasti. Saadaan luovuttavan organisaation tallentamista tiedoista. Historia- ja alkuperätieto (provenance information), joka sisältää tietoa digitoinnista,
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 6(62) viittaukset alkuperään ja teknisen metatiedon. Saadaan luovuttavan organisaation tallentamista tiedoista. Aitous- ja eheystieto (fixity information), joka sisältää tarkistussumman, autentikointiavaimen ja sähköisen allekirjoituksen. Luodaan luovutuksen yhteydessä siihen tarjotuilla työkaluilla. Myöhemmin käytettävä termi kuvailutieto tarkoittaa luovuttajan aineistoon liittämää yllämainittua tietoa. PAS-järjestelmä Koostaa säilytyspaketit, jossa luovutuspaketteihin lisätään säilytysmetatieto (ID, tallennusvälinetieto, virustarkistustieto, tieto muunnoksista yms). Hallinnoi säilytyspaketteja. Metatiedot synkronoidaan luovuttavan organisaation järjestelmiin ja asiakasliittymään. Luo jakelupaketit säilytyspaketeista. Jakelupaketit tarjotaan luovuttajalle ja asiakasliittymään taustajärjestelmien kautta. Tarjoaa palvelut ja toiminnot jotka liittyvät jakelupakettien, raporttien ja muiden tilausten toimittamisen kohdeyhteisölle ja taustajärjestelmiin. Tarjoaa hakutoiminnot ja palvelut, joiden avulla ylläpito ja muut PAS-järjestelmän suorat käyttäjät voivat selvittää digitaalisen informaation olemassolon, kuvauksien, sijainnin ja saatavuuden sekä noutaa sisältöjä. Taustajärjestelmät Sijaitsevat käyttäjien ja PAS-järjestelmän välissä. Ovat tyypillisesti organisaatiokohtaisia tai tietyn organisaatioryhmän yhteisiä järjestelmiä. Hallinnoivat aineistoa, josta osa on myös pitkäaikaissäilytettävänä PAS-järjestelmässä. Luovuttavat luovutuspaketteja PAS-järjestelmään. Ottavat vastaan jakelupaketteja PAS-järjestelmästä. Jakelupaketteja vastaanottava taustajärjestelmä voi olla joko sama tai eri järjestelmä kuin luovutuksen taustajärjestelmä. Tarjoavat käyttöliittymiä eri käyttäjäryhmille, erityisesti kirjastojen, arkistojen ja museoiden omille asiantuntijoille. Asiakasliittymä Tarjoaa palvelut ja toiminnot PAS-järjestelmässä olevan digitaalisen informaation olemassolon, kuvauksien, sijainnin ja saatavuuden selvittämiseen. Näiden avulla kohdeyhteisö voi pyytää ja saada informaatiosisältöjä taustajärjestelmien kautta. Mahdollistaa kokoelmarakenteiden muodostuksen käyttäen luovuttajien keräämää ja luomaa kokoelmatietoa. TARKENNETTAVA: Koko PAS-ratkaisun kokonaisarkkitehtuuria eli PAS-järjestelmän, hakupalveluiden ja taustajärjestelmien keskinäistä suhdetta on vielä mietittävä. Erityisesti on pohdittava sitä, miten säilytettyä informaatiota voidaan hakea PAS-järjestelmästä. Jos informaatiota ainoastaan kopioidaan suurina kokonaisuuksina taustajärjestelmiin ja kaikki haut ja käyttö tehdään niiden kautta, PAS-järjestelmän sisäistä toimintaa voidaan optimoida säilytystä eikä hakuja varten. Esimerkiksi koko Suomen www-sivut tietyltä vuodelta voivat olla yhtenä säilytyspakettina. Toisaalta jos PAS-järjestelmästä on mahdollista hakea informaatiota tehokkaasti pieninäkin paloina, taustajärjestelmien rooli voi olla kevyempi.
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 7(62) Kuva 6: Informaation luovutuksen ja käytön looginen kokonaisuus 2.3.2. Tekninen toteutus Ylläkuvatun loogisen PAS-järjestelmän tekniseen toteutukseen on useita eri vaihtoehtoja. Voidaan joko rakentaa keskitetty järjestelmä ja sille riittävät varmistukset, tai useammasta kevyemmästä järjestelmästä koostuva toteutus. Kuva 7 havainnollistaa käyttäjien, kirjastojen, arkistojen, museoiden ja PAS-järjestelmän suhdetta toisiinsa teknisen infrastruktuurin näkökulmasta. Luotettavassa pitkäaikaistallennuksessa data on jaettava useaan paikkaan ja kopioiden on oltava riittävän itsenäisiä toisistaan. Kustannuksien pitäminen kurissa edellyttää tallennusprosessien automatisointia. Teknistä toteutusta käsitellään yksityiskohtaisemmin luvussa 5. Turvallisuutta ja riskejä käsitelläänluvussa 6.
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 8(62) KIRJASTO, ARKISTO TAI MUSEO 3 KIRJASTO, ARKISTO TAI MUSEO 2 PAS-vastaanottopalvelin Taustajärjestelmä Asiakasliittymä KIRJASTO, ARKISTO TAI MUSEO Käyttäjä Asiantuntija Käyttäjä Aineiston haku Aineiston lähetys DIP DIP SIP Auditoija Kopiot aineistosta (useammassa paikassa) AIP PAS-JÄRJESTELMÄ Taustajärjestelmä Ylläpitäjä PAS-TASO (aikajänne kymmeniä-satoja vuosia) Kuva 7: Pitkäaikaissäilytysjärjestelmän tekninen infrastruktuuri 2.4. PAS-organisaatioon liittyvä vaatimusmäärittely (TRAC A) 2.4.. Kestävä hallinnointi Nro Vaatimus Kr Viitteet V2. V2.2 V2.3 V2.4 PAS-organisaatiolla ja siihen kuuluvilla toimijoilla on missio joka kuvastaa kestävää ja pitkäaikaista sitoutumista digitaalisen tiedon tallennukseen, hallintaan ja jakeluun. PAS-organisaatiolla on kirjatut periaatteet ja menettelytavat, jotka määrittävät tarvittavat lailliset mandaatit ja oikeudet digitaalisen informaation pitkäaikaiseen säilytykseen, ja organisaatio voi todistaa nämä oikeudet kaikille aineistoille. PAS-organisaatiolla on periaatteet, menettelytavat ja prosessit teknologian ja yhteisön muutoksien hallintaan, ja näitä voi arvioida, päivittää ja kehittää. PAS-organisaatiolla on käytössään soveltuvat työkalut kustannusten laskentaan pitkällä aikavälillä (esim. NASA CET). TRAC A. TRAC A3.3 TRAC A3.2 2
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 9(62) V2.5 PAS-organisaatiolla on jatkuvuus- ja varautumissuunnitelma. TRAC A.2 V2.6 V2.7 V2.8 V2.9 V2.0 V2. V2.2 V2.3 PAS-järjestelmää ylläpitävä taho sitoutuu hakemaan säännöllisesti palautetta aineistotuottajilta ja käyttäjiltä. PAS-järjestelmää ylläpitävä taho dokumentoi muutokset jotka koskevat pitkäaikaissäilytykseen liittyvää operatiivista toimintaa, proseduureja, ohjelmistoja ja laitteistoja. PAS-järjestelmää ylläpitävä taho sitoutuu läpinäkyvyyteen, avoimuuteen ja tilintekovastuuseen järjestelmän operointia ja hallintaa koskevissa toimissa, erityisesti digitaalisen sisällön hallintaan pitkällä aikavälillä liittyvissä. PAS-järjestelmää ylläpitävä taho sitoutuu vaatimuksesta määrittelemään, keräämään, jäljittämään ja tuottamaan tiedon aitouden ja eheyden tarkistamiseen tarvittavan tiedon. PAS-järjestelmää ylläpitävä taho sitoutuu säännöllisin välein tehtävään itsearviointiin, ja jos kyseessä on serfitioitu kokonaisuus, sitoutuu ilmoittamaan muutoksista jotka vaikuttavat sertifiointistatukseen. Järjestelmän tulevista ominaisuuksista (vuoden ja parin vuoden sisällä) ja kehityssuunnista on olemassa ajantasainen suunnitelma. PAS-organisaatio on määritellyt kohdeyhteisön ja osaajapohjan, ja sillä on julkisesti saatavilla määritelmät ja periaatteet säilytyksen palveluiden toteuttamiselle. PAS-organisaatio kouluttaa luovuttajia riittävästi PAS-järjestelmän käyttöön. TRAC A3.5 TRAC A3.6 TRAC A3.7 TRAC A3.8 TRAC A3.9 2 KK_PAS Y4 TRAC A3. TRAC A3. V2.4 PAS-järjestelmää ylläpitävällä taholla on kirjatut säilytysstrategiat. TRAC B3., B4. V2.5 V2.6 V2.7 V2.8 PAS-järjestelmää ylläpitävä taho on määrittänyt operatiiviset tehtäväkuvaukset ja niiden suorittamiseen on riittävästi osaavaa ja kokenutta henkilöstöä. PAS-järjestelmää ylläpitävä taho huolehtii että myös tuki- ja palvelutehtäviin on riittävästi henkilöstöä. PAS-järjestelmää ylläpitävä taho kouluttaa ja kehittää jatkuvasti henkilöstönsä osaamista. PAS-järjestelmää ylläpitävä taho sitoutuu ulkopuoliseen viralliseen tarkistukseen ja auditointiin järjestelmän teknologisen kehityksen ja muuttuvien käyttömallien huomioimiseksi. TRAC A2. TRAC A2.2 TRAC A2.2 TRAC A3.4
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 20(62) 2.4.2. Kestävä toimintamalli Nro Vaatimus Kr Viitteet V2.9 V2.20 V2.2 V2.22 V2.23 PAS-järjestelmää ylläpitävä taho on taloudellisesti vakaa. Sillä on useamman vuoden takainen historia ja turvattu tulevaisuus. PAS-järjestelmää ylläpitävällä taholla on lyhyen ja pitkän aikavälin (liike)toimintamallit. PAS-järjestelmää ylläpitävällä taholla on prosessit liiketoimintamallien arviointiin ja korjaamiseen vähintään vuosittain. PAS-järjestelmää ylläpitävän tahon taloudelliset käytänteet ja proseduurit ovat läpinäkyviä, noudattavat oleellisia tilinpitostandardeja ja käytäntöjä, ja ne tarkastetaan ulkopuolisen toimesta tilinpitolainsäädösten mukaisesti. PAS-järjestelmää ylläpitävällä taholla on pysyvä sitoutuminen arvioida ja raportoida riskeistä, hyödyistä, sijoituksista ja kuluista. KK_PAS Y5 TRAC A4. TRAC 4.2 TRAC A4.3 TRAC A4.4 V2.24 PAS-järjestelmää ylläpitävä taho sitoutuu seuraamaan kulujaan ja luomaan menetelmän miten kattaa kustannukset jatkuvasti. TRAC A4.5 2.4.3. Sopimukset, lisenssit ja vastuut Nro Vaatimus Kr Viitteet V2.25 V2.26 V2.27 V2.28 Jos PAS-organisaatio hallinnoi, säilyttää ja/tai antaa pääsyoikeuden muiden organisaatioiden omistamiin digitaaliseen informaatioon, sillä tulee olla soveltuvat ja riittävät sopimukset tähän. PAS-organisaation säilytyssopimuksien täytyy määritellä ja siirtää kaikki tarpeelliset säilytysoikeudet, ja nämä siirretyt oikeudet täytyy kirjata. PAS-organisaation tulee määrittää kaikki oleelliset näkökohdat liittyen digitaalisen informaation saantiin, ylläpitoon, pääsyyn ja poistoon kirjallisessa muodossa aineiston luovuttajien ja kaikkien oleellisten osapuolien kanssa. PAS-järjestelmää ylläpitävä taho seuraa ja hallinnoi sopimusten määrittämään digitaaliseen informaatioon liittyviä tekijänoikeuksia ja informaation käyttöön liittyviä rajoituksia. TRAC A5. TRAC A5.2 TRAC A5.3 TRAC A5.4 V2.29 Jos PAS-järjestelmää ylläpitävä taho vastaanottaa digitaalista informaatiota jonka omistajuus ja/tai oikeudet ovat epäselviä, on olemassa TRAC A5.5 menettelytavat vastuu- ja omistusoikeuskysymyksien käsittelyyn.
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 2(62) 3. PAS-järjestelmän yleiset vaatimukset Nro Vaatimus Kr Viitteet V3. PAS-järjestelmän tulee pystyä käsittelemään sähköistä aineistoa, siihen liittyvää metatietoa ja säilytysmetatietoa. TARKENNETTAVA: Täsmennettävä teknisessä määrittelyssä. VAPA V2. V3.2 PAS-järjestelmän tulee säilyttää tieto eri aineistojen välisistä suhteista. VAPA V2.7 V3.3 PAS-järjestelmän tulee voida käsitellä ja hallita useata metatietoskeemaa. VAPA V2.8 V3.4 V3.5 PAS-järjestelmän tulee pystyä muokkaamaan säilytettävän aineiston säilytysmetatietoa sekä sallia säilytysmetatiedon manuaalinen muutos. PAS-järjestelmä on vakaassa kehitysvaiheessa, ja siitä on olemassa jo useampia merkittäviä tuotantokäyttöön tarkoitettuja julkaisuja. VAPA V2.2 2 KK_PAS Y6 V3.6 PAS-järjestelmän dokumentaatio on kattavaa ja ajantasaista. KK_PAS Y8 V3.7 PAS-järjestelmän käyttäjät voivat esittää kysymyksiä, joihin saadaan vastaus esim. viikon sisällä ja parannusehdotuksia, jotka huomioidaan järjestelmää kehitettäessä. 2 KK_PAS Y9 V3.8 PAS-järjestelmä antaa ymmärrettäviä virheilmoituksia virheen ilmaantuessa ja neuvoo käyttäjää virhetilanteessa...7, KK_PAS Y0 V3.9 PAS-järjestelmä tarjoaa online-opastuksen. 3 V3.0 Opastus on sidottu kontekstiin. 3..2, KK_PAS Y..4, KK_PAS Y2 V3. V3.2 PAS-järjestelmä tarjoaa riittävät työkalut luovutuspaketin koostamiseen luovuttajan toimintaympäristössä. PAS-järjestelmä tarjoaa rajapinnan ulkoisille järjestelmäliittymille ja ohjelmille. KK_PAS Y3 KK_PAS Y3 V3.3 PAS-järjestelmä tarjoaa yhtenäisen käyttöliittymän. 2.., KK_PAS Y5
Pitkäaikaissäilytysjärjestelmän toiminnallinen vaatimusmäärittely Sivu 22(62) 3.. Toimintaprosessit ja käyttötapaukset PAS-järjestelmän toimintaprosessit koostuvat seuraavista ydinprosesseista: Luovutuspakettien vastaanotto Säilytyspakettien luominen Jakelupakettien koostaminen Tietopakettien hallinta Luovutuspakettien vastaanotto koostuu seuraavista palveluista: Luovutuspakettien eheyden ja oikeellisuuden tarkistus Virustarkistus Luovutuspaketteihin liitetään tietoa (mm. aikaleima, luovuttaja yms.) Luovutuspakettien siirto säilytykseen Luovutuksen kuittaus Lokitietojen luovutus Virheistä raportoiminen Säilytyspakettien luominen koostuu seuraavista palveluista: Luovutuspakettien vastaanotto Säilytysmetatiedon lisääminen Säilytyspakettien nimeäminen Virustarkistus Säilytyspakettien eheyden ja oikeellisuuden tarkistus Säilytyspakettien luominen Jakelupakettien luominen koostuu seuraavista palveluista: Säilytyspakettien haku Jakelupakettien luominen Jakelupakettien luovutus Haun kirjaus Tietopakettien hallinta koostuu seuraavista palveluista: Lokitietojen kirjaaminen Säilytyksen suunnittelu Aineiston versiointi Aineiston tuhoaminen tai käytön estäminen Tilastojen tuottaminen Muuttumattomuuden varmistaminen Metatietojen kirjaaminen ja ylläpito Pääsyn hallinta Suojaus Käyttöoikeuksien hallinta PAS-järjestelmän tunnistetut keskeiset käyttäjäroolit ovat luovuttaja, luovutetun aineiston ylläpitäjä, taustajärjestelmän ylläpitäjä ja käyttäjä. Viidennen roolin muodostaa PAS-järjestelmää ylläpitävän tahon henkilöstö, joka vastaa aineiston vastaanotosta ja hallinnasta. Erilaisten käyttäjäroolien luomisen vaatimukset käsitellään tarkemmin kohdassa 4.7.2.