KDK-PAS-jatkohanke KDK-infopäivä arkistoille 14.12.2010 Kimmo Koivunen CSC Tieteen tietotekniikan keskus
Tieteen tietotekniikan keskus CSC Valtion omistama ja opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö Liitti Suomen internetiin 1988 Työntekijöitä noin 200 Toimitilat Espoon Keilaniemessä, lähellä Otaniemen kampusta Toiminnan päämääriä: Tutkimuksen ja tuotekehityksen toimintaedellytysten parantaminen Kansallisten keskitettyjen palvelujen tarjoaminen Kansainvälisesti kilpailukykyisten tieteen tietotekniikan palvelujen tuottaminen 7.12.2010 2
KDK-PAS-jatkohanke Tilaaja: opetus- ja kulttuuriministeriö Toteuttaja: CSC Tieteen tietotekniikan keskus Oy Kesto: 1.6.2010 30.10.2011 Tavoite: Edistää KDK:n pitkäaikaissäilytyksen suunnittelua ja tuottaa pitkäaikaissäilytyksen yksityiskohtainen toteuttamissuunnitelma sekä edistää yhteistoimintaa KDK:n pitkäaikaissäilytyksen tavoitteiden ja painopisteiden toteutumiseksi 7.12.2010 3
Hankkeen tavoite tarkemmin Tavoite voidaan yksilöidä seuraaviin osatavoitteisiin: KDK:n kokonaisarkkitehtuurinäkemysten konkretisointi Pitkäaikaissäilytyksen toteutuksen yksityiskohtainen suunnitteleminen Toimijoiden osaamisen kasvattaminen Kansallisen yhteistyöverkoston rakentaminen Kansainvälisten kontaktien voimistaminen 7.12.2010 4
PAS-jatkohankkeen lähtökohdat OAIS-viitekehys KDK-kokonaisarkkitehtuuri PAS-jaoston työ Loppuraportti ja sen liitteet Kustannus- ja hyötyanalyysi Säilyttämisen vaatimustasot ja säilyttämisen menetelmät 7.12.2010 5
Pitkäaikaissäilytyksen kustannus- ja hyötyanalyysi Yhteisen PAS-järjestelmän kokonaiskustannukset 12 ensimmäisen toimintavuoden aikana olisivat noin 42 miljoonaa euroa Täysimittaisen PAS-järjestelmän kustannukset olisivat noin 4 miljoonaa euroa vuodessa SADe-ohjelman hyötyanalyysimallin mukaisesti arvioituna yhteinen PAS-järjestelmä tuottaa Käyttöönottovaiheessa noin 30 miljoonan euron säästöt hajautettuun malliin verrattuna Tuotantovaiheessa kustannussäästöt olisivat noin 10 miljoonaa euroa vuodessa Kumulatiivinen hyöty ensimmäisten 12 vuoden aikana olisi noin 100 miljoonaa euroa 7.12.2010 6
Pitkäaikaissäilytyksen kustannus- ja hyötyanalyysi Vuosi Järjestelmän toteutuksen vaihe Aineistoa 1 Vaatimusmäärittelyjen täydennys, työkalujen ja tukipalveluiden kehitystyö, hankintojen ja kilpailutuksen suunnittelu - 2 Työkalujen ja tukipalveluiden kehitystyö, kilpailutukset (ohjelmisto ja laitteisto), pilottijärjestelmän asennus 3 Ensimmäisten taustajärjestelmien liittäminen pilottiin, integrointiprojekti, tuotantoon ottaminen, 4 Tuotantokäyttö, vaihe 1: 1. säilytyspiste tuotannossa, laitteiston täydennys, kapasiteetin lisäys, käyttö ja ylläpito 5 Tuotantokäyttö, vaihe 1: Maantieteellisen hajautuksen valmistelu. Toisen säilytyspisteen hankintojen kilpailutus 6 Tuotantokäyttö, vaihe 2: 2. säilytyspiste tuotannossa, Kapasiteetin täydentäminen: molemmissa säilytyspisteissä kaikki aineisto - 300 Tt 700 Tt 1000 Tt 1400 Tt 7-12 Tuotantokäyttö (kaksi säilytyspistettä): Kapasiteetin lisäys 15% vuosittain, vuodesta 11 alkaen 25%, laitteistojen ja ohjelmistojen uusiminen syklien mukaisesti, vuosittain laitteiden uusintaa jossakin säilytyspisteessä, vuonna 11 uusitaan PAS-ohjelmisto 7.12.2010 7 Aineistotaulukon mukainen
Merkittävimmät laadulliset ja rahalliset hyödyt Laadullinen hyöty Merkittävyys Aika-jänne Keskeisimpiä rahallisia hyötyjä KDK:n pitkäaikaissäilytykselle ovat: 1. Yhteisen ratkaisun kustannussäästöt 2. Aineistojen säilytyksen hallinnan kustannussäästöt Todennäköisyys 3. Digitoitujen ja alkujaan digitaalisten aineistojen säilyvyyden tuomat kustannussäästöt 7.12.2010 8 Hyöty-indeksi Hyödyntävät organisaatiot pystyvät suoriutumaan lain velvoitteista 3 2 3 81 Poistaa päällekkäisiä toimintoja 2 2 3 63 Mahdollistaa saumattoman yhteistyön ja yhteiskäytön organisaatiorajojen yli 3 1 2 38 Parantaa mahdollisuuksia osaamisen kehittämiseen ja henkilöriippumattomuuteen 2 2 3 63 Hyödyntävät organisaatiot pystyvät keskittymään ydinosaamiseensa 3 2 3 81 Digitoitujen aineistojen säilyvyys voidaan varmistaa 3 1 3 63 Prosessien ja palveluiden laatu paranee 2 2 3 63 Mahdollistaa tuleville sukupolville aineistojen hyödyntämisen 3 1 3 63
Säilyttämisen hyötytase 20 000 000 15 000 000 90 000 000 70 000 000 10 000 000 50 000 000 5 000 000 0-5 000 000 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 30 000 000 10 000 000-10 000 000-30 000 000-10 000 000 Hyödyt Kustannukset Vuoden summa Kumulatiivinen hyöty -50 000 000 7.12.2010 9
PAS-jatkohankkeen tehtävät (etenemissuunnitelma)
Säilyttämisen vaatimustasot Alkuperäisen käyttökokemuksen säilyttäminen Vaativin, mutta käyttäjän kannalta mielenkiintoisin taso Esim. Tietokonepelin pelaaminen samoin kuin 30 vuotta sitten Sisällön ymmärrettävyyden säilyttäminen Teksti, kuvat ja muu olennainen sisältö voidaan tulkita Ymmärrettävyys riippuu myös kohdeyleisöstä Käytön ja uuden tiedon tuottamisen kannalta yleensä tärkein taso Bittien säilyttäminen Varmistetaan alkuperäisten ykkösten ja nollien säilyminen ja luettavuus, sisällön tulkinnasta ei takeita Säilyttämisen perusta ja minimitaso säilytyksen aloittamiseen: Suunnitelmallisesti tehtynä vaatimustasoa voidaan nostaa myöhemmin 7.12.2010 11
Säilyttämisen menetelmiä Alkuperäisen käyttökokemuksen säilyttäminen Emulaatio Emulaattoreiden kehittäminen uusille alustoille, formaattien seuranta jne. Aktiivinen testaaminen ja seuranta Sisällön ymmärrettävyyden säilyttäminen Migraatio Tiedostomuotojen kehityksen seuranta (formaattikirjasto) Muunnosten kehittäminen, testaaminen, toteuttaminen ja valvonta Varautuminen palautuksiin Bittien säilyttäminen Eheyden varmistaminen Tiedostojen validointi ja valvonta Kopioiden hallinta Koskee sekä objekteja että metadataa 7.12.2010 12
Bittien säilyttäminen Replikointi- ja virkistämisprosessi PAS-järjestelmän sisäinen ja automaattinen prosessi Datan siirtäminen tallennusalustalta toiselle Virkistäminen tehdään samalle mediatyypille kuin lähderesurssi Replikoinnin yhteydessä mediatyyppi vaihtuu Replikointi- ja virkistämistarpeen tunnistaminen Medialaitteiston kapasiteetti osoittautuu riittämättömäksi Laitteisto vioittuu Riskienhallinta; Esim. tietyn valmistajan medialaitteistossa on havaittu ominaispiirre, jonka perusteella kaikki vastaavat laitteistot kannattaa vaihtaa heti tai tietyn käyttöiän 7.12.2010 13 myötä
Bittien säilyttäminen Replikointi ja virkistäminen 7.12.2010 14
Ymmärrettävyyden säilyttäminen - Migraatioprosessin päätaso Tiedostomuodon muuntaminen esim. PPTX -> PDF/A tai metadatan muuntaminen MARC -> MARC21 Migraatio perustuu säilytyssuunnitelmalle, jonka hyödyntävä organisaatio laatii säilytettävälle aineistolle PAS-järjestelmän ylläpitäjä ja/tai hyödyntävä organisaatio suunnittelee migraation siten, että tulos vastaa säilytyssuunnitelmassa asetettuja vaatimuksia Migraation toteuttamiseksi vaaditaan toimenpiteitä PASjärjestelmän ylläpitäjältä ja hyödyntävältä organisaatiolta Ylläpitäjä tarkistaa mm. hyödyntävän organisaation kanssa tehdyn sopimuksen, kyseiseen formaattimuunnokseen tarjolla olevat muunnostyökalut ja tekee päätöksen siitä, kannattaako migraatiota toteuttaa tässä vaiheessa Päätöksenteko migraation toteuttamisesta tehdään tämän jälkeen hyödyntävän organisaation toimesta, mikäli näin on sovittu organisaation kanssa 7.12.2010 15
Migraatiotarpeen havaitsemisen taustatekijät Hyödyntävän organisaation vaatimukset Formaatin esityskelpoisuus heikentynyt, halutaan käsitellä uudella ohjelmalla Hyödyntävä organisaatio pyytää migraatiota Teknologian tarkkaileminen Formaatin vanhentuminen, uudet muunnostyökalut, laitteistojen ja ohjelmistojen kehittyminen Ympäristön tarkkaileminen Riskien uudelleenarviointi, standardien muuttuminen 7.12.2010 16
Migraation suunnittelemiseen vaikuttavat tekijät Säilytyssuunnitelmat Ottaa huomioon säilytyksen vaatimukset, tavoitteet ja tekniset rajoitteet, tekijänoikeudet ja käyttöoikeudet sekä hyödyntävän organisaation kokoelmapolitiikan ja lain velvoitteet säilyttämiselle. Muutoksia suunnitelmaan tulee hyödyntävän organisaation vaatimuksista, teknologian kehittymisen ja ympäristön tarkkailemisen myötä Sopimus hyödyntävän organisaation kanssa Määrittävät PAS-järjestelmään luovutettavan aineiston määrän, siirtämisen ja säilyttämisen ehdot ja vastuut Teknologian kehittyminen Vaatimusten saavuttaminen paranee 7.12.2010 17
Ymmärrettävyyden säilyttäminen - Migraation päätaso 7.12.2010 18
Kiitos! Kimmo.Koivunen@csc.fi