Rekisteri- ja tietokanta-aineistojen siirtäminen Kansallisarkiston sähköisen säilyttämisen palveluun Sisällys: 1. JOHDANTO... 2 2. SIIRRETTÄVÄN AINEISTON KUVAAMINEN SÄHKE2-RAKENTEESSA... 2 2.1. SÄHKE2-rakenne... 2 2.2. Aineiston ryhmittely SÄHKE2-rakenteen tasoille... 4 2.2.1. Tehtävätason käyttäminen ryhmittelyssä... 5 2.2.2. Asiatason käyttäminen ryhmittelyssä... 5 2.2.3. Asiakirjatason käyttäminen ryhmittelyssä... 5 3. AINEISTON KUVAILU SÄHKE2-METATIEDOILLA... 5 3.1. Tehtäväluokituksen metatiedot... 6 3.2. Asian metatiedot:... 7 3.2.2. Hallinnolliset metatiedot... 8 3.3. Toimenpiteen metatiedot:... 10 3.4. Asiakirjan metatiedot:... 11 3.4.1. Kuvailevat metatiedot... 11 3.4.2. Hallinnolliset metatiedot... 12 1
1. JOHDANTO Kansallisarkiston sähköisen säilyttämisen palveluun siirtäminen edellyttää kaikille siirrettäville aineistoille yhdenmukaista kuvailutiedot sisältävää SÄHKE2-siirtorakennetta, joka liittää siirrettävän aineiston osaksi arkistollista kokonaisuutta ja tukee aineiston myöhempää käyttöä. Tässä ohjeessa kuvataan miten rekisteri- ja tietokannan tietosisällöstä tuotetut datatiedostot (aineisto) esitetään SÄHKE2-määräyksen mukaisessa rakenteessa ja kuvataan SÄHKE2-määräyksen mukaisilla metatiedoilla. essa esitetyt metatiedot perustuvat SÄHKE2-normin metatietomalliin, jossa on määritelty pakolliset metatiedot sekä vapaaehtoiset metatiedot. 2. SIIRRETTÄVÄN AINEISTON KUVAAMINEN SÄHKE2-RAKENTEESSA 2.1. SÄHKE2-rakenne Rekisteristä tai tietokannasta siirrettävä data (aineisto) tulee kuvailla SÄHKE2-määräyksessä kuvattuun loogiseen rakenteeseen (SÄHKE2- XML). Käytännössä tämä tarkoittaa, että rekisteri- ja tietokantaaineisto liitetään kontekstiinsa. Alla esitetään tarkemmin SÄHKE2- rakenteen hierarkkiset tasot. Siirrettävä aineiston on tuotettava SÄHKE2-mukaiseen rakenteeseen, jossa on oltava edustettuna aina kaikki seuraavat tasot: Tehtäväluokitus Ylimpänä on organisaation tehtäväluokituksen mukainen tehtävä tai tehtävät, joiden tuloksena siirrettävä aineisto on muodostunut. Rekisteri- tai tietokanta-aineisto voi kokonaisuudessaan liittyä yhteen tai useampaan eri tehtävään. Siirrettävän aineiston yhteydessä tehtäväluokituksesta esitetään vain se osa, johon aineisto liittyy. Esim. Etuuksien myöntäminen Asia Kukin asia liittyy aina vain yhteen tehtävään ja asian tulee liittyä aina alimmalle tehtäväluokituksen hierarkiatasolle. Asia -tasoa käytetään ryhmittelemään siirrettävää aineistoa loogisesti jäsennettäviksi kokonaisuuksiksi, esimerkiksi siten, että kunkin vuoden aineisto muodostaa yhden asian tai kukin eri aineistotyyppi muodostaa oman asiansa. Esim. Vuonna 2008 myönnetyt etuudet 2
Toimenpide Asiakirja Dokumentti Yhteen asiaan liittyy aina 1 n. toimenpidettä. Toimenpiteen tavoitteena on kertoa tarkemmin missä yhteydessä aineisto on muodostunut. Tietokanta- ja rekisteritietojen kohdalla toimenpide -taso on luonteeltaan enemmän tekninen, mutta kunkin asian alla tulee olla aina vähintään yksi toimenpide, joka nimetään siten, että se kuvaa toimenpiteen alle ryhmiteltyä aineistoa. Esim. Vuosittaisten etuuksien tuottaminen tietojärjestelmästä Yhteen toimenpiteeseen voi kuulua 1 n. asiakirjaa. Asiakirja kuvaa siirtokokonaisuuteen kuuluvan pienimmän yksittäisen loogisen kokonaisuuden, esimerkiksi yhden datataulun tai tietyn informaatioalkion, esim. tietyn henkilön tiedot. Asiakirjatasolla kuvataan aina mm. sisältääkö data henkilötietoja ja mikä on sen julkisuusluokka. Pääsääntöisesti yksi asiakirja on aina yhtä kuin yksi tiedosto. Esim. Vuoden 2008 etuudet Aal Grö (Aaltonen Grönberg) Asiakirjatason alla olevalla dokumenttitasolla määritellään varsinaiset datatiedostot. Asiakirja voi muodostua useasta dokumentista eli tiedostosta. Jos asiakirja sisältää useamman kuin yhden dokumentin, tulee kuitenkin huomioida, että kaikki dokumentit (tiedostot) ovat samaa loogista kokonaisuutta ja niillä on yhdet yhteiset metatiedot. Esim. Etuudet08_Aalt_Gronb.xml Esimerkki 1: Kansallisarkiston ylläpitämä kuvitteellinen valtakunnallinen arkistotilarekisteri sisältää tiedot kaikista luokitelluista arkistotiloista. Tilastointikohteita rekisterissä on kolme: arkistotilan sijainti, tilan koko ja tilan kunto. Kutakin tilastointikohdetta rekisterissä seurataan neljännesvuosittain ja vuosittain. Seuraavassa oletuksena on, että koko tilasto on tuotettu tietokannasta yhdeksi datatiedostoksi, jolloin esimerkkiaineisto järjestyy SÄHKE2-rakenteen eri hierarkiatasoille seuraavasti: 3
ARKISTONMUODOSTAJA: Kansallisarkisto ARKISTO: Arkistotilarekisteri TEHTÄVÄLUOKITUS: 07 Tiedon hallinta ja viestintäpalvelut 07 01 Tiedon hallinta ja tietopalvelu 07 01 05 Tilastotoimi 07 01 05 02 Arkistotilarekisteri ASIA: 2008 Vuositilasto TOIMENPIDE: Tilastodatan tuottaminen ASIAKIRJA: 2008 Vuositilastodata DOKUMENTTI: Vuosi2008.csv (rekisteristä siirrettävä datatiedosto) 2.2. Aineiston ryhmittely SÄHKE2-rakenteen tasoille ARKISTONMUODOSTAJA: Kansallisarkisto ARKISTO: Arkistotilarekisteri Monissa tapauksissa siirrettävä data on lukuisina eri tiedostona, jolloin siirrettävä data voidaan ryhmitellä usealla eri tavalla loogisiksi kokonaisuuksiksi. Seuraavassa on esitetty tapa ryhmitellä sama aineisto, joka sisältää kolme datatiedostoa: TEHTÄVÄLUOKITUS: 07 Tiedon hallinta ja viestintäpalvelut 07 01 Tiedon hallinta ja tietopalvelu 07 01 05 Tilastotoimi 07 01 05 02 Arkistotilarekisteri ASIA: 2008 Vuositilasto TOIMENPIDE: Tilastodatan tuottaminen ASIAKIRJA: 2008 Sijaintitiedot ASIAKIRJA: 2008 Kokotiedot ASIAKIRJA: 2008 Kuntotiedot 4
Aineistoa ei ryhmitellä SÄHKE2-rakenteen eri tasoille sen mukaan, miten monta tiedostoa (asiakirjaa) siirrettävä aineisto sisältää, vaan keskeisenä sääntönä on, että asiatasolla erotetaan toisistaan selkeästi eri loogisiin kokonaisuuksiin kuuluvat aineistot. 2.2.1. Tehtävätason käyttäminen ryhmittelyssä Tehtäväluokitus edustaa organisaation lakisääteisten tehtävien ja tukija ylläpitotehtävien hierarkkista luetteloa. Tehtävätasolla voidaan siis erottaa toisistaan selkeästi eri tehtävien hoitamiseen liittyvät aineistot toisistaan. - Esim. Etuuksien käsittely, korvauksien käsittely Tavallisimmin rekisteri tai tietokanta kuuluu kokonaisuudessaan vain yhteen tehtävään, jolloin aineisto ei jakaudu usealle eri tehtävälle. 2.2.2. Asiatason käyttäminen ryhmittelyssä Asiatasolla erotellaan toisistaan samaan tehtävään liittyvä aineisto, mutta kuitenkin loogisesti eri kokonaisuuksiin kuuluva aineisto toisistaan. Asiatasolla jaotteluperusteita voivat olla mm. - Ajallinen rajaus, esim. vuoden 2008 aineisto, vuoden 2009 aineisto - Tilastointikohde: esim. tilojen koko, tilojen kunto Asialle tulevien asiakirjojen (dokumenttitiedostojen) määrä ei ole keskeinen luokitteluperuste, vaan tärkeämpää on jakaa aineisto selkeästi loogisiksi kokonaisuuksiksi. 2.2.3. Asiakirjatason käyttäminen ryhmittelyssä Asiakirjatasolla kuvataan itse aineisto, joka muodostuu dokumenteista eli tiedostoista. Asiakirjataso sisältää dokumenttitason, jossa erotetaan toisistaan eri tiedostot. Tällöin tietokannan tai rekisterin tietosisältö voidaan jakaa eri asiakirjoiksi dokumenteiksi (tiedostoiksi) esimerkiksi seuraavien periaatteiden mukaan: - Henkilön sukunimen mukaan, esim. Aal Kih, Kii Par - Maantieteellisen alueen mukaan, esim. Kaarina, Kaavi - Asianumeron mukaan, esim. 1 250/2008, 251 500/2008 - Muun yksilöivän tunnuksen mukaan, esim. Y-tunnus - Tietokannan taulun mukaan, esim. kokotiedot.csv, kuntotiedot.csv 3. AINEISTON KUVAILU SÄHKE2-METATIEDOILLA Siirrettävä aineisto kuvaillaan edellä esitetyn SÄHKE2-rakenteen kaikilla tasoilla. Kullakin tasolla voidaan siis esittää metatietona informaatiota, joka liittää siirrettävän aineiston kontekstiinsa, kertoo sen syntytaustasta ja alkuperäisestä käyttötarkoituksesta. 5
Kuvailevat tiedot tulee esittää sellaisella tasolla, jolla ne ovat aineiston käytön ja käytettävyyden kannalta tarpeelliset. Samoja tietoja ei ole tarpeen toistaa eri tasoilla. Kullekin tasolle pakolliseksi määritellyt metatiedot, kuten esimerkiksi nimeke (2.7) on kuitenkin esitettävä aina. Asia- ja asiakirja -tasoilla määritetään lisäksi aineistoon ja sen metatietoihin liittyvät hallinnolliset metatiedot eli aineiston käyttörajoitustiedot, henkilötietoluonne ja säilytysaika. Nämä tiedot tulee olla aina kuvattuna sekä asia- että asiakirja -tasoilla. - Asia -tasolla ilmoitetaan, mikäli aineistolle määriteltävät metatiedot ovat käyttörajoitettuja tai sisältävät henkilötietoja - Asiakirja -tasolla ilmoitetaan, mikäli itse siirrettävä data sisältää käyttörajoituksia tai henkilötietoja HUOM! Alla ei ole lueteltu kaikkia SÄHKE2-metatietomallin mukaisia pakollisia metatietoja, vaan ainoastaan ne, joiden käyttö rekisteri- ja tietokanta-aineistojen tapauksessa tarvitsee erillistä ohjeistamista. Kaikki pakolliset metatiedot selviävät SÄHKE2-metatietomallista ja siirtoskeemasta. 3.1. Tehtäväluokituksen metatiedot Tarkoituksena ei ole kuvata koko organisaation tehtäväluokitusta, vaan tehtäväluokituksesta esitetään vain se osa, johon aineisto liittyy. Tehtäväluokituksesta esitetään se tehtäväluokka, johon asia liittyy ja hierarkiassa tämän tehtäväluokan yläpuolella olevat luokat. Kts. kuva alla: 6
ARKISTONMUODOSTAJA: Kansallisarkisto ARKISTO: Arkistotilarekisteri TEHTÄVÄLUOKITUS: 07 Tiedon hallinta ja viestintäpalvelut 07 01 Tiedon hallinta ja tietopalvelu 07 01 05 Tilastotoimi 07 01 05 02 Arkistotilarekisteri ASIA: 2008 Vuositilasto KYLLÄ! TEHTÄVÄLUOKITUS: 07 Tiedon hallinta ja viestintäpalvelut 07 01 Tiedon hallinta ja tietopalvelu 07 01 05 Tilastotoimi 07 01 05 02 Arkistotilarekisteri 07 01 05 03 Tietopalvelutilasto 07 01 05 04 Luettelointitilasto EI! ASIA: 2008 Vuositilasto 3.2. Asian metatiedot: Asian metatiedoissa kerrotaan asian muodostavan loogisen kokonaisuuden sisältö ja sen rajauksen periaatteet. Selitteet: * merkityt ovat pakollisia ( ) on viittaus SÄHKE2-normin metatietomalliin 3.2.1. Kuvailevat metatiedot Seuraavat kuvailevat tiedot identifioivat asian sisällön ja edistävät aineiston löydettävyyttä. Samaa informaatiota ei tarvitse toistaa eri metatietoelementeillä. 7
Elementin nimi Kuvaus Esimerkki *Nimeke (2.7) Aihe (2.1) Kuvaus (2.5) Suhde (2.10) Kuvailee asian sisällön mahdollisimman tiiviisti, tulee olla mahdollisimman informatiivinen ja ytimekäs Aihealueen kuvaus, luonnehtii asiaa tai kertoo sen asiayhteydestä tai merkityksestä. Suositeltavaa käyttää asiasanastoja, ontologioita ja/tai luokitusjärjestelmiä. Lyhyt sisällön kuvaus asiasta. Voidaan myös käyttää kertomaan miten ko. asia liittyy laajempaan aineistokokonaisuuteen tai millaisen osan aineistosta asia muodostaa. Voidaan viitata johonkin toiseen asiaan tai asiakirjaan. Siirtokokonaisuuden jokaiselta asialta voi olla esim. viittaus siihen asiaan, joka sisältää kuvaukset ja dokumentaation ko. aineistosta. - Korvaa / Korvattu (2.10.1) - Viittaa / On viitattu (2.10.2) Vuoden 2012 arkistotilarekisteri Asiasanoja yleisen suomalaisen asiasanaston tms. mukaan (https://finto.fi/fi/) Asia sisältää X rekisteristä kaikki vuonna 2012 annetut rangaistusmääräykset, raportit ja tutkintaan liittyvät tiedot Pyritään selkeään, loogiseen muotoiluun, joka vastaa sisältöä. Voi hyödyntää mm. seulontapäätöksessä käytettyä kuvausta aineistosta. 3.2.2. Hallinnolliset metatiedot Hallinnolliset metatiedot sisältävät tiedon mm. käyttörajoituksesta, henkilötietoluonteesta ja säilytysajan. Asiatason käyttörajoitus koskee vain asian metatietoja. Asiakirjatasolla ilmoitetaan varsinaisesti asiakirjan tietosisältöön kohdistuva käyttörajoitus. 8
Elementin nimi Kuvaus Ilmaisutapa *Julkisuusluokka (2.6.1) Salassapitoaika (2.6.2) Salassapidon päättymisajankohta (2.6.3) Salassapitoperuste (2.6.4) Suojaustaso (2.6.5) Turvallisuusluokka (2.6.6) *Henkilötietoja (2.6.7) Asia on salassa pidettävä vain, jos itse asian SÄHKE2-metatiedot tai siihen liittyvien asiakirjojen SÄHKE2-metatiedot sisältävät salassa pidettävää tietoa. Itse rekisteridatan julkisuus ilmoitetaan aina asiakirjan metatiedoissa. Pakollinen tieto salassa pidettäville asioille. Pakollinen tieto salassa pidettäville. Lasketaan luontipäivä + salassapitoaika Pakollinen tieto salassa pidettäville, Perustuu erityislakiin tai julkisuuslakiin. Ks. asetus tietoturvallisuudesta valtionhallinnossa 2010/681 ja VAHTI-ohje 2/2010 Ks. asetus tietoturvallisuudesta valtionhallinnossa 2010/681 ja VAHTI-ohje 2/2010 Asia sisältää henkilötietoja vain, jos itse asian SÄHKE2-metatiedot tai siihen liittyvien asiakirjojen SÄHKE2-metatiedot sisältävät henkilötietoja. Itse rekisteridatan henkilötietoluonne ilmoitetaan aina asiakirjan metatiedoissa. Julkinen Osittain salassa pidettävä Salassa pidettävä Vuosina (kokonaisluku) Formaatti: vvvv-kk-pp Esim. JulkL 24.1 5 kohta I II III IV Turvallisuusluokka I Turvallisuusluokka II Turvallisuusluokka III Turvallisuusluokka IV Ei turvallisuusluokiteltu Ei sisällä henkilötietoja Sisältää henkilötietoja Sisältää arkaluontoisia henkilötietoja Sisältää erityisiä henkilötietoryhmiä 9
Metatiedoissa tulee kuvata tieto siitä, sisältyykö siirrettävään tietoaineistoon EU:n tietosuojaasetuksen: 9 artiklan mukaisia erityisiä henkilötietoryhmiä ilmaisevia tietoja ja/tai 10 artiklan mukaisia rikostuomioihin ja rikkomuksiin liittyviä henkilötietoja Sisältää rikostuomioihin ja rikkomuksiin liittyviä henkilötietoja Omistaja(2.6.9) *Säilytysajan pituus (2.11.1) *Säilytysajan peruste (2.11.2) Pakollinen salassa pidettävälle Siirrettävän aineiston tulee olla pysyvästi säilytettävää Pysyvä säilytys perustuu erityislakiin tai Kansallisarkiston päätökseen. Viittaus aina Kansallisarkiston siirrettävää aineistoa koskevaan seulontapäätökseen. Esitetään: -1 Perustuessaan Kansallisarkiston seulontapäätökseen muotoillaan peruste seulontapäätöksen diaarinumeron mukaisesti: esim. AL/24539/07.01.01.03.02/2 016 3.3. Toimenpiteen metatiedot Elementin nimi Kuvaus Esimerkki *Nimeke (5.3) *Tyyppi (5.6) Kertoo siirrettävän kokonaisuuden muodostamiseen liittyvästä toimenpiteestä, esim. tilastodatan muodostaminen, rekisterin sisällön kokoaminen tms. Eroaa tehtäväluokasta, joka ilmaisee ylätasolla minkä organisaatiolle kuuluvantehtävän tuloksena aineisto on alun perin muodostunut. Termi, joka kuvaa tehtyä toimenpidettä. Täydentää toimenpiteen nimekettä (5.3) tai voi olla myös sama. Vuoden 2012 rekisteridatan tuottaminen Vuoden 2012 rekisteridatan muodostaminen 10
3.4. Asiakirjan metatiedot 3.4.1. Kuvailevat metatiedot Seuraavat kuvailevat tiedot identifioivat asiakirjan sisällön ja auttavat aineiston löydettävyyttä. Samaa informaatiota ei tarvitse toistaa eri metatietoelementeillä. Elementin nimi Kuvaus Esimerkki *Nimeke (2.7) Kuvailee asiakirjan sisällön mahdollisimman tiiviisti, tulee olla mahdollisimman informatiivinen ja ytimekäs Vuoden 2012 rangaistusmääräykset X- mukaan Aineistolähtöisesti tulisi miettiä mikä on loogisin esittämisen tapa: esim. kohteiden aakkosjärjestyksessä vai toimipaikkojen mukaan *Tyyppi (2.15) Aihe (2.1) Kuvaus (2.5) Tyyppi metatieto ilmaisee, onko kyse rekisteridatasta, tietokannan taulusta, koodistokuvauksesta, muusta dokumentaatiosta tms. Aihealueen kuvaus, luonnehtii asiakirjaa tai kertoo sen asiayhteydestä tai merkityksestä. Suositeltavaa käyttää asiasanastoja, ontologioita ja/tai luokitusjärjestelmiä. Lyhyt sisällön kuvaus asiakirjasta. Voidaan myös käyttää kertomaan, miten ko. asiakirja liittyy laajempaan aineistokokonaisuuteen tai millaisen osan asiakirja muodostaa asiasta tai koko aineistosta. Rekisteridata Asiasanoja yleisen suomalaisen asiasanaston tms. mukaan (https://finto.fi/fi/) Vuonna 2012 annetut rangaistusmääräykset X mukaan järjestettynä (esim. toimipaikka) Suhde (2.10) Voidaan viitata johonkin toiseen asiaan tai asiakirjaan. Esimerkiksi korvaa tai täydentää asiakirjan tietoja. - Korvaa / Korvattu (2.10.1) 11
- Viittaa / On viitattu (2.10.2) Kattavuus (4.4) Voidaan ilmaista kattavuus: - Alueellinen (4.4.2) - Ajallinen (4.4.3) Alueellinen (4.4.2) Esimerkkejä merkintätavoista: - ISO 3166 - Maiden nimien standardoidut esitysmuodot - DCMI Point - Koordinaatit pisteelle - DCMI Box - Koordinaatit alueelle tai tilalle - TGN - The Getty Thesaurus of Geographic Names, Maantieteellisten nimien sanasto - SFS-EN ISO 3166-1 Maiden ja niiden osa-alueiden tunnukset. Osa 1: Maiden nimien tunnukset Ajallinen (4.4.3) Esimerkkejä merkintätavoista: - W3C-DTF - W3C:n merkintätapa ajankohdille, perustuu ISO 8601 standardiin - DCMI Period - Ajanjaksojen merkintätapa, DC yhteisön luoma 3.4.2. Hallinnolliset metatiedot Hallinnolliset metatiedot sisältävät tiedon mm. käyttörajoituksesta, henkilötietoluonteesta ja säilytysajan. Asiakirjalle määritellään seuraavat hallinnolliset metatiedot. Kaikki asiakirja tason alla olevat dokumentit saavat siis mainitut metatiedot. Tämä tulee ottaa huomioon mm. käyttörajoitusten kuvaamisessa. Elementin nimi Kuvaus Ilmaisutapa *Julkisuusluokka (2.6.1) Asiakirjan tietosisältöä koskeva julkisuusluokka Julkinen Osittain salassa pidettävä Salassa pidettävä 12
Salassapitoaika (2.6.2) Pakollinen tieto salassa pidettäville asioille. Vuosina (kokonaisluku) Salassapidon päättymisajankohta (2.6.3) Salassapitoperuste (2.6.4) Suojaustaso (2.6.5) Turvallisuusluokka (2.6.6) Henkilötietoja (2.6.7) Pakollinen tieto salassa pidettäville. Lasketaan luontipäivä. + salassapitoaika Pakollinen tieto salassa pidettäville, Perustuu erityislakiin tai julkisuuslakiin. Ks. asetus tietoturvallisuudesta valtionhallinnossa 2010/681 ja VAHTI-ohje 2/2010 Ks. asetus tietoturvallisuudesta valtionhallinnossa 2010/681 ja VAHTI-ohje 2/2010 Asiakirjan tietosisällön henkilötietoluonne Metatiedoissa tulee kuvata tieto siitä, sisältyykö siirrettävään tietoaineistoon EU:n tietosuojaasetuksen: 9 artiklan mukaisia erityisiä henkilötietoryhmiä ilmaisevia tietoja ja/tai 10 artiklan mukaisia rikostuomioihin ja rikkomuksiin liittyviä henkilötietoja Formaatti vvvv-kk-pp Esim. JulkL 24.1 5 kohta I II III IV Turvallisuusluokka I Turvallisuusluokka II Turvallisuusluokka III Turvallisuusluokka IV Ei turvallisuusluokiteltu Ei sisällä henkilötietoja Sisältää henkilötietoja Sisältää arkaluontoisia henkilötietoja Sisältää erityisiä henkilötietoryhmiä Sisältää rikostuomioihin ja rikkomuksiin liittyviä henkilötietoja Omistaja(2.6.9) Pakollinen salassa pidettävälle 13
*Säilytysajan pituus (2.11.1) Siirrettävän aineiston tulee olla pysyvästi säilytettävää Säilytetään pysyvästi esitetään: -1 *Säilytysajan peruste (2.11.2) Pysyvä säilytys perustuu erityislakiin tai Kansallisarkiston päätökseen. Viittaus aina Kansallisarkiston siirrettävää aineistoa koskevaan seulontapäätökseen. Vapaamuotoinen tekstikuvaus, esim. Kansallisarkiston päätös AL 166/07.01.01.03.01/2012 14