SÄHKE-määrittely III Tekninen mallintaminen ja RDF-mallintaminen
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 1 (17) Tekninen mallintaminen SÄHKE-hanke / Mallintamisen osahanke Versio ja pvm Laatinut Tarkpvm Tarkastanut Hyvpvm Hyväksynyt 0.8 / 06.06.2003 Hanne Laukkanen Tiina Leppänen Riku Moisio SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 2 (17) Muutoshistoria Versio ja pvm Laatija Muutoksen kuvaus 0.8 / 06.06.2003 Riku Moisio Päivitetty Kansallisarkiston havaitsemilla muutostarpeilla. 0.7 / 30.04.2003 Tiina Leppänen Päivitetty 23.04.2003 johtoryhmässä käsitellyillä muutostarpeilla. 0.6 / 28.02.2003 Tiina Leppänen Huomioitu 24.02.2003 toimitetut kommentit. 0.5 / 14.02.2003 Raija Janhonen Huomioitu 07.02.2003 toimitetut kommentit. Hanne Laukkanen Tiina Leppänen 0.4 / 31.01.2003 Hanne Laukkanen Tiina Leppänen Huomioitu palaverikommentit. Täydennetty tiedostomuotojen ja sähköisen siirron kuvauksia. 0.3 / 21.01.2003 Hanne Laukkanen Tiina Leppänen Huomioitu palaverikommentit. Täydennetty kuvaustiedostojen tietosisältöjä. 0.2 / 13.01.2003 Hanne Laukkanen Huomioitu R. Moision kommentit. Täydennetty kuvaus- Tiina Leppänen 0.1 / 19.12.2002 Hanne Laukkanen Tiina Leppänen Sisällysluettelo tiedostojen tietosisältöjä. Ensimmäinen luonnosversio 1 TEKNISEN MALLINTAMISEN LÄHTÖKOHDAT... 4 2 TIEDOSTOMUODOT... 5 2.1 Tekstimuotoon tallennetut asiakirjat... 5 2.1.1 Rakenteiset asiakirjat... 5 2.2 PDF-muotoon tallennetut asiakirjat... 6 2.3 Skannattu asiakirja... 6 2.3.1 Asiakirjat, joissa ei ole merkityksellisiä värejä... 6 2.3.2 Asiakirjat, joissa merkityksellisiä värejä... 7 2.4 Valokuvat... 7 2.5 Ääni... 7 3 KONVERSIOT JA LAADUNVARMENNUS... 7 3.1 Konversiotavat... 8 3.2 Laadunvarmennus... 8 3.2.1 Metatietojen laadunvarmennus... 8 3.2.2 Sähköisen aineiston laadunvarmennus... 8 3.2.3 Siirtotiedoston laadunvarmennus... 8 4 SIIRTOTIEDOSTON KOKOAMINEN... 9 5 SIIRTOTIEDOSTON RAKENNE... 9 5.1 Siirtotiedoston metatiedot... 11 5.1.1 Siirrettävän aineiston tietovälinekohtaiset tiedot (siirto.xml)... 12 5.1.2 Aineiston sisällön kuvaus (jarjkuv.xml)... 12 5.1.3 Tietovälineet (tietoval.xml)... 13 SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 3 (17) 5.2 Aineiston metatiedot (metatied.xml)... 13 5.2.1 Viittaukset sähköisiin asiakirjoihin... 13 5.3 Keskeneräiset asiat... 15 6 AINEISTON SIIRTO ARKISTOLAITOKSEEN... 15 6.1 Fyysiset tietovälineet... 15 6.2 Siirto tietoliikenneyhteyden välityksellä... 15 6.2.1 FTP... 16 6.2.2 SOAP... 16 Liitteet: Liite 1: SÄHKE-metatietomäärittelyn XML Schema a: aineiston_metatiedot09.xsd Liite 2: Siirtotiedoston metatietokuvaukset Liite 3: Siirtotiedoston metatietojen tietomalli (graafi) Liite 4: Siirtotiedoston metatietojen XML Schemat a: siirto01.xsd b: jarjestelmakuvaukset02.xsd c: tietovalineet01.xsd Liite 5: Esimerkit siirtotiedoston metatiedoista a: siirto.xml b: jarjkuv.xml c: tietoval.xml d: metatied.xml Lähteet: [1] H Sivonen: Kansallisarkistolle tehty tekninen selvitys tiedostoformaateista sekä pakkaus- ja paketointitavoista, Kansallisarkisto, 2002 [2] R. Moisio: Asiankäsittelyjärjestelmän toiminnalliset vaatimukset, Kansallisarkisto, 27.3.2002 [3] Tanskan arkistolaitos: Vejledning til cirkulaere om statslige myndigheders aflevering af elektroniske arkivsystemer til Statens Arkiver, http://www.sa.dk/sa/statamtkom/arklov/nyaflcirk.htm SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 4 (17) 1 Teknisen mallintamisen lähtökohdat SÄHKE-mallintaminen osahankkeen tekninen mallintaminen vaiheessa on tuotettu kuvaus arkistolaitokseen toimitettavan siirtotiedoston rakenteesta ja sisällöstä. Siirtotiedostolla tarkoitetaan asiankäsittelyjärjestelmän tuottamaa pitkäaikaissäilytykseen siirrettävää aineistoa, jossa ainakin sen rekisteriosa on tallennettu sähköisesti. Varsinainen aineisto voi sisältää sekä sähköisiä että fyysisiä asiakirjoja. Siirtotiedoston avulla on määritelty yhtenäinen tapa tuottaa arkistolaitoksen palvelujärjestelmään 1 tallennettava aineisto. Sen avulla asiankäsittelyjärjestelmien tuottama aineisto myös vastaanotetaan ja sitä käsitellään yhtenäisessä muodossa arkistolaitoksessa. Jatkossa aineisto on käytettävissä arkistolaitoksen palvelujärjestelmässä, jota tässä vaiheessa ei ole vielä määritelty. Teknisen mallintamisen tuloksena on määritelty tekniset reunaehdot siirtotiedostolle. Siirrettävän aineiston sisältämien asiakirjojen osalta on huomioitu ne tiedostomuodot, jotka arkistolaitos ottaa vastaan. Siirtotiedostossa kuvattu aineisto voi olla myös osaksi tai kokonaan tallennettu fyysiselle tietovälineelle esim. mikrofilmille. Siirtotavoista on kuvattu aineiston siirto fyysisellä tietovälineellä arkistolaitoksen nykyisten ohjeiden mukaisesti. Lisäksi on kuvattu yleisellä tasolla aineiston sähköinen siirto tietoliikenneyhteyksien avulla. Luvussa kaksi on kuvattu tiedostomuodot, joita arkistolaitos ottaa vastaan. Luvussa kolme on kuvattu pääkohdat konversiotavoista ja konversion tuloksena muodostuvien tiedostojen laadunvarmennuksesta. Siirtotiedoston kokoaminen on esitetty yleisellä tasolla luvussa neljä. Luvussa viisi on kuvattu siirtotiedoston sisältämät metatiedot, joiden tarkempi tietosisältö on kuvattu tämän asiakirjan liitteissä. Lopuksi luku kuusi sisältää kuvaukset siirtotavoista, joilla aineisto voidaan siirtää arkistolaitokseen. Siirtotavoista on huomioitu tässä vaiheessa nykyisen ohjeen mukainen aineiston siirto tietovälineillä sekä tulevaisuudessa todennäköisempi siirtomuoto eli tietoliikenneyhteyden välityksellä tapahtuva siirto. Tässä tekninen mallintaminen vaiheen lopputuloksena tuotetussa asiakirjassa kuvatut tekniset ohjeistukset ja ratkaisut perustuvat pääasiallisesti eri aihealueiden (esim. tiedostomuodot, pakkaustavat) osalta tehtyihin selvityksiin 1 Palvelujärjestelmä on sähköisen pitkäaikaissäilytyksen operatiivinen järjestelmä, jossa säilytetään sähköisiä aineistoja arkistolaitoksessa. SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 5 (17) [1]. Koska arkistolaitoksen säilytys- ja palvelujärjestelmän teknistä toteutustapaa ei ole vielä päätetty, siirtotiedoston tuottamiseen ja siirtämiseen liittyvät tekniset ratkaisumallit on tarkennettava ja päivitettävä siinä vaiheessa, kun arkistolaitoksen tuleva järjestelmäarkkitehtuuri on määritelty. 2 Tiedostomuodot 2.1 Tekstimuotoon tallennetut asiakirjat 2.1.1 Rakenteiset asiakirjat Siirtotiedoston sisältämä sähköinen aineisto tallennetaan seuraavissa luvuissa esitettyjen tiedostomuotojen mukaisesti. Lisäksi aineisto ryhmitellään tiedostomuotokohtaisesti hakemistoihin (tiff ja text). Tekstimuotoon tallennettu asiakirja on tuotettu tekstieditorilla (esim. Emacs, Notepad), eikä sen rakennetta ole kuvattu esim. HTML-elementtien avulla. Se ei myöskään sisällä merkkeihin liitettyjä tyylejä (esim. alleviivaus, lihavointi). Toisaalta myös tekstinkäsittelyohjelmalla tuotettu asiakirja voi olla tekstimuotoinen, jos se on tuotettu ja tallennettu tekstieditorilla tuotetun asiakirjan tavoin. Tekstimuotoon tallennetut asiakirjat liitetään siirtotiedostoon tekstimuotoisina. Merkkikoodauksena käytetään Unicode UTF-8:aa. Käytettävät kontrollimerkit ovat: Kontrollimerkki Merkin järjestysnumero CR (Carriage Return) 13 LF (Line Feed) 10 TAB (Horizontal Tab) 09 Rivinvaihtomerkkinä hyväksytään UNIX- (LF) ja Windows-muoto (CRLF). Rakenteiset asiakirjat ovat yleensä tekstimuotoon tallennettuja asiakirjoja. Erona pelkkiin tekstiasiakirjoihin on se, että tekstin joukkoon on tallennettu asiakirjan sisältöä ja rakennetta kuvaavia elementtejä esim. XML-rakenteen mukaisesti. Tällä hetkellä arkistolaitos ottaa vastaan vain pelkkiä tekstiasiakirjoja eli asiakirjoja, joita ei ole tallennettu rakenteiseen muotoon (poikkeustapauksissa tiedot voidaan säilyttää HTML-muodossa). Rakenteisten asiakirjojen vastaanottamiseksi tulee aineiston tuottajien ja aineistoa käsittelevän arkistolaitoksen palvelujärjestelmän osalta huomioitava ainakin seuraavat asiat: SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 6 (17) 2.2 PDF-muotoon tallennetut asiakirjat 2.3 Skannattu asiakirja 2.3.1 Asiakirjat, joissa ei ole merkityksellisiä värejä - Käytössä olisi yksi tai mahdollisesti useampi rakenne (standardi), jota asiakirjojen tulisi noudattaa. Esimerkkinä laajasti levinneistä rakenteisten julkaisujen standardeista mainittakoon DocBook. - Siirrettävän aineiston validointi pitäisi ulottaa myös rakenteisille asiakirjoille. Toisaalta rakenteen oikeellisuus ei takaa vielä sen oikeaa käyttötapaa aineiston tuottaminen vaatii tuottamiseen tarkoitetulta järjestelmältä ja tuottajalta enemmän kuin pelkän tekstin tuottaminen. Mitä tarkempi rakenne, sitä vaativampaa on asiakirjan tuottaminen. - Sallittujen rakenteiden mukaiset käsittelysäännöt tulee huomioida palvelujärjestelmässä. Arkistolaitos ei vastaanota PDF-tiedostomuotoon tallennettuja asiakirjoja toistaiseksi. PDF:n käytettävyyttä pitkäaikaissäilytyksessä heikentävät mm. sen epävarma turvallisuus (esim. se voi sisältää erilaisia lomake- ja skriptitoimintoja) sekä upotetut kirjasinlajit ja niiden tekijänoikeudet. PDFtiedostomuodosta on tekeillä paremmin pitkäaikaissäilytykseen sopiva määrittely PDF/A. Paperiasiakirjat voidaan muuntaa sähköiseen muotoon skannaamalla, jolloin siirtotiedostoa muodostettaessa on huomioitava skannattujen asiakirjojen tiedostomuoto ja tallennustapa. Tähän ryhmään kuuluvat asiakirjat, jotka sisältävät pääsääntöisesti tekstiä tai niiden sisältämillä väreillä ei ole merkitystä sisällön tulkitsemiseksi (esim. asiakirja sisältää värillisen yritystunnuksen). Viranomainen päättää, onko skannattavassa asiakirjassa esiintyvillä väreillä merkitystä. Päätöstä tehtäessä on kiinnitettävä huomiota asiakirjan tietosisällön säilymiseen. Skannatut asiakirjat tallennetaan CCITT/ITU-T Group 4 -pakattuun TIFF v. 6.0 -muotoon, jossa jokainen sivu on tallennettu erilliseen tiedostoon. Sivukohtaisten tiedoston tallentaminen ja niihin viittaaminen on esitetty kohdassa 5.2.1 Viittaukset sähköisiin asiakirjoihin. Asiakirja skannataan paperilta 200-400 ppi (pixels/inch) -tarkkuudella kaksiväriseksi (mustavalko) bittikartaksi. Tarkkuustaso on valittava siten, että asiakirjan teksti on tulkittavissa yksiselitteisesti. Tarkastaminen on tehtävä silmämääräisesti. SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 7 (17) 2.3.2 Asiakirjat, joissa merkityksellisiä värejä 2.4 Valokuvat 2.5 Ääni 3 Konversiot ja laadunvarmennus Asiakirjasta tallennetaan siirtotiedostoon sekä häviöttömästi pakattu mustavalkobittikartta että mahdollisesti siitä tuotettu pelkkää tekstiä sisältävä vedos (eli ns. dumppi ) tekstihakua varten. Tekstimuotoinen vedos tuotetaan OCR-ohjelmalla (kuvat) tai tallentamalla asiakirja tekstimuotoon (Save as text) ja se tallennetaan omaksi sivunumeroiduksi tiedostokseen. Tähän ryhmään kuuluvat asiakirjat, jotka sisältävät sisällön tulkitsemisen kannalta tärkeitä värejä. Asiakirja skannataan RGB-värillisenä (8 bittiä/kanava, yhteensä 24 bit eli True Color) ja tallennetaan TIFFtiedostomuotoon (tarkkuus 200-400 ppi) käyttäen LZW-pakkausta. Sähköisestä asiakirjasta on aina varmistettava silmämääräisesti, että tarkkuustaso riittävä ja tarpeelliset värit ovat mukana. Asiakirjasta tuotetaan mahdollisesti myös tekstivedos tekstihakua varten. Tiedostojen tallentaminen siirtotiedostoon ja niihin kohdistuvat viittaukset tehdään kuten kohdassa 5.2.1 Viittaukset sähköisiin asiakirjoihin. Valokuvat tallennetaan JFIF-tiedostomuotoon JPEG Baseline -pakattuna. Valokuvat tallennetaan häviöllistä pakkausta käyttäen siten, etteivät pakkauksesta johtuvat häviöt ole havaittavissa häiritsevästi. Äänen tallentamiseen ja pakkaukseen valitaan vähintäänkin jokin psykoakustinen koodausmenetelmä (esim. MP3), jossa näytetaajuutena käytetään lähtötiedoston näytetaajuutta (mielellään 44,1 khz tai 48 khz). Arkistolaitoksen vastaanottamat tiedostomuodot eivät todennäköisesti vastaa niitä tiedostomuotoja, joissa asiakirjoja tuotetaan ja hallitaan niiden aktiiviaikana. Tällöin siirtotiedostoa varten asiakirja on konvertoitava. Asiakirjat konvertoidaan johonkin vastaanotettavista tiedostomuodoista. Konversiomenetelmiä ja niihin liittyviä ohjelmistoja on olemassa useita, joten tässä kuvauksessa ei ole mahdollista esittää kattavasti tapoja, joilla siirrettävä aineisto konvertoidaan. Siirtotiedoston vastaanottajan ja sitä käsittelevän järjestelmän näkökulmasta on kuitenkin erittäin tärkeää, että konversion tulokset vastaavat sisällöltään alkuperäistä aineistoa ja niiden tallentaminen sekä käsittely arkistolaitoksen säilytys- ja palvelujärjestelmässä on mahdollista. SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 8 (17) 3.1 Konversiotavat Siirrettävä aineisto on tallennettava tämän ohjeen mukaisesti teksti- ja/tai TIFF-muotoon. Aineiston konvertoiminen TIFF-muotoon tapahtuu joko skannaamalla (paperiasiakirja) tai ohjelmallisesti tallentamalla (sähköinen asiakirja, esim. PDFmuodosta tuotetaan TIFF-muoto). Kun asiakirja konvertoidaan tekstimuotoon, hyvin todennäköisesti useita sen ulkoasuun ja tekstin asetteluun liittyviä määrittelyitä häviää. Esimerkiksi tekstinkäsittelyohjelman avulla tuotetut tyyli- ja taulukkoasetukset eivät tallennu tekstimuotoiseen tiedostoon. Jos nämä konversion aiheuttamat hävikit vaikuttavat oleellisesti asiakirjan sisällön tulkitsemiseen, asiakirja kannattaa konvertoida kuvaksi eli TIFF-muotoon. On myös huomioitava, että asiakirjan konversiosta pitää tallentaa tieto asiakirjan metatietoihin (säilytyshistoria). 3.2 Laadunvarmennus 3.2.1 Metatietojen laadunvarmennus 3.2.2 Sähköisen aineiston laadunvarmennus 3.2.3 Siirtotiedoston laadunvarmennus Siirtoaineiston laadunvarmistukseen liittyy kolme eri osa-aluetta: metatietorakenteiden oikeellisuus sekä sähköisessä muodossa olevan aineiston ja siirtotiedoston teknisen laadun varmennus. Metatietojen laadunvarmennuksella tarkoitetaan varsinaisen aineiston ja siirtotiedostoon liittyvien metatietojen rakenteen tarkastamista (XMLtiedostot). Jokaista metatietomääritystä varten on tehty oma XML Schema, joiden avulla varmistetaan, että aineisto on määritellyn rakenteen mukaista. XML-rakenteiden tarkastamiseen käytetään validointiohjelmaa, joka tukee XML Schema versio 1.0 mukaisia rakenteita. Konvertoidut sähköiset asiakirjat on tarkastettava ennen kuin ne voidaan liittää osaksi siirtotiedostoa. Tarkastaminen tehdään pistokokein, kunnes saavutetaan riittävä varmuus konversion onnistumisesta. Pistokokeiden määrä/aineisto on mahdollista määritellä myös tilastollisin menetelmin. Siirtotiedoston teknisellä laadunvarmennuksella varmistetaan, että siirrettävä aineistokokonaisuus on muodostettu teknisesti oikein. Siirrettävän aineiston SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 9 (17) 4 Siirtotiedoston kokoaminen 5 Siirtotiedoston rakenne osalta varmistetaan, että se on koottu ohjeiden mukaisesti ja sen sisältö on oikea. Tällöin varmistetaan myös se, että siirtotiedosto voidaan avata ja sen sisältö on käytettävissä arkistolaitoksessa. Ennen aineiston siirtoa täytyy siirtotiedoston kokoamisen lisäksi aineisto tallentaa tiiviimmin, jolloin siirtotiedoston koko on mahdollisimman pieni. Kokoamiseen liittyvillä toimenpiteillä voidaan edistää aineiston sisällön muuttumattomuutta siirron aikana. Siirtotiedoston kokoamiseen voidaan käyttää joko tar- ja gzip-ohjelmia tai zip-ohjelmaa. Tar-ohjelmaa voidaan käyttää myös tietoliikenneyhteyden välityksellä tapahtuvassa siirrossa. Sen avulla aineiston sisältämät tiedostot ja hakemistot kootaan yhdeksi binääritiedoksi. Kokoamisessa on huomioitava: - Tar-ohjelmassa käytetään standardiparametreja eli tuotettaessa tartiedostoa parametrit ovat -cf ja purettaessa xf. - Siirtotiedosto tallennetaan tiiviimmin gzip-ohjelmalla (deflate/inflate). - Zip-ohjelmassa käytetään standardiparametreja ja kokoaminen tehdään rekursiivisesti (hakemistorakenne mukana). Kokoamiseen käytettävät ohjelmat ja niiden versiot on täsmennettävä, kun arkistolaitoksen säilytys- ja palvelujärjestelmän tekninen järjestelmäarkkitehtuuri on päätetty. Siirtotiedoston rakenne loogisella tasolla on esitetty kuvassa 1 Siirtotiedoston looginen rakenne. Siirtotiedosto muodostuu joukosta metatietoja ja aineistosta (asiakirjoista), johon viitataan aineiston metatiedoista. Koko siirrettävän aineistokokonaisuuden kuvailuun käytettäviä metatietoja kutsutaan puolestaan siirtotiedoston metatiedoiksi. SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 10 (17) Siirtotiedoston metatiedot Siirtotiedoston kuvaukset Arkistonmuodostaja Arkisto Ryhmä Aineiston metatiedot Asia Toimenpide Asiakirja Asiakirjat Sähköinen aineisto Fyysinen aineisto Kuva 1. Siirtotiedoston looginen rakenne. Aineisto voidaan siirtää sähköisesti tietoliikenneyhteyden välityksellä, fyysisellä tietovälineellä tai molempien avulla. Kun aineisto tallennetaan ja siirretään fyysisellä tietovälineellä, siirtoaineisto jaetaan yhdelle tai useammalle tietovälineelle aineiston ja tietovälineen koon asettamien vaatimusten mukaisesti. Siirrettävän aineiston tekninen rakenne on esitetty kuvassa 2 Siirtotiedoston tekninen rakenne. Jos aineisto jaetaan ja tallennetaan useammalle tietovälineelle, seuraavat tietovälineet sisältävät aina aineistoa kuvaavan tiedoston ( siirto.xml ) ja hakemistorakenteen mukaisesti tallennetun osan siirrettävästä aineistosta. SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 11 (17) 1. Tietoväline/ Sähköinen siirto Seuraavat tietovälineet siirto.xml jarjkuv.xml tietoval.xml metatied.xml siirto.xml sisalto tiff tiff text text Kuva 2. Siirtotiedoston tekninen rakenne. 5.1 Siirtotiedoston metatiedot Kun aineisto siirretään kokonaan yhdellä tietovälineellä tai kertasiirtona sähköisesti tietoliikenneyhteyden välityksellä, siirtotiedoston rakenne on sama kuin ensimmäisen tietovälineen rakenne. Jos tietoliikenteen välityksellä tapahtuva siirto muodostuu useammasta lähetettävästä kokonaisuudesta, muut kokonaisuudet kuvataan kuten kuvassa 2 esitetty seuraavat tietovälineet. Siirtotiedoston metatiedot tallennetaan XML-rakenteisina ennalta sovittujen tiedostonimien mukaisesti (siirto.xml, jarjkuv.xml ja tietoval.xml). Aineiston metatiedot on tallennettu erilliseen XML-rakenteiseen tiedostoon (metatied.xml) ja varsinainen asiakirja-aineisto tallennetaan tiedostomuotokohtaisiin hakemistoihin. Siirtotiedoston rakenne on kuvattu tarkemmin seuraavissa luvuissa ja siirtotiedoston metatiedot on kuvattu liitteissä 2 Siirtotiedoston metatietokuvaukset ja 3 Siirtotiedoston metatietojen tietomalli. Siirtotiedoston tarkastamista ja käsittelyä varten tarvitaan siirrettävään kokonaisuuteen liittyviä kuvailutietoja. Lisäksi niitä tarvitaan siirtotiedoston sisällön tunnistamiseen, aineiston purkamiseen ja tallentamiseen palvelujärjestelmään. SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 12 (17) 5.1.1 Siirrettävän aineiston tietovälinekohtaiset tiedot (siirto.xml) 5.1.2 Aineiston sisällön kuvaus (jarjkuv.xml) Siirrettävän aineiston tietovälinekohtaiset tiedot tallennetaan siirto.xml nimiseen tiedostoon. Jos siirtotiedosto on tallennettu useammalle kuin yhdelle tietovälineelle, siirto.xml -tiedosto sisältyy niihin jokaiseen. Siirto.xml tiedostoon kuvataan seuraavaa: - Siirrettävän aineiston tunniste ja mahdollinen viittaus edellisiin siirtotiedostoihin, - siirtotiedoston tuottajan tiedot sekä tietojärjestelmän nimi, josta aineisto siirretään, - aineiston ajallinen kattavuus, - metatietojen XML Schema -määrittelyn nimi, - siirtotiedoston metatietojen tekniset tiedot ja - aineiston tai ko. tietovälineen sisältö (hakemistot ja tiedostot). Siirtotiedostoon tallennetaan myös kuvauksia asiankäsittelyjärjestelmästä (esim. systeemityödokumentaatio, näyttökuvia), jolla aineisto on tuotettu. Näiden tietojen avulla kuvataan aineiston alkuperäinen toimintaympäristö. Järjestelmäkuvaukset tallennetaan jarjkuv.xml nimiseen tiedostoon. Metatietojen avulla kuvataan pitkäaikaisesti säilytettävää aineistoa tuottavasta järjestelmästä ainakin seuraavat tiedot: - Järjestelmän yleiskuvaus ja käyttötarkoitus, - otteita järjestelmän käyttöliittymästä ja tulosteista sekä - systeemityöasiakirjat. Systeemityöasiakirjoista siirtotiedostoon liitetään ainakin käyttöohjeet, määrittely-, suunnittelu- ja toteutusasiakirjat sekä mahdolliset testaus- ja käyttöönottoasiakirjat. Systeemityöasiakirjat ja järjestelmää kuvaavat näkymät kuvaillaan SÄHKE-metatietomäärittelyn mukaisten asiakirjan metatietojen avulla ja tarvittaessa aineiston julkisuus voidaan määritellä metatietomäärittelyssä olevalla julkisuusrakenteella. Metatietojen ja asiakirjojen välisten viittausten muodostuminen kuvataan kohdassa 5.2.1 Viittaukset sähköisiin asiakirjoihin. Jos aineisto tallennetaan useammalle kuin yhdelle tietovälineelle tai lähetetään useammassa kuin yhdessä erässä, jarjkuv.xml tiedosto tallennetaan aina vain ensimmäiselle tietovälineelle/toimituserään. SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 13 (17) 5.1.3 Tietovälineet (tietoval.xml) 5.2 Aineiston metatiedot (metatied.xml) 5.2.1 Viittaukset sähköisiin asiakirjoihin Siirtotiedoston sisältämä aineisto voi olla tallennettuna yhdelle tai useammalle sähköiselle tai fyysiselle tietovälineelle. Toisaalta sähköinen siirto voi muodostua useammasta kuin yhdestä siirtokokonaisuudesta. Siirtoon sisältyvät tietovälineet luetellaan tietoval.xml tiedostossa (esim. arkistolaatikko, cd-levy, nauha). Jos siirtotiedosto on tallennettu useammalle kuin yhdelle tietovälineelle, tietoval.xml -tiedosto tallennetaan vain ensimmäiselle tietovälineelle. Jos aineisto siirretään tietoliikenneyhteyksien välityksellä yhdessä erässä ja aineisto on kokonaisuudessaan sähköisessä muodossa, tietoval.xml - tiedostoa ei muodosteta lainkaan. Aineiston metatiedot kuvataan SÄHKE-metatietomäärittelyn rakenteen mukaisesti. Metatiedot tallennetaan metatied.xml nimiseen tiedostoon. Jos siirtotiedosto on tallennettu useammalle kuin yhdelle tietovälineelle, metatied.xml -tiedosto tallennetaan vain ensimmäiselle tietovälineelle. Viittaukset asiakirjojen metatiedoista asiakirjatiedostoihin muodostetaan metatietorakenteella, johon tallennetaan tiedostomuoto- ja asiakirjan tunnistekohtaiset hakemistotunnisteet Kun asiakirja on tallennettu TIFF-muotoon ja siitä on muodostettu tekstivedos (eli ns. dumppi ), asiakirjan jokainen sivu on tallennettu erilliseen tiedostoon. Viittaus muodostetaan seuraavasti: - Asiakirjan sivukohtaiset tiedostot tallennetaan omaan rakenteeseen (hakemistoon), joka nimetään asiakirjan yksilöivän identifiointitunnuksen mukaisesti. Tiedostot sisältävä hakemisto tallennetaan siirtotiedostossa tiedostomuotokohtaiseen hakemistoon. - Hakemistonimien pituudeksi suositellaan 8 merkkiä. Jos tämä ei ole mahdollista asiakirjan identifiointitunnuksesta muodostettujen hakemistojen kohdalla, on huolehdittava, ettei hakemistopolun kokonaispituus ylitä 100 merkkiä. - Sivukohtaiset tiedostot nimetään siten, että nimi alkaa kirjaimella p ja loput merkit muodostavat sivunumeron, esim. p0000001.tif. Tiedostonimi on pituudeltaan 8+3 merkkiä. - Asiakirjan metatietojen Sijaintipaikka -nimiseen metatietorakenteesee (storagelocation) tallennetaan viittaus hakemistoon, johon sivu- SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 14 (17) kohtaiset tiedostot on tallennettu. Sijaintipaikka - metatietorakenteeseen tallennetaan myös tiedostomuoto (tiff tai text). Jokaiselle tiedostoformaatille tehdään oma hakemisto, jonne vastaavat tiedostot tallennetaan. Esimerkki kolmesivuisen asiakirjan tiff- ja tekstivedostiedostojen viittaus- ja tallennustavasta on esitetty kuvassa 3 Esimerkki monisivuisen asiakirjan viittaus- ja tallennustavasta. Asiakirjan metatiedot: <storagelocation type= text >text\01234567</storagelocation> <storagelocation type= tiff >tiff\01234567</storagelocation> Tiedostot siirtotiedoston rakenteessa: tiff 01234567 p0000001.tif p0000002.tif p0000003.tif text 01234567 p0000001.txt p0000002.txt p0000003.txt Kuva 3. Esimerkki monisivuisen asiakirjan viittaus- ja tallennustavasta. Jos asiakirja koostuu vain yhdestä tiedostosta (tekstimuotoinen asiakirja), viittaus tehdään edellä kuvatun mallin mukaan seuraavasti: - Asiakirjatiedosto tallennetaan tiedostomuotokohtaiseen rakenteeseen asiakirjan identifiointitunnuksella nimettyyn hakemistoon. - Tiedostonimen pituus on 8+3 merkkiä ja se muodostetaan kuten edellä on kuvattu: p0000001.<ext> (esim. p0000001.txt). Yhdestä tiedostosta muodostuvassa asiakirjatiedoston nimessä vain nimen loppuosa voi muuttua (txt tai tif). SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 15 (17) - Hakemistojen nimiksi suositellaan 8 merkkiä. Jos tämä ei ole mahdollista asiakirjan identifiointitunnuksesta muodostettujen hakemistojen kohdalla, on huolehdittava, ettei hakemistopolun kokonaispituus ylitä 100 merkkiä. 5.3 Keskeneräiset asiat 6 Aineiston siirto arkistolaitokseen 6.1 Fyysiset tietovälineet Aineiston siirtoajankohtana keskeneräisenä olevat asiat tallennetaan myös siirtotiedostoon. Asioille tehdään tekninen päätöstoimenpide, joka ei muuta asian tilaa (asian tila = kesken ). Siirtotiedostoon tallentuu asiasta sen hetkiset toimenpiteet ja toimenpiteisiin liitetyt asiakirjat. Siirtotiedoston siirtäminen arkistolaitokseen voidaan tällä hetkellä tehdä vain fyysisten tietovälineiden avulla. Tässä luvussa on kuvattu myös yleisellä tasolla aineiston siirto sähköisesti tietoliikenneyhteyden välityksellä. Arkistolaitos hyväksyy tällä hetkellä seuraavat tietovälineet sähköisten aineistojen siirtovälineiksi: - 8 mm nauhakasetit - 3,81 mm DDS (Digital Data Storage) nauhakasetit (DDS/DC tai DDS-2, DDS-3 tai DDS-4- formaatti) - CD-R -levy 6.2 Siirto tietoliikenneyhteyden välityksellä Tulevaisuudessa aineisto voidaan siirtää myös tietoliikenneyhteyden avulla, jolloin vältytään tietovälineisiin liittyviltä rajoituksilta (esim. rajallinen tallennuskapasiteetti, erilaiset tallennusformaatit). Tietoliikenneratkaisun määrittely ei sisältynyt tämän hankkeen tehtäviin ja sen tekemiseen vaaditaan tarkempia selvityksiä teknisten toteutustapavaihtoehtojen osalta. Se tulee olemaan yksi tärkeä osa tulevaa palvelujärjestelmäkokonaisuutta, jossa vastaanotettavia siirtotiedostoja tullaan käsittelemään. Tietoliikenneratkaisussa on yhtenä vaihtoehtona käyttää valmiita palveluita ja teknisiä ratkaisuja sähköisen aineiston vastaanottamisessa. Palvelun tarjoaja luo puitteet linjasiirrolle (esim. yhteydet, salaustekniikan) ja voi toimia aineiston teknisenä laadunvarmistajana (esim. merkistötarkastukset ja tarvittaessa merkistökonversiot). Palvelun tarjoaja takaa myös sen, että arkistolaitoksen vastaanottama aineisto on teknisesti mahdollisimman hyvälaatuista. SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 16 (17) Tällöin arkistolaitos voi keskittää voimavaransa sisällön tarkastamiseen ja siirtämiseen palvelujärjestelmään. Seuraavissa luvuissa on kuvattu yleisellä tasolla kaksi tiedonsiirtotapaa: FTP ja SOAP. Kumpikaan vaihtoehto ei itsessään sisällä ratkaisuja esim. tietoturvallisuuteen liittyen, vaan ne on huomioitava varsinaisten teknisten tietoliikenneyhteyksien suunnittelussa. 6.2.1 FTP FTP (File Transfer Protocol) on yksinkertainen tapa siirtää tiedostoja verkossa olevien tietokoneiden välityksellä. FTP perustuu asiakas-palvelin arkkitehtuuriin: siirtotiedoston lähettäjällä on FTP-asiakasohjelma, jolla otetaan yhteys arkistolaitoksen FTP-palvelimeen. Asiakas- ja palvelinohjelmia on saatavana kaikkiin käyttöjärjestelmiin. Lähettävän ja vastaanottavan järjestelmän merkistöeroavaisuuksien minimoimiseksi siirto on suositeltavaa tehdä binäärimuodossa. Siirto voidaan tehdä yhtenä tai useampana lähetyksenä. Lähetysten lukumäärään vaikuttaa siirrettävän aineiston koko. Jos yhden aineiston siirto tehdään useana FTPsiirtona, niin siirtotiedoston kuvaamisessa noudatetaan useammalla kuin yhdellä tietovälineellä siirrettäessä käytettävää kuvaustapaa. Tiedonsiirtotapana FTP on yksinkertainen ratkaisu etenkin sen käyttöönoton kannalta. FTP-ohjelmistoja on saatavana eri järjestelmäympäristöihin jopa ilmaiseksi. FTP-tuotteiden käyttö (ohjelmat, niiden versiot ja parametrointitavat) on täsmennettävä, kun arkistolaitoksen säilytys- ja palvelujärjestelmän tekninen järjestelmäarkkitehtuuri on päätetty. 6.2.2 SOAP SOAP (Simple Object Access Protocol) tarjoaa tavan välittää rakenteista ja tyypitettyä tietoa osapuolten välillä hajautetussa ympäristössä. SOAP ei itsessään määrittele mitään sovelluslogiikkaa, sen sijaan se määrittää tavat kertoa toiselle osapuolelle sovelluksen vaatimista tiedoista. SOAP on kehitetty lähinnä sovellusten väliseen viestien välitykseen. SOAP sanoma on XML dokumentti, joka koostuu pakollisesta SOAP envelope osiosta, valinnaisesta SOAP header osiosta ja pakollisesta SOAP body osiosta. Jos siirtotiedoston välittämiseen käytetään SOAP-protokollaa, siirtotiedoston metatiedot tallennetaan SOAP body osioon. Lisäksi body-osiossa tarvitaan SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Tekninen mallintaminen 06.06.2003 17 (17) tieto sanoman vastaanottavasta palvelusta/yhteydestä ja elementtien kuvaamisessa tarvittavan nimiavaruusmäärityksen osoite. Varsinaisen aineiston siirto voisi tapahtua SOAP-protokollan laajennuksen SOAP Messages with Attachments avulla, jonka avulla SOAP-sanoman mukana voidaan välittää myös liitteitä. SOAP-viestien muodostaminen edellyttää siihen tarkoitukseen tehtyä sovellusta (esim. Java-sovellus), joten sen käyttöönottaminen vaatii enemmän teknisiä ratkaisuja kuin esim. FTP. Toisaalta sovellusten tarjoama SOAPtuki on laajentunut viime aikoina huomattavasti, joten käyttöönottokynnyksen voisi olettaa edelleen madaltuvan tulevaisuudessa. Koska SOAP on hyvin tekninen toteutustapa, se tarjoaa monia mahdollisuuksia aineiston siirtoon liittyvien teknisten tarkastuksien hoitamiseksi järjestelmien välisellä viestinvaihdolla. Lisätietoja: AIIM International and NPES Partner to Standardize use of PDF for Document Archive and Preservation: http://www.aiim.org/article_edoc.asp?id=25517 ja http://www.aiim.org/article_pr.asp?id=24680 FTP: http://rfc.net/rfc959.html SOAP: http://www.w3.org/tr/soap/ SOAP Messages with Attachments: http://www.w3.org/tr/soap- Attachments XML Schema: http://www.w3.org/xml/schema SÄHKE-mallintaminen-Tekninen-mallintaminen- V08.doc Sisältö ja arkistolaitoksen tunnus 2003 arkistolaitos Versio 0.8
SÄHKE-hanke / Mallintamisen osahanke Metatietojen XML Schema Liite 1 30.4.2003 1 (5) SÄHKE-metatietojen XML Schema SÄHKE-hanke / Mallintamisen osahanke Versio ja pvm Laatinut Tarkpvm Tarkastanut Hyvpvm Hyväksynyt 0.2 / 30.04.2003 Heikki Ellonen SÄHKE-mallintaminen-Tekninen-mallintaminen- V07-Liite1.doc Sisältö ja arkistolaitoksen tunnus 2002 arkistolaitos Versio 0.2
SÄHKE-hanke / Mallintamisen osahanke Metatietojen XML Schema Liite 1 30.4.2003 2 (5) Muutoshistoria Versio ja pvm Laatija Muutoksen kuvaus 0.2 / 30.04.2003 Heikki Ellonen Korjattu johtoryhmän kokouksessa 23.4.2003 havaittuja virheitä. 0.1 / 17.02.2002 Heikki Ellonen Ensimmäinen versio Sisällysluettelo 1 Lukuohje... 3 2 Nimiavaruudet (namespaces)... 5 SÄHKE-mallintaminen-Tekninen-mallintaminen- V07-Liite1.doc Sisältö ja arkistolaitoksen tunnus 2002 arkistolaitos Versio 0.2
SÄHKE-hanke / Mallintamisen osahanke Metatietojen XML Schema Liite 1 30.4.2003 3 (5) 1 Lukuohje XML Schema on W3C:n standardi, jonka avulla määritetään rakenteisten dokumenttien rakenne ja jonka avulla voidaan tarkistaa toteuttaako jokin XML-dokumentti kyseisen määrityksen (validointi). Tämän lukuohjeen tavoitteena on opastaa lukijaansa hahmottamaan, miten edellisissä vaiheissa määritellyt metatiedot kuvataan XML Scheman avulla. Pääsääntöisesti jokaisesta UML:n kaavion luokasta on XML Schemaan luotu oma tietotyyppinsä, joka on tapauksesta riippuen joko yksinkertainen (simpletype) tai monimutkainen (complextype). Esimerkkinä muunnoksena on julkisuusluokan muuttuminen PublicityClassType-rakenteeksi (Kuva 1). Näiden perustyyppien avulla on luotu sitten monimutkaisemman tietotyypit. «enumeration» Julkisuusluokka -1 0 1 <xs:simpletype name="publicityclasstype" final="restriction"> <xs:documentation xml:lang="fi"> Hyväksytyt julkisuusluokat</xs:documentation> <xs:restriction base="xs:string"> <xs:enumeration value="-1"/> <xs:enumeration value="0"/> <xs:enumeration value="1"/> </xs:restriction> </xs:simpletype> Kuva 1 UML kaavion luokan muuntuminen XML Schemaan. XML Scheman juurena toimii elementti metadataofarchive, jonka alle on sitten kasattu arkistonmuodostajasta lähtevä hierarkia. Hierarkia on rakennettu siten, että jokaiselle pääkäsitteelle (arkistonmuodostaja, arkisto, ryhmä, asia, toimenpide ja asiakirja) kuvautuvat kaikki siihen liittyvät käsitteet. Käytännössä tämä tarkoittaa sitä, että ylemmälle hierarkiatasolle määritelty elementti (esim. julkisuus ) esiintyy myös alemmilla tasoilla elementtinä, vaikka tietosisältö olisi sama. SÄHKE-mallintaminen-Tekninen-mallintaminen- V07-Liite1.doc Sisältö ja arkistolaitoksen tunnus 2002 arkistolaitos Versio 0.2
SÄHKE-hanke / Mallintamisen osahanke Metatietojen XML Schema Liite 1 30.4.2003 4 (5) Tietoteknisistä syistä UML-kuvausta ei kuitenkaan ole muunnettu ylläolevan pääsäännön mukaan orjallisesti, vaan lähtökohdaksi on otettu, että XML skeema olisi XML-näkökulmasta katsottuna mahdollisimman joustava ja XML-taitoiselle helposti avautuva. Merkittävimmät muutokset liittyvät seuraavaan tilanteeseen: Käsitteeseen (esim. tekijä_asiakirja) liittyvä arvojoukko ei useimmiten esiinny omana rakenteena, vaan siitä on usein muodostettu attribuutti (Kuva 2). «enumeration» Rooli_Tekijä_Asiakirja 1 esittelijä julkaisija laatija 1 lähettäjä muu tekijä ratkaisija toimeksiantaja vastaanottaja Tekijä_Asiakirja henkilö : String yhteisö : String <xs:complextype name="creatorfordocumenttype" mixed="false"> <xs:all> <xs:element name="personalname" type="xs:string"/> <xs:element name="corporatename" type="xs:string" minoccurs="0"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:attribute name="role" use="required"> <xs:simpletype> <xs:restriction base="xs:string"> <xs:enumeration value="presenter"/> <xs:enumeration value="solver"/> <xs:enumeration value="publisher"/> <xs:enumeration value="maincreator"/> <xs:enumeration value="sender"/> <xs:enumeration value="contributor"/> <xs:enumeration value="mandator"/> <xs:enumeration value="receiver"/> </xs:restriction> </xs:simpletype> </xs:attribute> Kuva 2 UML-luokan "Tekijä_Asiakirjalle" muunnos XML Schemaan SÄHKE-mallintaminen-Tekninen-mallintaminen- V07-Liite1.doc Sisältö ja arkistolaitoksen tunnus 2002 arkistolaitos Versio 0.2
SÄHKE-hanke / Mallintamisen osahanke Metatietojen XML Schema Liite 1 30.4.2003 5 (5) 2 Nimiavaruudet (namespaces) Namespacet on XML-teknologia, jonka avulla voidaan varmistua siitä, että käytettävät käsitteet ovat yksikäsitteisiä. Namespacen käyttö XML Schemoissa on perusteltua silloin, kun yhden XML Scheman sisältä viitataan toisissa XML Schemoissa esiintyviin käsitteisiin. XML Schemassa aineiston_metatiedot09.xsd (liite 1a) nimiavaruus käsitettä on käytetty määrittämään schemassa esiintyvä kohdenimiavaruus, jolloin käytetyt käsitteet ovat tässä tapauksessa Kansallisarkiston määrittämiä. Kohdenimiavaruuden tunnus on: xs:schema targetnamespace=http://www.narc.fi/sahke/aineiston_metatiedot09 xmlns:narc="http://www.narc.fi/sahke/aineiston_metatiedot09" SÄHKE-mallintaminen-Tekninen-mallintaminen- V07-Liite1.doc Sisältö ja arkistolaitoksen tunnus 2002 arkistolaitos Versio 0.2
E:\Toimitukset\Tekninen mallintaminen\versio 0.7\aineiston_metatiedot09.xsd 05/12/03 13:21:54 <?xml version="1.0" encoding="utf-8"?> <!-- edited with XMLSPY v5 rel. 3 U (http://www.xmlspy.com) by Heikki Ellonen (Profium) --> <!-- 2003-04-30 Heikki Ellonen (Profium) --> <xs:schema targetnamespace="http://www.narc.fi/sahke/aineiston_metatiedot09" xmlns:narc="http://www.narc.fi/sahke/aineiston_metatiedot09" xmlns:xs="http://www.w3.org/2001/xmlschema" elementformdefault="qualified" attributeformdefault="unqualified" version="sahke 0.9"> <xs:element name="metadataofarchive"> <xs:documentation xml:lang="fi">kokoarkiston metatiedot</xs:documentation> <xs:complextype> <xs:sequence> <xs:element name="recordscreator" type="narc:recordscreatortype"/> </xs:sequence> <xs:complextype name="aikavälitype"> <xs:documentation xml:lang="fi">aikavälin kuvaus</xs:documentation> <xs:all> <xs:element name="startdate" type="xs:date"/> <xs:element name="enddate" type="xs:date" minoccurs="0"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:simpletype name="audiencetype"> <xs:documentation xml:lang="fi">kohdeyleisö (JHS143)</xs:documentation> <xs:restriction base="xs:string"/> </xs:simpletype> <xs:complextype name="titletype" mixed="false"> <xs:documentation xml:lang="fi">nimeke (JHS 143)</xs:documentation> <xs:sequence> <xs:element name="maintitle" type="xs:string"/> </xs:sequence> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:complextype name="titlefordocumenttype" mixed="false"> <xs:documentation xml:lang="fi">nimeke (JHS143)</xs:documentation> <xs:sequence> <xs:element name="maintitle" type="xs:string"/> <xs:element name="alternativetitle" type="xs:string" minoccurs="0" maxoccurs="unbounded"/> </xs:sequence> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:complextype name="creatortype" mixed="false"> <xs:documentation xml:lang="fi">ryhmään, asiaan, ja toimenpiteeseen liittyvät tekijätiedot</xs:documentation> <xs:appinfo>järjestelmän tulee taata se, että ryhmään, asiaan ja toimenpiteeseen liittyy vähintään yksi creator-elementti, jonka type attribuutti on 'registrar'</xs:appinfo> <xs:all> <xs:element name="personalname" minoccurs="0"/> <xs:element name="corporatename" minoccurs="0"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:simpletype name="listofcreatortypesforgroup"> <xs:documentation xml:lang="fi">creator elementin tarkenteet</xs:documentation> <xs:restriction base="xs:string"> <xs:enumeration value="maincreator"/> <xs:enumeration value="registrar"/> <xs:enumeration value="draftsman"/> <xs:enumeration value="presenter"/> <xs:enumeration value="solver"/> </xs:restriction> </xs:simpletype> <xs:simpletype name="listofcreatortypesforcase"> <xs:documentation xml:lang="fi">creator elementin tarkenteet</xs:documentation> <xs:restriction base="xs:string"> <xs:enumeration value="maincreator"/> <xs:enumeration value="registrar"/> <xs:enumeration value="draftsman"/> <xs:enumeration value="presenter"/> 1998-2002 Altova GmbH http://www.xmlspy.com Registered to Tiina Leppänen (TietoEnator Corp.) Page 1
E:\Toimitukset\Tekninen mallintaminen\versio 0.7\aineiston_metatiedot09.xsd 05/12/03 13:21:54 <xs:enumeration value="solver"/> <xs:enumeration value="mandator"/> <xs:enumeration value="responsible"/> </xs:restriction> </xs:simpletype> <xs:simpletype name="listofcreatortypesforaction"> <xs:documentation xml:lang="fi">creator elementin tarkenteet</xs:documentation> <xs:restriction base="xs:string"> <xs:enumeration value="maincreator"/> <xs:enumeration value="registrar"/> <xs:enumeration value="draftsman"/> <xs:enumeration value="presenter"/> <xs:enumeration value="solver"/> <xs:enumeration value="mandator"/> <xs:enumeration value="responsible"/> <xs:enumeration value="sender"/> <xs:enumeration value="receiver"/> </xs:restriction> </xs:simpletype> <xs:complextype name="creatorforarchivetype" mixed="false"> <xs:documentation xml:lang="fi">arkistoon liittyvät tekijätiedot</xs:documentation> <xs:all> <xs:element name="personalname" type="xs:string" minoccurs="0"/> <xs:element name="corporatename" type="xs:string"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:attribute name="type" use="optional"> <xs:simpletype> <xs:restriction base="xs:string"> <xs:enumeration value="responsible"/> <xs:enumeration value="responsible unit"/> <xs:enumeration value="contributor"/> </xs:restriction> </xs:simpletype> </xs:attribute> <xs:complextype name="creatorfordocumenttype" mixed="false"> <xs:documentation xml:lang="fi">asiakirjaan liittyvät tekijätiedot</xs:documentation> <xs:all> <xs:element name="personalname" type="xs:string"/> <xs:element name="corporatename" type="xs:string" minoccurs="0"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:attribute name="role" use="required"> <xs:simpletype> <xs:restriction base="xs:string"> <xs:enumeration value="presenter"/> <xs:enumeration value="solver"/> <xs:enumeration value="publisher"/> <xs:enumeration value="maincreator"/> <xs:enumeration value="sender"/> <xs:enumeration value="contributor"/> <xs:enumeration value="mandator"/> <xs:enumeration value="receiver"/> </xs:restriction> </xs:simpletype> </xs:attribute> <xs:simpletype name="subjecttype"> <xs:documentation xml:lang="fi">aihe (JHS143)</xs:documentation> <xs:restriction base="xs:string"/> </xs:simpletype> <xs:complextype name="descriptiontype" mixed="false"> <xs:documentation xml:lang="fi">kuvaus (JHS143)</xs:documentation> <xs:all> <xs:element name="abstract" type="xs:string" minoccurs="0"/> <xs:element name="additionalinformation" type="xs:string" minoccurs="0"/> <xs:element name="maindescription" type="xs:string" minoccurs="0"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:complextype name="descriptionforarchivetype" mixed="false"> 1998-2002 Altova GmbH http://www.xmlspy.com Registered to Tiina Leppänen (TietoEnator Corp.) Page 2
E:\Toimitukset\Tekninen mallintaminen\versio 0.7\aineiston_metatiedot09.xsd 05/12/03 13:21:54 <xs:documentation xml:lang="fi">kuvaus (JHS143)</xs:documentation> <xs:all> <xs:element name="abstract" type="xs:string" minoccurs="0"/> <xs:element name="additionalinformation" type="xs:string" minoccurs="0"/> <xs:element name="maindescription" type="xs:string"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:complextype name="descriptionfordoctype" mixed="false"> <xs:documentation xml:lang="fi">kuvaus (JHS143)</xs:documentation> <xs:all> <xs:element name="abstract" type="xs:string" minoccurs="0"/> <xs:element name="tableofcontents" type="xs:string" minoccurs="0"/> <xs:element name="maindescription" type="xs:string" minoccurs="0"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:simpletype name="typetype"> <xs:documentation xml:lang="fi">type (JHS143)</xs:documentation> <xs:restriction base="xs:string"/> </xs:simpletype> <xs:simpletype name="languagetype" final="#all"> <xs:documentation xml:lang="fi">kieli (JHS143) Hyväksytyt kielikoodit</xs:documentation> <xs:restriction base="xs:string"> <xs:enumeration value="fi"/> <xs:enumeration value="sv"/> <xs:enumeration value="se"/> <xs:enumeration value="en"/> </xs:restriction> </xs:simpletype> <xs:complextype name="coveragetype"> <xs:documentation xml:lang="fi">jhs143:n mukainen kattavuusrakenne</xs:documentation> <xs:all> <xs:element name="jurisdiction" type="xs:string" minoccurs="0"/> <xs:element name="spatial" type="xs:string" minoccurs="0"/> <xs:element name="temporal" type="narc:aikavälitype" minoccurs="0"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:complextype name="coverageforarchivetype"> <xs:documentation xml:lang="fi">jhs143:n mukainen kattavuusrakenne</xs:documentation> <xs:all> <xs:element name="jurisdiction" type="xs:string" minoccurs="0"/> <xs:element name="spatial" type="xs:string" minoccurs="0"/> <xs:element name="temporal" type="narc:aikavälitype"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:simpletype name="statustype"> <xs:documentation xml:lang="fi">hyväksytyt tilakoodit toimenpiteille, asioille, asiakirjoille</xs:documentation> <xs:restriction base="xs:string"> <xs:enumeration value="aloitettu"/> <xs:enumeration value="kesken"/> <xs:enumeration value="keskeytetty"/> <xs:enumeration value="valmis"/> </xs:restriction> </xs:simpletype> <xs:complextype name="identifiertype" mixed="true"> <xs:documentation xml:lang="fi">identifiointitunnus (JHS143)</xs:documentation> <xs:sequence> <xs:element name="nativeid" type="xs:string"/> <xs:element name="otherid" minoccurs="0" maxoccurs="unbounded"> <xs:complextype> <xs:attribute name="type" type="xs:string" use="optional"/> </xs:sequence> <xs:attribute name="issecret" type="xs:idref" use="optional"/> 1998-2002 Altova GmbH http://www.xmlspy.com Registered to Tiina Leppänen (TietoEnator Corp.) Page 3
E:\Toimitukset\Tekninen mallintaminen\versio 0.7\aineiston_metatiedot09.xsd 05/12/03 13:21:54 <xs:complextype name="basicdatesforgrouptype"> <xs:documentation xml:lang="fi">aikamääre (JHS143) </xs:documentation> <xs:all> <xs:element name="created" type="xs:date"/> <xs:element name="valid" type="narc:aikavälitype"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:complextype name="basicdatesforcasetype"> <xs:documentation xml:lang="fi">aikamääre (JHS143) </xs:documentation> <xs:all> <xs:element name="created" type="xs:date"/> <xs:element name="finished" type="xs:date"/> </xs:all> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:complextype name="additionaldates1type"> <xs:documentation xml:lang="fi">aikamääre (JHS143) Yhteisiä päivämääräkenttiä</xs:documentation> <xs:all minoccurs="0"> <xs:element name="issued" type="xs:date" minoccurs="0"/> <xs:element name="available" type="narc:aikavälitype" minoccurs="0"/> <xs:element name="acquired" type="xs:date" minoccurs="0"/> <xs:element name="modified" type="xs:date" minoccurs="0"/> <xs:element name="sent" type="xs:date" minoccurs="0"/> </xs:all> <xs:simpletype name="versiontype"> <xs:documentation xml:lang="fi">versio (JHS143)</xs:documentation> <xs:restriction base="xs:string"/> </xs:simpletype> <xs:simpletype name="sourcetype"> <xs:documentation xml:lang="fi">lähde (JHS143)</xs:documentation> <xs:restriction base="xs:string"/> </xs:simpletype> <xs:complextype name="relationforarchivetype"> <xs:documentation xml:lang="fi">suhde (JHS143)</xs:documentation> <xs:sequence> <xs:element name="replaces" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="isreplacedby" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="requires" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="isrequiredby" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="references" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="isreferencedby" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> </xs:sequence> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:complextype name="relationforgrouptype"> <xs:documentation xml:lang="fi">suhde (JHS143)</xs:documentation> <xs:sequence> <xs:element name="replaces" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="isreplacedby" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="haspart" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="ispartof" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="references" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="isreferencedby" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> </xs:sequence> <xs:attribute name="issecret" type="xs:idref" use="optional"/> <xs:complextype name="relationforcasetype"> <xs:documentation xml:lang="fi">suhde (JHS143)</xs:documentation> <xs:sequence> <xs:element name="references" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="isreferencedby" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> </xs:sequence> <xs:attribute name="issecret" type="xs:idref" use="optional"/> 1998-2002 Altova GmbH http://www.xmlspy.com Registered to Tiina Leppänen (TietoEnator Corp.) Page 4
E:\Toimitukset\Tekninen mallintaminen\versio 0.7\aineiston_metatiedot09.xsd 05/12/03 13:21:54 <xs:complextype name="relationfordoctype"> <xs:documentation xml:lang="fi">suhde (JHS143)</xs:documentation> <xs:complexcontent> <xs:extension base="narc:relationforarchivetype"> <xs:sequence> <xs:element name="haspart" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="ispartof" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="isformatof" type="xs:idref" minoccurs="0"/> <xs:element name="hasformat" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="isversionof" type="xs:idref" minoccurs="0"/> <xs:element name="hasversion" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> <xs:element name="isredactionof" type="xs:idref" minoccurs="0"/> <xs:element name="hasredaction" type="xs:idref" minoccurs="0" maxoccurs="unbounded"/> </xs:sequence> </xs:extension> </xs:complexcontent> <xs:simpletype name="rightstype"> <xs:documentation xml:lang="fi">oikeudet (JHS143)</xs:documentation> <xs:restriction base="xs:string"/> </xs:simpletype> <xs:complextype name="restrictiontype"> <xs:documentation xml:lang="fi">tietoon liittyvät salaus/julkisuussäännöt</xs:documentation> <xs:appinfo>sääntö: if (publicityclass!= "julkinen" ) lähes kaikki elementit pakollisia</xs:appinfo> <xs:sequence> <xs:element name="publicityclass" type="narc:publicityclasstype"> <xs:documentation xml:lang="fi">kohteen julkisuusaste</xs:documentation> <xs:element name="securityreason" minoccurs="0"> <xs:complextype> <xs:simplecontent> <xs:extension base="xs:string"> <xs:attribute name="issecret" type="xs:idref" use="optional"/> </xs:extension> </xs:simplecontent> <xs:element name="securityclass" minoccurs="0"> <xs:simpletype> <xs:restriction base="xs:int"> <xs:enumeration value="0"/> <xs:enumeration value="1"/> <xs:enumeration value="2"/> <xs:enumeration value="3"/> </xs:restriction> </xs:simpletype> <xs:element name="securityperiod" type="narc:aikavälitype" minoccurs="0"/> <xs:element name="securityperiodend" minoccurs="0"> <xs:complextype> <xs:simplecontent> <xs:extension base="xs:date"> <xs:attribute name="issecret" type="xs:idref" use="optional"/> </xs:extension> </xs:simplecontent> <xs:element name="personaldata"> <xs:simpletype> <xs:restriction base="xs:int"> <xs:enumeration value="0"/> <xs:enumeration value="1"/> <xs:enumeration value="2"/> </xs:restriction> </xs:simpletype> <xs:element name="person" type="narc:persontype" minoccurs="0" maxoccurs="unbounded"> <xs:documentation xml:lang="fi">henkilötietoja</xs:documentation> <xs:element name="owner" minoccurs="0"> <xs:documentation xml:lang="fi">julkisuustyyppiin liittyvä omistaja, jolla oikeus myöntää käyttöoikeuksia yms.</xs:documentation> 1998-2002 Altova GmbH http://www.xmlspy.com Registered to Tiina Leppänen (TietoEnator Corp.) Page 5