Unelmat ja todellisuus: saatavuus ja säilyminen Osmo Palonen Mikkelin Ammattikorkeakoulu
Sisältö 1. Esipuhe: Mamk ja minä 2. Taustaa: Organisoitua tiedonhallintaa 3. Missä ovat lähteet? 4. Unelmat ja todellisuus 5. Lopuksi
Miksi Mikkelin Ammattikorkeakoulu? Mikkeli on historiallisen tiedonhallinnan keskittymä: Elka, Kansalliskirjasto, Maakunta-arkisto Mikkelissä tehdään merkittävää sähköisen tiedonhallinnan ja digitoinnin tuotantoa ja kehittämistä: Mamk, KK Mamk on toiminut sähköisen tiedonhallinnan, arkistoinnin kehittämistoiminnassa 1990-luvun lopulta Projekteja 2002-2013 esim. OSA (http://osarchive.wordpress.com) Viva3 (http://www.mamk.fi/viva3) Palveluliiketoimintaa: Disec Oy, Darcmedia
35 vuotta sähköistä tiedonhallintaa Osmo Palonen Yli 10 vuotta sähköistä arkistointia: Projektipäällikkö, Mikkelin Ammattikorkeakoulu 2003-16 vuotta journalismia Pyhäjokiseudusta Aamulehteen 14 vuotta kirjapainoautomaatiota Ahlström & Honeywell Sähköistä tiedonhallintaa vuodesta 1978 Lukiota 30 vuoden välein, yo 2002 Varkauden aikuislukio Tampereen yliopisto: historia, IT: HuK 2008, FM 2011, Faktori- ja keskijohdon tutkinto 1988 (MI, AEL) Liikearkistoyhdistys pj 2012, Failin päätoimittaja 2007 -
Organisoitua tiedonhallintaa?
30-vuotinen tiedon vallankumous Tietokoneet yleisesti tiedon tuottamiseen 1980-luvulta Sihteerit katosivat 1990-luvulla, tieto luojan haltuun Sähköinen prosessi ovat muuttaneet tiedon hallinnan ja välityksen täysin ainakin yksityissektorilla Aineiston järjestäminen vasta arkistossa erittäin hankalaa Tieto on kerättävä prosesseissa, malleissa ja säännöissä On tiedettävä mitä aineisto sisältää ja mihin se liittyy Ilman metatietoa tieto on useimmiten arvotonta ei säilytetä Arvokkaaksi arvioitua voidaan yrittää IT-arkeologialla Yhteys IT-rikostutkinnan ja paperiarkiston menetelmiin
Asiakirjahallinnan kehityskulkuja Suomalaisen asiakirjakäsitteen lähtökohta valtio ja kunta Asiakirjan käsite: asia asiakirja = viranomaisen paperille kirjoittama asian käsittelyyn liittyvä prosessin tallenne Käsite laajentunut kahdella tasolla: Myös muiden kuin viranomaisten toiminnassa syntynyt tallenne: Voi olla esimerkiksi yritysten välinen sopimus Muussakin kuin viranomaisprosessissa syntynyt Myös muut kuin paperille kirjoitetut asian käsittelyyn liittyvät tallenteet jopa sähköiset Esimerkiksi palvelun tai tuotteen esite, esittelyvideo, valokuva Myös sähköposti, tekstiviesti tai verkkosivulta tuotettu ilmoittautuminen tai verkkokaupan hankinta
Vai onko kaikki liian myöhäistä? Kansainvälinen keskustelu: toimivatko asiankäsittelyjärjestelmät enää nykyisessä todellisuudessa Arkistonhoitajien murhe: kuinka tallennetaan twiitit, facebookseinät, blogit ja verkkosivut? Edes sähköposteista ei ole syntynyt toimivaa tallennustapaa Professorin neljä eri sukupolven mac-konetta, joissa eudora jne. posteja Kuinka moni viranomaistehtävää hoitava tallettaa asiakirjaksi luokittelemansa sähköpostit asiankäsittelyjärjestelmään Voitaisiinko yksityispostit erottaa kokonaan työposteista Entä tekstiviestit? Kuinka usein organisaatio tallettaa verkkosivunsa?
Byrokraatit ja jälkien metsästäjät Asiakirjahallinnan tehtävänä on tallentaa eheää, aitoa ja todistusvoimaista aineistoa hallinnon toteuttamiseksi Tieto siitä että Osmo Palonen kirjautui ensimmäisen kerran Tampereen yliopistoon syyslk. 1970 oli säilynyt vuoteen 2002 Asiakirjahallinnan keskeinen tehtävä on varmistaa hallinnon läpinäkyvyys ja toimia kansalaisten kontrollin välineenä Obaman aloite asiakirjahallinnan uudistamiseksi Asiakirjahallinnan avulla voidaan tallentaa organisaation historiaa niin että sen toimintaa voidaan arvioida ja esittää Historian tallentaminen historiamarkkinointi Pääosa tallennetusta tiedosta on akh:n kannalta järjestämätöntä Capture Client Digital Forensics ja Bit Curator
Missä ovat lähteet?
Historiankirjoituksen muutos Leopold von Ranke Wie es eigentlich gewesen ist - enää vain naiivi historiakäsitys Historia on tutkijan näkemys siitä mitä lähteet hänelle kertovat Historian painotuksen ja arvotuksen tekee tutkija suurmiesten historia ei riitä; maailmasta halutaan laajempi tai erilainen kuva Arjen historia, mikrohistoria, kansalaisyhteiskunnan historia Valtakunnallisesti merkittävä päätöksentekoaineisto ei riitä yksityisarkistojenkaan säilyttämisen periaatteeksi Lähteistä myös ulkopuolisten arvioiden merkitys kasvaa jos organisaatioiden toiminnasta ei jää muita kuin virallisia jälkiä Kirjeenvaihtoa korvaamaan haastattelut ja muut tallenteet
Just google it! Lähteiden saatavuus muokkaa tutkimusta Maisterin gradu täytyy saada valmiiksi ja olla kompakti Aiheen rajaus: ongelma sanomalehtiaineiston perusteella Nimeke: Iskelmä muuttuu muuttumatta - Suomalaisen iskelmän rakentuminen Iskelmä Finlandia -palkinnosta julkaistuissa lehtiartikkeleissa ongelma internetin keskustelupalstojen perusteella Nimeke: "KAMALA RISTIKUULUSTELU" Keskustelupalstoilla kerrottuja kokemuksia lastensuojelun puuttumisesta perheen elämään Vuosi: 2013 Tyyppi: Pro gradu Gradun aiheet Elävästä Arkistosta Last but not least: keskiaikalähteetkin on digitoitu
Mitä lähteitä graduissa käytetään? Ville Heinonen: Mustaa keltaisella - Ulkomaalaiset surmaajat iltapäivälehtien etusivujen julkisuudessa ja henkirikostilastoissa 1994 2010 Pro gradu -tutkielma Tampereen Yliopisto Viestinnän, median ja teatterin yksikkö Lokakuu 2013 35 paperilähdettä 10 verkkolähdettä Rantasila Anna: Tarrautuvat tunteet. Japanin kolmoiskatastrofin affektiivinen kerronnallistaminen YLE:n tvuutisissa. Pro gradu -tutkielma Tampereen Yliopisto Viestinnän, median ja teatterin yksikkö Marraskuu 2013 Artikkelit ja kirjat 6 sivua Elektroniset lähteet 2,5 sivua
Mitä lähteitä graduissa käytetään? 2 Riitta Koivisto: Adam Smith -ongelma Filosofian pro gradu -tutkielma Tampereen yliopisto Yhteiskunta- ja kulttuuritieteiden yksikkö Marraskuu 2012 9,5 sivua kirjoja 0 sivua elektronisia lähteitä Maria Sällilä: Aikuisten täytyy puuttua eikä vain seisoo! Tamperelaisten tukioppilaskoulutuksessa olevien nuorten kokemuksia koulukiusaamisesta ja siihen puuttumisesta Nuorisotyön ja nuorisotutkimuksen pro gradu -tutkielma Tampereen yliopisto Yhteiskunta- ja kulttuuritieteiden yksikkö Toukokuu 2011 Paperilähteet 5 sivua Elektroniset lähteet 3 sivua
Mitä lähteitä graduissa käytetään? 3 Palosen gradu: Poliittinen tehdas 2011 Kemijärven sellutehtaalle asetetut tavoitteet ja niiden toteutuminen (lähinnä 1945-1970) Arkistot: ELKA: Kemijärven SA, myös leikearkisto, josta käytetty 10 sanomalehden aineistoa; Suomen Selluloosayhdistyksen Arkisto Kemij.KA, Kj tilallisten yhteismetsän ark, Kj metsänhoitoyhd. Ark, Lapin Kansan arkisto Keskustan ja Maaseudun A, Eduskunnan A: VPA, KoM Sähköiset: Päivälehden Arkisto (Helsingin Sanomat) Verkkopalvelut 10 palvelua mm. Ylen Elävä Arkisto, valtioneuvosto, Paperiliitto, Tilastokeskus, Julkaistut: tutk.kirj. 12, muu kirj. 16, julkaisemattomat 1 nimikettä Haastattelut: 2 kpl
Yliopistohistorioita 1 Pohjolan Alma Mater (Oulun Yliopisto) 2003, 735 s. Arkistolähteet: 2 sivua Eduskunnan arkisto: Sivistysvaliokunnan ptk. 1948-1978 4 puoluearkistoa lähinnä 1947-58, ekr, ph, Oulun piiri Kansallisarkisto: KkA, OPMA, VNA VNA, OPMA, Korkeakouluneuvoston arkisto, OMA, OYA, SAA, Tilastokeskus. TyöminA, UKKA Painetut lähteet: 3,5 sivua Tilastojulkaisut, ulkom. Tilastojulkaisut, asetuskok, VPAsiak. 1 sivu Komiteamietinnot, korkeakoululaitoksen kehitt.suunnitelmat 3 sivua Toiminta- ja vuosikertomukset 9 organisaatiota Lehdet 8 + 14 nimikettä Haastattelut: 18 (aiempaa) +15 uutta Hakuteokset ja käsikirjat: 12 nimikettä Sähköiset lähteet: 1 sivu Kirjallisuus: 25 sivua
Yliopistohistorioita 2 Pohjoisen puolesta (Lapin Yliopisto) 2009, 487 s. Painamattomat lähteet: 3 sivua LyA, LKKSTA, LKSA, LY-SRA, ERA, SKA, KTKA, OTKA, TTKA, YTKA, KMTA, LYKA, LYTKA, LYYA, LaY amm.osa OMA: Kjärven SemA, RKA: kh, kv, Lkk, ArkK, TSaloa, Akja, OYA OPMA, EA Painetut lähteet: 3 sivua Tilastot 15 nimikettä Virallisjulkaisut: asetuskok, VPAsiak. (ilman aikamääritystä) Komiteamietinnot 15, korkeakoululaitoksen kehitt.suunnitelmat 12 Opinto-oppaat yt.osaston 1984-1991 Toiminta- ja vuosikertomukset 3 organisaatiota Sanoma- ja aikakauslehdet 26, hakuteokset ja käsikirjat: 1 nimike Haastattelut: 29, tiedonannot 7, kysely 18 hlöä Sähköiset lähteet: 4 sivua Kirjallisuus: 7 sivua
Unelmat ja todellisuus
Kaikki tieto on saatavilla vai onko sittenkään Unelma: Maailmassa tuotetaan yhä enemmän tietoa, joka on tarjolla sitä tarvitseville helposti ja älykkäilla hakumenetelmillä Todellisuus: tieto on jakautuneena järjestelmiin, joista ei sitä joko saa tai voi yhdistää mihinkään tapahtumaan tai muuhun aineistoon Aineistot ovat sidonnaisia järjestelmiin, kun järjestelmä poistuu, katoavat tiedotkin Kirjeenvaihdosta sähköposteihin paljonko teidän sähköposteistanne on tutkijoiden käytössä 2051? Missä facebook-sivut ovat vuonna 2035? Vai onko edessä keskiajan kirjojen kohtalo: biteistä ei voi tehdä tilikirjan kansia
Mitä voit löytää Suvun tietoa: Salomon Salomoninpoika Siltaloppi 23.11.1879 http://digi.narc.fi/digi/search.ka https://astia.narc.fi/astiaui/search.php?haku_list=&query=siltaloppi&startdate=1843&enddate=1901&recordscreator=ilmajoen+seurakunta&location=&classification=&hakutyyppi=normal www.google.fi Muuta tietoa: http://www.europeana.eu/ Suomalaista tietoa https://www.finna.fi/ Kanadasta: http://www.collectionscanada.gc.ca/lac-bac/search/all USA: http://www.archives.gov/
Tietojärjestelmät ja pitkäaikaissäilytys Tiedon säilyttämisen tarpeet otetaan yhdeksi lähtökohdaksi: Käytetään avoimia standardeja tiedon hallinnassa, vastaanotossa ja siirtämisessä muihin järjestelmiin Kansainvälisten (kansallisten) standardien ja vaatimusten mukaisuus Aineiston muutosten ja käytön (jos tarpeen) jälkien rekisteröinti Mahdollisuus siirtää koko tai valittu aineisto eheänä ja aitona Vaatimusmäärittelyssä pidetään lähtökohdista kiinni; etsitään tavat toteuttaa vaadittavat ominaisuudet kustannustehokkaasti Järjestelmän toimintaperiaatteiden, käyttötarkoituksen ja -ympäristön dokumentointi Järjestelmän käytön hallitun päättymisen ennakoiminen
Hyväksytyt säilytystiedostomuodot* Teksti Electronic Publications (EPUB) Extensible Hypertext Markup Language (XHTML) Ääni Audio Interchange File Format (AIFF), PCM-koodattu Broadcast Wave Format (BWF) Extensible Markup Language (XML) Hypertext Markup Language (HTML) Open Document Format (ODF) PDF for long-term preservation: PDF-Archive (PDF/A) Tekstitiedosto (Plain text) Free Lossless Audio Codec (FLAC) MPEG-4 AAC Advanced Audio Coding (AAC) Waveform Audio Format (WAV) Elävä kuva: Motion JPEG 2000 * = KDK:ssa hyväksytyt http://www.kdk.fi/images/stories/tiedostot/kdk-pas-tiedostomuodot.pdf
Hyväksytyt säilytystiedostomuodot* Kuva: Joint Photographic Experts Group (JPEG) Mamk:n Viva3 suositus: Paikkatiedot Inspire-direktiivin mukaisesti Joint Photographic Experts Group JPEG 2000 (JP2) Tagged Image File Format (TIFF) Verkkoarkisto: Web ARChive Format (WARC) Tietokannat: Määritys myöhemmin Yleistä: Arviointi jatkuva prosessi 2D- ja 3D- suunnitteluaineistolle ei vielä ole määritystä säilytysmuodoksi, vain yleisiä siirtomuotoja: STEP ja Wavefront OBJ 3D-jakelumuotoja: X3D, HTML5, 3D-PDF Laserkeilauksen pistepilviaineiston standardiksi muodostumassa LAS, josta standardoitu versio 1.3, prosessissa versio 1.4
Australialainen muistilista https://www.nla.gov.au/preserve/digipres/ (ei enää käytössä) Digitaalisten kokoelmien pitkäaikaissäilyttämisen kriittiset elementit Vaikuta siihen, miten sähköisiä aineistoja luodaan ja hallitaan ennen arkistointia: formaatit standardin mukaisina, identifiointi, metatieto Hyvä päätöksenteko: mitä talletetaan ymmärtäen mitkä tavoitteet materiaalin osalta saavutettava Varmistaa, että tavoitteiden saavuttaminen mahdollista lakia noudattaen Siirtää tiedostot menestyksekkäästi varmaan säilytyspaikkaan Yksilöidä ja kuvailla aineistot, että ne voidaan löytää, hallita ja näyttää Hallita arkistointi ja säilytysohjelma/prosessi Hallita data niin että se on turvassa Varmistaa että on olemassa toteuttamiskelpoisia keinoja saatavuuden turvaamiselle
Kauanko on kauan? n. 5000 eaa
Lopuksi Unelma omalle koneelle saavutettavissa olevasta kaikesta tiedosta ei varmaankaan toteudu koskaan Mitä enemmän aineistoa voi työekonomian kannalta hallita, sen parempia tuloksia on mahdollista saada esim. USA:n ja UK:n ulkoasiainaineisto Sähköisen aineiston suurin ongelma on säilyminen, toiseksi suurin ongelma tiedon ja huuhaa-tiedon sekoittuminen Aineiston saatavuus ja säilyttäminen sukupolvelta toiselle on tehtävä, jonka kaltaista ei ole tainnut ennen tätä aikaa olla Digital dark age voi syntyä myös siksi, että aineistoa valitaan tämän hetken näkökulmasta ja säilytetään vääriä asioita toisaalta sattumalla on aina ollut suuri osuus
Kiitos mielenkiinnosta! http://www.mamk.fi/palvelut/digitointi-_ja_arkistointipalvelut osmo.palonen@mamk.fi