Maria Kallio Raportti Kansallisarkiston käyttäjäkyselystä koskien sähköisten tutkimuspalveluiden kehittämistä Helmikuussa 2016 julkaistun käyttäjäkyselyn tavoitteena oli kartoittaa tutkijoille sähköistyvästä tutkimusprosessista esiin nousevia tarpeita. Samalla tutkijoille annettiin mahdollisuus kertoa heidän toiveitaan digitoitavien aineistojen valinnasta. Käyttäjäkyselyssä oli kaikkiaan kahdeksan kysymystä, joiden tarkoituksena oli selvittää, minkälaisia haasteita digitoidut aineistot asettavat tutkimuksen tekemiselle ja toisaalta, minkälaisia työkaluja tutkijat kaipaavat näiden haasteiden selättämiseen. Kyselystä saatuja vastauksia tullaan hyödyntämään Kansallisarkiston sähköisten tutkimuspalveluiden kehittämisessä laajasti, mutta erityisesti Euroopan unionin rahoittaman READ (Recognition and Enrichment of Archival Documents) -hankkeen puitteissa. Kyselystä tiedotettiin Kansallisarkiston verkkosivujen lisäksi yliopistojen sähköpostilistoilla sekä sosiaalisessa mediassa. Kysely oli avoinna 11.2 31.3.2016. Käyttäjäkysely keräsi määräaikaan mennessä yhteensä 43 vastausta. Vajaa kolmasosa vastaajista oli sukututkijoita, kun taas eri tieteenalojen jatko-opiskelijoita, tutkijoita ja opetushenkilökuntaa vastaajista oli 65 %. Loput kyselyyn vastanneista olivat opiskelijoita. Yli 70 % vastaajista edusti historiatieteitä, kun taas yhteiskuntatieteilijöiden osuus oli 20 %. Yksittäisiä vastauksia olivat jättäneet myös arkeologian ja kielitieteiden tutkijat. Kysymykset ja vastaukset Käyttäjäkyselyn ensimmäinen kysymys koski digitoitujen aineistojen käyttöä ja valtaosa (88 %) vastaajista kertoikin hyödyntävänsä Kansallisarkiston digitaaliarkistoa tai muita digitoidun aineiston verkkopalveluita lähes päivittäin. Vain viisi tutkijaa vastasi käyttävänsä digitoituja aineistoja hyvin vähän tai ei ollenkaan. Suurin syy tähän oli se, että heidän tarvitsemaansa aineistoa ei yksinkertaisesti ole saatavilla digitaalisessa muodossa tai vastaavasti sen tutkimuskäyttö on digitaaliarkiston ominaisuuksien takia hankalaa. Kansallisarkisto Rauhankatu 17 PL 258, 00171 Helsinki Puh. Tel. 029 533 7000 kirjaamo@arkisto.fi Riksarkivet Fredsgatan 17 PB 258, 00171 Helsingfors Fax (09) 176 302 http://www.arkisto.fi
Toinen kysymys koski digitoitujen aineistojen tutkimuskäyttöä helpottavia tekijöitä. Vastauksista nousi selvästi esiin neljä erilaista tekijää. Lähes puolet vastaajista (18 kpl) nimesi hyödyllisimmäksi ominaisuudeksi erilaiset hakemistot. Hakemistoilla tarkoitettiin niin nimi- ja paikannimihakemistoja kuin erilaisia aineistokohtaisia sisältöhakemistojakin. Lähes yhtä moni vastaaja (14kpl) kaipasi digitoituihin aineistoihin monipuolisia hakutoimintoja, joiden avulla juuri heidän etsimänsä materiaali olisi helpommin paikannettavissa. Vastaajat kiinnittävät huomiota myös digitoitujen aineistojen saatavuuteen. Monen toiveena oli saada entistä kattavammin eri aikakausien aineistoja vapaaseen käyttöön. Myös riittävät metatiedot koettiin digitoitujen aineistojen tutkimuskäyttöä helpottavaksi tekijäksi. Käyttäjäkyselyn kolmannessa kysymyksessä tutkijat saivat nimetä erilaisia työkaluja joita he tällä hetkellä hyödyntävät digitoitujen aineistojen tutkimuksessa. Varsinaisia käytössä olevia työkaluja olivat tekstinlouhintaan tarkoitetut sovellukset sekä paikkatietoon ja georeferointiin tarkoitetut työkalut. Useimmat vastaajista nimesivät kuitenkin työkaluja, joita he haluaisivat hyödyntää ja näihin kuuluivat muun muassa erilaiset tekstintunnistustyökalut sekä interaktiiviset sanakirjat. Vastauksista kävi yllättävällä tavalla ilmi, että vain harvalla vastaajalla oli kokemusta sähköisten tutkimustyökalujen käytöstä tai edes tietoa niiden tuomista mahdollisuuksista.
Neljännessä kysymyksessä vastaajia pyydettiin nimeämään sellaisia aineistoja, joiden tutkimuksessa he haluaisivat hyödyntää sähköisiä työkaluja. 30 % vastaajista toivoi uudenlaisia apuvälineitä erityisesti digitoitujen oikeuslähteiden tutkimukseen. Moni näistä vastaajista kuvasi tutkimusprosessinsa olevan kuin neulan etsimistä heinäsuovasta, sillä yksittäisten tapausten etsiminen esimerkiksi tuomiokirjoista vaatii aina valtavien aineistomäärien läpikäymistä. Myös kirjeiden ja kuvien tutkimukseen kaivattiin työkaluja. Sukututkijoiden vastauksissa nousi esiin halu hyödyntää uutta teknologiaa kirkonkirjojen tulkitsemiseen. Viidennessä kysymyksessä tutkijat pääsivät nimeämään, minkälaisia työkaluja he toivoisivat omien aineistojensa tutkimukseen. Esimerkkeinä heille annettiin READ -hankkeessa kehitettävä HTR-sovellus eli käsinkirjoitetun tekstin koneellinen tunnistus sekä erilaiset tekstihakumahdollisuudet. Suurin osa vastaajista nimesikin juuri jommankumman näistä kahdesta vaihtoehdosta tekstihakumahdollisuuden ollessa hieman suositumpi. Kiinnostus automaattiseen käsinkirjoitetun tekstin tunnistamiseen on vastausten perusteella suuri. Tosin useampi vastaaja esitti samalla epäilyksensä kyseisen teknologian toimivuudesta. Muutama vastaaja oli kiinnostunut myös tietokoneavusteisen kuvantunnistuksen tuomista mahdollisuuksista.
READ:in HTR-sovellus täytyy toistaiseksi opettaa lukemaan jokaista käsialaa erikseen. Tämän vuoksi se tarvitsee puhtaaksikirjoitettua malliaineistoa oppiakseen tunnistamaan eri kirjoitustyylejä. Käyttäjäkyselyn kuudennessa kysymyksessä tutkijoilta kysyttiin olisivatko he valmiita tuottamaan tätä pohja-aineistoa joillakin edellytyksillä. Yläpuolella olevassa kaaviossa on nähtävissä valmiiksi annetut vaihtoehdot. Lähtökohtaisesti jokainen kysymykseen vastannut oli valmis puhtaaksikirjoitetun tekstin tuottamiseen, suurin osa heistä nimenomaan omien tutkimusaineistojensa osalta. Myös joukkoistamishankkeet ja tutkimusyhteistyö nähtiin mahdollisina vaihtoehtoina tekstin tuottamiseen. Seitsemännessä kysymyksessä kysyttiin tutkijoiden kiinnostusta omien tutkimusaineistojensa indeksointiin tai metatietojen rikastamiseen. Suhtautuminen sosiaalisen metadatan tuottamiseen oli hyvin myönteistä ja monissa vastauksessa nousi esiin sen tuomat hyödyt. Vastaajien mukaan toteutustavan täytyisi kuitenkin olla mahdollisimman yksinkertainen ja käytettävyyteen tulisi panostaa jo suunnitteluvaiheessa. Yksi kielteisen vastauksen antaneista tutkijoista muistutti, että tämänkaltaisesta työstä ei akateemisessa maailmassa valitettavasti saa tunnustusta.
Käyttäjäkyselyn kahdeksas ja viimeinen kysymys antoi tutkijoille mahdollisuuden nimetä aineistoja, joita he erityisesti toivoisivat saataville Digitaaliarkistoon. Yllättävän moni vastaaja toivoi sanomalehtiaineistoja, joiden säilyttäminen on ensisijaisesti kirjastojen vastuulla. Useat vastaajat mainitsivatkin käyttävänsä Kansalliskirjaston digitaalista sanomalehtiarkistoa säännöllisesti. Suurimman osuuden kaikista vastauksista veivät kuitenkin seurakuntien arkistot ja niistä erityisesti kirkonkirjat. Vastaajien toivomuksena oli, että käyttörajoituksen piiristä vapautunutta aineistoa saataisiin entistä nopeammin digitaaliseen muotoon. Seuraavaksi eniten Digitaaliarkistoon toivottiin yksityisaineistoja, kuten päiväkirjoja ja kirjeitä. Perusteluna tähän oli muun muassa historiantutkimuksen nykysuuntaus, jossa tutkijoiden kiinnostus kohdistuu entistä useammin arjen ilmiöihin. Edellä mainittujen lisäksi erilaiset lähihistorian viranomaisaineistot, kartat sekä perukirjat saivat yksittäisiä mainintoja. Moni vastaajista oli kiinnostunut saamaan myös Ruotsissa säilytettäviä aineistoja Kansallisarkiston Digitaaliarkistoon. Yhteenveto Kansallisarkiston sähköisten tutkimuspalveluiden kehittämistä koskevan käyttäjäkyselyn keräämät vastaukset valottavat historian ja yhteiskunnallisen tutkimuksen lähdeaineistoihin kohdistuvia haasteita. Vastauksista käy ilmi, että digitoituja aineistoja on tarjolla hyvin, mutta niiden analysointiin on tällä
hetkellä tarjolla vain rajallisesti apuvälineitä. Myös tutkimusaiheet ovat muuttuneet ja yhä useammin kiinnostuksen kohteena ovat ihmisten arkeen tai lähihistoriaan liittyvät ilmiöt. Uudenlaiset lähestymistavat ja uuden teknologian tuomat mahdollisuudet asettavat uusia vaatimuksia koko tutkimusprosessille. Tähän saakka tietokoneavusteinen tutkimus on tarjonnut työkaluja ensisijaisesti painettujen lähteiden analysointiin. Kansallisarkiston pyrkimyksenä on yhteistyössä READ -hankkeen kanssa kehittää vastaavia työkaluja myös käsinkirjoitettujen aineistojen tutkimukseen ja edistää näin digitoitujen aineistojen tutkimuskäyttöä. Uudet digitaaliset tutkimustyökalut on tarkoitus integroida osaksi Kansallisarkiston sähköisiä palveluita, jolloin ne toivottavasti vastaavat paremmin tutkijoiden esiin nostamiin tarpeisiin.