Tutkimusdatan arkistointi ja jatkokäyttö ARJA KUULA TUTKIMUSAINEISTOJEN JATKOKÄYTTÖ JA TIETOSUOJA 21.11.2013 HELSINGIN YLIOPISTO
2 Esityksen sisältö Tietoarkisto Käsiteltävät aineistot Tietoarkiston tietosuojakäytännöt Arkistoinnissa Jatkokäytön hallinnoimisessa Tulevaisuuden haasteet
Yhteiskuntatieteellinen tietoarkisto www.fsd.uta.fi Yhteiskuntatieteellinen tietoarkisto Suomi on CESSDA-ERIC jäsen (Council of European Social Science Data Archives) Suomen Akatemia Valtakunnallinen neuvottelukunta Opetus- ja kulttuuriministeriö Tietoarkiston johtaja Tampereen yliopiston rehtori Fi Suomalaiset yliopistot ja tutkimusorganisaatiot Projektirahoitus Perusrahoitus Kansallinen palvelutehtävä Kansainvälinen tiedeyhteisö 3
4 Tietoarkiston aineistot Tutkimustarkoituksiin kerättyjä Numeerisia Tallennettu havantomatriisiksi Valtaosa posti-, puhelin- tai käyntikyselyjä, mutta havaintoyksikkö voi olla muutakin kuin henkilö Laadullisia Puhetta, kuvaa tai tekstiä sähköisenä tallenteena
5 Suostumuksella kerättävät aineistot Itsemääräämisoikeuden toteuttaminen ja yksityisyyden säätely kahdessa vaiheessa Osallistumispäätös: kyllä tai ei Vapaaehtoisuus tutkimuksen aikana - Tietojen suodattaminen - Vastaamasta kieltäytyminen
Yhteiskuntatieteellinen tietoarkisto www.fsd.uta.fi Seulonnasta EHTO 1: Aineistolle tunnistetaan jatkokäyttöarvo Kaikki sähköinen aineisto ei ole pitkäaikaissäilyttämisen arvoista! EHTO 2: Aineistojen tietosisältö on järjestyksessä ja sitä kuvaileva muu materiaali on riittävä jatkokäyttöön tarkoitetun aineiston käyttöversion prosessoimiseksi ja metadatan luomiseksi. Muuttujien selitteet, aineisto keruuaika, kohderyhmä, otanta, keruuinstrumentti (lomake, haastattelukysymykset tms.) jne. EHTO 3: Jos tarpeen anonymisoida, tunnisteiden poisto ei saa olla liian työlästä, eikä poistot/muokkaus saa vähentää oleellisesti aineiston käyttöarvoa Toisinaan jatkokäytettävissä olevan aineiston edellyttämä anonymisointi veisi liikaa resursseja tai tekisi aineiston käyttökelvottomaksi 6
7 Seulonta tietosuojan näkökulmasta,vaihtoehdot 1. Tutkittavat ovat alun alkaen suostuneet heitä koskevien tietojensa arkistointiin Mihin arkistoidaan Mitkä tunnisteet säilytetään arkistoitavan datan yhteydessä Miten jatkokäyttö hallinnoidaan 2. Tutkittavilta pyydetään jälkikäteen suostumusta arkistointiin 3. Aineisto anonymisoidaan 4. Tutkija hakee Kansallisarkistolta lupaa tunnisteellisen aineiston arkistointiin
8
9 Juomatapatutkimus 2008
10 Lupa arkistointiin jälkikäteen Kysytty viiden laadullisen aineiston tutkittavilta jälkikäteen lupaa arkistointiin Seitsemän 238:sta tutkittavasta on kieltänyt heitä koskevien tietojensa arkistoinnin jatkokäyttöön Tutkittavat korostivat halunneensa alun alkaen edesauttaa tutkimusta ja arkistointi jatkokäyttöön vain vahvisti alkuperäisen toiveen toteutumista
11 Anonymisoinnin suunnittelu Mitä aineiston käsittelystä ja tunnisteista sanotaan tutkittavien informoinnissa Mitkä tunnisteet ovat välttämättömiä aineiston ymmärtämisessä ja analyysissä Aineiston sisältö, aihepiiri Taustamuuttujien, taustatietojen määrä ja tarkkuus
12 Kvantitatiivisten aineistojen anonymisointi Muuttujan poistaminen Muuttujan saamien arvojen uudelleen luokittelu Muuttujan saamien ääriarvojen luokittelu Tunnisteiden poistaminen avointen kysymysten vastauksista
13 Kvalitatiivisen aineiston anonymisointi Henkilönimien, muiden erisnimien ja paikkatietojen muuttaminen Vilho Timo, Liisa [vaimo], Pizpala -> [grillikioski], meillä Käpylässä meillä [kaupunginosassa] Arkaluonteisten tietojen harkinnanvarainen poistaminen tai muuttaminen Taustatietojen luokittelu kategorioihin
14 Luokitellut taustatiedot
15
16 Uusi aineistoportaali Aila Käyttöönotto alkuvuodesta 2014 Aineistojen hakeminen, kuvailutietoihin tutustuminen, lataaminen Tukeutuu HAKA-käyttäjätunnistusjärjestelmään (suomalaiset korkeakoulut) Muualta tuleville asiakkaille tarjotaan vaihtoehtoinen käyttäjätunnistusjärjestelmä
17 Aineistojen toimitus jatkokäyttöön 7.1.2014 alkaen asiakas voi ladata verkosta aineistoja käyttöönsä aineistokohtaisten käyttöehtojen mukaisesti: 1. Vapaasti käytettävät aineistot: lataaminen edellyttää käyttäjältä vain toimivaa sähköpostiosoitetta. 2. Tutkimukseen, opetukseen ja opiskeluun käytettävät aineistot: lataaminen edellyttää Ailan asiakkaaksi kirjautumista. 3. Tutkimukseen ja ylempiin opinnäytteisiin käytettävät aineistot: lataaminen edellyttää Ailan asiakkaaksi kirjautumista. 4. Luvanvaraiset aineistot: lataaminen edellyttää Ailan asiakkaaksi kirjautumista ja luvan saamista aineiston tekijöiltä. Tietoarkiston asiakaspalvelu hoitaa lupapyyntöjen käsittelyn.
18 Ailan käyttöehdoista Asiakkaalle myönnetty käyttäjätunnus ja salasana ovat henkilökohtaisia. Asiakas ei saa luovuttaa käyttäjätunnusta ja salasanaa kenellekään ja hänen on vastattava siitä, etteivät käyttäjätunnus ja salasana joudu ulkopuolisten tietoon. Asiakas hyväksyy itseään sitoviksi kaikki toimenpiteet, jotka hänen tunnuksillaan on tehty. Tietoarkistolla on oikeus sulkea käyttöehtoja rikkoneen asiakkaan käyttäjätili. Mikäli asiakas käyttää aineistoa käyttöehtojen tai ilmoittamansa aineiston käyttötarkoituksen vastaisesti, tietoarkistolla on oikeus ilmoittaa väärinkäytöstä aineiston tekijöille, asiakkaan organisaatiolle ja tutkimusrahoittajalle.
19 Aineistojen yleiset käyttöehdot
20 Tulevaisuuden haasteita Millainen on pätevä suostumus aineiston arkistoinnille tunnistetietoineen? Aineistojen keruutavat muuttuvat Internet, puhelimet, yhä enemmän av-dataa Missä menevät tutkittavien itsemääräämisoikeuden rajat? Useat eivät halua tunnistettavuuden poistamista