Kvantitatiivisen aineiston anonymisointikeinot. Eliisa Haanpää, Tietoarkisto Tutkimusaineistojen anonymisointi -seminaari 5.4.

Samankaltaiset tiedostot
KVANTITATIIVNEN DATA JA SEN AVAAMINEN. Eliisa Haanpää, Tietoarkisto Metodifestivaali, Jyväskylä

Aineistoesimerkit kvantitatiiviset aineistot. Eliisa Haanpää, Tietoarkisto Tutkimusaineistojen anonymisointi -seminaari 5.4.

Tutkimuksen aineistonhallinnan eettisiä ulottuvuuksia. Tutkimusetiikkaseminaari, Tampereen yliopisto Arja Kuula-Luumi

Kvalitatiivisen aineiston anonymisointikeinot. Katja Fält Tampereen yliopisto

Tutkimusdatan arkistointi ja jatkokäyttö ARJA KUULA TUTKIMUSAINEISTOJEN JATKOKÄYTTÖ JA TIETOSUOJA HELSINGIN YLIOPISTO

KVANTITATIIVISEN TUTKIMUSAINEISTON KUVAILU

Tietosuoja tutkimuksessa. Arja Kuula-Luumi (Tietoarkisto) Tutkimusaineistojen anonymisointi -seminaari Tampereen yliopisto

Henkilötietoja sisältävän datan käsittely ja avaaminen TIETOSUOJA TUTKIJAN ARJESSA HY ARJA KUULA-LUUMI

Tietoarkisto palveluksessanne. Avoin tutkimusdata ja aineistonhallinta ihmistieteissä Hannele Keckman-Koivuniemi

Palveluportaali Ailan käyttö

TUTKIMUSDATAN KUVAILU. Kuvailun tiedotuspäivä Tieteenala-asiantuntija, FT Katja Fält

Tietoarkiston palvelut ja arkistointiprosessi. Annaleena Okuloff Tieteenala-asiantuntija

Aineistonhallinta ARJA KUULA-LUUMI ALAIKÄISIIN KOHDISTUVAN TUTKIMUKSEN ETIIKKAA -SEMINAARI TUTKIMUSEETTINEN NEUVOTTELUKUNTA, HELSINKI

Tietoarkiston palvelut. Arja Kuula-Luumi (Tietoarkisto) Tieteelliset lehdet ja tutkimusdata seminaari Tieteiden talo, Helsinki

Arvokas arkaluonteinen tutkimusaineisto. Annaleena Okuloff Terveystieteiden tieteenala-asiantuntija

Kvalitatiivisen datan avaaminen. Tieteenala-asiantuntija, FT Katja Fält Metodifestivaalit

Tutkittavien informointi. Antti Ketola & Arja Kuula-Luumi

Menetelmät tietosuojan toteutumisen tukena - käytännön esimerkkejä. Tilastoaineistot tutkijan työvälineenä - mahdollisuudet ja rajat 2.3.

TAMPEREEN YLIOPISTOSTA VALMISTUNEIDEN SIJOITTUMISSEURANTA -AINEISTOSARJAN ANONYMISOINTISUUNNITELMA

Lapset ja nuoret tietoarkistossa Tampereen yliopisto helena.laaksonen (at) uta.fi

Juomatapatutkimus ja muut alkoholiaineistot tietoarkistossa

Haastatteluun osallistuneet N:30

Ympäristötutkimuksen aineistoja tietoarkistossa

Terveystieteellisten aineistojen erityispiirteitä. Annaleena Okuloff

Jäsenrekisteri tietosuoja-asetus ja henkilötietolaki

Mitä Ihmettä on Tietoarkisto?

WORKSPACE OY REKISTERISELOSTEET

Miten tutkimuksen tietovarannot liittyvät etiikkaan ja viestintään? Tutkimusaineiston elinkaari

KAUPUNKIKUVATUTKIMUS 2017 Hämeenlinnan kaupunki. Etta Partanen Meiju Ahomäki Tiina Müller

Tietosuoja-asetus Tietoarkiston näkökulmasta. Aila ja aineistojen jatkokäyttö -seminaari Arja Kuula-Luumi Kehittämispäällikkö

FSD3028. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

MISTÄ RAKENTUU SEUTUKAUPUNKIEN VETOVOIMAISUUS? Seutukaupunkien vetovoimatutkimus 2019 Kaupunkikohtainen raportti: Kaskinen

Liite A: Kyselylomake

TUTKIMUSLUPAHAKEMUS. Sosiaali- ja terveystoimi 1 (5) 1 TUTKIMUSLUVAN HAKIJA Nimi. Osoite. Tutkimuslaitos, oppilaitos tai muu organisaatio

SELVITYS PRO GRADUJEN KÄYTÖSTÄ TAIDEKIRJASTOSSA

Hyväksyttekö, että lehdellä on julkihomo tai -lesbo päätoimittaja?

JHL:n jäsenkysely lastenhoitajien koulutustarpeista

Tutkimusaineiston hallinta. Annaleena Okuloff Terveystieteiden tieteenala-asiantuntija

FSD2511. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

Aineistonhallinta pähkinänkuoressa METODIFESTARIT TAMPEREEN YLIOPISTO ARJA KUULA-LUUMI

Yhteistyöstänne etukäteen kiittäen

Tietoarkisto on FAIR. Avoimen tieteen kevätpäivät 2019 Tampere Hannele Keckman-Koivuniemi tietopalvelupäällikkö

Pro gradu - tutkielma. Kasvatustieteiden tiedekunta, Oulun yliopisto KT HANNU Heikkinen

Miksi tutkimusaineistoja halutaan avattavan? Jyrki Hakapää, Suomen Akatemia

KYSELYTUTKIMUS MUISTISAIRAAN PUOLISON MENETTÄNEELLE. Hyvä vastaaja!

Avoin toimintakulttuuri. SotePeda 7/24 Hanna Lahtinen

.eu-verkkotunnusta koskevat WHOIS-toimintalinjat

KYSELYLOMAKE: FSD3189 TIEDON JA YHTEISKUNNALLISEN PÄÄTÖKSENTEON VUORO- VAIKUTUS 2017

FSD1256 Masennuskysely 2002 FSD1293 Kokemukset masennuksen hoidosta ja toipumisesta 2002 FSD1296 Elämä masentuneena 2002

KVANTITATIIVINEN TUTKIMUS

Tampereen kaupungin www-palvelun käyttäjäkysely

Järjestöt mukana muutoksessa -ohjelma Maakunnallisten Järjestö 2.0 -hankkeiden lähtötilanteen kartoitus ja yleisten tavoitteiden seurantakysely

Rekisterinpitäjä. Rekisteriasioista vastaava yhteyshenkilö. Rekisterin nimi. Rekisterin käyttötarkoitus. Rekisterin tietosisältö

Tutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen

Yleisimmät joukkoviestimet tutkimusta ja tiedettä koskevan tiedon välittäjinä suomalaisille

Keski-Suomen vaikuttavat järjestöt

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja

Valmiudet sote- ja maakuntauudistukseen

Suomalaisten näkemyksiä matkailusta

Koulutus ensisaapumistoimijoille Kuukausi-ilmoitukset Kirsi Sarkkinen

Mittariston laatiminen laatutyöhön

Tutkimusdata. Tutkijat verkoilla kurssi Helsingin yliopisto

Usein kysyttyjä kysymyksiä tietosuojasta

TIETOSUOJAILMOITUS TUTKIMUKSESTA TUTKIMUKSEEN OSALLISTUVALLE

Webropol-kyselyt. Tarja Heikkilä

Ailan käyttö ja aineistovarannot

Kvantitatiiviset menetelmät

Aluenopeusrajoituksen muutos ja liikenteen rauhoittamistoimenpiteet Kissanmaalla, Takahuhdissa, yms-kyselyn vastausten koonti

Muuttujien määrittely

KYSELYN JULKAISEMINEN JA VASTAUSTEN KERÄÄMINEN

Yhteenveto Kansalliskielistrategia-hankkeen kyselystä: Kuinka käytät kansalliskieliäsi?

Kysely sosiaalityö pääaineena vuosina valmistuneille

Mielipiteitä meistä ja vesivoimasta. Sidosryhmätutkimus 2015

KYSELYLOMAKE: FSD2925 KUNTIEN VALTUUSTOJEN JA HALLITUSTEN JÄSENET 2009 QUESTIONNAIRE: FSD2925 MEMBERS OF MUNICIPAL COUNCILS AND MUNICIPAL BOARDS 2009

Lapset ja nuoret tietoarkistossa Tampereen yliopisto helena.laaksonen (at) uta.fi

Rastita se vaihtoehto, joka parhaiten kuvaa omaa mielipidettä asiasta

LAADULLISEN TUTKIMUKSEN OMINAISLAATU

Valtuutetut: Kunnan elinvoimaisuuden kehittäminen on kunnan tärkein tehtävä, palvelujen tuottaminen listan viimeisenä

Aluenopeusrajoituksen muutos ja liikenteen rauhoittamistoimenpiteet Viinikassan Nekalassa, yms-kyselyn vastausten koonti

PALAUTEKYSELY RYHMÄN PÄÄTYTTYÄ

OHJE TESTIAINEISTON ANONYMISOINNISTA

Q1 Olen. Koulutuskysely kevät / 47. Answered: 2,264 Skipped: 0. Mies. Nainen 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 15.55% 352.

Tervetuloa vastaamaan Vanhankaupunginlahtea koskevaan kyselyyn!

Vankien poistumislupakäytännöt ja niiden yhteneväisyys

Esimerkkejä kvalitatiivisen aineiston anonymisoinnista. Tutkimusaineistojen anonymisointi seminaari Tampereen yliopisto Emilia Lehto, FSD

Tutkimusrahoittajien ja tiedejulkaisujen vaatimukset aineistonhallinnalle

Aluenopeusrajoituksen muutos ja liikenteen rauhoittamistoimenpiteet Kaukajärvellä ja Vehmaisissa-kyselyn vastausten koonti

YHTEISÖN SÄÄNNÖT: ToiveMylly. 1. Yleistä

Dokumenttia hyödyntävien tulee viitata siihen asianmukaisesti lähdeviitteellä. Lisätiedot:

Liitteet. Kohderyhmän ikä ja elämäntyyli. Liite I. Kyselylomake

Raahesta vuonna 2015 poismuuttaneet kyselyn tulokset

Helsingin kaupunginhallitus Pöytäkirja 1 (5)

Avoimen datan avaruus ja rajat. Tietoarkisto datan kokoajana ja kierrättäjänä

Itä-Suomen seudulliset liikkumistutkimukset Itä-Suomen liikkumistutkimus 2015

MISTÄ RAKENTUU SEUTUKAUPUNKIEN VETOVOIMAISUUS? Seutukaupunkien vetovoimatutkimus 2019 Kaupunkikohtainen raportti: Rauma

Katoavat työpaikat. Pekka Myrskylä

FSD1316 Verkkopalvelujen ja tietotekniikan käyttö Tampereella 2003

Kuntavaalikysely Jyty

FSD1318 Verkkopalvelujen ja tietotekniikan käyttö Tampereella 2001

POIMU työntekijäkysely

Transkriptio:

Kvantitatiivisen aineiston anonymisointikeinot Eliisa Haanpää, Tietoarkisto Tutkimusaineistojen anonymisointi -seminaari 5.4.2017 Tampere

2 Sisältö Kvantitatiivinen aineisto Anonymisointi yleisesti Anonymisointi käytännössä Anonymisoidessa huomioitavaa Tietoarkisto www.fsd.uta.fi

3 Kvantitatiivinen eli määrällinen aineisto Kerätty käynti-, puhelin-, internet-kyselyinä strukturoidulla kyselylomakkeella Voi olla myös mittausdataa, asiakirja-aineistoja ja rekisteriaineistoja Havaintoyksikkö useimmiten henkilö (voi myös olla mm. ilmiö, maantieteellinen alue) Kvantidata = tallennettu havaintomatriiseiksi

4 Kvantitatiivinen eli määrällinen aineisto Datan käsittely Tietoarkistossa Muuttujat tunnistetaan ja tarkistetaan Muuttujiin lisätään dokumentaatiota (selitteet) Tietosuojasyistä muuttujia voidaan poistaa tai luokitella uudelleen

5 Tietosuojasyistä muuttujia voidaan poistaa tai luokitella uudelleen eli anonymisoida

6 Muuttujia poistetaan ja luokitellaan, jotta aineisto on anonyymi aineistoa voidaan pitkäaikaissäilyttää tunnisteettomana aineistoa voidaan käyttää uudelleen muihin tutkimuksiin

7 Anonymisoidessa on arvioitava Onko yksilö edelleen mahdollista erottaa joukosta? Onko tietojen yhdistäminen yksilöön edelleen mahdollista? Voidaanko yksilöä koskevat tiedot päätellä? Onko vastaajan tunnistaminen kohtuullisin keinoin mahdollista? Lähde: Article 29 Data Protection Working Party: Opinion 05/2014 Anonymisation Techniques: https://cnpd.public.lu/fr/publications/groupe-art29/wp216_en.pdf

8 Kenen jalat?

9 Anonymisoinnista Tietoarkisto toivoo tutkijoiden anonymisoivan kvantitatiivisen aineiston ennen sen arkistoimista Anonymisointi tulee suunnitella aina aineistokohtaisesti Keinoja kvantitatiivisten aineistojen anonymisoinnille löytyy Tietoarkiston Aineistonhallinnan käsikirjasta

10 Yleisimmät kvantitatiivisen aineiston anonymisointikeinot Muuttujan poistaminen Arvojen uudelleen luokittelu sekä arvojen harkinnanvarainen luokittelu Tunnisteiden poistaminen avointen kysymysten vastauksista www.fsd.uta.fi/aineistonhallinta

11 Muuttujan poistaminen Muuttujat, joissa on tunnisteita, käsitellään seuraavasti: Suorat tunnisteet (henkilötunnus, nimi, osoite, puhelinnumero, sähköpostiosoite jne.) poistetaan Vahvat epäsuorat tunnisteet (opiskelijatunnus, auton rekisteritunnus jne.) poistetaan Epäsuorat tunnisteet (kunta, maakunta, ikä, sukupuoli, ammatti jne.) arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa

12 Muuttujan arvojen luokittelu Avuksi luokitteluun: Tilastokeskuksen alue- ja henkilöluokitukset Luokittelutapoja: Vastausten yhdistäminen luokkiin (esim. ikä: vuosista luokiksi) Ääriarvojen poistaminen tai karkeistaminen (esim. yli 50 vuotiaat) Selkeästi poikkeavien ja yksilöivien arvojen luokittelu Muu-vastaukseksi

13 Tunnisteet avovastauksissa Avoimet kysymykset saattavat sisältää vastaajaa tai kolmansia henkilöitä koskevia tunnisteita, joista vastaaja on kertonut omin sanoin Yksittäisiä tunnisteita voidaan anonymisoida Esim. Humppila > [Maaseutumainen kunta Kanta- Hämeessä] Tunnistamisriski tulee arvioida aina tapauskohtaisesti suhteessa aineiston aihepiiriin ja taustamuuttujiin

14 Mihin tulee kiinnittää huomiota? Paljonko muuttujat antavat yksilöllistä tietoa vastaajasta? Muun muassa Työ, opiskelu Kotikaupunki/-kunta Ulkoiset/näkyvät vammat ja sairaudet Kieli tai synnyinmaa Vastuutehtävät, luottamustoimet Mitä vastaus kertoo suhteessa muualta saataviin tietoihin? Muun muassa Verkossa julkaistu materiaali Julkiset asiakirjat Lehtijutut Yleisesti tiedossa oleva

15 Mihin tulee kiinnittää huomiota? Esimerkki 1 Paljonko muuttujat antavat yksilöllistä tietoa vastaajasta? Olin luonnonsuojeluyhdistyksen puheenjohtaja vuonna 2015 Mitä vastaus kertoo suhteessa muualta saataviin tietoihin? Järjestöjen ja yhdistysten (nykyisten ja menneiden) hallitusten jäsenten nimet löytyvät usein järjestön/yhdistyksen verkkosivuilta tai julkisista asiakirjoista

16 Mihin tulee kiinnittää huomiota? Esimerkki 2 Paljonko muuttujat antavat yksilöllistä tietoa vastaajasta? Työskentelen ratikkakuskina Mitä vastaus kertoo suhteessa muualta saataviin tietoihin? Raitiovaunuja on Suomessa tällä hetkellä ainoastaan Helsingissä, joten vastaaja työskentelee kyseisessä kaupungissa

17 Mihin tulee kiinnittää huomiota? Esimerkki 3 Paljonko muuttujat antavat yksilöllistä tietoa vastaajasta? Mies kaupunginjohtajana Kainuun maakunnassa Mitä vastaus kertoo suhteessa muualta saataviin tietoihin? Mies on Kajaanin kaupunginjohtaja, sillä Kainuussa on vain 2 kaupunkia, joista vain toisessa kaupunginjohtaja on mies Julkishallinnollisten tehtävien tiedot löytyvät usein julkisista asiakirjoista usean vuoden ajalta Kuntien ja kaupunkien määrät maakunnittain löytyvät verkosta

18 Mihin tulee kiinnittää huomiota? Esimerkki 4 Paljonko muuttujat antavat yksilöllistä tietoa vastaajasta? Pääsin opiskelemaan sosiaalityötä vuonna 2012 ja kirjoitin pro gradu -tutkielmani ulkomaalaisten uhrikokemuksista Mitä vastaus kertoo suhteessa muualta saataviin tietoihin? Opiskelijavalintojen tulokset saattavat olla julkaistuna verkossa Opinnäytetyöt löytyvät usein avoimesti verkosta

19 Tietoarkisto www.fsd.uta.fi asiakaspalvelu.fsd (a) uta.fi Esityksen kuvat: Unsplash CC0 1.0