KVANTITATIIVNEN DATA JA SEN AVAAMINEN. Eliisa Haanpää, Tietoarkisto Metodifestivaali, Jyväskylä

Samankaltaiset tiedostot
Kvantitatiivisen aineiston anonymisointikeinot. Eliisa Haanpää, Tietoarkisto Tutkimusaineistojen anonymisointi -seminaari 5.4.

KVANTITATIIVISEN TUTKIMUSAINEISTON KUVAILU

Tietoarkisto palveluksessanne. Avoin tutkimusdata ja aineistonhallinta ihmistieteissä Hannele Keckman-Koivuniemi

Tutkimusdatan arkistointi ja jatkokäyttö ARJA KUULA TUTKIMUSAINEISTOJEN JATKOKÄYTTÖ JA TIETOSUOJA HELSINGIN YLIOPISTO

Tutkimuksen aineistonhallinnan eettisiä ulottuvuuksia. Tutkimusetiikkaseminaari, Tampereen yliopisto Arja Kuula-Luumi

Palveluportaali Ailan käyttö

Aineistoesimerkit kvantitatiiviset aineistot. Eliisa Haanpää, Tietoarkisto Tutkimusaineistojen anonymisointi -seminaari 5.4.

Henkilötietoja sisältävän datan käsittely ja avaaminen TIETOSUOJA TUTKIJAN ARJESSA HY ARJA KUULA-LUUMI

Aineistonhallinta ARJA KUULA-LUUMI ALAIKÄISIIN KOHDISTUVAN TUTKIMUKSEN ETIIKKAA -SEMINAARI TUTKIMUSEETTINEN NEUVOTTELUKUNTA, HELSINKI

Aineistonhallinta pähkinänkuoressa METODIFESTARIT TAMPEREEN YLIOPISTO ARJA KUULA-LUUMI

Kvalitatiivisen datan avaaminen. Tieteenala-asiantuntija, FT Katja Fält Metodifestivaalit

Miten tutkimuksen tietovarannot liittyvät etiikkaan ja viestintään? Tutkimusaineiston elinkaari

Miksi tutkimusaineistoja halutaan avattavan? Jyrki Hakapää, Suomen Akatemia

Tietoarkiston palvelut. Arja Kuula-Luumi (Tietoarkisto) Tieteelliset lehdet ja tutkimusdata seminaari Tieteiden talo, Helsinki

Terveystieteellisten aineistojen erityispiirteitä. Annaleena Okuloff

TUTKIMUSDATAN KUVAILU. Kuvailun tiedotuspäivä Tieteenala-asiantuntija, FT Katja Fält

Tietoarkiston palvelut ja arkistointiprosessi. Annaleena Okuloff Tieteenala-asiantuntija

Arvokas arkaluonteinen tutkimusaineisto. Annaleena Okuloff Terveystieteiden tieteenala-asiantuntija

Tutkimusaineiston hallinta. Annaleena Okuloff Terveystieteiden tieteenala-asiantuntija

Ympäristötutkimuksen aineistoja tietoarkistossa

Tietosuoja tutkimuksessa. Arja Kuula-Luumi (Tietoarkisto) Tutkimusaineistojen anonymisointi -seminaari Tampereen yliopisto

Ailan käyttö ja aineistovarannot

Tutkimusdatan hallinnan kansalliset välineet IDA, Etsin, AVAA. Stina Westman, ATT-hanke, CSC

FSD3028. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

Lapset ja nuoret tietoarkistossa Tampereen yliopisto helena.laaksonen (at) uta.fi

Kvalitatiivisen aineiston anonymisointikeinot. Katja Fält Tampereen yliopisto

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja

Tutkittavien informointi. Antti Ketola & Arja Kuula-Luumi

Mitä Ihmettä on Tietoarkisto?

Tietosuoja-asetus Tietoarkiston näkökulmasta. Aila ja aineistojen jatkokäyttö -seminaari Arja Kuula-Luumi Kehittämispäällikkö

Infrastruktuurin aineistonhallinta ja käytön avoimuus

Juomatapatutkimus ja muut alkoholiaineistot tietoarkistossa

Tutkimusrahoittajien ja tiedejulkaisujen vaatimukset aineistonhallinnalle

Tutkimusdata. Tutkijat verkoilla kurssi Helsingin yliopisto

Data Management Plan Hyvä datanhallinta alkaa suunnittelusta. Minna Ahokas CSC

Palveluportaali Aila

Avointen aineistojen julkaisualusta AVAA

PALVELUITA DATANHALLINTAAN

Oletko mukana tutkimuksen muutoksessa? Lue tästä, miten voit hyödyntää avoimen tieteen ja tutkimuksen mahdollisuudet!

Ailan käyttö ja aineistovarannot

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja

PALVELUITA AINEISTOJEN HALLINTAAN

Rahoittajat ja tiedon julkisuus. Pirjo Hiidenmaa Suomen Akatemia

Saimaan ammattikorkeakoulu Tutkimuspäällikkö Henri Karppinen

Avoin tiede ja tutkimus TURUN YLIOPISTON DATAPOLITIIKKA

FSD2511. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

FSD2935. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

Tietosuoja, tutkimusetiikka ja aineistonhallinta

Taideyliopiston tutkimusaineistopolitiikka Toteuttamissuunnitelma

Ohjeita tutkimusaineistojen hallintaan ja julkaisemiseen

Lapset ja nuoret tietoarkistossa Tampereen yliopisto helena.laaksonen (at) uta.fi

Avoin toimintakulttuuri. SotePeda 7/24 Hanna Lahtinen

FSD3225. Kauppa- ja tietojenkäsittelytieteiden opiskelijoiden hyvinvointi Aineisto-opas

Psyka / laitoskokous Aineistonhankinta ja -tallennus

Julkisrahoitteisten tutkimusaineistojen avoimuus ja kansainvälinen tilanne OECD:n Open Access ohjeistus

ATT-viitearkkitehtuuri

Suostumus ja informointi tietosuojan muuttuneet käytännöt. Avoimen tieteen kevätpäivät

FSD2475. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

Tietoarkisto on FAIR. Avoimen tieteen kevätpäivät 2019 Tampere Hannele Keckman-Koivuniemi tietopalvelupäällikkö

FSD2828. Uutisointi ilmastonmuutoksesta ja rehevöitymisestä Koodikirja

AVOIN TIEDE JA TUTKIMUKSEN NÄKYVYYS

FSD2275. Äänestäminen ja puolueiden valintaperusteet eduskuntavaaleissa Koodikirja

Ailan käyttö ja aineistovarannot

IDA-tallennuspalvelun esittely. CSC Tieteen tietotekniikan keskus Oy

AVOIMEN TIETEEN JA TUTKIMUKSEN PALVELUKARTTA - TAVOITETILA 2020

Aineistojen avoimuuden vaateet ja haasteet. Metodifestivaalit 2013 Arja Kuula

Tutkimuksen rahoittajien ja julkaisijoiden sekä tutkimusorganisaatioiden politiikkasuositukset. Yleiskatsaus nykytilanteeseen.

Tutkimusaineistot ja tekijyys

Nykydokumentoinnin koulutuspäivä. Tietosuojakysymykset ja eettiset periaatteet nykydokumentoinnissa

FSD2852. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

FSD3098. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

Avoimen tieteen palvelujen kehittäminen Tampereen yliopiston kirjastossa. Tampereen kirjastopäivät

TAMPEREEN YLIOPISTOSTA VALMISTUNEIDEN SIJOITTUMISSEURANTA -AINEISTOSARJAN ANONYMISOINTISUUNNITELMA

Yhteiskuntahistorian tutkimus, tutkittavan suostumus ja avoimen tieteen haasteet

Henkilötietoja sisältävän aineiston käsittely ja jatkokäyttö

Tietosuoja ja aineiston avaaminen. Anne Kärki

AVOIMEN TIETEEN JA TUTKIMUKSEN KÄYTÄNNÖT. Diakonia-ammattikorkeakoulu

Palvelukartta 2020 Versio 0.4 helmikuu2017

Menetelmät tietosuojan toteutumisen tukena - käytännön esimerkkejä. Tilastoaineistot tutkijan työvälineenä - mahdollisuudet ja rajat 2.3.

Kirjasto yliopiston tutkimusaineistopolitiikan toteuttajana. Pekka Olsbo Julkaisukoordinaattori Jyväskylän yliopiston kirjasto

FSD2805. Kirjastojen kansallinen käyttäjäkysely: yleiset kirjastot Koodikirja

YLEISESITTELY: MITÄ ON AVOIN TIEDE? Ilkka Niiniluoto Helsingin yliopisto OKM:n seminaari

Tutkimuksen vastuullinen elinkaari

Avoimen tieteen palvelut

Metodiopetuksen tuki verkossa: menetelmäopetuksen tietovaranto

Julkaisujen avoimen saatavuuden tukeminen

Yleisimmät joukkoviestimet tutkimusta ja tiedettä koskevan tiedon välittäjinä suomalaisille

FSD3156. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

Avoimen tieteen ja tutkimuksen edistäminen periaatetasolta käytännön toimiin

FSD2412. Kansanedustajien vaalirahoitus Koodikirja

FSD3026. Suomen ulkomaankauppa: tavaratuonnin arvo Koodikirja

Tietovarantojen elinkaarisuunnittelu on tutkimuksessa vielä uutta

Humanististen alojen aineistojen erityispiirteet ja aineistonhallinta METODIFESTIVAALI

Ihmiseen kohdistuvan tutkimuksen eettiset periaatteet (luonnos 03/2019)

FSD3238. Työ- ja elinkeinoministeriön julkisten hankintojen ilmoitustilastoaineisto Koodikirja

Ohje arkaluonteisia henkilötietoja sisältävän tutkimuksen datanhallinnan suunnitteluun

Haastatteluun osallistuneet N:30

HAMKin yhteisten palveluiden TKI-tuen tiimin työsuunnitelma lukuvuosille

ETIIKKASEMINAARI Rahoitushauissa huomioitavaa

1. Tutkimuksessa puututaan tutkittavien fyysiseen koskemattomuuteen.

Transkriptio:

KVANTITATIIVNEN DATA JA SEN AVAAMINEN Eliisa Haanpää, Tietoarkisto Metodifestivaali, Jyväskylä 30.5.2017

Esityksen sisältö 1 Taustaa 2 Suunnittelu & käsittely 3 Anonymisointi

1 TAUSTAA

Miksi avata aineisto? Tieteen avoimuus ja hyvä tieteellinen käytäntö Rahoittajan tai yliopiston vaatimus Tieteellinen meriitti tutkijalle Yksittäinen aineisto on arvokas jatkotutkimukselle

Tutkimusaineiston elinkaari 1 2 3 Tutkimussuunnitelma Aineistonhallintasuunnitelma Rahoituksen hakeminen Luvat ja eettinen arviointi Keruun suunnittelu & toteutus Käsittely & kuvailu Aineiston analyysi & tulosten julkaisu Aineiston avaaminen / arkistointi Aineistotietojen julkaisu luetteloissa Elinkaari jatkuu mm. uusissa tutkimuksissa, opetuksessa, opiskelussa

Kvantitatiivinen eli määrällinen aineisto Kerätty kyselyinä (käynti, puhelin, internet) strukturoidulla lomakkeella Myös mittausdataa, asiakirja- ja rekisteriaineistoja Havaintoyksikkö useimmiten henkilö (myös mm. ilmiö, maantieteellinen alue) Kvantidata -> tallennettu havaintomatriisiksi

FSD0115 ISSP 2000 : ympäristö II : Suomen aineisto

2 SUUNNITTELU & KÄSITTELY

Aineistonhallinnan suunnittelu Aineistonhallintasuunnitelma osana tutkimussuunnitelmaa varmistaa, että aineistojen suhteen noudatetaan hyvää tieteellistä käytäntöä ja mahdollistetaan aineiston jatkokäyttö.

Aineistonhallintasuunnitelma 1 Aineisto 2 Oikeudet 3 Tietosuoja ja tietoturva 4 Tiedostoformaatit ja ohjelmistot 5 Aineiston käsittelyn ja sisällön kuvaus 6 Elinkaari

Tutkimusaineisto FSD0115 ISSP 2000 : ympäristö II : Suomen aineisto

Aineiston käsittely avaamisen näkökulmasta Havaintomatriisin tallennus Muuttujien nimet ja selitteet Muuttujan arvot ja niiden selitteet Muuttujien muunnokset Puuttuvat tiedot Painomuuttujat

Tutkimuksen toteutuksen kuvailu Alkuperäinen käyttötarkoitus Julkaisut Tekijät Tuottajat Perusjoukko Havaintoyksikkö Aineistonkeruu Lähdeaineistot

Tietoarkisto sekä Avoin tiede ja tutkimus (ATT) järjestävät webinarin mm. kvantitatiivisten aineistojen kuvailusta 6.6.2017 klo 14 Lisätietoa (Tietoarkisto > ajankohtaista > Osallistu webinareihin Ailan käytöstä ja tutkimusaineistojen kuvailusta)

3 ANONYMISOINTI

Anonyymi aineisto Pseudonyymi aineisto

Anonymisoinnista Anonymisointi tulee suunnitella aina aineistokohtaisesti Keinoja kvantitatiivisten aineistojen anonymisoinnille löytyy Tietoarkiston Aineistonhallinnan käsikirjasta > www.fsd.uta.fi/aineistonhallinta Tietoarkisto toivoo tutkijoiden anonymisoivan kvantitatiivisen aineiston ennen sen arkistoimista

Yleisimmät kvantitatiivisen aineiston anonymisointikeinot 1 Muuttujan poistaminen 2 Arvojen uudelleen luokittelu sekä arvojen harkinnanvarainen luokittelu 3 Tunnisteiden poistaminen avointen kysymysten vastauksista www.fsd.uta.fi/aineistonhallinta

1 Muuttujien poistaminen Muuttujat, joissa on tunnisteita, käsitellään seuraavasti: Suorat tunnisteet poistetaan Vahvat epäsuorat tunnisteet poistetaan Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa

2 Muuttujien luokittelu Avuksi luokitteluun: Tilastokeskuksen alue- ja henkilöluokitukset Luokittelutapoja: Vastausten yhdistäminen luokkiin (esim. ikä: vuosista luokiksi) Ääriarvojen poistaminen tai karkeistaminen (esim. yli 50 vuotiaat) Selkeästi poikkeavien ja yksilöivien arvojen luokittelu Muu-vastaukseksi

3 Tunnisteet avovastauksissa Avoimet kysymykset saattavat sisältää vastaajaa tai kolmansia henkilöitä koskevia tunnisteita, joista vastaaja on kertonut omin sanoin Yksittäisiä tunnisteita voidaan anonymisoida Esim. Humppila > [Maaseutumainen kunta Kanta-Hämeessä] Tunnistamisriski tulee arvioida aina tapauskohtaisesti suhteessa aineiston aihepiiriin ja taustamuuttujiin

Lisää anonymisoinnista Kvantitatiivisen aineiston anonymisointikeinot - Eliisa Haanpää YouTube Aineistoesimerkit (kvantitatiiviset aineistot) - Eliisa Haanpää YouTube Lisää esityksiä anonymisoinnista Tutkimusaineistojen anonymisointi -seminaari 5.4.2017 (Tietoarkisto > Ajankohtaista > Tapahtumat > Aiemmat tapahtumat)

Hyvin toteutettu suunnittelu, kuvailu ja käsittely tukee tutkimuksen tekoa ja myöhemmin aineiston avaamista

Lue lisää: aineistonhallinnan käsikirja: fsd.uta.fi/aineistonhallinta Ehdota aineistoasi arkistoitavaksi Tietoarkistoon ottamalla yhteyttä asiakaspalveluun TIETOARKISTO www.fsd.uta.fi Asiakaspalvelu (a) uta.fi Esityksen kuvat: Unsplash & Gratisography & StockSnap.io CC0