arvonmääritys ja säilytysajan määrääminen 6.5.2009 Sosiaali- ja terveysalan rekisteri- ja tilastoaineistojen arvo tutkimuksen näkökulmasta Marianne Johnson erikoissuunnittelija Rekisteritutkimuksen tukikeskus ReTki REKISTERITUTKIMUKSEN TUKIKESKUS
Rekisteritutkimuksen tukikeskus ReTki ReTki perustettiin vuonna 2003 ja on toiminut vuodesta 2005 lähtien KELAn, THLn ja TTLn rahoittamana Tavoitteena edistää kansallisten rekisterien tutkimuskäyttöä erityisesti terveys- ja sosiaalitieteissä: neuvomalla rekisteriaineistoihin perustuvan tutkimuksen suunnittelussa ja toteutuksessa parantamalla tutkijoiden rekisteriaineistojen käytön valmiuksia lisäämällä eri rekisteripitäjien välistä yhteistyötä kehittämällä rekisteriaineistojen käyttöön liittyviä menettelytapoja Internet-portaalin ylläpito ja kehittäminen www.rekisteritutkimus.fi Seminaarien ja keskustelutilaisuuksien järjestäminen Oppimateriaalin kokoaminen (verkkokurssi) Rekisteritutkimuksen edellytysten parantaminen
Rekisterit Rekisteri jonkin kohdejoukon kokonaisuudessaan käsittävä yleensä elektronisessa muodossa oleva tietoaineisto tietoja pidetään ajan tasalla eli päivitetään säännöllisesti yksiköt ovat yksikäsitteisesti tunnistettavissa vrt. Henkilötietolain henkilörekisterin määrittely Tilastoaineisto Otosaineistot Totaaliaineistot Rekisteriaineistot Oma tiedonkeruu Olemassa olevista rekistereistä Ei lueta rekistereihin Luetaan rekistereihin (Tilastorekisteri)
Suomen rekisteröintijärjestelmä Hallinnolliset perusrekisterit Esim: - Väestötietojärjestelmä, VRK - Työhallinnon asiakaspalvelurekisteri, TEM - Etuusrekisteri, KELA - Eläkerekisteri, ETK - Kiinteistörekisteri, Maanmittauslaitos - Kaupparekisteri, PRH - Potilastietojärjestelmät, sairaalat ym. Tilasto-, tutkimus-, suunnittelu- ja valvontarekisterit Esim: - suurin osa TK:n aineistoista - THL:n rekisterit Primäärit tilastorekisterit - Tutkintorekisteri, TK
Suomen sosiaalirekisterit 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 Väestö 1967 Eläkkeet 1969 Työsuhteet 1969 Kansaneläkkeet 1970 Perhe-eläkkeet 1970 Lasten vammaistuet 1970 Väestölaskenta (5-vuoden välin) 1970 Tutkinnot 1970 Sairauspäivärahat 1971 Yksityisen terveydenhuollon käynnit 1971 Kuntoutukset 1978 Lukioihin ja ammattikouluihin hakeneet 1987 Sotilasavustukset 1985 Työttömyyskorvaukset 1985 Toimeentulotuki 1985 Työssäkäynti 1987 Huostaan otetut lapset ja nuoret 1991 Työnhakijat 1991 Perhe-etuudet 1993 Rikokset 1993 Lapsenhoitoetuudet 1993 Äitiysavustukset 1994 Työmarkkina-avustukset 1994 Asumistuet 1994 Sos.huoll.laitosten hoito 1994 Tulonjako 1995 Reseptilääkkeet 1996 Opintotuet 1997 Yliopistoihin hakeneet 1998» Ammatit 2004
Suomen terveysrekisterit 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 Syövät 1953 Tuberkuloosin hoito 1956 Psykiatrinen hoito 1957 Uudet tuberkuloositapaukset 1958 Sukupuolitaudit 1958 Yleissairaaloiden hoito 1960 Epämuodostumat 1963 Ammattisairaudet 1964 Erityiskorvattavat lääkkeet 1964 Lääkkeiden haittavaikutukset 1966 Sairaaloiden poistoilmoitukset 1967 Kohdunkaulan- ja rintasyövän joukkotarkastukset 1968 Kuolemansyyt 1969 Raskauden keskeytykset ja steriloinnit 1977 Syövälle altistuminen 1979 Ortopediset implantit 1980 Näkövamma 1983 Syntymät 1987 Tartuntataudit 1989 Hammasimplantit 1994 Terveyshuollon hoito 1994 Yks. terv. huollon toimenpiteet 1996
Rekisteritutkimus hallinnolliset ja tilastolliset rekisterit muodostavat valtaisan tietovarannon Suomessa henkilötietolaki (523/1999), julkisuuslaki (621/1999) ja lukuisat erillislait mahdollistavat henkilörekistereiden käytön tieteellisiin tutkimuksiin rekistereitä käytetään paljon mm. väitöskirjojen aineistona esim. Helsingin yliopistossa hyväksyttiin vuosina 2007-2008 40 rekistereihin pohjautuvaa väitöskirjaa (ethesis)
Käyttölupahakemukset henkilörekisteritietoihin 160 140 120 100 KELA 80 Stakes ( ei STM:n kautta) 60 40 STM 20 Tilastokeskus /Henkilötilastot 0 2000 2001 2002 2003 2004 2005 2006 2007 2008 arvonmääräys 6.5.2009
Terveyspuolen rekisteritutkimus Pohjoismaissa (PubMed haku rekisteri + maa) 500 450 400 350 300 250 200 150 Norway Denmark Finland Sweden 100 50 0 2000 2001 2002 2003 2004 2005 2006 2007 2008
Rekisteriaineistojen arvo tutkimuksen näkökulmasta Tietosisältö Kattavuus Dokumentaatio, metatiedot Tiedon laatu, luotettavuus Yhdistettävyys Käytettävyys, käyttöön saanti Pitkiä aikasarjoja
Tietosisältö Rekisterit laajoja tietovarantoja Rekisteritutkimuksessa käytetään muuhun tarkoitukseen kerättyä tietoa Käytettävä saatavissa olevia tietoja Proxy-muuttujia Tarvitaan tietoa siitä mitä tietoa on saatavissa Rekisteriselosteet, ReTkin sivuilta linkit Toivomus: muuttujaluettelot nettiin hakuohjelma vrt. FSD Nesstar
Kattavuus Usein 100 % Mahdollista tutkia pieniä ryhmiä, alueellista tietoa ym. Tilastokeskus toimittaa tutkijalle otoksen tutkimuspopulaatiosta Dokumentaatio, metatiedot Tietuekuvaus Muuttujien määritteet Tutkijan tiedettävä miten tieto on syntynyt Alkuperäinen lähde Poimintakriteerit Päättelysäännöt, käsittely Vuosien varrella tapahtuneet muutokset tietojen keräyksessä, yhteiskunnassa, laissa, hallinnollisissa käsitteissä, luokituksissa
ReTkin dokumentaatioprojekti esim. Toimeentulotukirekisteri 1987 alkaen Vuodelta 1987 ja 1988 ei kerätä tietoja toimeentulotuen tarpeen syistä, eikä pääasiallisesta toimeentulolähteestä marraskuun asiakkaiden osalta. (kts. kohta 7). 1989 alkaen Laajennettu luokitus käyttöön marraskuun asiakkaiden pääasialliseen toimeentulolähteeseen ja toimeentulotuen tarpeen taustalla oleviin tekijöihin. 1991 alkaen Ilmoitetaan myös viitehenkilön puolison henkilötunnus. 1992 alkaen Sosioekonomisen aseman luokitus vastaamaan mm. väestötilastoissa käytettyä luokitusta. Aiemmin käytössä Sosioekonominen asema-luokitus, ammattiasemaluokitus. Tilastokeskus: Käsikirjoja Nro 17, Helsinki 1983. Uusi lähde: Sosioekonomisen aseman luokitus 1989. Tilastokeskus: Käsikirjoja Nro 17, Helsinki 1989. 1994 alkaen Sotilasavustustilasto irrotetaan toimeentulotukitilastosta ja siirretään Kelaan.
Tiedon laatu, luotettavuus Luotettavuustutkimuksia Muuhun kun omiin hallinnollisiin tarpeisiin kerätty tieto ei ole usein kovin luotettavaa Yhdistettävyys Muihin rekisteritietoihin, muihin tutkimustietoihin ja näytteisiin Tunnisteet henkilötunnus vuodesta 1967 Yritystunnus, kotipaikkatunnus, kuntakoodi, ammattikoodi Anonymisoitujen aineistojen HT/järjestysnumeroavaimet
Käytettävyys, käyttöön saaminen Taltiointimuoto Fyysinen kunto Tiedoston rakenne, tietokantaratkaisut Saantirajoitukset (esim. vain tieteellisin tutkimuksiin) Lupamenettelyt Rekisteriviranomaisen resurssit/kyky palvella Aika ja kustannukset Tilastokeskuksessa yritystietojen etäkäyttöprojekti CSC:n ja ReTkin rekisteritiedon etäkäytön valmisteluhanke
Lupakäsittelyyn ja aineistonpoimintaan käytetty aika kuntoutustutkimuksessa työvoimahallinto lupakäsittely aineistonpoiminta VKK VK ETK Kela STM/Sairaanhoitopiirit 0 10 20 30 40 Kuukausia
Pitkiä aikasarjoja Mahdollistaa pitkittäistutkimusta virtatarkastelua kohorttien seurantaa sukupolvien välinen vertailua sosiaalisen periytyvyyden tutkimusta, ylisukupolvisuus Yhdistettyjä vuosiaineistoja, luokitukset ym. yhtenäistetty Väestölaskentojen pitkittäisaineisto vuosilta 1950, 1970-2005 (TK) Työssäkäyntitilasto pitkittäistiedosto 1987 - (TK)
Rekisteritietojen säilytys Erillislait (esim): Tartuntatautilaki; vrk-yhdistely, sen jälkeen tunnistetiedot poistattava Opiskelijavalintarekisteri; viisi vuotta opiskelijavalintapäätöksen tekemistä lukien, arvokkaat tiedot pysyvästi niin kuin arkistolaitos erikseen määrää Yleislait Henkilötietolaki, Julkisuuslaki, Arkistolaki Arkistomuodostussuunnitelma (AMS) Virasto laatii Arkistolaitos hyväksyy / määrää pysyvän säilyttämisen
Rekisteritutkimusaineistojen säilytys Lupaehdot: Lupa tiettyyn tutkimukseen Käyttöoikeus ainoastaan luvassa nimetyillä henkilöillä Aineisto hävitettävä kun tutkimus on suoritettu tai 3-5 vuoden päästä Mikäli lupa säilyttää, säilytys ilman tunnisteita Tutkimusaineiston voi muodostaa uudestaan mikäli lähderekisterit arkistoidaan pysyvästi