1 HYPA 2009 kyselyn aineistokuvaus Tiivistelmä Suomalaisten Hyvinvointi ja Palvelut (HYPA) -kysely on THL:n osittain paneelimuotoinen kyselytutkimus, jossa yhdistetään puhelin- ja käyntihaastatteluja, postikyselyjä ja rekisteriaineistoja. Tiedonkeruu toteutetaan noin joka kolmas vuosi ja syksyn 2009 tiedonkeruu oli lajissaan kolmas. Aikaisemmat tiedonkeruut toteutettiin syksyllä 2004 ja syksyllä 2006. HYPA -kyselyjen tavoitteena on tarjota ajan tasalla olevaa, luotettavaa ja kattavaa tutkimusaineistoa suomalaisten hyvinvoinnista ja hyvinvointipalveluiden käytöstä. Tarkempaa tietoa HYPA kyselystä sekä aineistokuvaukset löytyvät hankkeen kotisuvuilta: www.thl.fi/hypa HYPA -tutkimuksen rungon muodostavat puhelinhaastattelut, joista puolikas muodostaa aina paneelin edellisen aallon kanssa 50 prosentin rotaatiomenetelmällä. Haastattelutietoja täydennetään rekisteritiedoilla. Käytännössä kaikki taustamuuttujat kuten sukupuoli, ikä, perherakenne, tulot ja niin edelleen on yhdistetty rekistereistä. Näin on vapautettu tilaa haastattelulomakkeeseen sellaisia kysymyksiä varten, joita koskevia tietoja ei saada rekistereistä. Puhelinhaastattelujen kohderyhmä on 18 79-vuotiaat Manner-Suomen asukkaat. Ruotsinkielisiä vastaajia varten kyselylomakkeet on käännetty ruotsiksi. Otantamenetelmänä on systemaattinen satunnaisotanta Tilastokeskuksen väestötietokannasta. Jälkiosituksella lasketuilla painomuuttujilla korjataan sukupuolten, ikäryhmien ja alueiden välisiä eroja vastaushalukkuudessa. Vuoden 2009 aallon puhelinhaastattelut toteutettiin 31.8. 4.12.2009 Tilastokeskuksen haastatteluorganisaation toimesta. Otoksen koko oli 5 800 ja otoksesta puolet oli uusia kohteita, puolet oli ollut mukana edellisessä vuoden 2006 aallossa. Puhelinhaastattelu kesti keskimäärin noin 21 minuuttia. Puhelinhaastatteluja saatiin 3 933 kappaletta, ja otoksen ylipeitto huomioon ottaen vastausosuudeksi (netto) saatiin 80 prosenttia. Bruttokadon yleisin syy oli se, ettei otoshenkilön puhelinnumeroa löydetty. Ensimmäistä kertaa mukana olleiden bruttokato oli huomattavasti suurempi kuin jo vuonna 2006 mukana olleiden. Tämä johtui pääasiassa siitä, että vuonna 2006 mukana olleille löydettiin puhelinnumero paljon paremmin kuin ensimmäistä kertaa mukana olleille. Haastattelijoiden apuna oli heille vuoden 2006 tiedonkeruun aikana löydetyt puhelinnumerot. Toiseksi yleisin kadon syy oli kieltäytyminen haastattelusta. Puhelinhaastatelluilta kysyttiin myös lupa erillisen postikyselyn lähettämiseen. Haastatelluista 79 prosenttia (n=3099) antoi luvan postikyselyn lähettämiselle. Kirjekyselyn vastaukset saatiin lokakuun 2009 ja tammikuun 2010 välisenä aikana. Postikyselylomakkeita palautettiin 1 824 kappaletta, eli postikyselyn vastausosuus (netto) oli 47 prosenttia alkuperäisestä otoksesta. Rekisteritiedot taustamuuttujista yhdistettiin haastattelutietoihin aikaisempien aaltojen tapaan. Vuoden 2009 aallon yhteydessä toteutettiin vuoden 2004 aallon kaltainen erillinen lisäotos ja tiedonkeruu erillisellä käyntihaastattelulomakkeella 80 vuotta täyttäneille. Otos käsitti Manner-Suomen suomen- ja ruotsinkieliset itsenäisesti asuvat henkilöt. Tilastokeskuksen
2 haastatteluorganisaatio toteutti käyntihaastattelut 16.9. 4.12.2009. Käyntihaastattelujen keskimääräinen kesto oli noin 45 minuuttia. Otoskoko oli 600 henkilöä ja onnistuneita haastatteluja saatiin 373. Otoksen ylipeitto on kohdehenkilöiden korkean iän vuoksi korkea, joten nettovastausosuus on 81 prosenttia. Yleisin syyluokitus ylipeitolle oli sairastuminen tai kuolema, toiseksi yleisin pysyvä laitoshoitoon joutuminen. Tutkimuksen toteutus Hyvinvointipalvelut tutkimus koostui neljästä osasta. Tutkimuksen rungon muodostivat tietokoneavusteiset puhelinhaastattelut, jotka tehtiin 31.8. ja 4.12.2009 välisenä aikana. Puhelinhaastattelujen otos oli 5800 18 79 -vuotiasta suomalaista. Otoksesta noin 4000 henkilöä oli mukana ensimmäistä kertaa. Noin 1800 haastateltavaa oli mukana tutkimuksen edellisellä kierroksella syksyllä 2006. Puhelinhaastattelujen keskimääräinen kesto oli noin 21 minuuttia. Tutkimuskokonaisuuden toisen osan muodostivat vanhuksille tehdyt tietokoneavusteiset käyntihaastattelut, jossa haastattelu tehtiin haastateltava silmästä silmään tavaten. Otos oli 600 yli 79 -vuotiasta suomalaista. Tiedot kerättiin 16.9. ja 4.12.2009 välisenä aikana. Käyntihaastattelujen keskimääräinen kesto oli noin 45 minuuttia. Kolmas tiedonkeruutapa oli kirjekysely, joka täydensi puhelinhaastatteluaineistoa. Puhelinhaastatteluun vastanneilta kysyttiin lupa lähettää heille vielä lyhyehkö paperilomake täytettäväksi ja palautettavaksi. Kirjekyselyn vastaukset saatiin lokakuun 2009 ja tammikuun 2010 välisenä aikana. Neljäs osa tutkimuskokonaisuutta oli rekisteriyhdistelyt tammikuussa 2010. Puhelin- ja käyntihaastatteluaineistoihin liitettiin verottajan rekistereihin perustuvat ns. tulotiedot. Tutkimuksen kato Sivulla kaksi esitetystä taulukosta näkee puhelin- ja käyntihaastattelujen bruttokadon syyt. Bruttokadossa on mukana sekä ylipeitto (esim. kuolleet) että alipeitto (esim. puhelittomat). Nettokadossa sekä yli- että alipeitto poistettaisiin kadosta. Kadon ja alipeiton määrittely puhelinhaastattelututkimuksissa on tulkinnanvarainen ja häilyvä, koska esim. tilanne, jossa puhelinnumeroa ei löydetä, ei tarkoita sitä, ettei henkilöllä olisi puhelinnumeroa olemassa. Puhelinhaastatteluissa bruttokadon yleisin syy oli se, ettei otoshenkilön puhelinnumeroa löydetty. Ensimmäistä kertaa mukana olleiden bruttokato oli huomattavasti suurempi kuin jo vuonna 2006 mukana olleiden. Tämä johtui pääasiassa siitä, että vuonna 2006 mukana olleille löydettiin puhelinnumero paljon paremmin kuin ensimmäistä kertaa mukana olleille. Haastattelijoiden apuna oli heille vuoden 2006 tiedonkeruun aikana löydetyt puhelinnumerot. Toiseksi yleisin kadon syy oli kieltäytyminen haastattelusta. Käyntihaastatteluissa yleisimmät kadon syyt liittyivät otoshenkilön huonoon terveyteen. Yleisin syy oli sairas tai kuollut, toiseksi yleisin syy pysyvä laitoshoito. Puhelinhaastatteluun vastanneista henkilöistä (n=3933) noin 79 prosenttia (n=3099) antoi luvan kirjekyselylomakkeen lähettämiseen. Kelvollisesti täytettyjä kirjekyselylomakkeita palautettiin lopulta 1824 kappaletta, eli haastattelussa luvan antaneista noin 59 % palautti lomakkeen.
3 Puhelinhaastattelujen kato A = uusi haastateltava vuonna 2009 Laji Total B = paneelikohde, haastateltu vuonna 2006 A B 2466 1467 3933 Otos 5800 henkilöä. Taulukosta puuttuu 1 katotapaus. 61,77 81,18 Kieltäytyi, ei tiedetä tarkempaa syytä 112 27 139 2,81 1,49 Kieltäytyi, ei kiinnosta 106 23 129 2,66 1,27 Kieltäytyi ajanpuutteen vuoksi 97 26 123 2,43 1,44 Kieltäytyi periaatteellisista syistä 72 7 79 1,8 0,39 Kieltäytyi tutkimuksen aiheen vuoksi 23 8 31 0,58 0,44 Kieltäytyi tiedonkeruutavan vuoksi 1 0 1 0,03 0 Ei tavoitettu, puhelinnumero tiedossa 196 65 261 4,91 3,6 Ei tavoitettu, tilapäisesti poissa 11 7 18 0,28 0,39 Ei tavoitettu, joku muu kieltää osallistumisen 11 2 13 0,28 0,11 Osittaiskato: haastattelu keskeytyi 0 1 1 0 0,06 Haastattelua ei voitu tehdä kielivaikeuksien vuoksi 37 0 37 0,93 0 Haastattelua ei voitu tehdä pysyvän sairauden tai vamman 40 14 54 vuoksi 1 0,77 Tavoitettu, haast.aikaa ei saada sovittua, ei tavoiteta uudelleen 142 58 200 3,56 3,21 Henkilö kuollut 8 4 12 0,2 0,22 Henkilö muuttanut pysyvästi ulkomaille 16 2 18 0,4 0,11 Henkilö pysyvästi laitoshoidossa 9 0 9 0,23 0 Muu bruttokato 2 0 2 0,05 0 Ei löydetty numeroa - haastattelua ei voitu tehdä 643 96 739 16,11 5,31 Total 3992 1807 5799
4 Puhelinhaastattelujen kato taustamuuttujien mukaan OTOS VASTANNEET KATO VAST % henkilöä %-osuus henkilöä %-osuus henkilöä %-osuus BRUTTO sukupuoli mies 2856 49,2 1870 47,6 986 52,81 65,5 nainen 2944 50,8 2063 52,5 881 47,19 70,1 ikäryhmä 18-24 v. 479 8,3 254 6,46 225 12,05 53,0 25-34 v. 994 17,1 578 14,7 416 22,28 58,1 35-44 v. 1026 17,7 658 16,73 368 19,71 64,1 45-54 v. 1064 18,3 725 18,43 339 18,16 68,1 55-64 v. 1190 20,5 884 22,48 306 16,39 74,3 65-79 v. 1047 18,1 834 21,21 213 11,41 79,7 kuntaryhmä kaupunkimaiset 3974 68,5 2598 66,06 1376 73,7 65,4 taajaan asutut 914 15,8 652 16,58 262 14,03 71,3 maaseutumaiset 912 15,7 683 17,37 229 12,27 74,9 siviilisääty naimaton 1924 33,2 1085 27,59 839 45,03 56,4 avioliitossa 2911 50,2 2204 56,04 707 37,95 75,7 eronnut/leski 961 16,6 644 16,37 317 17,02 67,0 yhteensä 5796 100,0 3933 100,0 1863 100,0 67,8 kato ei löydetty puhelinta 739 39,6 739 39,58 kieltäytyi 502 26,9 502 26,89 ei tavoitettu 292 15,6 292 15,64 muut syyt 334 17,9 334 17,89 yhteensä 1867 100,0 1867 100,0 laji uusi haastateltava 3993 68,8 2466 62,7 1527 81,79 61,8 mukana vuonna 2006 1807 31,2 1467 37,3 340 18,21 81,2 sukupuoli ja ikäryhmä M 18-24 v. 227 3,9 111 2,8 116 6,2 48,9 N 18-24 v. 252 4,3 143 3,6 109 5,8 56,7 M 25-34 v. 527 9,1 302 7,7 225 12,1 57,3 N 25-34 v. 467 8,1 276 7,0 191 10,2 59,1 M 35-44 v. 518 8,9 309 7,9 209 11,2 59,7 N 35-44 v. 508 8,8 349 8,9 159 8,5 68,7 M 45-54 v. 532 9,2 345 8,8 187 10,0 64,8 N 45-54 v. 532 9,2 380 9,7 152 8,1 71,4 M 55-64 v. 573 9,9 419 10,7 154 8,2 73,1 N 55-64 v. 617 10,6 465 11,8 152 8,1 75,4 M 65-79 v. 479 8,3 384 9,8 95 5,1 80,2 N 65-79 v. 568 9,8 450 11,4 118 6,3 79,2
5 Käyntihaastattelujen kato Total TEHTY HAASTATTELU 373 373 62,17 Kieltäytyi, ei tiedetä tarkempaa syytä 18 18 3 Kieltäytyi, ei kiinnosta 17 17 2,83 Kieltäytyi ajanpuutteen vuoksi 3 3 0,5 Kieltäytyi periaatteellisista syistä 19 19 3,17 Kieltäytyi tutkimuksen aiheen vuoksi 2 2 0,33 Kieltäytyi tiedonkeruutavan vuoksi 3 3 0,5 Ei tavoitettu, puhelinnumero tiedossa 6 6 1 Ei tavoitettu, puhelinnumero tuntematon, osoite 8 8 tiedossa 1,33 Ei tavoitettu, puhelinnumero ja osoite tuntemattomia 1 1 0,17 Ei tavoitettu, tilapäisesti poissa 4 4 0,67 Ei tavoitettu, joku muu kieltää osallistumisen 8 8 1,33 Osittaiskato: haastattelu keskeytyi 2 2 0,33 Haastattelua ei voitu tehdä kielivaikeuksien 3 3 vuoksi 0,5 Haastattelua ei voitu tehdä pysyvän sairauden tai 59 59 vamman vuoksi 9,83 Tavoitettu, haast.aikaa ei saada sovittua, ei tavoiteta uudelleen 2 2 0,33 Henkilö kuollut 26 26 4,33 Henkilö pysyvästi laitoshoidossa 46 46 7,67 Total 600 600
6 Aineiston painottaminen 18-79-vuotiaan väestön puhelinhaastattelut Aineistoon laskettiin mukaan painokertoimet, jotka ottavat huomioon otanta-asetelman ja korjaavat jossain määrin kadon aiheuttamaa vinoumaa. Mukaan laskettiin neljä eri painokerrointa: wcal - henkilöpaino kullekin vastaajalle (väestöön korottava paino) wcal_n - analyysipaino kullekin vastaajalle (skaalattu edellisestä siten, että keskiarvo=1 ja summa = vastaajien lukumäärä) wcalhh - kotitalouspaino kullekin taloudelle (kotitalouksien lukumäärään korottava paino) wcalhh_n - kotitalouskohtainen analyysipaino (skaalattu edellisestä siten, että keskiarvo=1 ja summa = vastaajien lukumäärä) Henkilöitä koskevat painot on estimoitu koko aineistolle ottamatta paneelia mitenkään huomioon. Painojen muodostamisessa on oletettu, että jokaisella vastaajalla on ollut yksi ja sama sisältymistodennäköisyys. Kalibrointi paikkaa sekä kadon että paneelin vanhenemisesta aiheutuvan peittovirheen vaikutusta. Kato oli melko suuri "puhtaassa" otososassa, ja melko pieni paneeliosassa. Taustamuuttujina käytettiin seuraavia 18-79-vuotiaan väestön jakaumia: sukupuoli (2 luokkaa), 5-vuotisikäryhmä (paitsi 18-24; 12 luokkaa), maakunta + pääkaupunkiseutu (20 luokkaa) ja tilastollinen kuntaryhmitys (3 luokkaa). Aineisto tuottaa siten oikeat väestöjakaumat näiden luokitusten mukaan. Kalibroinnissa painojen vaihtelua rajoitettiin hieman, mutta se jäi melko suureksi (cv=27 %). Suurimmat painot aiheutuvat paneelin tuottamasta nuorimpien ikäluokkien alipeitosta. Kotitalouspainot estimoitiin oletuksella, että kunkin talouden sisältymistodennäköisyys on verrannollinen taloudessa olevien aikuisten lukumäärään (joka saadaan erotuksena lomakkeen kysymyksistä A1-A2a). Lasten lukumäärä saattoi puuttua tai aikuisten luku olla suuri (yli viisi), josta syystä aikuisten lukumäärä oli sama kuin kotitalouden koko. Näissä tapauksissa aikuisten määräksi imputoitiin 2. Tämän jälkeen aineisto painotettiin käyttäen vertailutietona tulonjako-silc -tutkimuksen ns. master-tiedostoa, josta estimoitiin kotitalouksien koko- ja aluejakaumat. Kokojakauma rajoitettiin kuuteen, johon sitä suuremmat taloudet yhdistettiin. Aluejakaumana käytettiin maakuntaa, ja pääkaupunkiseutu oli erotettu omaksi luokakseen. Kotitalouksien kokonaismäärä on runsaat 2.5 miljoonaa. Tutkimuksen kotitalouksia koskevat tiedot ovat kuitenkin sen verran epätarkkoja, ettei suositella analyysipainojen käyttämistä. Epätarkkuus aiheutuu siitä, ettei tarkkaa koostumusta selvitetä samaan tapaan kuin varsinaisissa kotitalouksia koskevissa tutkimuksissa, joissa tiedot kerätään henkilö henkilöltä. Painojen vaihtelu on melko suurta, cv=47 %, ja lisäksi korottavien painojen jakauma näyttää kaksihuippuiselta. Syytä on hankala sanoa. Yli 80-vuotiaiden käyntihaastelut Vanhusosalle muodostettiin vain henkilöpainot sekä vastaavat analyysipainot. Havaintojen vähyyden vuoksi aluejakaumana on käytetty läänijakaumaa sekä tilastollista kuntaryhmitystä. Ikäluokat rajattiin kolmeen (80-84, 85-89 ja 89+), lisäksi kalibroinnissa käytettiin vastaajan
7 sukupuolta. Painoja rajoitettiin hiukan ylimääräisen varianssin välttämiseksi. Vaihtelu on kuitenkin suurta, painojen cv=20%. Rekisteriyhdistelyt HYPA-aineistot sisältävät useita eri rekistereistä muodostettuja ja yhdistettyjä muuttujia. Käytännössä HYPA-tutkimuksen kaikki taustamuuttujat (työmarkkina-asemaa lukuun ottamatta) perustuvat rekisteritietoihin. Edellä esitettyihin muuttujaluetteloihin on merkitty jokaisen muuttujan kohdalla tieto siitä, perustuvatko muuttujan tiedot rekisteri- vai haastattelutietoihin. Vastaajan demografisia tietoja ja vastaajan kotitalouden rakennetta kuvaavat rekisteritiedot perustuvat väestörekisterin viimeisimpään tietoon, käytännössä kesän 2009 tilanteeseen. Yhdistettyjä tietoja ovat vastaajan ikä, sukupuoli ja nuorimman lapsen ikä. Lisäksi puhelinhaastattelulomake sisälsi joukon kotitalouden kokoa ja lasten lukumäärää koskevia tarkistuskysymyksiä, joiden antamia tietoja verrattiin rekisteritietoihin jo haastattelun aikana. Mikäli haastattelu- ja rekisteritiedot kotitalouden koosta tai rakenteesta erosivat, haastattelija kysyi syytä tälle erillisellä kysymyksellä. Myös postikyselylomake sisälsi tarkistuskysymyksiä, joilla varmistettiin, että rekisteritiedot olivat ajantasaisia ja paikkansapitäviä. Tiedot kotitalouksien tuloista ja tulonsiirroista on yhdistetty vuoden 2008 Tulonjaon kokonaineistosta, joka perustuu verotustietoihin. Kotitalouden katsotaan muodostuvan niistä henkilöistä, jotka asuvat ja ruokailevat yhdessä tai muuten käyttävät tulojaan yhdessä. Vastaajan kotitalous on muodostettu tämän määritelmän perusteella yhdistämällä väestörekisterin tietoja kyselytietoihin. Lisätietoja Tulonjaon kokonaisaineistosta löytyy Tilastokeskuksen sivuilta: http://tilastokeskus.fi/til/tjkt/index.html. Käytettävissä olevien rahatulojen määritelmä perustuu Tulonjakotilaston käyttämään määritelmään ja se voidaan kuvata seuraavasti: Palkkatulot + Yrittäjätulot + Omaisuustulot = Tuotannontekijätulot + Saadut tulonsiirrot = Bruttotulot - Maksetut tulonsiirrot = Käytettävissä oleva rahatulo Lisätietoa Tulonjakotilaston tulokäsitteistä löytyy Tulonjakotilaston (Tilastokeskus) tai Tilastokeskuksen sivuilta: http://www.stat.fi/tk/el/tulo/tulonj.html Kotitalouden saamat tulonsiirrot ovat luokiteltu ESSPROS (The European System of integrated Social Protection Statistics) tulokäsitteiden mukaisesti. Tietoa ESSPROStulokäsitteistä löytyy THL:n sivuilta: http://www.stakes.fi/fi/tilastot/aiheittain/sosiaalipalvelut/sosmenotkasitteet.htm.
8 Vastaajan koulutustiedot puhelinhaastatteluaineistossa perustuvat Tilastokeskuksen tutkintorekisterin viimeisimpään tietoon korkeimmasta tutkinnosta, käytännössä kesän 2009 tilanteeseen. Tutkintokoodit ovat luokiteltu ISCED 1997 (International Standard Classification of Education) luokituksen mukaiseksi. Yhden numeron tasolla ISCED erottelee koulutusasteen, kahdella ja sitä useammalla myös koulutusalan. Puhelinhaastatteluaineistossa sisältää ISCEDluokituksen 2. numeron tarkkuudella. Lisätietoa ISCED-koulutusluokituksesta löytyy Tilastokeskuksen luokituspalvelut -sivuilta: http://www.stat.fi/tk/tt/luokitukset/index_henkilo_keh.html. Vastaajan asuinpaikkatiedot perustuvat väestörekisterin viimeisimpään tietoon, käytännössä kesän 2009 tilanteeseen. Vastaajan asuinkunta on luokiteltu erilaisiin Tilastokeskuksen alueluokituksiin. Lisätietoja löytyy Tilastokeskuksen alueluokitussivuilta: www.stat.fi/tk/tt/luokitukset/index_alue_keh.html Puhelinhaastattelulomakkeen ammattia koskevasta kysymyksistä on muodostettu aineistoon ISCO (International Standard Classification of Occupations) ammattiluokitukset 1, 2 ja 3 numeron tarkkuudella. Lisätietoa ISCO-luokituksesta löytyy Tilastokeskuksen sivuilta: www.stat.fi/tk/tt/luokitukset/index_henkilo_keh.html.