Kyselytutkimusten. Erkki Pahkinen Kyselytutkimusten otantamenetelmät ja aineistoanalyysi. Erkki Pahkinen OTANTAMENETELMÄT JA AINEISTOANALYYSI



Samankaltaiset tiedostot
JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Tilastollisen tutkimuksen vaiheet

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

Vuonna 2013 talonrakennusalan yritysten tuotot korjausrakentamisesta olivat 6 miljardia euroa

Ulkoilututkimus Luonnon virkistyskäytön valtakunnallinen inventointi, LVVI2 -tutkimus

Tutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen

MONISTE 2 Kirjoittanut Elina Katainen

Talonrakennusalan yritysten korjausrakentamisen urakoista kertyi 7,6 miljardia euroa vuonna 2016

Suomalaisten matkailu

Korjausrakentaminen 2012

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

Talonrakennusalan yritysten korjausrakentamisen urakoista kertyi 6,8 miljardia euroa vuonna 2015

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Mielipidemittaus maailman muutoksen kuvaajana

Ohje tutkimustiedon tulkintaan

Kuntatalous neljännesvuosittain

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

YLE Uutiset PUOLUEIDEN KANNATUSARVIOT. Huhtikuu 2017 ( )

PUOLUEIDEN KANNATUSARVIOT

Webropol-kyselyt. Tarja Heikkilä

Kuluttajabarometri: taulukot

Kuluttajabarometri: taulukot

YLE Uutiset PUOLUEIDEN KANNATUSARVIOT. Maaliskuu 2018 ( ) YLE Uutiset

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

European Social Survey Miten tiedot kerättiin? Marko Ylitalo Metodifestivaalit, Tampere

Tiedontuotanto kalastusmatkailusta - kyselytutkimuksen tuloksia

Rakennusyritysten rakennuksiin kohdistuvien korjausurakoiden arvo oli 8,9 miljardia euroa vuonna 2017





Rastita se vaihtoehto, joka parhaiten kuvaa omaa mielipidettä asiasta

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

YLE Uutiset. PUOLUEIDEN KANNATUSARVIOT, Maalis-huhtikuu 2017 ( ) Toteutus. Tutkimus- ja otantamenetelmä. Tutkimuksen ajankohta

Suomalaisten matkailu

Kuluttajabarometri: taulukot

Kuluttajabarometri: taulukot

TALOUSTUTKIMUS OY TYÖNTEKIJÖIDEN N=1010

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastokeskuksen liikevaihtoindeksien ennakkotietojen estimointimenetelmän kehittäminen. Heli Holtari. Tilastotieteen pro gradu -tutkielma

Kuinka tutkijat hakevat tietoa Aaltoyliopiston

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Oppilaitosten aikuiskoulutus 2012

Reijo Manninen, fysiikan lehtori. Tampereen Ammattikorkeakoulu. Insinöörikoulutuksen foorumi 2010 Hämeenlinna

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?

Vankien poistumislupakäytännöt ja niiden yhteneväisyys

Oppilaitosten aikuiskoulutus 2014

Suomalaisten matkailu

Kvantitatiivisen aineiston analyysi

Lehtitarjonta lisännyt kilpailua lukijoista

Presidentinvaalitutkimus, kesä 2011 Taloustutkimus Oy Jari Pajunen & Tuomo Turja

Mat Operaatiotutkimuksen projektityöseminaari

Ammattikorkeakoulukoulutus 2012

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Suomalaisten matkailu

Vähittäiskaupan määrävuosiselvitys 2012

Monitasomallit koulututkimuksessa

TOHTORINKOULUTUKSEN TUTKIMUSPERUSTAINEN KEHITTÄMINEN OULUN YLIOPISTOSSA

Harjoitus 7: NCSS - Tilastollinen analyysi

Oppilaitosten aikuiskoulutus 2015

Teema 8: Parametrien estimointi ja luottamusvälit

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Avoimia työpaikkoja toisella neljänneksellä yhtä paljon kuin vuosi sitten

Kuluttajabarometri: taulukot

Kuluttajabarometri: taulukot

Case Omnia, LAHP10SEA : Atto-aineita osittain työssäoppien päiväkodissa, sosiaali ja terveysalan pt.

Liikkumistutkimus 2018: tutkimussuunnitelma

Presidentinvaalitutkimus 2011

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

Suomalaisten matkailu

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

KVANTITATIIVISEN TUTKIMUSAINEISTON KUVAILU

Neuvontaa käyttäytymistieteellisen tiedekunnan opiskelijoille tilastollisten menetelmien käytössä kevätlukukaudella 2007

Oppilaitosten aikuiskoulutus 2016

Ammattikorkeakoulukoulutus 2013

Oppilaitosten aikuiskoulutus 2011

Oppilaitosten aikuiskoulutus 2017

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

KALEVAN POJAT JUKOLAN VIESTISSÄ VUODET

Ryväsotanta Hyödyllinen silloin kun ei ole kattavaa otantakehikkoa käytettävissä Etuna tiedonkeruun kustannusten väheneminen ilman että otoksen edusta

Perhe- varallisuus- oikeus. Aulis Aarnio Urpo Kangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Oppilaitosten aikuiskoulutus 2013

Avaa ovi työelämään! Work Pilots yhdistää työn tarjoajat ja tekijät keikkatöiden osalta. läheltä, helposti, nopeasti

Otannasta ja mittaamisesta

Transkriptio:

ISBN 978-951-39-4687-6 Otantamenetelmin kerätyt kyselyaineistot ja niis tä tuotetut tutkimukset ovat nyky-yhteiskunnan arkea. Kirja perehdyttää lukijan otanta-aineistojen keräysja analyysimenetelmien periaatteisiin ja ennen kaikkea siihen, kuinka kyselytutkimukset ja analyysit tehdään oikein! Kirja sisältää mm.: väestö- ja yritysotoksien poimintamenetelmät tietojen keräys haastatteluna tai verkkokyselynä otanta-aineiston analyysimenetelmät esimerkkiaineistoina PISA 2003, Vaaligallup 2008, Suomalaisten matkailu 2002 jne. suomi-englanti-suomi -hakusanasto Kirja on suunnattu mm.: tutkijoille, jotka keräävät tai analysoivat otanta-aineistoja tilastomenetelmien metodeja opiskeleville tutkijoille ja opiskelijoille metodikäsikirjaksi yliopistojen ja oppilaitosten kurssikirjaksi Harjoitusohjelma ohjattuun tai itseoppimiseen: mukana on esimerkein varustettuna SPSS-ohjelman käyttöohje otanta-aineistojen poiminta- ja analysointimenetelmiin Kirjoittaja on emeritus prof. Erkki Pahkinen Jyväskylän yliopistosta. Hän on toiminut tilastotieteen laitoksen surveymetodologian professorina vuosina 1995-2000. Erkki Pahkinen Kyselytutkimusten otantamenetelmät ja aineistoanalyysi Erkki Pahkinen Kyselytutkimusten OTANTAMENETELMÄT JA AINEISTOANALYYSI JULPU 2012 JULPU JULPU

Kuvassa on Jukolan viestisuunnistuksen (7 vaihtoa) iltalähtö 18.6.2011. (Kilpailun järjestäjä Vehkalahden Veikot). Tehtävä: a) mitä taustatietoja käyttäisit ja b) millä otanta-asetelmalla poimisit 21 juoksijan otoksen doping-mittaukseen. Joukkueita on 1500 ja jokaisessa niistä 7 suunnistajaa. Lukijalle Otantamenetelmin kerätyt kyselyaineistot ja niistä tuotetut tilastot ovat nyky-yhteiskunnassa arkea. Näitä tilanteita esiintyy mitä erilaisimmassa yhteiskunta- ja talousalan tutkimuksissa, yliopistoissa eri oppiaineiden tutkimusprojekteissa ja markkinatutkimusyrityksissä. Tämän kirjan tarkoitus on perehdyttää lukija tällaisten aineistojen tuotanto- ja analyysimenetelmien perusteisiin. Ne on syytä tuntea, varsinkin jos aikoo itse osallistua kyselytutkimuksen tekoon tutkijana tai käyttää omassa opinnäytetyössään otannalla kerättyä havaintoaineistoa. Tutkijalle on silloin ensiarvoisen tärkeää otantamenetelmien perustuntemus eli se miten aineisto edustaa taustalla olevaa väestöä tai yrityskantaa ja miten otannasta ja mittauksista aiheutuva satunnaisuus on huomioitava tilastolaskelmissa Tätä kirjaa voidaan pitää II-painoksena kirjasta, jonka kirjoitin yhdessä prof. Risto Lehtosen kanssa 1989. Noista ajoista kyselytutkimusten metodiikka ja käytänteet ovat menneet eteenpäin, joten puolet aikaisemman kirjan sisällöstä on päivitetty ja toinen puoli vaihdettu täysin uuteen. Uusina alueina ovat tulleet mm. havaintoaineiston puuttuvien tietojen käsittely, aluetilastojen laskentatekniikka, mielipidemittauksissa sovellettu kiintiöpoiminta sekä elektronisiin kyselylomakkeisiin liittyvät käytänteet. Tekstin punaisena lankana on otannasta aiheutuva satunnaisuus, sen arvioiminen, ja kuinka se vaihtelee otantamenetelmittäin. Tämän vuoksi sisältö on yhdeltä osalta kiinnitetty pieneen, esimerkkinä olevaan kuntarekisteriaineistoon, josta eri otantamenetelmin poimitaan samankokoisia kuntaotoksia. Otoksista lasketaan aina sama tunnusluku, joka on läänitason työttömien lukumäärä. Lukija näkee siten selvästi miten otanta-asetelma muokkaa laskentatuloksia, vaikka kaikissa tapauksissa kohteena oleva tunnusluku, otoskoko ja perusjoukko ovat aina samat. Kyselytutkimuksen tuloksiin tulee satunnaisuutta myös muuta kautta kuin otannasta. Tällaisia ovat vastauskato ja kysymysasetteluihin liittyvät mittavirheet. Kirja sisältää molempiin ongelmakohtiin keskittyvät aliluvut.

Erkki Pahkinen GSM- 050-5126174 22.3.2012 2(5) Esimerkkeinä on aineistoja suurkyselyistä kuten kansainvälinen koulusaavutustutkimus eli PISA 2003. Siinä näkyy, miten monimutkaisia perusasetelmista yhdistellen koostetut suurkyselyt ovat, ja miten tällöin laskentatekniikka mutkistuu. Markkinatutkimusyritykseltä on kaksi kiintiöasetelmin kerättyä haastatteluaineistoa, joista toinen Vaaligallup 2008 käsittelee puoluekannatusta. Kiintiöinnin ongelma on vastaajien valikoituminen ja miten siitä aiheutuva virhe korjataan. Tilastokeskuksen tutkimus Suomalaisten matkailu 2002 toimii alustana, ja siinä vuorostaan näytetään tietokoneavusteisen haastattelulomakkeen elektroninen ohjausrakenne ja myös miten sitä voidaan käyttää vastausrasitteen mittaamiseen ja yleensä mittaustarkkuuden parantamiseen. Mikään oppikirja ei synny ilman yhteistyötä, niin ei tämäkään. Minulla on ilo kiittää useita henkilöitä. Prof. Leif Nordberg Åbo Akademista on tehnyt suuren työn esitarkastamalla käsikirjoituksen otanta-asetelmien ja tilastotieteen näkökulmasta. Taloustutkimus Oy:n IT johtaja Jukka Puska on antanut tärkeää tukea markkinatutkimuslaitosten mielipidetiedustelujen tekniikan selvityksessä. Tilastokeskuksen erikoistutkija Petri Godenhjelm on tarkistanut kysymysten tekotekniikkaan ja testaukseen liittyvän aliluvun. Kustantajan taholta Pekka Olsbo on tehnyt merkittävää oikoluku- ja tarkistustyötä ja Ville Korkiakangas vastannut teoksen taitosta. Sisällön eräs uutuus on opiskelija Juho Kopran kirjoittama algoritmi, jonka avulla tuotettu perusjoukon listausjärjestys johtaa systemaattisessa otannassa optimaaliseen estimointiin. Viimevaiheen tarkistuksiin on osallistunut opiskelija Teemu Holopainen. Yliopistotasolla kirja sopii otantamenetelmien perusoppikirjaksi. Sisältöaineiden opiskelijat, joiden opinnäyte perustuu kyselyaineistoon, voivat käyttää tätä metodikäsitteiden hakuteoksena. Alan kansainvälisyydestä johtuen esim. hakusanasto on kaksikielinen suomi-englanti. Kirjalla voi olla valikoitua käyttöä myös ammattikorkeakoulujen metodiopetuksessa. Viimeisessä aliluvussa on SPSS ohjelman käyttöohje koskien sekä otoksien poimintaa että otosaineistojen analyysiä. Tämän avulla lukija voi tehdä saman aliluvun harjoitustehtävät, ja omaksua sitä kautta otantamenetelmien perusteet tekemällä opitaan oppimismallia noudattaen. Harjoitustehtävät on testattu Jyväskylän yliopiston matematiikan ja tilastotieteen laitoksen otantamenetelmien kursseilla. Kiitos kuuluu harjoituksiin osallistuneille opiskelijoille heidän antamistaan palautteista sekä ohjaajille, joina ovat olleet lehtori Harri Högmander, tohtorikoulutettava Jouni Helske Jyväskylän yliopistosta, ja yliopettaja Mauno Keto Mikkelin Ammattikorkeakoulusta. Jyväskylässä helmikuun 11 päivänä 2012. Erkki Pahkinen

Erkki Pahkinen GSM- 050-5126174 22.3.2012 3(5) Kustantaja: JULPU Jyväskylä University Library Publishing Unit (242 s.) Sisällysluettelo 1. Johdanto kysely- ja otantatutkimusten metodiikkaan......6 1.1 Esimerkkiaineistot... 15 2. Otanta-asetelma ja estimointi.19 2.1 Yksinkertainen satunnaisotanta alkiotasolla..19 2.2 Otanta-asetelmasta aiheutuva satunnaisuus..23 2.3 Yksinkertainen satunnaisotanta ryvästasolla..33 2.3.1 Rypäiden sisäkorreloituneisuus ja asetelmakerroin.37 2.3.2 Kaksiasteinen ryväsotanta 39 2.3.3 Systemaattinen otanta ryväsotannan erikoistapauksena..42 2.4 Ositettu otanta ja ositekohtainen otoksen kiintiöinti 49 2.5 Otanta tilastoyksikön koon mukaan.....58 2.6 Otannan porrastus kaksiasteiseksi tai vaiheiseksi.65 2.7 Otoskoon määrääminen.70 3. Aputiedot ja mallinnus otanta-aineiston laskentavaiheen tukena. 74 3.1 Otanta-aineiston jälkiositus..75 3.2 Malliavusteisesti tehostettu suhde- ja regressioestimointi.78 3.3 Malliperusteinen estimointi otanta-aineistosta..83 3.4 Otanta-asetelmien tehokkuusvertailu 86

Erkki Pahkinen GSM- 050-5126174 22.3.2012 4(5) 4. Aluetilaston laadinta otanta-aineistosta..91 4.1 Asetelmaperusteiset ja malliavusteiset alue-estimaatit...91 4.2 Aluemalleihin perustuvat alue-ennusteet..95 4.3. Alue-estimoinnin laatumittarit..105 4.4 Otoksen kiintiöinti aluetilastojen näkökulmasta.106 5. Estimointi ja testaus moniasteisissa otanta-asetelmissa..109 5.1. Linearisointimenetelmä..111 5.2. Otoksen uudiskäytön menetelmät.. 115 5.3 Tilastollisten testisuureiden asetelmakorjaukset PISA 2003 121 5.4 Regressiomallin sovitus moniasteiseen otanta-asetelmaan. 128 6. Puuttuvien tietojen aiheuttaman vastauskadon hallinta.136 6.1 Vastauskato aiheuttaa tulosharhaa ja epätarkkuutta..137 6.2 Vastauskadon korjaus otantapainoja korottaen 138 6.3 Aineiston paikkaus eli imputointi..144 7. Mielipidetiedustelut ja kiintiöasetelmat..151 7.1 Kiintiöasetelma ja kiintiöiden täyttö 152 7.2 Otantapainojen muokkaus kalibroinnilla..154 7.3 Kiintiöinti puhelinhaastattelussa; vaaligallup 2008..159 7.4 Kiintiöinti käyntihaastattelussa; ydinvoimavastaisuus. 163 8. Mittausmenetelmät ja välineet kyselytutkimuksissa. 168 8.1 Kysymysten laatiminen ja esitestaus..170 8.2 Tietokoneavusteisten kyselyiden toimivuus ja laatu.. 175 8.3 Toistettujen e-kyselyiden laatuarviointi......182 9. Loppukatsaus otanta-aineistojen tuotantomenetelmiin.187 10. Tekemällä opitaan; harjoitusaiheita sisällön omaksumiseen...191

Erkki Pahkinen GSM- 050-5126174 22.3.2012 5(5) 10.1 SPSS ohjelmiston käyttöohje otanta-asetelmien osalta 195 Lähdekirjallisuus..202 Hakusanasto suomi-englanti...205