Mielipidetutkimusten mieli



Samankaltaiset tiedostot
Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Jatkuvat satunnaismuuttujat

Luottamusvälit. Normaalijakauma johnkin kohtaan

Matemaatikot ja tilastotieteilijät

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tutkimustiedonhallinnan peruskurssi

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

IHAILLUIMMAT SUOMALAISET 2010 Ketä elossa olevaa, tunnettua suomalaista naista ja miestä suomalaiset ihailevat eniten?

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

KANSALAISET: VAALIKAMPANJASSA SAA LOUKATA, MUTTA EI VALEHDELLA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastotieteen jatkokurssi syksy 2003 Välikoe

YLE Uutiset. PUOLUEIDEN KANNATUSARVIOT, Maalis-huhtikuu 2017 ( ) Toteutus. Tutkimus- ja otantamenetelmä. Tutkimuksen ajankohta

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Kokoomus kyvykkäin puolue SDP ja Keskusta kolmen kärjessä

Suomalaisten käsityksiä kirjastoista

Mielipiteet ydinvoimasta Maaliskuu Mielipiteet ydinvoimasta maaliskuu 2015

Mielipiteet ydinvoimasta Maaliskuu 2014

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

YLE Uutiset. Haastattelut tehtiin Marraskuun 2008 alusta lähtien kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

Mielipiteet ydinvoimasta

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Mittariston laatiminen laatutyöhön

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

TUTKIMUSOSIO Julkaistavissa klo 00:01. Puoluekartta: Oikeistossa kuusi, keskusta-oikeistossa kaksi ja vasemmistossa kolme puoluetta

Perussuomalaisten kannattajien ja vaaleissa nukkuvien luottamus on kateissa

Sovellettu todennäköisyyslaskenta B

&idx=2&uilang=fi&lang=fi&lvv=2015

SUOMALAISTEN SUHDE PUOLUEISIIN. Epäusko puolueiden aikaansaannoksiin on lisääntynyt

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Todennäköisyyslaskenta - tehtävät

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

KOTITALOUKSIEN SÄÄSTÄMISTUTKIMUS Kotitalouksien säästämistutkimus

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

3.7 Todennäköisyysjakaumia

HAVAITUT JA ODOTETUT FREKVENSSIT

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

&idx=2&uilang=fi&lang=fi&lvv=2015

Ammattiyhdistysliikkeeseen luottaa (41 %) vastanneista; vahvimmin Sdp:n (76%) ja vasemmistoliiton (67%) ja heikoimmin kokoomuksen (27%) kannattajat.

Todennäköisyys (englanniksi probability)

Mat Tilastollisen analyysin perusteet, kevät 2007

Presidentinvaalitutkimus 2011

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

SDP olisi suosituin puolue maan hallitukseen

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

6. laskuharjoitusten vastaukset (viikot 10 11)

riippumattomia ja noudattavat samaa jakaumaa.

Hyvä maakuntavaltuutettu ajaa koko maakunnan etua, eikä ole kansanedustaja

YLE Uutiset. Haastattelut tehtiin Kannatusarvio kuvaa tilannetta eduskuntavaalien puoluekannatuksessa.

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

dx=2&uilang=fi&lang=fi&lvv=2015

Presidentinvaalitutkimus, kesä 2011 Taloustutkimus Oy Jari Pajunen & Tuomo Turja

4. laskuharjoituskierros, vko 7, ratkaisut

KANSALAISET: YKSILÖ ITSE VASTUUSSA OMASTA HYVINVOINNISTAAN

Tutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen

Sovellettu todennäköisyyslaskenta B

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Harjoitus 7: NCSS - Tilastollinen analyysi

MONISTE 2 Kirjoittanut Elina Katainen

PUOLUEIDEN KANNATUSARVIOT

Mat Tilastollisen analyysin perusteet, kevät 2007

11. laskuharjoituskierros, vko 15, ratkaisut

Puolueensa kannatusta vahvistaa eniten Li Andersson ja vähiten Touko Aalto

Kesäaikajärjestelyistä luopuminen, syyskuu 2018 Sakari Nurmela Kantar TNS Oy

KUNNAN TÄRKEIMMÄT TEHTÄVÄT: ELINVOIMA, YHTEISÖLLISYYS JA DEMOKRATIA-ALUSTA

YLE Uutiset PUOLUEIDEN KANNATUSARVIOT. Huhtikuu 2017 ( )

} {{ } kertaa jotain

Harjoituspaketti helmikuuta 2008

Totta vai tarua matematiikan paradokseja

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin Yliopisto Harjoitus 1, ratkaisuehdotukset

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

YLE Uutiset PUOLUEIDEN KANNATUSARVIOT. Maaliskuu 2018 ( ) YLE Uutiset

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Todennäköisyys. Antoine Gombaud, eli chevalier de Méré?.? Kirjailija ja matemaatikko

KiVa Koulu tilannekartoituskysely 2016 Koulupalaute: Henrikin koulu

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

dx=5&uilang=fi&lang=fi&lvv=2014

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Teema 8: Parametrien estimointi ja luottamusvälit

Ryväsotanta Hyödyllinen silloin kun ei ole kattavaa otantakehikkoa käytettävissä Etuna tiedonkeruun kustannusten väheneminen ilman että otoksen edusta

Monitasomallit koulututkimuksessa

Suomalainen haluaa asua pientalossa lähellä kaupunkia tiivis, kaupunkimainen rakentaminen torjutaan

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Kansalaiset: Yle, STT ja MTV3 luotetuimmat uutisoijat - sosiaaliseen mediaan ei luoteta (tutkimusosio)

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Iän vaikutus itsetuntoon

Transkriptio:

1 Mielipidetutkimusten mieli Mielipidetutkimuksia ympäröi usein salaperäisyyden verho. Kansalaiset ihmettelevät, voiko kyselyihin luottaa: Miten on mahdollista, että tuhannen henkilön otos edustaa viittä miljoonaa asukasta? Ja miksei minulta koskaan kysytä mitään? Mielipidetutkimuksissa tuhat ihmistä voi todellakin edustaa paitsi kaikkia suomalaisia myös vaikkapa koko Yhdysvaltojen kansaa ja heitä on sentään yli 300 miljoonaa. Tämä on intuition ja arkijärjen vastaista, mutta kun asiaa pohtii hieman tarkemmin, se ei vaikutakaan niin uskomattomalta. Juho Rahkonen Mielipidetutkimuksissa on pohjimmiltaan kyse todennäköisyydestä. Kun satunnaisesti valituilta ihmisiltä kysytään, mitä puoluetta he kannattavat, heillä on rajallinen määrä vaihtoehtoja. Mitä useamman ihmisen kohdalla kysymys toistetaan, sitä pienemmäksi käy todennäköisyys, että he kaikki valitsisivat saman vastausvaihtoehdon. Mielipidetutkimuksissa avainasemassa on otoksen laatiminen: tuhannen vastaajan joukossa pitäisi olla eri-ikäisiä, eri alueilla asuvia, eri ammattiryhmiin kuuluvia, miehiä ja naisia samassa suhteessa kuin koko väestössä. Silloin otoksesta voidaan tehdä kohdejoukkoa (esimerkiksi äänestysikäisiä suomalaisia) koskevia yleistäviä päätelmiä. Klassisen todennäköisyyden tärkein ominaisuus on, että kaikki tapaukset ovat yhtä todennäköisiä. Periaatteessa ja käytännössäkin on mahdollista, että kyselyyn valikoituu esimerkiksi tuhat Sdp:n kannattajaa eikä yhtään muun puolueen kannattajaa. Tällaisten virheiden todennäköisyys on kuitenkin niin häviävän pieni, että elävässä elämässä mielipidemittaukset antavat aina oikeansuuntaisen tuloksen, jos otanta- ja tutkimusmenetelmät ovat kunnossa. Taulukko 1 seuraavalla sivulla havainnollistaa otantasattuman pienenemistä vastaajamäärän lisääntyessä. Kuvitteellisessa esimerkissä kolmesta ensimmäisestä vastaajasta kaikki sattuvat olemaan Sdp:n kannattajia. Neljännessä ja viidennessä vastauksessa mukaan osuu jo muidenkin puolueiden kannattajia. Näin jatketaan, ja mitä useammilta vastaajilta kysytään, sitä enemmän vastaukset alkavat hajota eri vaihtoehtojen kesken. Koko ajan pienenee sen todennäköisyys, että otokseen valikoituisi liian paljon tai vähän tietyllä tavalla ajattelevia ihmisiä. Parinsadan vastauksen kohdalla puolueiden todelliset kannatuserot alkavat yleensä jo näkyä, vaikka tulokset ovatkin vielä siinä vaiheessa varsin epätarkkoja. Kyse on samanlaisesta ilmiöstä kuin nopanheitossa: ensimmäisillä viidellä heitolla nopan silmälukujen jakauma saattaa olla aivan mitä vain viiden ja kolmenkymmenen välillä, mutta kun heittelyä jatketaan, tulokset lähestyvät koko ajan nopan silmälukujen keskiarvoa. Tämä tietysti edellyttää sitä, että noppa on muotoiltu täysin tasaisesti, jolloin jokainen luku on yhtä todennäköinen. Sama periaate pätee mielipidetutkimuksissa: kenellä tahansa kohdejoukkoon kuuluvalla pitää olla yhtä suuri mahdollisuus osua haastateltavien joukkoon.

2 Taulukko 1. Otantasattuman pieneneminen puolueen kannatusmittauksen edetessä kokoomusta Sdp:tä Keskustaa vihreitä vasemmistoliittoa 1. vastaaja * 2. vastaaja ** 3. vastaaja *** 4. vastaaja * 5. vastaaja * 6. vastaaja * 7. vastaaja ** 100. vastaaja ****** ******** **** ********* ******** ******** **** ******** ********** **** **** ******* ****** ************ Todennäköisyyslaskennassa tunnetaan niin sanottu syntymäpäiväongelma: koska vuodessa on 365 päivää, ei tunnu kovin todennäköiseltä, että pienessä ihmisjoukossa olisi henkilöitä, joilla on sama syntymäpäivä. Itse asiassa todennäköisyys on hyvin suuri jo vähäisessäkin joukossa. Esimerkiksi 30 hengen luokassa todennäköisyys, että vähintään kahdella henkilöllä on sama syntymäpäivä, on jopa 80 prosenttia. Syntymäpäiväongelma auttaa ymmärtämään myös mielipiteiden jakautumista: pienessäkin ihmisjoukossa on paljon todennäköisempää, että joillakin ihmisillä on sama mielipide kuin että heillä kaikilla olisi eri mielipide. Miksi juuri 1000 on sellainen luku, jonka katsotaan edustavan koko kansaa? Kysymys on taas todennäköisyydestä ja siitä, miten suuri otantasattuman tuottama riski ollaan valmiita hyväksymään. Todennäköisyyslaskenta on puhdasta matematiikkaa. Se perustuu loogiseen päättelyyn eikä sano mitään reaalimaailmasta se vain tuottaa erilaisia lukuja, ja on sitten yhteinen sopimuskysymys, miten tarkkoja tuloksia käytännössä tarvitaan. Sattuma on mielipidetutkijalle kaksiteräinen miekka: ilman sattuman ja satunnaisuuden olemassaoloa heidän työnsä olisi yksinkertaisesti mahdotonta, mutta toisaalta sattumassa piilee myös virheen vaara. Entropia ja epäjärjestys Entropia on termodynamiikan ja tilastollisen matematiikan perussuure, joka kertoo epäjärjestyksen asteesta. Entropia kuvaa sitä, miten todennäköinen jokin systeemin tila on. Kun saavissa olevaa kiehuvaa vettä viilennetään pesuvedeksi lisäämällä siihen kylmää vettä, veden lämpö jakautuu ensin epätasaisesti: kädellä koskettaessa saavin toisessa reunassa vesi tuntuu vielä liian

3 kuumalta, kun taas toisessa reunassa vesi tuntuu liian viileältä. Jo muutamassa sekunnissa vesi muuttuu kuitenkin tasaisen lämpimäksi. Entropian mukaan on erittäin todennäköistä, että havaintoyksiköt olivatpa ne hiukkasia tai ihmisten mielipiteitä ovat jakaantuneet melko tasaisesti. Sellainen tilanne, että kaikki huoneessa olevat ilmamolekyylit olisivat kasautuneet samaan nurkkaan, on äärimmäisen epätodennäköinen. Samoin on epätodennäköistä, että kiintiöihin perustuvalla satunnaisotannalla tehtyyn mielipidetutkimukseen valikoituisi jokin mielipiteiden kasauma, joka vääristäisi tulosta merkittävästi. Mielipiteitä ei tietenkään voi aivan suoraan verrata fysikaalisiin ilmiöihin, sillä mielipiteet ovat kulttuurisidonnaisia eivätkä ne siksi jakaannu täysin satunnaisesti. Tämän vuoksi otokseen pitääkin saada mahdollisimman edustavasti eritaustaisia vastaajia. Kuvio 1a, epätasainen mielipideavaruus Kuvio 1b, tasainen mielipideavaruus * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * Mahdollisten haastateltavien joukko Otos *= kyllä-mielipide, = ei-mielipide Kuviot 1a ja 1b havainnollistavat otantaan perustuvien mielipidetutkimusten periaatetta. Vasemmalla olevassa kuviossa kyllä- ja ei-mielipiteet ovat kasautuneet mahdollisten haastateltavien joukon eri puolille. Tällainen tilanne on entropian mukaan hyvin epätodennäköinen. Kun tällaiseen mielipideavaruuteen kohdistetaan satunnaisotos (joka kuvioissa jää ympyrän sisäpuolelle), vaarana on tulosten vääristyminen mukaan saattaa valikoitua esimerkiksi pelkkiä ei-mielipiteitä, vaikka koko perusjoukossa niiden osuus olisi esimerkiksi 60 prosenttia. Käytännössä kuitenkin aina vallitsee kuvion 1b kaltainen tilanne, jossa mielipiteet ovat jakautuneet entropian ennustaman epäjärjestyksen lain mukaan (likimain) tasaisesti. Kun tällaiseen mielipideavaruuteen kohdistetaan satunnaisotos, mukaan valikoituu hyvin suurella todennäköisyydellä sama osuus mielipiteitä kuin on koko perusjoukossa. (Huom. Kuvioissa mielipiteiden jakaumia ei ole kuvattu täysin tasaisiksi, koska elävässä elämässä mielipiteet jakautuvat vain likimain tasaisesti. Matemaattisin termein voidaan todeta, että perusjoukon kasvaessa mielipiteiden jakauma lähestyy täydellistä tasaisuutta.) Kuten edellä on jo todettu, kiintiöpoiminnalla pyritään sekoittamaan pakkaa niin, että mahdollisten vastaajien joukossa on eritaustaisia ihmisiä samassa suhteessa kuin koko väestössä. Jos

4 otokseen valitaan liikaa tiettyihin ryhmiin kuuluvia ihmisiä, heidän mielipiteensä eivät edusta koko väestöä. Seuraava historiallinen esimerkki valaisee asiaa: Tieteellisten mielipidemittausten alkuaikoina, vuonna 1936, Valitut Palat -lehti lähetti kymmenen miljoonaa kyselykorttia saadakseen selville presidenttiehdokkaiden kannatuksen. Yli kaksi miljoonaa korttia palautettiin, mutta tutkimus meni silti mönkään. Otos ei ollut edustava: koska lehti oli lähettänyt korttinsa puhelimen ja auton omistaville kansalaisille, vastaajajoukkoon valikoitui liian vähän työväenluokan edustajia. George Gallup onnistui puolestaan paljon pienemmällä otoksella, noin 50 000:lla, ennustamaan Franklin D. Rooseveltin voiton. Tarinan opetus: ei se koko vaan edustavuus. Normaalijakauma Puhtaasti satunnaiset, toisistaan riippumattomat ilmiöt jakautuvat useimmiten niin, että ne noudattavat likimain normaalijakaumaa. Normaalijakauman kuvaajasta käytetään usein nimitystä kellokäyrä tai Gaussin käyrä, normaalijakaumaa kehitelleen matemaatikko Carl Friedrich Gaussin mukaan. Arkikielellä normaalijakauma tarkoittaa sitä, että ääripäiden arvoja on vähemmän kuin keskiarvoa lähellä olevia arvoja. Esimerkiksi ihmisten pituudet muodostavat normaalijakaumaa muistuttavan kuvaajan: suurin osa aikuisista ihmisistä on suunnilleen keskipituisia tai parikymmentä senttimetriä yli tai ali. Todella pitkä- ja lyhytkasvuiset ovat vähemmistönä. Usein mielipidetutkimusten tulokset lähestyvät normaalijakaumaa. Jos kysytään vastaajien mielipidettä jostain asiasta esimerkiksi viisiportaisella Likertin asteikolla, jossa 5=täysin samaa mieltä, 4=samaa mieltä jne., ääripäiden vastauksia tulee yleensä vähemmän kuin keskiarvoa lähellä olevia vastauksia. Tämä ei kuitenkaan ole mikään yleispätevä sääntö: joskus vastaukset voivat painottua jompaankumpaan ääripäähän hyvinkin voimakkaasti. Jos mielipiteet menisivät aina normaalijakauman mukaan, mielipidetutkimuksia ei edes kannattaisi tehdä, koska tulos tiedettäisiin etukäteen. Kansalaisten mielipide jostakin asiasta ei ole täysin satunnainen ilmiö, vaan se riippuu monista tekijöistä. Esimerkiksi noppaa heitettäessä tulokset alkavat ennen pitkää asettua normaalijakauman mukaisesti: tulosten keskiarvo lähenee koko ajan 3,5:tä. Tarkkaan ottaen väestön pituus ei noudata normaalijakaumaa, koska se ei ole puhtaasti satunnainen ilmiö: esimerkiksi ravitsemustilanne sekä tulo- ja elintasoerot vaikuttavat ihmisten pituuteen. Vielä enemmän yhteiskunnallisiin taustatekijöihin ovat sidoksissa mielipiteet. Mielipidetutkimuksissa normaalijakaumalle onkin eniten käyttöä arvioitaessa tulosten tarkkuutta mm. keskihajonnan ja virhemarginaalin avulla.

5 Power-law eli vallan laki Kuvio 2. Pitkä häntä mielipidetutkimuksissa 90 80 70 60 50 40 30 20 10 0 Tarja Halonen Kirsti Paakkanen Tanja Karpela Anne Brunila Paula Lehtomäki Riitta Uosukainen Lenita Airisto Tuija Brax Tarja Cronberg Elisabeth Rehn Sari Baldauf Paula Risikko Sirkka Hämäläinen Hannele Pokka Suvi Lindén Liisa Hyssälä Jaana Laitinen Pesola Sari Sarkomaa Suvi Anne Siimes Tuuli Matinsalo Silloin, kun tutkimus koostuu monista pienistä havaintoyksiköistä, tulokset asettuvat usein pikemminkin power-law-jakauman kuin normaalijakauman mukaisesti. Power law eli vallan laki tunnetaan myös nimellä pitkä häntä. Kuvio 2 perustuu tutkimukseen, jossa vastaajia pyydettiin nimeämään kolme Suomen vaikutusvaltaisinta naista. Kun tulokset laskettiin yhteen, havaittiin presidentti Tarja Halosen saaneen 80 prosenttia kaikista äänistä. Listan kakkosena tullut Kirsti Paakkanen sai yhdeksän prosenttia ja kolmonen Tanja Karpela kuusi prosenttia. Kymmenkunta naista sai yhden kahden prosentin ääniosuuksia, ja heidän takanaan tuli vielä pitkä lista yksittäisiä hajamainintoja saaneita naisia. Samanmuotoisia kuvaajia syntyy, kun verrataan esimerkiksi suosituimpia Internet-sivustoja tai myydyimpiä kirjailijoita ja muusikoita: niissäkin pienen pieni joukko, usein vain muutama toimija, vie valtaosa koko potista. Suosituimpien kapean kärjen takana on valtava joukko paljon vähemmän tunnettuja toimijoita, joiden myyntitulos tai kävijämäärä ei yhteenlaskettunakaan riitä jättiläisten tasolle. Tulosten tulkinta Virhemarginaali kertoo siitä, millaisia riskejä otantasattuma aiheuttaa tulosten yleistettävyydelle otokseen saattaa valikoitua liian suuri tai pieni osuus tietyllä tavalla ajattelevia ihmisiä. Tällaisten vääristymien mahdollisuutta pyritään välttämään poimimalla vastaajat kiintiöiden mukaan ja täysin satunnaisesti: periaatteessa kenellä tahansa kohdejoukkoon kuuluvalla on yhtä suuri todennäköisyys tulla valituksi vastaajien joukkoon. Virhemarginaalin suuruus riippuu kahdesta muuttujasta: vastaajamäärästä ja tulokseksi saadusta prosenttiluvusta. Virhemarginaali on sitä suurempi, mitä lähempänä tulos on 50:tä prosenttia. Arkijärjellä ajateltuna vaikuttaisi siltä, että esimerkiksi Yhdysvalloissa kansan mielipiteiden selvittäminen vaatisi suuremman vastaajajoukon kuin Suomessa, koska yhdysvaltalaisia on paljon

6 enemmän kuin suomalaisia. Maan väkiluvulla ei kuitenkaan ole merkitystä, kunhan kiintiöpoiminta ja kysely on suoritettu oikein. Periaatteessa asia kyllä on niin kuin arkijärki sanoo: mitä enemmän vastaajia, sitä tarkempi kysely. Olennaista on kuitenkin se, että muutaman tuhannen vastaajan jälkeen otoskoon kasvattaminen pienentää virhemarginaalia niin vähän, ettei sillä ole käytännössä suurta merkitystä (kuvio 1). Kuvio 1. Vastaajamäärän vaikutus virhemarginaaliin *Kuvion virhemarginaali on laskettu sellaisesta tutkimuksesta, jossa vastauksien prosenttiosuus on 40 tai 60. Tämä on melko tavanomainen vastausten jakauma. Mitä lähempänä tulokseksi saatu prosenttiluku on 50:tä, sitä jyrkempi kuviossa olevasta käyrästä muodostuu. Mitä lähempänä tulos on nollaa tai sataa, sitä loivempi käyrä on. Kuten kuviosta 1 nähdään, vastaajamäärän lisääminen pienentää virhemarginaalia ensin jyrkästi, mutta jo noin 150 vastaajan kohdalla pieneneminen alkaa nopeasti hidastua. Tällä kohdalla virhemarginaali on yhä noin ±8 prosenttiyksikköä. Yleisesti katsotaan, että tuhannen henkilön otos on riittävä edustaviin mielipidekyselyihin: tällä vastaajamäärällä virhemarginaali on ±0,9 3,2 prosenttiyksikköä riippuen siitä, mikä on kyselyn tulokseksi saatu prosenttiluku. Nollan prosentin virhemarginaaliin päästään vain kysymällä jotain asiaa kaikilta kohdejoukkoon kuuluvilta. Koska käytännössä ei ole mahdollista tavoittaa kaikkia yli neljää miljoonaa äänestysikäistä suomalaista, parin kolmen prosenttiyksikön virhemarginaalilla toimivan kyselytutkimuksen katsotaan olevan riittävän tarkka. Joskus esimerkiksi puoluekannatusten mittaamisessa on perusteltua käyttää tavallista suurempaa otoskokoa, jotta virhemarginaali saataisiin vielä pienemmäksi ja puolueiden kannatuseroja voitaisiin verrata paremmin. 2000 3000 vastaajalla virhemarginaali saadaan puristetuksi jopa alle prosenttiyksikköön.

7 Vastaajamäärän noustessa kustannuksetkin kasvavat, sillä jokainen vastaaja täytyy saada kiinni tavalla tai toisella. Esimerkiksi puhelinhaastatteluissa tyypillinen haastattelu kestää muutaman minuutin, mutta saadakseen esimerkiksi tuhat vastaajaa haastattelijoiden täytyy yleensä tavoitella vähintään nelinkertaista määrää. Kirje- ja Internet-kyselyissä vastausprosentit jäävät yleensä reilusti alle 50:n. Henkilökohtaisissa käyntihaastatteluissa hyötysuhde on vielä heikompi: jokaista loppuunvietyä haastattelua kohde täytyy käydä kolkuttamassa noin kymmenellä ovella. Osa haastateltavista kieltäytyy, osalla ei ole aikaa, osa ei ole juuri silloin paikalla, ja osaa ei tavoiteta lainkaan. Kysymysten järjestys Mielipidetutkimuksissa ei aina ole yhdentekevää, millaisessa järjestyksessä kysymykset esitetään. Taloustutkimuksessa tehtiin alkuvuonna 2008 kaksi erillistä tutkimusta mielipidemittausten vaikutuksesta politiikkaa koskevaa kiinnostukseen. Kummassakin tutkimuksessa oli tuhannen vastaajan edustava otos, ja ne tehtiin lähes samanaikaisesti. Kysymysten sanamuodotkin olivat täsmälleen samat. Ainoa ero oli, että toinen tutkimus alkoi kiinnostusta koskevalla kysymyksellä ja toisessa tutkimuksessa kiinnostuskysymystä edelsi neljä politiikkaan (Sdp:n puheenjohtajakamppailuun) liittyvää kysymystä. Verrattaessa kyselyiden tuloksia havaittiin, että politiikkaa koskevat kysymykset vaikuttuvat siihen, miten suureksi vastaajat arvioivat politiikkaa koskevan kiinnostuksensa. Taulukko 2. Edeltävien kysymysten vaikutus vastauksiin politiikkakyselyssä Miten paljon politiikka kiinnostaa Teitä? Tutkimus, joka alkoi tällä kysymyksellä Tutkimus, jossa tätä kysymystä edelsi neljä ajankohtaista politiikkaan liittyvää kysymystä Erittäin paljon 7 6 Paljon 24 37 Vähän 54 49 Ei ollenkaan 15 7 Ei vastausta/eos 1 Muiden kysymysten kohdalla kahden eri tutkimuksen vastausjakaumissa ei ollut tilastollisesti merkittäviä eroja. Tätä kysymystä edeltäneet neljä politiikka-aiheista kysymystä olivat ilmeisesti virittäneet vastaajissa sellaisen tunnelman, että politiikka on kiinnostavaa. Huomionarvoista on, että niihin vastaajiin, joita politiikka kiinnosti jo valmiiksi erittäin paljon, edeltävät kysymykset eivät

8 ole vaikuttaneet. Sen sijaan ne ovat vähentäneet alle puoleen niiden määrän, joita politiikka ei kiinnosta ollenkaan. Mikä tekee mielipidetutkimuksista tieteellisiä? Jotta mielipidetutkimus olisi luotettava, otos täytyy kerätä niin, että eri väestöryhmät ovat edustettuina oikeassa suhteessa. Tämä on yleisin tekijä, joka erottaa tieteelliset mielipidemittaukset muista kyselyistä. Tieteellisyyden vaatimukset voidaan tiivistää seuraavasti (Holopainen & Pulkkinen 2002, 11). Tieteellinen menetelmä on looginen objektiivinen yleistettävissä oleva todennettavissa oleva yhteensopiva teorian ja havaintojen kanssa Yllä olevat ehdot täytyy rajata koskemaan vain tutkimuksen teknistä toteuttamista, sillä tutkimukseen liittyy aina myös subjektiivinen puoli, oli se miten tieteellisesti ja objektiivisesti toteutettu. Asiaa kuvastaa hyvin yhteiskuntatutkijan lausahdus määrällisen tutkimuksen luonteesta: Aineisto heijastaa muuntuneena takaisin tutkijan käsitysmaailmasta tehdyt kysymykset. Siinä mielessä aineisto ei ole vain empiriaa, vaan materialisoitunut kaiku. (Suvi Ronkainen väitöskirjassaan Ajan ja paikan merkitsemät, Gaudeamus 1999) Mielipidetutkimus on oikeastaan vain muodon antamista olemassa oleville aineksille. Jo ennen tutkimuksen tekemistä määritellään ainekset eli kysymykset ja mahdolliset vastausvaihtoehdot. Lopullinen tutkimus kuvaa siis näiden ainesten keskinäisiä suhteita aineistossa. Näin ajateltuna mielipidetutkimuksissa varsinainen tiedonkeruu on vain yksi, pienehkö osa koko tutkimusta. Toki tiedonkeruu on yleensä mielipidetutkimuksen teknisesti ja taloudellisesti vaativin osuus. Mielipidetutkimusten tekeminen on jatkuvaa vuoropuhelua tilastollisten tunnuslukujen ja tutkijan oman tulkintatyön välillä. Erilaisilla tilastollisilla testeillä voidaan arvioida, onko esimerkiksi jokin ero tilastollisesti merkitsevä. Tilastollisen testin perusteella on kuitenkin mahdollista vain arvioida kyseiseen mielipiteeseen liittyvää riskiä sille, että otoksen perusteella perusjoukosta tehty johtopäätös on virheellinen lopullinen päätöksenteko jää aina tutkijalle (Heikkilä 1998, 181). Esimerkiksi Uusi Suomi -Internet-lehden omassa kyselyssä joulukuussa 2007 61 prosenttia vastaajista kannatti Suomen Nato-jäsenyyttä ja 33 prosenttia vastusti sitä. Kaikissa satunnaisotannalla tehdyissä kyselyissä viimeisten kymmenen vuoden aikana luvut olivat olleet päinvastoin. Uuden Suomen kysely ei siis millään voinut edustaa Suomen kansan mielipidettä, eikä lehti tällaista väittänytkään. Jutussa tuotiin esiin, että vastaajajoukko oli ilmeisen valikoitunutta, minkä vuoksi Nato-jäsenyys sai poikkeuksellisen muhkeat kannatuslukemat. i Tiivistetysti voidaan sanoa, että tieteellisin menetelmin tehdyssä mielipidetutkimuksessa vastaajat valitaan ennen kyselyä, kun taas epätieteellisissä kyselyissä tutkimus valitsee itse vastaajansa.

9 i http://www.uusisuomi.fi/kotimaa/7885-poikkeuksellinen-kyselytulos-nato-kannatus-61 (10.1.2008) Holopainen, Martti & Pulkkinen, Pekka 2002: Tilastolliset menetelmät. Helsinki: WSOY Heikkilä, Tarja 1998: Tilastollinen tutkimus. Helsinki: Edita