Perusjoukko ja otos Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Havaitoyksikkö o empiirise mittaukse kohde Perusjoukko o kaikkie havaitoyksiköide muodostama kokoaisuus Otos o perusjoukkoa pieempi havaitoyksikköjoukko, joho mittaus kohdistetaa Mikko Mattila 2010 1 Mikko Mattila 2010 2 Tilastollie päättely Kuvaileva tilastoaalyysi tiivistää iformaatiota muuttujie omiaisuuksista ja iide välisistä suhteista Ei ole tarkoitus tehdä yleistyksiä perusjoukosta Tilastollise päättely avulla voidaa tehdä johtopäätöksiä perusjoukosta Kuika hyvi otokse avulla mitatut tulokset voidaa yleistää koko perusjoukkoa koskeviksi tuloksiksi? Mikko Mattila 2010 3 Luottamusväli ja -taso Luottamusväli kertoo mille välille perusjouko tuusluvu arvo sijoittuu tietyllä todeäköisyydellä Esim. 95% todeäköisyydellä suomalaiste Nato-kaatus sijoittuu 40-50% välille Mikko Mattila 2010 4 Luottamusväli ja -taso Luottamustaso kertoo, millä todeäköisyydellä perusjoukkoa kuvaava tuusluku o tietyllä luottamusvälillä Edellisessä esimerkissä 95% o luottamustaso Luottamusväli tietämiseksi täytyy tietää luottamustaso ja päivastoi Mitä korkeampi luottamustaso, sitä pidempi luottamusväli ja päivastoi Otatajakauma Luottamusväli laskemiseksi tarvitaa tietoa otatajakaumasta Otatajakauma o tuusluvu jakauma, joka saadaa ottamalla kaikki määräty kokoise otokset perusjoukosta Esim. otetaa kaikki mahdolliset 1000 hege otokset suomalaisista ja lasketaa Nato-kaattajie osuus jokaisesta otoksesta Tuusluku voi olla osuus, keskiarvo, keskihajota, korrelaatiokerroi, regressiokerroi je. Mikko Mattila 2010 5 Mikko Mattila 2010 6 1
Keskivirhe Keskivirhee laskemie Otatajakauma omiaisuudet voidaa määritellä laskeallisesti tilastotietee meetelmi Luottamusväli laskemiseksi tarvitaa tieto tuusluvu keskivirheestä Tuusluvu keskivirhe kuvaa se otatajakauma hajotaa Jos kyse o osuudesta (esim. kuika mota prosettia suomalaisista kaattaa Nato- jäseyyttä), se saadaa kaavasta: S=keskivirhe, p=kaattajie prosettiosuus, q=vastustajie prosettiosuus, =otoskoko. pq Mikko Mattila 2010 7 Mikko Mattila 2010 8 Keskivirhee laskemie Jos kyse o keskiarvosta (esim. mikä o suomaiste keskipalkka) saadaa keskivirhe kaavasta: Kaavassa S=keskivirhe, s=muuttuja keskihajota otoksessa, =otoskoko s Mikko Mattila 2010 9 Luottamusväli laskemie 95% luottamusväli lasketaa kaavasta: otoskeskiarvo ± 1,96 * keskivirhe Esim. otoksessa 45% kaattaa Natoa ja keskivirhe o 1,57 Silloi Nato-kaatus o välillä 45% ± 1,96*1,57 eli 41,9%-48,1% 48,1% Jos halutaa 99% luottamusväli, käytetää kertoimea 2,58 Mikko Mattila 2010 10 ISSP / esimerkki q32: Oletteko jäseeä jossaki ryhmässä, joka tärkeimpää tavoitteea o luoo- ja ympäristösuojelu? q33: Oletteko viimeksi kuluee vuode aikaa a) Allekirjoittaeet joki ympäristösuojelua koskeee adressi tai vastaava? b) Lahjoittaut rahaa jolleki ympäristösuojelujärjestölle tai ryhmälle? c) Ottaut osaa mieleosoituksee tai marssii joku ympäristöasia vuoksi? ISSP / esimerkki Kyllä Ei N Jäseyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mieleosoitus 1,1% 98.9 % 1489 Mikko Mattila 2010 11 Mikko Mattila 2010 12 2
ISSP / esimerkki Jäseyys 5,4% 4.3-6.5 3.9-6.9 Adressi 21,6% 19.5-23.7 18.9-24.3 Lahjoitus 23,7% 21.5-25.9 20.9-26.5 Mieleosoitus 1,1% 0.6-1.6 0.4-1.8 I political matters people talk of the left ad the right. How would you place your views o this scale? LEFT 1 2 3 4 5 6 7 8 9 10 MAA RIGHT KESKIARVO N KESKIHAJON- TA Suomi 5,58 862 1,91 Espaja 4,60 795 2,03 Taska 5,44 954 1,94 Mikko Mattila 2010 13 Mikko Mattila 2010 14 Lasketaa Suomalaiste vastaajie 95% luottamusväli: s 1,91 0,065 862 5,58 1,96 * 0,065 5,45 5,58 1,96 * 0,065 5,71 MAA 95%: luottamusväli Suomi 5,45 5,71 Espaja 4,46 4,74 Taska 5,32 5,56 Mikko Mattila 2010 15 Mikko Mattila 2010 16 Otokse ja perusjouko koko Otoskoo kasvaessa luottamusväli pieeee eli pystytää tekemää tarkempia arvioita perusjoukosta Luottamusväli puolittamiseksi otoskoko täytyy elikertaistaa Perusjouko koko ei vaikuta tilastolliste yleistyste tarkkuutee Samaa otoskokoa voidaa käyttää väestömäärältää eri kokoisissa maissa Mikko Mattila 2010 17 Otoskoko Otoskoo vaikutus Esimerkissä o laskettu eri otoskokoje vaikutus keskivirheesee ja luottamusvälii. Oletuksea o, että 50% vastaajista o vastaut kyllä kysymyksee. Keskivirhe 95%: luottamusväli 50 7.1 36 64 100 5.0 40 60 200 3.5 43 57 500 2.2 46 54 1000 1.6 47 53 2000 1.1 48 52 10000 0.5 49 51 Mikko Mattila 2010 18 3
Hypoteesie tilastollie testaus Hypoteesie testaukse perusperiaatteide ymmärtämie tärkeää, koska kaikki moimuuttujameetelmät sisältävät automaattisesti tilastollisia testejä ristiitaulukko 2-testi regressioaalyysi t-testi, testi, F-testi variassiaalyysi F-testi je. Mikko Mattila 2010 19 Hypoteesie tilastollie testaus Huom. tutkimushypoteesi ja tilastollise hypoteesi ero Tutkimushypoteesi: korkeammi koulutetut hekilöt osallistuvat poliittisesti eemmä kui vähemmä koulutusta saaeet Em. hypoteesia voidaa operatioalisoida, mitata ja tutkia moella eri tavalla Tilastollie hypoteesi liittyy aia joki muuttuja jakaumaa tai muuttujie välistä yhteyttä kuvaavaa tuuslukuu Mikko Mattila 2010 20 Hypoteesie tilastollie testaus Hypoteesie testaukse viisi vaihetta: 1) hypoteesie valita 2) tilastollise testi valita 3) merkitsevyystaso valita 4) testi suorittamie 5) päätökse tekemie Kyseessä hypoteesi testaukse oppikirjamalli, todellisuudessa ämä vaiheet ovat tutkija päässä, eikä iitä muuta kui poikkeustapauksissa kirjata esim. tutkimusraporttii Mikko Mattila 2010 21 Hypoteesie valita Nollahypoteesi H 0 Teoriasta johdetu oletukse vastaie hypoteesi Esim. mieste ja aiste keskipalkka o sama Vastahypoteesi H 1 Mieste ja aiste keskipalka ovat erisuuret (kaksisuutaie testaus) Naiste keskipalkka o mieste keskipalkkaa pieempi (yksisuutaie testaus) Mikko Mattila 2010 22 Tilastollise testi valita Riippuu hypoteesi sisällöstä Erilaisia testejä o kymmeiä Moee määrällisee meetelmää sisältyy automaattisesti testit esim. Pearsoi korrelaatiokertoime yhteydessä testataa, eroaako ko. kerroi tilastollisesti merkitsevästi ollasta Merkitsevyystaso valita Kutsutaa myös riskitasoksi Määrittää todeäköisyyde sille, että ollahypoteesi hylätää, vaikka se o tosi Yleesä käytetää 5%, 1% ja 0,1% tasoja Em. tasot aioastaa sopimuksevaraisia Mikko Mattila 2010 23 Mikko Mattila 2010 24 4
Testi suorittamie Käytäössä aia tilasto-ohjelmisto ohjelmisto avulla Tuloksea p-arvo, joka määrittää virhee todeäköisyyde, jos ollahypoteesi hylätää Mikko Mattila 2010 25 Päätökse tekemie Jos p-arvo alle valitu merkitsevyystaso ollahypoteesi hylätää Tällöi puhutaa tilastollisesti merkitsevästä tuloksesta (ei merkittävästä ) Merkitää taulukoihi usei tähdillä: * (p<0,05),** (p<0,01), ***(p<0,001) Sisällöllie tulkita tärkeä! p-fetisismi vaara Mikko Mattila 2010 26 Päätökse tekemie Päätöstä tehtäessä o mahdollisuus kahtee virheesee: Jos ollahypoteesi hylätää, vaikka se o tosi hylkäämisvirhe (egl. type I error) Jos ollahypoteesi hyväksytää, vaikka se o epätosi hyväksymisvirhe (type II error) Hyväksymis- ja hylkäämisvirheide todeäköisyydet toisistaa riippuvaisia jos hylkäämisvirheelle asetetaa vaativa raja (esim. 0,1%), kasvaa hyväksymisvirhee todeäköisyys ja päivastoi Mikko Mattila 2010 27 Hypoteesie testaukse kritiikki Tekie: ovatko otokset todella satuaisotoksia? Tieteefilosofie: ollahypoteesi useimmite triviaali Käytäöllie: testit tehdää vääri tai iide ritualistie käyttö Pragmaattie vastakritiikki: testauksessa ogelmia, mutta siitä huolimatta parempi käyttää iitä, kui luopua kokoaa tilastollise merkitsevyyde arvioiista. Mikko Mattila 2010 28 Aieistoa koko perusjoukko? Oko tilastollisessa testauksessa mieltä, jos aieistoa o koko perusjoukko? Asia o joki verra kiistaalaie, mutta valtavirra mielipide o, että testaamie o hyödyllistä myös tässä tapauksessa Esim. tutkitaa Helsigi yliopisto professoreide tieteellistä tuottavuutta ja havaitaa ero alemmista sosiaaliluokista ja korkeimmista sosiaaliluokista tulleide välillä Vaikka kyseessä ei ole otos, voi erot kuiteki johtua satuaisista tekijöistä, koska jos kaikki proffat jaettaisii satuaisesti kahtee ryhmää, myös äide ryhmie välillä olisi todeäköisesti pieiä eroja tilastollie testi kertoo, oko ero ii suuri, että o epätodeäköistä, että yhtä suuri ero saataisii jakamalla perusjoukko satuaisesti ryhmii Mikko Mattila 2010 29 5