Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE...7 1. JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9 1.1 PARAMETRITTOMIEN MENETELMIEN LYHYT HISTORIA 11 1.2 PARAMETRITTOMAT MENETELMÄT IHMISTIETEISSÄ 13 1.3 MENETELMÄN VALINTA 16 1.4 TARKKA TESTI VAI APPROKSIMAATIO? 25 1.5 KIRJAN JÄSENNYS 27 2. YHTEEN OTOKSEEN LIITTYVIÄ TESTEJÄ...31 2.1 BINOMITESTI 32 2.2 KHIIN NELIÖ -YHTEENSOPIVUUSTESTI 44 2.3 KOLMOGOROVIN SMIRNOVIN YHDEN OTOKSEN TESTI 58 2.4 JÄRJESTYSTESTI (RUNS TEST) 70 3. PARITTAISTEN OTOSTEN VERTAILEMINEN...81 3.1 MCNEMARIN TESTI 82 3.2 MERKKITESTI 91 3.3 WILCOXONIN MERKKITESTI 100 3.4 FRIEDMANIN TESTI 112 3.5 COCHRANIN Q -TESTI 125 4. RIIPPUMATTOMIEN OTOSTEN VERTAILU...133 4.1 RISTIINTAULUKON ANALYYSI JA TULKINTA 134 4.2 MEDIAANITESTI 153 4.3 KOLMOGOROVIN SMIRNOVIN KAHDEN OTOKSEN TESTI 161 4.4 WALDIN WOLFOWITZIN TESTI 170 4.5 MANNIN WHITNEYN WILCOXONIN TESTI 181 4.6 KRUSKALIN WALLISIN TESTI 194 4.7 JONKHEEREN TERPSTRAN TESTI 206 5. PARAMETRITTOMIA YHTEYDEN MITTOJA...217 5.1 LUOKITTELUASTEIKOLLE SOVELTUVIA YHTEYDEN MITTOJA 218 Kontingenssikerroin...218 Phi-kerroin...219 Cramérin V...220 Epäsymmetrisen yhteyden mitat L B ja tau...223 5.2 RIIPPUVIEN MUUTTUJIEN YHTEYDEN MITTOJA 230 Cohenin kappa...230 5.3 JÄRJESTYSASTEIKOLLE SOVELTUVIA YHTEYDEN MITTOJA 234 Spearmanin järjestyskorrelaatiokerroin...235 Kendallin järjestyskorrelaatiokerroin tau...238 Kendallin osittaiskorrelaatiokerroin T xy.z...245 Goodmanin ja Kruskalin Gamma...246 Somersin delta...249 6. NÄKYMIÄ PARAMETRITTOMIIN MONIMUUTTUJAMENETELMIIN...255 LÄHTEET...258 LIITEET...263 ASIA- JA HENKILÖHAKEMISTO...265 6
2. Yhteen otokseen liittyviä testejä Luvun tavoitteet: Yhden otoksen testit: jakauman muoto yhteensopivuus vertaaminen ennalta tunnettuun jakaumaan 1. Saada yleiskuva yhden otoksen tilanteisiin liittyvistä tutkimusasetelmista. 2. Pystyä valitsemaan esitellyistä menetelmistä omaan aineistoon sopiva testimenettely. 3. Pystyä laskemaan tarvittaessa vaikka käsin omaan aineistoon liittyvä testisuureen arvo ja tulkitsemaan tulos. Yhden otoksen testit ovat yleensä jakauman muotoon liittyviä testejä. Olemme kiinnostuneita tietämään, onko kyseinen jakauma peräisin tietynlaisesta (esimerkiksi normaalista, binomijakautuneesta tai tasaisesta) perusjoukosta 20. Tätä perinteisesti tutkitaan ns. yhteensopivuustesteillä (Goodness-of-fit). Tässä luvussa esitellään joitain tunnettuja yhteensopivuustestejä. Binomitestillä testataan kaksiluokkaisen muuttujan eli dikotomisen muuttujan esimerkiksi kruunu/klaava, tyttö/poika, mies/ nainen, oikea vastaus/väärä vastaus, läpäissyt/eiläpäissyt, palkkataso alle X/palkkataso yli X jne. jakautuneisuutta. Mikäli dikotominen muuttuja jakautuu satunnaisesti, sen arvot noudattavat binomijakaumaa. Binomitestiä voidaan käyttää myös Khiin neliö -testin post hoc-testinä, mikäli luokittelevia muuttujia on kaksi. Khiin neliö -testillä (merkitään χ 2 jos käytetään pientä kreikkalaista khi -kirjainta tai Χ 2 jos käytetään suurta khi-kirjainta) testataan yhteensopivuutta luokittelumuuttujan havaittujen frekvenssien 21 ja tilastollisessa mielessä odotettujen frekvenssien välillä. Itse testisuure on sama kuin ristiintaulukon analysoinnissa käytettävä χ 2 -riippumattomuustesti, joka lienee lukijalle tuttu 22. Kolmogorovin Smirnovin testillä ja sen laajennuksella Lillieforsin testillä voidaan testata havaitun, vähintään järjestysasteikollisesti mitatun jakauman poikkeamaa useastakin tunnetusta jakaumasta. Testeissä verrataan havaittuja ja odotettuja jakaumia toisiinsa; 20 Erilaisia jakaumamuotoja ja perusjoukkoja käsitellään tarkemmin Tilastollisen päättelyn perusteet -kirjassa (Metodologia 3.). 21 Tilastollisen kuvauksen perusteet -kirjassa (Metodologia 2.) käsitellään tarkemmin näitä perustermejä. Mikäli lukija ei aktiivisesti harrasta tutkimuksen tekemistä ja terminologia tuottaa hankaluuksia, kannattaa ennen tämän kirjan lukemista perehtyä ainakin pintapuolisesti sekä mainittuun kirjaan että Tilastollisen päättelyn perusteet -kirjaan (Metodologia 3.). Vakiintunut termi frekvenssi tarkoittaa kutakuinkin samaa kuin lukumäärä. 22 Katso esimerkiksi Tilastollisen kuvauksen perusteet -kirja (Metodologia 2.) 31
jakauman järjestys mikäli jakaumat ovat liian kaukana toisistaan, niiden välillä on tilastollisesti merkitsevä ero. Järjestys- eli Runs-testillä testataan, ovatko muuttujan arvot järjestyneet sarjoiksi (engl. Runs eli pyrähdys ) vai ovatko arvot satunnaisessa järjestyksessä. Yleensä nollahypoteesi edellyttää havaintojen satunnaisen järjestyksen. 2.1 Binomitesti Binomitestillä testataan, ovatko lukumäärät eri ryhmissä samat, kun muuttuja saa kaksi arvoa. Binomitestiä voidaan käyttää laajasti erilaisiin sovelluksiin, joita pohditaan jatkossa lisää. 2.1.1 Mihin tilanteeseen sopii Jo aiemmin totesimme, että Binomitesti soveltuu testaamaan muuttujia, jotka voivat saada kaksi arvoa. Tällaisia muuttujia edustavat mm. vastinparit poikavauva/tyttövauva, mies/nainen, onnistua/epäonnistua tehtävässä, sairastua/ei sairastua, kruunu/klaava, poissa/paikalla. Myös jatkuvista muuttujista voidaan tehdä dikotomisia: palkka yli X/ alle X, älykkyys yli A/ alle A, testissä pistemäärä yli S/ alle S jne. Nämä muuttujat noudattavat ns. binääristä eli dikotomista (kaksi arvoa saavaa) populaatiota, joka on kunkin muuttujan suhteen ainutlaatuinen. Klassinen esimerkki Binomitestin soveltuvuudesta on tutkia, onko kolikko käsittelemätön eli tuottaa rehellisen tuloksen kolikon heitossa. Koska todennäköisyys saada kruunu tai klaava on 0.5, voimme tutkia, onko pitkän heittosarjan tuloksessa suurin piirtein yhtä paljon kruunuja kuin klaavoja, vaikka peräkkäin tietenkin saattaa tulla useampiakin kruunuja tai klaavoja. Samoin voimme tutkia tietyn nopan silmän esiintyvyyttä (todennäköisyys 1/6) ja näin ollen arpakuution harhattomuutta. Jos tietyn sairauden esiintyvyys on A % väestössä, voimme Binomitestin avulla selvittää, onko otoksessa enemmän sairastuneita kuin väestössä yleensä. Jos valittavana on kaksi esinettä, voimme tutkia, valitsevatko tutkittavat satunnaisesti kumman hyvänsä esineen (todennäköisyys 0.5), vai tuleeko jompikumpi esineistä valittua toista useammin. 32
Toisenlainen käyttömahdollisuus Binomitestille syntyy ristiintaulukoiden analyysissa. Mikäli toinen muuttujista on järjestysasteikollinen ja saa vain kaksi arvoa (esimerkiksi yläkvartiili/alakvartiili) ja toinen aidosti luokitteleva muuttuja, Binomitestiä voidaan käyttää ns. post hoc -testinä. Tästä tulee puhetta tarkemmin ristiintaulukon analysoinnin yhteydessä luvussa 4.1.3. 2.1.2 Rajoitukset ja oletukset Tutkittavan muuttujan tulee saada vain kaksi arvoa, tai muuttuja tulee muuttaa sellaiseen muotoon, että siinä on kaksi arvoa. Jatkossa huomaamme, että laskenta tapahtuu hieman eri tavalla riippuen siitä, paljonko havaintoja on. 2.1.3 Lyhyesti teoriasta ja käsitteistä Binomitodennäköisyys Kun otamme yhden havainnon kaksi arvoa saavasta perusjoukosta, saamme tietenkin jommankumman noista kahdesta arvosta. Kun lapsi on syntymässä, se on joko tyttö tai poika, tai kun heitämme kolikkoa, tulee joko kruunu tai klaava, tai monivalintatehtävä joko osattiin tai ei osattu. Merkinnät ovat tietenkin yleensä valittavissa, mutta yleensä laskujen kannalta on mielekästä merkitä näitä arvoja luvuilla 0 ja 1. Riippuen populaatiosta näillä ns. Bernoulli-muuttujan 23 arvoilla on tietty todennäköisyys. Näin esimerkiksi todennäköisyys, että syntyvä lapsi on poika, on 0.52 ja todennäköisyys, että syntyvä lapsi on tyttö, on 0.48, sillä satunnaiskoe nimeltään lapsen syntymä näyttää koko väestössä tuottavan tällaisen tuloksen. Yleisesti merkitsemme näitä todennäköisyyksiä symboleilla p ja q. Koska kokonaistodennäköisyys 24 on 1, p:n ja q:n välillä on yhteys: q = 1 p ja p = 1 q. Jos annamme pojille koodin 1 ja tytöille koodin 0 (tai tietenkin päinvastoin), merkitsemme todennäköisyyden teknisesti seuraavasti: 23 Tällaista 0 tai 1 arvon saavaa satunnaismuuttujaa nimitetään Bernoulli-muuttujaksi 1600-luvulla vaikuttaneen matemaatikon Jacob Bernoullin mukaan. 24 Todennäköisyyteen liittyvä peruskysymyksiä kuten merkintöjä ja todennäköisyyden ominaisuuksia, jotka tunnetaan nimellä Kolmogorovin aksiomat pohditaan tarkemmin Tilastollisen päättelyn perusteet -kirjassa (Metodologia 3.). 33
johon sijoitetaan saamamme arvo 0.9 (huom. kuitenkin pilkulla). Tulos on 0.1841 eli saamme saman tuloksen kuin aiemmin binomijakauman perusteella. 2.1.4 Tekninen suoritus SPSS-ohjelmistolla ja tulkinta Binomitesti soveltuu tilanteisiin, joissa muuttuja voi saada kaksi arvoa ja haluamme tietää, onko muuttujan muodostama jakauma satunnainen. Teemme SPSS-ohjelmistolla 32 saman analyysin, jota jo käsittelimme teoreettisessa osassa. Olemme kiinnostuneita kahden samanvärisen, mutta erimerkkisen virvoitusjuoman menekistä kesäpäivänä. Aineistossamme on 100 myytyä pulloa, joista 45 on merkkiä A ja loput (eli 55) merkkiä B. Kysymme, onko tämän suuruinen ero myynnissä normaalin rajoissa, vai onko ero tilastollisesti merkitsevä. Kysymyksen asetteluun sopii hyvin Binomitesti. Perusnäkymä Binomitestin laskeminen SPSS-ohjelmistossa alkaa komennoilla Analyze> Nonparametric Tests> Binomial Päävalikko näyttää seuraavalta: 32 SPSS-ohjelmiston perusteita aineiston syöttöä, tarkistusta ja perustunnuslukujen laskemista käsitellään tarkemmin esimerkiksi kirjasarjan 5. osassa (SPSS aloittelevan tutkijan käytössä). 41
Valinnat Data sisältää vain yhden muuttujan, joten tekninen valinta on helppo: valitsemme mukaan oikean muuttujan (JUOMA). Koska nollahypoteesimme olettaa satunnaisuutta juomien ostamisessa, molemmilla merkeillä A ja B on yhtäläinen mahdollisuus tulla valituksi. Näin ollen vertailussa käytettävä todennäköisyys (Test Proportion) on p = ½ = 0.5. Normaaleissa SPSS-ohjelmiston Base- tai Advance-moduuleista ei ole mahdollisuutta laskea tarkkoja testejä (Exact tests). Lisävarusteena sellainen on kuitenkin saatavissa. Koska sellainen on nyt käytössä, valitaan oletuksena olevan asymptoottisen menetelmän lisäksi myös tarkka analyysimenetelmä. Valittavana olisi myös ns. Monte Carlo -simulaatiomenetelmään perustuva menettely. Koska aineistomme on pieni, emme tarvitse tätä vaihtoehtoa. Mikäli tarkka menettely ei kykene sallitussa ajassa suoriutumaan kaikkien mahdollisten järjestysvaihtoehtojen laskemisessa, se automaattisesti siirtyy käyttämään simulaatiomenettelyä. 42
Tulokset ja niiden tulkinta Tulosten kuvaaminen alkaa otokseen liittyvillä perustunnusluvuilla (Descriptive Statistics): Descriptive Statistics JUOMA Std. N Mean Deviation Minimum Maximum 100,55,500 0 1 Varsinainen Binomitestin tulos on seuraavassa taulukossa (Binomial test): JUOMA Group 1 Group 2 Total a. Based on Z Approximation. Binomial Test Observed Asymp. Sig. Exact Sig. Category N Prop. Test Prop. (2-tailed) (2-tailed) juomaa 45,45,50,368 a,368 juomab 55,55 100 1,00 Z-pisteeseen perustuva normaalijakauma-approksimaatio (Asymp. Sig.) tuottaa tulokseksi kaksisuuntaisesti mitattuna p- arvon p = 0.368, joka on tarkkana testinä (Exact Sig.) sama Binomitesti on itsessään tarkka testi. Juomien A ja B myynnissä ei ole tilastollisesti merkitsevää eroa. 43