Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden
Sisältö t ja t t ja t kahden kahden
t ja t kahden
t ja t Tällä luennolla käsitellään epäparametrisia eli jakaumasta riippumattomia tilastollisia testejä. kahden
t ja t t ja t kahden
t ja t t ja t t ja t sopivat järjestysasteikollisille (esim. kouluarvosanat) muuttujille. Niitä voidaan kuitenkin käyttää myös jatkuville kvantitatiivisille muuttujille. en ja en etuna on, että niiden käyttö ei edellytä vahvoja jakaumaoletuksia. kahden
t ja t kahden
Yhden merkkitesti Yhden merkkitesti vastaa yhden t testiä ilman oletuksia perusjoukon jakauman tyypistä. Olkoot x 1, x 2,..., x n jatkuvan satunnaismuuttujan x havaitut arvot. Oletetaan, että havaintopisteet ovat riippumattomia ja tulevat (tuntemattomasta) jakaumasta, jonka mediaani m. Nollahypoteesi mediaanille H 0 : m = m 0. t ja t kahden Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m > m 0 (yksisuuntainen), H 1 : m < m 0 (yksisuuntainen) tai H 1 : m m 0 (kaksisuuntainen).
Yhden merkkitesti Muodostetaan erotukset d i = x i m 0, i = 1, 2,..., n. Testisuure S on niiden tapausten lukumäärä, joilla d i > 0. (Vaihtoehtoisesti voidaan tarkastella niiden tapausten lukumäärä, joilla d i < 0. ) Jos nollahypoteesi pätee, niin testisuure noudattaa binomijakaumaa parametrein n ja 1/2. Testisuureen normaaliarvo on 1 2 n, ja sen varianssi on 1 4 n. Suuret ja pienet testisuureen arvot (verrattuna normaaliarvoon 1 2n) viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. t ja t kahden
Yhden merkkitesti, p arvot Testisuureen S jakauma on taulukoitu ja monet tietokoneohjelmat laskevat testin p arvoja. n p arvot määritetään seuraavilla kaavoilla, joissa s on testisuureen S havaittu arvo: Jos vaihtoehtoinen hypoteesi H 1 : m > m 0, niin testin p arvo on p = P(S s). Jos vaihtoehtoinen hypoteesi H 1 : m < m 0, niin testin p arvo on p = P(S s). Jos vaihtoehtoinen hypoteesi H 1 : m m 0, niin testin p arvo on p = 2 min{p(s s), P(S s)}. Edellä P(S s) ja P(S s) lasketaan luonnollisestikin nollahypoteesin vallitessa. t ja t kahden
Yhden asymptoottinen merkkitesti t ja t Kun otoskoko on suuri, testisuure Z = S n/2 noudattaa n/4 nollahypoteesin vallitessa likimain standardinormaalijakaumaa. Approksimaatio on tavallisesti riittävän hyvä, jos n > 20. Pienissä otoksissa nojataan testisuureen S tarkkaan jakaumaan. kahden
Yhden merkkitesti Oletimme edellä, että otos on jatkuvasta jakaumasta. ä voidaan käyttää myös silloin kun otos on diskreetistä jakaumasta, mutta tällöin on mahdollista, että osalle otospisteistä d i = x i m 0 = 0. Jos nollien lukumäärä on pieni otoskokoon nähden, niin nämä tapaukset voidaan jättää huomioimatta ja otoskokoa voidaan pienentää vastaavasti. Muussa tapauksessa nollat tulee määrittää siten, että ne vaikeuttavat nollahypoteesin hylkäystä. Esim. kaksisuuntaisen vaihtoehtoisen hypoteesin tapauksessa tulos 3 negatiivista merkkiä, 15 positiivista merkkiä ja 6 nollaa, tulisi testissä käsitellä kuten 9 negatiivista merkkiä ja 15 positiivista merkkiä. t ja t kahden
parivertailuille, testausasetelma t ja t Parivertailuilun testausasetelma Havainnot muodostuvat muuttujaa x koskevista mittaustuloksien pareista (x i1, x i2 ), i = 1, 2,..., n jotka ovat toisistaan riippumattomia. Yhden mittausparin arvoja ei kuitenkaan oleteta riippumattomiksi! Muodostetaan mittaustuloksien x i1 ja x i2 nollasta eroavat erotukset d i = x i1 x i2, i = 1, 2,..., k. kahden
parivertailuille t ja t Yleinen hypoteesi H: erotukset d i ovat riippumattomia, samoin jakautuneita ja tulevat jakaumasta jonka mediaani on m. Nollahypoteesi mediaanille H 0 : m = 0. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m > 0 (yksisuuntainen), H 1 : m < 0 (yksisuuntainen) tai H 1 : m 0 (kaksisuuntainen). Nyt voidaan käyttää tavanomaista yhden merkkitestiä mittaustuloksien erotuksille d i. kahden
Numeerinen esimerkki t ja t Eräässä kuvitteellisessa hoitokokeessa tutkitaan, kuinka lääke a alentaa plasman galliapitoisuutta. Plasman korkea galliapitoisuus on yhteydessä moniin sairauksiin. Kokeen alussa mitattiin galliapitoisuus ensimmäisen kerran ja toisen kerran 8 viikon lääkehoidon jälkeen. Haluat tutkia onko lääkkeellä ollut haluttua vaikutusta 5% luottamustasolla. kahden
Mittaustulokset Taulukko: Galliapitoisuudet (µg/1000ml) ennen ja hoidon jälkeen. Potilas Pitoisuus Erotus Ennen Jälkeen 1 1384 1332-52 2 1640 1564-76 3 1122 1100-22 4 1272 1260-12 5 1380 1360-20 6 624 1624 1000 7 360 1821 1461 8 456 450-6 9 1726 1712-14 10 332 821 489 11 1342 1338-4 12 1630 1626-4 13 1170 1160-10 t ja t kahden
t testi t ja t One Sample t-test data: Erotus t = 1.5646, df = 12, p-value = 0.9282 alternative hypothesis: true mean is less than 0 sample estimates: mean of x = 210 kahden
t ja t One-sample Sign-Test data: Erotus s = 3, p-value = 0.04614 alternative hypothesis: true median is less than 0 sample estimates: median of x = -10 kahden
t ja t Vertaile testien antamia tuloksia. Kumpikaan testeistä ei yksinään anna hyvää kuvaa lääkityksen a vaikutuksesta? Miksi? Miten lääke näyttäisi tämän aineiston perusteella vaikuttavan? kahden
t ja t kahden
Yhden Yhden merkillinen vastaa yhden t testiä vähemmillä jakaumaoletuksilla. Olkoot x 1, x 2,..., x n jatkuvan symmetrisen satunnaismuuttujan x havaitut arvot. Oletetaan, että havaintopisteet ovat riippumattomia ja tulevat (tuntemattomasta) symmetrisestä jakaumasta, jonka mediaani m. t ja t kahden Nollahypoteesi mediaanille H 0 : m = m 0. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m > m 0 (yksisuuntainen), H 1 : m < m 0 (yksisuuntainen) tai H 1 : m m 0 (kaksisuuntainen).
Yhden Muodostetaan erotusten itseisarvot d i = x i m 0, i = 1, 2,..., n. Laitetaan nämä erotusten itseisarvot järjestykseen pienimmästä suurimpaan. Määritetään merkilliset järjestysluvut (signed ranks) R (x i ) s.e. R (x i ) on itseisarvon d i = x i m 0 järjestysluku kerrottuna erotuksen (x i m 0 ) merkillä. Testisuure W = R (x i )>0 R (x i ) on positiivisten järjestyslukujen summa. (Vaihtoehtoisesti voidaan tarkastella negatiivisten järjestyslukujen summaa.) Testisuureen normaaliarvo on n(n+1) 4, ja sen varianssi on n(n+1)(2n+1) 24. Suuret ja pienet testisuureen arvot (verrattuna normaaliarvoon n(n+1) 4 ) viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. t ja t kahden
Yhden, p arvot Testisuureen W jakauma on taulukoitu ja monet tietokoneohjelmat laskevat testin p arvoja. n p arvot määritetään seuraavilla kaavoilla, joissa w on testisuureen W havaittu arvo: Jos vaihtoehtoinen hypoteesi H 1 : m > m 0, niin testin p arvo on p = P(W w ). Jos vaihtoehtoinen hypoteesi H 1 : m < m 0, niin testin p arvo on p = P(W w ). Jos vaihtoehtoinen hypoteesi H 1 : m m 0, niin testin p arvo on p = 2 min{p(w w ), P(W w )}. Edellä P(W w ) ja P(W w ) lasketaan nollahypoteesin vallitessa. t ja t kahden
Yhden asymptoottinen t ja t Kun otoskoko on suuri, testisuure Z = W E(W ), missä var(w ) E(W ) = n(n+1) 4 ja var(w ) = n(n+1)(2n+1) 24, noudattaa nollahypoteesin vallitessa likimain standardinormaalijakaumaa. kahden Approksimaatio on tavallisesti riittävän hyvä, jos n > 20. Pienissä otoksissa nojataan testisuureen W tarkkaan jakaumaan.
Yhden Oletimme edellä, että otos on jatkuvasta jakaumasta. ä voidaan käyttää myös silloin kun otos on diskreetistä jakaumasta, mutta tällöin on mahdollista, että osalla otospisteistä itseisarvojen x i m 0 järjestysluku on sama. Tällöin kaikille näille otospisteille valitaan järjestysluvuksi keskimmäinen. Esim. jos kahdella otospisteellä x i m 0 on sama, vastaten järjestyslukuja 7 ja 8, niin molemmille pisteille asetetaan järjestysluvuksi 7.5. Jos kolmella otospisteellä x i m 0 on sama, vastaten järjestyslukuja 3, 4 ja 5, niin järjestysluvuksi valitaan kaikille kolmelle 4. t ja t kahden
parivertailuille, testausasetelma t ja t Parivertailuilun testausasetelma Havainnot muodostuvat muuttujaa x koskevista mittaustuloksien pareista (x i1, x i2 ), i = 1, 2,..., n jotka ovat toisistaan riippumattomia. Yhden mittausparin arvoja ei kuitenkaan oleteta riippumattomiksi! Muodostetaan mittaustuloksien x i1 ja x i2 nollasta eroavat erotukset d i = x i1 x i2, i = 1, 2,..., k. Erotusten oletetaan noudattavan symmetristä jakaumaa!! kahden
parivertailuille Yleinen hypoteesi H: erotukset d i ovat riippumattomia, samoin jakautuneita ja tulevat symmetrisestä jakaumasta jonka mediaani on m. Nollahypoteesi mediaanille H 0 : m = 0. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m > 0 (yksisuuntainen), H 1 : m < 0 (yksisuuntainen) tai H 1 : m 0 (kaksisuuntainen). Nyt voidaan käyttää tavanomaista yhden ä mittaustuloksien erotuksille d i. t ja t kahden
Numeerinen esimerkki, merkillinen parivertailulle Kallen superkeksien pahin kilpailija keksimarkkinoilla on Panun pahanmakuiset prinsessakeksit. Näiden keksipakettien eri kauppojen myyntihintoja haluttiin vertailla, mutta keksien hintojen jakaumasta ei ole tietoa, joskin voidaan olettaa, että hintojen erotuksien jakauma on symmetrinen. Tutkimukseen valittiin satunnaisesti 10 eri kauppaa. Keksien hinnat on kirjattu alla olevaan taulukkoon. Kallen 4.56 4.67 4.28 4.57 478 4.54 4.56 Panun 4.52 4.48 4.51 4.30 4.59 4.67 4.53 Erotus 0.04 0.19-0,23 0.27 0.19-0.13 0.03 4.48 4.47 4.50 4.54 4.71 4.49-0.06-0.24 0.01 t ja t kahden Taulukko: Taulukossa näkyvät Kallen superkeksien ja Panun pahanmakuisten prinsessakeksien hinnat eri kaupoissa.
Numeerinen esimerkki, merkillinen parivertailulle t ja t Erotusten oletetaan noudattavan symmetristä jakaumaa. Nollahypoteesina on, että Kallen superkeksien ja Panun pahanmakuisten prinsessakeksien hintojen teoreettisissa mediaaneissa ei ole eroa eli että erotusten teoreettinen mediaani on nolla. Seuraavaan sivulla olevaan taulukkoon on kirjattu erotusten itseisarvot suuruusjärjestyksessä sekä lisäksi erotusten merkilliset järjestysluvut. kahden
Numeerinen esimerkki, merkillinen parivertailulle t ja t Erotus 0.01 0.03 0.04 0.06 0.13 0.19 0.19 Merk.järj. 1 2 3-4 -5 6.5 6.5 0.23 0.24 0.27-8 -9 10 Taulukko: Erotusten itseisarvot järjetettyinä suurimmasta pienimpään ja erotusten merkilliset järjestysluvut. kahden Testisuure W = R (d i )>0 R (x i ) = 1 + 2 + 3 + 6.5 + 6.5 + 10 = 29. Testin p-arvoksi saadaan laskentaohjelmistolla 0.9219. Nollahypoteesi jätetään voimaan.
vs. Testit soveltuvat saman tyyppisiin ongelmiin: yksi otos, mediaanin vertaaminen vakioon - kaksi toisistaan riippuvaa otosta, mediaanien vertaaminen. Testit ovat yhden t testin ei-parametrisiä vastineita. Testisuureiden arvot eivät riipu havaintoarvoista, vaan ainoastaan niiden keskinäisestä järjestyksestä. ssä ei tehdä oletuksia perusjoukon jakauman tyypistä. vaatii symmetria-oletuksen. käyttää merkkitestiä enemmän informaatiota havaintojen järjestyksestä. Jos jakauma voidaan olettaa symmetriseksi, kannattaa turvautua Wilcoxoniin, muussa tapauksessa merkkitesti on ainoa tie. t ja t kahden
t ja t kahden kahden
kahden kahden vastaa kahden riippumattoman t testiä vähemmillä jakaumaoletuksilla. kahden on käytännössä täsmälleen sama testi kuin ns. Mannin ja Whitneyn testi. Olkoot x 1, x 2,..., x n satunnaismuuttujan x havaitut arvot ja olkoot y 1, y 2,..., y m satunnaismuuttujan y havaitut arvot. Oletetaan, että havaintopisteet x 1, x 2,..., x n ovat riippumattomia ja samoin jakautuneita, ja oletetaan, että havaintopisteet y 1, y 2,..., y m ovat riippumattomia ja samoin jakautuneita. Oletetaan vielä, että x i ja y j ovat riippumattomia kaikilla i, j ja että muuttujat x i ja muuttujat y j noudattavat muuten samaa jakaumaa, mutta niiden mediaanit saattavat erota toisistaan. t ja t kahden Nollahypoteesi mediaanille H 0 : m x = m y. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m x > m y (yksisuuntainen), H 1 : m x < m y (yksisuuntainen) tai H 1 : m x m y (kaksisuuntainen).
kahden Tarkastelaan otoksia x 1, x 2,..., x n ja y 1, y 2,..., y m. Oletetaan (yleisyyden kärsimättä), että n m. kahden perustuu kaikkien havaintojen keskinäisen suuruusjärjestyksen tarkasteluun. Yhdistetään otokset x 1, x 2,..., x n ja y 1, y 2,..., y m yhdeksi otokseksi z 1, z 2,..., z n+m. Järjestetään yhdistetyn havainnot suuruusjärjestykseen pienimmästä suurimpaan. Olkoon R(z i ) havainnon z i järjestysluku yhdistetyssä otoksessa z 1, z 2,..., z n+m. Testisuure W = n i=1 R(x i) on pienemmän järjestyslukujen summa. Testisuureen normaaliarvo on n(n + m + 1)/2, ja sen varianssi on nm(n + m + 1)/12. Suuret ja pienet testisuureen arvot (verrattuna normaaliarvoon n(n + m + 1)/2) viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. t ja t kahden
kahden, p arvot Testisuureen W jakauma on taulukoitu ja monet tietokoneohjelmat laskevat testin p arvoja. kahden p arvot määritetään seuraavilla kaavoilla, joissa w on testisuureen W havaittu arvo: Jos vaihtoehtoinen hypoteesi H 1 : m x > m y, niin testin p arvo on p = P(W w). Jos vaihtoehtoinen hypoteesi H 1 : m x < m y, niin testin p arvo on p = P(W w). Jos vaihtoehtoinen hypoteesi H 1 : m x m y, niin testin p arvo on p = 2 min{p(w w), P(W w)}. Edellä P(W w) ja P(W w) lasketaan nollahypoteesin vallitessa. t ja t kahden
Kahden asymptoottinen t ja t Kun otoskoko on suuri, testisuure Z = W E(W ), missä var(w ) E(W ) = n(n + m + 1)/2 ja var(w ) = nm(n + m + 1)/12, noudattaa nollahypoteesin vallitessa likimain standardinormaalijakaumaa. kahden Approksimaatio on tavallisesti riittävän hyvä, jos n, m > 10. Pienissä otoksissa nojataan testisuureen W tarkkaan jakaumaan
kahden t ja t ä voidaan käyttää myös silloin kun otos on diskreetistä jakaumasta, mutta tällöin on mahdollista, että osalla otospisteistä on sama järjestysluku. Tällöin kaikille näille otospisteille valitaan järjestysluvuksi keskimmäinen. Esim. jos kahden havainnon järjestysluku on sama, vastaten järjestyslukuja 7 ja 8, niin molemmille havainnoille asetetaan järjestysluvuksi 7.5. Jos kolmen havainnon järjestysluku on sama, vastaten järjestyslukuja 3, 4 ja 5, niin järjestysluvuksi valitaan kaikille kolmelle 4. kahden
kahden t ja t Huomaa, että ä voidaan käyttää myös silloin, kun muuttujia ei voida mitata, mutta ne voidaan asettaa järjestykseen. (Esim. soittotaito, asunnon kunto,...) kahden
kahden t ja t kahden on kahden riippumattoman t testin ei-parametrinen vastine. Testisuureiden arvo ei riipu muuttujien x i ja y j arvoista, vaan ainoastaan niiden keskinäisestä järjestyksestä. Testi on varteenotettava vaihtoehto kahden riippumattoman t testille, jos perusjoukot eivät ole normaalijakautuneita. kahden
Numeerinen esimerkki kahden lle. t ja t Opiskelijoiden pituuksia mitattiin matematiikan laitoksen käytävällä. Kymmenen satunnaisesti valittua opiskelijaa laitettiin seisomaan pituusjärjestykseen. Opiskelijoiden joukossa oli sekä miehiä että naisia. Haluttiin selvittää, onko mies- ja naisopiskelijoin pituuksien jakaumissa eroa. kahden
Pituusjärjestyksestä saatiin seuraavan taulukon mukainen. Taulukkoon on kirjattu kunkin opiskelijan sukupuoli sekä järjestysluku. Opiskelija N N M M M N M M N M Järjestysluku 1 2 3 4 5 6 7 8 9 10 Taulukko: Pituusjärjestykseen järjestetyt mies- ja naisopiskelijat järjestyslukuineen. t ja t kahden Testisuure on pienemmän, tässä naisten, järjestyslukujen summa W = 4 i=1 R(x i) = 1 + 2 + 6 + 9 = 18. Koska otoskoot ovat pieniä luetaan taulukosta testisuureen kriittinen arvo. Kriittinen arvo 12.32 < 18, joten nollahypoteesia pituuksien jakaumien samuudesta ei voida hylätä.
t ja t J. S. Milton, J. C. Arnold: Introduction to Probability and Statistics, McGraw-Hill Inc 1995. R. V. Hogg, J. W. McKean, A. T. Craig: Introduction to Mathematical Statistics, Pearson Education 2005. Pertti Laininen: Todennäköisyys ja sen tilastollinen soveltaminen, Otatieto 1998, numero 586. Ilkka Mellin: Tilastolliset menetelmät, http://math.aalto.fi/opetus/sovtoda/materiaali.html. kahden