Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Samankaltaiset tiedostot
Testit järjestysasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Testejä suhdeasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Väliestimointi (jatkoa) Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Osa 2: Otokset, otosjakaumat ja estimointi

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Hypoteesin testaus Alkeet

Tilastolliset menetelmät: Tilastolliset testit

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Normaalijakaumasta johdettuja jakaumia

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Mat Sovellettu todennäköisyyslasku A

tilastotieteen kertaus

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

11. laskuharjoituskierros, vko 15, ratkaisut

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

10. laskuharjoituskierros, vko 14, ratkaisut

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Hierarkkiset koeasetelmat. Heliövaara 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Tilastollisia peruskäsitteitä ja Monte Carlo

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Vilkkumaa / Kuusinen 1

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Regressioanalyysi. Kuusinen/Heliövaara 1

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Tilastollinen aineisto Luottamusväli

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Transkriptio:

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1

Testit järjestysasteikollisille muuttujille Järjestysasteikollisten muuttujien testit Merkkitesti Wilcoxonin rankitesti Mannin ja Whitneyn testi Wilcoxonin rankisummatesti TKK (c) Ilkka Mellin (2004) 2

Testit järjestysasteikollisille muuttujille: Mitä opimme? Tarkastelemme tässä luvussa seuraavia järjestysasteikollisten muuttujien testejä: Merkkitesti ja merkkitesti parivertailuille Wilcoxonin rankitesti ja Wilcoxonin rankitesti parivertailuille Mannin ja Whitneyn testi eli Wilcoxonin rankisummatesti Testit on tarkoitettu todennäköisyysjakauman sijaintiparametreille (mediaanille), mutta ne ovat luonteeltaan ei-parametrisia eli jakaumista riippumattomia siinä mielessä, että testien yleiset hypoteesit eivät tarkkaan määrittele perusjoukon jakaumaa. TKK (c) Ilkka Mellin (2004) 3

Testit järjestysasteikollisille muuttujille: Esitiedot Esitiedot: ks. seuraavia lukuja: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Otos ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi Tilastolliset testit Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut Diskreettejä jakaumia Jatkuvia jakaumia TKK (c) Ilkka Mellin (2004) 4

Testit järjestysasteikollisille muuttujille: Lisätiedot Testejäsuhdeasteikollisille muuttujille käsitellään luvussa Testit suhdeasteikollisille muuttujille Testejälaatueroasteikollisille muuttujille käsitellään luvussa Testit laatueroasteikollisille muuttujille Jakaumaoletuksien testaamista käsitellään luvussa Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (2004) 5

Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten muuttujien testit Merkkitesti Wilcoxonin rankitesti Mannin ja Whitneyn testi Wilcoxonin rankisummatesti TKK (c) Ilkka Mellin (2004) 6

Testit järjestysasteikollisille muuttujille Avainsanat Ei-parametrinen testi Jakauman sijaintiparametri Jakaumista riippumaton testi Järjestysasteikko Kahden otoksen testit Mediaani Parametri Parivertailu Yhden otoksen testit TKK (c) Ilkka Mellin (2004) 7

Järjestysasteikollisten muuttujien testit Testit järjestysasteikollisille muuttujille 1/2 Tarkastelemme seuraavia testejä (jatkuville) järjestysasteikollisille muuttujille: Merkkitesti Wilcoxonin rankitesti Mannin ja Whitneyn testi eli Wilcoxonin rankisummatesti Testejä saa käyttää myös välimatka-ja suhdeasteikollisille muuttujille. Mitta-asteikot: ks. lukua Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 8

Järjestysasteikollisten muuttujien testit Testit järjestysasteikollisille muuttujille 2/2 Kaikki käsiteltävät testit ovat ei-parametrisia eli jakaumista riippumattomia, millä tarkoitetaan sitä, että testien yleiset hypoteesit eivät tarkkaan määrittele perusjoukon jakaumaa. Merkkitesti ja Wilcoxonin rankitesti ovat luonteeltaan yhden otoksen testejä, mutta niitä voidaan soveltaa myös parivertailuasetelmissa. Mannin ja Whitneyn testi eli Wilcoxonin rankisummatesti on luonteeltaan kahden otoksen testi. Kaikissa käsiteltävissä testeissä testataan tarkemmin määrittelemättömän todennäköisyysjakauman sijaintiparametria (mediaania) koskevia hypoteeseja TKK (c) Ilkka Mellin (2004) 9

Testit järjestysasteikollisille muuttujille Järjestysasteikollisten muuttujien testit >> Merkkitesti Wilcoxonin rankitesti Mannin ja Whitneyn testi Wilcoxonin rankisummatesti TKK (c) Ilkka Mellin (2004) 10

Merkkitesti Avainsanat Asymptoottinen testi Binomijakauma Ei-parametrinen testi Jakaumista riippumaton testi Järjestysasteikko Mediaani Normaalijakauma Parametri Parivertailu Testisuure Testisuureen jakauma t-testi Yhden otoksen testit TKK (c) Ilkka Mellin (2004) 11

Merkkitesti Testausasetelma Olkoon X1, X2,, X n yksinkertainen satunnaisotos perusjoukosta S, jonka jakauma on symmetrinen. Asetetaan jakauman mediaanille Me nollahypoteesi H :Me = Me 0 0 Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman eräänä ratkaisuna on merkkitesti, joka vastaa yhden otoksen t-testiä. TKK (c) Ilkka Mellin (2004) 12

Merkkitesti Testisuureet Määritellään erotukset ja olkoon D i = X i Me 0, i = 1, 2,, n n n niiden erotusten D i lukumäärä, jotka ovat 0. Jos nollahypoteesi H 0 pätee, positiivisten ja negatiivisten erotusten on jakauduttava suunnilleen tasan. Määritellään testisuureet S ja S + : S = negatiivisten erotusten D i = X i Me 0 lukumäärä S + = positiivisten erotusten D i = X i Me 0 lukumäärä TKK (c) Ilkka Mellin (2004) 13

Merkkitesti Testisuureiden S ja S + ominaisuudet (i) S + S + = n (ii) Jos nollahypoteesi H 0 pätee, testisuureet S ja S + noudattavat binomijakaumaa Bin(n, q) parametrein n ja q = 1/2: (iii) (iv) S ~ Bin(n, 1/2) S + ~Bin(n, 1/2) Jos nollahypoteesi H 0 pätee, + E( S ) = E( S ) = nq = n Jos nollahypoteesi H 0 pätee, D( S ) = D( S ) = nq(1 q) = n 2 2 + 1 4 1 2 TKK (c) Ilkka Mellin (2004) 14

Merkkitesti Eksakti testi Testisuureiden S ja S + jakaumat on taulukoitu ja monet tietokoneohjelmat laskevat testin p-arvoja. Merkkitestin p-arvot määrätään seuraavilla kaavoilla, joissa s (s + ) on testisuureen S (S + ) havaittu arvo: (i) Vaihtoehtoinen hypoteesi H 1 : Me > Me 0 Testin p-arvo: p = Pr(S + > s + ) (ii) Vaihtoehtoinen hypoteesi H 1 : Me < Me 0 Testin p-arvo: p = Pr(S < s ) (iii) Vaihtoehtoinen hypoteesi: H 1 : Me Me 0 Testin p-arvo: p = 2 min{pr(s + > s + ), Pr(S < s )} TKK (c) Ilkka Mellin (2004) 15

Merkkitesti Standardoitu S-testisuure ja sen jakauma 1/2 Jos nollahypoteesi H 0 pätee, + 1 E( S ) = E( S ) = n 2 2 + 1 D( S ) = D( S ) = 4 n Määritellään testisuure z = S E( S ) * * * D( S ) jossa S * = S tai S +. 2 TKK (c) Ilkka Mellin (2004) 16

Merkkitesti Standardoitu S-testisuure ja sen jakauma 2/2 Jos nollahypoteesi H 0 pätee, niin testisuure z = S E( S ) * * * D( S ) noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0, 1): z ~ a N(0,1) Approksimaatio on tavallisesti riittävän hyvä, jos n > 20. Pienissä otoksissa nojataan testisuureen S * tarkkaan jakaumaan. TKK (c) Ilkka Mellin (2004) 17

Merkkitesti Asymptoottinen testi Testisuureen z = S normaaliarvo = 0, koska nollahypoteesin H 0 pätiessä E(z) = 0 E( S ) * * * D( S ) Siten itseisarvoltaan suuret testisuureen z arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. Hylkäysalueen valinta ja p-arvon määrääminen: ks. lukua Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 18

Merkkitesti Kommentteja Merkkitesti voidaan tulkita yhden otoksen t-testin eiparametriseksi vastineeksi. Merkkitestissä ei tehdä toisin kuin yhden otoksen t-testissä mitään oletuksia perusjoukon jakauman tyypistä. Merkkitestin testisuureen arvo ei riipu havaintoarvoista, vaan ainoastaan niiden keskinäisestä järjestyksestä. TKK (c) Ilkka Mellin (2004) 19

Merkkitesti Merkkitestin soveltaminen parivertailuasetelmiin 1/2 Merkkitestiä voidaan soveltaa parivertailuasetelmiin, joissa havainnot muodostuvat toisistaan riippumattomista mittauspareista (X i, Y i ), i = 1, 2,, n Oletetaan, että X-ja Y-mittausten jakaumat ovat muuten samat, mutta niiden mediaaneilla (sijaintiparametreilla) saattaa olla eri arvot. Määritellään havaintojen X i ja Y i erotukset D i = X i Y i, i = 1, 2,, n ja olkoon n niiden erotusten D i lukumäärä, jotka ovat 0. TKK (c) Ilkka Mellin (2004) 20

Merkkitesti Merkkitestin soveltaminen parivertailuasetelmiin 2/2 Tehdään oletus, että erotusten D i = X i Y i, i = 1, 2,, n jakauma on symmetrinen. Määritellään testisuureet S ja S + erotuksille D i kuten edellä. Olkoon Me D erotusten D i = X i Y i, i = 1, 2,, n mediaani. Tällöin nollahypoteesin H : Me = 0 0 D testaamiseen voidaan soveltaa merkkitestiä. TKK (c) Ilkka Mellin (2004) 21

Testit järjestysasteikollisille muuttujille Järjestysasteikollisten muuttujien testit Merkkitesti >> Wilcoxonin rankitesti Mannin ja Whitneyn testi Wilcoxonin rankisummatesti TKK (c) Ilkka Mellin (2004) 22

Wilcoxonin rankitesti Avainsanat Asymptoottinen testi Ei-parametrinen testi Jakaumista riippumaton testi Järjestysasteikko Mediaani Normaalijakauma Parametri Parivertailu Testisuure Testisuureen jakauma t-testi Yhden otoksen testit TKK (c) Ilkka Mellin (2004) 23

Wilcoxonin rankitesti Testausasetelma Olkoon X1, X2,, X n yksinkertainen satunnaisotos perusjoukosta S, jonka jakauma on symmetrinen. Asetetaan jakauman mediaanille Me nollahypoteesi H :Me = Me 0 0 Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman eräänä ratkaisuna on Wilcoxonin rankitesti, joka vastaa yhden otoksen t-testiä. TKK (c) Ilkka Mellin (2004) 24

Wilcoxonin rankitesti Testisuure 1/2 Olkoon D i = X i Me 0, i = 1, 2,, n ja olkoon n n niiden erotusten D i lukumäärä, jotka ovat 0. Olkoot Z1, Z2,, Zn itseisarvot D i järjestettyinä suuruusjärjestykseen pienimmästä suurimpaan ja olkoon R(Z i ) = itseisarvon Z i järjestysnumero eli ranki, i = 1, 2,, n TKK (c) Ilkka Mellin (2004) 25

Wilcoxonin rankitesti Testisuure 2/2 Määritellään testisuure W W = R( Zi ) D < 0 on niiden rankien summa, joita vastaavat erotukset D i = X i Me 0 < 0 Määritellään testisuure W + i D > 0 i on niiden rankien summa, joita vastaavat erotukset W + = R( Zi ) D i = X i Me 0 > 0 TKK (c) Ilkka Mellin (2004) 26

Wilcoxonin rankitesti Testisuureiden W ja W + ominaisuudet (i) (ii) (iii) + 1 W + W = 2 n( n+ 1) Jos nollahypoteesi H 0 pätee, + E( W ) = E( W ) = n( n+ 1) Jos nollahypoteesi H 0 pätee, 1 4 D( W ) = D( W ) = n( n+ 1)(2n+ 1) 2 2 + 1 24 TKK (c) Ilkka Mellin (2004) 27

Wilcoxonin rankitesti Eksakti testi Testisuureiden W ja W + jakaumat on taulukoitu ja monet tietokoneohjelmat laskevat testin p-arvoja. Wilcoxonin rankitestin p-arvot määrätään seuraavilla kaavoilla, joissa w ja w + ovat testisuureiden W ja W + havaitut arvot: (i) Vaihtoehtoinen hypoteesi H 1 : Me > Me 0 Testin p-arvo: p = Pr(W + > w + ) (ii) Vaihtoehtoinen hypoteesi H 1 : Me < Me 0 Testin p-arvo: p = Pr(W < w ) (iii) Vaihtoehtoinen hypoteesi H 1 : Me Me 0 Testin p-arvo: p = 2 min{pr(w + > w + ), Pr(W < w )} TKK (c) Ilkka Mellin (2004) 28

Wilcoxonin rankitesti Standardoitu W-testisuure ja sen jakauma 1/2 Jos nollahypoteesi H 0 pätee, + 1 E( W ) = E( W ) = n( n+ 1) 2 2 + 1 D( W ) = D( W ) = 24 n( n+ 1)(2n+ 1) Määritellään testisuure W z = E( W ) * * * D( W ) jossa W * = W tai W +. 4 TKK (c) Ilkka Mellin (2004) 29

Wilcoxonin rankitesti Standardoitu W-testisuure ja sen jakauma 2/2 Jos nollahypoteesi H 0 pätee, niin testisuure W z = * * * D( W ) noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0, 1): z ~ a N(0,1) E( W ) Approksimaatio on tavallisesti riittävän hyvä, jos n > 20. Pienissä otoksissa nojataan testisuureen W * tarkkaan jakaumaan. TKK (c) Ilkka Mellin (2004) 30

Wilcoxonin rankitesti Asymptoottinen testi Testisuureen W z = normaaliarvo = 0, koska nollahypoteesin H 0 pätiessä E(z) = 0 E( W ) * * * D( W ) Siten itseisarvoltaan suuret testisuureen z arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. Hylkäysalueen valinta ja p-arvon määrääminen: ks. lukua Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 31

Wilcoxonin rankitesti Kommentteja Wilcoxonin rankitesti voidaan tulkita yhden otoksen t- testin ei-parametriseksi vastineeksi. Wilcoxonin rankitestissä ei tehdä toisin kuin yhden otoksen t-testissä mitään oletuksia perusjoukon jakauman tyypistä. Wilcoxonin rankitestin testisuureen arvo ei riipu havaintoarvoista, vaan ainoastaan niiden keskinäisestä järjestyksestä. Wilcoxonin rankitesti käyttää merkkitestiä enemmän informaatiota havaintojen järjestyksestä. Wilcoxonin rankitesti on voimakkaampi kuin merkkitesti. TKK (c) Ilkka Mellin (2004) 32

Wilcoxonin rankitesti Wilcoxonin rankitestin soveltaminen parivertailuasetelmiin 1/2 Wilcoxonin rankitestiä voidaan soveltaa parivertailuasetelmiin, joissa havainnot muodostuvat toisistaan riippumattomista mittauspareista (X i, Y i ), i = 1, 2,, n Oletetaan, että X-ja Y-mittausten jakaumat ovat muuten samat, mutta niiden mediaaneilla (sijaintiparametreilla) saattaa olla eri arvot. Määritellään havaintojen X i ja Y i erotukset D i = X i Y i, i = 1, 2,, n ja olkoon n niiden erotusten D i lukumäärä, jotka ovat 0. TKK (c) Ilkka Mellin (2004) 33

Wilcoxonin rankitesti Wilcoxonin rankitestin soveltaminen parivertailuasetelmiin 2/2 Oletetaan, että erotusten D i = X i Y i, i = 1, 2,, n jakauma on symmetrinen. Määritellään testisuureet W ja W + erotuksille D i kuten edellä. Olkoon Me D erotusten D i = X i Y i, i = 1, 2,, n mediaani. Tällöin nollahypoteesin H : Me = 0 0 D testaamiseen voidaan soveltaa Wilcoxonin rankitestiä. TKK (c) Ilkka Mellin (2004) 34

Testit järjestysasteikollisille muuttujille Järjestysasteikollisten muuttujien testit Merkkitesti Wilcoxonin rankitesti >> Mannin ja Whitneyn testi Wilcoxonin rankisummatesti TKK (c) Ilkka Mellin (2004) 35

Mannin ja Whitneyn testi Avainsanat Asymptoottinen testi Ei-parametrinen testi Jakaumista riippumaton testi Järjestysasteikko Kahden otoksen testit Mediaani Normaalijakauma Parametri Testisuure Testisuureen jakauma t-testi TKK (c) Ilkka Mellin (2004) 36

Mannin ja Whitneyn testi Testausasetelma 1/2 Oletetaan, että X1, X2,, Xn ovat riippumattomia havaintoja satunnaismuuttujan X jakaumasta perusjoukossa S 1 (otos 1). Oletetaan, että Y1, Y2,, Ym ovat riippumattomia havaintoja satunnaismuuttujan Y jakaumasta perusjoukossa S 2 (otos 2). Olkoot otokset lisäksi toisistaan riippumattomia. TKK (c) Ilkka Mellin (2004) 37

Mannin ja Whitneyn testi Testausasetelma 2/2 Oletetaan, että satunnaismuuttujat X ja Y noudattavat muuten samaa jakaumaa, mutta niiden mediaanit (sijaintiparametrit) saattavat erota toisistaan. Asetetaan nollahypoteesi, että satunnaismuuttujilla X ja Y on sama mediaani (sijaintiparametri). Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman eräänä ratkaisuna on Mannin ja Whitneyn testi, joka vastaa kahden riippumattoman otoksen t-testiä. TKK (c) Ilkka Mellin (2004) 38

Mannin ja Whitneyn testi Yleinen hypoteesi Yleinen hypoteesi H : (1) Havainnot (2) Havainnot (3) Jakaumat F X ja F X ovat muuten samat, mutta niiden mediaanit (sijaintiparametrit) saattavat erota toisistaan. (4) Havainnot X i ja Y j ovat riippumattomia kaikille i ja j Huomautus: X F, i= 1,2,, n i X Y F, j = 1,2,, m j Y Oletus (3) sisältää kolme riippumattomuusoletusta: Havainnot ovat riippumattomia otoksien 1 ja 2 sisällä. Havainnot ovat riippumattomia otoksien 1 ja 2 välillä. TKK (c) Ilkka Mellin (2004) 39

Mannin ja Whitneyn testi Nollahypoteesi ja vaihtoehtoinen hypoteesi Nollahypoteesi H 0 : H 0 : F X = F Y Vaihtoehtoinen hypoteesi H 1 : H 1 : F X F Y TKK (c) Ilkka Mellin (2004) 40

Mannin ja Whitneyn testi Testin idea Yhdistetään X-ja Y-havainnot yhdeksi otokseksi ja järjestetään yhdistetyn otoksen havainnot suuruusjärjestykseen pienimmästä suurimpaan. Tarkastellaan miten X-ja Y-havainnot seuraavat yhdistetyssä otoksessa toisiaan. Jos kaikki X-havainnot (Y-havainnot) edeltävät kaikkia Y-havaintoja (X-havaintoja), ei ole uskottavaa, että nollahypoteesi H 0 pätee. Jos satunnaismuuttujat X ja Y noudattavat samaa jakaumaa, on ilmeistä, että X-ja Y-havaintojen on sekoituttava sopivasti toisiinsa. Mannin ja Whitneyn testisuure mittaa tätä sekoittumista. TKK (c) Ilkka Mellin (2004) 41

Mannin ja Whitneyn testi Testisuure U 1 muoto 1 Määritellään satunnaismuuttujat (1) 1, jos Xi < Yj Dij = 0, jos Xi > Yj i = 1, 2,, n, j = 1, 2,, m ja testisuure U 1 n m = i= 1 j= 1 D (1) ij TKK (c) Ilkka Mellin (2004) 42

Mannin ja Whitneyn testi Testisuure U 1 muoto 2 Määritellään satunnaismuuttujat R(X i ) = havainnon X i järjestysnumero eli ranki yhdistetyssä otoksessa i = 1, 2,, n ja testisuure n 1 U1 = nm+ 2 n( n+ 1) R( Xi ) Testisuureen U 1 muodot 1 ja 2 ovat ekvivalentteja. i= 1 TKK (c) Ilkka Mellin (2004) 43

Mannin ja Whitneyn testi Testisuureen U 1 ominaisuudet Testisuureen U 1 arvo ei riipu X-ja Y-havaintoarvojen suuruudesta, vaan ainoastaan niiden keskinäisestä järjestyksestä. Aina pätee 0 U 1 nm ja erityisesti U 1 = 0, jos X i > Y j kaikille i ja j U 1 = nm, jos X i < Y j kaikille i ja j TKK (c) Ilkka Mellin (2004) 44

Mannin ja Whitneyn testi Testisuure U 2 muoto 1 Määritellään satunnaismuuttujat (2) 1, jos Yj < Xi D ji = 0, jos Yj > Xi j = 1, 2,, m, i = 1, 2,, n ja testisuure U 2 m n = j= 1 i= 1 D (2) ji TKK (c) Ilkka Mellin (2004) 45

Mannin ja Whitneyn testi Testisuure U 2 muoto 2 Määritellään satunnaismuuttujat R(Y j ) = havainnon Y j järjestysnumero eli ranki yhdistetyssä otoksessa j = 1, 2,, m ja testisuure m 1 U2 = nm+ 2 m( m+ 1) R( Yj ) Testisuureen U 2 muodot 1 ja 2 ovat ekvivalentteja. j= 1 TKK (c) Ilkka Mellin (2004) 46

Mannin ja Whitneyn testi Testisuureen U 2 ominaisuudet Testisuureen U 2 arvo ei riipu X-ja Y-havaintoarvojen suuruudesta, vaan ainoastaan niiden keskinäisestä järjestyksestä. Aina pätee 0 U 2 nm ja erityisesti U 2 = 0, jos Y j > X i kaikille i ja j U 2 = nm, jos Y j < X i kaikille i ja j TKK (c) Ilkka Mellin (2004) 47

Mannin ja Whitneyn testi Testisuureiden U 1 ja U 2 ominaisuudet (i) (ii) (iii) U 1 + U 2 = nm Jos nollahypoteesi H 0 pätee, E( U ) = E( U ) = nm 1 1 2 2 Jos nollahypoteesi H 0 pätee, D( U ) = D( U ) = nm( n+ m+ 1) 2 2 1 1 2 12 TKK (c) Ilkka Mellin (2004) 48

Mannin ja Whitneyn testi Standardoitu U 1 -testisuure ja sen jakauma Jos nollahypoteesi H 0 pätee, niin standardoitu satunnaismuuttuja z 1 U1 E( U1) = D( U ) 1 noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa: z 1 ~ a N(0,1) Approksimaatio on tavallisesti riittävän hyvä, jos n > 10 ja m > 10. Pienissä otoksissa nojataan testisuureen U 1 tarkkaan jakaumaan. TKK (c) Ilkka Mellin (2004) 49

Mannin ja Whitneyn testi Asymptoottinen testi muoto 1 Testisuureen U1 E( U1) z1 = D( U1) normaaliarvo = 0, koska nollahypoteesin H 0 pätiessä E(z 1 ) = 0 Siten itseisarvoltaan suuret testisuureen z 1 arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. Hylkäysalueen valinta ja p-arvon määrääminen: ks. lukua Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 50

Mannin ja Whitneyn testi Standardoitu U 2 -testisuure ja sen jakauma Jos nollahypoteesi H 0 pätee, niin standardoitu satunnaismuuttuja z 2 U = E( U ) D( U ) 2 2 noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa: z 2 ~ a N(0,1) 2 Approksimaatio on tavallisesti riittävän hyvä, jos n > 10 ja m > 10. Pienissä otoksissa nojataan testisuureen U 2 tarkkaan jakaumaan. TKK (c) Ilkka Mellin (2004) 51

Mannin ja Whitneyn testi Asymptoottinen testi muoto 2 Testisuureen U2 E( U2) z2 = D( U 2) normaaliarvo = 0, koska nollahypoteesin H 0 pätiessä E(z 2 ) = 0 Siten itseisarvoltaan suuret testisuureen z 2 arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. Hylkäysalueen valinta ja p-arvon määrääminen: ks. lukua Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 52

Mannin ja Whitneyn testi Kommentteja 1/2 Mannin ja Whitneyn testi voidaan tulkita kahden riippumattoman otoksen t-testin ei-parametriseksi vastineeksi. Mannin ja Whitneyn testissä ei tehdä toisin kuin kahden riippumattoman otoksen t-testissä mitään oletuksia perusjoukkojen jakaumasta. Mannin ja Whitneyn testisuureiden arvo ei riipu muuttujien X ja Y arvoista, vaan ainoastaan niiden keskinäisestä järjestyksestä. TKK (c) Ilkka Mellin (2004) 53

Mannin ja Whitneyn testi Kommentteja 2/2 Jos havainnot ovat normaalijakautuneita, Mannin ja Whitneyn testi ei ole yhtä voimakas kuin kahden riippumattoman otoksen t-testi. Jos havainnot eivät ole normaalijakautuneita, Mannin ja Whitneyn testi saattaa olla paljon voimakkaampi kuin kahden riippumattoman otoksen t-testi. Mannin ja Whitneyn testi on varteenotettava vaihtoehto kahden riippumattoman otoksen t-testille, jos otoskoot eivät ole kovin isoja ja perusjoukot eivät ole normaalijakautuneita. TKK (c) Ilkka Mellin (2004) 54

Testit järjestysasteikollisille muuttujille Järjestysasteikollisten muuttujien testit Merkkitesti Wilcoxonin rankitesti Mannin ja Whitneyn testi >> Wilcoxonin rankisummatesti TKK (c) Ilkka Mellin (2004) 55

Wilcoxonin rankisummatesti Avainsanat Asymptoottinen testi Ei-parametrinen testi Jakaumista riippumaton testi Järjestysasteikko Kahden otoksen testit Mediaani Normaalijakauma Parametri Testisuure Testisuureen jakauma t-testi TKK (c) Ilkka Mellin (2004) 56

Wilcoxonin rankisummatesti Wilcoxonin rankisummatesti ja Mannin ja Whitneyn testi Wilcoxonin rankisummatesti perustuu Mannin ja Whitneyn testisuureiden muodoissa 2 esiintyviin havaintojen rankisummiin eli järjestyslukujen summiin. Wilcoxonin rankisummatesti on ekvivalentti Mannin ja Whitneyn testin kanssa. TKK (c) Ilkka Mellin (2004) 57

Wilcoxonin rankisummatesti Testisuure T 1 Määritellään satunnaismuuttujat R(X i ) = havainnon X i järjestysnumero eli ranki yhdistetyssä otoksessa i = 1, 2,, n ja testisuure T 1 n = R( Xi ) i= 1 TKK (c) Ilkka Mellin (2004) 58

Wilcoxonin rankisummatesti Testisuure T 2 Määritellään satunnaismuuttujat R(Y j ) = havainnon Y j järjestysnumero eli ranki yhdistetyssä otoksessa j = 1, 2,, m ja testisuure T 2 m = R( Yj ) j= 1 TKK (c) Ilkka Mellin (2004) 59

Wilcoxonin rankisummatesti Testisuureiden T 1 ja T 2 ominaisuudet (i) (ii) (iii) T + T = ( n+ m )( n+ m+ 1) 1 1 2 2 Jos nollahypoteesi H 0 pätee, 1 E( T) = n( n+ m+ 1) 1 2 1 E( T2 ) = 2 m( n+ m+ 1) Jos nollahypoteesi H 0 pätee, D( T) = D( T ) = nm( n+ m+ 1) 2 2 1 1 2 12 TKK (c) Ilkka Mellin (2004) 60

Wilcoxonin rankisummatesti Standardoitu T 1 -testisuure ja sen jakauma Jos nollahypoteesi H 0 pätee, niin standardoitu satunnaismuuttuja z 1 T1 E( T1) = D( T ) 1 noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa: z 1 ~ a N(0,1) Approksimaatio on tavallisesti riittävän hyvä, jos n > 10 ja m > 10. Pienissä otoksissa nojataan testisuureen T 1 tarkkaan jakaumaan. TKK (c) Ilkka Mellin (2004) 61

Wilcoxonin rankisummatesti Asymptoottinen testi muoto 1 Testisuureen T1 E( T1) z1 = D( T1 ) normaaliarvo = 0, koska nollahypoteesin H 0 pätiessä E(z 1 ) = 0 Siten itseisarvoltaan suuret testisuureen z 1 arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. Hylkäysalueen valinta ja p-arvon määrääminen: ks. lukua Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 62

Wilcoxonin rankisummatesti Standardoitu T 2 -testisuure ja sen jakauma Jos nollahypoteesi H 0 pätee, niin standardoitu satunnaismuuttuja z 2 T = E( T ) D( T ) 2 2 2 noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa: z 2 ~ a N(0,1) Approksimaatio on tavallisesti riittävän hyvä, jos n > 10 ja m > 10. Pienissä otoksissa nojataan testisuureen T 2 tarkkaan jakaumaan. TKK (c) Ilkka Mellin (2004) 63

Wilcoxonin rankisummatesti Asymptoottinen testi muoto 2 Testisuureen T2 E( T2) z2 = D( T2 ) normaaliarvo = 0, koska nollahypoteesin H 0 pätiessä E(z 2 ) = 0 Siten itseisarvoltaan suuret testisuureen z 2 arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. Hylkäysalueen valinta ja p-arvon määrääminen: ks. lukua Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 64