TKK (c Ilkka Melli (004 Johdatus tilastotieteesee TKK (c Ilkka Melli (004 : Mitä opimme? Tarkastelemme tässä luvussa seuraavia järjestysasteikolliste muuttujie testejä: ja merkkitesti parivertailuille ja parivertailuille eli Testit o tarkoitettu todeäköisyysjakauma sijaitiparametreille (mediaaille, mutta e ovat luoteeltaa ei-parametrisia eli jakaumista riippumattomia siiä mielessä, että testie yleiset hypoteesit eivät tarkkaa määrittele perusjouko jakaumaa. : Esitiedot Esitiedot: ks. seuraavia lukuja: Tilastolliste aieistoje keräämie ja mittaamie Tilastolliste aieistoje kuvaamie Otos ja otosjakaumat Estimoiti Estimoitimeetelmät Väliestimoiti Tilastolliset testit Satuaismuuttujat ja todeäköisyysjakaumat Jakaumie tuusluvut Diskreettejä jakaumia Jatkuvia jakaumia TKK (c Ilkka Melli (004 3 TKK (c Ilkka Melli (004 4 : Lisätiedot Testejä suhdeasteikollisille muuttujille käsitellää luvussa Testit suhdeasteikollisille muuttujille Testejä laatueroasteikollisille muuttujille käsitellää luvussa Testit laatueroasteikollisille muuttujille Jakaumaoletuksie testaamista käsitellää luvussa Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie >> TKK (c Ilkka Melli (004 5 TKK (c Ilkka Melli (004 6
TKK (c Ilkka Melli (004 7 / Avaisaat Ei-parametrie testi Jakauma sijaitiparametri Jakaumista riippumato testi Järjestysasteikko Kahde otokse testit Mediaai Parametri Parivertailu Yhde otokse testit Tarkastelemme seuraavia testejä (jatkuville järjestysasteikollisille muuttujille: eli Testejä saa käyttää myös välimatka-ja suhdeasteikollisille muuttujille. Mitta-asteikot: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. TKK (c Ilkka Melli (004 8 / Kaikki käsiteltävät testit ovat ei-parametrisia eli jakaumista riippumattomia, millä tarkoitetaa sitä, että testie yleiset hypoteesit eivät tarkkaa määrittele perusjouko jakaumaa. ja ovat luoteeltaa yhde otokse testejä, mutta iitä voidaa soveltaa myös parivertailuasetelmissa. eli o luoteeltaa kahde otokse testi. Kaikissa käsiteltävissä testeissä testataa tarkemmi määrittelemättömä todeäköisyysjakauma sijaitiparametria (mediaaia koskevia hypoteeseja >> TKK (c Ilkka Melli (004 9 TKK (c Ilkka Melli (004 0 Testausasetelma Avaisaat Biomijakauma Ei-parametrie testi Jakaumista riippumato testi Järjestysasteikko Mediaai Normaalijakauma Parametri Parivertailu Testisuure Testisuuree jakauma t-testi Yhde otokse testit Olkoo X, X,, X yksikertaie satuaisotos perusjoukosta S, joka jakauma o symmetrie. Asetetaa jakauma mediaaille Me ollahypoteesi H 0 :Me Me0 Testausogelma: Ovatko havaiot sopusoiussa ollahypoteesi H 0 kassa? Ogelma eräää ratkaisua o merkkitesti, joka vastaa yhde otokse t-testiä. TKK (c Ilkka Melli (004 TKK (c Ilkka Melli (004
TKK (c Ilkka Melli (004 3 Testisuureet Testisuureide S ja S + omiaisuudet Määritellää erotukset D i X i Me 0, i,,, ja olkoo iide erotuste D i lukumäärä, jotka ovat 0. Jos ollahypoteesi H 0 pätee, positiiviste ja egatiiviste erotuste o jakauduttava suuillee tasa. Määritellää testisuureet S ja S + : S egatiiviste erotuste D i X i Me 0 lukumäärä S + positiiviste erotuste D i X i Me 0 lukumäärä (i S + S + (ii Jos ollahypoteesi H 0 pätee, testisuureet S ja S + oudattavat biomijakaumaa Bi(, q parametrei ja q /: S ~ Bi(, / S + ~Bi(, / (iii Jos ollahypoteesi H 0 pätee, + E( S E( S q (iv Jos ollahypoteesi H 0 pätee, + D( S D( S q( q 4 TKK (c Ilkka Melli (004 4 Eksakti testi Stadardoitu S-testisuure ja se jakauma / Testisuureide S ja S + jakaumat o taulukoitu ja moet tietokoeohjelmat laskevat testi p-arvoja. p-arvot määrätää seuraavilla kaavoilla, joissa s (s + o testisuuree S (S + havaittu arvo: (i Vaihtoehtoie hypoteesi H : Me > Me 0 Testi p-arvo: p Pr(S + > s + (ii Vaihtoehtoie hypoteesi H : Me < Me 0 Testi p-arvo: p Pr(S < s (iii Vaihtoehtoie hypoteesi: H : Me Me 0 Testi p-arvo: p mi{pr(s + > s +, Pr(S < s } Jos ollahypoteesi H 0 pätee, + E( S E( S + D( S D( S 4 Määritellää testisuure S E( S z D( S jossa S S tai S +. TKK (c Ilkka Melli (004 5 TKK (c Ilkka Melli (004 6 Stadardoitu S-testisuure ja se jakauma / Jos ollahypoteesi H 0 pätee, ii testisuure S E( S z D( S oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0, : z ~ a N(0, Approksimaatio o tavallisesti riittävä hyvä, jos > 0. Pieissä otoksissa ojataa testisuuree S tarkkaa jakaumaa. Testisuuree S E( S z D( S ormaaliarvo 0, koska ollahypoteesi H 0 pätiessä E(z 0 Site itseisarvoltaa suuret testisuuree z arvot viittaavat piei. TKK (c Ilkka Melli (004 7 TKK (c Ilkka Melli (004 8
TKK (c Ilkka Melli (004 9 Kommetteja soveltamie parivertailuasetelmii / voidaa tulkita yhde otokse t-testi eiparametriseksi vastieeksi. ssä ei tehdä toisi kui yhde otokse t-testissä mitää oletuksia perusjouko jakauma tyypistä. testisuuree arvo ei riipu havaitoarvoista, vaa aioastaa iide keskiäisestä järjestyksestä. ä voidaa soveltaa parivertailuasetelmii, joissa havaiot muodostuvat toisistaa riippumattomista mittauspareista (X i, Y i, i,,, Oletetaa, että X-ja Y-mittauste jakaumat ovat muute samat, mutta iide mediaaeilla (sijaitiparametreilla saattaa olla eri arvot. Määritellää havaitoje X i ja Y i erotukset D i X i Y i, i,,, ja olkoo iide erotuste D i lukumäärä, jotka ovat 0. TKK (c Ilkka Melli (004 0 soveltamie parivertailuasetelmii / Tehdää oletus, että erotuste D i X i Y i, i,,, jakauma o symmetrie. Määritellää testisuureet S ja S + erotuksille D i kute edellä. Olkoo Me D erotuste D i X i Y i, i,,, mediaai. Tällöi ollahypoteesi H 0 : Me D 0 testaamisee voidaa soveltaa merkkitestiä. TKK (c Ilkka Melli (004 >> TKK (c Ilkka Melli (004 Testausasetelma Avaisaat Ei-parametrie testi Jakaumista riippumato testi Järjestysasteikko Mediaai Normaalijakauma Parametri Parivertailu Testisuure Testisuuree jakauma t-testi Yhde otokse testit Olkoo X, X,, X yksikertaie satuaisotos perusjoukosta S, joka jakauma o symmetrie. Asetetaa jakauma mediaaille Me ollahypoteesi H 0 :Me Me0 Testausogelma: Ovatko havaiot sopusoiussa ollahypoteesi H 0 kassa? Ogelma eräää ratkaisua o, joka vastaa yhde otokse t-testiä. TKK (c Ilkka Melli (004 3 TKK (c Ilkka Melli (004 4
TKK (c Ilkka Melli (004 5 Testisuure / Testisuure / Olkoo D i X i Me 0, i,,, ja olkoo iide erotuste D i lukumäärä, jotka ovat 0. Olkoot Z, Z,, Z itseisarvot D i järjestettyiä suuruusjärjestyksee pieimmästä suurimpaa ja olkoo R(Z i itseisarvo Z i järjestysumero eli raki, i,,, Määritellää testisuure W R( Zi Di < 0 W o iide rakie summa, joita vastaavat erotukset D i X i Me 0 < 0 Määritellää testisuure + W R( Zi Di > 0 W + o iide rakie summa, joita vastaavat erotukset D i X i Me 0 > 0 TKK (c Ilkka Melli (004 6 Testisuureide W ja W + omiaisuudet Eksakti testi (i (ii (iii + W + W ( + Jos ollahypoteesi H 0 pätee, + E( W E( W ( + 4 Jos ollahypoteesi H 0 pätee, D( W D( W + ( + (+ 4 Testisuureide W ja W + jakaumat o taulukoitu ja moet tietokoeohjelmat laskevat testi p-arvoja. p-arvot määrätää seuraavilla kaavoilla, joissa w ja w + ovat testisuureide W ja W + havaitut arvot: (i Vaihtoehtoie hypoteesi H : Me > Me 0 Testi p-arvo: p Pr(W + > w + (ii Vaihtoehtoie hypoteesi H : Me < Me 0 Testi p-arvo: p Pr(W < w (iii Vaihtoehtoie hypoteesi H : Me Me 0 Testi p-arvo: p mi{pr(w + > w +, Pr(W < w } TKK (c Ilkka Melli (004 7 TKK (c Ilkka Melli (004 8 Stadardoitu W-testisuure ja se jakauma / Stadardoitu W-testisuure ja se jakauma / Jos ollahypoteesi H 0 pätee, + E( W E( W ( + + D( W D( W 4 ( + (+ Määritellää testisuure W E( W z D( W jossa W W tai W +. 4 Jos ollahypoteesi H 0 pätee, ii testisuure W E( W z D( W oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0, : z ~ a N(0, Approksimaatio o tavallisesti riittävä hyvä, jos > 0. Pieissä otoksissa ojataa testisuuree W tarkkaa jakaumaa. TKK (c Ilkka Melli (004 9 TKK (c Ilkka Melli (004 30
TKK (c Ilkka Melli (004 3 Kommetteja Testisuuree W E( W z D( W ormaaliarvo 0, koska ollahypoteesi H 0 pätiessä E(z 0 Site itseisarvoltaa suuret testisuuree z arvot viittaavat piei. voidaa tulkita yhde otokse t- testi ei-parametriseksi vastieeksi. ssä ei tehdä toisi kui yhde otokse t-testissä mitää oletuksia perusjouko jakauma tyypistä. testisuuree arvo ei riipu havaitoarvoista, vaa aioastaa iide keskiäisestä järjestyksestä. käyttää merkkitestiä eemmä iformaatiota havaitoje järjestyksestä. o voimakkaampi kui merkkitesti. TKK (c Ilkka Melli (004 3 soveltamie parivertailuasetelmii / ä voidaa soveltaa parivertailuasetelmii, joissa havaiot muodostuvat toisistaa riippumattomista mittauspareista (X i, Y i, i,,, Oletetaa, että X-ja Y-mittauste jakaumat ovat muute samat, mutta iide mediaaeilla (sijaitiparametreilla saattaa olla eri arvot. Määritellää havaitoje X i ja Y i erotukset D i X i Y i, i,,, ja olkoo iide erotuste D i lukumäärä, jotka ovat 0. TKK (c Ilkka Melli (004 33 soveltamie parivertailuasetelmii / Oletetaa, että erotuste D i X i Y i, i,,, jakauma o symmetrie. Määritellää testisuureet W ja W + erotuksille D i kute edellä. Olkoo Me D erotuste D i X i Y i, i,,, mediaai. Tällöi ollahypoteesi H 0 : Me D 0 testaamisee voidaa soveltaa ä. TKK (c Ilkka Melli (004 34 >> Avaisaat Ei-parametrie testi Jakaumista riippumato testi Järjestysasteikko Kahde otokse testit Mediaai Normaalijakauma Parametri Testisuure Testisuuree jakauma t-testi TKK (c Ilkka Melli (004 35 TKK (c Ilkka Melli (004 36
TKK (c Ilkka Melli (004 37 Testausasetelma / Testausasetelma / Oletetaa, että X, X,, X ovat riippumattomia havaitoja satuaismuuttuja X jakaumasta perusjoukossa S (otos. Oletetaa, että Y, Y,, Ym ovat riippumattomia havaitoja satuaismuuttuja Y jakaumasta perusjoukossa S (otos. Olkoot otokset lisäksi toisistaa riippumattomia. Oletetaa, että satuaismuuttujat X ja Y oudattavat muute samaa jakaumaa, mutta iide mediaait (sijaitiparametrit saattavat erota toisistaa. Asetetaa ollahypoteesi, että satuaismuuttujilla X ja Y o sama mediaai (sijaitiparametri. Testausogelma: Ovatko havaiot sopusoiussa ollahypoteesi H 0 kassa? Ogelma eräää ratkaisua o Mai ja Whitey testi, joka vastaa kahde riippumattoma otokse t-testiä. TKK (c Ilkka Melli (004 38 Yleie hypoteesi Nollahypoteesi ja vaihtoehtoie hypoteesi Yleie hypoteesi H : ( Havaiot Xi FX, i,,, ( Havaiot Yj FY, j,,, m (3 Jakaumat F X ja F X ovat muute samat, mutta iide mediaait (sijaitiparametrit saattavat erota toisistaa. (4 Havaiot X i ja Y j ovat riippumattomia kaikille i ja j Huomautus: Oletus (3 sisältää kolme riippumattomuusoletusta: Havaiot ovat riippumattomia otoksie ja sisällä. Havaiot ovat riippumattomia otoksie ja välillä. Nollahypoteesi H 0 : H 0 : F X F Y Vaihtoehtoie hypoteesi H : H : F X F Y TKK (c Ilkka Melli (004 39 TKK (c Ilkka Melli (004 40 Testi idea Testisuure U muoto Yhdistetää X-ja Y-havaiot yhdeksi otokseksi ja järjestetää yhdistety otokse havaiot suuruusjärjestyksee pieimmästä suurimpaa. Tarkastellaa mite X-ja Y-havaiot seuraavat yhdistetyssä otoksessa toisiaa. Jos kaikki X-havaiot (Y-havaiot edeltävät kaikkia Y-havaitoja (X-havaitoja, ei ole uskottavaa, että ollahypoteesi H 0 pätee. Jos satuaismuuttujat X ja Y oudattavat samaa jakaumaa, o ilmeistä, että X-ja Y-havaitoje o sekoituttava sopivasti toisiisa. suure mittaa tätä sekoittumista. TKK (c Ilkka Melli (004 4 Määritellää satuaismuuttujat (, jos Xi < Yj Dij 0, jos Xi > Yj i,,,, j,,, m U m i j D ( ij TKK (c Ilkka Melli (004 4
TKK (c Ilkka Melli (004 43 Testisuure U muoto Testisuuree U omiaisuudet Määritellää satuaismuuttujat R(X i havaio X i järjestysumero eli raki yhdistetyssä otoksessa i,,, U m+ ( + R( Xi i Testisuuree U muodot ja ovat ekvivaletteja. Testisuuree U arvo ei riipu X-ja Y-havaitoarvoje suuruudesta, vaa aioastaa iide keskiäisestä järjestyksestä. Aia pätee 0 U m ja erityisesti U 0, jos X i > Y j kaikille i ja j U m, jos X i < Y j kaikille i ja j TKK (c Ilkka Melli (004 44 Testisuure U muoto Testisuure U muoto Määritellää satuaismuuttujat (, jos Yj < Xi Dji 0, jos Yj > Xi j,,, m, i,,, U m j i D ( ji Määritellää satuaismuuttujat R(Y j havaio Y j järjestysumero eli raki yhdistetyssä otoksessa j,,, m m U m+ m( m+ R( Yj j Testisuuree U muodot ja ovat ekvivaletteja. TKK (c Ilkka Melli (004 45 TKK (c Ilkka Melli (004 46 Testisuuree U omiaisuudet Testisuureide U ja U omiaisuudet Testisuuree U arvo ei riipu X-ja Y-havaitoarvoje suuruudesta, vaa aioastaa iide keskiäisestä järjestyksestä. Aia pätee 0 U m ja erityisesti U 0, jos Y j > X i kaikille i ja j U m, jos Y j < X i kaikille i ja j (i (ii (iii U + U m Jos ollahypoteesi H 0 pätee, E( U E( U m Jos ollahypoteesi H 0 pätee, D( U D( U m( + m+ TKK (c Ilkka Melli (004 47 TKK (c Ilkka Melli (004 48
TKK (c Ilkka Melli (004 49 Stadardoitu U -testisuure ja se jakauma muoto Jos ollahypoteesi H 0 pätee, ii stadardoitu satuaismuuttuja U E( U z D( U oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: z ~ a N(0, Approksimaatio o tavallisesti riittävä hyvä, jos > 0 ja m > 0. Pieissä otoksissa ojataa testisuuree U tarkkaa jakaumaa. Testisuuree U E( U z D( U ormaaliarvo 0, koska ollahypoteesi H 0 pätiessä E(z 0 Site itseisarvoltaa suuret testisuuree z arvot viittaavat piei. TKK (c Ilkka Melli (004 50 Stadardoitu U -testisuure ja se jakauma muoto Jos ollahypoteesi H 0 pätee, ii stadardoitu satuaismuuttuja U E( U z D( U oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: z ~ a N(0, Approksimaatio o tavallisesti riittävä hyvä, jos > 0 ja m > 0. Pieissä otoksissa ojataa testisuuree U tarkkaa jakaumaa. Testisuuree U E( U z D( U ormaaliarvo 0, koska ollahypoteesi H 0 pätiessä E(z 0 Site itseisarvoltaa suuret testisuuree z arvot viittaavat piei. TKK (c Ilkka Melli (004 5 TKK (c Ilkka Melli (004 5 Kommetteja / Kommetteja / voidaa tulkita kahde riippumattoma otokse t-testi ei-parametriseksi vastieeksi. ssä ei tehdä toisi kui kahde riippumattoma otokse t-testissä mitää oletuksia perusjoukkoje jakaumasta. suureide arvo ei riipu muuttujie X ja Y arvoista, vaa aioastaa iide keskiäisestä järjestyksestä. Jos havaiot ovat ormaalijakautueita, Mai ja Whitey testi ei ole yhtä voimakas kui kahde riippumattoma otokse t-testi. Jos havaiot eivät ole ormaalijakautueita, Mai ja Whitey testi saattaa olla paljo voimakkaampi kui kahde riippumattoma otokse t-testi. o varteeotettava vaihtoehto kahde riippumattoma otokse t-testille, jos otoskoot eivät ole kovi isoja ja perusjoukot eivät ole ormaalijakautueita. TKK (c Ilkka Melli (004 53 TKK (c Ilkka Melli (004 54
TKK (c Ilkka Melli (004 55 >> Avaisaat Ei-parametrie testi Jakaumista riippumato testi Järjestysasteikko Kahde otokse testit Mediaai Normaalijakauma Parametri Testisuure Testisuuree jakauma t-testi TKK (c Ilkka Melli (004 56 ja perustuu Mai ja Whitey testisuureide muodoissa esiityvii havaitoje rakisummii eli järjestyslukuje summii. o ekvivaletti Mai ja Whitey testi kassa. Testisuure T Määritellää satuaismuuttujat R(X i havaio X i järjestysumero eli raki yhdistetyssä otoksessa i,,, T R( Xi i TKK (c Ilkka Melli (004 57 TKK (c Ilkka Melli (004 58 Testisuure T Testisuureide T ja T omiaisuudet Määritellää satuaismuuttujat R(Y j havaio Y j järjestysumero eli raki yhdistetyssä otoksessa j,,, m m T R( Yj j (i (ii (iii T + T ( + m ( + m+ Jos ollahypoteesi H 0 pätee, E( T ( + m+ E( T m( + m+ Jos ollahypoteesi H 0 pätee, D( T D( T m( + m+ TKK (c Ilkka Melli (004 59 TKK (c Ilkka Melli (004 60
TKK (c Ilkka Melli (004 6 Stadardoitu T -testisuure ja se jakauma muoto Jos ollahypoteesi H 0 pätee, ii stadardoitu satuaismuuttuja T E( T z D( T oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: z ~ a N(0, Approksimaatio o tavallisesti riittävä hyvä, jos > 0 ja m > 0. Pieissä otoksissa ojataa testisuuree T tarkkaa jakaumaa. Testisuuree T E( T z D( T ormaaliarvo 0, koska ollahypoteesi H 0 pätiessä E(z 0 Site itseisarvoltaa suuret testisuuree z arvot viittaavat piei. TKK (c Ilkka Melli (004 6 Stadardoitu T -testisuure ja se jakauma muoto Jos ollahypoteesi H 0 pätee, ii stadardoitu satuaismuuttuja T E( T z D( T oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: z ~ a N(0, Approksimaatio o tavallisesti riittävä hyvä, jos > 0 ja m > 0. Pieissä otoksissa ojataa testisuuree T tarkkaa jakaumaa. Testisuuree T E( T z D( T ormaaliarvo 0, koska ollahypoteesi H 0 pätiessä E(z 0 Site itseisarvoltaa suuret testisuuree z arvot viittaavat piei. TKK (c Ilkka Melli (004 63 TKK (c Ilkka Melli (004 64