Tilastolliset menetelmät: Tilastolliset testit

Samankaltaiset tiedostot
Tilastolliset menetelmät: Tilastolliset testit

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Väliestimointi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

2-suuntainen vaihtoehtoinen hypoteesi

Sovellettu todennäköisyyslaskenta B

Harjoitus 7: NCSS - Tilastollinen analyysi

Testit laatueroasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

8. laskuharjoituskierros, vko 11, ratkaisut

Testejä suhdeasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Sovellettu todennäköisyyslaskenta B

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

Osa 2: Otokset, otosjakaumat ja estimointi

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Testit järjestysasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

χ 2 -yhteensopivuustesti

Mat Tilastollisen analyysin perusteet, kevät 2007

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

χ 2 -yhteensopivuustesti

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

tilastotieteen kertaus

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Estimointi. Vilkkumaa / Kuusinen 1

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

10. laskuharjoituskierros, vko 14, ratkaisut

Otantajakauman käyttö päättelyssä

Harjoitukset 1 : Tilastokertaus

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Yhden selittäjän lineaarinen regressiomalli

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. β versio. Tilastolliset menetelmät. Ilkka Mellin. Teknillinen korkeakoulu, Matematiikan laboratorio

Tilastolliset menetelmät

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia.

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

n = 100 x = %:n luottamusväli µ:lle Vastaus:

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

11. laskuharjoituskierros, vko 15, ratkaisut

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Sovellettu todennäköisyyslasku. Tilastolliset testit. Avainsanat:

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

6.1 Riippumattomat satunnaismuuttujat

Transkriptio:

Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille 0. Testejä järjestysasteikollisille muuttujille. Testejä laatueroasteikollisille muuttujille. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Ilkka Melli 5

Tilastolliset testit Ilkka Melli 6

Tilastolliset testit Sisällys 8. TILASTOLLINEN TESTAUS 3 8.. TILASTOLLISEN TESTAUKSEN IDEA 3 TILASTOLLISEN TESTAUKSEN LÄHTÖKOHTA 3 SATUNNAISOTOS 3 8.. TILASTOLLISET HYPOTEESIT 33 YLEINEN HYPOTEESI 33 NOLLAHYPOTEESI 33 VAIHTOEHTOINEN HYPOTEESI 34 8.3. TILASTOLLISET TESTIT JA TESTISUUREET 34 TESTI 34 TESTISUURE 34 8.4. VIRHEET TESTAUKSESSA 35 HYLKÄYSVIRHE 35 HYVÄKSYMISVIRHE 35 TESTIN VOIMAKKUUS 35. JA. LAJIN VIRHEET 35 TESTIN TULOS JA MAAILMAN TILAT 36 TESTIN HYLKÄYS- JA HYVÄKSYMISALUEET 36 8.5. MERKITSEVYYSTASO JA TESTIN HYLKÄYSALUE 36 MERKITSEVYYSTASO 36 MERKITSEVYYSTASON FREKVENSSITULKINTA 37 TAVANOMAISET MERKITSEVYYSTASOT 37 HYLKÄYSALUEEN MÄÄRÄÄMINEN YKSIKERTAISISSA TESTAUSASETELMISSA 37 8.6. TESTIN P-ARVO 39 P-ARVO 39 P-ARVON FREKVENSSITULKINTA 39 P-ARVO JA TESTI PÄÄTÖSSÄÄNTÖNÄ 40 P-ARVON MÄÄRÄÄMINEN YKSINKERTAISISSA TESTAUSASETELMISSA 40 8.7. TESTIN SUORITTAMINEN 4 TESTIN SUORITTAMINEN MERKITSEVYYSTASON VALINTAAN PERUSTUVISSA TESTAUSASETELMISSA _ 4 TESTIN SUORITTAMINEN P-ARVON VALINTAAN PERUSTUVISSA TESTAUSASETELMISSA 4 8.8. NORMAALIJAKAUMAN PARAMETREJA KOSKEVAT TESTIT: ESIMERKKI 4 TESTAUSASETELMA 4 HAVAINNOT 43 TESTAUSASETELMAA KOSKEVAT HYPOTEESIT 44 χ -TESTI VARIANSSILLE 45 T-TESTI ODOTUSARVOLLE 48 8.9. TILASTOLLISET TESTIT JA HAVAINTOJEN MITTA-ASTEIKOLLISET OMINAISUUDET 5 9. TESTEJÄ SUHDEASTEIKOLLISILLE MUUTTUJILLE 54 9.. SUHDEASTEIKOLLISTEN MUUTTUJIEN TESTIT 55 9.. YHDEN OTOKSEN T-TESTI ODOTUSARVOLLE 56 TESTAUSASETELMA YHDEN OTOKSEN T-TESTISSÄ 56 HYPOTEESIT YHDEN OTOKSEN T-TESTISSÄ 56 PARAMETRIEN ESTIMOINTI YHDEN OTOKSEN T-TESTISSÄ 56 TESTISUURE JA SEN JAKAUMA YHDEN OTOKSEN T-TESTISSÄ 57 HYLKÄYSALUEEN MÄÄRÄÄMINEN YHDEN OTOKSEN T-TESTISSÄ 58 Ilkka Melli 7

Tilastolliset testit P-ARVON MÄÄRÄÄMINEN YHDEN OTOKSEN T-TESTISSÄ 59 NORMAALISUUSOLETUKSEN MERKITYS YHDEN OTOKSEN T-TESTISSÄ 59 YHDEN OTOKSEN T-TESTIN HYVÄKSYMISVIRHEEN TODENNÄKÖISYYS JA VOIMAKKUUS 60 9.3. KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTI A ODOTUSARVOILLE: YLEINEN TAPAUS 6 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 6 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 63 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 63 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 64 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 65 P-ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 67 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 67 9.4. KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTI B ODOTUSARVOILLE: YHTÄ SUURTEN VARIANSSIEN TAPAUS 67 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 67 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 68 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 69 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 69 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 7 P-ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 7 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 7 9.5. T-TESTI PARIVERTAILUILLE 7 PARIVERTAILUASETELMA 7 TESTAUSASETELMA T-TESTISSÄ PARIVERTAILUILLE 7 HYPOTEESIT T-TESTISSÄ PARIVERTAILUILLE 7 PARAMETRIEN ESTIMOINTI T-TESTISSÄ PARIVERTAILUILLE 7 TESTISUURE JA SEN JAKAUMA T-TESTISSÄ PARIVERTAILUILLE 73 HYLKÄYSALUEEN MÄÄRÄÄMINEN T-TESTISSÄ PARIVERTAILUILLE 74 P-ARVON MÄÄRÄÄMINEN T-TESTISSÄ PARIVERTAILUILLE 74 NORMAALISUUSOLETUKSEN MERKITYS T-TESTISSÄ PARIVERTAILUILLE 74 9.6. YHDEN OTOKSEN χ -TESTI VARIANSSILLE 74 TESTAUSASETELMA YHDEN OTOKSEN TESTISSÄ VARIANSSILLE 74 HYPOTEESIT YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 75 PARAMETRIEN ESTIMOINTI YHDEN χ -TESTISSÄ VARIANSSILLE 75 TESTISUURE JA SEN JAKAUMA YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 75 HYLKÄYSALUEEN MÄÄRÄÄMINEN YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 76 P-ARVON MÄÄRÄÄMINEN YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 78 NORMAALISUUSOLETUKSEN MERKITYS YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 78 9.7. KAHDEN RIIPPUMATTOMAN OTOKSEN F- TESTI VARIANSSEILLE 78 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 78 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 79 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 80 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 80 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE _ 8 P-ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 8 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 83 0. TESTEJÄ JÄRJESTYSASTEIKOLLISILLE MUUTTUJILLE 84 0.. JÄRJESTYSASTEIKOLLISTEN MUUTTUJIEN TESTIT 85 0.. MERKKITESTI 85 TESTISUUREET S JA S + 85 TESTISUUREIDEN S JA S + OMINAISUUDET 86 Ilkka Melli 8

Tilastolliset testit EKSAKTI MERKKITESTI 86 STANDARDOITU MERKKITESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 86 KOMMENTTEJA 87 MERKKITESTI JA PARIVERTAILUASETELMAT 87 0.3. WILCOXONIN RANKITESTI 87 TESTISUUREET W JA W + 88 TESTISUUREIDEN W JA W + OMINAISUUDET 88 EKSAKTI WILCOXONIN RANKITESTI 89 STANDARDOITU W-TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 89 KOMMENTTEJA 90 WILCOXONIN RANKITESTI JA PARIVERTAILUASETELMAT 90 0.4. MANNIN JA WHITNEYN TESTI 90 HYPOTEESIT 9 MANNIN JA WHITNEYN TESTIN IDEA 9 TESTISUURE U MUOTO 9 TESTISUURE U MUOTO 9 TESTISUUREEN U OMINAISUUDET 9 TESTISUURE U MUOTO 9 TESTISUURE U MUOTO 9 TESTISUUREEN U OMINAISUUDET 9 TESTISUUREIDEN U JA U OMINAISUUDET 93 STANDARDOITU U -TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 93 STANDARDOITU U -TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 93 KOMMENTTEJA 94 0.5. WILCOXONIN RANKISUMMATESTI 94 MANNIN JA WHITNEYN TESTI JA WILCOXONIN RANKISUMMATESTI 94 TESTISUURE T 94 TESTISUURE T 94 TESTISUUREIDEN T JA T OMINAISUUDET 94 STANDARDOITU T -TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 95 STANDARDOITU T -TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 95. TESTEJÄ LAATUEROASTEIKOLLISILLE MUUTTUJILLE 96.. LAATUEROASTEIKOLLISTEN MUUTTUJIEN TESTIT 97.. TESTI SUHTEELLISELLE OSUUDELLE 97 TESTAUSASETELMA TESTISSÄ SUHTEELLISELLE OSUUDELLE 97 HYPOTEESIT TESTISSÄ SUHTEELLISELLE OSUUDELLE 98 PARAMETRIEN ESTIMOINTI TESTISSÄ SUHTEELLISELLE OSUUDELLE 98 TESTISUURE JA SEN JAKAUMA TESTISSÄ SUHTEELLISELLE OSUUDELLE 99 HYLKÄYSALUEEN MÄÄRÄÄMINEN TESTISSÄ SUHTEELLISELLE OSUUDELLE 00 P-ARVON MÄÄRÄÄMINEN TESTISSÄ SUHTEELLISELLE OSUUDELLE 0.3. SUHTEELLISTEN OSUUKSIEN VERTAILUTESTI 0 TESTAUSASETELMA SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 0 HYPOTEESIT SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 0 PARAMETRIEN ESTIMOINTI SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 0 TESTISUURE SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 03 HYLKÄYSALUEEN MÄÄRÄÄMINEN SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 05 P-ARVON MÄÄRÄÄMINEN SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 06. YHTEENSOPIVUUDEN, HOMOGEENISUUDEN JA RIIPPUMATTOMUUDEN TESTAAMINEN 07 Ilkka Melli 9

Tilastolliset testit.. JAKAUMAOLETUKSIEN TESTAUS 08.. YHTEENSOPIVUUDEN TESTAAMINEN 08 TESTAUSASETELMA χ -YHTEENSOPIVUUSTESTISSÄ 08 HYPOTEESIT χ -YHTEENSOPIVUUSTESTISSÄ 09 HAVAITUT LUOKKAFREKVENSSIT 09 ODOTETUT LUOKKAFREKVENSSIT 0 TESTISUURE JA SEN JAKAUMA χ -YHTEENSOPIVUUSTESTISSÄ χ -YHTEENSOPIVUUSTESTI: SOVELLUS 3.3. HOMOGEENISUUDEN TESTAAMINEN 7 TESTAUSASETELMA χ -HOMOGEENISUUSTESTISSÄ 7 χ -HOMOGEENISUUSTESTIN SUORITTAMINEN 7 HYPOTEESIT χ -HOMOGEENISUUSTESTISSÄ 8 HAVAITUT FREKVENSSIT 8 NOLLAHYPOTEESIN TULKINTA χ -HOMOGEENISUUSTESTISSÄ 9 ODOTETTUJEN FREKVENSSIEN MÄÄRÄÄMINEN 9 TESTISUURE JA SEN JAKAUMA χ -HOMOGEENISUUSTESTISSÄ.4. RIIPPUMATTOMUUDEN TESTAAMINEN TESTAUSASETELMA χ -RIIPPUMATTOMUUSTESTISSÄ χ -RIIPPUMATTOMUUSTESTIN SUORITTAMINEN 3 HYPOTEESIT χ -RIIPPUMATTOMUUSTESTISSÄ 3 HAVAITUT FREKVENSSIT 3 NOLLAHYPOTEESIN TULKINTA χ -RIIPPUMATTOMUUSTESTISSÄ 4 ODOTETTUJEN FREKVENSSIEN MÄÄRÄÄMINEN 4 TESTISUURE JA SEN JAKAUMA χ -RIIPPUMATTOMUUSTESTISSÄ 6.5. χ -HOMOGEENISUUSTESTI VS χ -RIIPPUMATTOMUUSTESTI 7.6. NORMAALISUUDEN TESTAAMINEN 8 BOWMANIN JA SHENTONIN TESTI NORMAALISUUDELLE 8 TODENNÄKÖISYYSJAKAUMAN VINOUS JA HUIPUKKUUS 8 HAVAINTOJEN JAKAUMAN VINOUS JA HUIPUKKUUS 9 HYPOTEESIT 30 BOWMANIN JA SHENTONIN TESTI 30 RANKIT PLOT -KUVIO SEKÄ WILKIN JA SHAPIRON TESTI NORMAALISUUDELLE 30 RANKIT PLOT -KUVIO JA WILKIN JA SHAPIRON TESTI: SOVELLUS 3 Ilkka Melli 30

8. Tilastollie testaus 8. Tilastollie testaus 8.. Tilastollise testaukse idea 8.. Tilastolliset hypoteesit 8.3. Tilastolliset testit ja testisuureet 8.4. Virheet testauksessa 8.5. Merkitsevyystaso ja testi hylkäysalue 8.6. Testi p-arvo 8.7. Testi suorittamie 8.8. Normaalijakauma parametreja koskevat testit 8.9. Tilastolliset testit ja mitta-asteikot Tilastollisella testauksella tarkoitetaa tutkimukse kohteea olevasta perusjoukosta esitettyje väitteide tai oletuksie asettamista koetteelle ko. perusjoukosta kerätyistä havaioista saatua iformaatiota vastaa. Tällöi perusjoukosta esitetyt väitteet tai oletukset o puettava ko. perusjouko alkioide omiaisuuksie vaihtelua perusjoukossa kuvaavie todeäköisyysjakaumia tai iide parametreja koskeviksi oletuksiksi eli hypoteeseiksi. Tilastollie testi o päätössäätö, joka kertoo oko asetettu hypoteesi hylättävä vai ei havaioista saadu iformaatio valossa. Site tilastollie testi mittaa hypoteesi ja havaitoje yhteesopivuutta. Tarkastelemme tässä luvussa tilastollise testiteoria peruskäsitteitä sekä tarkastelemme esitety teoria havaiollistuksea ormaalijakauma parametreja koskevie hypoteesie testaamista. Avaisaat: Esimmäise laji virhe, Frekvessitulkita, Havaito, Hylkäysalue, Hylkäysvirhe, Hypoteesi, Hyväksymisalue, Hyväksymisvirhe, Järjestysasteikko, χ -jakauma, χ -testi, Kaksisuutaie vaihtoehtoie hypoteesi, Kriittie arvo, Kriittie raja, Laatueroasteikko, Maailma tila, Merkitsevyys, Merkitsevyystaso, Mitta-asteikko, Nollahypoteesi, Normaaliarvo, Normaalijakauma, Odotusarvo, Otatameetelmä, Otos, Parametri, p-arvo, Perusjoukko, Satuaisotos, Suhdeasteikko, t-jakauma, t-testi, Testausasetelma, Testi, Testi tulos, Testisuure, Tilastollie hypoteesi, Tilastolliste hypoteesie testaus, Todeäköisyysjakauma, Toise laji virhe, Vaihtoehtoie hypoteesi, Variassi, Voimakkuus, Välimatka-asteikko, Yksisuutaie vaihtoehtoie hypoteesi, Yleie hypoteesi Ilkka Melli 3

8. Tilastollie testaus 8.. Tilastollise testaukse idea Tilastollise testaukse lähtökohta Lähtökohta: Tutkimukse kohteea olevasta perusjoukosta o esitetty joki väite tai oletus. Kysymys: Mite esitettyä väitettä tai oletusta voidaa testata? Vastaus: Väitettä tai oletusta voidaa testata tilastollisesti, jos väite tai oletus voidaa pukea tutkimukse kohteea oleva perusjouko omiaisuude vaihtelua ko. perusjoukossa kuvaavaa todeäköisyysjakaumaa tai se parametreja koskevaksi oletukseksi eli hypoteesiksi. Olkoo X tutkimukse kohteea oleva perusjouko joki omiaisuude vaihtelua perusjoukossa kuvaava satuaismuuttuja ja olkoo satuaismuuttuja X todeäköisyysjakauma pistetodeäköisyys- tai tiheysfuktio f(x;θ) jossa θ o fuktio f muodo määräävä tutemato parametri. Yksikertaisissa testausasetelmissa kiiostukse kohteea o hypoteesi, joka mukaa parametrilla θ o arvo θ 0. Mite todeäköisyysjakauma f(x;θ) parametria θ koskevaa hypoteesia θ = θ 0 voidaa testata tilastollisesti? Tilastollisessa testauksessa hypoteesi θ = θ 0 asetetaa koetteelle havaitoje todeäköisyysjakaumasta f(x;θ) sisältämää iformaatiota vastaa. Satuaisotos Oletamme jatkossa, että havaiot X, X,, X muodostavat satuaisotokse jakaumasta, joka pistetodeäköisyys- tai tiheysfuktio o f(x;θ) Tällöi X, X,, X ovat riippumattomia, idettisesti jakautueita satuaismuuttujia, joilla o sama pistetodeäköisyys- tai tiheysfuktio f(x;θ): X, X, K, X X f( x; θ ), i =,, K, i Tavoitteeamme o siis testata tilastollisesti muotoa θ = θ 0 olevia parametrisia hypoteeseja. Testi suorittamista varte valitaa testisuure, joka mittaa satuaismuuttujie X, X,, X Ilkka Melli 3

8. Tilastollie testaus havaittuje arvoje x, x,, x ja hypoteesi θ = θ 0 yhteesopivuutta. Hyvä yhteesopivuus merkitsee sitä, että havaiot ovat sopusoiussa oletukse θ = θ 0 kassa ja huoo yhteesopivuus merkitsee sitä, että havaiot ja oletus θ = θ 0 ovat ristiriidassa keskeää. 8.. Tilastolliset hypoteesit Ku todeäköisyysjakauma parametreja koskevia väitteitä tai oletuksia testataa tilastollisesti, testausasetelma kiiittämiseksi o tehtävä kolme oletusta: (i) Testausasetelmaa koskevat perusoletukset, joista pidetää kiii testaukse aikaa, muodostavat testi yleise hypoteesi. (ii) Testattavaa oletusta kutsutaa ollahypoteesiksi. (iii) Vaihtoehtoie hypoteesi o oletus, joka astuu voimaa, jos ollahypoteesi hylätää testissä. Yleie hypoteesi Yleiset testausasetelmaa koskevat oletukset muodostavat testi yleise hypoteesi H. Yleie hypoteesi H sisältää oletukset perusjoukosta otatameetelmästä perusjouko jakaumasta Yleise hypoteesi H oletuksista pidetää kiii koko testi suoritukse aja, mikä merkitsee sitä, että tilastollie testaus tehdää aia ehdollisesti yleise hypoteesi H oletuste suhtee. Huomautus: Yleise hypoteesi sisältämiä jakaumaoletuksia voidaa ja o tavallisesti myös syytä testata eriksee; ks. esimerkiksi lukua Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie. Nollahypoteesi Sitä perusjouko jakauma parametreja koskevaa väitettä tai oletusta, jota halutaa testata kutsutaa ollahypoteesiksi. Nollahypoteesille käytetää tavallisesti merkitää H 0. Testissä ollahypoteesi H 0 asetetaa koetteelle havaitoje perusjouko jakaumasta sisältämää iformaatiota vastaa. Nollahypoteesista H 0 pidetää kiii, elleivät havaitoje sisältämät todisteet ollahypoteesia vastaa ole kylli voimakkaita. Olkoo f(x;θ) tutkimukse kohteea olevaa perusjouko omiaisuutta kuvaava todeäköisyysjakauma pistetodeäköisyys- tai tiheysfuktio. Yksikertaisissa testausasetelmissa ollahypoteesi o muotoa Huomautus: H 0 : θ = θ 0 Ilkka Melli 33

8. Tilastollie testaus Nollahypoteesit ovat yksikertaisissa testausasetelmissa muotoa o sama tai muotoa ei ole eroa. Vaihtoehtoie hypoteesi Vaihtoehtoie hypoteesi H o oletus, joka astuu voimaa, jos ollahypoteesi H 0 hylätää. Ku tilastollista testiä tehdää, toivotaa usei, että ollahypoteesi voidaa hylätä ja vaihtoehtoie hypoteesi hyväksyä. Tämä johtuu siitä, että vaihtoehtoise hypoteesi hyväksymie merkitsee yleesä iformaatio lisäätymistä. Vaihtoehtoie hypoteesi voidaa tavallisesti muotoilla usealla eri tavalla. Jos ollahypoteesi o muotoa o sama tai ei ole eroa, vaihtoehtoie hypoteesi o tavallisesti muotoa ei ole sama tai o eroa. Jos ollahypoteesi o yksikertaista muotoa H 0 : θ = θ 0 vaihtoehtoie hypoteesi voidaa muotoilla seuraavilla kolmella tavalla: (i) H : θ > θ 0 (ii) H : θ < θ 0 (iii) H : θ θ 0 Tapauksissa (i) ja (ii) saomme, että vaihtoehtoie hypoteesi o yksisuutaie. Tapauksessa (iii) saomme, että vaihtoehtoie hypoteesi o kaksisuutaie. Huomautus: Vaihtoehtoise hypoteesi muoto vaikuttaa tavallisesti siihe tapaa, jolla testi suoritetaa. 8.3. Tilastolliset testit ja testisuureet Testi Tilastollie testi o päätössäätö, joka kertoo jokaisessa yksittäisessä testaustilateessa eli jokaiselle otokselle, oko ollahypoteesi H 0 hylättävä vai ei. Testisuure Tilastollie testi perustuu testisuureesee, joka mittaa havaitoje ja ollahypoteesi H 0 yhteesopivuutta. Testisuure o satuaismuuttuja, joka arvo riippuu havaioista ja ollahypoteesista H 0. Havaitoje ja ollahypoteesi H 0 yhteesopivuude mittaamie tarkoittaa sitä, että tutkitaa kuika todeäköistä o saada sellaisia testisuuree arvoja kui o saatu, jos ollahypoteesi H 0 pätee. Tämä vaatii testisuuree jakauma tutemista. Jos havaitoje ja ollahypoteesi H 0 yhteesopivuus o testisuureella mitattua hyvä, ollahypoteesi H 0 jätetää voimaa. Jos havaitoje ja ollahypoteesi H 0 yhteesopivuus o testisuureella mitattua huoo, ollahypoteesi H 0 hylätää ja vaihtoehtoie hypoteesi H hyväksytää. Testisuuree odotusarvoa ollahypoteesi H 0 pätiessä kutsutaa testisuuree ormaaliarvoksi. Jos testisuuree havaittu arvo o lähellä testisuuree ormaaliarvoa, havaiot ovat sopusoiussa ollahypoteesi H 0 kassa. Jos testisuuree otoksesta määrätty arvo poikkeaa merkitsevästi ormaaliarvostaa, havaiot sisältävät todisteita ollahypoteesia H 0 vastaa. Ilkka Melli 34

8. Tilastollie testaus 8.4. Virheet testauksessa Hylkäysvirhe Jos ollahypoteesi H 0 hylätää silloi, ku se o tosi, tehdää hylkäysvirhe. Hylkäysvirhee todeäköisyys α o ehdollie todeäköisyys Pr(H 0 hylätää H 0 o tosi) = α Hylkäysvirhee todeäköisyyde α komplemettitodeäköisyys Pr(H 0 hyväksytää H 0 o tosi) = α o todeäköisyys hyväksyä ollahypoteesi silloi, ku se o tosi. Tilastollisessa tutkimuksessa oudatetaa tietee yleistä varovaisuusperiaatetta: Hypoteeseja ei pidä hylätä ilma riittävä paiavia syitä. Siksi ollahypoteesi H 0 virheellise hylkäykse todeäköisyys halutaa tehdä tilastollisessa testauksessa mahdollisimma pieeksi. Siksi havaioilta vaaditaa vahvoja todisteita ollahypoteesia H 0 vastaa ee kui se suostutaa hylkäämää. Hyväksymisvirhe Jos ollahypoteesi H 0 jätetää voimaa silloi, ku se ei ole tosi, tehdää hyväksymisvirhe. Hyväksymisvirhee todeäköisyys β o ehdollie todeäköisyys Pr(H 0 jätetää voimaa H 0 ei ole tosi) = β Huomautus: Hylkäysvirhee todeäköisyys α ja hyväksymisvirhee todeäköisyys β eivät ole toistesa komplemettitodeäköisyyksiä. Testi voimakkuus Hyväksymisvirhee todeäköisyyde β komplemettitodeäköisyyttä Pr(H 0 hylätää H 0 ei ole tosi) = β kutsutaa testi voimakkuudeksi. Hyvä testi o voimakas, koska voimakkaalla testillä o piei hyväksymisvirhee todeäköisyys β. Testi voimakkuus ( β) riippuu tavallisesti testattava parametri todellisesta arvosta. Testi voimakkuutta testattava parametri arvoje fuktioa kutsutaa voimakkuusfuktioksi; esimerkki: ks. kappaletta Yhde otokse t-testi luvussa Testejä suhdeasteikollisille muuttujille.. ja. laji virheet Koska testiä tehtäessä pyritää esisijaisesti varomaa sitä, että ollahypoteesi H 0 hylätää silloi, ku se o tosi, hylkäysvirhettä kutsutaa usei esimmäise laji virheeksi. Tällöi hyväksymisvirhettä eli sitä, että ollahypoteesi H 0 hyväksytää silloi, ku se ei ole tosi, kutsutaa toise laji virheeksi. Ilkka Melli 35

8. Tilastollie testaus Testi tulos ja maailma tilat Maailma tilat ja testi tulokset voidaa ryhmitellä seuraavaksi eliketäksi: Maailma tila Nollahypoteesi pätee Nollahypoteesi ei päde Testi tulos Nollahypoteesi jää voimaa Nollahypoteesi hylätää Oikea johtopäätös Hylkäysvirhe Hyväksymisvirhe Oikea johtopäätös Testi hylkäys- ja hyväksymisalueet Ku testi formuloidaa päätössäätöä, testiä varte kostruoidu testisuuree mahdolliste arvoje joukko jaetaa kahtee osaa, hylkäysalueesee ja hyväksymisalueesee: (i) Jos testisuuree havaioista määrätty arvo joutuu hylkäysalueelle, ollahypoteesi H 0 hylätää. (ii) Jos testisuuree havaioista määrätty arvo joutuu hyväksymisalueelle, ollahypoteesi H 0 jätetää voimaa. Huomautus: Testisuuree mahdolliste arvoje jouko jako hylkäys- ja hyväksymisalueisii ei saa riippua havaioista. 8.5. Merkitsevyystaso ja testi hylkäysalue Merkitsevyystaso Testi merkitsevyystaso α o todeäköisyys, että testisuuree havaioista määrätty arvo joutuu hylkäysalueelle, jos ollahypoteesi H 0 pätee. Jos testisuuree havaioista määrätty arvo joutuu ollahypoteesi H 0 pätiessä hylkäysalueelle, ollahypoteesi H 0 hylätää virheellisesti. Tämä hylkäysvirhee todeäköisyys o α. Tavallisesti testi hylkäysalue määrätää kiiittämällä testissä käytettävä merkitsevyystaso α etukätee so. jo ee havaitoje keräämistä; ks. kappaletta Esimerkki: Normaalijakauma parametrie testaamie. Ilkka Melli 36

8. Tilastollie testaus Merkitsevyystaso frekvessitulkita Oletetaa, että yleise hypoteesi H lisäksi myös ollahypoteesi H 0 pätee ja että olemme valieet testi merkitsevyystasoksi luvu α. Toistetaa otataa ja sovelletaa jokaisee otoksee samaa testiä. Tällöi joudumme virheellisesti hylkäämää ollahypoteesi H 0 keskimääri α %:ssa otoksia, vaikka ollahypoteesi H 0 koko aja pätee. Tavaomaiset merkitsevyystasot Koska testeissä halutaa esisijaisesti suojautua hylkäysvirhettä vastaa, testi merkitsevyystasoksi α o tapaa valita pieiä lukuja. Ns. tavaomaiset merkitsevyystasot ovat α = 0.05 α = 0.0 (i) (ii) α = 0.00 Jos ollahypoteesi H 0 voidaa hylätä merkitsevyystasolla α = 0.05, saotaa: Testisuuree arvo (tai testi tulos) o melkei merkitsevä. Jos ollahypoteesi H 0 voidaa hylätä merkitsevyystasolla α = 0.0, saotaa: Testisuuree arvo (tai testi tulos) o merkitsevä. (iii) Jos ollahypoteesi H 0 voidaa hylätä merkitsevyystasolla α = 0.00, saotaa: Testisuuree arvo (tai testi tulos) o erittäi merkitsevä. Merkitsevyystasoa α valittaessa o aia syytä ottaa huomioo väärä päätökse seuraukset. Hylkäysaluee määräämie yksikertaisissa testausasetelmissa Testi hylkäysalue riippuu yksikertaisissa testausasetelmissa paitsi valitusta merkitsevyystasosta α myös vaihtoehtoise hypoteesi muodosta. Olkoo parametria θ koskeva ollahypoteesi yksikertaista muotoa H 0 : θ = θ 0 Valitaa testi merkitsevyystasoksi α ja oletetaa, että testisuureea o (jatkuva) satuaismuuttuja Z. Tehdää testisuureesta Z seuraavat oletukset: () Testisuuree Z mahdolliset arvot kuuluvat välii (a,b), jossa voi olla a = ja/tai b = +. (a) Testisuureella Z o taipumus saada suuria arvoja, jos θ > θ 0 (b) Testisuureella Z o taipumus saada pieiä arvoja, jos θ < θ 0 Huomautus: Oletukset a-b pätevät kaikille testisuureille tässä esityksessä. Ilkka Melli 37

8. Tilastollie testaus Tarkastellaa testi hylkäysaluee määräämistä erilaiste vaihtoehtoiste hypoteesie tapauksissa. (i) Jos vaihtoehtoisea hypoteesia o yksisuutaie Testisuuree tiheysfuktio vaihtoehto H : θ > θ 0 ii testi hylkäysalue o muotoa (u, b) jossa kriittie arvo tai raja u määrätää site, että Pr(Z u H 0 ) = α Ks. kuvaa oikealla. α u α Hyväksymisalue Hylkäysalue (ii) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ < θ 0 ii testi hylkäysalue o muotoa (a, l) jossa kriittie arvo tai raja l määrätää site, että Pr(Z l H 0 ) = α Ks. kuvaa oikealla. α l α Hylkäysalue Hyväksymisalue (iii) Jos vaihtoehtoisea hypoteesia o kaksisuutaie vaihtoehto H : θ θ 0 ii testi hylkäysalue o muotoa (a, l) (u, b) jossa kriittiset arvot tai rajat l ja u määrätää site, että Pr(Z u H 0 ) = Pr(Z l H 0 ) = α/ Ks. kuvaa oikealla. Testisuuree tiheysfuktio α/ α/ α l u Hylkäysalue Hyväksymisalue Hylkäysalue Ilkka Melli 38

8. Tilastollie testaus Jos testisuuree Z jakauma o symmetrie origo suhtee, ii edellä esitetyille kriittisille arvoille pätee: l = u Huomautus: Todeäköisyydet kohdissa (i)-(iii) ovat ehdollisia todeäköisyyksiä, joissa ehtotapahtumaa o se, että ollahypoteesi H 0 pätee. Todeäköisyydet määrätää testisuuree Z jakaumasta. Jakaumaa määrättäessä oletetaa, että ollahypoteesi H 0 pätee. 8.6. Testi p-arvo p-arvo Nollahypoteesi hylkäämie voidaa perustaa etukätee valitu merkitsevyystaso ja sitä vastaava hylkäysaluee määräämise sijasta testi p-arvoo. Testi p-arvo o piei merkitsevyystaso, jolla ollahypoteesi H 0 voidaa hylätä. Nykyiset tilastolliset ohjelmistot tulostavat lähes aia testie p-arvot ja siksi p-arvoje käyttö o lähes kokoaa syrjäyttäyt etukätee valittuje kiiteide merkitsevyystasoje käytö. Testi p-arvo määrätää seuraavalla tavalla: (i) Lasketaa valitu testisuuree arvo havaioista. (ii) Määrätää olettae, että ollahypoteesi H 0 pätee todeäköisyys sille, että testisuure saa (ormaaliarvoosa verrattua) ii poikkeuksellise arvo kui se o saaut tai vielä poikkeuksellisempia arvoja. Jos testi p-arvoksi saadaa piei luku, testisuure o saaut arvo, joka kuuluu ollahypoteesi H 0 pätiessä epätodeäköiste testisuuree arvoje joukkoo. Site ollahypoteesi voidaa hylätä, jos testi p-arvo o kylli piei. Mitä pieempi o testi p-arvo, sitä vahvempia todisteita havaiot sisältävät ollahypoteesia H 0 vastaa. Huomautus: Testi p-arvo määrätää testisuuree Z jakaumasta. Jakaumaa määrättäessä oletetaa, että ollahypoteesi H 0 pätee. p-arvo frekvessitulkita Oletetaa, että yleise hypoteesi H lisäksi myös ollahypoteesi H 0 pätee testausasetelmassa. Toistetaa otataa ja sovelletaa jokaisee otoksee samaa testiä. Tällöi havaitsemme keskimääri p %:ssa poimittuja otoksia havaittua testisuuree arvoa poikkeavamma testisuuree arvo. Ilkka Melli 39

8. Tilastollie testaus p-arvo ja testi päätössäätöä Tilastollie testi eli päätössäätö, joka kertoo jokaisessa yksittäisessä tilateessa eli jokaiselle otokselle, oko ollahypoteesi H 0 hylättävä vai ei, voidaa perustaa seuraavalla tavalla testi p- arvoo: (i) Valitaa piei todeäköisyys p 0. (ii) Määrätää testi p-arvo. Jos p < p 0, hylätää ollahypoteesi H 0 ja hyväksytää vaihtoehtoie hypoteesi H. Jos p p 0, jätetää ollahypoteesi H 0 voimaa. Todeäköisyyttä p 0 valittaessa o aia syytä ottaa huomioo väärä päätökse seuraukset. p-arvo määräämie yksikertaisissa testausasetelmissa Testi p-arvo riippuu yksikertaisissa testausasetelmissa vaihtoehtoise hypoteesi muodosta. Olkoo parametria θ koskeva ollahypoteesi yksikertaista muotoa H 0 : θ = θ 0 Oletetaa, että testisuureea o (jatkuva) satuaismuuttuja Z. Oletetaa yksikertaisuude vuoksi, että testisuuree jakauma o symmetrie origo suhtee. Tehdää testisuureesta Z lisäksi seuraavat oletukset: () Testisuuree Z mahdolliset arvot kuuluvat välii (a,b), jossa voi olla a = ja b = +. (a) Testisuureella Z o taipumus saada suuria arvoja, jos θ > θ 0 (b) Testisuureella Z o taipumus saada pieiä arvoja, jos Huomautus: θ < θ 0 Oletukset a-b pätevät kaikille testisuureille tässä esityksessä. Oletetaa, että testisuuree Z havaioista määrätty arvo o z. Tarkastellaa testi p-arvo määräämistä erilaiste vaihtoehtoiste hypoteesie tapauksissa. (i) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ > θ 0 ii testi p-arvo o p = Pr(Z z H 0 ) Ks. kuvaa oikealla. p p 0 z Ilkka Melli 40

8. Tilastollie testaus (ii) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ < θ 0 ii testi p-arvo o p = Pr(Z z H 0 ) Ks. kuvaa oikealla. p p z 0 (iii) Jos vaihtoehtoisea hypoteesia o kaksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ θ 0 ii testi p-arvo o p = Pr(Z z H 0 ) Ks. kuvaa oikealla. p p p z 0 + z Huomautus: Todeäköisyydet kohdissa (i)-(iii) ovat ehdollisia todeäköisyyksiä, joissa ehtotapahtumaa o se, että ollahypoteesi H 0 pätee. Todeäköisyydet määrätää testisuuree Z jakaumasta. Jakaumaa määrättäessä oletetaa, että ollahypoteesi H 0 pätee. 8.7. Testi suorittamie Testi suorittamie merkitsevyystaso valitaa perustuvissa testausasetelmissa Jos testi perustuu merkitsevyystaso valitaa, testi suorittamisessa o seuraavat vaiheet: () Asetetaa testi hypoteesit: Yleie hypoteesi H Testaukse kohteea oleva ollahypoteesi H 0 Vaihtoehtoie hypoteesi H () Valitaa testiä varte testisuure. Testisuuree tehtävää o mitata havaitoje ja ollahypoteesi H 0 yhteesopivuutta. (3) Valitaa merkitsevyystaso α ja kostruoidaa testille sitä vastaava hylkäysalue. (4) Poimitaa otos ii, että yleise hypoteesi H oletukset pätevät. Ilkka Melli 4

8. Tilastollie testaus Jos havaitoje sisältämät todisteet ollahypoteesia H 0 vastaa ovat testisuureella mitattua kylli vahvoja, ollahypoteesi H 0 hylätää ja vaihtoehtoie hypoteesi H hyväksytää. (5) Määrätää valitu testisuuree arvo havaioista. (6) Tehdää päätös ollahypoteesi hylkäämisestä. Jos testisuuree arvo joutuu hylkäysalueelle, hylätää ollahypoteesi H 0 ja hyväksytää vaihtoehtoie hypoteesi H. Jos testisuuree arvo jää hyväksymisalueelle, jätetää ollahypoteesi H 0 voimaa. Testi suorittamie p-arvo valitaa perustuvissa testausasetelmissa Jos testi perustetaa testisuuree arvoa vastaavii p-arvoihi, testi suorittamisessa o seuraavat vaiheet: () Asetetaa testi hypoteesit: Yleie hypoteesi H Testaukse kohteea oleva ollahypoteesi H 0 Vaihtoehtoie hypoteesi H () Valitaa testiä varte testisuure. Testisuuree tehtävää o mitata havaitoje ja ollahypoteesi H 0 yhteesopivuutta. (3) Poimitaa otos ii, että yleise hypoteesi H oletukset pätevät. Jos havaitoje sisältämät todisteet ollahypoteesia H 0 vastaa ovat testisuureella mitattua kylli vahvoja, ollahypoteesi H 0 hylätää ja vaihtoehtoie hypoteesi H hyväksytää. (4) Määrätää valitu testisuuree arvo havaioista. (5) Määrätää testisuuree havaittua arvoa vastaava p-arvo. (6) Tehdää päätös ollahypoteesi hylkäämisestä. Jos testi p-arvo o kylli piei, hylätää ollahypoteesi H 0 ja hyväksytää vaihtoehtoie hypoteesi H. Jos testi p-arvo ei ole kylli piei, jätetää ollahypoteesi H 0 voimaa. 8.8. Normaalijakauma parametreja koskevat testit: Esimerkki Esitämme tässä kappaleessa testiteoria havaiollistuksea testit ormaalijakauma odotusarvolle ja variassille yksikertaise laaduvalvotaa koskeva esimerki tapauksessa. Normaalijakauma parametreja koskevia testejä käsitellää tarkemmi kappaleessa Testejä suhdeasteikollisille muuttujille. Testausasetelma Koe tekee ruuveja, joide tavoitepituutea o 0 cm, mutta ruuvie pituus vaihtelee joki verra satuaisesti. Ruuvit tehdää eriä. Valmistuserää pidetää myytikelpoisea, jos erä ruuvie pituudet eivät vaihtele liia paljo ja ruuvit ovat keskimääri oikea mittaisia: Ilkka Melli 4

8. Tilastollie testaus Ruuvie pituuksie variassi ei saa ylittää tilastollisesti merkitsevästi arvoa 0.0 cm ja ruuvie keskipituus ei saa poiketa tilastollisesti merkitsevästi pituude tavoitearvostaa 0 cm. Ruuvie pituutta valvotaa seuraavalla tavalla: (i) Poimitaa jokaisesta valmistuserästä joukko ruuveja tutkittavaksi satuaisotataa käyttäe. (ii) Mitataa otoksee poimittuje ruuvie pituudet. (iii) Verrataa otoksee poimittuje ruuvie pituuksie otosvariassia arvoo 0.0 cm ja pituuksie aritmeettista keskiarvoa ruuvie tavoitepituutee 0 cm. (v) Jos otoksee poimittuje ruuvie pituuksie variassi o liia suuri tai pituuksie aritmeettie keskiarvo poikkeaa pituude tavoitearvosta liia paljo, ii koko valmistuserä hylätää. Katsomme seuraavassa, mite ruuvie pituude valvoassa käytetää hyväksi tilastollista testausta, ku oletamme, ruuvie pituude vaihtelua voidaa kuvata ormaalijakaumalla. Havaiot Oletetaa, että erää valmistuserä ruuvie joukosta o poimittu satuaisotos, joka koko o = 30 ja otoksee poimittuje ruuvie pituudet o mitattu. Otosta kuvaavat seuraavat tuusluvut: Pituuksie aritmeettie keskiarvo o X = 0.09 cm ja pituuksie otoskeskihajota o s = 0.038 cm Huomautus: Samaa aieistoa o tarkasteltu myös luvuissa Tilastolliste aieistoje kuvaamie ja Väliestimoiti. Taulukko oikealla esittää otoksee poimittuje ruuvie pituuksie luokiteltua frekvessijakaumaa. Kuva oikealla esittää otoksee poimittuje ruuvie pituuksie luokiteltua frekvessijakaumaa vastaavaa histogrammia. Luokkavälit määräävät kuvio suorakaiteide kaat ja suorakaiteide korkeudet o valittu ii, että suorakaiteide pita-alat vastaavat luokkafrekvessejä. Luokkavälit Luokkafrekvessit (9.85,9.90] (9.90,9.95] (9.95,0.00] 6 (0.00,0.05] 3 (0.05,0.0] 5 (0.0,0.5] 4 (0.5,0.0] 5 (0.0,0.5] 3 (0.5,0.30] Frekvessi 7 6 5 4 3 0 Ruuvie pituuksie luokiteltu frekvessijakauma 9.8 9.9 0.0 0. 0. 0.3 0.4 Pituus (cm) Ilkka Melli 43

8. Tilastollie testaus Huomautus: Jos otataa toistetaa, kaikki otosta koskevat tiedot (sekä havaitoarvot että iistä määrätyt otossuureet kute aritmeettiset keskiarvot ja otoskeskihajoat sekä havaitoarvoje jakaumaa kuvaavat graafiset esitykset kute histogrammit) vaihtelevat satuaisesti otoksesta toisee. Ogelma: Oko otosiformaatio sopusoiussa ruuvie pituude variassille ja odotusarvolle asetettuje tavoitearvoje kassa? Ratkaisu: Kostruoidaa otosiformaatio ja ruuvie pituude variassi ja odotusarvo tavoitearvoille yhteesopivuude tutkimista varte tarkoituksee sopivat tilastolliset testit. Testausasetelmaa koskevat hypoteesit Määritellää satuaismuuttuja X: Yleie hypoteesi H : X = ruuvi pituus Otoksee poimittuje ruuvie pituudet eivät riipu toisistaa ja ruuvie pituudet vaihtelevat satuaisesti oudattae ormaalijakaumaa: X, X,, X X i ~ N(μ, σ ), i =,,, Pidämme testaukse aikaa kiii yleisestä hypoteesista H. Nollahypoteesi H 0 : Ruuvie pituuksie variassi o korkeitaa 0.0 cm : H 0 : σ σ 0 = 0.0 cm Vaihtoehtoie hypoteesi H : Ruuvie pituuksie variassi o suurempi kui 0.0 cm : H : σ > σ 0 = 0.0 cm Ruuvie pituuksie variassia koskevaa ollahypoteesia H 0 voidaa testata s. χ -testillä; testi suoritus: ks. ko. kohtaa alla. Nollahypoteesi H 0 : Ruuvie pituuksie odotusarvo yhtyy tavoitearvoosa 0 cm: H 0 : μ = μ0 = 0 cm Vaihtoehtoie hypoteesi H : Ruuvie pituuksie odotusarvo poikkeaa pituude tavoitearvosta 0 cm: H : μ μ0 = 0 cm Ruuvie pituuksie odotusarvoa koskevaa ollahypoteesia H 0 voidaa testata s. t-testillä: testi suoritus: ks. ko. kohtaa alla. Ilkka Melli 44

8. Tilastollie testaus χ -testi variassille Yleie hypoteesi H : Otoksee poimittuje ruuvie pituudet eivät riipu toisistaa ja ruuvie pituudet vaihtelevat satuaisesti oudattae ormaalijakaumaa: Nollahypoteesi H 0 : X, X,, X X i ~ N(μ, σ ), i =,,, Ruuvie pituuksie variassi o korkeitaa 0.0 cm : H 0 : σ σ 0 = 0.0 cm Vaihtoehtoie hypoteesi H : Ruuvie pituuksie variassi o suurempi kui 0.0 cm : H : σ > σ 0 = 0.0 cm Käytetää testisuureea χ -testisuuretta jossa ( ) s χ = σ 0 s X X = ( i ) i= o havaitoje (harhato) otosvariassi ja σ 0 o ollahypoteesi H 0 kiiittämä parametri σ arvo. Voidaa osoittaa, että testisuure χ oudattaa χ -jakaumaa vapaustei ( ), jos yleie hypoteesi H ja ehto σ = σ 0 pätevät (ks. lukua Otokset ja otosjakaumat): χ χ ( ) Esimerki tapauksessa otoksee poimittuje ruuvie pituuksie aritmeettie keskiarvo oli X = 0.09 cm otoksee poimittuje ruuvie pituuksie otoskeskihajota oli s = 0.038 cm ja ollahypoteesi H 0 kiiittämä parametri σ arvo oli σ 0 = 0.0 cm Ilkka Melli 45

8. Tilastollie testaus Site χ -testisuuree arvoksi saadaa ( ) s (30 ) 0.038 χ = = = 3.46 σ 0.0 0 Voidaa osoittaa, että ym. χ -testisuuree ormaaliarvo eli testisuuree odotusarvo o ehdo pätiessä σ = σ 0 E( χ σ = σ ) = 0 χ -testisuuree ormaaliarvoosa ( ) verrattua suuret ja pieet arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Valitaa merkitsevyystasoksi α = 0.05 Koska vaihtoehtoie hypoteesi H : σ > σ 0 = 0.0 cm o yksisuutaie, hylkäysaluee määräämistä varte valitaa kriittie arvo tai raja χ α site, että Pr( χ χα ) = α = 0.05 jossa satuaismuuttuja χ oudattaa χ -jakaumaa vapausastei ( ) = 9. Kriittie arvo χ α toteuttaa ehdo χ Pr( χ χ ) = α = 0.95 (9)-jakauma tiheysfuktio χ -jakauma taulukoista ähdää, että Pr(χ 4.557) = 0.05 ku vapausasteide lukumäärä ( ) = 9. Site kriittiseksi arvoksi saadaa χ α = 4.557 Kuvio oikealla havaiollistaa kriittise arvo määräämistä. χ -testi hylkäysalueeksi tulee tässä väli ( χ α, + ) α Jos χ -testisuuree arvo joutuu hylkäysalueelle, ollahypoteesi H 0 : σ σ 0 hylätää merkitsevyystasolla α = 0.05. Todeäköisyys, että χ -testisuuree arvo joutuu ehdo σ = σ 0 0.07 0.06 0.05 0.04 0.03 0.0 0.0 0 0.95 4.557 0.05 Ilkka Melli 46

8. Tilastollie testaus pätiessä hylkäysalueelle o α = 0.05. χ -testi hyväksymisalue o muotoa [0, χ α ] Jos χ -testisuuree arvo joutuu hyväksymisalueelle, ollahypoteesi H 0 : σ σ 0 jätetää voimaa merkitsevyystasolla α. χ 3 -testi hylkäys- ja hyväksymisalueita voidaa kuvata yksisuutaise vaihtoehtoise hypoteesi H : σ > σ 0 tapauksessa alla olevalla kuviolla: 0 χ α Hyväksymisalue Hylkäysalue Kriittie arvo χ α määrätää site, että jolloi Pr( α ) χ χ = α Pr( α ) χ χ = α Esimerki tapauksessa χ -testi hylkäys- ja hyväksymisalueet saavat seuraava muodo: 0 4.557 Hyväksymisalue Hylkäysalue Kriittie arvo 4.557 o siis määrätty site, että jolloi Pr( χ 4.557) = 0.05 Pr( χ 4.557) = 0.95 Ilkka Melli 47

8. Tilastollie testaus Esimerki tapauksessa otoksesta määrätty χ -testisuuree arvo o pieempi kui kriittie arvo χ α : χ = 3.46 < 4.557 = χ α Site testisuuree arvo o joutuut hyväksymisalueelle ja voimme jättää ollahypoteesi H 0 : σ σ 0 = 0.0 cm voimaa merkitsevyystasolla α = 0.05. Johtopäätös: Ruuvie pituude variassi ei ole tilastollisesti merkitsevästi arvoa 0.0 cm suurempi. Oletetaa, että ruuveja tekevä koe toimii ii, että ruuvie pituude variassi o jatkuvasti hyväksyttävä suuruista. Tällöi siis ollahypoteesi H 0 : σ σ 0 = 0.0 cm pätee koko aja. Oletetaa yt, että poimimme koee tekemie ruuvie joukosta toistuvasti uusia otoksia ja testaamme jokaise otokse perusteella ollahypoteesia H 0 käyttämällä merkitsevyystasoa lukua α = 0.05 Tällöi joudumme hylkäämää ollahypoteesi H 0 keskimääri 5 kertaa 00:sta, vaikka ollahypoteesi H 0 pätee koko aja. Esimerki tapauksessa otoksesta määrättyä χ -testisuuree arvoa 3.70 vastaava p-arvo o χ - jakauma taulukoide mukaa p = Pr(χ > 3.70) > 0. Tämä merkitsee sitä, että χ -testisuure saa ormaaliarvoosa ( ) = 9 ähde arvoa 3.70 poikkeuksellisempia arvoja todeäköisyydellä, joka o suurempi kui 0., jos ollahypoteesi H 0 : σ σ 0 = 0.0 cm pätee. Site emme voi hylätä ollahypoteesia H 0 millää tavaomaisella merkitsevyystasolla. Tulos o sopusoiussa merkitsevyystasoa käyttävä tekiika avulla saadu tulokse kassa. t-testi odotusarvolle Yleie hypoteesi H : Otoksee poimittuje ruuvie pituudet eivät riipu toisistaa ja ruuvie pituudet vaihtelevat satuaisesti oudattae ormaalijakaumaa: X, X,, X X i ~ N(μ, σ ), i =,,, Nollahypoteesi H 0 : Ruuvie pituuksie odotusarvo yhtyy tavoitearvoosa 0 cm: H 0 : μ = μ0 = 0 cm Ilkka Melli 48

8. Tilastollie testaus Vaihtoehtoie hypoteesi H : Ruuvie pituuksie odotusarvo poikkeaa pituude tavoitearvosta 0 cm: H : μ μ0 = 0 cm Käytetää testisuureea t-testisuuretta X μ0 t = s/ jossa X X i i = = o havaitoje aritmeettie keskiarvo, s = ( Xi X) i= o havaitoje (harhato) otosvariassi ja μ 0 ollahypoteesi H 0 kiiittämä odotusarvoparametri μ arvo. Voidaa osoittaa, että testisuure t oudattaa t-jakaumaa vapaustei ( ), jos yleie hypoteesi H ja ollahypoteesi H 0 : μ = μ0 pätevät (ks. lukua Otokset ja otosjakaumat): t t( ) t-testisuure mittaa havaitoje aritmeettise keskiarvo X ja ollahypoteesi H 0 kiiittämä odotusarvoparametri μ arvo μ 0 tilastollista etäisyyttä, jossa mittayksikköä o aritmeettise keskiarvo X keskivirhee σ / estimaattori s/. Esimerki tapauksessa otoksee poimittuje ruuvie pituuksie aritmeettie keskiarvo oli X = 0.09 cm otoksee poimittuje ruuvie pituuksie otoskeskihajota oli s = 0.038 cm ja ollahypoteesi H 0 kiiittämä parametri μ arvo oli μ 0 = 0 cm Site testisuuree t arvoksi saadaa X μ0 0.09 0 t = = = 4.749 s/ 0.038/ 30 Voidaa osoittaa, että edellä määritelly t-testisuuree ormaaliarvo eli testisuuree odotusarvo o ollahypoteesi H 0 : μ = μ0 Ilkka Melli 49

8. Tilastollie testaus pätiessä E(t H 0 ) = 0 t-testisuuree itseisarvoltaa suuret arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Huomautus: Testisuuree t jakauma o symmetrie origo suhtee. Valitaa merkitsevyystasoksi α = 0.05 Koska vaihtoehtoie hypoteesi H : μ μ0 = 0 cm o kaksisuutaie, hylkäysaluee määräämistä varte valitaa kriittiset arvot t α/ ja +t α/ site, että Pr( t t ) = Pr( t + t ) = 0.05 α/ α/ jossa satuaismuuttuja t oudattaa t-jakaumaa vapausastei ( ) = 9. Kriittiset arvot t α/ ja +t α/ toteuttavat ehdo Pr( t t + t ) = = 0.95 α/ α/ α Huomaa, että merkitsevyystasoo α liittyvät kriittiset arvot ovat tässä (kaksisuutaise vaihtoehtoise hypoteesi) tapauksessa täsmällee samat kui luottamustasoo ( α) liittyvät luottamus-kertoimet; ks. lukua Väliestimoiti. t-jakauma taulukoista ähdää, että Pr(t +.045) = 0.05 Pr(t.045) = 0.05 ku vapausasteide lukumäärä ( ) = 9. Site kriittiset arvot ovat: +t α/ = +.045 t α/ =.045 Kuvio oikealla havaiollistaa kriittiste rajoje määräämistä. t-testi hylkäysalue o muotoa (, t ) ( + t, + ) α/ α/ Jos t-testisuuree arvo joutuu hylkäysalueelle, ollahypoteesi H 0 : μ = μ0 hylätää merkitsevyystasolla α. Todeäköisyys, että t-testisuuree arvo joutuu ollahypoteesi H 0 pätiessä hylkäysalueelle o α. 0.5 0.4 0.3 0. 0. 0 t(9)-jakauma tiheysfuktio 0.05 0.95 0.05.045 0 +.045 Ilkka Melli 50

8. Tilastollie testaus t-testi hyväksymisalue o muotoa [ t, + t ] α/ α/ Jos t-testisuuree arvo joutuu hyväksymisalueelle, ollahypoteesi H 0 : μ = μ0 jätetää voimaa merkitsevyystasolla α. t-testi hylkäys- ja hyväksymisalueita voidaa kuvata kaksisuutaise vaihtoehtoise hypoteesi tapauksessa alla olevalla kaaviolla: 0 t α / +t α / Hylkäysalue Hyväksymisalue Hylkäysalue Kriittiset arvot t α/ ja +t α/ määrätää site, että jolloi Pr( t t ) = Pr( t + t ) = / α/ α/ α Pr( t t + t ) = α/ α/ α Esimerki tapauksessa t-testi hylkäys- ja hyväksymisalueet saavat seuraava muodo:.045 0 +.045 Hylkäysalue Hyväksymisalue Hylkäysalue Kriittiset arvot.045 ja +.045 o siis määrätty site, että Pr( t.045) = Pr( t +.045) = 0.05 jolloi Pr(.045 t +.045) = 0.95 Esimerki tapauksessa otoksesta määrätty t-testisuuree arvo o suurempi kui kriittie arvo +t α/ : t = 4.749 >.045 = +t 0.05 Ilkka Melli 5

8. Tilastollie testaus Koska testisuuree arvo o joutuut hylkäysalueelle, hylkäämme ollahypoteesi H 0 : μ = μ0 = 0 cm ja hyväksymme vaihtoehtoise hypoteesi H : μ μ0 = 0 cm merkitsevyystasolla α = 0.05. Johtopäätös: Ruuvie keskimääräie pituus poikkeaa tilastollisesti merkitsevästi tavoitearvostaa 0 cm. Saattaa olla syytä pysäyttää ruuveja valmistava koe tarkistusta varte. Oletetaa, että ruuveja tekevä koe toimii ii, että ruuvie pituude odotusarvo o jatkuvasti hyväksyttävä suuruie. Tällöi siis ollahypoteesi H 0 : μ = μ0 = 0 cm pätee koko aja. Oletetaa yt, että poimimme koee tekemie ruuvie joukosta toistuvasti uusia otoksia ja testaamme jokaise otokse perusteella ollahypoteesia H 0 käyttämällä merkitsevyystasoa lukua α = 0.05 Tällöi joudumme hylkäämää ollahypoteesi H 0 keskimääri 5 kertaa 00:sta, vaikka ollahypoteesi H 0 pätee koko aja. Esimerki tapauksessa otoksesta määrätty t-testisuuree arvoa 4.749 vastaava p-arvo o t- jakauma taulukoide mukaa p = Pr(t > 4.749 ) < 0.0005 = 0.00 Tämä merkitsee sitä, että t-testisuure saa ormaaliarvoosa 0 ähde arvoa 4.749 poikkeuksellisempia arvoja todeäköisyydellä, joka o pieempi kui 0.00, jos ollahypoteesi H 0 : μ = μ0 = 0 cm pätee. Site voimme hylätä ollahypoteesi H 0 kaikilla tavaomaisilla merkitsevyystasoilla. Tulos o sopusoiussa merkitsevyystasoa käyttävä tekiika avulla saadu tulokse kassa. 8.9. Tilastolliset testit ja havaitoje mitta-asteikolliset omiaisuudet Havaitoje mitta-asteikolliset omiaisuudet ohjaavat testi valitaa; lisätietoja mitta-asteikoista: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Tilastolliset testit voidaa ryhmitellä havaitoje mitta-asteikolliste omiaisuuksie suhtee seuraavalla tavalla: Testit suhde- tai välimatka-asteikollisille muuttujille Testit järjestysasteikollisille muuttujille Testit laatueroasteikollisille muuttujille Ilkka Melli 5

8. Tilastollie testaus Seuraavissa kolmessa luvussa tarkastellaa suurta joukkoa erilaisia testejä. Tarkasteltavat testit ovat seuraavat: Testejä suhde- tai välimatka-asteikollisille muuttujille: Yhde otokse t-testi ormaalijakauma odotusarvolle Kahde riippumattoma otokse t-testi ormaalijakaumie odotusarvoille: Yleie tapaus Kahde riippumattoma otokse t-testi ormaalijakaumie odotusarvoille: Yhtä suurte variassie tapaus t-testi parivertailuille Yhde otokse testi ormaalijakauma variassille Kahde riippumattoma otokse testi ormaalijakauma variasseille Ks. lukua Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille: Merkkitesti Wilcoxoi rakitesti Mai ja Whitey testi eli Wilcoxoi rakisummatesti Ks. lukua Testejä järjestysasteikollisille muuttujille. Testejä laatueroasteikollisille muuttujille: Testi suhteelliselle osuudelle Suhteelliste osuuksie vertailutesti Ks. lukua Testejä laatueroasteikollisille muuttujille. Ilkka Melli 53

9. Testejä suhdeasteikollisille muuttujille 9. Testejä suhdeasteikollisille muuttujille 9.. Testit ormaalijakauma parametreille 9.. Yhde otokse t-testi odotusarvolle 9.3. Kahde riippumattoma otokse t-testi odotusarvoille: Yleie tapaus 9.4. Kahde riippumattoma otokse t-testi odotusarvoille: Yhtä suurte variassie tapaus 9.5. t-testi parivertailuille 9.6. Yhde otokse χ -testi variassille 9.7. Kahde riippumattoma otokse F-testi variasseille Tarkastelemme tässä luvussa yhde otokse ja kahde otokse testejä ormaalijakauma odotusarvolle ja variassille. Testejä ormaalijakauma odotusarvolle voidaa soveltaa myös moissa sellaisissa tilateissa, joissa havaiot eivät oudata ormaalijakaumaa. Site testejä ormaalijakauma odotusarvolle voidaa pitää yleisiä testeiä suhde- (tai välimatka-) asteikolliste satuaismuuttujie odotusarvolle. Se sijaa testejä ormaalijakauma variassille ei pidä soveltaa, jos havaitoje jakauma poikkeaa vähäki eemmä ormaalijakaumasta. Avaisaat: Aritmeettie keskiarvo, Asymptoottie testi, F-jakauma, F-testi, Hylkäysalue, Hylkäysvirhe, Hyväksymisalue, Hyväksymisvirhe, χ -jakauma, χ -testi, Kahde otokse testi, Kriittie arvo, Merkitsevyystaso, Nollahypoteesi, Normaaliarvo, Normaalijakauma, Odotusarvo, Otos, Otoskeskihajota, Otosvariassi, p-arvo, Parametri, Parivertailu, Riippumattomat otokset, Sovitettu pari, Stadardipoikkeama, Suhdeasteikko, t-jakauma, t-testi, Testisuure, Todeäköisyysjakauma, Vaihtoehtoie hypoteesi, Variassi, Vertailutesti, Voimakkuus, Välimatka-asteikko, Yhde otokse testi, Yleie hypoteesi Ilkka Melli 54

9. Testejä suhdeasteikollisille muuttujille 9.. Suhdeasteikolliste muuttujie testit Normaalijakauma o tilastotietee tärkei jakauma. Oletetaa, että satuaismuuttuja X oudattaa ormaalijakaumaa parametrei μ ja σ : X N( μ, σ ) Parametri μ o ormaalijakauma odotusarvo ja parametri σ o ormaalijakauma variassi: μ = E(X) σ = Var(X) Parametrit μ ja σ määräävät täysi ormaalijakauma. Normaalijakauma parametreja koskevat testit voidaa jakaa kahtee ryhmää: Yhde otokse testit Kahde otokse testit Yhde otokse testeissä testataa yksikertaisia ollahypoteeseja, jotka koskevat ormaalijakauma odotusarvo- tai variassiparametria. Kahde otokse testit ovat vertailutestejä, joissa verrataa kahde ormaalijakauma odotusarvo- tai variassiparametreja toisiisa. Tässä luvussa tarkastellaa seuraavia testejä ormaalijakauma parametreille: Yhde otokse t-testi odotusarvolle Kahde riippumattoma otokse t-testi A odotusarvoille: Yleie tapaus Kahde riippumattoma otokse t-testi B odotusarvoille: Yhtä suurte variassie tapaus t-testi parivertailuille Yhde otokse χ -testi variassille Kahde riippumattoma otokse F-testi variasseille Testejä ormaalijakauma odotusarvolle voidaa soveltaa myös moissa sellaisissa tilateissa, joissa havaiot eivät oudata ormaalijakaumaa. Tämä perustuu seuraavii seikkoihi: (i) Testit odotusarvolle perustuvat havaitoje aritmeettisii keskiarvoihi. (ii) Keskeise raja-arvolausee mukaa myös ei-ormaaliste havaitoje aritmeettiset keskiarvot oudattavat tietyi ehdoi suurissa otoksissa approksimatiivisesti ormaalijakaumaa. Tämä merkitsee sitä, että testejä ormaalijakauma odotusarvolle voidaa pitää yleisiä testeiä suhde- (tai välimatka-) asteikolliste satuaismuuttujie odotusarvolle; mitta-asteikot: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Se sijaa testejä ormaalijakauma variassille ei pidä soveltaa, jos havaitoje jakauma ei ole lähellä ormaalijakaumaa ja tilae ei yleesä ole parempi suurillakaa havaitoje lukumäärillä. Ilkka Melli 55

9. Testejä suhdeasteikollisille muuttujille 9.. Yhde otokse t-testi odotusarvolle Testausasetelma yhde otokse t-testissä Olkoo X i, i =,,, satuaisotos ormaalijakaumasta N(μ, σ ). Tällöi satuaismuuttujat X i, i =,,, ovat riippumattomia ja oudattavat samaa ormaalijakaumaa N(μ, σ ): X, X, L, X X N( μσ, ), i =,, K, i Asetetaa ormaalijakauma N(μ, σ ) odotusarvo- eli paikkaparametrille μ ollahypoteesi H :μ = μ 0 0 Testausogelma: Ovatko havaiot sopusoiussa hypoteesi H 0 kassa? Hypoteesit yhde otokse t-testissä Yleie hypoteesi H : X, X, K, X X ~N( μσ, ), i =,, K, Nollahypoteesi: i H :μ = μ 0 0 Vaihtoehtoiset hypoteesit: H: μ > μ0 H: μ < μ0 H : μ μ 0 -suutaiset vaihtoehtoiset hypoteesit -suutaie vaihtoehtoie hypoteesi Parametrie estimoiti yhde otokse t-testissä Olkoot ja X X i i = = s X X = ( i ) i= tavaomaiset harhattomat estimaattorit ormaalijakauma parametreille μ ja σ. Tuusluku X o havaitoje X i, i =,,, aritmeettie keskiarvo ja s o havaitoje X i, i =,,, (harhato) otosvariassi. Ilkka Melli 56

9. Testejä suhdeasteikollisille muuttujille Testisuure ja se jakauma yhde otokse t-testissä Määritellää t-testisuure X μ0 t = s/ Jos ollahypoteesi H :μ = μ 0 0 pätee, ii testisuure t oudattaa t-jakaumaa vapausastei ( ): t t( ) Perustelu: Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H 0 pätevät: X, X, K, X X ~N( μσ, ), i =,, K, i Koska tällöi (ks. lukua Otokset ja otosjakaumat) σ X = Xi N μ0, i= ii X μ0 Z = N(0,) σ / Koska stadardipoikkeama σ o tutemato, satuaismuuttuja Z o testisuureea epäoperatioaalie. Jos stadardipoikkeama σ korvataa satuaismuuttuja Z lausekkeessa vastaavalla otossuureella s = ( Xi X) i= ii saadaa t-testisuure X μ0 t = s/ joka ollahypoteesi H 0 pätiessä oudattaa t-jakaumaa vapausastei ( ): t t( ) Todistus: ks. lukua Otokset ja otosjakaumat. Testisuure t mittaa havaitoarvoje aritmeettise keskiarvo X ja ollahypoteesi H 0 kiiittämä odotusarvoparametri μ arvo μ 0 tilastollista etäisyyttä. Mittayksikköä o erotukse Ilkka Melli 57

9. Testejä suhdeasteikollisille muuttujille stadardipoikkeama X μ 0 σ / estimaattori, jota määrättäessä o oletettu, että ollahypoteesi H 0 pätee. Testisuuree t ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(t) = 0 Site itseisarvoltaa suuret testisuuree t arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Hylkäysaluee määräämie yhde otokse t-testissä Valitaa testi merkitsevyystasoksi α. (i) Jos vaihtoehtoie hypoteesi o muotoa H:μ > μ 0 ii kriittie arvo +t α saadaa ehdosta Pr( t + t α ) = α jossa t t( ). Testi hylkäysalue o tällöi muotoa ( + t α, + ) (ii) Jos vaihtoehtoie hypoteesi o muotoa H:μ < μ 0 ii kriittie arvo t α saadaa ehdosta Pr( t t α ) = α jossa t t( ). Testi hylkäysalue o tällöi muotoa (, t α ) (iii) Jos vaihtoehtoie hypoteesi o muotoa H:μ μ 0 ii kriittiset arvot t α/ ja +t α/ saadaa ehdoista Pr( t tα /) = α / Pr( t + t ) = α / α / jossa t t( ). Testi hylkäysalue o tällöi muotoa (, t ) ( + t, + ) α/ α/ Nollahypoteesi H 0:μ = μ0 hylätää, jos testisuuree arvo osuu hylkäysalueelle. Ilkka Melli 58

9. Testejä suhdeasteikollisille muuttujille Alla olevat kuviot havaiollistavat testi hylkäysaluee määräämistä: > μ 0 H:μ < μ 0 0 H:μ H:μ μ t ( ) t ( ) t ( ) α α α α α α α t α + t α t α / +t α / Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue p-arvo määräämie yhde otokse t-testissä Olkoo t-testisuuree havaittu arvo t 0. Alla olevat kuviot havaiollistavat testi p-arvo määräämistä: > μ 0 H:μ < μ 0 0 H:μ H:μ μ t ( ) t ( ) t ( ) p p p p p p p t + t t 0 t 0 0 0 Testi p-arvo = p Testi p-arvo = p Testi p-arvo = p Nollahypoteesi hylätää, jos testi p-arvo o kylli piei. Normaalisuusoletukse merkitys yhde otokse t-testissä Yhde otokse t-testi yleisessä hypoteesissa oletetaa, että havaiot ovat ormaalijakautueita. t-testi ei kuitekaa ole herkkä poikkeamille ormaalisuudesta, jos havaitoje lukumäärä o kylli suuri. Testiä o melko turvallista käyttää, ku havaitoje lukumäärä > 5 jos havaitoje jakauma ei ole kovi vio ja havaitoje joukossa ei ole poikkeavia havaitoja. Jos havaitoje lukumäärä > 40 testiä voidaa melko turvallisesti käyttää jopa selvästi vioille havaitoje jakaumille. Ilkka Melli 59

9. Testejä suhdeasteikollisille muuttujille Yhde otokse t-testi hyväksymisvirhee todeäköisyys ja voimakkuus Tarkastellaa t-testi hyväksymisvirhee todeäköisyyttä ja voimakkuutta tilateessa, jossa ormaalijakauma variassi σ o tuettu. Huomautus: Jos ormaalijakauma variassia σ ei tueta, vaatii t-testi voimakkuude määräämie s. epäkeskise t-jakauma määrittelemistä. Sivuutamme tämä yleise tapaukse käsittely tässä esityksessä. Olkoo ollahypoteesi muotoa H :μ = μ 0 0 ja vaihtoehtoie hypoteesi muotoa H:μ < μ 0 Koska ormaalijakauma variassi σ o oletettu tuetuksi, ollahypoteesia H 0 voidaa testata t- testisuureella X μ0 t = σ / Testisuure t oudattaa ollahypoteesi H 0 pätiessä stadardoitua ormaalijakaumaa (ks. lukua Otokset ja otosjakaumat): t N(0, ) Koska vaihtoehtoie hypoteesi o tässä muotoa H:μ < μ 0 voimme valita testi päätössääöksi seuraava sääö: Hylkää ollahypoteesi H :μ = μ 0 0 jos X μ0 t = < zα σ / Kriittie arvo z α saadaa ehdosta Pr(Z z α ) = α jossa satuaismuuttuja Z oudattaa stadardoitua ormaalijakaumaa: Z N(0, ) Testi päätössäätö voidaa selvästi ilmaista myös seuraavassa muodossa: Hylkää ollahypoteesi H :μ = μ jos 0 0 X < μ z σ = X 0 α / c jossa kriittie arvo z α määrätää samoi kui edellä. Ilkka Melli 60

9. Testejä suhdeasteikollisille muuttujille Testi hyväksymisvirhee todeäköisyys β o ehdollie todeäköisyys jossa ja β = Pr(H0 jätetää voimaa H0ei ole tosi) = Pr( X Xc μ = μ ) X μ X c μ = Pr σ / σ / X c μ = Pr t σ / t X μ = σ / μ < μ 0 Testi voimakkuus β o ehdollie todeäköisyys jossa kute edellä ja β = Pr(H0hylätää H0ei ole tosi) = Pr( X < Xc μ = μ ) X μ X c μ = Pr < σ / σ / X c μ = Pr t < σ / t X μ = σ / μ < μ 0 Havaiollistus: Kuvio alla havaiollistaa t-testi hyväksymisvirhee todeäköisyyttä β ja voimakkuutta β. Yleie hypoteesi H : X, X,, X X i ~ N(μ, σ ), i =,,, Nollahypoteesi H 0 : μ = μ 0 Vaihtoehtoie hypoteesi H : μ < μ 0 Ilkka Melli 6

9. Testejä suhdeasteikollisille muuttujille Merkitsevyystasoa α vastaava kriittie arvo z α määrätää site, että Pr(Z z α ) = α jossa Z N(0, ) Testi päätössäätö voidaa ilmaista seuraavassa muodossa: Hylkää ollahypoteesi H 0, jos X < X = μ z c 0 ασ / Hyväksymisvirhee todeäköisyys β : Voimakkuus β : β = Pr( X X c μ = μ ) β = Pr( X < X c μ = μ ) N(μ,σ / ) N(μ 0,σ /) α β μ μ 0 X c 9.3. Kahde riippumattoma otokse t-testi A odotusarvoille: Yleie tapaus Testausasetelma kahde riippumattoma otokse t-testissä A Olkoo X i, i =,,, satuaisotos ormaalijakaumasta N( μ, σ ). Tällöi satuaismuuttujat X i, i =,,, ovat riippumattomia ja oudattavat samaa ormaalijakaumaa X, X, L, X X N( μ, σ ), i =,, K, i Olkoo X j, j =,,, satuaisotos ormaalijakaumasta riippumattomia ja oudattavat samaa ormaalijakaumaa X, X, L, X Oletetaa lisäksi, että otokset X N( μ, σ ), j =,, K, j N( μ, σ ) : N( μ, σ ). Tällöi satuaismuuttujat X j, j =,,, ovat N( μ, σ ) : ja X i, i =,,, X j, j =,,, Ilkka Melli 6

9. Testejä suhdeasteikollisille muuttujille ovat riippumattomia. Otoste riippumattomuudella tarkoitetaa sitä, että se, millaie havaito o saatu jakaumasta ei ole vaikuttaut siihe, millaie havaito o saatu jakaumasta, ja käätäe, se, millaie havaito o saatu jakaumasta ei ole vaikuttaut siihe, millaie havaito o saatu jakaumasta. Huomautus: Jakaumie variassit saavat (mutta iide ei tarvitse) tässä esitettävässä kahde riippumattoma otokse t-testissä A erota toisistaa. Jos variassit voidaa olettaa yhtä suuriksi, kaattaa käyttää seuraavassa kappaleessa esitettävää kahde riippumattoma otokse t-testiä B. Asetetaa ormaalijakaumie N( μ, σ) ja N( μ, σ ) odotusarvo- eli paikkaparametreille μ ja μ ollahypoteesi H 0 :μ = μ = μ Testausogelma: Ovatko havaiot sopusoiussa hypoteesi H 0 kassa? Hypoteesit kahde riippumattoma otokse t-testissä A Yleie hypoteesi H : (i) X ~N( μ, σ ), i =,, K, i (ii) X ~N( μ, σ ), j =,, K, j (iii) Havaiot X i ja X j ovat riippumattomia kaikille i ja j Nollahypoteesi: H 0 :μ = μ = μ Vaihtoehtoiset hypoteesit: H: μ > μ -suutaiset vaihtoehtoiset hypoteesit H: μ < μ H : μ μ -suutaie vaihtoehtoie hypoteesi Parametrie estimoiti kahde riippumattoma otokse t-testissä A Olkoot ja k X = X, k =, k k i = k k ik k k i= ik s = ( X X ), k =, tavaomaiset harhattomat estimaattorit ormaalijakauma parametreille μk ja σ k. Tuusluku X k o havaitoje X ik, i =,,, k, k =, aritmeettie keskiarvo ja s k o havaitoje X ik, i =,,, k, k =, otosvariassi. Ilkka Melli 63

9. Testejä suhdeasteikollisille muuttujille Testisuure ja se jakauma kahde riippumattoma otokse t-testissä A Määritellää t-testisuure A kaavalla t A = X X s s + Jos ollahypoteesi H 0 :μ = μ = μ pätee, ii testisuure t A oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,): t N(0,) A a Perustelu: Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H 0 pätevät: X, X, K, X, X, X, K, X i N( μσ, ), =,, K, j N( μσ, ), =,, K, X i X j Tällöi (ks. lukua Otokset ja otosjakaumat) X X Koska X X, ii σ = = Xi N μ, i= σ X j N μ, j= σ σ X X N 0, + Edellä esitetystä seuraa, että X X Z = N(0,) σ σ + Koska variassit σ ja σ ovat tutemattomia, satuaismuuttuja Z o testisuureea epäoperatioaalie. Jos variassit σ ja σ korvataa satuaismuuttuja Z lausekkeessa iide harhattomilla estimaattoreilla k sk = ( Xik Xk), k =, k i= ii saadaa t-testisuure Ilkka Melli 64

9. Testejä suhdeasteikollisille muuttujille t A = X X s s + joka ollahypoteesi H 0 pätiessä oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,): t A a N(0,) Todistus sivuutetaa. Testisuure t A mittaa otoksie ja aritmeettiste keskiarvoje tilastollista etäisyyttä. Mittayksikköä o erotukse X X stadardipoikkeama σ σ + estimaattori, jota määrättäessä o oletettu, että ollahypoteesi H 0 pätee. Testisuuree t A ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(t A ) = 0 Site itseisarvoltaa suuret testisuuree t A arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Pieissä otoksissa testisuuree t A jakaumalle saadaa parempi approksimaatio käyttämällä approksimoivaa jakaumaa t-jakaumaa vapausastei ν = s s + s + s Jos ν ei ole kokoaisluku, ν: arvo pyöristetää alaspäi lähimpää kokoaislukuu. Tätä approksimaatiota kutsutaa Satterthwaite approksimaatioksi. Approksimatiivisea jakaumaa käytetää joskus myös t-jakaumaa vapausastei ν = mi{, } Tämä approksimaatio ei ole yhtä hyvä kui Satterthwaite approksimaatio. Hylkäysaluee määräämie kahde riippumattoma otokse t-testissä A Valitaa testi merkitsevyystasoksi α. Käsittelemme tässä kriittiste rajoje määräämistä vai, ku testisuuree t A jakaumaa approksimoidaa ormaalijakaumalla. Jos testisuuree t A approksimoidaa t-jakaumalla, ii kriittiste rajoje määräämie tapahtuu samalla tavalla kui yhde otokse t-testi tapauksessa. Ilkka Melli 65

9. Testejä suhdeasteikollisille muuttujille (i) Jos vaihtoehtoie hypoteesi o muotoa H:μ > μ ii kriittie arvo +z α saadaa ehdosta Pr( Z + z α ) = α jossa Z N(0,). Testi hylkäysalue o tällöi muotoa ( + z α, + ) (ii) Jos vaihtoehtoie hypoteesi o muotoa H:μ < μ ii kriittie arvo z α saadaa ehdosta Pr( Z z α ) = α jossa Z N(0,). Testi hylkäysalue o tällöi muotoa (, z α ) (iii) Jos vaihtoehtoie hypoteesi o muotoa H:μ μ ii kriittiset arvot z α/ ja +z α/ saadaa ehdoista Pr( Z zα /) = α / Pr( Z + z ) = α / α / jossa Z N(0,). Testi hylkäysalue o tällöi muotoa (, z ) ( + z, + ) α/ α/ Nollahypoteesi hylätää, jos testisuuree arvo osuu hylkäysalueelle. Alla olevat kuviot havaiollistavat testi hylkäysaluee valitaa: > μ H:μ < μ H:μ μ H:μ N(0,) N(0,) N(0,) α α α α α α α + z α z α z α / / +z α Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue Ilkka Melli 66

9. Testejä suhdeasteikollisille muuttujille p-arvo määräämie kahde riippumattoma otokse t-testissä A Olkoo t-testisuuree t A havaittu arvo t 0. Käsittelemme tässä testi p-arvo määräämistä vai, ku testisuuree t A jakaumaa approksimoidaa ormaalijakaumalla. Jos testisuuree t A jakaumaa approksimoidaa t-jakaumalla, ii p-arvo määräämie tapahtuu täsmällee samalla tavalla kui yhde otokse t-testi tapauksessa. Alla olevat kuviot havaiollistavat testi p-arvo määräämistä: > μ H:μ < μ H:μ μ H:μ N(0,) N(0,) N(0,) p p p t + t Testi p-arvo = p Nollahypoteesi hylätää, jos testi p-arvo o kylli piei. Normaalisuusoletukse merkitys kahde riippumattoma otokse t-testissä A Kahde otokse t-testi yleise hypoteesi mukaa havaiot ovat molemmissa otoksissa ormaali-jakautueita. Testi ei kuitekaa ole herkkä poikkeamille ormaalisuudesta, jos molempie otoste otoskoot ovat kylli suuria. Testiä o melko turvallista käyttää, ku > 5 ja > 5 ja ja eivät eroa toisistaa kovi paljo, jos havaitoje jakaumat eivät ole kovi vioja ja havaitoje joukossa ei ole poikkeavia havaitoja. Jos > 40 ja > 40 testiä voidaa melko turvallisesti käyttää jopa selvästi vioille havaitoje jakaumille. 9.4. Kahde riippumattoma otokse t-testi B odotusarvoille: Yhtä suurte variassie tapaus Testausasetelma kahde riippumattoma otokse t-testissä B Oletetaa, että edellisessä kappaleessa esitettyje oletuste lisäksi hypoteesi σ = σ = σ p p p p t 0 t 0 0 0 Testi p-arvo = p pätee. Tällöi testausasetelmaa voidaa kuvata seuraavalla tavalla: Olkoo X i, i =,,, Testi p-arvo = p Ilkka Melli 67

9. Testejä suhdeasteikollisille muuttujille satuaisotos ormaalijakaumasta N( μ, σ ) riippumattomia ja oudattavat samaa ormaalijakaumaa X, X, L, X X N( μ, σ ), i =,, K, i Olkoo X j, j =,,, satuaisotos ormaalijakaumasta N( μ, σ ) riippumattomia ja oudattavat samaa ormaalijakaumaa X, X, L, X Oletetaa lisäksi, että otokset X N( μ, σ ), j =,, K, j. Tällöi satuaismuuttujat X i, i =,,, ovat N(, ) μ σ :. Tällöi satuaismuuttujat X j, j =,,, ovat N(, ) μ σ : ja X i, i =,,, X j, j =,,, ovat riippumattomia. Otoste riippumattomuudella tarkoitetaa sitä, että se, millaie havaito o saatu jakaumasta ei ole vaikuttaut siihe, millaie havaito o saatu jakaumasta, ja käätäe, se, millaie havaito o saatu jakaumasta ei ole vaikuttaut siihe, millaie havaito o saatu jakaumasta. Huomautus: Jakaumie variassit o oletettu tässä esitettävässä kahde riippumattoma otokse t- testissä B yhtä suuriksi. Jos variassit saavat erota toisistaa, pitää käyttää edellisessä kappaleessa esitettyä kahde riippumattoma otokse t-testiä A. Asetetaa ormaalijakaumie N( μ, σ ) ja N( μ, σ ) odotusarvo- eli paikkaparametreille μ ja μ ollahypoteesi H 0 :μ = μ = μ Testausogelma: Ovatko havaiot sopusoiussa hypoteesi H 0 kassa? Hypoteesit kahde riippumattoma otokse t-testissä B Yleie hypoteesi H : (i) X ~N( μ, σ ), i =,, K, i (ii) X ~N( μ, σ ), j =,, K, j Nollahypoteesi: (iii) Havaiot X i ja X j ovat riippumattomia kaikille i ja j H 0 :μ = μ = μ Vaihtoehtoiset hypoteesit: Ilkka Melli 68

9. Testejä suhdeasteikollisille muuttujille H: μ > μ H: μ < μ H : μ μ -suutaiset vaihtoehtoiset hypoteesit -suutaie vaihtoehtoie hypoteesi Parametrie estimoiti kahde riippumattoma otokse t-testissä B Olkoot ja k X = X, k =, k k i = k k ik k k i= ik s = ( X X ), k =, tavaomaiset harhattomat estimaattorit ormaalijakauma parametreille μk ja σ k. Tuusluku X k o havaitoje X ik, i =,,, k, k =, aritmeettie keskiarvo ja s k o havaitoje X ik, i =,,, k, k =, otosvariassi. Testisuure ja se jakauma kahde riippumattoma otokse t-testissä B Määritellää t-testisuure B kaavalla X X tb = sp + jossa s ( ) s + ( ) s p = + o s. yhdistetty (egl. pooled) variassi. Jos ollahypoteesi H 0 :μ = μ = μ pätee, ii testisuure t B oudattaa t-jakaumaa vapausastei ( + ): t t( + ) B Perustelu: Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H 0 pätevät: X, X, K, X, X, X, K, X i N( μσ, ), =,, K, j N( μσ, ), =,, K, X i X j Ilkka Melli 69

9. Testejä suhdeasteikollisille muuttujille Tällöi (ks. lukua Otokset ja otosjakaumat) X σ = Xi N μ, i= σ X = X j N μ, j= Koska X X, ii X X N 0, σ + Edellä esitetystä seuraa, että X X Z = N(0,) σ + Koska stadardipoikkeama σ o tutemato, satuaismuuttuja Z o testisuureea epäoperatioaalie. Määritellää otosvariassit k sk = ( Xik Xk), k =, k i= Jos satuaismuuttuja Z lausekkeessa stadardipoikkeama σ korvataa otossuureella s P = ( ) s + ( ) s + ii saadaa t-testisuure X X tb = sp + joka ollahypoteesi H 0 pätiessä oudattaa t-jakaumaa vapausastei ( + ): t B t( + ) Todistus sivuutetaa; ks. kuiteki vastaavaa todistusta yhde otokse t-testi tapauksessa kappaleessa Yhde otokse t-testi. Testisuure t B mittaa otoksie ja aritmeettiste keskiarvoje tilastollista etäisyyttä. Mittayksikköä o erotukse X X stadardipoikkeama Ilkka Melli 70

9. Testejä suhdeasteikollisille muuttujille σ + estimaattori, jota määrättäessä o oletettu, että ollahypoteesi H 0 pätee. Testisuuree t B ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(t B ) = 0 Site itseisarvoltaa suuret testisuuree t B arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Hylkäysaluee määräämie kahde riippumattoma otokse t-testissä B Kriittiste rajoje määräämie tapahtuu samalla tavalla kui yhde otokse t-testi tapauksessa. p-arvo määräämie kahde riippumattoma otokse t-testissä B Testi p-arvo määräämie tapahtuu samalla tavalla kui yhde otokse t-testi tapauksessa. Normaalisuusoletukse merkitys kahde riippumattoma otokse t-testissä B Kahde otokse t-testi yleise hypoteesi mukaa havaiot ovat molemmissa otoksissa ormaali-jakautueita. Testi ei kuitekaa ole herkkä poikkeamille ormaalisuudesta, jos molempie otoste otoskoot ovat kylli suuria. Testiä o melko turvallista käyttää, ku > 5 ja > 5 ja ja eivät eroa toisistaa kovi paljo, jos havaitoje jakaumat eivät ole kovi vioja ja havaitoje joukossa ei ole poikkeavia havaitoja. Jos > 40 ja > 40 testiä voidaa melko turvallisesti käyttää jopa selvästi vioille havaitoje jakaumille. 9.5. t-testi parivertailuille Parivertailuasetelma Parivertailuasetelma sytyy tilastollisessa tutkimuksessa esimerkiksi seuraavissa tilateissa: (i) Tavoitteea o vertailla kahta mittaria suorittamalla molemmilla mittareilla mittauksia samoista kohteista samaaikaisesti (samoissa olosuhteissa). (ii) Tavoitteea o tutkia joki käsittely vaikutusta suorittamalla mittauksia samoista kohteista ee käsittelyä ja käsittely jälkee. (iii) Päämäärää o vertailla kahta perusjoukkoa suorittamalla mittauksia sama muuttuja arvoista perusjoukkoje alkioide sovitetuissa pareissa. Kaikissa tilateissa (i)-(iii) mittaukset muodostavat mittauspareja. Saattaisi olla houkuttelevaa soveltaa tällaisissa testausasetelmissa kahde riippumattoma otokse t-testiä muodostamalla otokset ii, että toisee otoksee otetaa jokaisesta mittausparista pari esimmäie alkio ja toisee otoksee pari toie alkio. Näi ei saa kuitekaa tehdä, koska parivertailuasetelmissa samaa parii liittyvät mittaukset riippuvat yleesä toisistaa ja siksi kahde riippumattoma otokse t-testiä ei saa Ilkka Melli 7

9. Testejä suhdeasteikollisille muuttujille soveltaa. Kahde riippumattoma otokse t-testi soveltamie parivertailuasetelmaa saattaa johtaa täysi virheellisee johtopäätöksee. Testausasetelma t-testissä parivertailuille Oletetaa, että havaiot muodostuvat muuttujaa X koskevista mittaustuloksie pareista (X i, X i), i =,,, jotka ovat toisistaa riippumattomia. Tavoitteea o verrata mittauksia toisiisa: Atavatko mittaukset keskimääri sama tulokse? Kute edellä todettii, riippumattomie otoste t-testiä ei saa käyttää tällaisessa tilateessa. Testausogelma saadaa ratkaistuksi siirtymällä tarkastelemaa mittaustuloksie X i ja X i erotuksia D,,,, i = Xi Xi i = K Mittaukset ja atavat keskimääri sama tulokse, jos erotukset D i saavat keskimääri arvo olla. Testausogelma ratkaisua o tavaomaie yhde otokse t-testi mittaustuloksie X i ja X i erotuksie D i odotusarvolle. Hypoteesit t-testissä parivertailuille Yleie hypoteesi H : D, D, K, D D ~N( μ, σ ), i =,, K, Nollahypoteesi: i D D H : μ = 0 0 D Vaihtoehtoiset hypoteesit: H: μd > 0 H: μd < 0 -suutaiset vaihtoehtoiset hypoteesit H : μ 0 -suutaie vaihtoehtoie hypoteesi D Parametrie estimoiti t-testissä parivertailuille Olkoot ja Di i = D= s D D D = ( i ) i= tavaomaiset harhattomat estimaattorit ormaalijakauma parametreille μ ja σ. Tuusluku D o erotuste D,,,, i = Xi Xi i = K aritmeettie keskiarvo ja s D o erotuste D = X,,,, X i = K otosvariassi. i i i D D Ilkka Melli 7

9. Testejä suhdeasteikollisille muuttujille Testisuure ja se jakauma t-testissä parivertailuille Määritellää t-testisuure D t = s / Jos ollahypoteesi H : μ = 0 0 D D pätee, ii testisuure t oudattaa t-jakaumaa vapausastei ( ): t t( ) Perustelu: Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H 0 pätevät: D, D, K, D D N(0, σ ), i =,, K, i Tällöi (ks. lukua Otokset ja otosjakaumat) ja site D σ D D= Di N 0, i= D Z = N(0,) σ / D Koska stadardipoikkeama σ D o tutemato, satuaismuuttuja Z o testisuureea epäoperatioaalie. Jos stadardipoikkeama σ D korvataa satuaismuuttuja Z lausekkeessa vastaavalla otossuureella sd = ( Di D) i= ii saadaa t-testisuure D t = s / D joka ollahypoteesi H 0 pätiessä oudattaa t-jakaumaa vapausastei ( ): t t( ) Todistus: ks. kappaletta Yhde otokse t-testi. Testisuure t mittaa havaitoarvoje erotuksie aritmeettise keskiarvo tilastollista etäisyyttä ollasta. Mittayksikköä o erotuksie D i aritmeettise keskiarvo D stadardipoikkeama σ / D Ilkka Melli 73

9. Testejä suhdeasteikollisille muuttujille estimaattori, jota määrättäessä o oletettu, että ollahypoteesi H 0 pätee. Testisuuree t ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(t) = 0 Site itseisarvoltaa suuret testisuuree t arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Hylkäysaluee määräämie t-testissä parivertailuille Kriittiste rajoje määräämie tapahtuu samalla tavalla kui yhde otokse t-testi tapauksessa. p-arvo määräämie t-testissä parivertailuille Testi p-arvo määräämie tapahtuu samalla tavalla kui yhde otokse t-testi tapauksessa. Normaalisuusoletukse merkitys t-testissä parivertailuille Parivertailuasetelma t-testi yleisessä hypoteesissa oletetaa, että havaitoarvoje erotukset ovat ormaali-jakautueita. Testi ei kuitekaa ole herkkä poikkeamille ormaalisuudesta, jos havaitoje lukumäärä o kylli suuri. Testiä o melko turvallista käyttää, ku > 5 jos erotuste jakauma ei ole kovi vio ja erotuksie joukossa ei ole poikkeavia erotuksia. Jos havaitoje lukumäärä > 40 testiä voidaa melko turvallisesti käyttää jopa selvästi vioille erotuksie jakaumille. 9.6. Yhde otokse χ -testi variassille Testausasetelma yhde otokse testissä variassille Olkoo X i, i =,,, satuaisotos ormaalijakaumasta N( μ, σ ). Tällöi satuaismuuttujat X i, i =,,, ovat riippumattomia ja oudattavat samaa ormaalijakaumaa N( μ, σ ) : Asetetaa ormaalijakauma X, X, L, X X i i N( μσ, ), =,, K, H :σ = σ 0 0 N( μ, σ ) variassiparametrille σ ollahypoteesi Testausogelma: Ovatko havaiot sopusoiussa hypoteesi H 0 kassa? Ilkka Melli 74

9. Testejä suhdeasteikollisille muuttujille Hypoteesit yhde otokse χ -testissä variassille Yleie hypoteesi H : Nollahypoteesi: X, X, K, X i ~N( μσ, ), =,, K, X i H :σ = σ 0 0 Vaihtoehtoiset hypoteesit: H: σ > σ 0 -suutaiset vaihtoehtoiset hypoteesit H: σ < σ0 H : σ σ -suutaie vaihtoehtoie hypoteesi 0 Parametrie estimoiti yhde χ -testissä variassille Olkoot ja X X i i = = s X X = ( i ) i= tavaomaiset harhattomat estimaattorit ormaalijakauma parametreille μ ja σ. Tuusluku X o havaitoje X i, i =,,, aritmeettie keskiarvo ja s o havaitoje X i, i =,,, otosvariassi. Testisuure ja se jakauma yhde otokse χ -testissä variassille Määritellää χ -testisuure Jos ollahypoteesi ( ) s χ = σ H :σ 0 = σ 0 0 pätee, ii testisuure χ oudattaa χ -jakaumaa vapausastei ( ): χ χ ( ) Perustelu: Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H 0 pätevät: X, X, K, X X N( μσ, ), i =,, K, i 0 Ilkka Melli 75

9. Testejä suhdeasteikollisille muuttujille Tällöi (ks. lukua Otokset ja otosjakaumat) X i μ Y = χ ( ) i= σ 0 Koska odotusarvo μ o tutemato, satuaismuuttuja Y o testisuureea epäoperatioaalie. Jos satuaismuuttuja Y lausekkeessa odotusarvo μ korvataa vastaavalla otossuureella X X i i = = ii saadaa χ -testisuure jossa i i= σ0 σ0 X X ( ) s χ = = s X X = ( i ) i= Jos ollahypoteesi H 0 pätee, testisuure χ oudattaa χ -jakaumaa vapausastei ( ): χ χ ( ) Todistus: ks. lukua Otokset ja otosjakaumat. Testisuuree χ ormaaliarvo = ( ), koska ollahypoteesi H 0 pätiessä E(χ ) = Site sekä pieet että suuret testisuuree χ arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Hylkäysaluee määräämie yhde otokse χ -testissä variassille Valitaa testi merkitsevyystasoksi α. (i) Jos vaihtoehtoie hypoteesi o muotoa H:σ > σ 0 ii kriittie arvo χ α saadaa ehdosta Pr( α ) χ χ = α jossa χ χ ( ). Testi hylkäysalue o tällöi muotoa (ii) ( χ α, + ) Jos vaihtoehtoie hypoteesi o muotoa H:σ < σ 0 ii kriittie arvo χ α saadaa ehdosta Ilkka Melli 76

9. Testejä suhdeasteikollisille muuttujille Pr( χ χ ) = α α jossa χ χ ( ). Testi hylkäysalue o tällöi muotoa (0, ) χ α (iii) Jos vaihtoehtoie hypoteesi o muotoa H:σ σ 0 ii kriittiset arvot χ α / ja χ α / saadaa ehdoista Pr( χ χ ) = α / α / Pr( χ χ ) = α / α / jossa χ χ ( ). Testi hylkäysalue o tällöi muotoa (0, χ ) ( χ, + ) α/ α/ Nollahypoteesi hylätää, jos testisuuree arvo osuu hylkäysalueelle. Alla olevat kuviot havaiollistavat testi hylkäysaluee määräämistä: H:σ > σ 0 H:σ < σ 0 H:σ σ 0 χ ( ) χ ( ) χ ( ) α α α α α α α χα χ α χ χ α α Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue Ilkka Melli 77

9. Testejä suhdeasteikollisille muuttujille p-arvo määräämie yhde otokse χ -testissä variassille Olkoo χ -testisuuree havaittu arvo χ 0. Alla olevat kuviot havaiollistavat testi p-arvo määräämistä, ku vaihtoehtoie hypoteesi o yksisuutaie: H:σ > σ 0 H:σ < σ 0 χ ( ) χ ( ) Kaksisuutaise vaihtoehtoise hypoteesi H:σ σ 0 tapauksessa testi p-arvo o jossa { 0 0 } p = mi Pr( χ χ ),Pr( χ χ ) χ χ ( ) Nollahypoteesi hylätää, jos testi p-arvo o kylli piei. Normaalisuusoletukse merkitys yhde otokse χ -testissä variassille Tässä esitety variassitesti yleisessä hypoteesissa oletetaa, että havaiot ovat ormaalijakautueita. Testi o aika herkkä poikkeamille ormaalisuudesta ja site testi ei toimi kovikaa hyvi, jos havaitoje jakauma o vio tai havaitoje joukossa o poikkeavia havaitoja. Lisäksi suuretkaa havaitoje lukumäärät eivät paraa tilaetta. 9.7. Kahde riippumattoma otokse F- testi variasseille Testausasetelma kahde riippumattoma otokse F-testissä variasseille Olkoo p p p p Testi p-arvo = p χ 0 χ 0 X i, i =,,, Testi p-arvo = p satuaisotos ormaalijakaumasta N( μ, σ ). Tällöi satuaismuuttujat X i, i =,,, ovat riippumattomia ja oudattavat samaa ormaalijakaumaa N( μ, σ ) : Ilkka Melli 78

9. Testejä suhdeasteikollisille muuttujille Olkoo X, X, L, X X N( μ, σ ), i =,, K, i X j, j =,,, satuaisotos ormaalijakaumasta N( μ, σ ). Tällöi satuaismuuttujat X j, j =,,, ovat riippumattomia ja oudattavat samaa ormaalijakaumaa X, X, L, X Oletetaa lisäksi, että otokset X N( μ, σ ), j =,, K, j N( μ, σ ) : ja X i, i =,,, X j, j =,,, ovat riippumattomia. Otoste riippumattomuudella tarkoitetaa sitä, että se millaie havaito o saatu jakaumasta ei ole vaikuttaut siihe millaie havaito o saatu jakaumasta, ja käätäe, se millaie havaito o saatu jakaumasta ei ole vaikuttaut siihe millaie havaito o saatu jakaumasta. Asetetaa ormaalijakaumie N( μ, σ) ja N( μ, σ ) variassiparametreilleσ jaσ ollahypoteesi H :σ = σ = σ 0 Testausogelma: Ovatko havaiot sopusoiussa hypoteesi H 0 kassa? Hypoteesit kahde riippumattoma otokse F-testissä variasseille Yleie hypoteesi H : (i) X ~N( μ, σ ), i =,, K, i (ii) X ~N( μ, σ ), j =,, K, j (iii) Havaiot X i ja X j ovat riippumattomia kaikille i ja j Nollahypoteesi: Vaihtoehtoiset hypoteesit: H :σ = σ = σ 0 H: σ > σ -suutaiset vaihtoehtoiset hypoteesit H: σ < σ H : σ σ -suutaie vaihtoehtoie hypoteesi Ilkka Melli 79

9. Testejä suhdeasteikollisille muuttujille Parametrie estimoiti kahde riippumattoma otokse F-testissä variasseille Olkoot ja k X = X, k =, k k i = k k ik k k i= ik s = ( X X ), k =, tavaomaiset harhattomat estimaattorit ormaalijakauma parametreille μk ja σ k. Tuusluku X k o havaitoje X ik, i =,,, k, k =, aritmeettie keskiarvo ja s k o havaitoje X ik, i =,,, k, k =, otosvariassi. Testisuure ja se jakauma kahde riippumattoma otokse F-testissä variasseille Määritellää F-testisuure Jos ollahypoteesi s F = s H :σ = σ = σ 0 pätee, ii testisuure F oudattaa F-jakaumaa vapausastei ( ) ja ( ) : F F(, ) Perustelu: Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H 0 pätevät: X, X, K, X, X, X, K, X i N( μ, σ ), =,, K, j N( μ, σ ), =,, K, X i X j Tällöi (ks. lukua Otokset ja otosjakaumat) X i μ = χ ( ) i σ = X j μ = χ j= σ Y Y Koska Y Y, ii Y Y / = Y / F(, ) ( ) Koska odotusarvot μ ja μ ovat tutemattomia, satuaismuuttuja Y o testisuureea epäoperatioaalie. Ilkka Melli 80

9. Testejä suhdeasteikollisille muuttujille Korvataa satuaismuuttujie Y ja Y, lausekkeissa odotusarvot μ ja μ vastaavilla otossuureilla k X = X, k =, k k i = Saamme satuaismuuttujat jossa V V ik ( ) s Xi X = = σ i σ = ( ) s X j X = = σ j= σ s = ( X X ), k =, k k ik k k i= Jos ollahypoteesi H 0 pätee (ks. lukua Otokset ja otosjakaumat) V χ ( ) V χ ( ) Lisäksi satuaismuuttujat V ja V ovat riippumattomia: V V Määritellää F-testisuure F V /( ) s = = V s /( ) Jos ollahypoteesi H 0 pätee, testisuure F oudattaa suoraa F-jakauma määritelmä mukaa F-jakaumaa vapausastei ( ) ja ( ): F F(, ) Suurille testisuuree o F ormaaliarvo, koska ollahypoteesi H 0 pätiessä E( F) = 3 Site sekä pieet että suuret testisuuree F arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Hylkäysaluee määräämie kahde riippumattoma otokse F-testissä variasseille Valitaa testi merkitsevyystasoksi α. (i) Jos vaihtoehtoie hypoteesi o muotoa H:σ > σ Ilkka Melli 8

9. Testejä suhdeasteikollisille muuttujille ii kriittie arvo F α saadaa ehdosta Pr( F F α ) = α jossa F F(, ). Testi hylkäysalue o tällöi muotoa ( F α, + ) (ii) Jos vaihtoehtoie hypoteesi o muotoa H:σ < σ ii kriittie arvo F α saadaa ehdosta Pr( F F α ) = α jossa F F(, ). Testi hylkäysalue o tällöi muotoa (0, ) F α (iii) Jos vaihtoehtoie hypoteesi o muotoa H:μ μ ii kriittiset arvot F α/ ja F α/ saadaa ehdoista Pr( F F ) = α / α / Pr( F F ) = α / α / jossa F F(, ). Testi hylkäysalue o tällöi muotoa (0, F ) ( F, + ) α/ α/ Nollahypoteesi hylätää, jos testisuuree arvo osuu hylkäysalueelle. Alla olevat kuviot havaiollistavat testi hylkäysaluee valitaa: H:σ > σ H:σ < σ H:σ σ F (, ) F (, ) F (, ) α α α α α α α F α F α F α F α Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue p-arvo määräämie kahde riippumattoma otokse F-testissä variasseille Olkoo F-testisuuree F havaittu arvo F 0. Ilkka Melli 8

9. Testejä suhdeasteikollisille muuttujille Alla olevat kuviot havaiollistavat testi p-arvo määräämistä, ku vaihtoehtoie hypoteesi o yksisuutaie: H:σ > σ F (, ) H:σ < σ F (, ) Kaksisuutaise vaihtoehtoise hypoteesi H:σ σ tapauksessa testi p-arvo o jossa p p p F 0 Testi p-arvo = p { } p = mi Pr( F F ),Pr( F F ) F F(, ) 0 0 Nollahypoteesi hylätää, jos testi p-arvo o kylli piei. p Testi p-arvo = p Normaalisuusoletukse merkitys kahde riippumattoma otokse F-testissä variasseille Tässä esitety variassie vertailutesti yleisessä hypoteesissa oletetaa, että havaiot ovat molemmissa otoksissa ormaalijakautueita. Testi o aika herkkä poikkeamille ormaalisuudesta ja site testi ei toimi kovikaa hyvi, jos havaitoje jakauma o vio tai havaitoje joukossa o poikkeavia havaitoja. Lisäksi suuretkaa havaitoje lukumäärät eivät paraa tilaetta. Ilkka Melli 83

0. Testejä järjestysasteikollisille muuttujille 0. Testejä järjestysasteikollisille muuttujille 0.. Järjestysasteikolliste muuttujie testit 0.. Merkkitesti 0.3. Wilcoxoi testi 0.4. Mai ja Whitey testi 0.5. Wilcoxoi rakisummatesti Tarkastelemme tässä luvussa joitaki järjestysasteikolliste muuttujie testejä. Tarkasteltavissa testeissä testataa tarkemmi määrittelemättömä todeäköisyysjakauma sijaitiparametria (mediaaia) koskevia hypoteeseja. Vaikka testit muotoillaa järjestysasteikollisille muuttujille, iitä voidaa (ja o usei järkevää) käyttää myös välimatka- ja suhdeasteikollisille muuttujille. Avaisaat: Asymptoottie testi, Eksakti testi, Hylkäysalue, Järjestetty otos, Järjestysasteikko, Kahde otokse testi, Mai ja Whitey testi, Mediaai, Merkitsevyystaso, Merkkitesti, Nollahypoteesi, Normaaliarvo, Normaalijakauma, Odotusarvo, Otos, Otosvariassi, p-arvo, Parametri, Parivertailu, Riippumattomat otokset, Sovitettu pari, Stadardipoikkeama, Stadardoiti, Suhdeasteikko, t-testi, Testisuure, Todeäköisyysjakauma, Vaihtoehtoie hypoteesi, Variassi, Vertailutesti, Välimatkaasteikko, Wilcoxoi rakisummatesti, Wilcoxoi rakitesti, Yhde otokse testi, Yleie hypoteesi Ilkka Melli 84

0. Testejä järjestysasteikollisille muuttujille 0.. Järjestysasteikolliste muuttujie testit Tarkastelemme tässä luvussa seuraavia testejä järjestysasteikollisille muuttujille: Merkkitesti Wilcoxoi rakitesti Mai ja Whitey testi eli Wilcoxoi rakisummatesti Kaikissa käsiteltävissä testeissä testataa tarkemmi määrittelemättömä todeäköisyysjakauma sijaitiparametria (mediaaia) koskevia hypoteeseja. Vaikka testit muotoillaaki järjestysasteikollisille muuttujille, mikää ei estä iide käyttämistä myös välimatka- ja suhdeasteikollisille muuttujille; mitta-asteikot: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Testit ovat luoteeltaa jakaumista riippumattomia, millä tarkoitetaa sitä, että testie yleiset hypoteesit eivät määrittele tarkasti perusjouko jakaumaa. Testejä voidaa kutsua myös ei-parametrisisiksi, millä taas tarkoitetaa sitä, että testattavat hypoteesit eivät kohdistu mikää tiety todeäköisyysjakauma parametreihi. Merkkitesti ja Wilcoxoi rakitesti ovat yhde otokse testejä, mutta iitä voidaa soveltaa myös parivertailuasetelmissa. Mai ja Whitey testi eli Wilcoxoi rakisummatesti o kahde otokse testi. 0.. Merkkitesti Olkoo X, X,, X satuaisotos jakaumasta, joka pistetodeäköisyys- tai tiheysfuktio f(x) o symmetrie. Asetetaa jakauma mediaaille Me ollahypoteesi H 0 : Me = Me 0 Ovatko havaiot sopusoiussa ollahypoteesi H 0 kassa? Tämä testausogelma eräää ratkaisua o merkkitesti, joka o eräs mahdollie ei-parametrie vastie yhde otokse t- testille ormaalijakauma odotusarvolle; ks. lukua Testit suhdeasteikollisille muuttujille. Testisuureet S ja S + Määritellää erotukset ja olkoo D i = X i Me 0, i =,,, iide erotuste D i lukumäärä, jotka ovat 0. O ilmeistä, että ollahypoteesi H 0 pätiessä positiiviste ja egatiiviste erotuste o jakauduttava suuillee tasa. Määritellää testisuureet S ja S + : S = egatiiviste erotuste D i = X i Me 0 lukumäärä S + = positiiviste erotuste D i = X i Me 0 lukumäärä Ilkka Melli 85

0. Testejä järjestysasteikollisille muuttujille Testisuureide S ja S + omiaisuudet (i) S + S + = (ii) Jos ollahypoteesi H 0 pätee, testisuureet S ja S + oudattavat biomijakaumaa Bi(, q) parametrei ja q = /: S ~ Bi(,/) S + ~ Bi(,/) (iii) Jos ollahypoteesi H 0 pätee, ii + E( S ) = E( S ) = q= (iv) Jos ollahypoteesi H 0 pätee, Eksakti merkkitesti D( S ) = D( S ) = q( q) = + 4 Testisuureide S ja S + jakaumat o taulukoitu ja moet tietokoeohjelmat laskevat testi p-arvoja. Merkkitesti p-arvot määrätää seuraavilla kaavoilla, joissa s ja s + ovat testisuureide S ja S + havaitut arvot: (i) Vaihtoehtoie hypoteesi: (ii) H : Me > Me 0 Testi p-arvo: p = Pr(S + > s + ) Vaihtoehtoie hypoteesi: H : Me < Me 0 Testi p-arvo: p = Pr(S < s ) (iii) Vaihtoehtoie hypoteesi: H : Me Me 0 Testi p-arvo: p = mi{pr(s + > s + ), Pr(S < s )} Stadardoitu merkkitestisuure ja se asymptoottie jakauma Jos ollahypoteesi H 0 pätee, ii + E( S ) = E( S ) = D( S ) = D( S ) = + 4 Määritellää stadardoitu satuaismuuttuja S Z = E( S ) S * * * D( ) Ilkka Melli 86

0. Testejä järjestysasteikollisille muuttujille jossa S = S tai S + Jos ollahypoteesi H 0 pätee, ii testisuure Z oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,): Z ~ a N(0,) Approksimaatio o tavallisesti riittävä hyvä, jos > 0. Pieissä otoksissa ojataa testisuuree S (= S tai S + ) tarkkaa jakaumaa. Testisuuree Z ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(Z) = 0 Site itseisarvoltaa suuret testisuuree Z arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. Hylkäysaluee valita ja p-arvo määräämie: ks. lukua Tilastollie testaus. Kommetteja Merkkitesti voidaa tulkita ei-parametriseksi vastieeksi ormaalijakauma odotusarvoa koskevalle yhde otokse t-testille. Merkkitestissä ei tehdä toisi kui yhde otokse t-testissä mitää oletuksia perusjouko jakauma tyypistä. O myös syytä huomata, että merkkitesti testisuuree arvo ei riipu havaitoarvoista, vaa aioastaa iide keskiäisestä järjestyksestä. Merkkitesti ja parivertailuasetelmat Merkkitestiä voidaa soveltaa parivertailuasetelmii, joissa havaiot muodostuvat toisistaa riippumattomista mittauspareista (X i, Y i ), i =,,, Oletetaa, että X- ja Y-mittauste jakaumat ovat muute samat, mutta iide mediaaeilla (sijaitiparametreilla) saattaa olla eri arvot. Määritellää havaitoje X i ja Y i erotukset D i = X i Y i, i =,,, ja olkoo iide erotuste D i lukumäärä, jotka ovat 0 ja oletetaa, että erotuste D i, i =,,, jakauma o symmetrie. Määritellää testisuureet S ja S + erotuksille D i kute edellä. Olkoo Me D erotuste D i, i =,,, mediaai. Tällöi ollahypoteesi H 0 : Me D = 0 testaamisee voidaa soveltaa merkkitestiä. 0.3. Wilcoxoi rakitesti Olkoo X, X,, X Ilkka Melli 87

0. Testejä järjestysasteikollisille muuttujille satuaisotos jakaumasta, joka pistetodeäköisyys- tai tiheysfuktio f(x) o symmetrie. Asetetaa jakauma mediaaille Me ollahypoteesi H 0 : Me = Me 0 Ovatko havaiot sopusoiussa ollahypoteesi H 0 kassa? Tämä testausogelma eräää ratkaisua o Wilcoxoi rakitesti, joka o eräs mahdollie ei-parametrie vastie yhde otokse t-testille ormaalijakauma odotusarvolle; ks. lukua Testit suhdeasteikollisille muuttujille. Testisuureet W ja W + Olkoo ja olkoo D i = X i Me 0, i =,,, iide erotuste D i lukumäärä, jotka ovat 0. Olkoot Z, Z,, Z itseisarvot D i järjestettyiä suuruusjärjestyksee pieimmästä suurimpaa ja olkoo R(Z i ) = itseisarvo Z i järjestysumero eli raki, i =,,, Määritellää testisuure W = R( Zi ) Di < 0 o iide rakie summa, joita vastaavat erotukset D i = X i Me 0 < 0 Määritellää testisuure + W = R( Zi ) Di > 0 o iide rakie summa, joita vastaavat erotukset D i = X i Me 0 > 0 Testisuureide W ja W + omiaisuudet (i) + W + W = ( + ) (ii) Jos ollahypoteesi H 0 pätee, + E( W ) = E( W ) = ( + ) (iii) Jos ollahypoteesi H 0 pätee, 4 D( W ) = D( W ) = ( + )(+ ) + 4 Ilkka Melli 88

0. Testejä järjestysasteikollisille muuttujille Eksakti Wilcoxoi rakitesti Testisuureide W ja W + jakaumat o taulukoitu ja moet tietokoeohjelmat laskevat testi p- arvoja. Wilcoxoi rakitesti p-arvot määrätää seuraavilla kaavoilla, joissa w ja w + ovat testisuuree W ja W + havaitut arvot: (i) Vaihtoehtoie hypoteesi: (ii) H : Me > Me 0 Testi p-arvo: p = Pr(W + > w + ) Vaihtoehtoie hypoteesi: H : Me < Me 0 Testi p-arvo: p = Pr(W < w ) (iii) Vaihtoehtoie hypoteesi: H : Me Me 0 Testi p-arvo: p = mi{pr(w + > w + ), Pr(W < w )} Stadardoitu W-testisuure ja se asymptoottie jakauma Jos ollahypoteesi H 0 pätee, + E( W ) = E( W ) = 4 ( + ) + D( W ) = D( W ) = ( + )(+ ) Määritellää testisuure jossa W Z = E( W ) W * * * D( ) 4 W = W tai W + Jos ollahypoteesi H 0 pätee, ii testisuure Z oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,): Z ~ a N(0,) Approksimaatio o tavallisesti riittävä hyvä, jos > 0. Pieissä otoksissa ojataa testisuuree W (= W tai W + ) tarkkaa jakaumaa. Testisuuree z ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(Z) = 0 Site itseisarvoltaa suuret testisuuree Z arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. Hylkäysaluee valita ja p-arvo määräämie: ks. lukua Tilastollie testaus. Ilkka Melli 89

0. Testejä järjestysasteikollisille muuttujille Kommetteja Wilcoxoi rakitesti voidaa tulkita ei-parametriseksi vastieeksi ormaalijakauma odotusarvoa koskevalle yhde otokse t-testille. Wilcoxoi rakitestissä ei tehdä toisi kui yhde otokse t- testissä mitää oletuksia perusjouko jakauma tyypistä. O myös syytä huomata, että Wilcoxoi rakitesti testisuuree arvo ei riipu havaitoarvoista, vaa aioastaa iide keskiäisestä järjestyksestä. Wilcoxoi rakitesti käyttää kuiteki eemmä iformaatiota havaitoje järjestyksestä kui merkkitesti. Siksi Wilcoxoi rakitesti o voimakkaampi kui merkkitesti. Wilcoxoi rakitesti ja parivertailuasetelmat Wilcoxoi rakitestiä voidaa soveltaa parivertailuasetelmii, joissa havaiot muodostuvat toisistaa riippumattomista mittauspareista (X i, Y i ), i =,,, Oletetaa, että X- ja Y-mittauste jakaumat ovat muute samat, mutta iide mediaaeilla (sijaitiparametreilla) saattaa olla eri arvot. Määritellää havaitoje X i ja Y i erotukset D i = X i Y i, i =,,, ja olkoo iide erotuste D i lukumäärä, jotka ovat 0 ja oletetaa, että erotuste D i, i =,,, jakauma o symmetrie. Määritellää testisuureet W ja W + erotuksille D i kute edellä. Olkoo Me D erotuste D i, i =,,, mediaai. Tällöi ollahypoteesi H 0 : Me D = 0 testaamisee voidaa soveltaa Wilcoxoi rakitestiä. 0.4. Mai ja Whitey testi Olkoot X, X, K, X riippumattomia havaitoja satuaismuuttuja X jakaumasta perusjoukossa S (otos ). Olkoot Y, Y, K, Ym ovat riippumattomia havaitoja satuaismuuttuja Y jakaumasta perusjoukossa S (otos ). Oletetaa lisäksi, että otokset ja ovat riippumattomia. Otoste riippumattomuudella tarkoitetaa sitä, että se millaie havaito o saatu jakaumasta ei ole vaikuttaut siihe millaie havaito o saatu jakaumasta, ja käätäe, se millaie havaito o saatu jakaumasta ei ole vaikuttaut siihe millaie havaito o saatu jakaumasta. Tehdää oletus, että satuaismuuttujat X ja Y oudattavat muute samaa jakaumaa, mutta iide mediaait (sijaitiparametrit) saattavat erota toisistaa ja asetetaa ollahypoteesi, että satuaismuuttujilla X ja Y o sama mediaai (sijaitiparametri). Ilkka Melli 90

0. Testejä järjestysasteikollisille muuttujille Ovatko havaiot sopusoiussa ollahypoteesi H 0 kassa? Tämä testausogelma eräää ratkaisua o Mai ja Whitey testi, joka o eräs mahdollie ei-parametrie vastie kahde riippumattoma otokse t-testiä ormaalijakaumie odotusarvoille; ks. lukua Testit suhdeasteikollisille muuttujille. Hypoteesit Yleie hypoteesi H : () Havaiot X F, i=,, K, i () Havaiot Y F, j =,, K, m j Y X (3) Jakaumat F X ja F Y ovat muute samat, mutta iide mediaait (sijaitiparametrit) saattavat erota toisistaa. (4) Havaiot X i ja Y j ovat riippumattomia kaikille i ja j. Nollahypoteesi H 0 : H 0 : F X = F Y Vaihtoehtoie hypoteesi H : H : F X F Y Mai ja Whitey testi idea Yhdistetää X- ja Y-havaiot yhdeksi otokseksi ja järjestetää yhdistety otokse havaiot suuruusjärjestyksee pieimmästä suurimpaa ja tarkastellaa mite X- ja Y-havaiot seuraavat yhdistetyssä otoksessa toisiaa. Jos kaikki X-havaiot (Y-havaiot) edeltävät kaikkia Y-havaitoja (X-havaitoja), ei ole uskottavaa, että ollahypoteesi H 0 pätee. Jos satuaismuuttujat X ja Y oudattavat samaa jakaumaa, o ilmeistä, että X- ja Y-havaitoje o sekoituttava sopivasti toisiisa. Mai ja Whitey testisuure mittaa tätä sekoittumista. Testisuure U muoto Määritellää satuaismuuttujat ja testisuure, jos () Xi < Yj Dij = 0, jos Xi > Yj i =,, K, ; j =,, K, m U m = i= j= D () ij Ilkka Melli 9

0. Testejä järjestysasteikollisille muuttujille Testisuure U muoto Määritellää satuaismuuttujat ja testisuure R(X i ) = havaio X i järjestysumero eli raki yhdistetyssä otoksessa i =,,, U = m+ ( + ) R( Xi ) Testisuuree U omiaisuudet i= Testisuuree U muodot ja ovat ekvivaletteja. Testisuuree U arvo ei riipu X- ja Y- havaitoarvoje suuruudesta, vaa aioastaa iide keskiäisestä järjestyksestä. Aia pätee 0 U m ja erityisesti Testisuure U muoto Määritellää satuaismuuttujat ja testisuure U = 0, jos X i > Y j kaikille i ja j U = m, jos X i < Y j kaikille i ja j, jos () Yj < Xi D ji = 0, jos Yj > Xi j =,, K, m; i =,, K, U m = j= i= D () ji Testisuure U muoto Määritellää satuaismuuttujat ja testisuure R(Y j ) = havaio Y j järjestysumero eli raki yhdistetyssä otoksessa j =,,, m m U m m( m ) R( Y ) = + + Testisuuree U omiaisuudet j= Testisuuree U muodot ja ovat ekvivaletteja. Testisuuree U arvo ei riipu X- ja Y- havaitoarvoje suuruudesta, vaa aioastaa iide keskiäisestä järjestyksestä. Aia pätee 0 U m j Ilkka Melli 9

0. Testejä järjestysasteikollisille muuttujille ja erityisesti U = 0, jos Y j > X i kaikille i ja j U = m, jos Y j < X i kaikille i ja j Testisuureide U ja U omiaisuudet (i) (ii) U + U = m Jos ollahypoteesi H 0 pätee, ii E( U ) = E( U ) = m (iii) Jos ollahypoteesi H 0 pätee, ii D( U ) = D( U ) = m( + m+ ) Stadardoitu U -testisuure ja se asymptoottie jakauma Jos ollahypoteesi H 0 pätee, ii stadardoitu satuaismuuttuja Z U E( U) = D( U ) oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,): Z ~ a N(0,) Approksimaatio o tavallisesti riittävä hyvä, jos > 0 ja m > 0. Pieissä otoksissa ojataa testisuuree U tarkkaa jakaumaa. Testisuuree Z ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(Z ) = 0 Site itseisarvoltaa suuret testisuuree Z arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. Hylkäysaluee valita ja p-arvo määräämie: ks. lukua Tilastollie testaus. Stadardoitu U -testisuure ja se asymptoottie jakauma Jos ollahypoteesi H 0 pätee, ii stadardoitu satuaismuuttuja Z U E( U) = D( U ) oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,): Z ~ a N(0,) Approksimaatio o tavallisesti riittävä hyvä, jos > 0 ja m > 0. Pieissä otoksissa ojataa testisuuree U tarkkaa jakaumaa. Testisuuree Z ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(Z ) = 0 Site itseisarvoltaa suuret testisuuree Z arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. Hylkäysaluee valita ja p-arvo määräämie: ks. lukua Tilastollie testaus. Ilkka Melli 93

0. Testejä järjestysasteikollisille muuttujille Kommetteja Mai ja Whitey testi voidaa tulkita ei-parametriseksi vastieeksi kahde riippumattoma otokse t-testille ormaalijakaumie odotusarvoille. Mai ja Whitey testissä ei tehdä toisi kui kahde riippumattoma otokse t-testissä mitää oletuksia perusjoukkoje jakaumasta. Mai ja Whitey testisuureide arvo ei riipu muuttujie X ja Y arvoista, vaa aioastaa iide keskiäisestä järjestyksestä. Jos havaiot ovat ormaalijakautueita, Mai ja Whitey testi ei ole yhtä voimakas kui kahde riippumattoma otokse t-testi. Jos havaiot eivät ole ormaalijakautueita, Mai ja Whitey testi saattaa olla paljo voimakkaampi kui kahde riippumattoma otokse t-testi. Mai ja Whitey testi o varteeotettava vaihtoehto kahde riippumattoma otokse t-testille, jos otoskoot eivät ole kovi isoja ja perusjoukot eivät ole ormaalijakautueita. 0.5. Wilcoxoi rakisummatesti Mai ja Whitey testi ja Wilcoxoi rakisummatesti Wilcoxoi rakisummatesti perustuu Mai ja Whitey testisuureide U ja U muodoissa esiityvii havaitoje rakisummii eli järjestyslukuje summii. Wilcoxoi rakisummatesti o ekvivaletti Mai ja Whitey testi kassa. Testisuure T Määritellää satuaismuuttujat ja testisuure R(X i ) = havaio X i järjestysumero eli raki yhdistetyssä otoksessa i =,,, T = R( Xi ) i= Testisuure T Määritellää satuaismuuttujat ja testisuure R(Y j ) = havaio Y j järjestysumero eli raki yhdistetyssä otoksessa j =,,, m T m = R( Yj ) j= Testisuureide T ja T omiaisuudet (i) T + T = ( + m )( + m+ ) Ilkka Melli 94

0. Testejä järjestysasteikollisille muuttujille (ii) Jos ollahypoteesi H 0 pätee, E( T) = ( + m+ ) E( T ) = m( + m+ ) (iii) Jos ollahypoteesi H 0 pätee, D( T) = D( T ) = m( + m+ ) Stadardoitu T -testisuure ja se asymptoottie jakauma Jos ollahypoteesi H 0 pätee, ii stadardoitu satuaismuuttuja Z T E( T) = D( T ) oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,): Z ~ a N(0,) Approksimaatio o tavallisesti riittävä hyvä, jos > 0 ja m > 0. Pieissä otoksissa ojataa testisuuree T tarkkaa jakaumaa. Testisuuree Z ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(Z ) = 0 Site itseisarvoltaa suuret testisuuree Z arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. Hylkäysaluee valita ja p-arvo määräämie: ks. lukua Tilastollie testaus. Stadardoitu T -testisuure ja se asymptoottie jakauma Jos ollahypoteesi H 0 pätee, ii stadardoitu satuais-muuttuja Z T E( T) = D( T ) oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,): Z ~ a N(0,) Approksimaatio o tavallisesti riittävä hyvä, jos > 0 ja m > 0. Pieissä otoksissa ojataa testisuuree T tarkkaa jakaumaa. Testisuuree Z ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(Z ) = 0 Site itseisarvoltaa suuret testisuuree Z arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. Hylkäysaluee valita ja p-arvo määräämie: ks. lukua Tilastollie testaus. Ilkka Melli 95

. Testejä laatueroasteikollisille muuttujille. Testejä laatueroasteikollisille muuttujille.. Laatueroasteikolliste muuttujie testit.. Testi suhteelliselle osuudelle.3. Suhteelliste osuuksie vertailutesti Tarkastelemme tässä luvussa yhde ja kahde otokse testejä Beroulli-jakauma odotusarvoparametrille. Beroulli-jakauma odotusarvo voidaa tulkita todeäköisyydeksi poimia tutkimukse kohteea olevasta perusjoukosta alkio, jolla o joki tietty omiaisuus. Jos perusjoukko o äärellie, ii Beroulli-jakauma odotusarvoparametri o ko. omiaisuude omaavie alkioide suhteellie osuus. Koska se, oko perusjouko alkiolla joki omiaisuus vai ei, o laatuero, voidaa tässä luvussa käsiteltävät testit lukea laatueroasteikolliste muuttujie testeihi. Testejä voidaa (ja o usei järkevää) käyttää myös järjestys-, välimatka- ja suhdeasteikollisille muuttujille. Avaisaat: Asymptoottie testi, Beroulli-jakauma, Hylkäysalue, Järjestysasteikko, Kahde otokse testi, Kriittie arvo, Laatueroasteikko, Merkitsevyystaso, Nollahypoteesi, Normaaliarvo, Normaalijakauma, Odotusarvo, Otos, Otoskeskihajota, Otosvariassi, p-arvo, Parametri, Riippumattomat otokset, Stadardipoikkeama, Suhdeasteikko, Suhteellie osuus, t-testi, Testisuure, Todeäköisyys, Todeäköisyysjakauma, Vaihtoehtoie hypoteesi, Variassi, Vertailutesti, Välimatka-asteikko, Yhde otokse testi, Yleie hypoteesi Ilkka Melli 96

. Testejä laatueroasteikollisille muuttujille.. Laatueroasteikolliste muuttujie testit Tässä luvussa tarkastelemme seuraavia testejä: Testi suhteelliselle osuudelle Suhteelliste osuuksie vertailutesti Molemmissa käsiteltävissä testeissä testataa Beroulli-jakauma odotusarvoa koskevia hypoteeseja. Beroulli-jakauma odotusarvo voidaa aia tulkita todeäköisyydeksi poimia tutkimukse kohteea olevasta perusjoukosta alkio, jolla o joki tietty omiaisuus. Jos perusjoukko o äärellie, ii Beroulli-jakauma odotusarvoparametri o ko. omiaisuude omaavie alkioide suhteellie osuus. Käsiteltävät testit luetaa laatueroasteikolliste muuttujie testeihi, koska se, oko perusjouko alkiolla joki omiaisuus vai ei, o laatuero. Vaikka testit muotoillaaki laatueroasteikollisille muuttujille, mikää ei estä iide käyttämistä myös järjestys-, välimatka- ja suhdeasteikollisille muuttujille; mitta-asteikot: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Testi suhteelliselle osuudelle o yhde otokse testi. Suhteelliste osuuksie vertailutesti o kahde otokse testi... Testi suhteelliselle osuudelle Testausasetelma testissä suhteelliselle osuudelle Olkoo A perusjouko S tapahtuma ja olkoo Pr(A) = p Pr(A c ) = p = q Määritellää satuaismuuttuja, jos tapahtuma A sattuu X = 0, jos tapahtuma A ei satu Tällöi satuaismuuttuja X oudattaa Beroulli-jakaumaa parametriaa p: X Ber(p) ja E( X) = p Var( X ) = D ( X) = pq Oletetaa, että tapahtuma A o muotoa Tällöi A = Perusjouko S alkiolla o omiaisuus P p = Pr(A) o todeäköisyys poimia perusjoukosta S satuaisesti alkio, jolla o omiaisuus P. Jos perusjoukko S o äärellie, ii todeäköisyys p kuvaa iide perusjouko S alkioide suhteellista osuutta, joilla o omiaisuus P. Ilkka Melli 97

. Testejä laatueroasteikollisille muuttujille Olkoo X, X,, X satuaisotos perusjoukosta S, joka oudattaa Beroulli-jakaumaa Beroulli(p). Tällöi X, X, K, X X Beroulli( p), i =,, K, i Asetetaa Beroulli-jakauma odotusarvoparametrille p ollahypoteesi H 0 : p = p 0 Testausogelma: Ovatko havaiot sopusoiussa hypoteesi H 0 kassa? Hypoteesit testissä suhteelliselle osuudelle Yleie hypoteesi H : X, X, K, X X Beroulli( p), i =,, K, Nollahypoteesi: i H 0 : p = p 0 Vaihtoehtoiset hypoteesit: H: p > p0 H: p< p0 H : p p 0 -suutaiset vaihtoehtoiset hypoteesit -suutaie vaihtoehtoie hypoteesi Parametrie estimoiti testissä suhteelliselle osuudelle Olkoo pˆ = X i = i tavaomaie harhato estimaattori Beroulli-jakauma parametrille p. Huomaa, että i= X i = f o tapahtuma A frekvessi siiä -kertaisessa riippumattomie Beroulli-kokeide sarjassa, jota yksikertaise satuaisotokse poimita Beroulli-jakaumasta Beroulli(p) merkitsee. Site f pˆ = o tapahtuma A suhteellie frekvessi ja f = X Bi(, p) i= i Ilkka Melli 98

. Testejä laatueroasteikollisille muuttujille Testisuure ja se jakauma testissä suhteelliselle osuudelle Määritellää Z-testisuure pˆ p0 Z = p0( p0) Jos ollahypoteesi H 0 : p = p 0 pätee, ii testisuure Z oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,): Z a N(0,) Perustelu: Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H 0 pätevät: X, X, K, X X Beroulli( p ), i =,, K, i 0 Tällöi pätee (ks. moistee Todeäköisyyslasketa lukua Stokastiika kovergessikäsitteet ja raja-arvolauseet sekä lukuja Otokset ja otosjakaumat ja Väliestimoiti): jolloi f p pˆ X N p, ( p ) 0 0 = i = a 0 i= Z = pˆ p0 p ( p ) / 0 0 a N(0,) Approksimaatio o tavallisesti riittävä hyvä, jos pˆ 0, ( pˆ) 0 Testisuure Z mittaa parametri p estimaati ˆp ja ollahypoteesi kiiittämä parametri p arvo p 0 tilastollista etäisyyttä. Mittayksikköä o erotukse ˆp p 0 stadardipoikkeama p( p) estimaattori, joka o määrätty olettae, että ollahypoteesi H 0 pätee Testisuuree Z ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(Z) = 0 Site itseisarvoltaa suuret testisuuree Z arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Ilkka Melli 99

. Testejä laatueroasteikollisille muuttujille Hylkäysaluee määräämie testissä suhteelliselle osuudelle Valitaa testi merkitsevyystasoksi α. (i) Jos vaihtoehtoie hypoteesi o muotoa H:p> p 0 ii kriittie arvo +z α saadaa ehdosta Pr( Z + z α ) = α jossa Z N(0,). Testi hylkäysalue o tällöi muotoa ( + z α, + ) (ii) Jos vaihtoehtoie hypoteesi o muotoa H:p< p 0 ii kriittie arvo z α saadaa ehdosta Pr( Z z α ) = α jossa Z N(0,). Testi hylkäysalue o tällöi muotoa (, z α ) (iii) Jos vaihtoehtoie hypoteesi o muotoa H:p p 0 ii kriittiset arvot z α/ ja +z α/ saadaa ehdoista Pr( Z zα /) = α / Pr( Z + z ) = α / jossa α / Z N(0,). Testi hylkäysalue o tällöi muotoa (, z ) ( + z, + ) α/ α/ Nollahypoteesi hylätää, jos testisuuree Z arvo osuu hylkäysalueelle. Alla olevat kuviot havaiollistavat testi hylkäysaluee valitaa: H : p p > 0 < 0 H:p p0 H : p p N(0,) N(0,) N(0,) α α α α α α α z α + z α z α / +z α / Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue Ilkka Melli 00

. Testejä laatueroasteikollisille muuttujille p-arvo määräämie testissä suhteelliselle osuudelle Olkoo Z-testisuuree Z havaittu arvo z 0. Alla olevat kuviot havaiollistavat testi p-arvo määräämistä: > p0 H : p < p0 H:p p0 H : p N(0,) N(0,) N(0,) Nollahypoteesi hylätää, jos testi p-arvo o kylli piei..3. Suhteelliste osuuksie vertailutesti Testausasetelma suhteelliste osuuksie vertailutestissä Olkoo A perusjouko S k, k =, tapahtuma ja olkoot Pr(A) = p k Pr(A c ) = p k = q k Määritellää satuaismuuttujat X k, k =, :, jos A tapahtuu perusjoukossa Sk X k = 0, jos A ei tapahdu perusjoukossa Sk Tällöi ja X k ~ Beroulli(p k ), k =, E( X ) = p k k Var( X k) = D ( Xk) = pkqk Oletetaa, että tapahtuma A o muotoa Tällöi p p p p p p p z + z p-arvo = p z0 z0 0 0 p-arvo = p A = Perusjouko alkiolla o omiaisuus P p-arvo = p p k = Pr(A) o todeäköisyys poimia perusjoukosta S k, k =, satuaisesti alkio, jolla o omiaisuus P. Jos perusjoukko S k, k =, o äärellie, ii todeäköisyys p k kuvaa iide perusjouko S k alkioide suhteellista osuutta, joilla o omiaisuus P. Olkoo Ilkka Melli 0

. Testejä laatueroasteikollisille muuttujille X, X, K, X satuaisotos perusjoukosta S, joka oudattaa Beroulli-jakaumaa Beroulli(p ). Tällöi X, X, K, X X Beroulli( p ), i =,, K, Olkoo i X, X, K, X satuaisotos perusjoukosta S, joka oudattaa Beroulli-jakaumaa Beroulli(p ). Tällöi X, X, K, X X Beroulli( p ), i =,, K, i Olkoot otokset lisäksi toisistaa riippumattomia. Asetetaa Beroulli-jakaumie parametreille p ja p ollahypoteesi H 0 : p = p = p Testausogelma: Ovatko havaiot sopusoiussa hypoteesi H 0 kassa? Hypoteesit suhteelliste osuuksie vertailutestissä Yleie hypoteesi H : (i) X i Beroulli( p), i =,, K, i (ii) X i Beroulli( p), i =,, K, (iii) X, X, K, X, X, X, K, X Nollahypoteesi: H 0 : p = p = p Vaihtoehtoiset hypoteesit: H: p > p -suutaiset vaihtoehtoiset hypoteesit H: p < p H : p p -suutaie vaihtoehtoie hypoteesi Parametrie estimoiti suhteelliste osuuksie vertailutestissä Olkoo k pˆ = X, k =, k k i = ik tavaomaie harhato estimaattori Beroulli-jakauma parametrille p k, k =,. i Ilkka Melli 0

. Testejä laatueroasteikollisille muuttujille Huomaa, että k i= X = f, k =, ik k o tapahtuma A frekvessi siiä -kertaisessa riippumattomie Beroulli-kokeide sarjassa, jota yksikertaise satuaisotokse poimita Beroulli-jakaumasta Beroulli(p k ), k =, merkitsee. Site fk pˆ k =, k =, k o tapahtuma A suhteellie frekvessi otoksessa k =, ja k k = ik k k i= f X Bi(, p ) Jos ollahypoteesi H 0 : p = p = p pätee, voidaa otokset yhdistää ja parametri p harhato estimaattori o tapahtuma A suhteellie frekvessi yhdistetyssä otoksessa: p ˆ+ p ˆ f+ f pˆ = = + + Jos ollahypoteesi H 0 pätee, ii p( p) p( p) Var( pˆ pˆ ) = + = p( p) + Testisuure suhteelliste osuuksie vertailutestissä Määritellää Z-testisuure Z = pˆ pˆ pˆ( pˆ) + Jos ollahypoteesi H 0 : p = p = p pätee, ii testisuure Z oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: Z a N(0,) Ilkka Melli 03

. Testejä laatueroasteikollisille muuttujille Perustelu: Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H 0 pätevät: Xi Beroulli( p), i =,, K, X j Beroulli( p), j =,, K, X, X, K, X, X, X, K, X Tällöi pätee (ks. moistee Todeäköisyyslasketa lukua Stokastiika kovergessikäsitteet ja raja-arvolauseet sekä lukuja Otokset ja otosjakaumat ja Väliestimoiti): Koska ii f p( p) pˆ = Xi = a N p, i= f p( p) pˆ = X j = a N p, j= pˆ pˆ Y = pˆ pˆ p( p) + a N(0,) Koska todeäköisyys p o tutemato, satuaismuuttuja Y o testisuureea epäoperatioaalie. Jos satuaismuuttuja Y lausekkeessa todeäköisyys p korvataa otossuureella p ˆ+ p ˆ f+ f pˆ = = + + saadaa testisuure Z = pˆ pˆ pˆ( pˆ) + joka ollahypoteesi H 0 pätiessä oudattaa suurissa otoksissa stadardoitua ormaalijakaumaa N(0,): Z a N(0, ) Todistus sivuutetaa. Ilkka Melli 04

. Testejä laatueroasteikollisille muuttujille Approksimaatio o tavallisesti riittävä hyvä, jos pˆ 5, ( pˆ ) 5 ja pˆ 5, ( pˆ ) 5 Testisuure Z mittaa tapahtuma A otoksista ja määrättyje suhteelliste frekvessie etäisyyttä. Mittayksikköä o erotukse pˆ pˆ stadardipoikkeama p( p) + estimaattori, joka o määrätty olettae, että ollahypoteesi H 0 pätee Testisuuree Z ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(Z) = 0 Site itseisarvoltaa suuret testisuuree Z arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Hylkäysaluee määräämie suhteelliste osuuksie vertailutestissä Valitaa testi merkitsevyystasoksi α. (i) Jos vaihtoehtoie hypoteesi o muotoa H:p > p ii kriittie arvo +z α saadaa ehdosta Pr( Z + z α ) = α jossa Z N(0,). Testi hylkäysalue o tällöi muotoa ( + z α, + ) (ii) Jos vaihtoehtoie hypoteesi o muotoa H:p < p ii kriittie arvo z α saadaa ehdosta Pr( Z z α ) = α jossa Z N(0,). Testi hylkäysalue o tällöi muotoa (, z α ) (iii) Jos vaihtoehtoie hypoteesi o muotoa H:p p ii kriittiset arvot z α/ ja +z α/ saadaa ehdoista Ilkka Melli 05

. Testejä laatueroasteikollisille muuttujille jossa Pr( Z z ) = α / α / Pr( Z + z ) = α / α / Z N(0,). Testi hylkäysalue o tällöi muotoa (, z ) ( + z, + ) α/ α/ Nollahypoteesi hylätää, jos testisuuree Z arvo osuu hylkäysalueelle. Alla olevat kuviot havaiollistavat testi hylkäysaluee valitaa: H:p p H:p > < H:p p p N(0,) N(0,) N(0,) α α α α α α α z α + z α z α / +z α / Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue p-arvo määräämie suhteelliste osuuksie vertailutestissä Olkoo Z-testisuuree Z havaittu arvo z 0. Alla olevat kuviot havaiollistavat testi p-arvo määräämistä: H:p p H:p > < H:p p p N(0,) N(0,) N(0,) p p p p p p p z + z z0 z0 0 0 p-arvo = p p-arvo = p p-arvo = p Nollahypoteesi hylätää, jos testi p-arvo o kylli piei. Ilkka Melli 06

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie.. Jakaumaoletuksie testaamie.. Yhteesopivuude testaamie.3. Homogeeisuude testaamie.4. Riippumattomuude testaamie.5. χ -homogeeisuustesti ja χ -riippumattomuustesti.6. Normaalisuude testaamie Tarkastelemme tässä luvussa erilaiste jakaumaoletuste testaamista. Tarkastelu kohteea ovat χ -testit yhteesopivuudelle, homogeeisuudelle ja riippumattomuudelle sekä Bowmai ja Shetoi testi ja Wilki ja Shapiro testi ormaalisuudelle. χ -yhteesopivuustestissä pyritää selvittämää ovatko havaiot sopusoiussa havaitoje jakaumasta tehdy jakaumaoletukse kassa. χ -testit homogeeisuudelle ja riippumattomuudelle. ovat läheistä sukua χ -testille yhteesopivuudelle. χ -testissä homogeeisuudelle perusjoukko o jaettu kahtee tai useampaa ryhmää ja testattavaa hypoteesia o se, että tarkasteltava muuttuja oudattaa kaikissa ryhmissä samaa jakaumaa. χ -testissä riippumattomuudelle perusjouko alkiot o luokiteltu ristii kahde tekijä suhtee ja testattavaa hypoteesia o se, että tekijät ovat riippumattomia. Koska ormaalijakaumalla o ii keskeie asema tilastotieteessä, havaitoje ormaalisuudelle o kehitetty useita erilaisia testejä. Tässä luvussa tarkastellaa Bowmai ja Shetoi testiä sekä Wilki ja Shapiro testiä ormaalisuudelle. Avaisaat: Bowmai ja Shetoi testi, Ei-parametrie testi, Frekvessitaulukko, Havaittu frekvessi, Homogeeisuude testaamie, Huipukkuus, Hylkäysalue, Hyväksymisalue, Jakaumaoletukse testaamie, Jakaumista riippumato testi, χ -etäisyys, χ -jakauma, χ -testi, χ -testi homogeeisuudelle, χ -testi riippumattomuudelle, χ -testi yhteesopivuudelle, Kriittie arvo, Merkitsevyystaso, Normaalisuude testaamie, Odotettu frekvessi, p-arvo, Rakit Plot -kuvio, Solu, Solufrekvessi, Suhteellie frekvessi, Vious, Wilki ja Shapiro testi, Yhteesopivuude testaamie Ilkka Melli 07

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie.. Jakaumaoletuksie testaus Tässä luvussa tarkastellaa seuraavia sekä diskreeteille että jatkuville muuttujille tarkoitettuja testejä yhteesopivuudelle, homogeeisuudelle ja riippumattomuudelle: χ -testi yhteesopivuudelle χ -testi homogeeisuudelle χ -testi riippumattomuudelle Bowmai ja Shetoi testi sekä Wilki ja Shapiro testi ormaalisuudelle Tilastollise testaukse perusmuodossa testataa todeäköisyysjakaumie parametreja koskevia ollahypoteeseja; ks. lukuja Tilastollie testaus ja Testejä suhdeasteikollisille muuttujille. Tällöi testi yleie hypoteesi kiiittää havaitoje jakauma. Kysymys: Voidaako yleise hypoteesi jakaumaoletusta testata tilastollisesti? Vastaus: Kyllä! Jakaumaoletuksia koskevia tilastollisia testejä kutsutaa tavallisesti yhteesopivuustesteiksi. Yhteesopivuustesteillä pyritää selvittämää ovatko havaiot sopusoiussa tehdy jakaumaoletukse kassa. Yleiseä yhteesopivuustestiä käytetää χ -testiä. Läheistä sukua χ -testille yhteesopivuudelle ovat testit homogeeisuudelle ja riippumattomuudelle. χ -testissä homogeeisuudelle testausasetelma o seuraava: (i) Perusjoukko o jaettu kahtee tai useampaa ryhmää. (ii) Testattavaa hypoteesia o se, että tarkasteltava muuttuja oudattaa kaikissa ryhmissä samaa jakaumaa. χ -testissä riippumattomuudelle testausasetelma o seuraava: (i) Perusjouko alkiot o luokiteltu ristii kahde tekijä suhtee. (ii) Testattavaa hypoteesia o se, että tekijät ovat riippumattomia. χ -testit homogeeisuudelle ja riippumattomuudelle ovat erilaisista lähtökohdistaa huolimatta läheistä sukua toisillee esimerkiksi iihi liittyvät laskutoimitukset ovat täysi samat. Koska ormaalijakaumalla o ii keskeie asema tilastotieteessä, havaitoje ormaalisuudelle o kehitetty useita erilaisia testejä. Tässä luvussa tarkastellaa kahta ormaalisuustestiä: (i) Bowmai ja Shetoi testi perustuu havaitoje vioude ja huipukkuude mittoihi. (ii) Wilki ja Shapiro testi perustuu s. rakit plot -kuvioo... Yhteesopivuude testaamie Testausasetelma χ -yhteesopivuustestissä Tarkastellaa tutkimusasetelmaa, jossa perusjouko S alkioita voidaa kuvata faktorilla eli tekijällä A, joka saa olla laatuero-, järjestys-, välimatka- tai suhdeasteikollie muuttuja ja haluamme Ilkka Melli 08

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie testata oletusta, joka mukaa tekijä A oudattaa perusjoukossa S jotaki määrättyä todeäköisyys-jakaumaa. Oletetaa, että käyttävissämme o tekijää A koskevia havaitoja. Tällöi testattava jakaumaoletus voidaa muotoilla esimerkiksi seuraavilla tavoilla: (i) Voidaako havaitoje jakaumaa kuvata oletukse määrittelemällä todeäköisyysjakaumalla? (ii) Voisivatko havaiot olla oletukse määrittelemä todeäköisyysjakauma geeroimia eli tuottamia? (iii) Ovatko havaiot ja tehty jakaumaoletus yhteesopivia? χ -yhteesopivuustestissä havaitoje ja havaitoje jakaumasta tehdy oletukse yhteesopivuutta tutkitaa seuraavalla tavalla: () Valitaa havaioille sopiva luokitus. () Määrätää havaitoje luokkafrekvessit. (3) Määrätää tehdy jakaumaoletukse mukaiset odotetut luokkafrekvessit. (4) Verrataa havaittuja ja odotettuja luokkafrekvessejä toisiisa χ -testisuureella. Hypoteesit χ -yhteesopivuustestissä Yleie hypoteesi H : Havaiot X, X,, X o saatu poimimalla satuaisotos perusjoukosta S. Nollahypoteesi H 0 : Havaiot X, X,, X oudattavat todeäköisyysjakaumaa, joka pistetodeäköisyystai tiheysfuktio o f(x;θ). Fuktio f(x;θ) parametrit eivät ole välttämättä tuettuja. Vaihtoehtoie hypoteesi H : Havaiot X, X,, X eivät oudata ollahypoteesi H 0 määrittelemää todeäköisyysjakaumaa. Havaitut luokkafrekvessit Luokitellaa havaiot X, X,, X toisesa poissulkevii luokkii, joide lukumäärä o m ja olkoo O k, k =,,, m iide havaitoje frekvessi eli lukumäärä jotka kuuluvat luokkaa k. Frekvessi O k o luokkaa k kuuluvie havaitoje havaittu frekvessi. Tarkastellaa havaittuje frekvessie määräämistä eriksee diskreettie ja jatkuvie muuttujie tapauksissa: (i) Oletetaa, että havaiot X, X,, X ovat diskreeti satuaismuuttuja X havaittuja arvoja ja, että satuaismuuttuja X mahdolliset arvot ovat y, y,, y m Tällöi havaito X i luokitellaa luokkaa k, jos X i = y k, i =,,,, k =,,, m Ilkka Melli 09

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie (ii) Luokkaa k kuuluvie havaitoje X i havaittu frekvessi O k o iide havaitoje lukumäärä, jotka saavat arvo y k. Oletetaa, että havaiot X, X,, X ovat jatkuva satuaismuuttuja X havaittuja arvoja ja, että X (a, b) Jaetaa väli (a, b) pisteillä a= a < a < a < L < a < a = b 0 m pistevieraisii osaväleihi (a k, a k ], k =,,, m Tällöi havaito X i luokitellaa luokkaa k, jos X i (a k, a k ], i =,,,, k =,,, m Luokkaa k kuuluvie havaitoje X i havaittu frekvessi O k o iide havaitoje lukumäärä, jotka kuuluvat välii k. Havaitut luokkafrekvessit O k voidaa esittää frekvessitaulukkoa seuraavassa muodossa: m Luokka m Summa Havaittu frekvessi O O O m Frekvessiä O k kutsutaa tavallisesti havaituksi solufrekvessiksi frekvessitauluko solussa k. Solufrekvessit O k toteuttavat yhtälö m k = O k = Odotetut luokkafrekvessit Oletetaa, että havaiot X, X,, X ovat satuaismuuttuja X havaittuja arvoja ja, että havaiot o luokiteltu toisesa poissulkevii luokkii, joide lukumäärä o m. Oletetaa, että ollahypoteesi H 0 määrää täydellisesti satuaismuuttuja X jakauma ja olkoo P k todeäköisyys sille, että satuaismuuttuja X saa arvo luokasta k, ku ollahypoteesi H 0 pätee. Tällöi luokkaa k kuuluvie havaitoje odotettu frekvessi E k o E = P, k =,, K, m k k Oletetaa, että ollahypoteesi H 0 määrää kyllä satuaismuuttuja X jakauma tyypi, mutta jakauma parametrit ovat tutemattomia. Jos jakauma parametreja ei tueta, e o estimoitava havaioista. Olkoo P k estimoitu todeäköisyys sille, että satuaismuuttuja X saa arvo luokasta k, ku ollahypoteesi H 0 pätee. Tällöi luokkaa k kuuluvie havaitoje odotettu frekvessi E k o E = P, k =,, K, m k k Ilkka Melli 0

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie (i) Oletetaa, että X o diskreetti satuaismuuttuja, joka mahdolliset arvot ovat Tällöi y, y,, y m P k = Pr(X = y k ), k =,,, m jossa todeäköisyys Pr(X = y k ) määrätää olettae, että ollahypoteesi H 0 pätee. Todeäköisyydet Pr(X = y k ) voidaa määrätä satuaismuuttuja X kertymäfuktio tai pistetodeäköisyysfuktio avulla. (ii) Oletetaa, että X o jatkuva satuaismuuttuja, joka saa arvoja väliltä (a, b) ja, että väli (a, b) o jaettu pisteillä a= a < a < a < L < a < a = b 0 m pistevieraisii osaväleihi (a k, a k ], k =,,, m Tällöi P = Pr( a < X a ), k =,, K, m k k k jossa todeäköisyys Pr( a < k X ak) määrätää olettae, että ollahypoteesi H 0 pätee. Todeäköisyydet Pr( ak < X ak) voidaa määrätä satuaismuuttuja X kertymäfuktio tai tiheysfuktio avulla. Odotetut frekvessit E k voidaa esittää frekvessitaulukkoa seuraavassa muodossa: m Luokka m Summa Odotettu frekvessi E E E m Frekvessiä E k kutsutaa tavallisesti odotetuksi solufrekvessiksi frekvessitauluko solussa k. Solufrekvessit E k toteuttavat yhtälö m k = E k = Testisuure ja se jakauma χ -yhteesopivuustestissä Testi ollahypoteesille H 0 perustuu havaittuje frekvessie O k ja odotettuje frekvessie E k vertailuu. Jos havaittuje frekvessie O k ja odotettuje frekvessie E k jakaumat muistuttavat tarpeeksi paljo toisiaa, havaiot ovat sopusoiussa ollahypoteesi H 0 kassa. Määritellää χ -testisuure m ( Ok Ek) χ = E jossa k = k Ilkka Melli

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie O k = havaittu frekvessi luokassa k E k = odotettu frekvessi luokassa k m = luokkie lukumäärä Testisuure χ mittaa havaittuje ja odotettuje frekvessie jakaumie yhteesopivuutta tai etäisyyttä ja siksi sitä kutsutaa usei χ -etäisyydeksi. χ -testisuure voidaa kirjoittaa myös muotoo m (ˆ pk Pk) χ = P jossa k = k p ˆk = O k / = havaittu suhteellie frekvessi luokassa k P k = todeäköisyys, että havaito kuuluu luokkaa k, ku ollahypoteesi H 0 pätee m = luokkie lukumäärä Jos ollahypoteesi H 0 pätee, testisuure χ oudattaa suurissa otoksissa approksimatiivisesti χ - jakaumaa vapausastei f = (m p): jossa χ χ ( f ) a f = m p m = luokkie lukumäärä p = odotettuje frekvessie E k määräämiseksi estimoituje parametrie lukumäärä Approksimaatio o tavallisesti riittävä hyvä, jos odotetut frekvessit E k toteuttavat ehdot E > 5, k =,, K, m k Ehdot saadaa toteutumaa valitsemalla havaioille sopiva luokitus. Testisuuree χ ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o jossa E( χ ) = f f = m p Normaaliarvoaa merkitsevästi suuremmat χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Normaaliarvoaa merkitsevästi pieemmät χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 pätee liia hyvi: Havaiot saattavat olla vääreettyjä. χ -yhteesopivuustesti o jakaumista riippumato, ei-parametrie testi: (i) Testi yleie hypoteesi ei kiiitä havaitoje jakaumaa, jote se soveltuu kaikille todeäköisyysjakaumille. Ilkka Melli

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie (ii) Testissä ei testata todeäköisyysjakauma parametreja koskevaa hypoteesia, vaa oletusta havaitoje jakaumasta. χ -yhteesopivuustesti: Sovellus Luvuissa Tilastolliste aieistoje kuvaamie, Väliestimoiti ja Tilastollie testaus o käsitelty seuraavaa esimerkkiä : Koe tekee ruuveja, joide tavoitepituutea o 0 cm. Ruuvie pituus vaihtelee satuaisesti joki verra. Vaihtelusta ei ole haittaa, kuha valmistettuje ruuvie keskimääräie pituus o tarpeeksi lähellä tavoitearvoaa ja pituudet eivät vaihtele liikaa. Ruuvie laaduvalvota o toteutettu ii, että jokaisesta valmistuserästä ruuveja poimitaa satuaisotos ja otoksee poimittuje ruuvie pituudet mitataa. Olemme soveltaeet äi kerättyy esimerkkiaieistoo seuraavia tilastollisia meetelmiä: (i) Luvussa Tilastolliste aieistoje kuvaamie o äytetty, mite ruuvie pituude jakaumaa otoksessa voidaa kuvata luokitellulla frekvessijakaumalla ja sitä vastaavalla histogrammilla. (ii) Luvussa Väliestimoiti o äytetty, mite koee tekemie ruuvie keskipituudelle voidaa kostruoida otostietoje perusteella luottamusväli. (iii) Luvussa Tilastollie testaus o äytetty, mite voidaa testata ovatko otoksessa saadut tiedot ruuvie keskipituudesta sopusoiussa ruuvie tavoitepituude kassa. Sekä ruuvie keskipituude luottamusväli (ks. lukua Väliestimoiti) että testi ruuvie keskipituude tavoitearvolle (ks. lukua Tilastollie testaus) perustuivat oletuksee, joka mukaa ruuvie pituus o satuaismuuttuja, joka oudattaa ormaalijakaumaa. Tätä jakaumaoletusta voidaa testata χ -yhteesopivuustestillä seuraavassa esitettävällä tavalla. Yleie hypoteesi H : Ruuvit o poimittu satuaisotaalla koee tekemie ruuvie joukosta. Nollahypoteesi H 0 : Koee tekemie ruuvie pituudet oudattavat ormaalijakaumaa. Vaihtoehtoie hypoteesi H : Koee tekemie ruuvie pituudet eivät oudata ormaalijakaumaa. Koee valmistamie ruuvie joukosta poimittii siis satuaisotos, joka koko = 30 ja otoksee poimittuje ruuvie pituudet mitattii. Ruuvie pituuksie aritmeettie keskiarvo otoksessa oli X = 0.09 cm ja otoskeskihajota oli s = 0.038 cm Taulukko oikealla esittää otoksee poimittuje ruuvie pituuksie luokiteltua frekvessijakaumaa. Luokkavälit Luokkafrekvessit (9.85,9.90] (9.90,9.95] (9.95,0.00] 6 (0.00,0.05] 3 (0.05,0.0] 5 (0.0,0.5] 4 (0.5,0.0] 5 (0.0,0.5] 3 (0.5,0.30] Ilkka Melli 3

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Kuva oikealla esittää otoksee poimittuje ruuvie pituuksie luokiteltua frekvessijakaumaa vastaavaa histogrammia. Voisiko tällaie pituuksie jakauma sytyä ormaalijakautueesta perusjoukosta poimitusta satuaisotoksesta, ts. ovatko havaiot sopusoiussa iistä tehdy ormaalisuusoletukse kassa? Tähä kysymyksee ataa vastaukse χ -yhteesopivuustesti. χ -yhteesopivuustesti vaatimat laskutoimitukset voidaa järjestää seuraava tauluko muotoo (taulukko o luotu Microsoft Excel -ohjelmalla): Frekvessi 7 6 5 4 3 0 Ruuvie pituuksie luokiteltu frekvessijakauma 9.8 9.9 0.0 0. 0. 0.3 0.4 Pituus (cm) () () (3) (4) (5) (6) (7) (8) Luokka Luoka yläraja Havaittu luokkafrekvessi Stadardoitu Kertymäfuktio luoka yläraja arvo Kertymäfuktio arvoje erotus Odotettu luokkafrekvessi Khi -arvo k a k O k z k F (z k ) F (z k ) F (z k ) E k χ k 9.90 -.79444 0.03637 0.03637.095 0.0076 9.95 -.39 0.09460 0.0583.74698 0.03665 3 0.00 6-0.834 0.087 0.087 3.4799.3377 4 0.05 3-0.34990 0.363 0.6034 4.800 0.686 5 0.0 5 0.36 0.5535 0.895 5.67443 0.0806 6 0.5 4 0.633 0.7300 0.7775 5.3345 0.3395 7 0.0 5.09464 0.8636 0.3306 3.9977 0.5466 8 0.5 3.5765 0.9450 0.07934.3806 0.636 9 0.30.05766 0.9809 0.05750.7487 0.3046 Summa 30 30 4.90937 Tauluko sarakkeide selitykset: () Luokka: k =,,, m = 9 () Luoka k yläraja: a k (3) Havaittu luokkafrekvessi luokassa k : O k m k = O k = = 30 (4) Luoka k yläraja a k stadardoitua: z k ak X ak 0.09 = = s 0.038 Ilkka Melli 4

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie jossa X = 0.09 cm o ruuvie pituuksie aritmeettie keskiarvo otoksessa ja s = 0.038 cm o pituuksie keskihajota otoksessa. (5) Stadardoidu ormaalijakauma N(0,) kertymäfuktio F( ) arvo pisteessä z k : F(z k ) (6) Kertymäfuktio arvoje erotus F(z k ) F(z k- ) = Pr(z k- < z z k ) = P k o todeäköisyys, että havaito kuuluu luokkaa k, jos ollahypoteesi H 0 ruuvie pituude ormaalijakautueisuudesta pätee. Todeäköisyydet P k toteuttavat ehdo m k = P = k koska valitu luokitukse ulkopuolelle jääeet ormaalijakauma hätäalueide todeäköisyysmassat o yhdistetty reualuokkii. (7) Odotettu luokkafrekvessi luokassa k : E k = P k m k = (8) Luoka k χ -arvo: jossa E k = = 30 ( Ok Ek) χk = E k O k = havaittu frekvessi luokassa k E k = odotettu frekvessi luokassa k χ -yhteesopivuustesti testisuuree arvo saadaa sarakkee (8) lukuje sarakesummaa: m m ( Ok Ek) χ = χk = = 4.0 E k= k= k χ -yhteesopivuustesti vertaa havaittuja frekvessejä O k ja ollahypoteesi mukaa odotettuja frekvessejä E k toisiisa. Geometrisesti vertailu merkitsee havaittuja luokkafrekvessejä O k vastaavie suorakaiteide pita-aloje vertaamista odotettuja frekvessejä E k vastaavie suorakaiteide pita-aloihi; ks. kuvaa alla. Ilkka Melli 5

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie 7 6 Ruuvie pituuksie luokiteltu frekvessijakauma Havaitut frekvessit Odotetut frekvessit Frekvessi 5 4 3 0 9.8 9.9 0.0 0. 0. 0.3 0.4 Pituus (cm) Nollahypoteesi H 0 : Ruuvie pituudet oudattavat ormaalijakaumaa pätiessä testisuure χ oudattaa χ -jakaumaa vapausastei (m p): χ χ (m p) jossa Esimerkissä m = luokkie lukumäärä p = odotettuje frekvessie E k määräämiseksi estimoituje parametrie lukumäärä m p = 9 = 6 koska. Valitaa merkitsevyystasoksi α = 0.05 Merkitsevyystasoa α = 0.05 vastaava kriittie arvo o χ 0.05 =.59 koska χ -jakauma taulukoide mukaa jossa Pr( χ.59) = 0.05 χ χ (6) Ilkka Melli 6

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Merkitsevyystasoa α = 0.05 vastaava hylkäysalue o site muotoa (.59, + ) Koska χ -yhteesopivuustesti testisuuree arvo χ = < 4.0.59 kuuluu siis testi hyväksymisalueesee ja site ollahypoteesi jää voimaa merkitsevyystasolla α = 0.05: Havaiot ovat sopusoiussa ormaalisuusoletukse kassa. Huomautuksia: Microsoft Excel -ohjelma mukaa χ -yhteesopivuustesti testisuuree arvoa 4.0 vastaava p-arvo o 0.65. Site ormaalisuusoletukse hylkäämisee ei ole myöskää testi p-arvo mukaa mitää perusteita. Tarkkaa ottae luokkia olisi pitäyt yhdistää ii, että ehdot E > 5, k =,, K, m k olisivat toteutueet. Tällä ei kuitekaa pitäisi tässä olla vaikutusta testi tuloksee..3. Homogeeisuude testaamie Testausasetelma χ -homogeeisuustestissä Tarkastellaa tutkimusasetelmaa, jossa perusjouko S alkioita kuvataa yhdellä faktorilla eli tekijällä A, joka saa olla laatuero-, järjestys-, välimatka- tai suhdeasteikollie muuttuja. Jaetaa perusjoukko S jakaa kahtee tai useampaa ryhmää, poimitaa ryhmistä toisistaa riippumattomat satuaisotokset ja tarkastellaa tekijä A vaihtelua otoksissa. Tehdää oletus, että tekijä A oudattaa kaikissa ryhmissä samaa, tarkemmi määrittelemätötä todeäköisyysjakaumaa. Haluamme testata tehtyä jakaumaoletusta: (i) Voidaako eri otoksista (ryhmistä) saatuja havaitoarvoje jakaumia kuvata samalla todeäköisyysjakaumalla? (ii) Voivatko otokset olla sama todeäköisyysjakauma geeroimia eli tuottamia? Jos tehty jakaumaoletus pätee ja tekijä A oudattaa siis kaikissa ryhmissä samaa jakaumaa, perusjoukko o homogeeie ja perusjoukkoa ei tarvitse jakaa tekijää A koskevissa tarkasteluissa erillisiksi ryhmiksi. Jos tehty jakaumaoletus ei päde, jolloi tekijä A ei oudata kaikissa ryhmissä samaa jakaumaa, perusjoukko o heterogeeie ja ryhmiä o syytä tarkastella tekijää A koskevissa tarkasteluissa erillisiä. Kutsumme tällaiste jakaumaoletuksie testaamisee tarkoitettuja testejä homogeeisuustesteiksi. χ -homogeeisuustesti suorittamie χ -homogeeisuustestissä havaitoje ja iide jakaumasta eri ryhmissä tehdy homogeeisuusoletukse yhteesopivuutta mitataa seuraavalla tavalla: () Valitaa havaioille yhteie luokitus. Ilkka Melli 7

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie () Määrätää havaitoje luokkafrekvessit jokaisesta otoksesta. (3) Määrätää tehdy homogeeisuusoletukse mukaiset odotetut luokkafrekvessit. (4) Verrataa havaittuja ja odotettuja luokkafrekvessejä toisiisa χ -testisuureella. Hypoteesit χ -homogeeisuustestissä Yleie hypoteesi H : Perusjoukosta o jaettu r ryhmää, joista o poimittu (toisistaa riippumattomat) satuaisotokset. Nollahypoteesi H 0 : Otokset i =,,, r o poimittu samasta todeäköisyysjakaumasta. Vaihtoehtoie hypoteesi H : Otokset i =,,, r o poimittu eri todeäköisyysjakaumista. Havaitut frekvessit Oletetaa, että tutkimukse kohteea oleva perusjoukko S o jaettu r ryhmää ja poimitaa ryhmistä toisistaa riippumattomat satuaisotokset, joide koot ovat i, i =,,, r Luokitellaa havaiot jokaisessa otoksessa samaa luokitusta käyttäe toisesa poissulkevii luokkii, joide lukumäärä olkoo c ja määrätää ryhmä i luokkaa j kuuluvie havaitoje havaittu frekvessi eli lukumäärä O ij, i =,,, r, j =,,, c Muodostetaa havaituista frekvesseistä O ij (r c)-frekvessitaulukko [O ij ] : Luokat c Summa Ryhmät O O O c O O O c r O r O r O rc r Summa C C C c Taulukossa: r = ryhmie lukumäärä c = luokkie lukumäärä O ij = havaittu frekvessi ryhmä i luokassa j, i =,,, r, j =,,, c i = otoskoko ryhmässä i Ilkka Melli 8

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie C j = havaittu frekvessi yhdistety havaitoaieisto luokassa j = havaitoje kokoaislukumäärä Frekvessiä O ij kutsutaa tavallisesti havaituksi solufrekvessiksi frekvessitaulu solussa (i, j). Havaittuje frekvessie O ij taulukossa pätee: (i) Rivisummat yhtyvät ryhmäkohtaisii otoskokoihi: (ii) c Oij = i, i =,, K, r j= Sarakesummat yhtyvät yhdistety havaitoaieisto luokkafrekvesseihi: r Oij = Cj, j =,, K, c i= (iii) Havaitoje kokoaislukumäärä: r c r c O = = C = ij i j i= j= i= j= Nollahypoteesi tulkita χ -homogeeisuustestissä Jos ollahypoteesi H 0 pätee, havaitoje pitää jakautua (satuaisvaihtelua lukuu ottamatta) jokaisessa ryhmässä i =,,, r samalla tavalla luokkii j =,,, c. Jos ollahypoteesi H 0 pätee, havaitoje jakautumie luokkii j =,,, c ei saa riippua siitä, mihi ryhmää i =,,, r e kuuluvat. Jos ollahypoteesi H 0 pätee, todeäköisyys, että havaito kuuluu luokkaa j =,,, c ei saa riippua siitä, mihi ryhmää i =,,, r se kuuluu. Odotettuje frekvessie määräämie Olkoo x o tarkastelu kohteea oleva perusjouko S alkio. Määritellää seuraavat todeäköisyydet: pij = Pr( x kuuluu ryhmää i ja luokkaa j) p ji = Pr( x kuuluu luokkaa j x kuuluu ryhmää i) pi = Pr( x kuuluu ryhmää i) p j = Pr( x kuuluu luokkaa j) i =,, K, r, j =,, K, c Todeäköisyyslaskea yleise tulosääö mukaa pij = pj i pi, i =,, K, r, j =,, K, c Jos ollahypoteesi H 0 pätee, todeäköisyys, että perusjouko S alkio x kuuluu luokkaa j ei saa riippua siitä, mihi ryhmää i alkio x kuuluu. Site ollahypoteesi H 0 perusjouko homogeeisuudesta voidaa ilmaista joko muodossa H : p = p, i =,, K, r, j =,, K, c tai muodossa 0 ji j Ilkka Melli 9

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie H : p = p p, i =,, K, r, j =,, K, c 0 ij i j Todeäköisyydet pij, pi, p voidaa estimoida havaituista frekvesseistä O j ij kaavoilla Oij C i j pˆ ˆ ˆ ij = pi = p j = Jos ollahypoteesi H 0 pätee, solutodeäköisyydet p ij voidaa estimoida kaavoilla C i j P = ˆ ˆ ij pi p j = Määrätää ollahypoteesi H 0 pätiessä odotetut solufrekvessit E ij yhtälöillä Cj C i j Eij = Pij = i =, i =,, K, r, j =,, K, c Muodostetaa odotetuista frekvesseistä E ij (r c)-frekvessitaulukko [E ij ] : Luokat c Summa Ryhmät E E E c E E E c r E r E r E rc r Summa C C C c Taulukossa r = ryhmie lukumäärä c = luokkie lukumäärä E ij = odotettu frekvessi ryhmä i luokassa j, i =,,, r, j =,,, c i = otoskoko ryhmässä i C j = havaittu frekvessi yhdistety havaitoaieisto luokassa j = havaitoje kokoaislukumäärä Frekvessiä E ij kutsutaa tavallisesti odotetuksi solufrekvessiksi frekvessitaulu solussa (i, j). Ilkka Melli 0

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Odotettuje frekvessie E ij taulukossa pätee: (i) Rivisummat yhtyvät ryhmäkohtaisii otoskokoihi: (ii) c Eij = i, i =,, K, r j= Sarakesummat yhtyvät yhdistety havaitoaieisto luokkafrekvesseihi: r Eij = Cj, j =,, K, c i= (iii) Havaitoje kokoaislukumäärä: r c r c E = = C = ij i j i= j= i= j= Testisuure ja se jakauma χ -homogeeisuustestissä Määritellää χ -testisuure jossa χ r c = ( Oij Eij ) E i= j= ij O ij = havaittu frekvessi solussa (i, j) E ij = odotettu frekvessi solussa (i, j) r = ryhmie lukumäärä c = luokkie lukumäärä Testisuure χ mittaa havaittuje ja odotettuje frekvessie jakaumie yhteesopivuutta tai etäisyyttä ja siksi sitä kutsutaa usei χ -etäisyydeksi. Homogeeisuustestiχ -testisuure voidaa kirjoittaa myös muotoo r c (ˆ p ) ij Pij χ = P i= j= ij jossa pˆ ij Oij = Eij C i j P ˆ ˆ ij = = = pi p j pˆ pˆ i = i j C j = i =,, K, r, j =,, K, c Ilkka Melli

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Jos ollahypoteesi H 0 pätee, testisuure χ oudattaa suurissa otoksissa approksimatiivisesti χ -jakaumaa vapausastei f = (r )(c ): jossa χ χ ( f ) a r = ryhmie lukumäärä c = luokkie lukumäärä Approksimaatio o tavallisesti riittävä hyvä, jos odotetut frekvessit E ij ja keskimääräiset odotetut frekvessit C j /r toteuttavat ehdot Eij >, i =,, K, r, j =,, K, c C / r > 5, j =,, K, c j Ehdot saadaa toteutumaa valitsemalla havaioille sopiva luokitus. Testisuuree χ ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o jossa E( χ ) = f f = (r )(c ) Normaaliarvoaa merkitsevästi suuremmat χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. χ -homogeeisuustesti o jakaumista riippumato, ei-parametrie testi: (i) (ii) Testi yleie hypoteesi ei kiiitä havaitoje jakaumaa. Testissä ei testata todeäköisyysjakauma parametreja koskevaa hypoteesia, vaa oletusta havaitoje jakaumasta..4. Riippumattomuude testaamie Testausasetelma χ -riippumattomuustestissä Tarkastellaa tutkimusasetelmaa, jossa perusjouko S alkioita kuvataa kahdella faktorilla eli tekijällä A ja B, jotka saavat olla laatuero-, järjestys-, välimatka- tai suhdeasteikollisia muuttujia. Poimitaa perusjoukosta S satuaisotos ja tarkastellaa tekijöide A ja B vaihtelua otoksessa. Tehdää oletus, että tekijät A ja B ovat riippumattomia. Haluamme testata tehtyä riippumattomuusoletusta: Ovatko havaiot sopusoiussa tehdy riippumattomuusoletukse kassa? Jos tehty oletus pätee ja tekijät A ja B ovat siis riippumattomia, tekijöitä A ja B voidaa tarkastella erillisiä. Jos tehty oletus ei päde ja tekijät A ja B eivät siis ole riippumattomia, tekijät A ja B ovat assosioitueita. Kutsumme tällaiste riippumattomuusoletuksie testaamisee tarkoitettuja testejä riippumattomuustesteiksi. Ilkka Melli

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie χ -riippumattomuustesti suorittamie χ -riippumattomuustestissä havaitoje ja tehdy riippumattomuusoletukse yhteesopivuutta mitataa seuraavalla tavalla: () Valitaa havaioille sopivat luokitukset tekijöide A ja B suhtee. () Luokitellaa havaiot tekijöide A ja B suhtee ristii ja määrätää havaitut luokkafrekvessit. (3) Määrätää tehdy riippumattomuusoletukse mukaiset odotetut luokkafrekvessit. (4) Verrataa havaittuja ja odotettuja luokkafrekvessejä toisiisa χ -testisuureella. Hypoteesit χ -riippumattomuustestissä Yleie hypoteesi H : Perusjoukosta o poimittu satuaisotos ja havaitoyksiköt o luokiteltu ristii kahde tekijä A ja B suhtee. Nollahypoteesi H 0 : Tekijät A ja B ovat riippumattomia. Vaihtoehtoie hypoteesi H : Tekijät A ja B eivät ole riippumattomia. Havaitut frekvessit Poimitaa tutkimukse kohteea olevasta perusjoukosta S satuaisotos, joka koko o. Luokitellaa havaitoyksiköt tekijä A suhtee toisesa poissulkevii luokkii, joide lukumäärä o r. Määrätää tekijä A luokkaa i kuuluvie havaitoje havaittu frekvessi eli lukumäärä R i, ku i =,,, r. Luokitellaa havaitoyksiköt tekijä B suhtee toisesa poissulkevii luokkii, joide lukumäärä o c. Määrätää tekijä B luokkaa j kuuluvie havaitoje havaittu frekvessi eli lukumäärä C j, ku j =,,, c. Luokitellaa havaitoyksiköt tekijöide A ja B suhtee ristii toisesa poissulkevii luokkii, joide lukumäärä o r c. Määrätää tekijä A luokkaa i ja tekijä B luokkaa j kuuluvie havaitoje havaittu frekvessi eli lukumäärä O ij, ku i =,,, r ja j =,,, c. Muodostetaa havaituista frekvesseistä O ij (r c)-frekvessitaulukko [O ij ] : B-luokat c Summa A-luokat O O O c R O O O c R r O r O r O rc R r Summa C C C c Ilkka Melli 3

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Taulukossa: r c = A-luokkie lukumäärä = B-luokkie lukumäärä O ij = havaittu frekvessi luokassa, joka määrää A-luokka i ja B-luokka j, i =,,, r, j =,,, c R i = havaittu frekvessi A-luokassa i C j = havaittu frekvessi B-luokassa j = havaitoje kokoaislukumäärä Frekvessiä O ij kutsutaa tavallisesti havaituksi solufrekvessiksi frekvessitaulu solussa (i, j). Havaittuje frekvessie O ij taulukossa pätee: (i) Rivisummat yhtyvät havaittuihi frekvesseihi A-luokituksessa: (ii) c Oij = Ri, i =,, K, r j= Sarakesummat yhtyvät havaittuihi frekvesseihi B-luokituksessa: r Oij = Cj, j =,, K, c i= (iii) Havaitoje kokoaislukumäärä: r c r c O = R = C = ij i j i= j= i= j= Nollahypoteesi tulkita χ -riippumattomuustestissä Jos ollahypoteesi H 0 pätee, havaitoje jakautumie A-luokkii ei saa riippua siitä, mihi B-luokkaa havaiot kuuluvat, toisi saoe, jos ollahypoteesi H 0 pätee, todeäköisyys, että havaito kuuluu A-luokkaa i =,,, r ei saa riippua siitä, mihi B-luokkaa j =,,, c se kuuluu. Jos ollahypoteesi H 0 pätee, havaitoje jakautumie B-luokkii ei saa riippua siitä, mihi A-luokkaa havaiot kuuluvat, toisi saoe, jos ollahypoteesi H 0 pätee, todeäköisyys, että havaito kuuluu B-luokkaa j =,,, c ei saa riippua siitä, mihi A-luokkaa i =,,, r se kuuluu. Odotettuje frekvessie määräämie Olkoo x o tarkastelu kohteea oleva perusjouko S alkio. Määritellää seuraavat todeäköisyydet: pij = Pr( x kuuluu A-luokkaa i ja B-luokkaa j) pi = Pr( x kuuluu A-luokkaa i) p j = Pr( x kuuluu B-luokkaa j) i =,, K, r, j =,, K, c Ilkka Melli 4

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Jos ollahypoteesi H 0 pätee, tapahtumat {x S x kuuluu A-luokkaa i} {x S x kuuluu B-luokkaa j} ovat riippumattomia kaikille i =,,, r, j =,,, c. Site ollahypoteesi H 0 tekijöide A ja B riippumattomuudesta voidaa ilmaista muodossa H : p = p p, i =,, K, r, j =,, K, c 0 ij i j Todeäköisyydet pij, pi, p voidaa estimoida havaituista frekvesseistä O j ij kaavoilla Oij R C i j pˆ ˆ ˆ ij = pi = p j = Jos ollahypoteesi H 0 pätee, solutodeäköisyydet p ij voidaa estimoida kaavoilla R C i j P = ˆ ˆ ij pi p j = Määrätää ollahypoteesi H 0 pätiessä odotetut solufrekvessit E ij yhtälöillä RC i j Eij = Pij =, i =,, K, r, j =,, K, c Muodostetaa odotetuista frekvesseistä E ij (r c)-frekvessitaulukko [E ij ] : B-luokat c Summa A-luokat E E E c R E E E c R r E r E r E rc R r Summa C C C c Taulukossa r c = A-luokkie lukumäärä = B-luokkie lukumäärä E ij = odotettu frekvessi luokassa, joka määrää A-luokka i ja B-luokka j, i =,,, r, j =,,, c R i = havaittu frekvessi A-luokassa i C j = havaittu frekvessi B-luokassa j = havaitoje kokoaislukumäärä Ilkka Melli 5

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Frekvessiä E ij kutsutaa tavallisesti odotetuksi solufrekvessiksi frekvessitaulu solussa (i, j). Odotettuje frekvessie E ij taulukossa pätee: (i) Rivisummat yhtyvät havaittuihi frekvesseihi A-luokituksessa: (ii) c Eij = Ri, i =,, K, r j= Sarakesummat yhtyvät havaittuihi frekvesseihi B-luokituksessa: r Eij = Cj, j =,, K, c i= (iii) Havaitoje kokoaislukumäärä: r c r c E = R = C = ij i j i= j= i= j= Testisuure ja se jakauma χ -riippumattomuustestissä Määritellää χ -testisuure jossa χ r c = ( Oij Eij ) E i= j= ij O ij = havaittu frekvessi solussa (i, j) E ij = odotettu frekvessi solussa (i, j) r = A-luokkie lukumäärä c = B-luokkie lukumäärä Testisuure χ mittaa havaittuje ja odotettuje frekvessie jakaumie yhteesopivuutta tai etäisyyttä ja siksi sitä kutsutaa usei χ -etäisyydeksi. χ -testisuure voidaa kirjoittaa myös muotoo r c (ˆ p ) ij Pij χ = P i= j= ij jossa Oij pˆ ij = Eij R C i j P ˆ ˆ ij = = = pi p j Ri pˆ i = C j pˆ j = i =,, K, r, j =,, K, c Ilkka Melli 6

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Jos ollahypoteesi H 0 pätee, testisuure χ oudattaa suurissa otoksissa approksimatiivisesti χ -jakaumaa vapausastei f = (r )(c ): jossa χ χ ( f ) a r = A-luokkie lukumäärä c = B-luokkie lukumäärä Approksimaatio o tavallisesti riittävä hyvä, jos odotetut frekvessit E ij ja keskimääräiset odotetut frekvessit R i /c ja C j /r toteuttavat ehdot Eij >, i =,, K, r, j =,, K, c Ri / c> 5, i =,, K, r C / r > 5, j =,, K, c j Ehdot saadaa toteutumaa valitsemalla havaioille sopiva luokitus. Testisuuree χ ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o jossa E( χ ) = f f = (r )(c ) Normaaliarvoaa merkitsevästi suuremmat χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. χ -riippumattomuustesti o jakaumista riippumato, ei-parametrie testi: (i) Testi yleie hypoteesi ei kiiitä havaitoje jakaumaa. (ii) Testissä ei testata todeäköisyysjakauma parametreja koskevaa hypoteesia, vaa oletusta havaitoje jakaumasta..5. χ -homogeeisuustesti vs χ -riippumattomuustesti Havaittuje frekvessie taulukosta ei voi sellaiseaa ähdä oko kyseessä χ -homogeeisuustesti vai χ -riippumattomuustesti testausasetelmasta. Lisäksi testit tehdää tekisesti täsmällee samalla tavalla: Odotetut frekvessit määrätää samalla kaavalla. Testisuureet lasketaa samalla kaavalla. Testisuureet oudattavat ollahypoteesi pätiessä approksimatiivisesti samaa jakaumaa. Testie testausasetelmat ovat kuiteki täysi erilaiset. Homogeeisuustesti testausasetelma: (i) Perusjoukko koostuu r ryhmästä ja testissä tarkastellaa perusjouko alkioide jakautumista luokkii eri ryhmissä, ku alkiot o luokiteltu yhde tekijä A suhtee käyttäe kaikissa ryhmissä samaa luokitusta. Ilkka Melli 7

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie (ii) Havaitoaieisto muodostuu toisistaa riippumattomista ryhmäkohtaisista satuaisotoksista. (iii) Sekä ryhmäkohtaiset otoskoot i että havaitoje kokoaislukumäärä ovat kiiteitä eli ei-satuaisia (eli valittuja) lukuja, ku taas sattuma määrää mite havaiot jakautuvat luokkii ryhmie sisällä. Riippumattomuustesti testausasetelma: (i) Testissä tarkastellaa kahde tekijä A ja B assosiaatiota eli riippuvuutta, ku havaiot o luokiteltu ristii tekijöide A ja B suhtee. (ii) Havaitoaieisto muodostuu yhdestä satuaisotoksesta. (iii) Vai havaitoje kokoaislukumäärä o kiiteä eli ei-satuaie (eli valittu) luku, ku taas sattuma määrää mite havaiot jakautuvat luokkii tekijöide A ja B ristiluokitukse suhtee..6. Normaalisuude testaamie Normaalijakaumalla o keskeie asema tilastotieteessä. Esimerkiksi tavaomaise t-testi yleisessä hypoteesissa oletetaa, että havaiot oudattavat ormaalijakaumaa. Siksi tilastotieteessä o kehitetty useita erilaisia meetelmiä havaitoje ormaalisuude tutkimisee. Normaalisuutta voidaa tietysti testata edellä esitetyllä χ -testillä, joka o yleie yhteesopivuustesti. Seuraavassa tarkastellaa kuiteki seuraavia, erityisesti ormaalisuude testaamisee tarkoitettuja tilastollisia testejä: Bowmai ja Shetoi testi Rakit Plot -kuvio ja Wilki ja Shapiro testi Bowmai ja Shetoi testi ormaalisuudelle Olkoot γ ja γ tavaomaiset keskusmometteihi perustuvat tuusluvut todeäköisyysjakaumie vioudelle ja huipukkuudelle. Normaalijakaumalle γ = γ = 0 Bowmai ja Shetoi testissä havaitoje ormaalisuude testaamie perustuu testisuureesee, joka o vastaavie otossuureide fuktio. Testisuure saa suuria arvoja, jos havaitoje vious ja/tai huipukkuus poikkeavat paljo ormaalijakautuee satuaismuuttuja vioudesta ja/tai huipukkuudesta. Todeäköisyysjakauma vious ja huipukkuus Satuaismuuttuja X k. origomometti o α E( k k = X ), k =,,3, K Satuaismuuttuja X k. keskusmometti o Erityisesti k μk = E ( X α), k =,,3, K α = E( X ) = μx Ilkka Melli 8

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie o satuaismuuttuja X odotusarvo ja μ = E ( X μx) = σ X o satuaismuuttuja X variassi. Todeäköisyysjakauma vioude mittaa käytetää tuuslukua γ = μ 3 3 μ ja todeäköisyysjakauma huipukkuude mittaa. käytetää tuuslukua Normaalijakaumalle μ γ = 3 4 μ γ = γ = 0 Havaitoje jakauma vious ja huipukkuus Olkoot X, X,, X välimatka- tai suhdeasteikollise satuaismuuttuja X havaittuja arvoja. Havaitoje X, X,, X k. origomometti o k a = X, k =,, K k i = Havaitoje X, X,, X k. keskusmometti o Erityisesti i = i k m = ( X a ), k =,, K a k = X o havaitoje X, X,, X aritmeettie keskiarvo ja i m ˆ = ( Xi X) = σ X i= o havaitoje X, X,, X otosvariassi. Havaitoje jakauma vioude mittaa käytetää tuuslukua c = m 3 3 m ja havaitoje jakauma huipukkuude mittaa käytetää tuuslukua m c = 3 4 m Ilkka Melli 9

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Hypoteesit Yleie hypoteesi H : Havaiot X, X,, X o poimittu yksikertaisella satuaisotaalla perusjoukosta S. Nollahypoteesi H 0 : Havaiot X, X,, X oudattavat ormaalijakaumaa. Vaihtoehtoie hypoteesi H : Havaiot X, X,, X eivät oudata ormaalijakaumaa. Bowmai ja Shetoi testi Määritellää χ -testisuure χ = c + c 6 4 Jos ollahypoteesi H 0 pätee, testisuure χ oudattaa suurissa otoksissa approksimatiivisesti χ - jakaumaa :lla vapausasteella: χ χ () a Testisuuree χ ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o E(χ ) = Normaaliarvoaa merkitsevästi suuremmat χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Normaaliarvoaa merkitsevästi pieemmät χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 pätee liia hyvi, jolloi havaiot saattavat olla vääreettyjä. Rakit Plot -kuvio sekä Wilki ja Shapiro testi ormaalisuudelle Tietokoegrafiikka mahdollistaa havaitoaieisto ormaalisuude tutkimise graafisi keioi. Normaalisuude tutkimisee tarkoitetut graafiset meetelmät perustuvat kuvioihi, joide ideaa o se, että ormaalijakautueet havaiot asettuvat (satuaisvaihtelua lukuu ottamatta) suoralle ja havaitoje epäormaalisuus tulee kuviossa esille poikkeamia tästä suorasta. Tällaie kuvio voidaa muodostaa usealla eri periaatteella; tässä tarkastellaa s. Rakit Plot -kuviota. Olkoot Z, Z,, Z havaiot X, X,, X suuruusjärjestyksessä pieimmästä suurimpaa. Olkoo E(Y i ), i =,,, i. havaio Y i odotusarvo, jossa Y i o suuruusjärjestyksessä i. havaito stadardoidusta ormaalijakaumasta N(0,) poimitusta satuaisotoksesta. Piirretää pistediagrammi (E(Y i ), Z i ), i =,,, Ilkka Melli 30

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Jos havaiot X, X,, X ovat ormaalijakautuee satuaismuuttuja X havaittuja arvoja, pisteet (E(Y i ), Z i ), i =,,, asettuvat (satuaisvaihtelua lukuu ottamatta) suoralle. Poikkeamat tästä suorasta viittaavat epäormaalisuutee. Kuviosta voidaa tuistaa: Havaitoarvoje jakauma vious Havaitoarvoje jakauma huipukkuus Poikkeavat havaiot (egl. outliers) Wilki ja Shapiro testisuure o Rakit Plot -kuvio pisteistä (E(Y i ), Z i ), i =,,, lasketu otoskorrelaatiokertoime eliö. Pieet testisuuree arvot viittaavat siihe, että ormaalisuusoletus ei päde. Suuret testisuuree arvot ovat sopusoiussa ormaalisuusoletukse kassa. Testisuuree jakauma o epästadardi, mutta moet tilasto-ohjelmistot osaavat laskea Wilki ja Shapiro testisuuree arvoa vastaavia p-arvoja. Rakit Plot -kuvio ja Wilki ja Shapiro testi: Sovellus Kappaleessa Yhteesopivuude testaamie tarkasteltii seuraavaa esimerkkiä: (i) Koe tekee ruuveja, joide tavoitepituutea o 0 cm. (ii) Ruuvie pituus vaihtelee satuaisesti joki verra. (iii) Ruuvie pituuksie oletetaa kuiteki oudattava ormaalijakaumaa. Tällöi todettii, että havaiot ovat yleise χ -yhteesopivuustesti perusteella sopusoiussa ormaalisuusoletukse kassa. Tarkastellaa ormaalisuusoletusta vielä Rakit Plot -kuvio ja Shapiro ja Wilki testi valossa. Ilkka Melli 3

. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Alla o otoksee poimittuje ruuvie pituuksista piirretty Rakit Plot -kuvio. 0.3 Wilk-Shapiro / Rakit Plot of PITUUS 0. Ordered Data 0.3 0.04 9.95 9.86-3 - - 0 3 Rakits Wilk-Shapiro 0.9779 (p=0.7674) 30 cases Havaitoja vastaavie pisteide poikkeamat suorasta viivasta ovat ii vähäisiä, että ormaalisuusoletusta ei ole mitää syytä asettaa kyseealaiseksi. Rakit Plot -kuvioo liittyvä Wilki ja Shapiro testisuuree arvo o esimerkkiaieisto tapauksessa 0.9779 ja testisuuree arvoa vastaava p-arvo o 0.7674 Site ormaalisuusoletusta ei ole syytä asettaa kyseealaiseksi myöskää Wilki ja Shapiro testi perusteella. Ilkka Melli 3