Tilastolliset menetelmät: Tilastolliset testit

Samankaltaiset tiedostot
Tilastolliset menetelmät: Tilastolliset testit

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Väliestimointi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

2-suuntainen vaihtoehtoinen hypoteesi

Sovellettu todennäköisyyslaskenta B

Harjoitus 7: NCSS - Tilastollinen analyysi

Testit laatueroasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

2-suuntainen vaihtoehtoinen hypoteesi

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

8. laskuharjoituskierros, vko 11, ratkaisut

Mat Tilastollisen analyysin perusteet, kevät 2007

Testejä suhdeasteikollisille muuttujille

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Sovellettu todennäköisyyslaskenta B

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Testit järjestysasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

χ 2 -yhteensopivuustesti

Mat Tilastollisen analyysin perusteet, kevät 2007

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

χ 2 -yhteensopivuustesti

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

tilastotieteen kertaus

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

Sovellettu todennäköisyyslaskenta B

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Estimointi. Vilkkumaa / Kuusinen 1

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1

10. laskuharjoituskierros, vko 14, ratkaisut

Otantajakauman käyttö päättelyssä

Harjoitukset 1 : Tilastokertaus

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Yhden selittäjän lineaarinen regressiomalli

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. β versio. Tilastolliset menetelmät. Ilkka Mellin. Teknillinen korkeakoulu, Matematiikan laboratorio

Tilastolliset menetelmät

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia.

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

n = 100 x = %:n luottamusväli µ:lle Vastaus:

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

11. laskuharjoituskierros, vko 15, ratkaisut

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Sovellettu todennäköisyyslasku. Tilastolliset testit. Avainsanat:

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

6.1 Riippumattomat satunnaismuuttujat

Transkriptio:

Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille 0. Testejä järjestysasteikollisille muuttujille. Testejä laatueroasteikollisille muuttujille. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Ilkka Melli 5

Tilastolliset testit Ilkka Melli 6

Tilastolliset testit Sisällys 8. TILASTOLLINEN TESTAUS 3 8.. TILASTOLLISEN TESTAUKSEN IDEA 3 TILASTOLLISEN TESTAUKSEN LÄHTÖKOHTA 3 SATUNNAISOTOS 3 8.. TILASTOLLISET HYPOTEESIT 33 YLEINEN HYPOTEESI 33 NOLLAHYPOTEESI 33 VAIHTOEHTOINEN HYPOTEESI 34 8.3. TILASTOLLISET TESTIT JA TESTISUUREET 34 TESTI 34 TESTISUURE 34 8.4. VIRHEET TESTAUKSESSA 35 HYLKÄYSVIRHE 35 HYVÄKSYMISVIRHE 35 TESTIN VOIMAKKUUS 35. JA. LAJIN VIRHEET 35 TESTIN TULOS JA MAAILMAN TILAT 36 TESTIN HYLKÄYS- JA HYVÄKSYMISALUEET 36 8.5. MERKITSEVYYSTASO JA TESTIN HYLKÄYSALUE 36 MERKITSEVYYSTASO 36 MERKITSEVYYSTASON FREKVENSSITULKINTA 37 TAVANOMAISET MERKITSEVYYSTASOT 37 HYLKÄYSALUEEN MÄÄRÄÄMINEN YKSIKERTAISISSA TESTAUSASETELMISSA 37 8.6. TESTIN P-ARVO 39 P-ARVO 39 P-ARVON FREKVENSSITULKINTA 39 P-ARVO JA TESTI PÄÄTÖSSÄÄNTÖNÄ 40 P-ARVON MÄÄRÄÄMINEN YKSINKERTAISISSA TESTAUSASETELMISSA 40 8.7. TESTIN SUORITTAMINEN 4 TESTIN SUORITTAMINEN MERKITSEVYYSTASON VALINTAAN PERUSTUVISSA TESTAUSASETELMISSA _ 4 TESTIN SUORITTAMINEN P-ARVON VALINTAAN PERUSTUVISSA TESTAUSASETELMISSA 4 8.8. NORMAALIJAKAUMAN PARAMETREJA KOSKEVAT TESTIT: ESIMERKKI 4 TESTAUSASETELMA 4 HAVAINNOT 43 TESTAUSASETELMAA KOSKEVAT HYPOTEESIT 44 χ -TESTI VARIANSSILLE 45 T-TESTI ODOTUSARVOLLE 48 8.9. TILASTOLLISET TESTIT JA HAVAINTOJEN MITTA-ASTEIKOLLISET OMINAISUUDET 5 9. TESTEJÄ SUHDEASTEIKOLLISILLE MUUTTUJILLE 54 9.. SUHDEASTEIKOLLISTEN MUUTTUJIEN TESTIT 55 9.. YHDEN OTOKSEN T-TESTI ODOTUSARVOLLE 56 TESTAUSASETELMA YHDEN OTOKSEN T-TESTISSÄ 56 HYPOTEESIT YHDEN OTOKSEN T-TESTISSÄ 56 PARAMETRIEN ESTIMOINTI YHDEN OTOKSEN T-TESTISSÄ 56 TESTISUURE JA SEN JAKAUMA YHDEN OTOKSEN T-TESTISSÄ 57 HYLKÄYSALUEEN MÄÄRÄÄMINEN YHDEN OTOKSEN T-TESTISSÄ 58 Ilkka Melli 7

Tilastolliset testit P-ARVON MÄÄRÄÄMINEN YHDEN OTOKSEN T-TESTISSÄ 59 NORMAALISUUSOLETUKSEN MERKITYS YHDEN OTOKSEN T-TESTISSÄ 59 YHDEN OTOKSEN T-TESTIN HYVÄKSYMISVIRHEEN TODENNÄKÖISYYS JA VOIMAKKUUS 60 9.3. KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTI A ODOTUSARVOILLE: YLEINEN TAPAUS 6 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 6 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 63 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 63 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 64 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 65 P-ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 67 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ A 67 9.4. KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTI B ODOTUSARVOILLE: YHTÄ SUURTEN VARIANSSIEN TAPAUS 67 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 67 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 68 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 69 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 69 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 7 P-ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 7 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSEN T-TESTISSÄ B 7 9.5. T-TESTI PARIVERTAILUILLE 7 PARIVERTAILUASETELMA 7 TESTAUSASETELMA T-TESTISSÄ PARIVERTAILUILLE 7 HYPOTEESIT T-TESTISSÄ PARIVERTAILUILLE 7 PARAMETRIEN ESTIMOINTI T-TESTISSÄ PARIVERTAILUILLE 7 TESTISUURE JA SEN JAKAUMA T-TESTISSÄ PARIVERTAILUILLE 73 HYLKÄYSALUEEN MÄÄRÄÄMINEN T-TESTISSÄ PARIVERTAILUILLE 74 P-ARVON MÄÄRÄÄMINEN T-TESTISSÄ PARIVERTAILUILLE 74 NORMAALISUUSOLETUKSEN MERKITYS T-TESTISSÄ PARIVERTAILUILLE 74 9.6. YHDEN OTOKSEN χ -TESTI VARIANSSILLE 74 TESTAUSASETELMA YHDEN OTOKSEN TESTISSÄ VARIANSSILLE 74 HYPOTEESIT YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 75 PARAMETRIEN ESTIMOINTI YHDEN χ -TESTISSÄ VARIANSSILLE 75 TESTISUURE JA SEN JAKAUMA YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 75 HYLKÄYSALUEEN MÄÄRÄÄMINEN YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 76 P-ARVON MÄÄRÄÄMINEN YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 78 NORMAALISUUSOLETUKSEN MERKITYS YHDEN OTOKSEN χ -TESTISSÄ VARIANSSILLE 78 9.7. KAHDEN RIIPPUMATTOMAN OTOKSEN F- TESTI VARIANSSEILLE 78 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 78 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 79 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 80 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 80 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE _ 8 P-ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 8 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSEN F-TESTISSÄ VARIANSSEILLE 83 0. TESTEJÄ JÄRJESTYSASTEIKOLLISILLE MUUTTUJILLE 84 0.. JÄRJESTYSASTEIKOLLISTEN MUUTTUJIEN TESTIT 85 0.. MERKKITESTI 85 TESTISUUREET S JA S + 85 TESTISUUREIDEN S JA S + OMINAISUUDET 86 Ilkka Melli 8

Tilastolliset testit EKSAKTI MERKKITESTI 86 STANDARDOITU MERKKITESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 86 KOMMENTTEJA 87 MERKKITESTI JA PARIVERTAILUASETELMAT 87 0.3. WILCOXONIN RANKITESTI 87 TESTISUUREET W JA W + 88 TESTISUUREIDEN W JA W + OMINAISUUDET 88 EKSAKTI WILCOXONIN RANKITESTI 89 STANDARDOITU W-TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 89 KOMMENTTEJA 90 WILCOXONIN RANKITESTI JA PARIVERTAILUASETELMAT 90 0.4. MANNIN JA WHITNEYN TESTI 90 HYPOTEESIT 9 MANNIN JA WHITNEYN TESTIN IDEA 9 TESTISUURE U MUOTO 9 TESTISUURE U MUOTO 9 TESTISUUREEN U OMINAISUUDET 9 TESTISUURE U MUOTO 9 TESTISUURE U MUOTO 9 TESTISUUREEN U OMINAISUUDET 9 TESTISUUREIDEN U JA U OMINAISUUDET 93 STANDARDOITU U -TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 93 STANDARDOITU U -TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 93 KOMMENTTEJA 94 0.5. WILCOXONIN RANKISUMMATESTI 94 MANNIN JA WHITNEYN TESTI JA WILCOXONIN RANKISUMMATESTI 94 TESTISUURE T 94 TESTISUURE T 94 TESTISUUREIDEN T JA T OMINAISUUDET 94 STANDARDOITU T -TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 95 STANDARDOITU T -TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 95. TESTEJÄ LAATUEROASTEIKOLLISILLE MUUTTUJILLE 96.. LAATUEROASTEIKOLLISTEN MUUTTUJIEN TESTIT 97.. TESTI SUHTEELLISELLE OSUUDELLE 97 TESTAUSASETELMA TESTISSÄ SUHTEELLISELLE OSUUDELLE 97 HYPOTEESIT TESTISSÄ SUHTEELLISELLE OSUUDELLE 98 PARAMETRIEN ESTIMOINTI TESTISSÄ SUHTEELLISELLE OSUUDELLE 98 TESTISUURE JA SEN JAKAUMA TESTISSÄ SUHTEELLISELLE OSUUDELLE 99 HYLKÄYSALUEEN MÄÄRÄÄMINEN TESTISSÄ SUHTEELLISELLE OSUUDELLE 00 P-ARVON MÄÄRÄÄMINEN TESTISSÄ SUHTEELLISELLE OSUUDELLE 0.3. SUHTEELLISTEN OSUUKSIEN VERTAILUTESTI 0 TESTAUSASETELMA SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 0 HYPOTEESIT SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 0 PARAMETRIEN ESTIMOINTI SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 0 TESTISUURE SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 03 HYLKÄYSALUEEN MÄÄRÄÄMINEN SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 05 P-ARVON MÄÄRÄÄMINEN SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 06. YHTEENSOPIVUUDEN, HOMOGEENISUUDEN JA RIIPPUMATTOMUUDEN TESTAAMINEN 07 Ilkka Melli 9

Tilastolliset testit.. JAKAUMAOLETUKSIEN TESTAUS 08.. YHTEENSOPIVUUDEN TESTAAMINEN 08 TESTAUSASETELMA χ -YHTEENSOPIVUUSTESTISSÄ 08 HYPOTEESIT χ -YHTEENSOPIVUUSTESTISSÄ 09 HAVAITUT LUOKKAFREKVENSSIT 09 ODOTETUT LUOKKAFREKVENSSIT 0 TESTISUURE JA SEN JAKAUMA χ -YHTEENSOPIVUUSTESTISSÄ χ -YHTEENSOPIVUUSTESTI: SOVELLUS 3.3. HOMOGEENISUUDEN TESTAAMINEN 7 TESTAUSASETELMA χ -HOMOGEENISUUSTESTISSÄ 7 χ -HOMOGEENISUUSTESTIN SUORITTAMINEN 7 HYPOTEESIT χ -HOMOGEENISUUSTESTISSÄ 8 HAVAITUT FREKVENSSIT 8 NOLLAHYPOTEESIN TULKINTA χ -HOMOGEENISUUSTESTISSÄ 9 ODOTETTUJEN FREKVENSSIEN MÄÄRÄÄMINEN 9 TESTISUURE JA SEN JAKAUMA χ -HOMOGEENISUUSTESTISSÄ.4. RIIPPUMATTOMUUDEN TESTAAMINEN TESTAUSASETELMA χ -RIIPPUMATTOMUUSTESTISSÄ χ -RIIPPUMATTOMUUSTESTIN SUORITTAMINEN 3 HYPOTEESIT χ -RIIPPUMATTOMUUSTESTISSÄ 3 HAVAITUT FREKVENSSIT 3 NOLLAHYPOTEESIN TULKINTA χ -RIIPPUMATTOMUUSTESTISSÄ 4 ODOTETTUJEN FREKVENSSIEN MÄÄRÄÄMINEN 4 TESTISUURE JA SEN JAKAUMA χ -RIIPPUMATTOMUUSTESTISSÄ 6.5. χ -HOMOGEENISUUSTESTI VS χ -RIIPPUMATTOMUUSTESTI 7.6. NORMAALISUUDEN TESTAAMINEN 8 BOWMANIN JA SHENTONIN TESTI NORMAALISUUDELLE 8 TODENNÄKÖISYYSJAKAUMAN VINOUS JA HUIPUKKUUS 8 HAVAINTOJEN JAKAUMAN VINOUS JA HUIPUKKUUS 9 HYPOTEESIT 30 BOWMANIN JA SHENTONIN TESTI 30 RANKIT PLOT -KUVIO SEKÄ WILKIN JA SHAPIRON TESTI NORMAALISUUDELLE 30 RANKIT PLOT -KUVIO JA WILKIN JA SHAPIRON TESTI: SOVELLUS 3 Ilkka Melli 30

8. Tilastollie testaus 8. Tilastollie testaus 8.. Tilastollise testaukse idea 8.. Tilastolliset hypoteesit 8.3. Tilastolliset testit ja testisuureet 8.4. Virheet testauksessa 8.5. Merkitsevyystaso ja testi hylkäysalue 8.6. Testi p-arvo 8.7. Testi suorittamie 8.8. Normaalijakauma parametreja koskevat testit 8.9. Tilastolliset testit ja mitta-asteikot Tilastollisella testauksella tarkoitetaa tutkimukse kohteea olevasta perusjoukosta esitettyje väitteide tai oletuksie asettamista koetteelle ko. perusjoukosta kerätyistä havaioista saatua iformaatiota vastaa. Tällöi perusjoukosta esitetyt väitteet tai oletukset o puettava ko. perusjouko alkioide omiaisuuksie vaihtelua perusjoukossa kuvaavie todeäköisyysjakaumia tai iide parametreja koskeviksi oletuksiksi eli hypoteeseiksi. Tilastollie testi o päätössäätö, joka kertoo oko asetettu hypoteesi hylättävä vai ei havaioista saadu iformaatio valossa. Site tilastollie testi mittaa hypoteesi ja havaitoje yhteesopivuutta. Tarkastelemme tässä luvussa tilastollise testiteoria peruskäsitteitä sekä tarkastelemme esitety teoria havaiollistuksea ormaalijakauma parametreja koskevie hypoteesie testaamista. Avaisaat: Esimmäise laji virhe, Frekvessitulkita, Havaito, Hylkäysalue, Hylkäysvirhe, Hypoteesi, Hyväksymisalue, Hyväksymisvirhe, Järjestysasteikko, χ -jakauma, χ -testi, Kaksisuutaie vaihtoehtoie hypoteesi, Kriittie arvo, Kriittie raja, Laatueroasteikko, Maailma tila, Merkitsevyys, Merkitsevyystaso, Mitta-asteikko, Nollahypoteesi, Normaaliarvo, Normaalijakauma, Odotusarvo, Otatameetelmä, Otos, Parametri, p-arvo, Perusjoukko, Satuaisotos, Suhdeasteikko, t-jakauma, t-testi, Testausasetelma, Testi, Testi tulos, Testisuure, Tilastollie hypoteesi, Tilastolliste hypoteesie testaus, Todeäköisyysjakauma, Toise laji virhe, Vaihtoehtoie hypoteesi, Variassi, Voimakkuus, Välimatka-asteikko, Yksisuutaie vaihtoehtoie hypoteesi, Yleie hypoteesi Ilkka Melli 3

8. Tilastollie testaus 8.. Tilastollise testaukse idea Tilastollise testaukse lähtökohta Lähtökohta: Tutkimukse kohteea olevasta perusjoukosta o esitetty joki väite tai oletus. Kysymys: Mite esitettyä väitettä tai oletusta voidaa testata? Vastaus: Väitettä tai oletusta voidaa testata tilastollisesti, jos väite tai oletus voidaa pukea tutkimukse kohteea oleva perusjouko omiaisuude vaihtelua ko. perusjoukossa kuvaavaa todeäköisyysjakaumaa tai se parametreja koskevaksi oletukseksi eli hypoteesiksi. Olkoo X tutkimukse kohteea oleva perusjouko joki omiaisuude vaihtelua perusjoukossa kuvaava satuaismuuttuja ja olkoo satuaismuuttuja X todeäköisyysjakauma pistetodeäköisyys- tai tiheysfuktio f(x;θ) jossa θ o fuktio f muodo määräävä tutemato parametri. Yksikertaisissa testausasetelmissa kiiostukse kohteea o hypoteesi, joka mukaa parametrilla θ o arvo θ 0. Mite todeäköisyysjakauma f(x;θ) parametria θ koskevaa hypoteesia θ = θ 0 voidaa testata tilastollisesti? Tilastollisessa testauksessa hypoteesi θ = θ 0 asetetaa koetteelle havaitoje todeäköisyysjakaumasta f(x;θ) sisältämää iformaatiota vastaa. Satuaisotos Oletamme jatkossa, että havaiot X, X,, X muodostavat satuaisotokse jakaumasta, joka pistetodeäköisyys- tai tiheysfuktio o f(x;θ) Tällöi X, X,, X ovat riippumattomia, idettisesti jakautueita satuaismuuttujia, joilla o sama pistetodeäköisyys- tai tiheysfuktio f(x;θ): X, X, K, X X f( x; θ ), i =,, K, i Tavoitteeamme o siis testata tilastollisesti muotoa θ = θ 0 olevia parametrisia hypoteeseja. Testi suorittamista varte valitaa testisuure, joka mittaa satuaismuuttujie X, X,, X Ilkka Melli 3

8. Tilastollie testaus havaittuje arvoje x, x,, x ja hypoteesi θ = θ 0 yhteesopivuutta. Hyvä yhteesopivuus merkitsee sitä, että havaiot ovat sopusoiussa oletukse θ = θ 0 kassa ja huoo yhteesopivuus merkitsee sitä, että havaiot ja oletus θ = θ 0 ovat ristiriidassa keskeää. 8.. Tilastolliset hypoteesit Ku todeäköisyysjakauma parametreja koskevia väitteitä tai oletuksia testataa tilastollisesti, testausasetelma kiiittämiseksi o tehtävä kolme oletusta: (i) Testausasetelmaa koskevat perusoletukset, joista pidetää kiii testaukse aikaa, muodostavat testi yleise hypoteesi. (ii) Testattavaa oletusta kutsutaa ollahypoteesiksi. (iii) Vaihtoehtoie hypoteesi o oletus, joka astuu voimaa, jos ollahypoteesi hylätää testissä. Yleie hypoteesi Yleiset testausasetelmaa koskevat oletukset muodostavat testi yleise hypoteesi H. Yleie hypoteesi H sisältää oletukset perusjoukosta otatameetelmästä perusjouko jakaumasta Yleise hypoteesi H oletuksista pidetää kiii koko testi suoritukse aja, mikä merkitsee sitä, että tilastollie testaus tehdää aia ehdollisesti yleise hypoteesi H oletuste suhtee. Huomautus: Yleise hypoteesi sisältämiä jakaumaoletuksia voidaa ja o tavallisesti myös syytä testata eriksee; ks. esimerkiksi lukua Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie. Nollahypoteesi Sitä perusjouko jakauma parametreja koskevaa väitettä tai oletusta, jota halutaa testata kutsutaa ollahypoteesiksi. Nollahypoteesille käytetää tavallisesti merkitää H 0. Testissä ollahypoteesi H 0 asetetaa koetteelle havaitoje perusjouko jakaumasta sisältämää iformaatiota vastaa. Nollahypoteesista H 0 pidetää kiii, elleivät havaitoje sisältämät todisteet ollahypoteesia vastaa ole kylli voimakkaita. Olkoo f(x;θ) tutkimukse kohteea olevaa perusjouko omiaisuutta kuvaava todeäköisyysjakauma pistetodeäköisyys- tai tiheysfuktio. Yksikertaisissa testausasetelmissa ollahypoteesi o muotoa Huomautus: H 0 : θ = θ 0 Ilkka Melli 33

8. Tilastollie testaus Nollahypoteesit ovat yksikertaisissa testausasetelmissa muotoa o sama tai muotoa ei ole eroa. Vaihtoehtoie hypoteesi Vaihtoehtoie hypoteesi H o oletus, joka astuu voimaa, jos ollahypoteesi H 0 hylätää. Ku tilastollista testiä tehdää, toivotaa usei, että ollahypoteesi voidaa hylätä ja vaihtoehtoie hypoteesi hyväksyä. Tämä johtuu siitä, että vaihtoehtoise hypoteesi hyväksymie merkitsee yleesä iformaatio lisäätymistä. Vaihtoehtoie hypoteesi voidaa tavallisesti muotoilla usealla eri tavalla. Jos ollahypoteesi o muotoa o sama tai ei ole eroa, vaihtoehtoie hypoteesi o tavallisesti muotoa ei ole sama tai o eroa. Jos ollahypoteesi o yksikertaista muotoa H 0 : θ = θ 0 vaihtoehtoie hypoteesi voidaa muotoilla seuraavilla kolmella tavalla: (i) H : θ > θ 0 (ii) H : θ < θ 0 (iii) H : θ θ 0 Tapauksissa (i) ja (ii) saomme, että vaihtoehtoie hypoteesi o yksisuutaie. Tapauksessa (iii) saomme, että vaihtoehtoie hypoteesi o kaksisuutaie. Huomautus: Vaihtoehtoise hypoteesi muoto vaikuttaa tavallisesti siihe tapaa, jolla testi suoritetaa. 8.3. Tilastolliset testit ja testisuureet Testi Tilastollie testi o päätössäätö, joka kertoo jokaisessa yksittäisessä testaustilateessa eli jokaiselle otokselle, oko ollahypoteesi H 0 hylättävä vai ei. Testisuure Tilastollie testi perustuu testisuureesee, joka mittaa havaitoje ja ollahypoteesi H 0 yhteesopivuutta. Testisuure o satuaismuuttuja, joka arvo riippuu havaioista ja ollahypoteesista H 0. Havaitoje ja ollahypoteesi H 0 yhteesopivuude mittaamie tarkoittaa sitä, että tutkitaa kuika todeäköistä o saada sellaisia testisuuree arvoja kui o saatu, jos ollahypoteesi H 0 pätee. Tämä vaatii testisuuree jakauma tutemista. Jos havaitoje ja ollahypoteesi H 0 yhteesopivuus o testisuureella mitattua hyvä, ollahypoteesi H 0 jätetää voimaa. Jos havaitoje ja ollahypoteesi H 0 yhteesopivuus o testisuureella mitattua huoo, ollahypoteesi H 0 hylätää ja vaihtoehtoie hypoteesi H hyväksytää. Testisuuree odotusarvoa ollahypoteesi H 0 pätiessä kutsutaa testisuuree ormaaliarvoksi. Jos testisuuree havaittu arvo o lähellä testisuuree ormaaliarvoa, havaiot ovat sopusoiussa ollahypoteesi H 0 kassa. Jos testisuuree otoksesta määrätty arvo poikkeaa merkitsevästi ormaaliarvostaa, havaiot sisältävät todisteita ollahypoteesia H 0 vastaa. Ilkka Melli 34

8. Tilastollie testaus 8.4. Virheet testauksessa Hylkäysvirhe Jos ollahypoteesi H 0 hylätää silloi, ku se o tosi, tehdää hylkäysvirhe. Hylkäysvirhee todeäköisyys α o ehdollie todeäköisyys Pr(H 0 hylätää H 0 o tosi) = α Hylkäysvirhee todeäköisyyde α komplemettitodeäköisyys Pr(H 0 hyväksytää H 0 o tosi) = α o todeäköisyys hyväksyä ollahypoteesi silloi, ku se o tosi. Tilastollisessa tutkimuksessa oudatetaa tietee yleistä varovaisuusperiaatetta: Hypoteeseja ei pidä hylätä ilma riittävä paiavia syitä. Siksi ollahypoteesi H 0 virheellise hylkäykse todeäköisyys halutaa tehdä tilastollisessa testauksessa mahdollisimma pieeksi. Siksi havaioilta vaaditaa vahvoja todisteita ollahypoteesia H 0 vastaa ee kui se suostutaa hylkäämää. Hyväksymisvirhe Jos ollahypoteesi H 0 jätetää voimaa silloi, ku se ei ole tosi, tehdää hyväksymisvirhe. Hyväksymisvirhee todeäköisyys β o ehdollie todeäköisyys Pr(H 0 jätetää voimaa H 0 ei ole tosi) = β Huomautus: Hylkäysvirhee todeäköisyys α ja hyväksymisvirhee todeäköisyys β eivät ole toistesa komplemettitodeäköisyyksiä. Testi voimakkuus Hyväksymisvirhee todeäköisyyde β komplemettitodeäköisyyttä Pr(H 0 hylätää H 0 ei ole tosi) = β kutsutaa testi voimakkuudeksi. Hyvä testi o voimakas, koska voimakkaalla testillä o piei hyväksymisvirhee todeäköisyys β. Testi voimakkuus ( β) riippuu tavallisesti testattava parametri todellisesta arvosta. Testi voimakkuutta testattava parametri arvoje fuktioa kutsutaa voimakkuusfuktioksi; esimerkki: ks. kappaletta Yhde otokse t-testi luvussa Testejä suhdeasteikollisille muuttujille.. ja. laji virheet Koska testiä tehtäessä pyritää esisijaisesti varomaa sitä, että ollahypoteesi H 0 hylätää silloi, ku se o tosi, hylkäysvirhettä kutsutaa usei esimmäise laji virheeksi. Tällöi hyväksymisvirhettä eli sitä, että ollahypoteesi H 0 hyväksytää silloi, ku se ei ole tosi, kutsutaa toise laji virheeksi. Ilkka Melli 35

8. Tilastollie testaus Testi tulos ja maailma tilat Maailma tilat ja testi tulokset voidaa ryhmitellä seuraavaksi eliketäksi: Maailma tila Nollahypoteesi pätee Nollahypoteesi ei päde Testi tulos Nollahypoteesi jää voimaa Nollahypoteesi hylätää Oikea johtopäätös Hylkäysvirhe Hyväksymisvirhe Oikea johtopäätös Testi hylkäys- ja hyväksymisalueet Ku testi formuloidaa päätössäätöä, testiä varte kostruoidu testisuuree mahdolliste arvoje joukko jaetaa kahtee osaa, hylkäysalueesee ja hyväksymisalueesee: (i) Jos testisuuree havaioista määrätty arvo joutuu hylkäysalueelle, ollahypoteesi H 0 hylätää. (ii) Jos testisuuree havaioista määrätty arvo joutuu hyväksymisalueelle, ollahypoteesi H 0 jätetää voimaa. Huomautus: Testisuuree mahdolliste arvoje jouko jako hylkäys- ja hyväksymisalueisii ei saa riippua havaioista. 8.5. Merkitsevyystaso ja testi hylkäysalue Merkitsevyystaso Testi merkitsevyystaso α o todeäköisyys, että testisuuree havaioista määrätty arvo joutuu hylkäysalueelle, jos ollahypoteesi H 0 pätee. Jos testisuuree havaioista määrätty arvo joutuu ollahypoteesi H 0 pätiessä hylkäysalueelle, ollahypoteesi H 0 hylätää virheellisesti. Tämä hylkäysvirhee todeäköisyys o α. Tavallisesti testi hylkäysalue määrätää kiiittämällä testissä käytettävä merkitsevyystaso α etukätee so. jo ee havaitoje keräämistä; ks. kappaletta Esimerkki: Normaalijakauma parametrie testaamie. Ilkka Melli 36

8. Tilastollie testaus Merkitsevyystaso frekvessitulkita Oletetaa, että yleise hypoteesi H lisäksi myös ollahypoteesi H 0 pätee ja että olemme valieet testi merkitsevyystasoksi luvu α. Toistetaa otataa ja sovelletaa jokaisee otoksee samaa testiä. Tällöi joudumme virheellisesti hylkäämää ollahypoteesi H 0 keskimääri α %:ssa otoksia, vaikka ollahypoteesi H 0 koko aja pätee. Tavaomaiset merkitsevyystasot Koska testeissä halutaa esisijaisesti suojautua hylkäysvirhettä vastaa, testi merkitsevyystasoksi α o tapaa valita pieiä lukuja. Ns. tavaomaiset merkitsevyystasot ovat α = 0.05 α = 0.0 (i) (ii) α = 0.00 Jos ollahypoteesi H 0 voidaa hylätä merkitsevyystasolla α = 0.05, saotaa: Testisuuree arvo (tai testi tulos) o melkei merkitsevä. Jos ollahypoteesi H 0 voidaa hylätä merkitsevyystasolla α = 0.0, saotaa: Testisuuree arvo (tai testi tulos) o merkitsevä. (iii) Jos ollahypoteesi H 0 voidaa hylätä merkitsevyystasolla α = 0.00, saotaa: Testisuuree arvo (tai testi tulos) o erittäi merkitsevä. Merkitsevyystasoa α valittaessa o aia syytä ottaa huomioo väärä päätökse seuraukset. Hylkäysaluee määräämie yksikertaisissa testausasetelmissa Testi hylkäysalue riippuu yksikertaisissa testausasetelmissa paitsi valitusta merkitsevyystasosta α myös vaihtoehtoise hypoteesi muodosta. Olkoo parametria θ koskeva ollahypoteesi yksikertaista muotoa H 0 : θ = θ 0 Valitaa testi merkitsevyystasoksi α ja oletetaa, että testisuureea o (jatkuva) satuaismuuttuja Z. Tehdää testisuureesta Z seuraavat oletukset: () Testisuuree Z mahdolliset arvot kuuluvat välii (a,b), jossa voi olla a = ja/tai b = +. (a) Testisuureella Z o taipumus saada suuria arvoja, jos θ > θ 0 (b) Testisuureella Z o taipumus saada pieiä arvoja, jos θ < θ 0 Huomautus: Oletukset a-b pätevät kaikille testisuureille tässä esityksessä. Ilkka Melli 37

8. Tilastollie testaus Tarkastellaa testi hylkäysaluee määräämistä erilaiste vaihtoehtoiste hypoteesie tapauksissa. (i) Jos vaihtoehtoisea hypoteesia o yksisuutaie Testisuuree tiheysfuktio vaihtoehto H : θ > θ 0 ii testi hylkäysalue o muotoa (u, b) jossa kriittie arvo tai raja u määrätää site, että Pr(Z u H 0 ) = α Ks. kuvaa oikealla. α u α Hyväksymisalue Hylkäysalue (ii) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ < θ 0 ii testi hylkäysalue o muotoa (a, l) jossa kriittie arvo tai raja l määrätää site, että Pr(Z l H 0 ) = α Ks. kuvaa oikealla. α l α Hylkäysalue Hyväksymisalue (iii) Jos vaihtoehtoisea hypoteesia o kaksisuutaie vaihtoehto H : θ θ 0 ii testi hylkäysalue o muotoa (a, l) (u, b) jossa kriittiset arvot tai rajat l ja u määrätää site, että Pr(Z u H 0 ) = Pr(Z l H 0 ) = α/ Ks. kuvaa oikealla. Testisuuree tiheysfuktio α/ α/ α l u Hylkäysalue Hyväksymisalue Hylkäysalue Ilkka Melli 38

8. Tilastollie testaus Jos testisuuree Z jakauma o symmetrie origo suhtee, ii edellä esitetyille kriittisille arvoille pätee: l = u Huomautus: Todeäköisyydet kohdissa (i)-(iii) ovat ehdollisia todeäköisyyksiä, joissa ehtotapahtumaa o se, että ollahypoteesi H 0 pätee. Todeäköisyydet määrätää testisuuree Z jakaumasta. Jakaumaa määrättäessä oletetaa, että ollahypoteesi H 0 pätee. 8.6. Testi p-arvo p-arvo Nollahypoteesi hylkäämie voidaa perustaa etukätee valitu merkitsevyystaso ja sitä vastaava hylkäysaluee määräämise sijasta testi p-arvoo. Testi p-arvo o piei merkitsevyystaso, jolla ollahypoteesi H 0 voidaa hylätä. Nykyiset tilastolliset ohjelmistot tulostavat lähes aia testie p-arvot ja siksi p-arvoje käyttö o lähes kokoaa syrjäyttäyt etukätee valittuje kiiteide merkitsevyystasoje käytö. Testi p-arvo määrätää seuraavalla tavalla: (i) Lasketaa valitu testisuuree arvo havaioista. (ii) Määrätää olettae, että ollahypoteesi H 0 pätee todeäköisyys sille, että testisuure saa (ormaaliarvoosa verrattua) ii poikkeuksellise arvo kui se o saaut tai vielä poikkeuksellisempia arvoja. Jos testi p-arvoksi saadaa piei luku, testisuure o saaut arvo, joka kuuluu ollahypoteesi H 0 pätiessä epätodeäköiste testisuuree arvoje joukkoo. Site ollahypoteesi voidaa hylätä, jos testi p-arvo o kylli piei. Mitä pieempi o testi p-arvo, sitä vahvempia todisteita havaiot sisältävät ollahypoteesia H 0 vastaa. Huomautus: Testi p-arvo määrätää testisuuree Z jakaumasta. Jakaumaa määrättäessä oletetaa, että ollahypoteesi H 0 pätee. p-arvo frekvessitulkita Oletetaa, että yleise hypoteesi H lisäksi myös ollahypoteesi H 0 pätee testausasetelmassa. Toistetaa otataa ja sovelletaa jokaisee otoksee samaa testiä. Tällöi havaitsemme keskimääri p %:ssa poimittuja otoksia havaittua testisuuree arvoa poikkeavamma testisuuree arvo. Ilkka Melli 39

8. Tilastollie testaus p-arvo ja testi päätössäätöä Tilastollie testi eli päätössäätö, joka kertoo jokaisessa yksittäisessä tilateessa eli jokaiselle otokselle, oko ollahypoteesi H 0 hylättävä vai ei, voidaa perustaa seuraavalla tavalla testi p- arvoo: (i) Valitaa piei todeäköisyys p 0. (ii) Määrätää testi p-arvo. Jos p < p 0, hylätää ollahypoteesi H 0 ja hyväksytää vaihtoehtoie hypoteesi H. Jos p p 0, jätetää ollahypoteesi H 0 voimaa. Todeäköisyyttä p 0 valittaessa o aia syytä ottaa huomioo väärä päätökse seuraukset. p-arvo määräämie yksikertaisissa testausasetelmissa Testi p-arvo riippuu yksikertaisissa testausasetelmissa vaihtoehtoise hypoteesi muodosta. Olkoo parametria θ koskeva ollahypoteesi yksikertaista muotoa H 0 : θ = θ 0 Oletetaa, että testisuureea o (jatkuva) satuaismuuttuja Z. Oletetaa yksikertaisuude vuoksi, että testisuuree jakauma o symmetrie origo suhtee. Tehdää testisuureesta Z lisäksi seuraavat oletukset: () Testisuuree Z mahdolliset arvot kuuluvat välii (a,b), jossa voi olla a = ja b = +. (a) Testisuureella Z o taipumus saada suuria arvoja, jos θ > θ 0 (b) Testisuureella Z o taipumus saada pieiä arvoja, jos Huomautus: θ < θ 0 Oletukset a-b pätevät kaikille testisuureille tässä esityksessä. Oletetaa, että testisuuree Z havaioista määrätty arvo o z. Tarkastellaa testi p-arvo määräämistä erilaiste vaihtoehtoiste hypoteesie tapauksissa. (i) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ > θ 0 ii testi p-arvo o p = Pr(Z z H 0 ) Ks. kuvaa oikealla. p p 0 z Ilkka Melli 40

8. Tilastollie testaus (ii) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ < θ 0 ii testi p-arvo o p = Pr(Z z H 0 ) Ks. kuvaa oikealla. p p z 0 (iii) Jos vaihtoehtoisea hypoteesia o kaksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ θ 0 ii testi p-arvo o p = Pr(Z z H 0 ) Ks. kuvaa oikealla. p p p z 0 + z Huomautus: Todeäköisyydet kohdissa (i)-(iii) ovat ehdollisia todeäköisyyksiä, joissa ehtotapahtumaa o se, että ollahypoteesi H 0 pätee. Todeäköisyydet määrätää testisuuree Z jakaumasta. Jakaumaa määrättäessä oletetaa, että ollahypoteesi H 0 pätee. 8.7. Testi suorittamie Testi suorittamie merkitsevyystaso valitaa perustuvissa testausasetelmissa Jos testi perustuu merkitsevyystaso valitaa, testi suorittamisessa o seuraavat vaiheet: () Asetetaa testi hypoteesit: Yleie hypoteesi H Testaukse kohteea oleva ollahypoteesi H 0 Vaihtoehtoie hypoteesi H () Valitaa testiä varte testisuure. Testisuuree tehtävää o mitata havaitoje ja ollahypoteesi H 0 yhteesopivuutta. (3) Valitaa merkitsevyystaso α ja kostruoidaa testille sitä vastaava hylkäysalue. (4) Poimitaa otos ii, että yleise hypoteesi H oletukset pätevät. Ilkka Melli 4

8. Tilastollie testaus Jos havaitoje sisältämät todisteet ollahypoteesia H 0 vastaa ovat testisuureella mitattua kylli vahvoja, ollahypoteesi H 0 hylätää ja vaihtoehtoie hypoteesi H hyväksytää. (5) Määrätää valitu testisuuree arvo havaioista. (6) Tehdää päätös ollahypoteesi hylkäämisestä. Jos testisuuree arvo joutuu hylkäysalueelle, hylätää ollahypoteesi H 0 ja hyväksytää vaihtoehtoie hypoteesi H. Jos testisuuree arvo jää hyväksymisalueelle, jätetää ollahypoteesi H 0 voimaa. Testi suorittamie p-arvo valitaa perustuvissa testausasetelmissa Jos testi perustetaa testisuuree arvoa vastaavii p-arvoihi, testi suorittamisessa o seuraavat vaiheet: () Asetetaa testi hypoteesit: Yleie hypoteesi H Testaukse kohteea oleva ollahypoteesi H 0 Vaihtoehtoie hypoteesi H () Valitaa testiä varte testisuure. Testisuuree tehtävää o mitata havaitoje ja ollahypoteesi H 0 yhteesopivuutta. (3) Poimitaa otos ii, että yleise hypoteesi H oletukset pätevät. Jos havaitoje sisältämät todisteet ollahypoteesia H 0 vastaa ovat testisuureella mitattua kylli vahvoja, ollahypoteesi H 0 hylätää ja vaihtoehtoie hypoteesi H hyväksytää. (4) Määrätää valitu testisuuree arvo havaioista. (5) Määrätää testisuuree havaittua arvoa vastaava p-arvo. (6) Tehdää päätös ollahypoteesi hylkäämisestä. Jos testi p-arvo o kylli piei, hylätää ollahypoteesi H 0 ja hyväksytää vaihtoehtoie hypoteesi H. Jos testi p-arvo ei ole kylli piei, jätetää ollahypoteesi H 0 voimaa. 8.8. Normaalijakauma parametreja koskevat testit: Esimerkki Esitämme tässä kappaleessa testiteoria havaiollistuksea testit ormaalijakauma odotusarvolle ja variassille yksikertaise laaduvalvotaa koskeva esimerki tapauksessa. Normaalijakauma parametreja koskevia testejä käsitellää tarkemmi kappaleessa Testejä suhdeasteikollisille muuttujille. Testausasetelma Koe tekee ruuveja, joide tavoitepituutea o 0 cm, mutta ruuvie pituus vaihtelee joki verra satuaisesti. Ruuvit tehdää eriä. Valmistuserää pidetää myytikelpoisea, jos erä ruuvie pituudet eivät vaihtele liia paljo ja ruuvit ovat keskimääri oikea mittaisia: Ilkka Melli 4

8. Tilastollie testaus Ruuvie pituuksie variassi ei saa ylittää tilastollisesti merkitsevästi arvoa 0.0 cm ja ruuvie keskipituus ei saa poiketa tilastollisesti merkitsevästi pituude tavoitearvostaa 0 cm. Ruuvie pituutta valvotaa seuraavalla tavalla: (i) Poimitaa jokaisesta valmistuserästä joukko ruuveja tutkittavaksi satuaisotataa käyttäe. (ii) Mitataa otoksee poimittuje ruuvie pituudet. (iii) Verrataa otoksee poimittuje ruuvie pituuksie otosvariassia arvoo 0.0 cm ja pituuksie aritmeettista keskiarvoa ruuvie tavoitepituutee 0 cm. (v) Jos otoksee poimittuje ruuvie pituuksie variassi o liia suuri tai pituuksie aritmeettie keskiarvo poikkeaa pituude tavoitearvosta liia paljo, ii koko valmistuserä hylätää. Katsomme seuraavassa, mite ruuvie pituude valvoassa käytetää hyväksi tilastollista testausta, ku oletamme, ruuvie pituude vaihtelua voidaa kuvata ormaalijakaumalla. Havaiot Oletetaa, että erää valmistuserä ruuvie joukosta o poimittu satuaisotos, joka koko o = 30 ja otoksee poimittuje ruuvie pituudet o mitattu. Otosta kuvaavat seuraavat tuusluvut: Pituuksie aritmeettie keskiarvo o X = 0.09 cm ja pituuksie otoskeskihajota o s = 0.038 cm Huomautus: Samaa aieistoa o tarkasteltu myös luvuissa Tilastolliste aieistoje kuvaamie ja Väliestimoiti. Taulukko oikealla esittää otoksee poimittuje ruuvie pituuksie luokiteltua frekvessijakaumaa. Kuva oikealla esittää otoksee poimittuje ruuvie pituuksie luokiteltua frekvessijakaumaa vastaavaa histogrammia. Luokkavälit määräävät kuvio suorakaiteide kaat ja suorakaiteide korkeudet o valittu ii, että suorakaiteide pita-alat vastaavat luokkafrekvessejä. Luokkavälit Luokkafrekvessit (9.85,9.90] (9.90,9.95] (9.95,0.00] 6 (0.00,0.05] 3 (0.05,0.0] 5 (0.0,0.5] 4 (0.5,0.0] 5 (0.0,0.5] 3 (0.5,0.30] Frekvessi 7 6 5 4 3 0 Ruuvie pituuksie luokiteltu frekvessijakauma 9.8 9.9 0.0 0. 0. 0.3 0.4 Pituus (cm) Ilkka Melli 43

8. Tilastollie testaus Huomautus: Jos otataa toistetaa, kaikki otosta koskevat tiedot (sekä havaitoarvot että iistä määrätyt otossuureet kute aritmeettiset keskiarvot ja otoskeskihajoat sekä havaitoarvoje jakaumaa kuvaavat graafiset esitykset kute histogrammit) vaihtelevat satuaisesti otoksesta toisee. Ogelma: Oko otosiformaatio sopusoiussa ruuvie pituude variassille ja odotusarvolle asetettuje tavoitearvoje kassa? Ratkaisu: Kostruoidaa otosiformaatio ja ruuvie pituude variassi ja odotusarvo tavoitearvoille yhteesopivuude tutkimista varte tarkoituksee sopivat tilastolliset testit. Testausasetelmaa koskevat hypoteesit Määritellää satuaismuuttuja X: Yleie hypoteesi H : X = ruuvi pituus Otoksee poimittuje ruuvie pituudet eivät riipu toisistaa ja ruuvie pituudet vaihtelevat satuaisesti oudattae ormaalijakaumaa: X, X,, X X i ~ N(μ, σ ), i =,,, Pidämme testaukse aikaa kiii yleisestä hypoteesista H. Nollahypoteesi H 0 : Ruuvie pituuksie variassi o korkeitaa 0.0 cm : H 0 : σ σ 0 = 0.0 cm Vaihtoehtoie hypoteesi H : Ruuvie pituuksie variassi o suurempi kui 0.0 cm : H : σ > σ 0 = 0.0 cm Ruuvie pituuksie variassia koskevaa ollahypoteesia H 0 voidaa testata s. χ -testillä; testi suoritus: ks. ko. kohtaa alla. Nollahypoteesi H 0 : Ruuvie pituuksie odotusarvo yhtyy tavoitearvoosa 0 cm: H 0 : μ = μ0 = 0 cm Vaihtoehtoie hypoteesi H : Ruuvie pituuksie odotusarvo poikkeaa pituude tavoitearvosta 0 cm: H : μ μ0 = 0 cm Ruuvie pituuksie odotusarvoa koskevaa ollahypoteesia H 0 voidaa testata s. t-testillä: testi suoritus: ks. ko. kohtaa alla. Ilkka Melli 44

8. Tilastollie testaus χ -testi variassille Yleie hypoteesi H : Otoksee poimittuje ruuvie pituudet eivät riipu toisistaa ja ruuvie pituudet vaihtelevat satuaisesti oudattae ormaalijakaumaa: Nollahypoteesi H 0 : X, X,, X X i ~ N(μ, σ ), i =,,, Ruuvie pituuksie variassi o korkeitaa 0.0 cm : H 0 : σ σ 0 = 0.0 cm Vaihtoehtoie hypoteesi H : Ruuvie pituuksie variassi o suurempi kui 0.0 cm : H : σ > σ 0 = 0.0 cm Käytetää testisuureea χ -testisuuretta jossa ( ) s χ = σ 0 s X X = ( i ) i= o havaitoje (harhato) otosvariassi ja σ 0 o ollahypoteesi H 0 kiiittämä parametri σ arvo. Voidaa osoittaa, että testisuure χ oudattaa χ -jakaumaa vapaustei ( ), jos yleie hypoteesi H ja ehto σ = σ 0 pätevät (ks. lukua Otokset ja otosjakaumat): χ χ ( ) Esimerki tapauksessa otoksee poimittuje ruuvie pituuksie aritmeettie keskiarvo oli X = 0.09 cm otoksee poimittuje ruuvie pituuksie otoskeskihajota oli s = 0.038 cm ja ollahypoteesi H 0 kiiittämä parametri σ arvo oli σ 0 = 0.0 cm Ilkka Melli 45

8. Tilastollie testaus Site χ -testisuuree arvoksi saadaa ( ) s (30 ) 0.038 χ = = = 3.46 σ 0.0 0 Voidaa osoittaa, että ym. χ -testisuuree ormaaliarvo eli testisuuree odotusarvo o ehdo pätiessä σ = σ 0 E( χ σ = σ ) = 0 χ -testisuuree ormaaliarvoosa ( ) verrattua suuret ja pieet arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Valitaa merkitsevyystasoksi α = 0.05 Koska vaihtoehtoie hypoteesi H : σ > σ 0 = 0.0 cm o yksisuutaie, hylkäysaluee määräämistä varte valitaa kriittie arvo tai raja χ α site, että Pr( χ χα ) = α = 0.05 jossa satuaismuuttuja χ oudattaa χ -jakaumaa vapausastei ( ) = 9. Kriittie arvo χ α toteuttaa ehdo χ Pr( χ χ ) = α = 0.95 (9)-jakauma tiheysfuktio χ -jakauma taulukoista ähdää, että Pr(χ 4.557) = 0.05 ku vapausasteide lukumäärä ( ) = 9. Site kriittiseksi arvoksi saadaa χ α = 4.557 Kuvio oikealla havaiollistaa kriittise arvo määräämistä. χ -testi hylkäysalueeksi tulee tässä väli ( χ α, + ) α Jos χ -testisuuree arvo joutuu hylkäysalueelle, ollahypoteesi H 0 : σ σ 0 hylätää merkitsevyystasolla α = 0.05. Todeäköisyys, että χ -testisuuree arvo joutuu ehdo σ = σ 0 0.07 0.06 0.05 0.04 0.03 0.0 0.0 0 0.95 4.557 0.05 Ilkka Melli 46

8. Tilastollie testaus pätiessä hylkäysalueelle o α = 0.05. χ -testi hyväksymisalue o muotoa [0, χ α ] Jos χ -testisuuree arvo joutuu hyväksymisalueelle, ollahypoteesi H 0 : σ σ 0 jätetää voimaa merkitsevyystasolla α. χ 3 -testi hylkäys- ja hyväksymisalueita voidaa kuvata yksisuutaise vaihtoehtoise hypoteesi H : σ > σ 0 tapauksessa alla olevalla kuviolla: 0 χ α Hyväksymisalue Hylkäysalue Kriittie arvo χ α määrätää site, että jolloi Pr( α ) χ χ = α Pr( α ) χ χ = α Esimerki tapauksessa χ -testi hylkäys- ja hyväksymisalueet saavat seuraava muodo: 0 4.557 Hyväksymisalue Hylkäysalue Kriittie arvo 4.557 o siis määrätty site, että jolloi Pr( χ 4.557) = 0.05 Pr( χ 4.557) = 0.95 Ilkka Melli 47

8. Tilastollie testaus Esimerki tapauksessa otoksesta määrätty χ -testisuuree arvo o pieempi kui kriittie arvo χ α : χ = 3.46 < 4.557 = χ α Site testisuuree arvo o joutuut hyväksymisalueelle ja voimme jättää ollahypoteesi H 0 : σ σ 0 = 0.0 cm voimaa merkitsevyystasolla α = 0.05. Johtopäätös: Ruuvie pituude variassi ei ole tilastollisesti merkitsevästi arvoa 0.0 cm suurempi. Oletetaa, että ruuveja tekevä koe toimii ii, että ruuvie pituude variassi o jatkuvasti hyväksyttävä suuruista. Tällöi siis ollahypoteesi H 0 : σ σ 0 = 0.0 cm pätee koko aja. Oletetaa yt, että poimimme koee tekemie ruuvie joukosta toistuvasti uusia otoksia ja testaamme jokaise otokse perusteella ollahypoteesia H 0 käyttämällä merkitsevyystasoa lukua α = 0.05 Tällöi joudumme hylkäämää ollahypoteesi H 0 keskimääri 5 kertaa 00:sta, vaikka ollahypoteesi H 0 pätee koko aja. Esimerki tapauksessa otoksesta määrättyä χ -testisuuree arvoa 3.70 vastaava p-arvo o χ - jakauma taulukoide mukaa p = Pr(χ > 3.70) > 0. Tämä merkitsee sitä, että χ -testisuure saa ormaaliarvoosa ( ) = 9 ähde arvoa 3.70 poikkeuksellisempia arvoja todeäköisyydellä, joka o suurempi kui 0., jos ollahypoteesi H 0 : σ σ 0 = 0.0 cm pätee. Site emme voi hylätä ollahypoteesia H 0 millää tavaomaisella merkitsevyystasolla. Tulos o sopusoiussa merkitsevyystasoa käyttävä tekiika avulla saadu tulokse kassa. t-testi odotusarvolle Yleie hypoteesi H : Otoksee poimittuje ruuvie pituudet eivät riipu toisistaa ja ruuvie pituudet vaihtelevat satuaisesti oudattae ormaalijakaumaa: X, X,, X X i ~ N(μ, σ ), i =,,, Nollahypoteesi H 0 : Ruuvie pituuksie odotusarvo yhtyy tavoitearvoosa 0 cm: H 0 : μ = μ0 = 0 cm Ilkka Melli 48

8. Tilastollie testaus Vaihtoehtoie hypoteesi H : Ruuvie pituuksie odotusarvo poikkeaa pituude tavoitearvosta 0 cm: H : μ μ0 = 0 cm Käytetää testisuureea t-testisuuretta X μ0 t = s/ jossa X X i i = = o havaitoje aritmeettie keskiarvo, s = ( Xi X) i= o havaitoje (harhato) otosvariassi ja μ 0 ollahypoteesi H 0 kiiittämä odotusarvoparametri μ arvo. Voidaa osoittaa, että testisuure t oudattaa t-jakaumaa vapaustei ( ), jos yleie hypoteesi H ja ollahypoteesi H 0 : μ = μ0 pätevät (ks. lukua Otokset ja otosjakaumat): t t( ) t-testisuure mittaa havaitoje aritmeettise keskiarvo X ja ollahypoteesi H 0 kiiittämä odotusarvoparametri μ arvo μ 0 tilastollista etäisyyttä, jossa mittayksikköä o aritmeettise keskiarvo X keskivirhee σ / estimaattori s/. Esimerki tapauksessa otoksee poimittuje ruuvie pituuksie aritmeettie keskiarvo oli X = 0.09 cm otoksee poimittuje ruuvie pituuksie otoskeskihajota oli s = 0.038 cm ja ollahypoteesi H 0 kiiittämä parametri μ arvo oli μ 0 = 0 cm Site testisuuree t arvoksi saadaa X μ0 0.09 0 t = = = 4.749 s/ 0.038/ 30 Voidaa osoittaa, että edellä määritelly t-testisuuree ormaaliarvo eli testisuuree odotusarvo o ollahypoteesi H 0 : μ = μ0 Ilkka Melli 49

8. Tilastollie testaus pätiessä E(t H 0 ) = 0 t-testisuuree itseisarvoltaa suuret arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Huomautus: Testisuuree t jakauma o symmetrie origo suhtee. Valitaa merkitsevyystasoksi α = 0.05 Koska vaihtoehtoie hypoteesi H : μ μ0 = 0 cm o kaksisuutaie, hylkäysaluee määräämistä varte valitaa kriittiset arvot t α/ ja +t α/ site, että Pr( t t ) = Pr( t + t ) = 0.05 α/ α/ jossa satuaismuuttuja t oudattaa t-jakaumaa vapausastei ( ) = 9. Kriittiset arvot t α/ ja +t α/ toteuttavat ehdo Pr( t t + t ) = = 0.95 α/ α/ α Huomaa, että merkitsevyystasoo α liittyvät kriittiset arvot ovat tässä (kaksisuutaise vaihtoehtoise hypoteesi) tapauksessa täsmällee samat kui luottamustasoo ( α) liittyvät luottamus-kertoimet; ks. lukua Väliestimoiti. t-jakauma taulukoista ähdää, että Pr(t +.045) = 0.05 Pr(t.045) = 0.05 ku vapausasteide lukumäärä ( ) = 9. Site kriittiset arvot ovat: +t α/ = +.045 t α/ =.045 Kuvio oikealla havaiollistaa kriittiste rajoje määräämistä. t-testi hylkäysalue o muotoa (, t ) ( + t, + ) α/ α/ Jos t-testisuuree arvo joutuu hylkäysalueelle, ollahypoteesi H 0 : μ = μ0 hylätää merkitsevyystasolla α. Todeäköisyys, että t-testisuuree arvo joutuu ollahypoteesi H 0 pätiessä hylkäysalueelle o α. 0.5 0.4 0.3 0. 0. 0 t(9)-jakauma tiheysfuktio 0.05 0.95 0.05.045 0 +.045 Ilkka Melli 50

8. Tilastollie testaus t-testi hyväksymisalue o muotoa [ t, + t ] α/ α/ Jos t-testisuuree arvo joutuu hyväksymisalueelle, ollahypoteesi H 0 : μ = μ0 jätetää voimaa merkitsevyystasolla α. t-testi hylkäys- ja hyväksymisalueita voidaa kuvata kaksisuutaise vaihtoehtoise hypoteesi tapauksessa alla olevalla kaaviolla: 0 t α / +t α / Hylkäysalue Hyväksymisalue Hylkäysalue Kriittiset arvot t α/ ja +t α/ määrätää site, että jolloi Pr( t t ) = Pr( t + t ) = / α/ α/ α Pr( t t + t ) = α/ α/ α Esimerki tapauksessa t-testi hylkäys- ja hyväksymisalueet saavat seuraava muodo:.045 0 +.045 Hylkäysalue Hyväksymisalue Hylkäysalue Kriittiset arvot.045 ja +.045 o siis määrätty site, että Pr( t.045) = Pr( t +.045) = 0.05 jolloi Pr(.045 t +.045) = 0.95 Esimerki tapauksessa otoksesta määrätty t-testisuuree arvo o suurempi kui kriittie arvo +t α/ : t = 4.749 >.045 = +t 0.05 Ilkka Melli 5

8. Tilastollie testaus Koska testisuuree arvo o joutuut hylkäysalueelle, hylkäämme ollahypoteesi H 0 : μ = μ0 = 0 cm ja hyväksymme vaihtoehtoise hypoteesi H : μ μ0 = 0 cm merkitsevyystasolla α = 0.05. Johtopäätös: Ruuvie keskimääräie pituus poikkeaa tilastollisesti merkitsevästi tavoitearvostaa 0 cm. Saattaa olla syytä pysäyttää ruuveja valmistava koe tarkistusta varte. Oletetaa, että ruuveja tekevä koe toimii ii, että ruuvie pituude odotusarvo o jatkuvasti hyväksyttävä suuruie. Tällöi siis ollahypoteesi H 0 : μ = μ0 = 0 cm pätee koko aja. Oletetaa yt, että poimimme koee tekemie ruuvie joukosta toistuvasti uusia otoksia ja testaamme jokaise otokse perusteella ollahypoteesia H 0 käyttämällä merkitsevyystasoa lukua α = 0.05 Tällöi joudumme hylkäämää ollahypoteesi H 0 keskimääri 5 kertaa 00:sta, vaikka ollahypoteesi H 0 pätee koko aja. Esimerki tapauksessa otoksesta määrätty t-testisuuree arvoa 4.749 vastaava p-arvo o t- jakauma taulukoide mukaa p = Pr(t > 4.749 ) < 0.0005 = 0.00 Tämä merkitsee sitä, että t-testisuure saa ormaaliarvoosa 0 ähde arvoa 4.749 poikkeuksellisempia arvoja todeäköisyydellä, joka o pieempi kui 0.00, jos ollahypoteesi H 0 : μ = μ0 = 0 cm pätee. Site voimme hylätä ollahypoteesi H 0 kaikilla tavaomaisilla merkitsevyystasoilla. Tulos o sopusoiussa merkitsevyystasoa käyttävä tekiika avulla saadu tulokse kassa. 8.9. Tilastolliset testit ja havaitoje mitta-asteikolliset omiaisuudet Havaitoje mitta-asteikolliset omiaisuudet ohjaavat testi valitaa; lisätietoja mitta-asteikoista: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Tilastolliset testit voidaa ryhmitellä havaitoje mitta-asteikolliste omiaisuuksie suhtee seuraavalla tavalla: Testit suhde- tai välimatka-asteikollisille muuttujille Testit järjestysasteikollisille muuttujille Testit laatueroasteikollisille muuttujille Ilkka Melli 5

8. Tilastollie testaus Seuraavissa kolmessa luvussa tarkastellaa suurta joukkoa erilaisia testejä. Tarkasteltavat testit ovat seuraavat: Testejä suhde- tai välimatka-asteikollisille muuttujille: Yhde otokse t-testi ormaalijakauma odotusarvolle Kahde riippumattoma otokse t-testi ormaalijakaumie odotusarvoille: Yleie tapaus Kahde riippumattoma otokse t-testi ormaalijakaumie odotusarvoille: Yhtä suurte variassie tapaus t-testi parivertailuille Yhde otokse testi ormaalijakauma variassille Kahde riippumattoma otokse testi ormaalijakauma variasseille Ks. lukua Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille: Merkkitesti Wilcoxoi rakitesti Mai ja Whitey testi eli Wilcoxoi rakisummatesti Ks. lukua Testejä järjestysasteikollisille muuttujille. Testejä laatueroasteikollisille muuttujille: Testi suhteelliselle osuudelle Suhteelliste osuuksie vertailutesti Ks. lukua Testejä laatueroasteikollisille muuttujille. Ilkka Melli 53

9. Testejä suhdeasteikollisille muuttujille 9. Testejä suhdeasteikollisille muuttujille 9.. Testit ormaalijakauma parametreille 9.. Yhde otokse t-testi odotusarvolle 9.3. Kahde riippumattoma otokse t-testi odotusarvoille: Yleie tapaus 9.4. Kahde riippumattoma otokse t-testi odotusarvoille: Yhtä suurte variassie tapaus 9.5. t-testi parivertailuille 9.6. Yhde otokse χ -testi variassille 9.7. Kahde riippumattoma otokse F-testi variasseille Tarkastelemme tässä luvussa yhde otokse ja kahde otokse testejä ormaalijakauma odotusarvolle ja variassille. Testejä ormaalijakauma odotusarvolle voidaa soveltaa myös moissa sellaisissa tilateissa, joissa havaiot eivät oudata ormaalijakaumaa. Site testejä ormaalijakauma odotusarvolle voidaa pitää yleisiä testeiä suhde- (tai välimatka-) asteikolliste satuaismuuttujie odotusarvolle. Se sijaa testejä ormaalijakauma variassille ei pidä soveltaa, jos havaitoje jakauma poikkeaa vähäki eemmä ormaalijakaumasta. Avaisaat: Aritmeettie keskiarvo, Asymptoottie testi, F-jakauma, F-testi, Hylkäysalue, Hylkäysvirhe, Hyväksymisalue, Hyväksymisvirhe, χ -jakauma, χ -testi, Kahde otokse testi, Kriittie arvo, Merkitsevyystaso, Nollahypoteesi, Normaaliarvo, Normaalijakauma, Odotusarvo, Otos, Otoskeskihajota, Otosvariassi, p-arvo, Parametri, Parivertailu, Riippumattomat otokset, Sovitettu pari, Stadardipoikkeama, Suhdeasteikko, t-jakauma, t-testi, Testisuure, Todeäköisyysjakauma, Vaihtoehtoie hypoteesi, Variassi, Vertailutesti, Voimakkuus, Välimatka-asteikko, Yhde otokse testi, Yleie hypoteesi Ilkka Melli 54

9. Testejä suhdeasteikollisille muuttujille 9.. Suhdeasteikolliste muuttujie testit Normaalijakauma o tilastotietee tärkei jakauma. Oletetaa, että satuaismuuttuja X oudattaa ormaalijakaumaa parametrei μ ja σ : X N( μ, σ ) Parametri μ o ormaalijakauma odotusarvo ja parametri σ o ormaalijakauma variassi: μ = E(X) σ = Var(X) Parametrit μ ja σ määräävät täysi ormaalijakauma. Normaalijakauma parametreja koskevat testit voidaa jakaa kahtee ryhmää: Yhde otokse testit Kahde otokse testit Yhde otokse testeissä testataa yksikertaisia ollahypoteeseja, jotka koskevat ormaalijakauma odotusarvo- tai variassiparametria. Kahde otokse testit ovat vertailutestejä, joissa verrataa kahde ormaalijakauma odotusarvo- tai variassiparametreja toisiisa. Tässä luvussa tarkastellaa seuraavia testejä ormaalijakauma parametreille: Yhde otokse t-testi odotusarvolle Kahde riippumattoma otokse t-testi A odotusarvoille: Yleie tapaus Kahde riippumattoma otokse t-testi B odotusarvoille: Yhtä suurte variassie tapaus t-testi parivertailuille Yhde otokse χ -testi variassille Kahde riippumattoma otokse F-testi variasseille Testejä ormaalijakauma odotusarvolle voidaa soveltaa myös moissa sellaisissa tilateissa, joissa havaiot eivät oudata ormaalijakaumaa. Tämä perustuu seuraavii seikkoihi: (i) Testit odotusarvolle perustuvat havaitoje aritmeettisii keskiarvoihi. (ii) Keskeise raja-arvolausee mukaa myös ei-ormaaliste havaitoje aritmeettiset keskiarvot oudattavat tietyi ehdoi suurissa otoksissa approksimatiivisesti ormaalijakaumaa. Tämä merkitsee sitä, että testejä ormaalijakauma odotusarvolle voidaa pitää yleisiä testeiä suhde- (tai välimatka-) asteikolliste satuaismuuttujie odotusarvolle; mitta-asteikot: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Se sijaa testejä ormaalijakauma variassille ei pidä soveltaa, jos havaitoje jakauma ei ole lähellä ormaalijakaumaa ja tilae ei yleesä ole parempi suurillakaa havaitoje lukumäärillä. Ilkka Melli 55

9. Testejä suhdeasteikollisille muuttujille 9.. Yhde otokse t-testi odotusarvolle Testausasetelma yhde otokse t-testissä Olkoo X i, i =,,, satuaisotos ormaalijakaumasta N(μ, σ ). Tällöi satuaismuuttujat X i, i =,,, ovat riippumattomia ja oudattavat samaa ormaalijakaumaa N(μ, σ ): X, X, L, X X N( μσ, ), i =,, K, i Asetetaa ormaalijakauma N(μ, σ ) odotusarvo- eli paikkaparametrille μ ollahypoteesi H :μ = μ 0 0 Testausogelma: Ovatko havaiot sopusoiussa hypoteesi H 0 kassa? Hypoteesit yhde otokse t-testissä Yleie hypoteesi H : X, X, K, X X ~N( μσ, ), i =,, K, Nollahypoteesi: i H :μ = μ 0 0 Vaihtoehtoiset hypoteesit: H: μ > μ0 H: μ < μ0 H : μ μ 0 -suutaiset vaihtoehtoiset hypoteesit -suutaie vaihtoehtoie hypoteesi Parametrie estimoiti yhde otokse t-testissä Olkoot ja X X i i = = s X X = ( i ) i= tavaomaiset harhattomat estimaattorit ormaalijakauma parametreille μ ja σ. Tuusluku X o havaitoje X i, i =,,, aritmeettie keskiarvo ja s o havaitoje X i, i =,,, (harhato) otosvariassi. Ilkka Melli 56

9. Testejä suhdeasteikollisille muuttujille Testisuure ja se jakauma yhde otokse t-testissä Määritellää t-testisuure X μ0 t = s/ Jos ollahypoteesi H :μ = μ 0 0 pätee, ii testisuure t oudattaa t-jakaumaa vapausastei ( ): t t( ) Perustelu: Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H 0 pätevät: X, X, K, X X ~N( μσ, ), i =,, K, i Koska tällöi (ks. lukua Otokset ja otosjakaumat) σ X = Xi N μ0, i= ii X μ0 Z = N(0,) σ / Koska stadardipoikkeama σ o tutemato, satuaismuuttuja Z o testisuureea epäoperatioaalie. Jos stadardipoikkeama σ korvataa satuaismuuttuja Z lausekkeessa vastaavalla otossuureella s = ( Xi X) i= ii saadaa t-testisuure X μ0 t = s/ joka ollahypoteesi H 0 pätiessä oudattaa t-jakaumaa vapausastei ( ): t t( ) Todistus: ks. lukua Otokset ja otosjakaumat. Testisuure t mittaa havaitoarvoje aritmeettise keskiarvo X ja ollahypoteesi H 0 kiiittämä odotusarvoparametri μ arvo μ 0 tilastollista etäisyyttä. Mittayksikköä o erotukse Ilkka Melli 57

9. Testejä suhdeasteikollisille muuttujille stadardipoikkeama X μ 0 σ / estimaattori, jota määrättäessä o oletettu, että ollahypoteesi H 0 pätee. Testisuuree t ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(t) = 0 Site itseisarvoltaa suuret testisuuree t arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Hylkäysaluee määräämie yhde otokse t-testissä Valitaa testi merkitsevyystasoksi α. (i) Jos vaihtoehtoie hypoteesi o muotoa H:μ > μ 0 ii kriittie arvo +t α saadaa ehdosta Pr( t + t α ) = α jossa t t( ). Testi hylkäysalue o tällöi muotoa ( + t α, + ) (ii) Jos vaihtoehtoie hypoteesi o muotoa H:μ < μ 0 ii kriittie arvo t α saadaa ehdosta Pr( t t α ) = α jossa t t( ). Testi hylkäysalue o tällöi muotoa (, t α ) (iii) Jos vaihtoehtoie hypoteesi o muotoa H:μ μ 0 ii kriittiset arvot t α/ ja +t α/ saadaa ehdoista Pr( t tα /) = α / Pr( t + t ) = α / α / jossa t t( ). Testi hylkäysalue o tällöi muotoa (, t ) ( + t, + ) α/ α/ Nollahypoteesi H 0:μ = μ0 hylätää, jos testisuuree arvo osuu hylkäysalueelle. Ilkka Melli 58

9. Testejä suhdeasteikollisille muuttujille Alla olevat kuviot havaiollistavat testi hylkäysaluee määräämistä: > μ 0 H:μ < μ 0 0 H:μ H:μ μ t ( ) t ( ) t ( ) α α α α α α α t α + t α t α / +t α / Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue p-arvo määräämie yhde otokse t-testissä Olkoo t-testisuuree havaittu arvo t 0. Alla olevat kuviot havaiollistavat testi p-arvo määräämistä: > μ 0 H:μ < μ 0 0 H:μ H:μ μ t ( ) t ( ) t ( ) p p p p p p p t + t t 0 t 0 0 0 Testi p-arvo = p Testi p-arvo = p Testi p-arvo = p Nollahypoteesi hylätää, jos testi p-arvo o kylli piei. Normaalisuusoletukse merkitys yhde otokse t-testissä Yhde otokse t-testi yleisessä hypoteesissa oletetaa, että havaiot ovat ormaalijakautueita. t-testi ei kuitekaa ole herkkä poikkeamille ormaalisuudesta, jos havaitoje lukumäärä o kylli suuri. Testiä o melko turvallista käyttää, ku havaitoje lukumäärä > 5 jos havaitoje jakauma ei ole kovi vio ja havaitoje joukossa ei ole poikkeavia havaitoja. Jos havaitoje lukumäärä > 40 testiä voidaa melko turvallisesti käyttää jopa selvästi vioille havaitoje jakaumille. Ilkka Melli 59