Tilastolliset menetelmät: Tilastolliset testit



Samankaltaiset tiedostot
Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset menetelmät: Tilastolliset testit

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Väliestimointi (jatkoa) Heliövaara 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Testit laatueroasteikollisille muuttujille

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Testit järjestysasteikollisille muuttujille

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

8. laskuharjoituskierros, vko 11, ratkaisut

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

n = 100 x = %:n luottamusväli µ:lle Vastaus:

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslasku. Tilastolliset testit. Avainsanat:

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

2-suuntainen vaihtoehtoinen hypoteesi

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Mat Sovellettu todennäköisyyslasku A

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

2-suuntainen vaihtoehtoinen hypoteesi

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Osa 2: Otokset, otosjakaumat ja estimointi

Sovellettu todennäköisyyslaskenta B

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Yhden selittäjän lineaarinen regressiomalli

Mat Tilastollisen analyysin perusteet, kevät 2007

tilastotieteen kertaus

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastolliset menetelmät: Varianssianalyysi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

10. laskuharjoituskierros, vko 14, ratkaisut

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Sovellettu todennäköisyyslaskenta B

Hypoteesin testaus Alkeet

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Otoskoko 107 kpl. a) 27 b) 2654

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Otantajakauman käyttö päättelyssä

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Vilkkumaa / Kuusinen 1

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Normaalijakaumasta johdettuja jakaumia

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

9. laskuharjoituskierros, vko 12-13, ratkaisut

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1

Mat Sovellettu todennäköisyyslasku A

Transkriptio:

Tilastolliset meetelmät Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille. Testejä laatueroasteikollisille muuttujille. Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie TKK @ Ilkka Melli (6) 3

Tilastolliset meetelmät Tilastolliset testit TKK @ Ilkka Melli (6) 4

Tilastolliset meetelmät Tilastolliset testit Sisällys 8. TILASTOLLINEN TESTAUS 9 8.. TILASTOLLISEN TESTAUKSEN IDEA 3 TILASTOLLISEN TESTAUKSEN LÄHTÖKOHTA 3 SATUNNAISOTOS 3 8.. TILASTOLLISET HYPOTEESIT 3 YLEINEN HYPOTEESI 3 NOLLAHYPOTEESI 3 VAIHTOEHTOINEN HYPOTEESI 3 8.3. TILASTOLLISET TESTIT JA TESTISUUREET 3 TESTI 3 TESTISUURE 3 8.4. VIRHEET TESTAUKSESSA 33 HYLKÄYSVIRHE 33 HYVÄKSYMISVIRHE 33 TESTIN VOIMAKKUUS 33. JA. LAJIN VIRHEET 33 TESTIN TULOS JA MAAILMAN TILAT 34 TESTIN HYLKÄYS JA HYVÄKSYMISALUEET 34 8.5. MERKITSEVYYSTASO JA TESTIN HYLKÄYSALUE 34 MERKITSEVYYSTASO 34 MERKITSEVYYSTASON FREKVENSSITULKINTA 34 TAVANOMAISET MERKITSEVYYSTASOT 35 HYLKÄYSALUEEN MÄÄRÄÄMINEN YKSIKERTAISISSA TESTAUSASETELMISSA 35 8.6. TESTIN P ARVO 37 P ARVO 37 P ARVON FREKVENSSITULKINTA 37 P ARVO JA TESTI PÄÄTÖSSÄÄNTÖNÄ 37 P ARVON MÄÄRÄÄMINEN YKSINKERTAISISSA TESTAUSASETELMISSA 38 8.7. TESTIN SUORITTAMINEN 39 TESTIN SUORITTAMINEN MERKITSEVYYSTASON VALINTAAN PERUSTUVISSA TESTAUSASETELMISSA 39 TESTIN SUORITTAMINEN P ARVON VALINTAAN PERUSTUVISSA TESTAUSASETELMISSA 4 8.8. NORMAALIJAKAUMAN PARAMETREJA KOSKEVAT TESTIT: ESIMERKKI 4 TESTAUSASETELMA 4 HAVAINNOT 4 TESTAUSASETELMAA KOSKEVAT HYPOTEESIT 4 χ TESTI VARIANSSILLE 43 T TESTI ODOTUSARVOLLE 46 8.9. TILASTOLLISET TESTIT JA HAVAINTOJEN MITTA ASTEIKOILLISET OMINAISUUDET 5 9. TESTEJÄ SUHDEASTEIKOLLISILLE MUUTTUJILLE 5 9.. SUHDEASTEIKOLLISTEN MUUTTUJIEN TESTIT 53 9.. YHDEN OTOKSEN T TESTI ODOTUSARVOLLE 54 TESTAUSASETELMA YHDEN OTOKSEN T TESTISSÄ 54 HYPOTEESIT YHDEN OTOKSEN T TESTISSÄ 54 PARAMETRIEN ESTIMOINTI YHDEN OTOKSEN T TESTISSÄ 54 TESTISUURE JA SEN JAKAUMA YHDEN OTOKSEN T TESTISSÄ 55 TKK @ Ilkka Melli (6) 5

Tilastolliset meetelmät Tilastolliset testit HYLKÄYSALUEEN MÄÄRÄÄMINEN YHDEN OTOKSEN T TESTISSÄ 56 P ARVON MÄÄRÄÄMINEN YHDEN OTOKSEN T TESTISSÄ 57 NORMAALISUUSOLETUKSEN MERKITYS YHDEN OTOKSEN T TESTISSÄ 57 YHDEN OTOKSEN T TESTIN HYVÄKSYMISVIRHEEN TODENNÄKÖISYYS JA VOIMAKKUUS 58 9.3. KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTI A ODOTUSARVOILLE: YLEINEN TAPAUS 6 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ A 6 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ A 6 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ A 6 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ A 6 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ A 63 P ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ A 64 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ A 65 9.4. KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTI B ODOTUSARVOILLE: YHTÄ SUURTEN VARIANSSIEN TAPAUS 65 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ B 65 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ B 66 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ B 67 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ B 67 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ B 69 P ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ B 69 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSEN T TESTISSÄ B 69 9.5. T TESTI PARIVERTAILUILLE 69 PARIVERTAILUASETELMA 69 TESTAUSASETELMA T TESTISSÄ PARIVERTAILUILLE 7 HYPOTEESIT T TESTISSÄ PARIVERTAILUILLE 7 PARAMETRIEN ESTIMOINTI T TESTISSÄ PARIVERTAILUILLE 7 TESTISUURE JA SEN JAKAUMA T TESTISSÄ PARIVERTAILUILLE 7 HYLKÄYSALUEEN MÄÄRÄÄMINEN T TESTISSÄ PARIVERTAILUILLE 7 P ARVON MÄÄRÄÄMINEN T TESTISSÄ PARIVERTAILUILLE 7 NORMAALISUUSOLETUKSEN MERKITYS T TESTISSÄ PARIVERTAILUILLE 7 9.6. YHDEN OTOKSEN χ TESTI VARIANSSILLE 7 TESTAUSASETELMA YHDEN OTOKSEN TESTISSÄ VARIANSSILLE 7 HYPOTEESIT YHDEN OTOKSEN χ TESTISSÄ VARIANSSILLE 7 PARAMETRIEN ESTIMOINTI YHDEN χ TESTISSÄ VARIANSSILLE 73 TESTISUURE JA SEN JAKAUMA YHDEN OTOKSEN χ TESTISSÄ VARIANSSILLE 73 HYLKÄYSALUEEN MÄÄRÄÄMINEN YHDEN OTOKSEN χ TESTISSÄ VARIANSSILLE 74 P ARVON MÄÄRÄÄMINEN YHDEN OTOKSEN χ TESTISSÄ VARIANSSILLE 75 NORMAALISUUSOLETUKSEN MERKITYS YHDEN OTOKSEN χ TESTISSÄ VARIANSSILLE 76 9.7. KAHDEN RIIPPUMATTOMAN OTOKSEN F TESTI VARIANSSEILLE 76 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSEN F TESTISSÄ VARIANSSEILLE 76 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSEN F TESTISSÄ VARIANSSEILLE 77 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSEN F TESTISSÄ VARIANSSEILLE 77 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSEN F TESTISSÄ VARIANSSEILLE 77 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN F TESTISSÄ VARIANSSEILLE _79 P ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSEN F TESTISSÄ VARIANSSEILLE 8 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSEN F TESTISSÄ VARIANSSEILLE 8. TESTEJÄ JÄRJESTYSASTEIKOLLISILLE MUUTTUJILLE 8.. JÄRJESTYSASTEIKOLLISTEN MUUTTUJIEN TESTIT 83 TKK @ Ilkka Melli (6) 6

Tilastolliset meetelmät Tilastolliset testit.. MERKKITESTI 83 TESTISUUREET S JA S + 83 TESTISUUREIDEN S JA S + OMINAISUUDET 84 EKSAKTI MERKKITESTI 84 STANDARDOITU MERKKITESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 84 KOMMENTTEJA 85 MERKKITESTI JA PARIVERTAILUASETELMAT 85.3. WILCOXONIN RANKITESTI 85 TESTISUUREET W JA W + 86 TESTISUUREIDEN W JA W + OMINAISUUDET 86 EKSAKTI WILCOXONIN RANKITESTI 87 STANDARDOITU W TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 87 KOMMENTTEJA 88 WILCOXONIN RANKITESTI JA PARVERTAILUASETELMAT 88.4. MANNIN JA WHITNEYN TESTI 88 HYPOTEESIT 89 MANNIN JA WHITNEYN TESTIN IDEA 89 TESTISUURE U MUOTO 89 TESTISUURE U MUOTO 89 TESTISUUREEN U OMINAISUUDET 9 TESTISUURE U MUOTO 9 TESTISUURE U MUOTO 9 TESTISUUREEN U OMINAISUUDET 9 TESTISUUREIDEN U JA U OMINAISUUDET 9 STANDARDOITU U TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 9 STANDARDOITU U TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 9 KOMMENTTEJA 9.5. WILCOXONIN RANKISUMMATESTI 9 MANNIN JA WHITNEYN TESTI JA WILCOXONIN RANKISUMMATESTI 9 TESTISUURE T 9 TESTISUURE T 9 TESTISUUREIDEN T JA T OMINAISUUDET 9 STANDARDOITU T TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 93 STANDARDOITU T TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA 93. TESTEJÄ LAATUEROASTEIKOLLISILLE MUUTTUJILLE 94.. LAATUEROASTEIKOLLISTEN MUUTTUJIEN TESTIT 95.. TESTI SUHTEELLISELLE OSUUDELLE 95 TESTAUSASETELMA TESTISSÄ SUHTEELLISELLE OSUUDELLE 95 HYPOTEESIT TESTISSÄ SUHTEELLISELLE OSUUDELLE 96 PARAMETRIEN ESTIMOINTI TESTISSÄ SUHTEELLISELLE OSUUDELLE 96 TESTISUURE JA SEN JAKAUMA TESTISSÄ SUHTEELLISELLE OSUUDELLE 97 HYLKÄYSALUEEN MÄÄRÄÄMINEN TESTISSÄ SUHTEELLISELLE OSUUDELLE 98 P ARVON MÄÄRÄÄMINEN TESTISSÄ SUHTEELLISELLE OSUUDELLE 99.3. SUHTEELLISTEN OSUUKSIEN VERTAILUTESTI 99 TESTAUSASETELMA SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 99 HYPOTEESIT SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ PARAMETRIEN ESTIMOINTI SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ TESTISUURE SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ HYLKÄYSALUEEN MÄÄRÄÄMINEN SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 3 TKK @ Ilkka Melli (6) 7

Tilastolliset meetelmät Tilastolliset testit P ARVON MÄÄRÄÄMINEN SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ 4. YHTEENSOPIVUUDEN, HOMOGEENISUUDEN JA RIIPPUMATTOMUUDEN TESTAAMINEN 5.. JAKAUMAOLETUKSIEN TESTAUS 6.. YHTEENSOPIVUUDEN TESTAAMINEN 6 TESTAUSASETELMA χ YHTEENSOPIVUUSTESTISSÄ 6 HYPOTEESIT χ YHTEENSOPIVUUSTESTISSÄ 7 HAVAITUT LUOKKAFREKVENSSIT 7 ODOTETUT LUOKKAFREKVENSSIT 8 TESTISUURE JA SEN JAKAUMA χ YHTEENSOPIVUUSTESTISSÄ 9 χ YHTEENSOPIVUUSTESTI: SOVELLUS.3. HOMOGEENISUUDEN TESTAAMINEN 5 TESTAUSASETELMA χ HOMOGEENISUUSTESTISSÄ 5 χ HOMOGEENISUUSTESTIN SUORITTAMINEN 5 HYPOTEESIT χ HOMOGEENISUUSTESTISSÄ 6 HAVAITUT FREKVENSSIT 6 NOLLAHYPOTEESIN TULKINTA χ HOMOGEENISUUSTESTISSÄ 7 ODOTETTUJEN FREKVENSSIEN MÄÄRÄÄMINEN 7 TESTISUURE JA SEN JAKAUMA χ HOMOGEENISUUSTESTISSÄ 9.4. RIIPPUMATTOMUUDEN TESTAAMINEN TESTAUSASETELMA χ RIIPPUMATTOMUUSTESTISSÄ χ RIIPPUMATTOMUUSTESTIN SUORITTAMINEN HYPOTEESIT χ RIIPPUMATTOMUUSTESTISSÄ HAVAITUT FREKVENSSIT NOLLAHYPOTEESIN TULKINTA χ RIIPPUMATTOMUUSTESTISSÄ ODOTETTUJEN FREKVENSSIEN MÄÄRÄÄMINEN TESTISUURE JA SEN JAKAUMA χ RIIPPUMATTOMUUSTESTISSÄ 4.5. χ HOMOGEENISUUSTESTI JA χ RIIPPUMATTOMUUSTESTI 5.6. NORMAALISUUDEN TESTAAMINEN 6 BOWMANIN JA SHENTONIN TESTI NORMAALISUUDELLE 6 TODENNÄKÖISYYSJAKAUMAN VINOUS JA HUIPUKKUUS 6 HAVAINTOJEN JAKAUMAN VINOUS JA HUIPUKKUUS 7 HYPOTEESIT 8 BOWMANIN JA SHENTONIN TESTI 8 RANKIT PLOT KUVIO SEKÄ WILKIN JA SHAPIRON TESTI NORMAALISUUDELLE 8 RANKIT PLOT KUVIO JA WILKIN JA SHAPIRON TESTI: SOVELLUS 9 TKK @ Ilkka Melli (6) 8

Tilastolliset meetelmät 8. Tilastollie testaus 8. Tilastollie testaus 8.. Tilastollise testaukse idea 8.. Tilastolliset hypoteesit 8.3. Tilastolliset testit ja testisuureet 8.4. Virheet testauksessa 8.5. Merkitsevyystaso ja testi hylkäysalue 8.6. Testi p arvo 8.7. Testi suorittamie 8.8. Normaalijakauma parametreja koskevat testit 8.9. Tilastolliset testit ja mitta asteikot Tilastollisella testauksella tarkoitetaa tutkimukse kohteea olevasta perusjoukosta esitettyje väitteide tai oletuksie asettamista koetteelle havaioista saatua iformaatiota vastaa. Perusjoukosta esitetyt väitteet tai oletukset o tilastollisessa testauksessa puettava tutkimukse kohteea oleva perusjouko alkioide omiaisuuksie vaihtelua perusjoukossa kuvaavie todeäköisyysjakaumia tai iide parametreja koskeviksi hypoteeseiksi. Tilastollie testi o päätössäätö, joka saoo oko hypoteesi hylättävä vai ei havaioista saadu iformaatio valossa. Testi mittaa hypoteesi ja havaitoje yhteesopivuutta. Tarkastelemme tässä luvussa tilastollise testiteoria peruskäsitteitä sekä tarkastelemme esitetyty teoria havaiollistuksea ormaalijakauma parametreja koskevie hypoteesie testaamista. Avaisaat: Esimmäise laji virhe, Frekvessitulkita, Havaito, Hylkäysalue, Hylkäysvirhe, Hypoteesi, Hyväksymis alue, Hyväksymisvirhe, Järjestysasteikko, χ jakauma, χ testi, Kaksisuutaie vaihtoehtoie hypoteesi, Kriittie arvo, Kriittie raja, Laatueroasteikko, Maailma tila, Merkitsevyys, Merkitsevyystaso, Mitta asteikko, Nollahypoteesi, Normaaliarvo, Normaalijakauma, Odotusarvo, Otatameetelmä, Otos, Parametri, p arvo, Perusjoukko, Satuaisotos, Suhdeasteikko, t jakauma, t testi, Testausasetelma, Testi, Testi tulos, Testisuure, Tilastollie hypoteesi, Tilastolliste hypoteesie testaus, Todeäköisyysjakauma, Toise laji virhe, Vaihtoehtoie hypoteesi, Variassi, Voimakkuus, Välimatka asteikko, Yksisuutaie vaihtoehtoie hypoteesi, Yleie hypoteesi TKK @ Ilkka Melli (6) 9

Tilastolliset meetelmät 8. Tilastollie testaus 8.. Tilastollise testaukse idea Tilastollise testaukse lähtökohta Lähtökohta: Kysymys: Vastaus: Tutkimukse kohteea olevasta perusjoukosta o esitetty joki väite tai oletus. Mite esitettyä väitettä tai oletusta voidaa testata? Väitettä tai oletusta voidaa testata tilastollisesti, jos väite tai oletus voidaa pukea tutkimukse kohteea oleva perusjouko omiaisuude vaihtelua perusjoukossa kuvaavaa todeäköisyysjakaumaa tai se parametreja koskevaksi oletukseksi eli hypoteesiksi. Olkoo X tutkimukse kohteea oleva perusjouko joki omiaisuude vaihtelua perusjoukossa kuvaava satuaismuuttuja ja olkoo satuaismuuttuja X todeäköisyysjakauma pistetodeäköisyys tai tiheysfuktio f(x;θ) jossa θ o fuktio f muodo määräävä tutemato parametri. Yksikertaisissa testausasetelmissa kiiostukse kohteea o hypoteesi, joka mukaa parametrilla θ o arvo θ. Mite todeäköisyysjakauma f(x;θ) parametria θ koskevaa hypoteesia θ = θ voidaa testata tilastollisesti? Tilastollisessa testauksessa hypoteesi θ = θ asetetaa koetteelle havaitoje todeäköisyysjakaumasta f(x;θ) sisältämää iformaatiota vastaa. Satuaisotos Oletamme jatkossa, että havaiot X, X,, X muodostavat satuaisotokse jakaumasta, joka pistetodeäköisyys tai tiheysfuktio o f(x;θ) Tällöi X, X,, X ovat riippumattomia, idettisesti jakautueita satuaismuuttujia, joilla o sama pistetodeäköisyys tai tiheysfuktio f(x;θ): X, X, K, X X f( x; θ), i =,, K, i Tavoitteeamme o testata tilastollisesti muotoa θ = θ olevaa parametrista hypoteesia. Testi suorittamista varte valitaa testisuure, joka mittaa satuaismuuttujie X, X,, X TKK @ Ilkka Melli (6) 3

Tilastolliset meetelmät 8. Tilastollie testaus havaittuje arvoje x, x,, x ja hypoteesi θ = θ yhteesopivuutta. Hyvä yhteesopivuus merkitsee sitä, että havaiot ovat sopusoiussa oletukse θ = θ kassa ja huoo yhteesopivuus merkitsee sitä, että havaiot ja oletus θ = θ ovat ristiriidassa keskeää. 8.. Tilastolliset hypoteesit Ku todeäköisyysjakauma parametreja koskevia väitteitä tai oletuksia testataa tilastollisesti, testausasetelma kiiittämiseksi o tehtävä seuraavat kolme oletusta: (i) (ii) (iii) Testausasetelmaa koskevat perusoletukset, joista pidetää kiii testaukse aikaa, muodostavat testi yleise hypoteesi. Testattavaa oletusta kutsutaa ollahypoteesiksi. Vaihtoehtoie hypoteesi o oletus, joka astuu voimaa, jos ollahypoteesi hylätää testissä. Yleie hypoteesi Yleiset testausasetelmaa koskevat oletukset muodostavat testi yleise hypoteesi H. Yleie hypoteesi H sisältää oletukset perusjoukosta otatameetelmästä perusjouko jakaumasta Yleise hypoteesi H oletuksista pidetää kiii koko testaukse aja, mikä merkitsee sitä, että tilastollie testaus tehdää aia ehdollisesti yleise hypoteesi H oletuste suhtee. Huomautus: Yleise hypoteesi sisältämiä jakaumaoletuksia voidaa ja o tavallisesti myös syytä testata eriksee; ks. esimerkiksi lukua Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie. Nollahypoteesi Sitä perusjouko jakauma parametreja koskevaa väitettä tai oletusta, jota halutaa testata kutsutaa ollahypoteesiksi. Nollahypoteesille käytetää tavallisesti merkitää H. Testissä ollahypoteesi H asetetaa koetteelle havaitoje perusjouko jakaumasta sisältämää iformaatiota vastaa. Nollahypoteesista H pidetää kiii, elleivät havaitoje sisältämät todisteet ollahypoteesia vastaa ole kylli voimakkaita. Olkoo f(x;θ) tutkimukse kohteea olevaa perusjouko omiaisuutta kuvaava todeäköisyysjakauma pistetodeäköisyys tai tiheysfuktio. Yksikertaisissa testausasetelmissa ollahypoteesi o muotoa H : θ = θ TKK @ Ilkka Melli (6) 3

Tilastolliset meetelmät 8. Tilastollie testaus Huomautus: Nollahypoteesit ovat yksikertaisissa testausasetelmissa muotoa o sama tai muotoa ei ole eroa. Vaihtoehtoie hypoteesi Vaihtoehtoie hypoteesi H o oletus, joka astuu voimaa, jos ollahypoteesi H hylätää. Vaihtoehtoie hypoteesi voidaa tavallisesti muotoilla usealla eri tavalla. Jos ollahypoteesi o muotoa o sama tai ei ole eroa, vaihtoehtoie hypoteesi o tavallisesti muotoa ei ole sama tai o eroa. Ku tilastollista testiä tehdää, toivotaa usei, että ollahypoteesi voidaa hylätä ja vaihtoehtoie hypoteesi hyväksyä. Vaihtoehtoise hypoteesi hyväksymie merkitsee yleesä iformaatio lisäätymistä. Jos ollahypoteesi o yksikertaista muotoa H : θ = θ vaihtoehtoie hypoteesi voidaa muotoilla seuraavilla kolmella tavalla: (i) H : θ > θ (ii) H : θ < θ (iii) H : θ θ Tapauksissa (i) ja (ii) saomme, että vaihtoehtoie hypoteesi o yksisuutaie. Tapauksessa (iii) saomme, että vaihtoehtoie hypoteesi o kaksisuutaie. Huomautus: Vaihtoehtoise hypoteesi muoto vaikuttaa tavallisesti siihe tapaa, jolla testi suoritetaa. 8.3. Tilastolliset testit ja testisuureet Testi Tilastollie testi o päätössäätö, joka kertoo jokaisessa yksittäisessä testaustilateessa eli jokaiselle otokselle, oko ollahypoteesi H hylättävä vai ei. Testisuure Tilastollie testi perustuu aia testisuureesee, joka mittaa havaitoje ja ollahypoteesi H yhteesopivuutta. Testisuure o satuaismuuttuja, joka arvo riippuu havaioista ja ollahypoteesista H. Havaitoje ja ollahypoteesi H yhteesopivuude mittaamie tarkoittaa sitä, että tutkitaa kuika todeäköistä o saada sellaisia testisuuree arvoja kui o saatu. Tämä vaatii testisuuree jakauma tutemista. Jos havaitoje ja ollahypoteesi H yhteesopivuus o testisuureella mitattua hyvä, ollahypoteesi H jätetää voimaa. Jos havaitoje ja ollahypoteesi H yhteesopivuus o testisuureella mitattua huoo, ollahypoteesi H hylätää ja vaihtoehtoie hypoteesi H hyväksytää. Testisuuree odotusarvoa ollahypoteesi H pätiessä kutsutaa testisuuree ormaaliarvoksi. Jos testisuuree havaittu arvo o lähellä testisuuree ormaaliarvoa, havaiot ovat sopusoiussa TKK @ Ilkka Melli (6) 3

Tilastolliset meetelmät 8. Tilastollie testaus ollahypoteesi H kassa. Jos testisuuree otoksesta määrätty arvo poikkeaa merkitsevästi testisuuree ormaaliarvosta, havaiot sisältävät todisteita ollahypoteesia H vastaa. 8.4. Virheet testauksessa Hylkäysvirhe Jos ollahypoteesi H hylätää silloi, ku se o tosi, tehdää hylkäysvirhe. Hylkäysvirhee todeäköisyys α o ehdollie todeäköisyys Pr(H hylätää H o tosi) = α Hylkäysvirhee todeäköisyyde α komplemettitodeäköisyys Pr(H hyväksytää H o tosi) = α o todeäköisyys hyväksyä ollahypoteesi silloi, ku se o tosi. Tilastollisessa tutkimuksessa oudatetaa tietee yleistä varovaisuusperiaatetta: Hypoteeseja ei saa hylätä ilma riittäviä syitä. Siksi ollahypoteesi H virheellise hylkäykse todeäköisyys halutaa tehdä tilastollisessa testauksessa mahdollisimma pieeksi. Siksi havaioilta vaaditaa vahvoja todisteita ollahypoteesia H vastaa ee kui se suostutaa hylkäämää. Hyväksymisvirhe Jos ollahypoteesi H jätetää voimaa silloi, ku se ei ole tosi, tehdää hyväksymisvirhe. Hyväksymisvirhee todeäköisyys β o ehdollie todeäköisyys Huomautus: Pr(H jätetää voimaa H ei ole tosi) = β Hylkäysvirhee todeäköisyys α ja hyväksymisvirhee todeäköisyys β eivät ole toistesa komplemettitodeäköisyyksiä. Testi voimakkuus Hyväksymisvirhee todeäköisyyde β komplemettitodeäköisyyttä Pr(H hylätää H ei ole tosi) = β kutsutaa testi voimakkuudeksi. Hyvä testi o voimakas, koska voimakkaalla testillä o piei hyväksymisvirhee todeäköisyys β. Testi voimakkuus ( β) riippuu tavallisesti testattava parametri todellisesta arvosta. Testi voimakkuutta testattava parametri arvoje fuktioa kutsutaa voimakkuusfuktioksi; esimerkki: ks. kappaletta Yhde otokse t testi luvussa Testejä suhdeasteikollisille muuttujille.. ja. laji virheet Koska testiä tehtäessä pyritää esisijaisesti varomaa sitä, että ollahypoteesi H hylätää silloi, ku se o tosi, hylkäysvirhettä kutsutaa usei esimmäise laji virheeksi. Tällöi hyväksymisvirhettä eli sitä, että ollahypoteesi H hyväksytää silloi, ku se ei ole tosi, kutsutaa toise laji virheeksi. TKK @ Ilkka Melli (6) 33

Tilastolliset meetelmät 8. Tilastollie testaus Testi tulos ja maailma tilat Maailma tilat ja testi tulokset voidaa ryhmitellä seuraavaksi eliketäksi: Maailma tila Nollahypoteesi pätee Nollahypoteesi ei päde Testi tulos Nollahypoteesi jää voimaa Nollahypoteesi hylätää Oikea johtopäätös Hylkäysvirhe Hyväksymisvirhe Oikea johtopäätös Testi hylkäys ja hyväksymisalueet Ku testi formuloidaa päätössäätöä, testiä varte kostruoidu testisuuree mahdolliste arvoje joukko jaetaa kahtee osaa, hylkäysalueesee ja hyväksymis alueesee: (i) Jos testisuuree havaioista määrätty arvo joutuu hylkäysalueelle, ollahypoteesi H hylätää. (ii) Jos testisuuree havaioista määrätty arvo joutuu hyväksymisalueelle, ollahypoteesi H jätetää voimaa. Huomautus: Testisuuree mahdolliste arvoje jouko jako hylkäys ja hyväksymisalueisii ei saa riippua havaioista. 8.5. Merkitsevyystaso ja testi hylkäysalue Merkitsevyystaso Testi merkitsevyystaso α o todeäköisyys, että testisuuree havaioista määrätty arvo joutuu hylkäysalueelle, jos ollahypoteesi H pätee. Jos testisuuree havaioista määrätty arvo joutuu ollahypoteesi H pätiessä hylkäysalueelle, ollahypoteesi H hylätää virheellisesti ja seurauksea o hylkäysvirhe, joka todeäköisyys o α. Tavallisesti testi hylkäysalue määrätää kiiittämällä testissä käytettävä merkitsevyystaso α etukätee so. jo ee havaitoje keräämistä; ks. kappaletta Esimerkki: Normaalijakauma parametrie testaamie. Merkitsevyystaso frekvessitulkita Oletetaa, että yleise hypoteesi H lisäksi myös ollahypoteesi H pätee testausasetelmassa ja että olemme valieet testi merkitsevyystasoksi luvu α. Toistetaa otataa ja sovelletaa jokaisee TKK @ Ilkka Melli (6) 34

Tilastolliset meetelmät 8. Tilastollie testaus otoksee samaa testiä. Tällöi joudumme virheellisesti hylkäämää ollahypoteesi H keskimääri α %:ssa otoksia, vaikka ollahypoteesi H koko aja pätee. Tavaomaiset merkitsevyystasot Koska testeissä halutaa esisijaisesti suojautua hylkäysvirhettä vastaa, testi merkitsevyystasoksi α o tapaa valita pieiä lukuja. Ns. tavaomaiset merkitsevyystasot ovat (i) α =.5 α =. α =. Jos ollahypoteesi H voidaa hylätä merkitsevyystasolla α =.5, saotaa: Testisuuree arvo (tai testi tulos) o melkei merkitsevä. (ii) Jos ollahypoteesi H voidaa hylätä merkitsevyystasolla α =., saotaa: Testisuuree arvo (tai testi tulos) o merkitsevä. (iii) Jos ollahypoteesi H voidaa hylätä merkitsevyystasolla α =., saotaa: Testisuuree arvo (tai testi tulos) o erittäi merkitsevä. Merkitsevyystasoa α valittaessa o aia syytä ottaa huomioo väärä päätökse seuraukset. Hylkäysaluee määräämie yksikertaisissa testausasetelmissa Testi hylkäysalue riippuu yksikertaisissa testausasetelmissa paitsi valitusta merkitsevyystasosta α myös vaihtoehtoise hypoteesi muodosta. Olkoo parametria θ koskeva ollahypoteesi yksikertaista muotoa H : θ = θ Valitaa testi merkitsevyystasoksi α ja oletetaa, että testisuureea o (jatkuva) satuaismuuttuja Z. Tehdää testisuureesta Z seuraavat oletukset: () Testisuuree Z mahdolliset arvot kuuluvat välii (a,b), jossa voi olla a = ja/tai b = +. (a) Testisuureella Z o taipumus saada suuria arvoja, jos θ > θ (b) Testisuureella Z o taipumus saada pieiä arvoja, jos Huomautus: θ < θ Oletukset a b pätevät kaikille testisuureille tässä esityksessä. Tarkastellaa testi hylkäysaluee määräämistä erilaiste vaihtoehtoiste hypoteesie tapauksissa. (i) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio TKK @ Ilkka Melli (6) 35 α

Tilastolliset meetelmät 8. Tilastollie testaus H : θ > θ ii testi hylkäysalue o muotoa (u,b) jossa kriittie arvo tai raja u määrätää site, että Pr(Z u H ) = α Ks. kuvaa oikealla. (ii) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ < θ ii testi hylkäysalue o muotoa (a,l) jossa kriittie arvo tai raja l määrätää site, että Pr(Z l H ) = α Ks. kuvaa oikealla. α l α Hylkäysalue Hyväksymisalue (iii) Jos vaihtoehtoisea hypoteesia o kaksisuutaie vaihtoehto H : θ θ ii testi hylkäysalue o muotoa (a,l) (u,b) jossa kriittiset arvot tai rajat l ja u määrätää site, että Ks. kuvaa oikealla. Pr(Z u H ) = Pr(Z l H ) = α/ Testisuuree tiheysfuktio α/ α/ α l u Hylkäysalue Hyväksymisalue Hylkäysalue Jos testisuuree Z jakauma o symmetrie origo suhtee, ii edellä esitetyille kriittisille arvoille pätee: TKK @ Ilkka Melli (6) 36

Tilastolliset meetelmät 8. Tilastollie testaus Huomautus: l = u Todeäköisyydet kohdissa (i) (iii) ovat ehdollisia todeäköisyyksiä, joissa ehtotapahtumaa o se, että ollahypoteesi H pätee. Site todeäköisyydet määrätää testisuuree Z jakaumasta, ku jakaumaa määrättäessä oletetaa, että ollahypoteesi H pätee. 8.6. Testi p arvo p arvo Nollahypoteesi hylkäämie voidaa perustaa etukätee valitu merkitsevyystaso ja sitä vastaava hylkäysaluee määräämise sijasta testi p arvoo. Testi p arvo o piei merkitsevyystaso, jolla ollahypoteesi H voidaa hylätä. Tilastolliset ohjelmistot tulostavat ykyää lähes aia sovellettavie testie p arvot ja siksi p arvoje käyttö o lähes kokoaa syrjäyttäyt etukätee valittuje kiiteide merkitsevyystasoje käytö. Testi p arvo määrätää seuraavalla tavalla: (i) Lasketaa valitu testisuuree arvo havaioista. (ii) Määrätää olettae, että ollahypoteesi H pätee todeäköisyys sille, että testisuure saa (ormaaliarvoosa verrattua) ii poikkeuksellise arvo kui se o saaut tai vielä poikkeuksellisempia arvoja. Jos testi p arvoksi saadaa piei luku, testisuure o saaut arvo, joka kuuluu ollahypoteesi H pätiessä epätodeäköiste testisuuree arvoje joukkoo. Site ollahypoteesi voidaa hylätä, jos testi p arvo o kylli piei. Mitä pieempi o testi p arvo, sitä vahvempia todisteita havaiot sisältävät ollahypoteesia H vastaa. Huomautus: Testi p arvo määrätää testisuuree Z jakaumasta, ku jakauma o määrätty olettae, että ollahypoteesi H pätee. p arvo frekvessitulkita Oletetaa, että yleise hypoteesi H lisäksi myös ollahypoteesi H pätee testausasetelmassa. Toistetaa otataa ja sovelletaa jokaisee otoksee samaa testiä. Tällöi havaitsemme keskimääri p %:ssa poimittuja otoksia havaittua testisuuree arvoa poikkeavamma testisuuree arvo. p arvo ja testi päätössäätöä Tilastollie testi eli päätössäätö, joka kertoo jokaisessa yksittäisessä tilateessa eli jokaiselle otokselle, oko ollahypoteesi H hylättävä vai ei, voidaa perustaa seuraavalla tavalla testi p arvoo: (i) Valitaa piei todeäköisyys p. TKK @ Ilkka Melli (6) 37

Tilastolliset meetelmät 8. Tilastollie testaus (ii) Määrätää testi p arvo. Jos p < p, hylätää ollahypoteesi H ja hyväksytää vaihtoehtoie hypoteesi H. Jos p p, jätetää ollahypoteesi H voimaa. Todeäköisyyttä p valittaessa o aia syytä ottaa huomioo väärä päätökse seuraukset. p arvo määräämie yksikertaisissa testausasetelmissa Testi p arvo riippuu yksikertaisissa testausasetelmissa vaihtoehtoise hypoteesi muodosta. Olkoo parametria θ koskeva ollahypoteesi yksikertaista muotoa H : θ = θ Oletetaa, että testisuureea o (jatkuva) satuaismuuttuja Z. Oletetaa yksikertaisuude vuoksi, että testisuuree jakauma o symmetrie origo suhtee. Tehdää testisuureesta Z lisäksi seuraavat oletukset: () Testisuuree Z mahdolliset arvot kuuluvat välii (a,b), jossa voi olla a = ja/tai b = +. (a) Testisuureella Z o taipumus saada suuria arvoja, jos θ > θ (b) Testisuureella Z o taipumus saada pieiä arvoja, jos Huomautus: θ < θ Oletukset a b pätevät kaikille testisuureille tässä esityksessä. Oletetaa, että testisuuree Z havaioista määrätty arvo o z. Tarkastellaa testi p arvo määräämistä erilaiste vaihtoehtoiste hypoteesie tapauksissa. (i) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ > θ ii testi p arvo o p = Pr(Z z H ) Ks. kuvaa oikealla. p p z TKK @ Ilkka Melli (6) 38

Tilastolliset meetelmät 8. Tilastollie testaus (ii) Jos vaihtoehtoisea hypoteesia o yksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ < θ ii testi p arvo o p = Pr(Z z H ) Ks. kuvaa oikealla. p p z (iii) Jos vaihtoehtoisea hypoteesia o kaksisuutaie vaihtoehto Testisuuree tiheysfuktio H : θ θ ii testi p arvo o p = Pr(Z z H ) p p p z + z Huomautus: Todeäköisyydet kohdissa (i) (iii) ovat ehdollisia todeäköisyyksiä, joissa ehtotapahtumaa o se, että ollahypoteesi H pätee. Site todeäköisyydet määrätää testisuuree Z jakaumasta, ku jakaumaa määrättäessä o oletettu, että ollahypoteesi H pätee. 8.7. Testi suorittamie Testi suorittamie merkitsevyystaso valitaa perustuvissa testausasetelmissa Jos testi perustetaa merkitsevyystaso valitaa, testi suorittamisessa o seuraavat vaiheet: () Asetetaa testi hypoteesit: Yleie hypoteesi H Testaukse kohteea oleva ollahypoteesi H Vaihtoehtoie hypoteesi H () Valitaa testiä varte testisuure. Testisuuree tehtävää o mitata havaitoje ja ollahypoteesi H yhteesopivuutta. (3) Valitaa merkitsevyystaso α ja kostruoidaa testille sitä vastaava hylkäysalue. (4) Poimitaa otos ii, että yleise hypoteesi H oletukset pätevät. TKK @ Ilkka Melli (6) 39

Tilastolliset meetelmät 8. Tilastollie testaus Jos havaitoje sisältämät todisteet ollahypoteesia H vastaa ovat testisuureella mitattua kylli vahvoja, ollahypoteesi H hylätää ja vaihtoehtoie hypoteesi H hyväksytää. (5) Määrätää valitu testisuuree arvo havaioista. (6) Tehdää päätös ollahypoteesi hylkäämisestä. Jos testisuuree arvo joutuu hylkäysalueelle, hylätää ollahypoteesi H ja hyväksytää vaihtoehtoie hypoteesi H. Jos testisuuree arvo ei joudu hylkäysalueelle, jätetää ollahypoteesi H voimaa. Testi suorittamie p arvo valitaa perustuvissa testausasetelmissa Jos testi perustetaa testisuuree arvoa vastaavii p arvoihi, testi suorittamisessa o seuraavat vaiheet: () Asetetaa testi hypoteesit: Yleie hypoteesi H Testaukse kohteea oleva ollahypoteesi H Vaihtoehtoie hypoteesi H () Valitaa testiä varte testisuure. Testisuuree tehtävää o mitata havaitoje ja ollahypoteesi H yhteesopivuutta. (3) Poimitaa otos ii, että yleise hypoteesi H oletukset pätevät. Jos havaitoje sisältämät todisteet ollahypoteesia H vastaa ovat testisuureella mitattua kylli vahvoja, ollahypoteesi H hylätää ja vaihtoehtoie hypoteesi H hyväksytää. (4) Määrätää valitu testisuuree arvo havaioista. (5) Määrätää testisuuree havaittua arvoa vastaava p arvo. (6) Tehdää päätös ollahypoteesi hylkäämisestä. Jos testi p arvo o kylli piei, hylätää ollahypoteesi H ja hyväksytää vaihtoehtoie hypoteesi H. Jos testi p arvo ei ole kylli piei, jätetää ollahypoteesi H voimaa. 8.8. Normaalijakauma parametreja koskevat testit: Esimerkki Esitämme tässä kappaleessa testiteoria havaiollistuksea testit ormaalijakauma odotusarvolle ja variassille yksikertaise laaduvalvotaa koskeva esimerki tapauksessa. Normaalijakauma parametreja koskevia testejä käsitellää perusteellisesti kappaleessa Testejä suhdeasteikollisille muuttujille. Testausasetelma Koe tekee ruuveja, joide tavoitepituutea o cm. Ruuvie pituus vaihtelee kuiteki satuaisesti, mutta voidaa olettaa, että pituude vaihtelua voidaa kuvata ormaalijakaumalla. TKK @ Ilkka Melli (6) 4

Tilastolliset meetelmät 8. Tilastollie testaus Ruuveja tehdää koeella eriä. Valmistuserää pidetää myytikelpoisea, jos erä ruuvie pituudet eivät vaihtele liia paljo ja ruuvit ovat keskimääri oikea mittaisia: Ruuvie pituuksie variassi ei saa ylittää tilastollisesti merkitsevästi arvoa. cm ja ruuvie keskipituus ei saa poiketa tilastollisesti merkitsevästi pituude tavoitearvostaa cm. Ruuvie pituutta valvotaa seuraavalla tavalla: (i) (ii) Jokaisesta valmistuserästä poimitaa joukko ruuveja tutkittavaksi käyttäe satuaisotataa. Otoksee poimittuje ruuvie pituudet mitataa. (iii) Otoksee poimittuje ruuvie pituuksie otosvariassia verrataa arvoo. cm ja pituuksie aritmeettista keskiarvoa verrataa ruuvie tavoitepituutee cm. (v) Jos otoksee poimittuje ruuvie pituuksie variassi o liia suuri tai pituuksie aritmeettie keskiarvo poikkeaa pituude tavoitearvosta liia paljo, ii koko valmistuserä hylätää. Seuraavassa katsotaa, mite ruuvie pituude valvoassa käytetää hyväksi tilastollista testausta. Havaiot Oletetaa, että erää valmistuserä ruuvie joukosta o poimittu satuaisotos, joka koko o = 3 ja otoksee poimittuje ruuvie pituudet o mitattu. Otosta kuvaavat seuraavat tuusluvut: Pituuksie aritmeettie keskiarvo o X =.9 cm ja pituuksie otoskeskihajota o Huomautus: s =.38 cm Samaa aieistoa o tarkasteltu myös luvuissa Tilastolliste aieistoje kuvaamie ja Väliestimoiti. Taulukko oikealla esittää otoksee poimittuje ruuvie pituuksie luokiteltua frekvessijakaumaa. Kuva oikealla esittää otoksee poimittuje ruuvie pituuksie luokiteltua frekvessijakaumaa vastaavaa histogrammia. Luokkavälit määräävät kuvio suorakaiteide kaat ja suorakaiteide korkeudet o valittu ii, että suorakaiteide pita alat suhtautuvat toisiisa kute vastaavat luokkafrekvessit. Luokkavälit Luokkafrekvessit (9.85,9.9] (9.9,9.95] (9.95,.] 6 (.,.5] 3 (.5,.] 5 (.,.5] 4 (.5,.] 5 (.,.5] 3 (.5,.3] Frekvessi 7 6 5 4 3 Ruuvie pituuksie luokiteltu frekvessijakauma 9.8 9.9....3.4 Pituus (cm) TKK @ Ilkka Melli (6) 4

Tilastolliset meetelmät 8. Tilastollie testaus Huomautus: Jos otataa toistetaa, kaikki otosta koskevat tiedot (sekä havaitoarvot että iistä määrätyt otossuureet kute aritmeettiset keskiarvot ja otoskeskihajoat sekä havaitoarvoje jakaumaa kuvaavat graafiset esitykset kute hisrogrammit) vaihtelevat satuaisesti otoksesta toisee. Ogelma: Oko otosiformaatio sopusoiussa ruuvie pituude variassille ja odotusarvolle asetettuje tavoitearvoje kassa? Ratkaisu: Kostruoidaa otosiformaatio ja ruuvie pituude variassi ja odotusarvo tavoitearvoille yhteesopivuude tutkimista varte tarkoituksee sopivat tilastolliset testit. Testausasetelmaa koskevat hypoteesit Määritellää satuaismuuttuja X: Yleie hypoteesi H : X = ruuvi pituus Otoksee poimittuje ruuvie pituudet eivät riipu toisistaa ja ruuvie pituudet vaihtelevat satuaisesti oudattae ormaalijakaumaa: X, X,, X X i ~ N(µ, σ ), i =,,, Pidämme testaukse aikaa kiii yleisestä hypoteesista H. Nollahypoteesi H : Ruuvie pituuksie variassi o korkeitaa. cm : H : Vaihtoehtoie hypoteesi H : σ σ =. cm Ruuvie pituuksie variassi o suurempi kui. cm : H : σ > σ =. cm Ruuvie pituuksie variassia koskevaa ollahypoteesia H voidaa testata s. χ testillä; ks. alla. Nollahypoteesi H : Ruuvie pituuksie odotusarvo yhtyy tavoitearvoosa cm: H : µ = µ = cm Vaihtoehtoie hypoteesi H : Ruuvie pituuksie odotusarvo poikkeaa pituude tavoitearvosta cm: H : µ µ = cm Ruuvie pituuksie odotusarvoa koskevaa ollahypoteesia H voidaa testata s. t testillä: ks. alla. TKK @ Ilkka Melli (6) 4

Tilastolliset meetelmät 8. Tilastollie testaus χ testi variassille Yleie hypoteesi H : Otoksee poimittuje ruuvie pituudet eivät riipu toisistaa ja ruuvie pituudet vaihtelevat satuaisesti oudattae ormaalijakaumaa: Nollahypoteesi H : X, X,, X X i ~ N(µ, σ ), i =,,, Ruuvie pituuksie variassi o korkeitaa. cm : H : Vaihtoehtoie hypoteesi H : σ σ =. cm Ruuvie pituuksie variassi o suurempi kui. cm : H : σ > σ =. cm Käytetää testisuureea χ testisuuretta jossa χ ( ) s = σ s X X = ( i ) i= o havaitoje (harhato) otosvariassi ja σ o ollahypoteesi H kiiittämä parametri σ arvo. Voidaa osoittaa, että testisuure χ oudattaa χ jakaumaa vapaustei ( ), jos yleie hypoteesi H ja ehto σ = σ pätevät (ks. lukua Otokset ja otosjakaumat): χ χ ( ) Esimerki tapauksessa otoksee poimittuje ruuvie pituuksie aritmeettie keskiarvo oli X =.9 cm otoksee poimittuje ruuvie pituuksie otoskeskihajota oli s =.38 cm ja ollahypoteesi H kiiittämä parametri σ arvo oli σ =. cm Site χ testisuuree arvoksi saadaa TKK @ Ilkka Melli (6) 43

Tilastolliset meetelmät 8. Tilastollie testaus χ ( ) s (3 ).38 = = = 3.46 σ. Voidaa osoittaa, että yllä määritelly χ testisuuree ormaaliarvo eli testisuuree odotusarvo ehdo pätiessä o σ = σ E( χ σ = σ ) = χ testisuuree ormaaliarvoosa ( ) verrattua suuret ja pieet arvot viittaavat siihe, että ollahypoteesi H ei päde. Valitaa merkitsevyystasoksi α =.5 Koska vaihtoehtoie hypoteesi H : σ > σ =. cm o yksisuutaie, hylkäysaluee määräämistä varte valitaa kriittie arvo tai raja että Pr( χ χα) = α =.5 χ α site, jossa satuaismuuttuja χ oudattaa χ jakaumaa vapausastei ( ) = 9. Kriittie arvo χ α toteuttaa ehdo χ Pr( χ χ ) = α =.95 (9) jakauma tiheysfuktio χ jakauma taulukoista ähdää, että α Pr(χ 4.557) =.5 ku vapausasteide lukumäärä ( ) = 9. Site haluttu kriittie arvo o: χ α = 4.557 Kuvio oikealla havaiollistaa kriittise arvo määräämistä. Valitaa χ testi hylkäysalueeksi ( χ α, + ) Jos χ testisuuree arvo joutuu hylkäysalueelle, ollahypoteesi H : σ σ hylätää merkitsevyystasolla α =.5. Todeäköisyys, että χ testisuuree arvo joutuu ehdo σ = σ.7.6.5.4.3...95 4.557.5 TKK @ Ilkka Melli (6) 44

Tilastolliset meetelmät 8. Tilastollie testaus pätiessä hylkäysalueelle o α =.5. χ testi hyväksymisalue o muotoa [, χ α ] Jos χ testisuuree arvo joutuu hyväksymisalueelle, ollahypoteesi H : σ σ jätetää voimaa merkitsevyystasolla α. χ 3 testi hylkäys ja hyväksymisalueita voidaa kuvata yksisuutaise vaihtoehtoise hypoteesi H : σ > σ tapauksessa alla olevalla kuviolla: χ α Hyväksymisalue Hylkäysalue Kriittie arvo χ α o määrätty site, että jolloi χ χ = α Pr( α) χ χ = α Pr( α) Esimerki tapauksessa χ testi hylkäys ja hyväksymisalueet saavat seuraava muodo: 4.557 Hyväksymisalue Hylkäysalue Kriittie arvo 4.557 o siis määrätty site, että jolloi Pr( χ 4.557) =.5 Pr( χ 4.557) =.95 TKK @ Ilkka Melli (6) 45

Tilastolliset meetelmät 8. Tilastollie testaus Esimerki tapauksessa otoksesta määrätty χ testisuuree arvo o pieempi kui kriittie arvo χ α : χ = 3.46 < 4.557 = χ α Site testisuuree arvo o joutuut hyväksymisalueelle ja voimme jättää ollahypoteesi H : σ σ =. cm voimaa merkitsevyystasolla α =.5. Johtopäätös: Ruuvie pituude variassi ei ole tilastollisesti merkitsevästi arvoa. cm suurempi. Oletetaa, että ruuveja tekevä koe toimii ii, että ruuvie pituude variassi o jatkuvasti hyväksyttävä suuruista. Tällöi siis ollahypoteesi H : σ σ =. cm pätee koko aja. Oletetaa yt, että poimimme koee tekemie ruuvie joukosta toistuvasti uusia otoksia ja testaamme jokaise otokse perusteella ollahypoteesia H käyttämällä merkitsevyystasoa lukua α =.5 Tällöi joudumme hylkäämää ollahypoteesi H keskimääri 5 kertaa :sta, vaikka ollahypoteesi H pätee koko aja. Esimerki tapauksessa otoksesta määrättyä χ testisuuree arvoa 3.7 vastaava p arvo o χ jakauma taulukoide mukaa p = Pr(χ > 3.7) >. Tämä merkitsee sitä, että χ testisuure saa ormaaliarvoosa ( ) = 9 ähde arvoa 3.7 poikkeuksellisempia arvoja todeäköisyydellä, joka o suurempi kui., jos ollahypoteesi H : σ σ =. cm pätee. Site emme voi hylätä ollahypoteesia H millää tavaomaisella merkitsevyystasolla. Saatu tulos o sopusoiussa merkistevyystasoa käyttävä tekiika avulla saadu tulokse kassa. t testi odotusarvolle Yleie hypoteesi H : Otoksee poimittuje ruuvie pituudet eivät riipu toisistaa ja ruuvie pituudet vaihtelevat satuaisesti oudattae ormaalijakaumaa: Nollahypoteesi H : X, X,, X X i ~ N(µ, σ ), i =,,, Ruuvie pituuksie odotusarvo yhtyy tavoitearvoosa cm: H : µ = µ = cm Vaihtoehtoie hypoteesi H : TKK @ Ilkka Melli (6) 46

Tilastolliset meetelmät 8. Tilastollie testaus Ruuvie pituuksie odotusarvo poikkeaa pituude tavoitearvosta cm: H : µ µ = cm Käytetää testisuureea t testisuuretta jossa t = X X µ s/ Xi i = = o havaitoje aritmeettie keskiarvo, s X X = ( i ) i= o havaitoje (harhato) otosvariassi ja µ ollahypoteesi H kiiittämä odotusarvoparametri µ arvo. Voidaa osoittaa, että testisuure t oudattaa t jakaumaa vapaustei ( ), jos yleie hypoteesi H ja ollahypoteesi H : µ = µ pätevät (ks. lukua Otokset ja otosjakaumat): t t ( ) t testisuure mittaa havaitoje aritmeettise keskiarvo X ja ollahypoteesi H kiiittämä odotusarvoparametri µ arvo µ tilastollista etäisyyttä, jossa mittayksikköä o aritmeettise keskiarvo X keskivirhee σ / estimaattori s/. Esimerki tapauksessa otoksee poimittuje ruuvie pituuksie aritmeettie keskiarvo oli X =.9 cm otoksee poimittuje ruuvie pituuksie otoskeskihajota oli s =.38 cm ja ollahypoteesi H kiiittämä parametri µ arvo oli µ = cm Site testisuuree t arvoksi saadaa X µ.9 t = = = 4.749 s/.38/ 3 Voidaa osoittaa, että edellä määritelly t testisuuree ormaaliarvo eli testisuuree odotusarvo ollahypoteesi pätiessä o H : µ = µ TKK @ Ilkka Melli (6) 47

Tilastolliset meetelmät 8. Tilastollie testaus E(t H ) = t testisuuree itseisarvoltaa suuret arvot viittaavat siihe, että ollahypoteesi H ei päde. Huomautus: Testisuuree t jakauma o symmetrie origo suhtee. Valitaa merkitsevyystasoksi α =.5 Koska vaihtoehtoie hypoteesi H : µ µ = cm o kaksisuutaie, hylkäysaluee määräämistä varte valitaa kriittiset arvot t α/ ja +t α/ site, että Pr( t t ) = Pr( t + t ) =.5 α/ α/ jossa satuaismuuttuja t oudattaa t jakaumaa vapausastei ( ) = 9. Kriittiset arvot t α/ ja +t α/ toteuttavat ehdo Pr( t t + t ) = =.95 α/ α/ α Huomaa, että merkitsevyystasoo α liittyvät kriittiset arvot ovat tässä (kaksisuutaise vaihtoehtoise hypoteesi) tapauksessa täsmällee samat kui luottamustasoo ( α) liittyvät luottamuskertoimet; ks. lukua Väliestimoiti. t jakauma taulukoista ähdää, että Pr(t +.45) =.5 Pr(t.45) =.5 ku vapausasteide lukumäärä ( ) = 9. Site kriittiset arvot ovat: +t α/ = +.45 t α/ =.45 Kuvio oikealla havaiollistaa kriittiste rajoje määräämistä. t testi hylkäysalue o muotoa (, t ) ( + t, + ) α/ α/ Jos t testisuuree arvo joutuu hylkäysalueelle, ollahypoteesi H : µ = µ hylätää merkitsevyystasolla α. Todeäköisyys, että t testisuuree arvo joutuu ollahypoteesi H pätiessä hylkäysalueelle o α. t testi hyväksymisalue o muotoa [ t, + t ] α/ α/.5.4.3.. t(9) jakauma tiheysfuktio.5.95.5.45 +.45 TKK @ Ilkka Melli (6) 48

Tilastolliset meetelmät 8. Tilastollie testaus Jos t testisuuree arvo joutuu hyväksymisalueelle, ollahypoteesi H : µ = µ jätetää voimaa merkitsevyystasolla α. t testi hylkäys ja hyväksymisalueita voidaa kuvata kaksisuutaise vaihtoehtoise hypoteesi tapauksessa alla olevalla kaaviolla: t α / +t α / Hylkäysalue Hyväksymisalue Hylkäysalue Kriittiset arvot t α/ ja +t α/ o määrätty site, että jolloi Pr( t t ) = Pr( t + t ) = / α/ α/ α Pr( t t + t ) = α/ α/ α Esimerki tapauksessa t testi hylkäys ja hyväksymisalueet saavat seuraava muodo:.45 +.45 Hylkäysalue Hyväksymisalue Hylkäysalue Kriittiset arvot.45 ja +.45 o siis määrätty site, että jolloi Pr( t.45) = Pr( t +.45) =.5 Pr(.45 t +.45) =.95 Esimerki tapauksessa otoksesta määrätty t testisuuree arvo o suurempi kui kriittie arvo +t α/ : t = 4.749 >.45 = +t.5 Koska testisuuree arvo o joutuut hylkäysalueelle, voimme hylätä ollahypoteesi H : µ = µ = cm ja hyväksyä vaihtoehtoise hypoteesi TKK @ Ilkka Melli (6) 49

Tilastolliset meetelmät 8. Tilastollie testaus H : µ µ = cm merkitsevyystasolla α =.5. Johtopäätös: Ruuvie keskimääräie pituus poikkeaa tilastollisesti merkitsevästi tavoitearvostaa cm. Saattaa olla syytä pysäyttää ruuveja valmistava koe tarkistusta varte. Oletetaa, että ruuveja tekevä koe toimii ii, että ruuvie pituude odotusarvo o jatkuvasti hyväksyttävä suuruie. Tällöi siis ollahypoteesi H : µ = µ = cm pätee koko aja. Oletetaa yt, että poimimme koee tekemie ruuvie joukosta toistuvasti uusia otoksia ja testaamme jokaise otokse perusteella ollahypoteesia H käyttämällä merkitsevyystasoa lukua α =.5 Tällöi joudumme hylkäämää ollahypoteesi H keskimääri 5 kertaa :sta, vaikka ollahypoteesi H pätee koko aja. Esimerki tapauksessa otoksesta määrätty t testisuuree arvoa 4.749 vastaava p arvo o t jakauma taulukoide mukaa p = Pr(t > 4.749 ) <.5 =. Tämä merkitsee sitä, että t testisuure saa ormaaliarvoosa ähde arvoa 4.749 poikkeuksellisempia arvoja todeäköisyydellä, joka o pieempi kui., jos ollahypoteesi H : µ = µ = cm pätee. Site voimme hylätä ollahypoteesi H kaikilla tavaomaisilla merkitsevyystasoilla. Saatu tulos o sopusoiussa merkistevyystasoa käyttävä tekiika avulla saadu tulokse kassa. 8.9. Tilastolliset testit ja havaitoje mitta asteikoilliset omiaisuudet Havaitoje mitta asteikolliset omiaisuudet ohjaavat testi valitaa; lisätietoja mitta asteikoista: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Tilastolliset testit voidaa ryhmitellä havaitoje mitta asteikolliste omiaisuuksie suhtee seuraavalla tavalla: Testit suhde tai välimatka asteikollisille muuttujille Testit järjestysasteikollisille muuttujille Testit laatueroasteikollisille muuttujille Seuraavissa kolmessa luvussa tarkastellaa suurta joukkoa erilaisia testejä. Tarkasteltavat testit ovat seuraavat: Testejä suhde tai välimatka asteikollisille muuttujille: Yhde otokse t testi ormaalijakauma odotusarvolle Kahde riippumattoma otokse t testi ormaalijakaumie odotusarvoille: Yleie tapaus TKK @ Ilkka Melli (6) 5

Tilastolliset meetelmät 8. Tilastollie testaus Kahde riippumattoma otokse t testi ormaalijakaumie odotusarvoille: Yhtä suurte variassie tapaus t testi parivertailuille Yhde otokse testi ormaalijakauma variassille Kahde riippumattoma otokse testi ormaalijakauma variasseille Ks. lukua Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille: Merkkitesti Wilcoxoi rakitesti Mai ja Whitey testi eli Wilcoxoi rakisummatesti Ks. lukua Testejä järjestysasteikollisille muuttujille. Testejä laatueroasteikollisille muuttujille: Testi suhteelliselle osuudelle Suhteelliste osuuksie vertailutesti Ks. lukua Testejä laatueroasteikollisille muuttujille. TKK @ Ilkka Melli (6) 5

Tilastolliset meetelmät 9. Testejä suhdeasteikollisille muuttujille 9. Testejä suhdeasteikollisille muuttujille 9.. Testit ormaalijakauma parametreille 9.. Yhde otokse t testi odotusarvolle 9.3. Kahde riippumattoma otokse t testi odotusarvoille: Yleie tapaus 9.4. Kahde riippumattoma otokse t testi odotusarvoille: Yhtä suurte variassie tapaus 9.5. t testi parivertailuille 9.6. Yhde otokse χ testi variassille 9.7. Kahde riippumattoma otokse F testi variasseille Tarkastelemme tässä luvussa seuraavia testejä ormaalijakauma parametreille: Yhde otokse t testi odotusarvolle Kahde riippumattoma otokse t testi A odotusarvoille: Yleie tapaus Kahde riippumattoma otokse t testi B odotusarvoille: Yhtä suurte variassie tapaus t testi parivertailuille Yhde otokse χ testi variassille Kahde riippumattoma otokse F testi variasseille Testejä ormaalijakauma odotusarvolle voidaa soveltaa myös moissa sellaisissa tilateissa, joissa havaiot eivät oudata ormaalijakaumaa. Site testejä ormaalijakauma odotusarvolle voidaa pitää yleisiä testeiä suhde (tai välimatka ) asteikolliste satuaismuuttujie odotusarvoparametrille. Avaisaat: Aritmeettie keskiarvo, Asymptoottie testi, F jakauma, F testi, Hylkäysalue, Hylkäysvirhe, Hyväksymisalue, Hyväksymisvirhe, χ jakauma, χ testi, Kahde otokse testi, Kriittie arvo, Merkitsevyystaso, Nollahypoteesi, Normaaliarvo, Normaalijakauma, Odotusarvo, Otos, Otoskeskihajota, Otosvariassi, p arvo, Parametri, Parivertailu, Riippumattomat otokset, Sovitettu pari, Stadardipoikkeama, Suhdeasteikko, t jakauma, t testi, Testisuure, Todeäköisyysjakauma, Variassi, Vertailutesti, Voimakkuus, Välimatka asteikko, Yhde otokse testi, Yleie hypoteesi TKK @ Ilkka Melli (6) 5

Tilastolliset meetelmät 9. Testejä suhdeasteikollisille muuttujille 9.. Suhdeasteikolliste muuttujie testit Normaalijakauma o tilastotietee tärkei jakauma. Oletetaa, että satuaismuuttuja X oudattaa ormaalijakaumaa parametrei µ ja σ : X N( µσ, ) Tällöi parametri µ o ormaalijakauma odotusarvo ja paramaetri σ o ormaalijakauma variassi: µ = E(X) σ = Var(X) Parametrit µ ja σ määräävät täysi ormaalijakauma. Normaalijakauma parametreja koskevat testit voidaa jakaa kahtee ryhmää: Yhde otokse testit Kahde otokse testit Yhde otokse testeissä testataa yksikertaisia ollahypoteeseja, jotka koskevat ormaalijakauma odotusarvo tai variassiparametria. Kahde otokse testit ovat vertailutestejä, joissa verrataa kahde ormaalijakauma odotusarvo tai variassiparametreja toisiisa. Tässä luvussa tarkastellaa seuraavia testejä ormaalijakauma parametreille: Yhde otokse t testi odotusarvolle Kahde riippumattoma otokse t testi A odotusarvoille: Yleie tapaus Kahde riippumattoma otokse t testi B odotusarvoille: Yhtä suurte variassie tapaus t testi parivertailuille Yhde otokse χ testi variassille Kahde riippumattoma otokse F testi variasseille Testejä ormaalijakauma odotusarvolle voidaa soveltaa myös moissa sellaisissa tilateissa, joissa havaiot eivät oudata ormaalijakaumaa. Tämä perustuu seuraavii seikkoihi: (i) (ii) Testit odotusarvolle perustuvat havaitoje aritmeettisii keskiarvoihi. Keskeise raja arvolausee mukaa myös ei ormaaliste havaitoje aritmeettiset keskiarvot oudattavat tietyi ehdoi suurissa otoksissa approksimatiivisesti ormaalijakaumaa. Tämä merkitsee sitä, että testejä ormaalijakauma odotusarvolle voidaa pitää yleisiä testeiä suhde (tai välimatka ) asteikolliste satuaismuuttujie odotusarvoparametrille; mitta asteikot: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Se sijaa testit ormaalijakauma variassille eivät yleesä ole käyttökelpoisia ei ormaalisille havaioille ja tilae ei välttämättä parae suurillakaa havaitoje lukumäärillä. TKK @ Ilkka Melli (6) 53

Tilastolliset meetelmät 9. Testejä suhdeasteikollisille muuttujille 9.. Yhde otokse t testi odotusarvolle Testausasetelma yhde otokse t testissä Olkoo X i, i =,,, satuaisotos ormaalijakaumasta N(µ,σ ). Tällöi satuaismuuttujat X i, i =,,, ovat riippumattomia ja oudattavat samaa ormaalijakaumaa N(µ,σ ): X, X, L, X Xi N( µσ, ), i =,, K, Asetetaa ormaalijakauma N(µ,σ ) odotusarvo eli paikkaparametrille µ ollahypoteesi H :µ = µ Ogelma: Ovatko havaiot sopusoiussa hypoteesi H kassa? Ratkaisu: Yhde otokse t testi. Hypoteesit yhde otokse t testissä Yleie hypoteesi H : Nollahypoteesi: X, X, K, X X i i ~ N( µσ, ), =,, K, H :µ = µ Vaihtoehtoiset hypoteesit: H: µ > µ H: µ < µ H : µ µ suutaiset vaihtoehtoiset hypoteesit suutaie vaihtoehtoie hypoteesi Parametrie estimoiti yhde otokse t testissä Olkoot ja X Xi i = = s X X = ( i ) i= tavaomaiset harhattomat estimaattorit ormaalijakauma parametreille µ ja σ. Tuusluku X o havaitoje X i, i =,,, aritmeettie keskiarvo ja s o havaitoje X i, i =,,, (harhato) otosvariassi. TKK @ Ilkka Melli (6) 54

Tilastolliset meetelmät 9. Testejä suhdeasteikollisille muuttujille Testisuure ja se jakauma yhde otokse t testissä Määritellää t testisuure Jos ollahypoteesi t = X µ s/ H :µ = µ pätee, ii testisuure t oudattaa t jakaumaa vapausastei ( ): Perustelu: t t ( ) Oletetaa, että testi yleie hypoteesi H ja ollahypoteesi H pätevät: X, X, K, X X i i ~ N( µσ, ), =,, K, Koska tällöi (ks. lukua Otokset ja otosjakaumat) ii X σ = Xi N µ, i= X µ Z = N(,) σ / Koska stadardipoikkeama σ o tutemato, satuaismuuttuja Z o testisuureea epäoperatioaalie. Jos stadardipoikkeama σ korvataa satuaismuuttuja Z lausekkeessa vastaavalla otossuureella s = ( Xi X) i= ii saadaa t testisuure t = X µ s/ joka ollahypoteesi H pätiessä oudattaa t jakaumaa vapausastei ( ): t t( ) Todistus: ks. lukua Otokset ja otosjakaumat. Testisuure t mittaa havaitoarvoje aritmeettise keskiarvo X ja ollahypoteesi H kiiittämä odotusarvoparametri µ arvo µ tilastollista etäisyyttä. Mittayksikköä o erotukse TKK @ Ilkka Melli (6) 55

Tilastolliset meetelmät 9. Testejä suhdeasteikollisille muuttujille stadardipoikkeama X µ σ / estimaattori, jota määrättäessä o oletettu, että ollahypoteesi H pätee. Testisuuree t ormaaliarvo =, koska ollahypoteesi H pätiessä E(t) = Site itseisarvoltaa suuret testisuuree t arvot viittaavat siihe, että ollahypoteesi H ei päde. Hylkäysaluee määräämie yhde otokse t testissä Valitaa testi merkitsevyystasoksi α. (i) Jos vaihtoehtoie hypoteesi o muotoa H:µ > µ ii kriittie arvo +t α saadaa ehdosta Pr( t + t α ) = α jossa t t ( ). Testi hylkäysalue o tällöi muotoa ( + t α, + ) (ii) Jos vaihtoehtoie hypoteesi o muotoa H:µ < µ ii kriittie arvo t α saadaa ehdosta Pr( t t α ) = α jossa t t ( ). Testi hylkäysalue o tällöi muotoa ( t, α ) (iii) Jos vaihtoehtoie hypoteesi o muotoa H:µ µ ii kriittiset arvot t α/ ja +t α/ saadaa ehdoista Pr( t t ) = α/ α/ Pr( t + t ) = α/ α/ jossa t t ( ). Testi hylkäysalue o tällöi muotoa (, t ) ( + t, + ) α/ α/ Nollahypoteesi hylätää, jos testisuuree arvo osuu hylkäysalueelle. TKK @ Ilkka Melli (6) 56

Tilastolliset meetelmät 9. Testejä suhdeasteikollisille muuttujille Alla olevat kuviot havaiollistavat testi hylkäysaluee määräämistä: > H:µ < µ H:µ µ H:µ µ t ( ) t ( ) t ( ) α α α α α α α + t α t α t α / / +t α Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue p arvo määräämie yhde otokse t testissä Olkoo t testisuuree havaittu arvo t. Alla olevat kuviot havaiollistavat testi p arvo määräämistä: > H:µ < µ H:µ µ H:µ µ t ( ) t ( ) t ( ) p p p t + t Nollahypoteesi hylätää, jos testi p arvo o kylli piei. Normaalisuusoletukse merkitys yhde otokse t testissä Yhde otokse t testi yleisessä hypoteesissa oletetaa, että havaiot ovat ormaalijakautueita. t testi ei kuitekaa ole herkkä poikkeamille ormaalisuudesta, jos havaitoje lukumäärä o kylli suuri. Testiä o melko turvallista käyttää, ku havaitoje lukumäärä > 5 ellei havaitoje jakauma ole kovi vio ja havaitoje joukossa ole poikkeavia havaitoja. Jos havaitoje lukumäärä > 4 p p p p t t Testi p arvo = p Testi p arvo = p Testi p arvo = p testiä voidaa melko turvallisesti käyttää jopa selvästi vioille havaitoje jakaumille. TKK @ Ilkka Melli (6) 57