1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
2 Virheellisten komponenttien osuus tuotannossa? H 0 : π = π 0 H 1 : π > π 0 Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
3 Asuntojen keskimääräisen neliöhinnat keskustassa ja lähiössä? H 0 : µ 1 = µ 2 H 1 : µ 1 > µ 2 Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
4 Puolueen kannatus miesten ja naisten keskuudessa? H 0 : π 1 = π 2 H 1 : π 1 π 2 Nollahypoteesi Vaihtoehtoinen hypoteesi (kaksisuuntainen)
5 Esim. 1 Perunalastupussien valmistaja ilmoittaa pussien keskipainoksi 340 g. Oletetaan painon vaihtelun olevan normaalijakautunut hajontana 10 g. Tutkitaan väitettä ja tehdään 9 alkion satunnaisotos. Otoskeskiarvoksi saadaan 336 g. H 0 : µ = 340 g H 1 : µ < 340 g Tilastollinen hypoteesi Jos H 0 on tosi, niin X ~N (340, 102 9 ).
6 Tällöin Z = X 340 10/3 ~N (0, 1) Otossuure, jonka jakauma tunnetaan, kun H 0 tosi. Otossuureesta käytetään nimitystä testisuure.
7 z havaittu = 336 340 10/3 = 1,2 Testisuureen arvo otoksesta laskettuna, päättely tämän perusteella
8 Hyväksytäänkö vai hylätäänkö nollahypoteesi H 0? Hyväksytään H 0, jos otoksesta laskettu testisuureen arvo kuuluu tavanomaisiin arvoihin. Jos otoksesta laskettu testisuureen arvo kuuluu harvinaisiin arvoihin, niin H 0 hylätään ja H 1 hyväksytään.
9 Mikä on harvinaista? Testisuure noudattaa H 0 :n ollessa tosi standardoitua normaalijakaumaa, joten harvinaisina arvoina voidaan pitää esimerkiksi -1,65 = -z 0,05 pienempiä arvoja. Jos tehdään näin, niin suoritetaan testaus 5 %:n merkitsevyys- eli riskitasolla, ja hyväksytään H 0.
10
11 Usein riskitaso =0,05, 0,025, 0,01, 0,001 Voidaan määrittää myös pienin riskitaso, jolla H 0 voidaan hylätä. Tätä kutsutaan p arvoksi. Nyt jos H 0 tosi, niin P(Z -1,2) = 1 Φ(1,2) = 0,1151 = p-arvo. Tätä suuremmilla riskeillä H 0 voidaan hylätä. Ei oteta näin suurta riskiä!
12 6.1 Erilaisia testejä 6.1.1 Yhden populaation odotusarvoa koskeva päättely H 0 : µ = µ 0 Olk. X 1, X 2,..., X n on satunnaisotos N(µ, σ 2 ):sta, missä σ 2 tunnettu.
13 Jos H 0 on tosi, niin Z = X μ 0 σ/ n ~N (0, 1).
Jos H 1 : µ µ 0, niin H 0 hylätään riskitasolla, jos otoksesta laskettu z hav > z /2. 14
Pienin riskitaso, jolla H 0 voidaan hylätä, on 2P(Z> z hav ). 15
Jos H 1 : µ > µ 0, niin H 0 hylätään riskitasolla, jos otoksesta laskettu z hav > z. 16
Pienin riskitaso, jolla H 0 voidaan hylätä, on P(Z>z hav ). 17
Jos H 1 : µ < µ 0, niin H 0 hylätään riskitasolla, jos otoksesta laskettu z hav < -z. 18
Pienin riskitaso, jolla H 0 voidaan hylätä, on P(Z<z hav ). 19
20 Esim. 2 Valtakunnallisessa matematiikan kokeessa tulospistemäärä on noudattanut normaalijakaumaa parametrein 64 ja 64. Eräänä vuonna erään koulun 54 oppilaan keskiarvo oli 68. Voidaanko koulua pitää poikkeavana? H 0 : µ = 64 H 1 : µ > 64 Jos H 0 on tosi, niin Z = X μ 0 σ/ n ~N (0, 1). Tässä siis Z = X 64 64/ n ~N (0, 1).
21 Otoksesta saadaan z hav. = 68 64 64/ 54 = 3,67.
Esim. 3 Tutkija olettaa, että reagointiaika erääseen ärsykkeeseen on keskimäärin alle 6 sekuntia. Mitattiin 25 henkilön reagointiajat ja saatiin keskiarvoksi 5,2 s. Oletetaan, että reagointiaika on normaalisti jakautunut hajontana 2 s. Onko tutkija oikeassa? 22 H 0 : µ = 6 H 1 : µ < 6 Jos H 0 on tosi, niin Z = X μ 0 σ/ n ~N(0, 1). Tässä µ 0 = 6, = 2.
23 Saadaan z hav. = 5,2 6 2/ 25 = 2. Pienin riskitaso, jolla H 0 voidaan hylätä, on P(Z<-2) = 1- Φ(2) = 1 0,9772 = 0,0228. Jos valitaan riskitaso, joka on tätä suurempi, niin H 0 hylätään ja H 1 hyväksytään (tutkija oikeassa). Jos valitaan esim. 2 %:n riskitaso, H 0 hyväksytään. Päätellään, että tukija väärässä.
24 Päättely taulukkoarvojen perusteella: Jos valitaan 5 %:n riskitaso, niin harvinaisten arvojen raja on z 0,05 = -1,65. Koska -2 < -1,65, niin H 0 hylätään ja H 1 hyväksytään. Jos valitaan 1 %:n riskitaso, niin harvinaisten arvojen raja on z 0,01 = -2,33. Koska -2 > -2,33, niin H 0 hyväksytään.
Esim. 4 Riisipussien pakkauskoneen pitäisi tuottaa keskimäärin kilon pusseja. Painon oletetaan vaihtelevan normaalijakauman mukaisesti keskihajonnan ollessa 2,1 g. Tutkitaan koneen toimivuutta. Punnitaan satunnaisesti valitut 20 pussia, joiden keskipainoksi saadaan 1001 g. Toimiiko kone oikein? H 0 : µ = 1000 H 1 : µ 1000 Jos H 0 on tosi, niin Z = X μ 0 σ/ n ~N(0, 1). 25
Saadaan z hav. = 1001 1000 2,1/ 20 = 2,13 Pienin riskitaso, jolla H 0 voidaan hylätä, on 2P(Z>2,13) = 2(1-Φ(2,13)) = 2(1 0,9834) = 0,0338. Jos valitaan riskitaso, joka on tätä suurempi, niin H 0 hylätään ja H 1 hyväksytään (päätellään: kone ei toimi oikein). Jos valitaan esim. 1 %:n riskitaso, H 0 hyväksytään (päätellään: kone toimii oikein). 26
27 Päättely taulukkoarvojen perusteella: Jos valitaan 5 %:n riskitaso, niin harvinaisten arvojen raja on z 0,05/2 = 1,96. H 0 hylätään, H 1 hyväksytään. Jos valitaan 1 %:n riskitaso, niin harvinaisten arvojen raja on z 0,01/2 = 2,57. H 0 hyväksytään.