10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset (sademäärät mm:nä) on annettu alla olevassa taulukossa. estaa hypoteesia, että mittarit näyttävät keskimäärin samalla tavalla, kun vaihtoehtoisena hypoteesina on, että mittarit näyttävät keskimäärin eri tavalla. Käytä testissä 5% merkitsevyystasoa. Laite 1 2 3 4 5 6 7 8 9 10 A 1.38 9.69 0.39 1.42 0.54 5.94 0.59 2.63 2.44 0.56 B 1.42 10.37 0.39 1.46 0.55 6.15 0.61 2.69 2.68 0.53 Riippumattomien otosten t-testi ei ole ole tässä tehtävässä luvallinen, koska havainnot riippuvat pareittain toisistaaan. Jos laitteet toimivat edes jossakin määrin luotettavasti, A- ja B- laitteet antavat samalle sadepäivälle (so. samalle sateelle) toisiaan lähellä olevia mittaustuloksia, toisin sanoen mittausten välillä pitäisi olla voimakas positiivinen korrelaatio. ässä aineistossa Cor(A mittaus, B mittaus) = 0.9997. Koska otokset siis riippuvat toisistaan, toimitaan tällaisessa parivertailutilanteessa seuraavasti: Määrätään havaintoarvojen parikohtaiset erotukset ja testataan nollahypoteesia, jonka mukaan nämä erotukset ovat keskimäärin nollia. Olkoon X Ai = havaintoarvo ryhmässä A, i = 1, 2,..., 10 X Bi = havaintoarvo ryhmässä B, i = 1, 2,...,10 D i = X Ai X Bi, i = 1, 2,...,10 Hypoteesit: H 0 : E(D i ) = 0, i = 1, 2,..., n H 1 : E(D i ) 0, i = 1, 2,..., n estisuureena on = D s D / n, jossa D = 1 n n i=1 D i, s 2 D = 1 ( n ) Di 2 nd 2 n 1 i=1 Jos H 0 pätee, testisuure noudattaa Studentin t-jakaumaa vapausastein df = n 1 = 9. Nyt saadaan D = 0.127, s 2 D = 0.046 ja =.88. Koska käytämme kaksisuuntaista vaihtoehtohypoteesia (H 1 ) ja merkitsevyystaso α = 0.05 saadaan kriittisiksi arvoiksi t-jakauman taulukosta ±t α/2 (n 1) = ±t 0.025 (9) = ±2.262 ja hylkäysalue on siis näiden arvojen ulkopuolisilla jakauman hännillä. t 0.025 (9) t 0.025 (9)
(Mallikuvassa hylkäysalueet on merkitty poikkiviivoituksella.) Nyt.262 <.88 < 2.262, joten testisuure ei ole hylkäysalueessa ja nollahypoteesi jää siis voimaan. Mittarit näyttävät keskimäärin samalla tavalla. D2. Erään tuotteen valmistaja väittää, että tuotteista korkeintaan 5% on viallisia. Asiakas poimii otoksen, jonka koko on 200 ja löytää 19 viallista. Onko valmistajan väite oikeutettu? estaa hypoteesia, että valmistajan väite on oikeutettu, kun vaihtoehtoisena hypoteesina on, että viallisten suhteellinen osuus on suurempi kuin valmistajan väittämä 5%. Käytä testissä 1% merkitsevyystasoa. (Käytettävä testi (7.1) löytyy kaavakokoelmasta sivulta 92.) estataan siis suhteellista osuutta p. H 0 : p = 0.05 H 1 : p > 0.05 estin suorittamiseen tarvittavat arvot p 0 = 0.05 eli nollahypoteesin mukainen p:n arvo, ˆp = 19/200 = 0.095, n = 200, α = 0.01 ja näiden (neljän ensimmäisen) avulla laskettu testisuureen arvo on Z = ˆp p 0 p0 (1 p 0 ) n = 0.095 0.05 0.05 0.95 200 2.91 Kriittinen arvo on z α = z 0.01 = 2.33, koska kyseessä on yksisuuntainen testi. Nyt siis hylkäysalue on oikeanpuoleinen normaalijakauman häntä arvon z 0.01 = 2.33 ulkopuolella. Z z 0.01 Koska Z = 2.91 > 2.33 nollahypoteesi hylätään ja vaihtoehtoinen hypoteesi hyväksytään. Viallisten osuus on tilastollisesti merkitsevästi valmistajan ilmoittamaa suurempi. D3. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO 2 -pitoisuus. ulokset (otoskoot ja otosten tunnusluvut): A K n 10 16 x 64.94 57.06 s 2 9.0 7.29 Oletetaan mittaustulosten noudattavan kummassakin kohteessa normaalijakaumaa. a) estaa hypoteesit H 0 : σa 2 = σ2 K, H 1 : σa 2 > σ2 K merkitsevyystasolla (eli riskitasolla) 0.01. b) estaa hypoteesit H 0 : µ A = µ K, H 1 : µ A µ K merkitsevyystasolla 0.01.
Koska nyt ei tiedetä, ovatko jakaumien varianssit yhtäsuuret vai eivät, testataan ensin varianssien yhtäsuuruutta, ja vasta sen jälkeen odotusarvojen yhtäsuuruutta: a) H 0 : σa 2 = σ2 K H 1 : σa 2 > σ2 K arvittavat arvot: s 2 A = 9.0, s2 K = 7.29, n A = 10, n K = 16 ja α = 0.01. F-testisuureen arvoksi saadaan F = s2 A s 2 = 9.0 K 7.29 1.235 Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan vapausasteparametreilla n A 1 ja n K 1 eli toisin sanoen F F(df 1, df 2 ) = F(n A 1, n K 1) = F(9, 15). Kriittiseksi arvoksi saadaan F α (df 1, df 2 ) = F 0.01 (9, 15) = 3.895 ja koska F = 1.235 < F 0.01 (9, 15) = 3.895 ei nollahypoteesia hylätä. F F 0.05 (9, 15) Variansseja voidaan pitää yhtäsuurina. b) Koska edellinen testi päätyi pitämään variansseja yhtäsuurina käytemme odotusarvojen testaamiseen testiä 6.2.2, joka löytyy kaavakokoelman sivulta 87. H 0 : µ A = µ K H 0 : µ A µ K arpeelliset lukuarvot: x A = 64.94, x K = 57.06, s 2 A = 9.0, s2 K = 7.29, n A = 10, n K = 16 ja lisäksi tarvitaan yhdistetty varianssiestimaatti joka saadaan seuraavalla tavalla: s 2 p = (n A 1)s 2 A + (n K 1)s 2 K n A + n K 2 = 9 9.0 + 15 7.29 10 + 15 2 7.93 Kaikkien näiden tietojen avulla voimme lopulta laskea t-jakautuneen testisuureen arvon: = x A x K s p 1 n A + 1 n K 6.941 Koska vaihtoehtoinen hypoteesi on kaksisuuntainen ja käytetty testisuure noudattaa nollahypoteesin pätiessä t-jakaumaa vapausasteilla n A + n K 2 = 10 + 16 2 = 24, saadaan kriittisiksi arvoiksi ±t α/2 (n A + n K 2) = ±t 0.005 (24) = ±2.797. Hylkäysalue on näiden rajojen ulkopuolella ja nyt t 0.005 (24) = 2.797 < = 6.941, joten nollahypoteesi hylätään.
t 0.005 (24) t 0.005 (24) 7 6 5 4 4 5 6 7 Odotusarvojen kaksisuuntaisen vertailutestin (merkitsevyystaso 0.05) mukaan kohteen A SiO 2 -pitoisuus on keskimäärin suurempi kuin kohteen K. P4. ehdas valmistaa nauloja. Naulojen tavoitepituus on 15 cm. Naulojen pituus vaihtelee kuitenkin satunnaisesti noudattaen normaalijakaumaa. Naulojen joukosta poimittiin yksinkertainen satunnaisotos, jonka koko oli 40. Otoskeskiarvoksi saatiin 15.05 cm ja otosvarianssiksi 0.01 cm 2. estaa hypoteesia, että valmistettujen naulojen todellinen keskimääräinen pituus on tavoitearvon mukainen, kun vaihtoehtoisena hypoteesina on, että keskimääräinen pituus on tavoitearvoa suurempi. Käytä testissä 1% merkitsevyystasoa. 1 p. Koska kyseessä on yksinkertainen satunnaisotos normaalijakaumasta ja haluamme testata odotusarvoa käytämme testiä 6.1.1. kaavakirjan sivulta 84. H 0 : µ = 15cm H 1 : µ > 15cm estin suorittamiseksi tarvitsemme lisäksi seuraavat numeroarvot: x = 15.05cm, s = 0.1cm, n = 40, α = 0.01, µ 0 = 15cm ja näiden perusteella laskettu testisuureen arvo on = x µ 0 s/ n = 15.05 15 0.1/ 40 3.162 Koska vaihtoehtoinen hypoteesi on yksisuuntainen ja käytetty testisuure noudattaa nollahypoteesin pätiessä t-jakaumaa vapausasteilla n 1, saadaan kriittiseksi arvoksi t α (n 1) = t 0.01 (39) t 0.01 (40) = 2.423. Hylkäysalue on nyt t-jakauman oikeanpuoleisella hännällä kriittisen arvon yläpuolella. t 0.01 (40)
Koska t α (n 1) 2.423 < 3.162, nollahypoteesi hylätään ja vaihtoehtoinen hypoteesi hyväksytään. ehdas tuottaa keskimäärin liian pitkiä nauloja. P5. Verenpainelääkkeen testauksessa samojen potilaiden (8 kpl) verenpaine mitattiin ennen lääkkeen nauttimista ja sen jälkeen. Koetulokset (verenpaineet mm/hg) on esitetty ao. taulukossa. estaa hypoteesia, että lääke ei keskimäärin vaikuta verenpaineeseen, kun vaihtoehtoisena hypoteesina on, että verenpaine ei ole enää samalla tasolla lääkkeen nauttimisen jälkeen. (Kaksisuuntainen vaihtoehto hypoteesi.) Käytä testissä 1% merkitsevyystasoa. Potilas 1 2 3 4 5 6 7 8 Jälkeen 128 176 110 149 183 136 118 158 Ennen 134 174 118 152 187 136 125 168 1 p. Riippumattomien otosten t-testi ei ole ole tässä tehtävässä luvallinen, koska havainnot riippuvat pareittain toisistaaan. Koska Ennen- ja Jälkeen-otokset siis riippuvat toisistaan, toimitaan tällaisessa parivertailutilanteessa seuraavasti: Määrätään havaintoarvojen parikohtaiset erotukset ja testataan nollahypoteesia, jonka mukaan nämä erotukset ovat keskimäärin nollia. Olkoon X Ei = havaintoarvo ryhmässä Ennen, i = 1, 2,..., 8 X Ji = havaintoarvo ryhmässä Jälkeen, i = 1, 2,..., 8 D i = X Ei X Ji, i = 1, 2,...,8 Hypoteesit: H 0 : E(D i ) = 0, i = 1, 2,..., n H 1 : E(D i ) 0, i = 1, 2,..., n estisuureena on = D s D / n, jossa D = 1 n n i=1 D i, s 2 D = 1 ( n ) Di 2 n 1 nd2 i=1 Jos H 0 pätee, testisuure noudattaa Studentin t-jakaumaa vapausastein df = n 1 = 7. Nyt saadaan D = 4.5, s 2 D = 16.6 ja =.13. Koska käytämme kaksisuuntaista vaihtoehtohypoteesia (H 1 ) ja merkitsevyystaso α = 0.01 saadaan kriittisiksi arvoiksi t-jakauman taulukosta ±t α/2 (n 1) = ± 0.005 (7) = ±3.499 ja hylkäysalue on siis näiden arvojen ulkopuolisilla jakauman hännillä. t 0.005 (7) t 0.005 (7) 4 4 Nyt.499 <.13 < 3.499, joten testisuure ei ole hylkäysalueessa ja nollahypoteesi jää siis voimaan. Lääke ei keskimäärin muuta verenpainetta.
P6. utkittiin suojaavan pinnoitteen vaikutusta akselin kulumiseen. Yhteenveto havainnoista on esitetty ao. taulukossa. X 1 Pinnoite X 2 Ei pinnoitetta n i 15 21 x i 0.72 0.93 s 2 i 0.0063 0.0450 Oletetaan, että mitattuja muuttujia voidaan pitää normaalijakautuneina. a) Voidaanko jakaumien variansseja pitää yhtäsuurina? (merkitsevyystaso 0.05) b) odistaako havaintoaineisto tilastollisesti merkitsevyystasolla 0.01, että pinnoitus vähentää kulumista? Ohje: estaa a)-kohdassa varianssien yhtäsuuruutta testillä 6.3.2. (Mellin s. 91) ja b)-kohdassa a)- kohdan tuloksen mukaan odotusarvojen yhtäsuuruutta joko testillä 6.2.1. (Mellin s. 86) tai testillä 6.2.2. (Mellin s. 87). 2 p. Koska nyt ei tiedetä, ovatko jakaumien varianssit yhtäsuuret vai eivät, testataan ensin varianssien yhtäsuuruutta, ja vasta sen jälkeen odotusarvojen yhtäsuuruutta: a) H 0 : σ1 2 = σ2 2 H 1 : σ1 2 > σ2 2 arvittavat arvot: s 2 1 = 0.0063, s 2 2 = 0.0450, n 1 = 15, n 2 = 21 ja α = 0.05. F-testisuureen arvoksi saadaan (kun valitaan isompi variansseista osoittajaan taulukon lukemisen yksinkertaistamiseksi) F = s2 2 s 2 = 0.0450 1 0.0063 7.1429 Huomaa miten päin otosvarianssit on sijoitettu testisuureen kaavaan. Jos nollahypoteesi pitää paikkansa on F-testisuure jakautunut Fisherin F-jakauman mukaan vapausasteparametreilla n 2 1 ja n 1 1 eli toisin sanoen F F(df 2, df 1 ) = F(n 2 1, n 1 1) = F(20, 14). Kriittiseksi arvoksi saadaan F α (df 2, df 1 ) = F 0.05 (20, 14) = 2.388 Koska F 0.05 (20, 14) = 2.388 < F = 7.1429 nollahypoteesi hylätään. F 0.05 (20, 14) F Varianssit ovat erisuuria. b) Koska edellinen testi päätyi pitämään variansseja erisuurina käytemme odotusarvojen testaamiseen testiä 6.2.1, joka löytyy kaavakokoelman sivulta 86. H 0 : µ 1 = µ 2 H 0 : µ 1 < µ 2 arpeelliset lukuarvot: x 1 = 0.72, x 2 = 0.93, s 2 1 = 0.0063, s2 2 = 0.0450, n 1 = 15, n 2 = 21
Näiden tietojen avulla voimme lopulta laskea t-jakautuneen testisuureen arvon: = x 1 x 2 s 2 1 + s2 2 n 1 n 2 = 0.72 0.93 0.0063 + 0.0450 15 21 4.1482 Koska vaihtoehtoinen hypoteesi on yksisuuntainen ja käytetty testisuure noudattaa nollahypoteesin pätiessä t-jakaumaa vapausasteilla f = min{(n 1 1), (n 2 1)} = 14, saadaan kriittiseksi arvoksi t α (f) = t 0.01 (14) =.624. Hylkäysalue on tämän rajan vasemmalla puolella ja nyt t 0.01 (14) =.624 > = 4.1481, joten nollahypoteesi hylätään. t 0.01 (14) 4 Pinnoitus vähentää akselin kulumista. 4 L7. 600 erääseen vakavaan tautiin sairastunutta potilasta jaettiin satunnaisesti kahteen ryhmään (A ja B), joissa kummassakin oli 300 potilasta. Ryhmälle A annettiin tautiin kehitettyä uutta lääkettä ja ryhmälle B yleisesti käytettyä vanhaa lääkettä. Suosittelisitko uuden lääkkeen ottamista käyttöön koetuloksen perusteella kun a) ryhmässä A taudista parani 195 potilasta ja ryhmässä B 225 potilasta? b) ryhmässä A taudista parani 225 potilasta ja ryhmässä B 195 potilasta? a) Jos uusi lääke parantaa vähemmän potilaita kuin vanha lääke, ei tarvita testausta sen johtopäätöksen tekmiseksi, että uutta lääkettä ei kannata ottaa käyttöön. b) Käytetään suhteellisten osuuksien vertailutestiä: H 0 : p A = p B H 1 : p A > p B arvittavat lukuarvot: ˆp A = 225/300 = 0.75, ˆp B = 195/300 = 0.65, n A = n B = 300, α = 0.05 (koska ei ole erikseen käsketty käyttää mitään tiettyä merkitsevyystasoa). Lisäksi tarvitaan yhdistetyn suhteellisen osuuden estimaatti: ˆp = n Aˆp A + n B ˆp B n A + n B = 0.70
estisuureen arvoksi saadaan: ˆp A ˆp B Z = ( 1 ˆp(1 ˆp) + 1 ) 2.67 n A n B estisuure on nollahypoteesin pätiessä approksimatiivisesti N(0, 1)-jakautunut. Kriittiseksi arvoksi saadaan z α = z 0.05 = 1.65 ja hylkäysalue on tämän rajan oikealla puolella. Koska z 0.05 = 1.65 < Z 2.67, nollahypoteesi hylätään. z 0.05 Z Uuden lääkkeen käyttöönotto on perusteltua. L8. Alueella A 300:sta satunnaisotokseen poimitusta äänioikeutetusta 56% kannatti ehdokasta X. Alueella B ehdokkaan X kannatus 200:n satunnaisotokseen poimitun äänioikeutetun joukossa oli 48%. Muodosta testi nollahypoteesille, että kannatukset eivät eroa alueilla A ja B toisistataan. estaa nollahypoteesia 5% merkitsevyystasolla, kun vaihtoehtoisena hypoteesina on a) X:n kannatus on alueella A suurempaa kuin alueella B, b) X:n kannatus eroaa alueilla A ja B. Käytetään samaa testiä kuin edellisessä tehtävässä ja lasketaan ensin kaikki paitsi kriittiset rajat: H 0 : p A = p B arvittavat lukuarvot: ˆp A = 0.56, ˆp B = 0.48, n A = 300, n B = 200, α = 0.05. Lisäksi tarvitaan yhdistetyn suhteellisen osuuden estimaatti: estisuureen arvoksi saadaan: ˆp = n Aˆp A + n B ˆp B n A + n B = 0.53 ˆp A ˆp B Z = ( 1 ˆp(1 ˆp) + 1 ) 1.76 n A n B estisuure on nollahypoteesin pätiessä approksimatiivisesti N(0, 1)-jakautunut.
a) H 1 : p A > p B Kriittiseksi arvoksi saadaan siis z α = z 0.05 = 1.65 ja hylkäysalue on tämän rajan oikealla puolella. Koska z 0.05 = 1.65 < Z 1.76, nollahypoteesi hylätään. X:n kannatus on suurempaa alueella A. z 0.05 Z b) H 1 : p A p B Kriittisiksi arvoiksi saadaan siis ±z α/2 = ±z 0.025 = ±1.96 ja hylkäysalue on näiden rajojen ulkopuolella. Koska z 0.05 =.96 < Z 1.76 < z 0.05 = 1.96, nollahypoteesia ei hylätä. X:n kannatus ei eroa alueilla A ja B. Huomaa, että testin tulos riippuu sekä valitusta merkitsevyystasosta että vaihtoehtoisen hypoteesin muodosta. Käytännössä nämä on valittava erikseen jokaista tilannetta varten ja raportoidessa ilmoitettava luonnollisesti, miten testi suoritettiin. Z z 0.025 z 0.025