17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten noudattavan kummassakin kohteessa normaalijakaumaa. Ovatko varianssit yhtä suuret? Testaa merkitsevyystasolla. Ratkaisu: Tässä ei ole annettu mitään tietoa numeroarvojen lisäksi jonka perusteella olisi odotettavissa, että toinen variansseista olisi toista suurempi joten ainoa järkevä nollahypoteesi on silloin À Ã. Tarvittavat arvot:, Ã,, à ja «. F-testisuureen arvoksi saadaan à Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan vapausasteparametreilla ja à eli toisin sanoen µ à µ µ. Kriittisiksi arvoiksi saadaan «µ µ oikeanpuolisen hylkäysalueen alarajana (jota tosin tässä tapauksessa ei tarvita) on µ µµ vasemmanpuolisen hylkäysalueen ylärajana ja koska ei nollahypoteesia hylätä. (-arvoksi saadaan noin joten hylkäämiseen ei todellakaan ole syytä.) Tässä siis käytettiin hyväksi se tosiasia, että jos Ñ µ niin ѵ ja ÈÖ µ ÈÖ µ. Variansseja voidaan pitää yhtäsuurina. 2. Oletetaan, että, ja, muodostavat satunnaisotoksia jakaumista Æ µ ja Æ µ. Olkoon nollahypoteesina À. Mikä on todennäköisyys, että nollahypoteesi hylätään kun käytetään -testisuuretta varianssien yhtäsuuruuden testaamiseen merkitsevyystasolla jos todellisuudessa ja ja. Ratkaisu: Testisuure on Ë Ë ja nollahypoteesi hylätään jos «µ Koska µë oletuksilla pätee todellisuudessa µ niin annetuilla µë µë µ
Näin ollen ÈÖ nollahypoteesi hylätään µ ÈÖ «µµ ÈÖ «µ Tämä voidaan laskea numeerisesti µ-jakauman kertymaäfunktion avulla ja jos esimerkiksi «, ja saadaan hylkäämistodennäköisyys :n funktiona: 1 º 0.5 1 2 3. Kun on saatu havaintoarvoja, jotka nollahypoteesin mukaan noudattavat ÖÓÙÐÐ µjakaumaa ja halutaan testata nollahypoteesia À niin voidaan joko testata poikeaako suhteellinen havaittu osuus liian paljon arvosta käyttämällä normaaliapproksimaatiota tai sitten voidaan käyttää -testiä jakaumien vertailuun. Mikä on ero näiden menetelmien välillä? Ratkaisu: Oletetaan siis, että havaintoina on saatu Ñ nollaa ja ykköstä jolloin havaituksi suhteelliseksi osuudeksi tulee Ñ Edellisessä tapauksessa testisuure on Þ Ñ Jälkimmäisessä tapauksessa todetaan että nollien odotusarvo on odotusarvoksi tulee Ñ µ joten saadaan seuraava taulukko: Havaitut Ó Odotetut Nollat Ñ µ Ñ µ Ykköset Ñ µ -testin testisuureksi tulee Ñ µ Ñ µµ µ Ñ µ Ñ µµ Ñ µ Ñ µµµ Ñ µµ µ Ñ µ Ñ µ Ñ Ñ µ µ Ñ µ ja ykkösten µ Ñ µ
Tästä nähdään, että Þ ja koska Æ µ niin -testin testisuure noudattaa approksimatiivisesti µ-jakaumaa. -testin heikkoutena on, että suuri testisuuren arvo ei sano mitään siitä onko havaittu suhteellinen osuus suurempi vai pienempi kuin. 4. Kurssin Mat-1.2620 1. välikokeessa syksyllä 2006 pistejakauma oli seuraavanlainen: Pisteet 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Lkm 1 3 6 5 11 12 20 14 14 25 7 21 24 23 Pisteet 14 15 16 17 18 19 20 21 22 23 24 Lkm 31 25 14 26 29 13 15 13 10 13 10 Onko tämä jakauma normaalinen? Ratkaisu: Pistesummien keskiarvoksi saadaan ja otosvarianssiksi. Jos Æ µ niin esim. ÈÖ µµ ÈÖ ja tämä todennäköisyys, että nollahypoteesin ollessa voimassa saadaan 15 pistettä, voidaan laskea Æ µ-jakuman kertymäfunktion avulla. Kun näin saadut todennäköisyydet kerrotaan lukumäärällä saadaan odotetut lukumääärä eli Pisteet 0 1 2 3 4 5 6 7 8 9 4.7 2.6 3.73 5.19 7.02 9.19 11.69 14.41 17.24 20 Pisteet 10 11 12 13 14 15 16 17 18 19 22.51 24.57 26.02 26.73 26.64 25.75 24.14 21.96 19.38 16.58 Pisteet 20 21 22 23 24 13.77 11.09 8.66 6.56 14.87 È Ç Kun näiden arvojen perusteella lasketaan testisuuren à à µ à arvo saadaan ja koska vapausasteita on saadaan -arvoiksi noin (koska µ. Jos arvioidaan, että pistesummien kohdalla odotetut ja havaitut lukumäärät ovat liian pieniä niin voidaan ja sekä ja yhdistää. Silloin testisuuren arvoksi tulee ja -arvoksi vastaavasti noin joten tällä luokkien yhdistämisellä ei ollut kovin suurta merkitystä. Joka tapauksessa nollahypoteesi voidaan hylätä merkitsevyystasolla, joka on aika pieni. 5. Erään rokotuskokeen tulokset on esitetty alla. Käytä seuraavissa testeissä 5% merkitsevyystasoa. (a) Tutki, vaikuttaako rokotus sairastuvuuteen. (b) Sovella rokotuskokeen tuloksiin -testiä, kun nollahypoteesi olettaa, että sairastuvuus ei riipu rokotuksesta. Vertaa (a)- ja (b)-kohtien testien tuloksia toisiinsa. Voivatko ko. testit johtaa eri tulokseen? Sairastui Ei sairastunut Rokotettiin 9 42 Ei rokotettu 17 28
Ratkaisu: (a) Nollahypoteesi on: À Rokotus ei vaikuta sairastavuuteen, eli. Yllä on todennäköisyys sairastua, jos on rokotettu ja todennäköisyys sairastua, jos ei ole rokotettu. Tarvittavia lukuarvoja:,, ja sekä yhdistetyn suhteellisen osuuden estimaatti: Näiden perusteella testisuure saa arvon: µ Nollahypoteesin pätiessä testisuure on jakautunut suurissa otoksissa approksimatiivisesti Æ µ-jakauman mukaan. Kriittiset arvot merkitsevyystasolla 5% ovat siten Þ «Þ ja hylkäysalue on Þ tai Þ Koska Þ, nollahypoteesi hylätään. (b) Käytämme siis -riippumattomuustestiä ja nollahypoteesi on À Sairastumistodennäköisyys ei riipu rokotuksesta. Testisuure on muotoa: Ö Ç µ missä Ç on havaittu frekvenssi solussa, joka on rivillä ja sarakkeessa, ja on odotettu frekvenssi solussa, joka on rivillä ja sarakkeessa. Ö on taulukon rivien lukumäärä ja sarakkeiden lukumäärä. Odotetut frekvenssit saadaan riippumattomuusoletuksen avulla (kts. nollahypoteesi) toisin sanoen Ê missä on kokonaisotoskoko, Ê rivin rivisumma ja sarakkeen sarakesumma. Laskut on kätevintä tehdä taulukoimalla: Ç S Ei S summa R 9 42 51 Ei R 17 28 45 summa 26 70 96 S Ei S summa R 13.8125 37.1875 51 Ei R 12.1875 32.8125 45 summa 26 70 96 Tässä vaiheessa on hyvä tarkistaa, että rivi, ja sarakesummat ovat samat sekä havaituille että odotetuille frekvensseille. (Tilansäästämiseksi on jätetty pois taulukot Ç ja Ç µ. Ne on kuitenkin hyvä kirjoittaa auki testiä käsin suorittaessa.)
Ç µ S Ei S summa R 1.676753 0.622794 2.299548 Ei R 1.900321 0.705833 2.606154 summa 3.577074 1.328627 4.905701 Jossa siis oikean alanurkan summa on testisuureen arvo. Vapausasteet ovat tällä kertaa Ö µ µ µ µ. Kriittinen arvo on siis µ ja hylkäysalue on tämän oikealla puolella. Koska µ, nollahypoteesi hylätään. Sairastumistodennäköisyys riippuu rokotuksesta. Testit eivät -taulukon tapauksessa voi (näillä hypoteeseilla) johtaa eri tuloksiin, koska juuri tässä tilanteessa (a) -kohdan testisuureen arvon neliö on (b) -kohdan testisuureen arvo. 6. Alla oleva taulukko koskee USA:n äänioikeutettujen joukosta poimittua pientä otosta. Kyselyssä kysyttiin puoluekanta ja suhtautuminen käsiaseiden rajoituksiin. Ovatko puoluekanta ja suhtautuminen aserajoituksiin toisistaan riippumattomia? Käytä -riippumattomuustestiä ja 1%:n merkitsevyystasoa. Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa Demokraatit 110 22 64 Republikaanit 89 16 117 Sitoutumattomat 55 11 35 Ratkaisu: Nollahypoteesi on À : Suhtautuminen ei riipu puoluekannasta. Testisuure on muotoa: Ö Ç µ missä Ç on havaittu frekvenssi solussa, joka on rivillä ja sarakkeessa, ja on odotettu frekvenssi solussa, joka on rivillä ja sarakkeessa. Ö on taulukon rivien lukumäärä ja sarakkeiden lukumäärä. Odotetut frekvenssit määrätään jälleen käyttäen nollahypoteesin mukaista riippumattomuusoletusta: Ê missä on kokonaisotoskoko, Ê rivin rivisumma ja sarakkeen sarakesumma. Laskut on kätevintä tehdä taulukoimalla: Ç Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa summa Demokraatit 110 22 64 196 Republikaanit 89 16 117 222 Sitoutumattomat 55 11 35 101 summa 254 49 216 519
Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa summa Demokraatit 95.92 18.50 81.57 196 Republikaanit 108.65 20.96 92.39 222 Sitoutumattomat 49.43 9.54 42.03 101 summa 254 49 216 519 Ç µ Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa summa Demokraatit 2.07 0.66 3.79 6.51 Republikaanit 3.55 1.17 6.55 11.28 Sitoutumattomat 0.63 0.22 1.18 2.03 summa 6.25 2.06 11.52 19.82 Jossa siis oikean alanurkan summa on testisuureen arvo. Vapausasteet ovat tällä kertaa Ö µ µ µ µ. Kriittinen arvo on siis µ ja hylkäysalue on tämän oikealla puolella. Koska µ, nollahypoteesi hylätään. Suhtautuminen aserajoituksiin riippuu puoluekannasta. 7. Halutaan testata onko todella todennäköisyys, että saadaan kruuna tietyn kolikon kohdalla todella. Montako kertaa kolikkoa on vähintään heitettävä jotta todennäköisyys, että nollahypoteesi À hylätään merkitsevyystasolla on vähintään % jos todellisuudessa tai. Käytä normaaliapproksimaatiota. Vihje: Symmetrian perusteella riittää laskea heittojen lukumäärä kun. Ratkaisu: Oletetaan siis, että. Heitetään kolikkoa kertaa jolloin kruunujen suhteelliseksi osuudeksi saadaan. Testisuure on nyt µ missä tietenkin. Koska merkitsevyystasoksi on valittu ja nollahypoteesilla on kaksisuuntainen vaihtoehto, niin kriittiset arvot ovat Þ eli nollahypoteesi hylätään kun Þ tai Þ. Jos nyt todellisuudessa niin µ Æ µ
ja saamme ÈÖ µ ÈÖ Ö ÈÖ ÈÖ µ µ µ µ µ µ µ µ ÈÖ µ Vastaava lauseke saadaan todennäköisyydelle ÈÖ mutta koska riittää saada alaraja :lle ja koska on syytä olettaa, että tämä jälkimmäinen todennäköisyys tulee olemaan µ niin on vaadittava, että ÈÖ µ jolloin taulukosta saadaan, että» josta seuraa, että ³ eli on syytä valita. Nyt voidaan (mutta ei ole pakko) tarkistaa, että edellä tehty oletus oli oikea ja saadaan ÈÖ µ ÈÖ µ ÈÖ µ joten tämä on häviävän pieni luku muihin approksimaatioihin verrattuna.