11. laskuharjoituskierros, vko 15, ratkaisut

Samankaltaiset tiedostot
χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Sovellettu todennäköisyyslaskenta B

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

10. laskuharjoituskierros, vko 14, ratkaisut

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

Testit laatueroasteikollisille muuttujille

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Estimointi. Vilkkumaa / Kuusinen 1

Testejä suhdeasteikollisille muuttujille

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

5. laskuharjoituskierros, vko 8, ratkaisut

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Testit järjestysasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Sovellettu todennäköisyyslaskenta B

4. laskuharjoituskierros, vko 7, ratkaisut

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Sovellettu todennäköisyyslaskenta B

Todennäköisyyden ominaisuuksia

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastollinen aineisto Luottamusväli

1. laskuharjoituskierros, vko 4, ratkaisut

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

tilastotieteen kertaus

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

5.7 Uskottavuusfunktioon perustuvia testejä II

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

9. laskuharjoituskierros, vko 12-13, ratkaisut

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Hypoteesin testaus Alkeet

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

(x, y) 2. heiton tulos y

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

D ( ) E( ) E( ) 2.917

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lohkoasetelmat. Kuusinen/Heliövaara 1

Tilastollisia peruskäsitteitä ja Monte Carlo

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Tilastotieteen jatkokurssi Sosiaalitieteiden laitos Harjoitus 9 (viikko 16) Ratkaisuehdotuksia (Laura Tuohilampi)

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Harjoitus 2: Matlab - Statistical Toolbox

HAVAITUT JA ODOTETUT FREKVENSSIT

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Ilkka Mellin (2008) 1/5

Varma tapahtuma, Yhdiste, Yhdistetty tapahtuma, Yhteenlaskusääntö

Tilastotieteen jatkokurssi syksy 2003 Välikoe

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Transkriptio:

11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa noudattavan Poisson -jakaumaa. Erään aineen kohdalla rekisteröitiin emissioiden lukumäärät 101 samanmittaisella lyhyellä aikavälillä. Alla olevassa taulukossa on annettu emissioiden lukumäärien frekvenssit. Tutki χ 2 -testin avulla onko Poisson -jakaumaoletus sopusoinnussa havaintojen kanssa. Käytä testissä 5% merkitsevyystasoa. Emissioiden lkm 0 1 2 3 4 5 Frekvenssi 40 34 18 5 2 2 Kyseessä on χ 2 -yhteensopivuustesti. H 0 : Havainnot ovat peräisin Poisson -jakaumasta. H 1 : Havainnot eivät ole Poisson -jakaumasta. k χ 2 (O i E i ) 2 E i i1 missä O i on havaittu frekvenssi luokassa i ja E i on odotettu frekvenssi luokassa i. Odotetut frekvenssit saadaan jakaumaoletuksen avulla (kts. nollahypoteesi). Nyt on kuitenkin ensin estimoitava Poisson -jakauman parametri λ ennen kuin odotettuja frekvenssejä voidaan määrätä. Käytämme estimointiin suurimman uskottavuuden menetelmää: ˆλ x 1 n 5 i1 Nyt siis estimoitu tiheysfunktio Poisson -jakaumalle on ˆf(x) Pr(X x) e ˆλˆλx x! io i 1 103 1.0198 101 e 1.0198 1.0198 x x! Estimoidun tiheysfunktion avulla saamme odotetut frekvenssit: E 0 n Pr(X 0) 36.43 E 3 n Pr(X 3) 6.44 E 1 n Pr(X 1) 37.15 E 4 n Pr(X 4) 1.64 E 2 n Pr(X 2) 18.94 E 5 n Pr(X 5) 0.33 Koska luokissa 4 ja 5 odotetut frekvenssit ovat alle 5 yhdistetään ne luokkaan 3. Luonnollisesti myös vastaavat havaittujen frekvenssien luokat yhdistetään. Testisuureen laskeminen on kätevintä taulukoimalla: i O i E i (O i E i ) (O i E i ) 2 (O i E i ) 2 /E i 0 40 36.43 3.57 12.744 0.350 1 34 37.15-3.15 9.9225 0.267 2 18 18.97-0.97 0.94090 0.047 3 9 8.41 0.59 0.34810 0.041 summa 101 100.93 * * 0.705 Jossa siis oikean alanurkan summa on testisuureen arvo χ 2 0.705. Vapausasteet ovat tällä kertaa f k 1 p 4 1 1 2 koska luokkia on neljä (k 4) ja yksi parametri jouduttiin estimoimaan (p 1).

Kriittinen arvo on χ 2 α (k 1 p) χ2 0.05 (2) 5.99 ja hylkäysalue on tämän arvon oikealla puolella. χ 2 χ 2 0.05 (2) Koska χ 2 0.705 < χ 2 0.05(2) 5.99 ei nollahypoteesia hylätä. Havainnot näyttävät noudattavan Poisson -jakaumaa. D2. Erään rokotuskokeen tulokset on esitetty alla. Käytä seuraavissa testeissä 5% merkitsevyystasoa. a) Tutki onko rokotettujen ja rokottamattomien sairastuvuudessa eroa käyttäen suhteellisten osuuksien vertailuun tarkoitettua testiä. b) Sovella rokotuskokeen tuloksiin χ 2 -testiä kun nollahypoteesi olettaa että sairastuvuus ei riipu rokotuksesta. Vertaa a)- ja b-) -kohtien testien tuloksia toisiinsa. Voivatko ko. testit johtaa eri tulokseen? Sairastui Ei sairastunut Rokotettiin 9 42 Ei rokotettu 17 28 a) H 0 : Sairastuvuudessa ei ole eroa. H 1 : Sairastuvuus on rokotettujen joukossa pienempää. Toisin sanoen: H 0 : p 1 p 2 H 1 : p 1 p 2 Yllä p 1 on todennäköisyys sairastua jos on rokotettu ja p 2 todennäköisyys sairastua jos ei ole rokotettu. Tarvittavia lukuarvoja: ˆp 1 0.18 ˆp 2 0.38 n 1 51 ja n 2 45 sekä yhdistetyn suhteellisen osuuden estimaatti: Näiden perusteella testisuure saa arvon: ˆp n 1ˆp 1 + n 2ˆp 2 n 1 + n 2 0.27 Z ˆp 1 ˆp 2 ( 1 ˆp(1 ˆp) + 1 ) 2.21 n 1 n 2 Nollahypoteesin pätiessä testisuure on jakautunut suurissa otoksissa approksimatiivisesti N(0 1)-jakauman mukaan. Kaksisuuntaisen testin hyväksymisalue merkitsevyystasolla 5% on siten ( z α/2 z α/2 ) ( z 0.025 z 0.025 ) ( 1.96 1.96). Koska Z 2.21 < z 0.025 1.96 nollahypoteesi hylätään. Sairastuvuus on rokotettujen joukossa pienempää kuin rokottamattomien joukossa.

b) Käytämme siis χ 2 -riippumattomuustestiä. H 0 : Sairastumistodennäköisyys ei riipu rokotuksesta. H 1 : Sairastumistodennäköisyys riippuu rokotuksesta. r c χ 2 (O ij E ij ) 2 E ij i1 j1 missä O ij on havaittu frekvenssi solussa joka on rivillä i ja sarakkeessa j ja E ij on odotettu frekvenssi solussa joka on rivillä i ja sarakkeessa j. r on taulukon rivien lukumäärä ja c sarakkeiden lukumäärä. Odotetut frekvenssit saadaan riippumattomuusoletuksen avulla (kts. nollahypoteesi) toisin sanoen E ij R ic j n missä n on kokonaisotoskoko R i rivin i rivisumma ja C j sarakkeen j sarakesumma. Laskut on kätevintä tehdä taulukoimalla: O ij S Ei S summa R 9 42 51 Ei R 17 28 45 summa 26 70 96 E ij S Ei S summa R 13.8125 37.1875 51 Ei R 12.1875 32.8125 45 summa 26 70 96 Tässä vaiheessa on hyvä tarkistaa että rivi ja sarakesummat ovat samat sekä havaituille että odotetuille frekvensseille. (Tilansäästämiseksi on jätetty pois taulukot O ij E ij ja (O ij E ij ) 2. Ne on kuitenkin hyvä kirjoittaa auki testiä käsin suorittaessa.) (O ij E ij ) 2 /E ij S Ei S summa R 1.676753 0.622794 2.299548 Ei R 1.900321 0.705833 2.606154 summa 3.577074 1.328627 4.905701 Jossa siis oikean alanurkan summa on testisuureen arvo χ 2 4.905701. Vapausasteet ovat tällä kertaa f (r 1)(c 1) (2 1)(2 1) 1. Kriittinen arvo on siis χ 2 0.05 (1) 3.84 ja hylkäysalue on tämän oikealla puolella. χ 2 0.05 (1) χ 2 Koskaχ 2 4.905701 > χ 2 0.05 (1) 3.84 nollahypoteesi hylätään. Sairastumistodennäköisyys riippuu rokotuksesta. Testit eivät 2 2-taulukon tapauksessa voi (näillä hypoteeseilla) johtaa eri tuloksiin koska juuri tässä tilanteessa a) -kohdan testisuureen arvon neliö on b) -kohdan testisuureen arvo.

P3. Henkilöille A ja B on molemmille annettu noppa ja heitä on pyydetty heittämään sitä 120 kertaa. A ja B kertovat saaneensa heittojen tuloksena alla esitetyt silmälukujen jakaumat. a) Tutki χ 2 -testin avulla voidaanko A:n ja B:n heittämiä noppia pitää virheettöminä eli symmetrisinä. Tämä tapahtuu testaamalla nollahypoteesia että nopanheiton tulos noudattaa diskreettiä tasaista jakaumaa. Suuret χ 2 -testisuureen arvot johtavat nollahypoteesin hylkäämiseen. b) Tutki χ 2 -testin avulla kuinka todennäköistä on se että A ja B ovat rehellisiä kertoessaan heittäneensä noppa. Tämä tapahtuu testaamalla nollahypoteesia että nopanheiton tulos noudattaa diskreettiä tasaista jakaumaa. Tällä kertaa pienet χ 2 -testisuureen arvot johtavat nollahypoteesin hylkäämiseen. Käytä a)-kohdan testeissä sekä 10%:n että 5%:n merkitsevyystasoa ja b)-kohdan testeissä 1%:n merkitsevyystasoa. Silmäluku 1 2 3 4 5 6 A:n tulokset 12 16 20 17 25 30 B:n tulokset 19 20 19 22 19 21 2 p. a) Kyseessä on χ 2 -yhteensopivuustesti. H 0 : Havainnot ovat peräisin diskreetistä tasaisesta jakaumasta. H 1 : Havainnot eivät ole diskreetistä tasaisesta jakaumasta. k χ 2 (O i E i ) 2 E i i1 missä O i on havaittu frekvenssi luokassa i ja E i on odotettu frekvenssi luokassa i. Odotetut frekvenssit saadaan jakaumaoletuksen avulla (kts. nollahypoteesi). Koska kyse on diskreetistä tasaisesta jakaumasta on kaikilla luokilla sama todennäköisyys ja näin ollen myös sama odotettu frekvenssi. Niinpä Pr(Saadaan silmäluku i) 1/6 i 1 2... 6 ja koska n 120 molemmilla heittäjillä E i n Pr(Saadaan silmäluku i) 120/6 20. A:n käyttämälle nopalle saadaan seuraava taulukko: i O i E i O i E i (O i E i ) 2 (O i E i ) 2 /E i 1 12 20-8 64 3.2 2 16 20-4 16 0.8 3 20 20 0 0 0 4 17 20-3 9 0.45 5 25 20 5 25 1.25 6 30 20 10 100 5 summa 120 120 * * 10.7 B:n käyttämälle nopalle saadaan seuraava taulukko: i O i E i O i E i (O i E i ) 2 (O i E i ) 2 /E i 1 19 20-1 1 0.05 2 20 20 0 0 0 3 19 20-1 1 0.05 4 22 20 2 4 0.2 5 19 20-1 1 0.05 6 21 20 1 1 0.05 summa 120 120 * * 0.4

Molemmissa tapauksissa vapausasteiden lukumääräksi saadaan (koska yhtään parametria ei ole estimoitu) f k 1 p 6 1 0 5. Vastaavasti kriittiseksi arvoksi saadaan joko χ 0.1 (5) 9.236 tai χ 0.05 (5) 11.070 ja hylkäysalueet ovat näiden oikealla puolella. A:n testisuureen arvo oli χ 2 A 10.7 joka on kriittisten arvojen välissä. Tämä tarkoittaa sitä että 10%:n merkitsevyystasolla nollahypoteesi hylätään mutta 5%:n merkitsevyystasolla se jää voimaan. χ 2 0.1 (5) χ 2 A χ 2 0.05 (5) A:n käyttämän nopan symmetrisyys voidaan kyseenalaistaa (melko suurella riskillä). B:n testisuureen arvo oli χ 2 B 0.4 joka ei ole kummallakaan merkitsevyystasolla hylkäysalueessa joten nollahypoteesi jää B:n kohdalla voimaan. χ 2 B χ 2 0.1 (5) χ 2 0.05(5) B:n käyttämä noppa on symmetrinen. b) Nyt pitää siis tutkia onko vaihtelu liian pientä ollakseen kovin todennäköistä aidosti satunnaisessa aineistossa. Niinpä kriittiseksi arvoksi valitaankin sellainen jonka vasemmalle puolelle jää todennäköisyysmassasta 1% eli vasemman hännän kriittinen arvo χ 2 0.01(5) 0.554 ja hylkäysalue on tämän arvon vasemmalla puolella. Nyt A:han ei tarvitse kohdistaa epäilyksiä koska χ 2 A 10.7 > χ2 0.01 (5) 0.554 mutta sen sijaan vaikuttaa siltä että B on tekaissut tuloksensa koska χ 2 B 0.4 < χ2 0.01(5) 0.554. χ 2 0.99(5) χ 2 B χ 2 A A on todennäköisesti heittänyt noppa mutta B tuskin.

P4. Alla oleva taulukko koskee USA:n äänioikeutettujen joukosta poimittua pientä otosta. Kyselyssä kysyttiin puoluekanta ja suhtautuminen käsiaseiden rajoituksiin. Ovatko puoluekanta ja suhtautuminen aserajoituksiin toisistaan riippumattomia? Käytä χ 2 -riippumattomuustestiä ja 1%:n merkitsevyystasoa. Puolue Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa Demokraatit 110 22 64 Republikaanit 89 16 117 Sitoutumattomat 55 11 35 2 p. Käytetään tehtävän D2 b)-kohdan testiä. H 0 : Suhtautuminen ei riipu puoluekannasta. H 1 : Suhtautuminen riippuu puoluekannasta. r c χ 2 (O ij E ij ) 2 E ij i1 j1 missä O ij on havaittu frekvenssi solussa joka on rivillä i ja sarakkeessa j ja E ij on odotettu frekvenssi solussa joka on rivillä i ja sarakkeessa j. r on taulukon rivien lukumäärä ja c sarakkeiden lukumäärä. Odotetut frekvenssit määrätään jälleen käyttäen nollahypoteesin mukaista riippumattomuusoletusta: E ij R ic j n missä n on kokonaisotoskoko R i rivin i rivisumma ja C j sarakkeen j sarakesumma. Laskut on kätevintä tehdä taulukoimalla: Puolue Puolue Puolue O ij Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa summa Demokraatit 110 22 64 196 Republikaanit 89 16 117 222 Sitoutumattomat 55 11 35 101 summa 254 49 216 519 E ij Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa summa Demokraatit 95.92 18.50 81.57 196 Republikaanit 108.65 20.96 92.39 222 Sitoutumattomat 49.43 9.54 42.03 101 summa 254 49 216 519 χ 2 Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa summa Demokraatit 2.07 0.66 3.79 6.51 Republikaanit 3.55 1.17 6.55 11.28 Sitoutumattomat 0.63 0.22 1.18 2.03 summa 6.25 2.06 11.52 19.82 Jossa siis oikean alanurkan summa on testisuureen arvo χ 2 19.82. Vapausasteet ovat tällä kertaa f (r 1)(c 1) (3 1)(3 1) 4. Kriittinen arvo on siis χ 2 0.01 (4) 13.277 ja hylkäysalue on tämän oikealla puolella.

χ 2 0.01(4) χ 2 Koska χ 2 19.82 > χ 2 0.01(4) 13.277 nollahypoteesi hylätään. Suhtautuminen aserajoituksiin riippuu puoluekannasta. L5. Henkilöille A ja B on molemmille annettu noppa ja heitä on pyydetty heittämään sitä 120 kertaa. A ja B kertovat saaneensa heittojen tuloksena alla esitetyt silmälukujen jakaumat. Tutki χ 2 - testin avulla onko mahdollista että A ja B ovat käyttäneet samaa noppaa? Tämä tapahtuu χ 2 - homogeenisuustestiä käyttämällä. Käytä testissä 5%:n merkitsevyystasoa. Silmäluku 1 2 3 4 5 6 A:n tulokset 12 16 20 17 22 33 B:n tulokset 16 18 19 22 19 26 Käytetään tehtävän D2 b)-kohdan testisuuretta. Testi tosin on tällä kertaa χ 2 -homogeenisuustesti. H 0 : A- ja B-frekvenssit ovat peräisin samasta todennäköisyysjakaumasta. H 1 : A- ja B-frekvenssit eivät ole peräisin samasta todennäköisyysjakaumasta. r c χ 2 (O ij E ij ) 2 E ij i1 j1 missä O ij on havaittu frekvenssi solussa joka on rivillä i ja sarakkeessa j ja E ij on odotettu frekvenssi solussa joka on rivillä i ja sarakkeessa j. r on taulukon rivien lukumäärä ja c sarakkeiden lukumäärä. Odotetut frekvenssit määrätään käyttäen nollahypoteesin mukaista homogeenisuusoletusta: E ij n ic j n missä n on kokonaisotoskoko n i ryhmän i otoskoko ja C j luokan j kokonaisfrekvenssi. Laskut on kätevintä tehdä taulukoimalla: O ij 1 2 3 4 5 6 summa A 12 16 20 17 22 33 120 B 16 18 19 22 19 26 120 summa 28 34 39 39 41 59 240 E ij 1 2 3 4 5 6 summa A 14 17 19.5 19.5 20.5 29.5 120 B 14 17 19.5 19.5 20.5 29.5 120 summa 28 34 39 39 41 59 240 χ 2 1 2 3 4 5 6 summa A 0.285714 0.058824 0.012821 0.320513 0.109756 0.415254 1.202881 B 0.285714 0.058824 0.012821 0.320513 0.109756 0.415254 1.202881 summa 0.571429 0.117647 0.025641 0.641026 0.219512 0.830508 2.405763

Jossa siis oikean alanurkan summa on testisuureen arvo χ 2 2.405763. Vapausasteet ovat tällä kertaa f (r 1)(c 1) (2 1)(6 1) 5. Kriittinen arvo on siis χ 2 0.05 (5) 11.070 ja hylkäysalue on tämän oikealla puolella. χ 2 χ 2 0.05(5) Koska χ 2 2.405763 < χ 2 0.05 (5) 11.070 nollahypoteesia ei hylätä. A- ja B-frekvenssit ovat peräisin samasta todennäköisyysjakaumasta.