TILASTOTIETEEN JATKOKURSSI, 10 OP, 19.1. 4.5.2010. Kijallisuus: Ilkka Mellin: Johdatus tilastotieteeseen, 2. kija. Luennoi: ylioisto-oettaja Pekka Pee. 2. välikokeen 4.5.2010 mallivastaukset 1. Täysiin isteisiin oikeuttava vastaus sisältää oleellisesti alla todetut asiat. a) Luottamusväli sisältää todetulla tyyillisesti 99:n tai 95:n %:n todennäköisyydellä aametin todellisen avon. Todennäköisyys viittaa tässä yhteydessä fekventistiseen tulkintaan: Hyoteettisissa toisistaan iiumattomissa toistokokeissa luottamusväli eittää aametin todellisen avon todetulla suhteellisella osuudella. (Kijan s. 138.) b) Mekitsevyystesti on äätössääntö, joka ketoo, onko nollahyoteesi hylättävä vai ei (kijan s. 158.) Mekitsevyystestin vaiheet ovat (kijan s:t 157 163): Muodostetaan yleinen hyoteesi eli määitellään testausasetelmasta tehtävät yleiset oletukset. Muodostetaan nollahyoteesi eli testattava oletus ja käytettävä mekitsevyystaso (tyyillisesti 0, 05, 0, 01 tai 0, 001). Valitaan vaihtoehtoinen hyoteesi (onko se yksi- vai kaksisuuntainen). Valitaan soiva testisuue. Lasketaan testisuueen avo ja veataan sitä testisuueen jakaumaan nollahyoteesin ollessa voimassa eli mekitsevyystasosta ja vaihtoehtoisesta hyoteesista iiuviin kiittisiin avoihin. Mikäli testisuueen avo on hylkäysalueella nollahyoteesi hylätään. Muutoin nollahyoteesi jää voimaan. Testin -avo on todennäköisyys saada testisuueen havaittu tai sitä oikkeavami avo, kun nollahyoteesi ätee (kijan s. 160). c) Testin voima on todennäköisyys, että nollahyoteesi hylätään, kun se ei ole tosi. (Kijan s. 166.) d) Hylkäysvihe tehdään, kun nollahyoteesi hylätään, vaikka se on tosi. Hyväksymisvihe tehdään, kun nollahyoteesi jää voimaan, kun se ei ole tosi. (Kijan s. 166.)
2. a) Suhteellisen osuuden 100 (1 α) %:n luottamusvälin aoksimatiivinen kaava on (α (0, 1); kijan s. 149; ks. myös s. 122): P ± z α/2 PQ n. Yllä P on havaittu suhteellinen fekvenssi (Q =1 P ), z α/2 on standadinomaalijakauman 100 (1 α/2). esentiili ja n on havaintojen lukumäää. Tehtävässä annetuilla avoilla 95 %:n luottamusväliksi saadaan 0, 206 0, 794 0, 206 ± 1, 960 =0, 206 ± 0, 016. 2437 Aoksimatiivinen 95 %:n luottamusväli Suomen keskustan (KESK) kannatukselle on siten (19, 0%, 22, 2%). Suomen Keskustan eduskuntavaalitulos 23, 1 % ei ole 95 %:n luottamusvälin sisällä. Se mekitsee, että nollahyoteesi "kannatus on eduskuntavaalien 2007 mukainen" voidaan hylätä 5 %:n iskitasolla kaksisuuntaisessa testauksessa. Suomen Keskustan kannatus on vähentynyt eduskuntavaaleista. Edellisenkaltainen vastaus iittää täysiin isteisiin kohdasta. Peustellaan kuitenkin vielä viimeinen väite analyyttisesti. Analyyttinen melko yleistä muotoa oleva eustelu on kijan sivulla 139. Tässä esitetään eustelu tehtävän eityistilanteessa (oleellisesti kijan s. 149). Standadoitu muuttuja Z = P noudattaa suuilla havaintomääillä standadinomaalijakaumaa (kijan s:t 122 123 ja 149). Yllä on todellinen suhteellinen osuus (q =1 ), P = X/n on sen estimaatti ja X on havaittu fekvenssi. Testisuueen Z kiittiset avot ovat aoksimatiivisesti ±1, 960, kun 5 %:n iskitasolla testataan nollahyoteesia "suhteellinen osuus on " kaksisuuntaista vastahyoteesia vastaan. Näin ollen nollahyoteesi hylätään, mikäli P < 1, 960 tai P > 1, 960. eli kun P +1, 960 < tai P 1, 960 >. Sijoittamalla P = 0.206 ja estimoimalla P :n vaianssin lausekkeessa :tä ja q:ta P :llä ja Q:lla (Q =1 P ) saadaan hylkäysalueet 0, 206 0, 794 >0, 206 + 1, 960 =0, 206 + 0, 016 = 0, 222 2437
ja 0, 206 0, 794 <0, 206 1, 960 =0, 206 0, 016 = 0, 190. 2437 Hylkäysalueet ovat :n edellä lasketun 95 %:n aoksimatiivisen luottamusvälin oissulkemat alueet eaaliakselilla. Näin ollen :n avot, jotka eivät kuulu 95 %:n luottamusväliin, tulisivat hylätyksi testissä, jossa nollahyoteesi olisi luottamusvälin ulkouolinen avo :lle. b) Testisuue on edellä esitetty suuissa otoksissa nollahyoteesin ätiessä standadoitua nomaalijakaumaa noudattava Z = P. Peussuomalaisten kannatus oli eduskuntavaaleissa 4,1 %. Kyselytutkimuksessa kannatus on 7,8 %. Testataan, onko kannatuksen muutos mittausviheen uitteissa. Testisuue saa avon z = 0, 078 0, 041 0, 041 0, 959/2437 9, 211. Tehtävässä kysytään, onko kannatus muuttunut, joten tehdään kaksisuuntainen testi. Testi tulee tehdä 5 %:n iskitasolla. Kiittiset avot ovat siten standadinomaalijakauman ketymäfunktion 2,5. ja 97,5. esentiili eli 1, 960 ja 1, 960. Nollahyoteesi hylätään, koska 9, 211 > 1, 960. Peussuomalaisten kannatus on noussut eduskuntavaaleista. Todetaan lisäksi, että testin -avo on niin ieni, että edes kussin kotisivulla osoitettu laskui (htt://www.danielsoe.com/statcalc/calc21.asx) ei ysty sitä laskemaan. Suuin z-tunnusluku, jolle laskui laskee -avon on 5, jolloin -avo on noin 6 10 7. Edellä tehdyn testin -avo on sitäkin ienemi. Viheän liiton kannatus oli eduskuntavaaleissa 8,5 %. Kyselytutkimuksessa kannatus on 10,3 %. Testisuueen avo on nyt z = 0, 103 0, 085 0, 085 0, 915/2437 3, 186. Kuten edellä nollahyoteesi muuttumattomasta kannatuksesta hylätään 5 %:n iskitasolla. (Sivun htt://www.danielsoe.com/statcalc/calc21.asx laskuin mukaan testin -avo on n. 0, 0014.) Viheän liiton kannatus on kasvanut eduskuntavaaleista.
3. Taustaa: Tätä aineistoa tutkittiin HT 6.2:ssa. Analyysi eustui binomijakautuneen satunnaismuuttujan X Bin(n, ) nomaalijakauma-aoksimaatioon (kijan s. 109) X as. N(n, nq) eli standadoituun muuttujaan X n nq as. N(0, 1). Aoksimaation avulla laskettiin, että P(X 35) 5, 0 10 6 eli että todennäköisyys, että lasi määättäisiin isälle asumaan 35:ssä tai havemmassa äätöksessä, kun =0.5, on noin viisi miljoonasosaa. Testauksen näkökulmasta laskettu todennäköisyys on -avo yksisuuntaisessa testauksessa tai kaksi ketaa edellä mainittu -avo kaksisuuntaisessa testauksessa. Nollahyoteesi " =0.5" voitaisiin hylätä tavanomaisilla iskitasoilla iiumatta siitä, olisiko testi yksi- vai kaksisuuntainen. a) Tehtävässä ohjeistettiin tekemään kaksisuuntainen testi 1 %:n iskitasolla suhteellisen fekvenssin ja taahtuman todennäköisyyden vetailuun eustuen. Siten tulisi tehdä testi yllä olevan kaavan kanssa yhtäitävään kaavaan X n nq = X/n ( nq)/n = P as. N(0, 1) (1) eustuen. Yllä P = X/n eli P on suhteellinen fekvenssi. Tehtävän tilanteessa P =0, 297 ja nollahyoteesi on, että =0, 5. Testisuue on siten 0, 297 0, 5 4, 410. 0, 5 0, 5/118 Testisuueen avo on laskutakkuuden uitteissa sama kuin HT 6.2:ssa, koska kaavan (1) mukaan fekvenssistä ja suhteellisesta fekvenssistä muodostetut standadoidut muuttujat ovat yhtäsuuia. Kiittinen avo 1 %:n iskitasolla kaksisuuntaisessa testauksessa on 2, 576, joten nollahyoteesi hylätään. Laset määätään kääjäoikeudessa vanhemmille todennäköisyyksillä, jotka iiuvat sukuuolesta. Lasketaan lisäksi testin -avo. Kuten HT 6.2:ssa saadaan Φ ( 4, 410) 5, 0 10 6 (ketymäfunktion avo on laskettu sivun htt://www.danielsoe.com/statcalc/ calc02.asx laskuilla). Koska testi on kaksisuuntainen, on sen -avo 2 5, 0 10 6 =1 10 5 eli yksi sadastuhannesosa. Jatkuvuuskojauksen käyttö ei muuttaisi tuloksia juuikaan (HT 6.2).
b) Testataan nollahyoteesia " =0, 5" fekvenssijakauman ja teoeettisen jakauman yhteensoivuustestiä eli χ 2 -testiä käyttäen (kijan s:t 173 175). Taulukoissa alla ovat havaitut (O i ) ja odotetut (E i )fekvenssit. Laset isälle äidille Yht. Havaittu fekvenssi 35 83 118 Odotettu fekvenssi 59 59 118 Odotetut fekvenssit on laskettu kaavoilla E 1 = n ja E 2 = n (1 ), joissa n = 118 ja =0, 5 (kijan s. 174). χ 2 -testisuue saa avon 2X i=1 (O i E i ) 2 (35 59)2 (83 59)2 = + 19, 525. E i 59 59 Nollahyoteesin ätiessä testisuue noudattaa χ 2 -jakaumaa k 1:llä vaausasteella, jossa k on luokkien lukumäää (yhtään aametia ei tavitse estimoida odotettujen fekvenssien laskemiseksi; ks. kijan s. 174). Tehtävän tilanteessa k =2eli efeenssijakauma on χ 2 yhdellä vaausasteella. Testi on kaksisuuntainen, koska testisuue ei huomioi, mihin suuntaan havaitut fekvenssit oikkeavat odotetuista. Kijassa olevasta taulukosta nähdään, että χ 2 -jakauman yhdellä vaausasteella 99. esentiili on 6, 635. Nollahyoteesi " =0, 5" voidaan siten hylätä 1 %:n iskitasolla (19, 525 > 6.635). Päätellään, että kääjäoikeudessa laset määätään vanhemmille ei todennäköisyyksillä sukuuolesta iiuen. Edellisenkaltainen vastaus on iittävä. Todetaan oettavaisessa takoituksessa ja kiinnostuneille lisäksi, että testin -avo on 1 10 5 (laskettu laskuilla sivulla htt://www.danielsoe.com/statcalc/calc11.asx) eli täsmälleen sama kuin a)-kohdassa laskettu -avo. Tulos selittyy a)- ja b)-kohtien testisuueiden yhteydellä: (O 1 E 1 ) 2 + (O 2 E 2 ) 2 + [O 2 n(1 )] 2 E 1 E 2 n n(1 ) + [n O 1 n(1 )] 2 n n(1 ) + (O 1 n) 2 n n(1 ) (1 )+(O 1 n) 2 n(1 ) n(1 ) (X n)2 = n(1 ). Yllä toisella ivillä on sijoitettu O 2 = n O 1 ja louksi on siiytty a)-kohdan mekintään X = O 1. Havaitaan, että tämän kohdan χ 2 -testisuue on a)-kohdan
testisuueen (1) neliö (yliäänsäkin eikä vain tehtävän eityistilanteessa =0.5). Luennolla mainittiin, että standadinomaalijakautuneen satunnaismuuttujan neliö noudattaa χ 2 -jakaumaa yhdellä vaausasteella. Näin ollen tämän kohdan testisuue ja sen jakauma ovat a)-kohdan testisuueen ja jakauman neliöitä. Testit ovat siksi täysin yhtäitäviä ja johtavat täsmälleen samoihin äätelmiin. c) Tehtävä olisi tehdä yksisuuntainen testi. Kohdan b) χ 2 -testi eagoi symmetisesti sekä odotettua suuemiin että ienemiin havaittuihin fekvensseihin (neliöinnin (O i E i ) 2 vuoksi), joten se soveltuu vain kaksisuuntaiseen testaukseen. Kohdan a) testi saa ositiivisia tai negatiivisia avoja iiuen siitä, mihin suuntaan havaittu suhteellinen osuus oikkeaa nollahyoteesin mukaisesta suhteellisen osuuden odotusavosta. Kohdan a) testi soveltuu siksi myös ykssisuuntaisseen testaukseen ja sitä tulisi käyttää. 4. Nollahyoteesi on, että teksti on kijoitettu lyhyemmällä muteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti on kijoitettu idemmällä muteella. Testi tulee siten tehdä yksisuuntaisena. Nollahyoteesin mukaan sanan ituuden odotusavo on 6,2 ja vastahyoteesin mukaan 7,6. Molemmissa muteissa sanan ituuden keskihajonta on 2, 5 kijainta. Tekstissä sanan ituuden keskiavo X = 198/30 = 6, 6 kijainta. Tehtävässä ei keota sanojen ituuden jakaumasta muuta kuin odotusavo ja keskihajonta. Keskeisen aja-avolauseen (kijan s. 108) mukaan keskiavo iiumattomista satunnaismuuttujista, joiden odotusavo (μ) ja keskihajonta (σ) ovat vakioita, noudattaa suuilla havaintomääillä nomaalijakaumaa N(μ, σ 2 ) eli aoksimatiivisesti tunnusluku z = X μ σ/ n as. N(0, 1) noudattaa standadinomaalijakaumaa. Sanojen ituudet ovat ilmeisesti iiumattomia satunnaismuuttujia, joten lausetta voidaan soveltaa. Testisuue on siten 6, 6 6, 2 z = 2, 5/ 0, 876 30 ja sen avoa (0, 876) voidaan veata standadinomaalijakauman 95 esentiiliin (1, 645; yksisuuntainen testi 5 %:n iskitasolla). Koska 0, 876 < 1, 645, niin nollahyoteesi jää voimaan. Ei ole syytä luouaoletuksesta,ettätekstion kijoitettu lyhyemmällä vanhalla muteella.