Sosiaalitieteiden laitos Tilastotieteen jatkokurssi, kevät 20 7. laskuharjoitusten ratkaisuehdotukset. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti on kirjoitettu pidemmällä murteella. Testi tulee siten tehdä yksisuuntaisena. Nollahypoteesin mukaan sanan pituuden odotusarvo on 6,2 ja vastahypoteesin mukaan 7,6. Molemmissa murteissa sanan pituuden keskihajonta on 2, 5 kirjainta. Tekstissä sanan pituuden keskiarvo X = 98/30 = 6, 6 kirjainta. Tehtävässä ei kerrota sanojen pituuden jakaumasta muuta kuin odotusarvo ja keskihajonta. Keskeisen raja-arvolauseen (kirjan s. 08) mukaan keskiarvo riippumattomista satunnaismuuttujista, joiden odotusarvo (μ) ja keskihajonta (σ) ovat vakioita, noudattaa suurilla havaintomäärillä normaalijakaumaa N(μ, σ 2 ) eli approksimatiivisesti tunnusluku z = X μ σ/ n as. N(0, ) noudattaa standardinormaalijakaumaa. Sanojen pituudet on tehtävässä todettu riippumattomiksi satunnaismuuttujiksi, joten lausetta voidaan soveltaa. Testisuure on siten 6, 6 6, 2 z = 2, 5/ 0, 876, 30 ja sen arvoa (0, 876) voidaan verrata standardinormaalijakauman 95 persentiiliin (, 645; yksisuuntainen testi 5 %:n riskitasolla). Koska 0, 876 <, 645, niin nollahypoteesi jää voimaan. Ei ole syytä luopuaoletuksesta,ettätekstion kirjoitettu lyhyemmällä vanhalla murteella. 2. H 0 : p = 0, 5. Vastahypoteesi on kaksisuuntainen eli H : p 6= 0, 5, jossa p on naisen todennäköisyys tulla nimitetyksi. Testisuureen laskeminen tapahtuu täysin samoin kuin yksisuuntaisen testin tapauksessa tehtävässä 6.2: Merkitään satunnaismuuttujalla X nimitettyjen naisten lukumäärää. Tehtävän oletusten mukaan n =22ja p =0, 5 eli X Bin(22; 0, 5). Voimme käyttää binomijakauman normaaliapproksimaatiota sillä np = nq = 22 0, 5 = > 5 (kirjan s. 0). Binomijakautuneen satunnaismuuttujan normaalijakaumaapproksimaatioon perustuva nollahypoteesin pätiessä standardinormaalijakautunut testisuure on z = X np npq = X/n p ( npq)/n = ˆp p p pq/n as. N(0, ). Koska naisia tuli nimitetyiksi 8 kappaletta niin aineistosta laskettu naisten suhteellinen osuus ˆp =8/22 0, 364, joten z = 0, 364 0, 5 p 0, 5 0, 5/22, 276.
Tehtävän 6.2 ratkaisuehdotuksessa ei tarkkaan määritetty yksisuuntaisen testin p-arvoa vaan todettiin vain sen olevan yli 0, 05. Yksisuuntaisen testin p-arvo on Z-jakauman yhden, tehtävän 6.2 tapauksessa vasemman, hännän todennäköisyys. Arvioidaan se z-jakauman taulukkoa hyödyntäen: P(Z.276) P(Z.28) = 0.003 0, 0. Kaksisuuntaisen testin p-arvo on molempien häntätodennäköisyyksien summa testisuureen itseisarvosta eteenpäin. Tässä tapauksessa p-arvo on P(Z.276) + P(Z.276) 0, 20. Kaksisuuntaisen testin p-arvo on kaksinkertainen yksisuuntaisen testin p- arvoon verrattuna, mikä johtuu normaalijakauman symmetrisyydestä. 3. Kun tutkittavan perusjoukon ominaisuuden, eli tässä tapauksessa palkan, oletetaan olevan normaalijakautunut, voidaan käyttää t-testisuuretta. t-testi ei nojaudu normaaliapproksimaatioon, joten sen tulokset ovat tarkempia erityisesti pienillä otoskooilla kuin normaaliapproksimaatioon perustuvan z-testin. t- testisuuretta verrataan Studentin t-jakaumaan, jonka muoto riippuu vapausasteiden lukumäärästä, joka puolestaan riippuu otoskoosta (tämän tehtävän tapauksessa molempien otosten koista). Pienillä vapausasteiden lukumäärillä t-jakauma on selvästi paksuhäntäisempi kuin Z-jakauma ja tällöin t-testiin liittyvät p-arvot ovat suurempia kuin z-testin. Suurilla vapausasteiden lukumäärillä t- ja z- testien p-arvot ovat hyvin lähellä toisiaan, sillä t-jakauma menee standardinormaalijakaumaan ja z-testin pohjana oleva normaaliapproksimaatio tarkentuu otoskoon kasvaessa. a) H 0 : Palkoissa ei ole eroa hetero- ja homoseksuaalisten naisten välillä. H : Heteroseksuaalisten naisten palkka on pienempi kuin homoseksuaalisten naisten. Kahden ryhmän vertailun t-testisuure lasketaan samalla kaavalla kuin z- testisuure laskettiin tehtävässä 6.4: t = X X 2 9400 26600 r s + = r 38000 n n 2 090 + 3, 245. 925 t-testisuuretta verrataan Studentin t-jakaumaan vapausasteilla n + n 2 2 eli 090 + 925 2 = 203.Vapausasteiden määrä on nyt niin suuri, että t-jakauman ja Z-jakauman välinen ero on pieni. Toisaalta testisuureen itseisarvo on niin suuri, että vastaavaa häntätodennäköisyys eli p- arvo on monen desimaalin tarkkuudella nolla sekä t- ettäz-testin tapauksessa, esimerkiksi kurssin kotisivulla linkitetty t-testin todennäköisyyslaskuri antaa vastaavaksi p-arvoksi 0, 000000. Huvin vuoksi lasketaan tilasto-ohjelmistolla tarkat p-arvot: P (Z 3, 245) = 2, 4 4 0 40 2
P (t 3, 245) = 9, 327 0 39. Kummassakin testissä nollahypoteesi hylätään millä tahansa riskitasolla. Heteroseksuaaliset naiset ansaitsevat vähemmän kuin homoseksuaaliset naiset. b) H 0 : hetero- ja homoseksuaalisten miesten palkkojen välillä ei ole eroa. H : Hetero- ja homoseksuaalisten miesten palkkojen välillä on eroa. t = X X 2 303900 274500 r s + = r 40000 n n 2 92 + 8, 389. 38 Vapausasteita on nyt 92 + 38 2 = 2508. Kaksisuuntaisessa testissä p-arvo on kaksi kertaa yhden hännän todennäköisyys. p-arvot ovat nyt vielä suhteellisesti paljon pienempiä kuin a)-kohdassa eli vielä useamman desimaalin tarkkuudella nollia. Tarkkaan laskettuna p-arvot ovat P (Z 8, 389) + P (Z 8, 389) = 2 8, 046 0 76 =, 609 2 0 75 P (t 8, 389) + P (t 8, 389) = 2 3, 02 6 0 7 =6, 025 2 0 7. t-testin p-arvo on yli kymmentuhatkertainen z-testin p-arvoon verrattuna, mutta absoluuttinen ero on häviävän pieni. Molemmat p-arvot ovat käytännössä nollia. Nollahypoteesi siis hylätään molemmissa testeissä millä tahansa riskitasolla. Hetero- ja homoseksuaalisten miesten palkkojen välillä on eroa. 4. Testisuure on ˆp ˆp 2 ˆp( ˆp)( +, ) n n 2 jossa ˆp =(n ˆp +n 2 ˆp 2 )/(n +n 2 ) ja joka noudattaa standardinormaalijakaumaa suurilla havaintomäärillä (kirjan s:t 70 7). Merkitään indeksillä naisia ja indeksillä 2 miehiä. Todetaan ensin, että annetut tiedot ovat keskenään yhtäpitäviä eli että sukupuolten vastustusosuudet tuottavat yleiseksi vastustusosuudeksi kerrotun 0, 5: 485 0, 65 + 522 0, 38 ˆp = 485 + 522 (485 + 522 = 007). Lasketaan testisuure: 0, 65 0, 38 0, 5 0, 49 ( 485 + 522 ) 0, 50 =8, 564. Kriittiset arvot kaksisuuntaisessa testauksessa 5 prosentin riskitasolla ovat ±, 960 (kirjan lopussa olevassa standardinormaalijakauman taulukossa kriittinen arvo on kahden desimaalin tarkkuudella). Havaittu testisuure on (itseisarvoltaan) huomattavasti suurempi, joten nollahypoteesi voidaan hylätä 5 %:n 3
riskitasolla (ja tavattomasti pienemmilläkin riskitasoilla). Lisäydinvoiman vastustajien osuudet ovat erisuuret sukupuolissa. Tehtävä on mahdollista ratkaista myös χ 2 -testillä. Muodostetaan taulukot havaituista ja odotetuista solufrekvensseistä: ei vastusta vastustaa yhteensä miehet 324 98 522 naiset 70 35 485 yhteensä 494 53 007 ei vastusta vastustaa yhteensä miehet 256,075 265,925 522 naiset 237,925 247,075 485 yhteensä 494 53 007 Testisuure (aputulos ja kirjan s. 80) on nyt X 2 = 2X 2X i= j= (O ij E ij ) 2 E ij (324 256, 075)2 (35 247, 075)2 + + 73, 43. 258, 667 247, 075 O ij on havaittu frekvenssi. Odotetut frekvenssit E ij on laskettu kaavalla C j E ij = R i n n n = R ic j n, jossa R i on i. rivifrekvenssi, C j on j. sarakefrekvenssi ja n on havaintojen kokonaislukumäärä (kirjan s. 85). Esimerkiksi E = 522 494/007 = 256, 075. Nollahypoteesin pätiessä testisuure noudattaa asymptoottisesti χ 2 (2 )(2 ) -eli χ 2 -jakaumaa (kirjan s. 85). Sen kriittinen arvo 5 prosentin riskitasolla on 3, 84 (kirjan lopussa olevasta taulukosta). Nollahypoteesi hylätään selkeästi 5 %:n riskitasolla (ja %:n riskitasolla, jolla kriittinen arvo on 6, 635). Ylitse kurssin menevää pohdintaa: Ensin laskettu testisuure neliöitynä on 8, 564 2 73, 34, jokaonχ 2 -jakautuneen testisuureen arvo 73, 43. Testien p- arvot ovat siten oleellisesti identtiset. (Standardinormaalijakautuneen muuttujan neliö noudattaa χ 2 -jakaumaa.) 5. Lehtien teettämiä kyselyitä voitanee pitää toisistaan riippumattomina. Kyseessä on siten kolmen jakauman yhteensopivuustesti (kirjan s:t 78 ja 86). Testisuure on (kirjan s. 80) rx cx X 2 (O ij E ij ) 2 = χ 2 (r )(c ) E. ij i= j= O ij on havaittu frekvenssi. Odotetut frekvenssit E ij lasketaan kaavalla 4
E ij = C j n n i, jossa C j on j. sarakefrekvenssi ja n i on i. ryhmän otoskoko (kirjan s. 78). Tehtävässä on kolme ryhmää (kyselyt) ja kolme luokkaa (kantaa) eli i, j =, 2, 3. Odotetut frekvenssit on koottu taulukkoon alla. Esimerkiksi E = (47/3007) 007 474, 53. vastustaa ei kantaa kannattaa yhteensä (lkm) Yle 474,53 08,50 423,96 007 HS 47,23 07,75 42,02 000 Aamulehti 47,23 07,75 42,02 000 yhteensä (lkm) 47 324 266 3007 Testisuure saa arvon 3X 3X X 2 = i= j= (O ij E ij ) 2 E ij (57 474, 53)2 (390 42, 02)2 + + 6, 09. 474, 53 42, 02 Nollahypoteesi on, että jakaumat kullakin taulukon rivillä (kyselyssä) ovat samoja. Nollahypoteesin pätiessä testisuure noudattaa jakaumaa χ 2 (3 )(3 ) = χ2 4,kun havaintoja on paljon. Kriittinen arvo %:n riskitasolla on 3, 277 (kirjan lopussa olevasta taulukosta), joten nollahypoteesi hylätään tällä riskitasolla. Nollahypoteesi hylätään selkeästi jopa 0, %:n riskitasolla, jolloin kriittinen arvo on 8, 467. Testin mukaan vastausjakaumien eroja ei voida tulkita kyselyjen satunnaisvaihtelusta johtuvaksi. Lisäpohdintaa: Kaikki kyselyt on tehty maaliskuussa 200. Mielipiteet eivät näin lyhyellä aikavälillä yleensä muutu paljoa, joten kyselyiden erot ja testin tulos ovat yllättäviä. Eritoten Helsingin Sanomien kyselyssä vastausten jakauma vaikuttaa poikkeavan muiden kyselyiden tuloksista, vaikka se on tehty Ylen ja Aamulehden kyselyjen välissä. Testataan mielenkiinnosta, eroavatko Ylen ja Aamulehden alku- ja loppumaaliskuusta tehtyjen kyselyiden jakaumat toisistaan χ 2 -testin mukaan. Taulukoihin alla on laskettu uuden kysymyksenasettelun mukaiset sarakesummat (ylempi taulukko) ja odotetut frekvenssit (alempi taulukko, jossa esim. E = (987/2007) 007 495, 22). vastustaa ei kantaa kannattaa yhteensä (lkm) Yle 57 44 346 007 Aamulehti 470 40 390 000 yhteensä (lkm) 987 284 736 2007 5
vastustaa ei kantaa kannattaa yhteensä (lkm) Yle 495,22 42,50 369,28 007 Aamulehti 49,78 4,50 366,72 000 yhteensä (lkm) 987 284 736 2007 Testisuure saa arvon 2X 3X X 2 (O ij E ij ) 2 (57 495, 22)2 (390 366, 72)2 = + + 4, 900. E ij 495, 22 366, 72 i= j= Vertailujakauma on nyt χ 2 (2 )(3 ) = χ2 2. Riskitasoja 5 ja 0 % vastaavat kriittiset arvot olisivat 5, 99 ja 4, 605. Testinp-arvo sijoittuu välille (0, 05; 0, 0), joten tavanomaisilla riskitasoilla nollahypoteesia ei hylätä. Vaikuttaa siltä, että nollahypoteesin selkeä hylkäys edellä johtui Helsingin Sanomien teettämän kyselyn tuloksista. Mieleen tulee, että tässä kyselyssä on ollut jotain poikkeuksellista. Huomio kiinnittyy esimerkiksi luokan "ei kantaa" pieneen osuuteen Helsingin Sanomien tutkimuksessa (4 %vs. 4 %muissa kyselyissä). 6. Testaukset on kätevintä tehdä suhteellisen osuuden z-testillä. Testisuure on kirjan sivulla 70 esitetty ˆp ˆp 2 ˆp( ˆp)( +, ) n n 2 jossa ˆp =(n ˆp + n 2 ˆp 2 )/(n + n 2 ). Merkitään tällä kertaa indeksillä miehiä ja indeksillä 2 naisia. a) H 0 : Väkivaltaa puolisonsa taholta joskus kokeineiden miesten ja naisten osuudet ovat samat H : Väkivaltaa puolisonsa taholta joskus kokeineiden miesten ja naisten osuudet ovat eri suuret. Nyt ˆp = (9 0, 42 + 79 0, 43)/(9 + 79) = 0, 424. 0, 42 0, 43 0, 424( 0, 424)( 9 + 0, 066. 79 ) Kaksisuuntaisessa z testissä 5 %:n riskitason kriittiset arvot ovat ±, 96. Jos havaittu testisuure on pienempi kuin, 96 tai suurempi kuin, 96 niin H 0 hylätään. 0, 066 ei ole pienempi kuin, 96, jotenh 0 jää voimaan. 6
H 0 : Väkivaltaa puolisonsa taholta viimeisen 2 kuukauden aikana kokeneiden miesten ja naisten osuudet ovat samat H : Väkivaltaa puolisonsa taholta viimeisen 2 kuukauden aikana kokeneiden miesten ja naisten osuudet ovat eri suuret. ˆp = (9 0, 044 + 79 0, 037)/(9 + 79) = 0, 040 0, 044 0, 037 0, 040( 0, 040)( 9 + =0, 75905 79 ) Testisuure on pienempi kuin kriittinen arvo, 96, jotenh 0 jää voimaan. b) H 0 : miesten ja naisten osuudet ovat samat ryhmässä, joka kokee väkivallan alkaneen viimeisen 2 kuukauden aikana. H : miesten ja naisten osuudet ovat eri suuret ryhmässä, joka kokee väkivallan alkaneen viimeisen 2 kuukauden aikana. ˆp = (202 0, 6 + 27 0, 085)/(202 + 27) = 0, 305 0, 6 0, 085 0, 305( 0, 305)( 202 + 27 ) =, 9626 Testisuureen arvo, 9626 riittäisi juuri ja juuri nollahypoteesin hylkäämiseen 5 % riskitasolla, mutta 0, %:n riskitasolla kriittinen arvo on taulukosta arvioituna ±3, 3. Testisuureen arvo, 9626 ei ole suurempi kuin 3, 3, jotenh 0 jää voimaan. H 0 : miesten ja naisten osuudet ovat samat ryhmässä, joka kokee väkivallan alkaneen yli 0 vuotta sitten. H : miesten ja naisten osuudet ovat eri suuret ryhmässä, joka kokee väkivallan alkaneen yli 0 vuotta sitten. ˆp = (202 0, 258 + 27 0, 494)/(202 + 27) = 0, 349 0, 258 0, 494 0, 349( 0, 349)( 202 + 27 ) = 4, 378 Testisuureen arvo 4, 37 8 on pienempi kuin negatiivinen kriittinen arvo 3, 3, jotenh 0 hylätään. c) 7
H 0 : Seksuaalista häirintää kokeneiden miesten ja naisten osuudet ovat samat. H : Seksuaalista häirintää kokeneiden miesten ja naisten osuudet ovat eri suuret. ˆp = (98 0, 263 + 309 0, 643)/(98 + 309) = 0, 474 0, 263 0, 643 0, 47 4( 0, 47 4)( 98 + = 2, 496 309 ) Kurssin kotisivulle linkitetyn laskurin tarkkuuden puitteissa p-arvo on 0, 00000 eli HT 7.3:ssakin laskettuja pienempi. Tässäkin tehtävässä voi käyttää χ 2 -testiä. Näytetään esimerkkinä c)-kohta. Palautetaan suhteelliset osuudet frekvensseiksi, esim. 98 0, 263 504; 309 0, 643 842: kokenut häirintää ei ole kokenut häirintää yhteensä miehet 504 45 98 naiset 842 467 309 yhteensä 346 862 3227 Odotetut frekvenssit saadaan kertomalla miesten ja naisten lukumäärät vasemmassa sarakkeessa ˆp:lla ja oikeassa ( ˆp):lla. Esim.98 0, 47 4 800. kokenut häirintää ei ole kokenut häirintää yhteensä miehet 800 8 98 naiset 546 763 309 yhteensä 346 862 3227 χ 2 -testisuureen arvo on (504 800) 2 + 800 (45 8)2 8 + (842 546)2 546 + (467 763)2 763 =463, 72. Voidaan taas huomata, että yhdellä vapausasteella χ 2 -testisuureen arvo on pyöristystarkkuuksien rajoissa sama kuin vastaavan suhteellisen osuuden z-testisuuren toinen potenssi: 2, 496 2 = 462, 08. 8