1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Samankaltaiset tiedostot
Väliestimointi (jatkoa) Heliövaara 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

11. laskuharjoituskierros, vko 15, ratkaisut

Sovellettu todennäköisyyslaskenta B

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

6. laskuharjoitusten vastaukset (viikot 10 11)

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A

Sovellettu todennäköisyyslaskenta B

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Testit laatueroasteikollisille muuttujille

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

10. laskuharjoituskierros, vko 14, ratkaisut

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Hypoteesin testaus Alkeet

Tilastollinen aineisto Luottamusväli

HAVAITUT JA ODOTETUT FREKVENSSIT

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1

Testit järjestysasteikollisille muuttujille

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

2. välikokeen mallivastaukset

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Testejä suhdeasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

805306A Johdatus monimuuttujamenetelmiin, 5 op

Teema 8: Parametrien estimointi ja luottamusvälit

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastotieteen jatkokurssi Sosiaalitieteiden laitos Harjoitus 9 (viikko 16) Ratkaisuehdotuksia (Laura Tuohilampi)

Todennäköisyyden ominaisuuksia

Estimointi. Otantajakauma

Jatkuvat satunnaismuuttujat

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

5 Lisa materiaali. 5.1 Ristiintaulukointi

Sovellettu todennäköisyyslaskenta B

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

riippumattomia ja noudattavat samaa jakaumaa.

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

2. TILASTOLLINEN TESTAAMINEN...

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

30A02000 Tilastotieteen perusteet

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Kaksisuuntainen varianssianalyysi. Heliövaara 1

dx=5&uilang=fi&lang=fi&lvv=2014

Sovellettu todennäköisyyslaskenta B

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

11 Raja-arvolauseita ja approksimaatioita

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Transkriptio:

Sosiaalitieteiden laitos Tilastotieteen jatkokurssi, kevät 20 7. laskuharjoitusten ratkaisuehdotukset. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti on kirjoitettu pidemmällä murteella. Testi tulee siten tehdä yksisuuntaisena. Nollahypoteesin mukaan sanan pituuden odotusarvo on 6,2 ja vastahypoteesin mukaan 7,6. Molemmissa murteissa sanan pituuden keskihajonta on 2, 5 kirjainta. Tekstissä sanan pituuden keskiarvo X = 98/30 = 6, 6 kirjainta. Tehtävässä ei kerrota sanojen pituuden jakaumasta muuta kuin odotusarvo ja keskihajonta. Keskeisen raja-arvolauseen (kirjan s. 08) mukaan keskiarvo riippumattomista satunnaismuuttujista, joiden odotusarvo (μ) ja keskihajonta (σ) ovat vakioita, noudattaa suurilla havaintomäärillä normaalijakaumaa N(μ, σ 2 ) eli approksimatiivisesti tunnusluku z = X μ σ/ n as. N(0, ) noudattaa standardinormaalijakaumaa. Sanojen pituudet on tehtävässä todettu riippumattomiksi satunnaismuuttujiksi, joten lausetta voidaan soveltaa. Testisuure on siten 6, 6 6, 2 z = 2, 5/ 0, 876, 30 ja sen arvoa (0, 876) voidaan verrata standardinormaalijakauman 95 persentiiliin (, 645; yksisuuntainen testi 5 %:n riskitasolla). Koska 0, 876 <, 645, niin nollahypoteesi jää voimaan. Ei ole syytä luopuaoletuksesta,ettätekstion kirjoitettu lyhyemmällä vanhalla murteella. 2. H 0 : p = 0, 5. Vastahypoteesi on kaksisuuntainen eli H : p 6= 0, 5, jossa p on naisen todennäköisyys tulla nimitetyksi. Testisuureen laskeminen tapahtuu täysin samoin kuin yksisuuntaisen testin tapauksessa tehtävässä 6.2: Merkitään satunnaismuuttujalla X nimitettyjen naisten lukumäärää. Tehtävän oletusten mukaan n =22ja p =0, 5 eli X Bin(22; 0, 5). Voimme käyttää binomijakauman normaaliapproksimaatiota sillä np = nq = 22 0, 5 = > 5 (kirjan s. 0). Binomijakautuneen satunnaismuuttujan normaalijakaumaapproksimaatioon perustuva nollahypoteesin pätiessä standardinormaalijakautunut testisuure on z = X np npq = X/n p ( npq)/n = ˆp p p pq/n as. N(0, ). Koska naisia tuli nimitetyiksi 8 kappaletta niin aineistosta laskettu naisten suhteellinen osuus ˆp =8/22 0, 364, joten z = 0, 364 0, 5 p 0, 5 0, 5/22, 276.

Tehtävän 6.2 ratkaisuehdotuksessa ei tarkkaan määritetty yksisuuntaisen testin p-arvoa vaan todettiin vain sen olevan yli 0, 05. Yksisuuntaisen testin p-arvo on Z-jakauman yhden, tehtävän 6.2 tapauksessa vasemman, hännän todennäköisyys. Arvioidaan se z-jakauman taulukkoa hyödyntäen: P(Z.276) P(Z.28) = 0.003 0, 0. Kaksisuuntaisen testin p-arvo on molempien häntätodennäköisyyksien summa testisuureen itseisarvosta eteenpäin. Tässä tapauksessa p-arvo on P(Z.276) + P(Z.276) 0, 20. Kaksisuuntaisen testin p-arvo on kaksinkertainen yksisuuntaisen testin p- arvoon verrattuna, mikä johtuu normaalijakauman symmetrisyydestä. 3. Kun tutkittavan perusjoukon ominaisuuden, eli tässä tapauksessa palkan, oletetaan olevan normaalijakautunut, voidaan käyttää t-testisuuretta. t-testi ei nojaudu normaaliapproksimaatioon, joten sen tulokset ovat tarkempia erityisesti pienillä otoskooilla kuin normaaliapproksimaatioon perustuvan z-testin. t- testisuuretta verrataan Studentin t-jakaumaan, jonka muoto riippuu vapausasteiden lukumäärästä, joka puolestaan riippuu otoskoosta (tämän tehtävän tapauksessa molempien otosten koista). Pienillä vapausasteiden lukumäärillä t-jakauma on selvästi paksuhäntäisempi kuin Z-jakauma ja tällöin t-testiin liittyvät p-arvot ovat suurempia kuin z-testin. Suurilla vapausasteiden lukumäärillä t- ja z- testien p-arvot ovat hyvin lähellä toisiaan, sillä t-jakauma menee standardinormaalijakaumaan ja z-testin pohjana oleva normaaliapproksimaatio tarkentuu otoskoon kasvaessa. a) H 0 : Palkoissa ei ole eroa hetero- ja homoseksuaalisten naisten välillä. H : Heteroseksuaalisten naisten palkka on pienempi kuin homoseksuaalisten naisten. Kahden ryhmän vertailun t-testisuure lasketaan samalla kaavalla kuin z- testisuure laskettiin tehtävässä 6.4: t = X X 2 9400 26600 r s + = r 38000 n n 2 090 + 3, 245. 925 t-testisuuretta verrataan Studentin t-jakaumaan vapausasteilla n + n 2 2 eli 090 + 925 2 = 203.Vapausasteiden määrä on nyt niin suuri, että t-jakauman ja Z-jakauman välinen ero on pieni. Toisaalta testisuureen itseisarvo on niin suuri, että vastaavaa häntätodennäköisyys eli p- arvo on monen desimaalin tarkkuudella nolla sekä t- ettäz-testin tapauksessa, esimerkiksi kurssin kotisivulla linkitetty t-testin todennäköisyyslaskuri antaa vastaavaksi p-arvoksi 0, 000000. Huvin vuoksi lasketaan tilasto-ohjelmistolla tarkat p-arvot: P (Z 3, 245) = 2, 4 4 0 40 2

P (t 3, 245) = 9, 327 0 39. Kummassakin testissä nollahypoteesi hylätään millä tahansa riskitasolla. Heteroseksuaaliset naiset ansaitsevat vähemmän kuin homoseksuaaliset naiset. b) H 0 : hetero- ja homoseksuaalisten miesten palkkojen välillä ei ole eroa. H : Hetero- ja homoseksuaalisten miesten palkkojen välillä on eroa. t = X X 2 303900 274500 r s + = r 40000 n n 2 92 + 8, 389. 38 Vapausasteita on nyt 92 + 38 2 = 2508. Kaksisuuntaisessa testissä p-arvo on kaksi kertaa yhden hännän todennäköisyys. p-arvot ovat nyt vielä suhteellisesti paljon pienempiä kuin a)-kohdassa eli vielä useamman desimaalin tarkkuudella nollia. Tarkkaan laskettuna p-arvot ovat P (Z 8, 389) + P (Z 8, 389) = 2 8, 046 0 76 =, 609 2 0 75 P (t 8, 389) + P (t 8, 389) = 2 3, 02 6 0 7 =6, 025 2 0 7. t-testin p-arvo on yli kymmentuhatkertainen z-testin p-arvoon verrattuna, mutta absoluuttinen ero on häviävän pieni. Molemmat p-arvot ovat käytännössä nollia. Nollahypoteesi siis hylätään molemmissa testeissä millä tahansa riskitasolla. Hetero- ja homoseksuaalisten miesten palkkojen välillä on eroa. 4. Testisuure on ˆp ˆp 2 ˆp( ˆp)( +, ) n n 2 jossa ˆp =(n ˆp +n 2 ˆp 2 )/(n +n 2 ) ja joka noudattaa standardinormaalijakaumaa suurilla havaintomäärillä (kirjan s:t 70 7). Merkitään indeksillä naisia ja indeksillä 2 miehiä. Todetaan ensin, että annetut tiedot ovat keskenään yhtäpitäviä eli että sukupuolten vastustusosuudet tuottavat yleiseksi vastustusosuudeksi kerrotun 0, 5: 485 0, 65 + 522 0, 38 ˆp = 485 + 522 (485 + 522 = 007). Lasketaan testisuure: 0, 65 0, 38 0, 5 0, 49 ( 485 + 522 ) 0, 50 =8, 564. Kriittiset arvot kaksisuuntaisessa testauksessa 5 prosentin riskitasolla ovat ±, 960 (kirjan lopussa olevassa standardinormaalijakauman taulukossa kriittinen arvo on kahden desimaalin tarkkuudella). Havaittu testisuure on (itseisarvoltaan) huomattavasti suurempi, joten nollahypoteesi voidaan hylätä 5 %:n 3

riskitasolla (ja tavattomasti pienemmilläkin riskitasoilla). Lisäydinvoiman vastustajien osuudet ovat erisuuret sukupuolissa. Tehtävä on mahdollista ratkaista myös χ 2 -testillä. Muodostetaan taulukot havaituista ja odotetuista solufrekvensseistä: ei vastusta vastustaa yhteensä miehet 324 98 522 naiset 70 35 485 yhteensä 494 53 007 ei vastusta vastustaa yhteensä miehet 256,075 265,925 522 naiset 237,925 247,075 485 yhteensä 494 53 007 Testisuure (aputulos ja kirjan s. 80) on nyt X 2 = 2X 2X i= j= (O ij E ij ) 2 E ij (324 256, 075)2 (35 247, 075)2 + + 73, 43. 258, 667 247, 075 O ij on havaittu frekvenssi. Odotetut frekvenssit E ij on laskettu kaavalla C j E ij = R i n n n = R ic j n, jossa R i on i. rivifrekvenssi, C j on j. sarakefrekvenssi ja n on havaintojen kokonaislukumäärä (kirjan s. 85). Esimerkiksi E = 522 494/007 = 256, 075. Nollahypoteesin pätiessä testisuure noudattaa asymptoottisesti χ 2 (2 )(2 ) -eli χ 2 -jakaumaa (kirjan s. 85). Sen kriittinen arvo 5 prosentin riskitasolla on 3, 84 (kirjan lopussa olevasta taulukosta). Nollahypoteesi hylätään selkeästi 5 %:n riskitasolla (ja %:n riskitasolla, jolla kriittinen arvo on 6, 635). Ylitse kurssin menevää pohdintaa: Ensin laskettu testisuure neliöitynä on 8, 564 2 73, 34, jokaonχ 2 -jakautuneen testisuureen arvo 73, 43. Testien p- arvot ovat siten oleellisesti identtiset. (Standardinormaalijakautuneen muuttujan neliö noudattaa χ 2 -jakaumaa.) 5. Lehtien teettämiä kyselyitä voitanee pitää toisistaan riippumattomina. Kyseessä on siten kolmen jakauman yhteensopivuustesti (kirjan s:t 78 ja 86). Testisuure on (kirjan s. 80) rx cx X 2 (O ij E ij ) 2 = χ 2 (r )(c ) E. ij i= j= O ij on havaittu frekvenssi. Odotetut frekvenssit E ij lasketaan kaavalla 4

E ij = C j n n i, jossa C j on j. sarakefrekvenssi ja n i on i. ryhmän otoskoko (kirjan s. 78). Tehtävässä on kolme ryhmää (kyselyt) ja kolme luokkaa (kantaa) eli i, j =, 2, 3. Odotetut frekvenssit on koottu taulukkoon alla. Esimerkiksi E = (47/3007) 007 474, 53. vastustaa ei kantaa kannattaa yhteensä (lkm) Yle 474,53 08,50 423,96 007 HS 47,23 07,75 42,02 000 Aamulehti 47,23 07,75 42,02 000 yhteensä (lkm) 47 324 266 3007 Testisuure saa arvon 3X 3X X 2 = i= j= (O ij E ij ) 2 E ij (57 474, 53)2 (390 42, 02)2 + + 6, 09. 474, 53 42, 02 Nollahypoteesi on, että jakaumat kullakin taulukon rivillä (kyselyssä) ovat samoja. Nollahypoteesin pätiessä testisuure noudattaa jakaumaa χ 2 (3 )(3 ) = χ2 4,kun havaintoja on paljon. Kriittinen arvo %:n riskitasolla on 3, 277 (kirjan lopussa olevasta taulukosta), joten nollahypoteesi hylätään tällä riskitasolla. Nollahypoteesi hylätään selkeästi jopa 0, %:n riskitasolla, jolloin kriittinen arvo on 8, 467. Testin mukaan vastausjakaumien eroja ei voida tulkita kyselyjen satunnaisvaihtelusta johtuvaksi. Lisäpohdintaa: Kaikki kyselyt on tehty maaliskuussa 200. Mielipiteet eivät näin lyhyellä aikavälillä yleensä muutu paljoa, joten kyselyiden erot ja testin tulos ovat yllättäviä. Eritoten Helsingin Sanomien kyselyssä vastausten jakauma vaikuttaa poikkeavan muiden kyselyiden tuloksista, vaikka se on tehty Ylen ja Aamulehden kyselyjen välissä. Testataan mielenkiinnosta, eroavatko Ylen ja Aamulehden alku- ja loppumaaliskuusta tehtyjen kyselyiden jakaumat toisistaan χ 2 -testin mukaan. Taulukoihin alla on laskettu uuden kysymyksenasettelun mukaiset sarakesummat (ylempi taulukko) ja odotetut frekvenssit (alempi taulukko, jossa esim. E = (987/2007) 007 495, 22). vastustaa ei kantaa kannattaa yhteensä (lkm) Yle 57 44 346 007 Aamulehti 470 40 390 000 yhteensä (lkm) 987 284 736 2007 5

vastustaa ei kantaa kannattaa yhteensä (lkm) Yle 495,22 42,50 369,28 007 Aamulehti 49,78 4,50 366,72 000 yhteensä (lkm) 987 284 736 2007 Testisuure saa arvon 2X 3X X 2 (O ij E ij ) 2 (57 495, 22)2 (390 366, 72)2 = + + 4, 900. E ij 495, 22 366, 72 i= j= Vertailujakauma on nyt χ 2 (2 )(3 ) = χ2 2. Riskitasoja 5 ja 0 % vastaavat kriittiset arvot olisivat 5, 99 ja 4, 605. Testinp-arvo sijoittuu välille (0, 05; 0, 0), joten tavanomaisilla riskitasoilla nollahypoteesia ei hylätä. Vaikuttaa siltä, että nollahypoteesin selkeä hylkäys edellä johtui Helsingin Sanomien teettämän kyselyn tuloksista. Mieleen tulee, että tässä kyselyssä on ollut jotain poikkeuksellista. Huomio kiinnittyy esimerkiksi luokan "ei kantaa" pieneen osuuteen Helsingin Sanomien tutkimuksessa (4 %vs. 4 %muissa kyselyissä). 6. Testaukset on kätevintä tehdä suhteellisen osuuden z-testillä. Testisuure on kirjan sivulla 70 esitetty ˆp ˆp 2 ˆp( ˆp)( +, ) n n 2 jossa ˆp =(n ˆp + n 2 ˆp 2 )/(n + n 2 ). Merkitään tällä kertaa indeksillä miehiä ja indeksillä 2 naisia. a) H 0 : Väkivaltaa puolisonsa taholta joskus kokeineiden miesten ja naisten osuudet ovat samat H : Väkivaltaa puolisonsa taholta joskus kokeineiden miesten ja naisten osuudet ovat eri suuret. Nyt ˆp = (9 0, 42 + 79 0, 43)/(9 + 79) = 0, 424. 0, 42 0, 43 0, 424( 0, 424)( 9 + 0, 066. 79 ) Kaksisuuntaisessa z testissä 5 %:n riskitason kriittiset arvot ovat ±, 96. Jos havaittu testisuure on pienempi kuin, 96 tai suurempi kuin, 96 niin H 0 hylätään. 0, 066 ei ole pienempi kuin, 96, jotenh 0 jää voimaan. 6

H 0 : Väkivaltaa puolisonsa taholta viimeisen 2 kuukauden aikana kokeneiden miesten ja naisten osuudet ovat samat H : Väkivaltaa puolisonsa taholta viimeisen 2 kuukauden aikana kokeneiden miesten ja naisten osuudet ovat eri suuret. ˆp = (9 0, 044 + 79 0, 037)/(9 + 79) = 0, 040 0, 044 0, 037 0, 040( 0, 040)( 9 + =0, 75905 79 ) Testisuure on pienempi kuin kriittinen arvo, 96, jotenh 0 jää voimaan. b) H 0 : miesten ja naisten osuudet ovat samat ryhmässä, joka kokee väkivallan alkaneen viimeisen 2 kuukauden aikana. H : miesten ja naisten osuudet ovat eri suuret ryhmässä, joka kokee väkivallan alkaneen viimeisen 2 kuukauden aikana. ˆp = (202 0, 6 + 27 0, 085)/(202 + 27) = 0, 305 0, 6 0, 085 0, 305( 0, 305)( 202 + 27 ) =, 9626 Testisuureen arvo, 9626 riittäisi juuri ja juuri nollahypoteesin hylkäämiseen 5 % riskitasolla, mutta 0, %:n riskitasolla kriittinen arvo on taulukosta arvioituna ±3, 3. Testisuureen arvo, 9626 ei ole suurempi kuin 3, 3, jotenh 0 jää voimaan. H 0 : miesten ja naisten osuudet ovat samat ryhmässä, joka kokee väkivallan alkaneen yli 0 vuotta sitten. H : miesten ja naisten osuudet ovat eri suuret ryhmässä, joka kokee väkivallan alkaneen yli 0 vuotta sitten. ˆp = (202 0, 258 + 27 0, 494)/(202 + 27) = 0, 349 0, 258 0, 494 0, 349( 0, 349)( 202 + 27 ) = 4, 378 Testisuureen arvo 4, 37 8 on pienempi kuin negatiivinen kriittinen arvo 3, 3, jotenh 0 hylätään. c) 7

H 0 : Seksuaalista häirintää kokeneiden miesten ja naisten osuudet ovat samat. H : Seksuaalista häirintää kokeneiden miesten ja naisten osuudet ovat eri suuret. ˆp = (98 0, 263 + 309 0, 643)/(98 + 309) = 0, 474 0, 263 0, 643 0, 47 4( 0, 47 4)( 98 + = 2, 496 309 ) Kurssin kotisivulle linkitetyn laskurin tarkkuuden puitteissa p-arvo on 0, 00000 eli HT 7.3:ssakin laskettuja pienempi. Tässäkin tehtävässä voi käyttää χ 2 -testiä. Näytetään esimerkkinä c)-kohta. Palautetaan suhteelliset osuudet frekvensseiksi, esim. 98 0, 263 504; 309 0, 643 842: kokenut häirintää ei ole kokenut häirintää yhteensä miehet 504 45 98 naiset 842 467 309 yhteensä 346 862 3227 Odotetut frekvenssit saadaan kertomalla miesten ja naisten lukumäärät vasemmassa sarakkeessa ˆp:lla ja oikeassa ( ˆp):lla. Esim.98 0, 47 4 800. kokenut häirintää ei ole kokenut häirintää yhteensä miehet 800 8 98 naiset 546 763 309 yhteensä 346 862 3227 χ 2 -testisuureen arvo on (504 800) 2 + 800 (45 8)2 8 + (842 546)2 546 + (467 763)2 763 =463, 72. Voidaan taas huomata, että yhdellä vapausasteella χ 2 -testisuureen arvo on pyöristystarkkuuksien rajoissa sama kuin vastaavan suhteellisen osuuden z-testisuuren toinen potenssi: 2, 496 2 = 462, 08. 8