Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Samankaltaiset tiedostot
11. laskuharjoituskierros, vko 15, ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

10. laskuharjoituskierros, vko 14, ratkaisut

Sovellettu todennäköisyyslaskenta B

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Väliestimointi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

Testit laatueroasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

,ܾ jaü on annettu niin voidaan hakea funktion

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Sovellettu todennäköisyyslasku A

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Estimointi. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

2. TILASTOLLINEN TESTAAMINEN...

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Testit järjestysasteikollisille muuttujille

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Tilastollinen aineisto Luottamusväli

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Ó Ó Ó

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Todennäköisyyden ominaisuuksia

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

tilastotieteen kertaus

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

6. laskuharjoitusten vastaukset (viikot 10 11)

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Teema 8: Parametrien estimointi ja luottamusvälit

Tilastollisia peruskäsitteitä ja Monte Carlo

Näihin harjoitustehtäviin liittyvä teoria löytyy Adamsista: Ad6, Ad5, 4: 12.8, ; Ad3: 13.8,

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

5.7 Uskottavuusfunktioon perustuvia testejä II

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

pisteet Frekvenssi frekvenssi Yhteensä

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Transkriptio:

17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten noudattavan kummassakin kohteessa normaalijakaumaa. Ovatko varianssit yhtä suuret? Testaa merkitsevyystasolla. Ratkaisu: Tässä ei ole annettu mitään tietoa numeroarvojen lisäksi jonka perusteella olisi odotettavissa, että toinen variansseista olisi toista suurempi joten ainoa järkevä nollahypoteesi on silloin À Ã. Tarvittavat arvot:, Ã,, à ja «. F-testisuureen arvoksi saadaan à Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan vapausasteparametreilla ja à eli toisin sanoen µ à µ µ. Kriittisiksi arvoiksi saadaan «µ µ oikeanpuolisen hylkäysalueen alarajana (jota tosin tässä tapauksessa ei tarvita) on µ µµ vasemmanpuolisen hylkäysalueen ylärajana ja koska ei nollahypoteesia hylätä. (-arvoksi saadaan noin joten hylkäämiseen ei todellakaan ole syytä.) Tässä siis käytettiin hyväksi se tosiasia, että jos Ñ µ niin ѵ ja ÈÖ µ ÈÖ µ. Variansseja voidaan pitää yhtäsuurina. 2. Oletetaan, että, ja, muodostavat satunnaisotoksia jakaumista Æ µ ja Æ µ. Olkoon nollahypoteesina À. Mikä on todennäköisyys, että nollahypoteesi hylätään kun käytetään -testisuuretta varianssien yhtäsuuruuden testaamiseen merkitsevyystasolla jos todellisuudessa ja ja. Ratkaisu: Testisuure on Ë Ë ja nollahypoteesi hylätään jos «µ Koska µë oletuksilla pätee todellisuudessa µ niin annetuilla µë µë µ

Näin ollen ÈÖ nollahypoteesi hylätään µ ÈÖ «µµ ÈÖ «µ Tämä voidaan laskea numeerisesti µ-jakauman kertymaäfunktion avulla ja jos esimerkiksi «, ja saadaan hylkäämistodennäköisyys :n funktiona: 1 º 0.5 1 2 3. Kun on saatu havaintoarvoja, jotka nollahypoteesin mukaan noudattavat ÖÓÙÐÐ µjakaumaa ja halutaan testata nollahypoteesia À niin voidaan joko testata poikeaako suhteellinen havaittu osuus liian paljon arvosta käyttämällä normaaliapproksimaatiota tai sitten voidaan käyttää -testiä jakaumien vertailuun. Mikä on ero näiden menetelmien välillä? Ratkaisu: Oletetaan siis, että havaintoina on saatu Ñ nollaa ja ykköstä jolloin havaituksi suhteelliseksi osuudeksi tulee Ñ Edellisessä tapauksessa testisuure on Þ Ñ Jälkimmäisessä tapauksessa todetaan että nollien odotusarvo on odotusarvoksi tulee Ñ µ joten saadaan seuraava taulukko: Havaitut Ó Odotetut Nollat Ñ µ Ñ µ Ykköset Ñ µ -testin testisuureksi tulee Ñ µ Ñ µµ µ Ñ µ Ñ µµ Ñ µ Ñ µµµ Ñ µµ µ Ñ µ Ñ µ Ñ Ñ µ µ Ñ µ ja ykkösten µ Ñ µ

Tästä nähdään, että Þ ja koska Æ µ niin -testin testisuure noudattaa approksimatiivisesti µ-jakaumaa. -testin heikkoutena on, että suuri testisuuren arvo ei sano mitään siitä onko havaittu suhteellinen osuus suurempi vai pienempi kuin. 4. Kurssin Mat-1.2620 1. välikokeessa syksyllä 2006 pistejakauma oli seuraavanlainen: Pisteet 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Lkm 1 3 6 5 11 12 20 14 14 25 7 21 24 23 Pisteet 14 15 16 17 18 19 20 21 22 23 24 Lkm 31 25 14 26 29 13 15 13 10 13 10 Onko tämä jakauma normaalinen? Ratkaisu: Pistesummien keskiarvoksi saadaan ja otosvarianssiksi. Jos Æ µ niin esim. ÈÖ µµ ÈÖ ja tämä todennäköisyys, että nollahypoteesin ollessa voimassa saadaan 15 pistettä, voidaan laskea Æ µ-jakuman kertymäfunktion avulla. Kun näin saadut todennäköisyydet kerrotaan lukumäärällä saadaan odotetut lukumääärä eli Pisteet 0 1 2 3 4 5 6 7 8 9 4.7 2.6 3.73 5.19 7.02 9.19 11.69 14.41 17.24 20 Pisteet 10 11 12 13 14 15 16 17 18 19 22.51 24.57 26.02 26.73 26.64 25.75 24.14 21.96 19.38 16.58 Pisteet 20 21 22 23 24 13.77 11.09 8.66 6.56 14.87 È Ç Kun näiden arvojen perusteella lasketaan testisuuren à à µ à arvo saadaan ja koska vapausasteita on saadaan -arvoiksi noin (koska µ. Jos arvioidaan, että pistesummien kohdalla odotetut ja havaitut lukumäärät ovat liian pieniä niin voidaan ja sekä ja yhdistää. Silloin testisuuren arvoksi tulee ja -arvoksi vastaavasti noin joten tällä luokkien yhdistämisellä ei ollut kovin suurta merkitystä. Joka tapauksessa nollahypoteesi voidaan hylätä merkitsevyystasolla, joka on aika pieni. 5. Erään rokotuskokeen tulokset on esitetty alla. Käytä seuraavissa testeissä 5% merkitsevyystasoa. (a) Tutki, vaikuttaako rokotus sairastuvuuteen. (b) Sovella rokotuskokeen tuloksiin -testiä, kun nollahypoteesi olettaa, että sairastuvuus ei riipu rokotuksesta. Vertaa (a)- ja (b)-kohtien testien tuloksia toisiinsa. Voivatko ko. testit johtaa eri tulokseen? Sairastui Ei sairastunut Rokotettiin 9 42 Ei rokotettu 17 28

Ratkaisu: (a) Nollahypoteesi on: À Rokotus ei vaikuta sairastavuuteen, eli. Yllä on todennäköisyys sairastua, jos on rokotettu ja todennäköisyys sairastua, jos ei ole rokotettu. Tarvittavia lukuarvoja:,, ja sekä yhdistetyn suhteellisen osuuden estimaatti: Näiden perusteella testisuure saa arvon: µ Nollahypoteesin pätiessä testisuure on jakautunut suurissa otoksissa approksimatiivisesti Æ µ-jakauman mukaan. Kriittiset arvot merkitsevyystasolla 5% ovat siten Þ «Þ ja hylkäysalue on Þ tai Þ Koska Þ, nollahypoteesi hylätään. (b) Käytämme siis -riippumattomuustestiä ja nollahypoteesi on À Sairastumistodennäköisyys ei riipu rokotuksesta. Testisuure on muotoa: Ö Ç µ missä Ç on havaittu frekvenssi solussa, joka on rivillä ja sarakkeessa, ja on odotettu frekvenssi solussa, joka on rivillä ja sarakkeessa. Ö on taulukon rivien lukumäärä ja sarakkeiden lukumäärä. Odotetut frekvenssit saadaan riippumattomuusoletuksen avulla (kts. nollahypoteesi) toisin sanoen Ê missä on kokonaisotoskoko, Ê rivin rivisumma ja sarakkeen sarakesumma. Laskut on kätevintä tehdä taulukoimalla: Ç S Ei S summa R 9 42 51 Ei R 17 28 45 summa 26 70 96 S Ei S summa R 13.8125 37.1875 51 Ei R 12.1875 32.8125 45 summa 26 70 96 Tässä vaiheessa on hyvä tarkistaa, että rivi, ja sarakesummat ovat samat sekä havaituille että odotetuille frekvensseille. (Tilansäästämiseksi on jätetty pois taulukot Ç ja Ç µ. Ne on kuitenkin hyvä kirjoittaa auki testiä käsin suorittaessa.)

Ç µ S Ei S summa R 1.676753 0.622794 2.299548 Ei R 1.900321 0.705833 2.606154 summa 3.577074 1.328627 4.905701 Jossa siis oikean alanurkan summa on testisuureen arvo. Vapausasteet ovat tällä kertaa Ö µ µ µ µ. Kriittinen arvo on siis µ ja hylkäysalue on tämän oikealla puolella. Koska µ, nollahypoteesi hylätään. Sairastumistodennäköisyys riippuu rokotuksesta. Testit eivät -taulukon tapauksessa voi (näillä hypoteeseilla) johtaa eri tuloksiin, koska juuri tässä tilanteessa (a) -kohdan testisuureen arvon neliö on (b) -kohdan testisuureen arvo. 6. Alla oleva taulukko koskee USA:n äänioikeutettujen joukosta poimittua pientä otosta. Kyselyssä kysyttiin puoluekanta ja suhtautuminen käsiaseiden rajoituksiin. Ovatko puoluekanta ja suhtautuminen aserajoituksiin toisistaan riippumattomia? Käytä -riippumattomuustestiä ja 1%:n merkitsevyystasoa. Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa Demokraatit 110 22 64 Republikaanit 89 16 117 Sitoutumattomat 55 11 35 Ratkaisu: Nollahypoteesi on À : Suhtautuminen ei riipu puoluekannasta. Testisuure on muotoa: Ö Ç µ missä Ç on havaittu frekvenssi solussa, joka on rivillä ja sarakkeessa, ja on odotettu frekvenssi solussa, joka on rivillä ja sarakkeessa. Ö on taulukon rivien lukumäärä ja sarakkeiden lukumäärä. Odotetut frekvenssit määrätään jälleen käyttäen nollahypoteesin mukaista riippumattomuusoletusta: Ê missä on kokonaisotoskoko, Ê rivin rivisumma ja sarakkeen sarakesumma. Laskut on kätevintä tehdä taulukoimalla: Ç Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa summa Demokraatit 110 22 64 196 Republikaanit 89 16 117 222 Sitoutumattomat 55 11 35 101 summa 254 49 216 519

Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa summa Demokraatit 95.92 18.50 81.57 196 Republikaanit 108.65 20.96 92.39 222 Sitoutumattomat 49.43 9.54 42.03 101 summa 254 49 216 519 Ç µ Suhtautuminen aserajoituksiin Puoltaa Ei kantaa Vastustaa summa Demokraatit 2.07 0.66 3.79 6.51 Republikaanit 3.55 1.17 6.55 11.28 Sitoutumattomat 0.63 0.22 1.18 2.03 summa 6.25 2.06 11.52 19.82 Jossa siis oikean alanurkan summa on testisuureen arvo. Vapausasteet ovat tällä kertaa Ö µ µ µ µ. Kriittinen arvo on siis µ ja hylkäysalue on tämän oikealla puolella. Koska µ, nollahypoteesi hylätään. Suhtautuminen aserajoituksiin riippuu puoluekannasta. 7. Halutaan testata onko todella todennäköisyys, että saadaan kruuna tietyn kolikon kohdalla todella. Montako kertaa kolikkoa on vähintään heitettävä jotta todennäköisyys, että nollahypoteesi À hylätään merkitsevyystasolla on vähintään % jos todellisuudessa tai. Käytä normaaliapproksimaatiota. Vihje: Symmetrian perusteella riittää laskea heittojen lukumäärä kun. Ratkaisu: Oletetaan siis, että. Heitetään kolikkoa kertaa jolloin kruunujen suhteelliseksi osuudeksi saadaan. Testisuure on nyt µ missä tietenkin. Koska merkitsevyystasoksi on valittu ja nollahypoteesilla on kaksisuuntainen vaihtoehto, niin kriittiset arvot ovat Þ eli nollahypoteesi hylätään kun Þ tai Þ. Jos nyt todellisuudessa niin µ Æ µ

ja saamme ÈÖ µ ÈÖ Ö ÈÖ ÈÖ µ µ µ µ µ µ µ µ ÈÖ µ Vastaava lauseke saadaan todennäköisyydelle ÈÖ mutta koska riittää saada alaraja :lle ja koska on syytä olettaa, että tämä jälkimmäinen todennäköisyys tulee olemaan µ niin on vaadittava, että ÈÖ µ jolloin taulukosta saadaan, että» josta seuraa, että ³ eli on syytä valita. Nyt voidaan (mutta ei ole pakko) tarkistaa, että edellä tehty oletus oli oikea ja saadaan ÈÖ µ ÈÖ µ ÈÖ µ joten tämä on häviävän pieni luku muihin approksimaatioihin verrattuna.