Sovellettu todennäköisyyslaskenta B

Samankaltaiset tiedostot
Väliestimointi (jatkoa) Heliövaara 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Testejä suhdeasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

10. laskuharjoituskierros, vko 14, ratkaisut

Estimointi. Vilkkumaa / Kuusinen 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Tilastollinen aineisto Luottamusväli

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Mat Sovellettu todennäköisyyslasku A

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Testit järjestysasteikollisille muuttujille

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

9. laskuharjoituskierros, vko 12-13, ratkaisut

11. laskuharjoituskierros, vko 15, ratkaisut

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Todennäköisyyden ominaisuuksia

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Hypoteesin testaus Alkeet

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Satunnaismuuttujien mittausasteikot 93

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Teema 8: Parametrien estimointi ja luottamusvälit

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Otoskoko 107 kpl. a) 27 b) 2654

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastollisia peruskäsitteitä ja Monte Carlo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Teema 9: Tilastollinen merkitsevyystestaus

5.7 Uskottavuusfunktioon perustuvia testejä II

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

2. Keskiarvojen vartailua

Sovellettu todennäköisyyslaskenta B

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Mat Tilastollisen analyysin perusteet, kevät 2007

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

2-suuntainen vaihtoehtoinen hypoteesi

Estimointi. Otantajakauma

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

riippumattomia ja noudattavat samaa jakaumaa.

Transkriptio:

Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19

1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman otoksen F-testi variansseille Suhteellisen osuuden testaus Suhteellisten frekvenssien vertailutesti Antti Rasila () TodB 15. marraskuuta 2007 2 / 19

Yhden otoksen χ 2 -testi varianssille 1/3 Oletetaan, että X 1,..., X n riippumattomia ja Nollahypoteesi: Vaihtoehtoiset hypoteesit: X i N(µ, σ 2 ), i = 1, 2,..., n. H 1 : σ 2 > σ 2 0 H 1 : σ 2 < σ 2 0 H 0 : σ 2 = σ 2 0. } (yksisuuntaiset), tai H 1 : σ 2 σ 2 0 (kaksisuuntainen). Antti Rasila () TodB 15. marraskuuta 2007 3 / 19

Yhden otoksen χ 2 -testi varianssille 2/3 Olkoot X = 1 n n i=1 X i ja s 2 = 1 n 1 n (X i X ) 2 tavanomaiset harhattomat estimaattorit parametreille µ ja σ 2. Määritellään χ 2 -testisuure i=1 χ 2 = (n 1)s2 σ0 2, joka nollahypoteesin pätiessä noudattaa χ 2 -jakaumaa vapausastein (n 1), eli χ 2 χ 2 (n 1). Valitaan merkitsetvyystasoksi α. Antti Rasila () TodB 15. marraskuuta 2007 4 / 19

Yhden otoksen χ 2 -testi varianssille 3/3 Jos vaihtoehtoinen hypoteesi on muotoa H 1 : σ 2 > σ0 2, niin kriittinen arvo saadaan ehdosta Pr(χ 2 χ 2 α) = α. Testin hylkäysalue on muotoa (χ 2 α, + ). Vastaavasti, jos vaihtoehtoinen hypoteesi on muotoa H 1 : σ 2 < σ 2 0, niin kriittinen arvo χ 2 1 α saadaan ehdosta Pr(χ2 χ 2 α 1 ) = α ja hylkäysalue on muotoa (0, χ 2 1 α ). Kaksisuuntaisessa tapauksessa H 1 : σ 2 σ 2 0 kriittiset arvot χ2 1 α/2 ja χ 2 α/2 saadaan ehdoista Pr(χ 2 χ 2 1 α/2 ) = Pr(χ2 χ 2 α/2 ) = α/2 ja hylkäysalue on muotoa (0, χ 2 1 α/2 ) (χ2 α/2, + ). Antti Rasila () TodB 15. marraskuuta 2007 5 / 19

Esimerkki Herkkiä teknisiä laitteita sisältävässä tilassa ilman suhteellisen kosteuden tulisi pysyä mahdollisimman tarkaan vakiona 45% ja hajonnan saisi olla korkeintaan 3%. Tutkitaan, täyttykö hajonnalle asetettu vaatimus merkitsevyystasolla 0.05, kun mitatut suhteelliset kosteudet ovat 40 42 45 37 46 55 45 43 48 43 43 47 47 43 Oletetaan ilman kosteus normaalijakautuneeksi ja asetetaan nollahypoteesiksi oletus, että kosteus vaihtelee sallituissa rajoissa. Siis H 0 : σ 3, H 1 : σ > 3. Otoskeskihajonta s = 4.201 ja otoskoko n = 14, joten χ 2 = (n 1)s2 σ 2 0 = 13 4.2012 3 2 25.49 > 22.36 = χ 2 0.95. Testin tulos on selvästi hylkäysalueella, joten kosteuden säätöä on syytä parantaa. Antti Rasila () TodB 15. marraskuuta 2007 6 / 19

Kahden riippumattoman otoksen F-testi variansseille 1/3 Olkoot X i N(µ 1, σ1 2) ja Y j N(µ 2, σ2 2 ), missä i = 1,..., m ja j = 1,..., n. Oletetaan, että havainnot X i, Y j ovat riippumattomia kaikilla i, j. Nollahypoteesi σ 1 = σ 2 = σ. Vaihtoehtoiset hypoteesit: H 1 : σ 2 1 > σ2 2 H 1 : σ 2 1 < σ2 2 } (yksisuuntaiset), tai H 1 : σ 2 1 σ 2 2 (kaksisuuntainen). Antti Rasila () TodB 15. marraskuuta 2007 7 / 19

Kahden riippumattoman otoksen F-testi variansseille 2/3 Määritellään F-testisuure F = s2 X sy 2, missä s X (vast. s Y ) on havaintojen X i (vast. Y j ) harhaton otosvarianssi. Nollahypoteesin pätiessä testisuure F noudattaa F-jakaumaa vapausastein m 1 ja n 1, eli F F (m 1, n 1). Valitaan merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : σ1 2 > σ2 2, niin kriittinen arvo F α saadaan ehdosta Pr(F F α ) = α. Testin hylkäysalue on muotoa (F α, + ). Antti Rasila () TodB 15. marraskuuta 2007 8 / 19

Kahden riippumattoman otoksen F-testi variansseille 3/3 Vastaavasti, jos vaihtoehtoinen hypoteesi on muotoa H 1 : σ 2 1 < σ2 2, niin kriittinen arvo F 1 α saadaan ehdosta Pr(F F 1 α ) = α ja hylkäysalue on muotoa (0, F 1 α ). Kaksisuuntaisessa tapauksessa vaihtoehtoinen hypoteesi on muotoa H 1 : σ 2 1 σ2 2 ja kriittiset arvot F 1 α/2 ja F α/2 saadaan ehdoista Pr(F F 1 α/2 ) = Pr(F F α/2 ) = α/2 ja hylkäysalue on muotoa (0, F 1 α/2 ) (F α/2, + ). Antti Rasila () TodB 15. marraskuuta 2007 9 / 19

Esimerkki (Niemi) 1/3 Tutkittiin, onko kahden eri valmistajan katalysaattoreilla eroa. Valittiin kokeeseen 32 samanmerkkistä ja mallista autoa. Näistä valittiin umpimähkään 16 autoa, joihin asennettiin valmistajan A katalysaattori, loppuihin valmistajan B. Autoja käytetiin samanlaisissa olosuhteissa ja mitattiin pakokaasun häkäpitoisuus. Tulokset olivat: A 0.051 0.055 0.052 0.053 0.051 0.058 0.056 0.056 0.048 0.051 0.058 0.046 0.049 0.045 0.056 0.049 B 0.048 0.052 0.050 0.051 0.046 0.048 0.043 0.052 0.052 0.051 0.048 0.048 0.055 0.049 0.045 0.053 Oletetaan häkäpitoisuus normaalijakautuneeksi ja testataan, ovatko valmistajien A ja B katalysaattoreiden suodattamien pakokaasujen häkäpitoisuuksien keskiarvot samat vai eivät. Testataan aluksi, ovatko häkäpitoisuuksien hajonnat samat. Antti Rasila () TodB 15. marraskuuta 2007 10 / 19

Esimerkki (Niemi) 2/3 Testissä H 0 : σ 1 = σ 2 ja H 1 : σ 1 σ 2. Valitaan α = 0.05. Otoshajonnat ovat s A = 0.00410 ja s B = 0.00316. Testimuuttuja F = 0.004102 0.00316 2 = 1.68 ja kriittiset arvot F 0.975 (15, 15) = 2.86 ja F 0.025 (15, 15) = 1/F 0.975 (15, 15) = 0.38. Hajontoja siis voidaan pitää yhtäsuurina. Tätä voisi perustella myös sillä, että testiin valitut autot olivat samanlaisia. Tutkitaan seuraavaksi merkitsevyystasolla 0.01, onko häkäpitoisuuksissa eroja. Antti Rasila () TodB 15. marraskuuta 2007 11 / 19

Esimerkki (Niemi) 3/3 Nyt H 0 : µ A µ B = 0 ja H 1 : µ A µ B 0. Otoskeskiarvot ovat x A = 0.0521 ja x B = 0.0494. Saadaan (16 1) 0.00410 s p = 2 + (16 1) 0.00316 2 = 0.00366. 16 + 16 2 Testisuureen arvo t 0 = x A x B 0.0521 0.0494 = s p 1/nA + 1/n B 0.00366 2/16 = 2.121. Kriittinen arvo t 0.995 (30) = 2.750, joten nollahypoteesi jää voimaan. Ei ole riittävää näyttöä sille, että valmistajien A ja B katalysaattoreissa olisi eroa. Tulos on kuitenkin melko lähellä hylkäämisrajaa, ja nollahypoteesi olisi hylätty merkitsevyystasolla 0.05. Antti Rasila () TodB 15. marraskuuta 2007 12 / 19

Suhteellisen osuuden testaus 1/3 Olkoon A tapahtuma ja X i, i = 1, 2,..., n satunnaisotos Bernoulli-jakaumasta, jossa p = Pr(A). Oletetaan, että X 1,..., X n ovat riippumattomia ja X i Bernoulli(p). Nollahypoteesti H 0 : p = p 0. Vaihtoehtoiset hypoteesit: H 1 : p > p 0 H 1 : p < p 0 } (yksisuuntaiset), tai H 1 : p p 0 (kaksisuuntainen). Antti Rasila () TodB 15. marraskuuta 2007 13 / 19

Suhteellisen osuuden testaus 2/3 Olkoon ˆp = 1 n n X j = f /n, i=1 missä f on tapahtuman A frekvenssi otoksessa ja f /n on suhteellinen frekvenssi. Määritellään Z-testisuure Z = ˆp p 0 p0 (1 p 0 )/n. Jos nollahypoteesi H 0 : p = p 0 on tosi, niin Z noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0, 1). Vrt. esimerkki viime viikon luennoissa. Approksimaatio on tavallisesti riittävän hyvä, jos nˆp 10 ja n(1 ˆp) 10. Valitaan merkitsevyystasoksi α. Antti Rasila () TodB 15. marraskuuta 2007 14 / 19

Suhteellisen osuuden testaus 3/3 Jos vaihtoehtoinen hypoteesi on muotoa H 1 : p > p 0, niin kriittinen arvo +z α saadaan ehdosta Pr(Z +z α ) = α. Testin hylkäysalue on muotoa (+z α, + ). Vastaavasti, jos vaihtoehtoinen hypoteesi on muotoa H 1 : p < p 0, niin kriittinen arvo z α saadaan ehdosta Pr(Z z α ) = α ja hylkäysalue on muotoa (, z α ). Kaksisuuntaisessa tapauksessa H 1 : p p 0 kriittiset arvot z α/2 ja +z α/2 saadaan ehdoista Pr(Z z 2 α/2 = Pr(Z +z α/2) = α/2 ja hylkäysalue on muotoa (, z α/2 ) (+z α/2, + ). Antti Rasila () TodB 15. marraskuuta 2007 15 / 19

Suhteellisten frekvenssien vertailutesti 1/4 Olkoon A tapahtuma ja X ik, i = 1, 2,..., n k, k = 1, 2 satunnaisotos Bernoulli-jakaumasta, jossa p k = Pr(A). Oletetaan, että X 1k,..., X nk k ovat riippumattomia ja X ik Bernoulli(p k ), i = 1,..., n k, k = 1, 2. Nollahypoteesti H 0 : p 1 = p 2 = p. Vaihtoehtoiset hypoteesit: H 1 : p 1 > p 2 H 1 : p 1 < p 2 } (yksisuuntaiset), tai H 1 : p 1 p 2 (kaksisuuntainen). Antti Rasila () TodB 15. marraskuuta 2007 16 / 19

Suhteellisten frekvenssien vertailutesti 2/4 Olkoon n k ˆp = 1 X j = f k /n k, n k missä f k on tapahtuman A frekvenssi otoksessa k ja f k /n k on suhteellinen frekvenssi. Nyt n k i=1 f k = X ik Bin(n k, p k ), k = 1, 2. i=1 Jos nollahypoteesi H 0 : p 1 = p 2 = p pätee, otokset voidaan yhdistää ja parametrin p harhaton estimaattori ˆp on ˆp = n 1ˆp 1 + n 2ˆp 2 n 1 + n 2 = f 1 + f 2 n 1 + n 2. Antti Rasila () TodB 15. marraskuuta 2007 17 / 19

Suhteellisten frekvenssien vertailutesti 3/4 Määritellään Z-testisuure Z = ˆp 1 ˆp 2 ˆp(1 ˆp)(1/n1 + 1/n 2 ). Jos nollahypoteesi H 0 : p 1 = p 2 = p on tosi, niin Z noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0, 1). Approksimaatio on tavallisesti riittävän hyvä, jos n k ˆp k 5 ja n k (1 ˆp k ) 5. Valitaan merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : p 1 > p 2, niin kriittinen arvo +z α saadaan ehdosta Pr(Z +z α ) = α. Testin hylkäysalue on muotoa (+z α, + ). Antti Rasila () TodB 15. marraskuuta 2007 18 / 19

Suhteellisten frekvenssien vertailutesti 4/4 Vastaavasti, jos vaihtoehtoinen hypoteesi on muotoa H 1 : p 1 < p 2, niin kriittinen arvo z α saadaan ehdosta Pr(Z z α ) = α ja hylkäysalue on muotoa (, z α ). Kaksisuuntaisessa tapauksessa H 1 : p 1 p 2 kriittiset arvot z α/2 ja +z α/2 saadaan ehdoista Pr(Z z α/2 ) = Pr(Z +z α/2 ) = α/2 ja hylkäysalue on muotoa (, z α/2 ) (+z α/2, + ). Antti Rasila () TodB 15. marraskuuta 2007 19 / 19