Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Samankaltaiset tiedostot
Väliestimointi (jatkoa) Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

Testejä suhdeasteikollisille muuttujille

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Testit laatueroasteikollisille muuttujille

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Mat Sovellettu todennäköisyyslasku A

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

10. laskuharjoituskierros, vko 14, ratkaisut

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Testit järjestysasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 5

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Todennäköisyyden ominaisuuksia

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Sovellettu todennäköisyyslaskenta B

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

11. laskuharjoituskierros, vko 15, ratkaisut

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Tilastollinen aineisto Luottamusväli

Tilastollisia peruskäsitteitä ja Monte Carlo

Kertausluento. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

2. Keskiarvojen vartailua

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

2. TILASTOLLINEN TESTAAMINEN...

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

5.7 Uskottavuusfunktioon perustuvia testejä II

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

1. Tilastollinen malli??

Estimointi. Otantajakauma

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

9. laskuharjoituskierros, vko 12-13, ratkaisut

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

3.6 Su-estimaattorien asymptotiikka

Transkriptio:

Tilastollinen testaus Vilkkumaa / Kuusinen 1

Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää oletuksia tai väitteitä - Esim. kone tuottaa keskimäärin (satunnaisvaihtelun puitteissa) 7cm pituisia nauloja Tilastollisessa testauksessa tutkitaan oletusten tai väitteiden paikkansapitävyyttä tutkimuskohteista tehtyjen havaintojen avulla. - Mitataan usean naulan todellinen pituus = havaintoaineisto - Lasketaan naulojen keskimääräinen pituus - Selittyykö keskimääräisen pituuden poikkeama 7cm:stä satunnaisvaihtelulla, vai onko poikkeama tilastollisesti merkitsevä? Vilkkumaa / Kuusinen 2

Testausasetelman hypoteesit Testattavat oletukset tai väitteet esitetään jakaumaa tai sen parametreja koskevina hypoteeseina Testausasetelma kiinnitetään tekemällä seuraavat kolme oletusta: (i) Testausasetelmaa koskevia yleisiä oletuksia kutsutaan testin yleiseksi hypoteesiksi. (ii) Testattavaa väitettä tai oletusta kutsutaan testin nollahypoteesiksi. (iii) Jos nollahypoteesi hylätään testissä, astuu voimaan vaihtoehtoinen hypoteesi. Vilkkumaa / Kuusinen 3

Yleinen hypoteesi Yleinen hypoteesi H sisältää oletukset - perusjoukosta - käytetystä otantamenetelmästä - perusjoukon jakaumasta Yleisen hypoteesin oletuksista pidetään kiinni koko testauksen ajan. Yleisen hypoteesin sisältämiä jakaumaoletuksia voidaan ja on yleensä syytä testata erikseen. Vilkkumaa / Kuusinen 4

Nollahypoteesi Sitä perusjoukon jakauman parametreja koskevaa väitettä tai oletusta, jota halutaan testata kutsutaan nollahypoteesiksi, ja merkitään H 0. Nollahypoteesista H 0 pidetään kiinni, elleivät havaintojen sisältämät todisteet nollahypoteesia vastaan ole kyllin voimakkaita. Olkoon f(x; θ) tutkimuksen kohteena olevaa perusjoukon ominaisuutta kuvaavan todennäköisyysjakauman pistetodennäköisyys- tai tiheysfunktio. Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa H 0 : θ = θ 0 Vilkkumaa / Kuusinen 5

Vaihtoehtoinen hypoteesi Vaihtoehtoinen hypoteesi H 1 on oletus, joka astuu voimaan, jos nollahypoteesi H 0 hylätään. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0 tai muotoa H 1 : θ < θ 0, vaihtoehtoista hypoteesia kutsutaan yksisuuntaiseksi. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0 vaihtoehtoista hypoteesia kutsutaan kaksisuuntaiseksi. Vilkkumaa / Kuusinen 6

Testisuure Tilastollinen testi perustuu testisuureeseen, joka mittaa havaintojen ja nollahypoteesin H 0 yhteensopivuutta. Testisuure on satunnaismuuttuja, jonka arvo riippuu havainnoista ja nollahypoteesista H 0. Havaintojen ja nollahypoteesin H 0 yhteensopivuuden mittaaminen tarkoittaa sitä, että tutkitaan kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on saatu, ehdolla että H 0 pätee. Yhteensopivuuden mittaaminen vaatii siis testisuureen jakauman tuntemista. Vilkkumaa / Kuusinen 7

Esimerkki: testi perusjoukon odotusarvolle, kun otos on normaalijakaumasta Yleinen hypoteesi H : (1) X i N(μ, σ 2 ), i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : μ = μ 0 Vaihtoehtoiset hypoteesit H 1 : μ > μ 0, H 1 : μ < μ 0, H 1 : μ μ 0 Testisuure T = ˉX μ 0 s/ n Testisuureen jakauma: jos nollahypoteesi pätee, T t(n 1). Vilkkumaa / Kuusinen 8

Testisuureen normaaliarvo Testisuureen odotusarvoa nollahypoteesin H 0 pätiessä kutsutaan testisuureen normaaliarvoksi. Jos testisuureen havaittu arvo on lähellä normaaliarvoa, havainnot ovat sopusoinnussa nollahypoteesin H 0 kanssa. Jos testisuureen havaittu arvo poikkeaa merkitsevästi normaaliarvosta, havainnot sisältävät todisteita nollahypoteesia H 0 vastaan. Vilkkumaa / Kuusinen 9

Virheet testauksessa Jos nollahypoteesi H 0 hylätään silloin kun se on tosi, tehdään hylkäysvirhe. Hylkäysvirheen todennäköisyys α on muotoa P r(h 0 hylätään H 0 on tosi) = α Jos nollahypoteesi H 0 jätetään voimaan silloin kun se ei ole tosi, tehdään hyväksymisvirhe. Hyväksymisvirheen todennäköisyys β on muotoa P r(h 0 jätetään voimaan H 0 ei ole tosi) = β Vilkkumaa / Kuusinen 10

Hylkäys- ja hyväksymisalueet Tilastollisessa testauksessa testisuureen mahdollisten arvojen joukko jaetaan kahteen osaan: (i) Jos testisuureen havainnoista laskettu arvo joutuu hylkäysalueelle, nollahypoteesi H 0 hylätään. (i) Jos testisuureen havainnoista laskettu arvo joutuu hyväksymisalueelle, nollahypoteesi H 0 jätetään voimaan. Vilkkumaa / Kuusinen 11

Merkitsevyystaso Testin merkitsevyystaso α on todennäköisyys sille, että testisuureen havainnoista laskettu arvo joutuu hylkäysalueelle nollahypoteesin H 0 pätiessä. Merkitsevyystaso α on siis hylkäysvirheen todennäköisyys. Ns. tavanomaiset merkitsevyystasot ovat α = 0.05 α = 0.01 α = 0.001 Vilkkumaa / Kuusinen 12

Hylkäysalueen määrääminen yksisuuntaisessa testissä Olkoon parametria θ koskeva nollahypoteesi muotoa H 0 : θ = θ 0. Olkoon testisuureena satunnaismuuttuja Z, jonka mahdolliset arvot ovat välillä (a, b). Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0, on hylkäysalue (yleensä) väli (u, b), jossa kriittinen raja u määrätään siten, että P r(z u H 0 ) = α Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ < θ 0, on hylkäysalue (yleensä) väli (a, l), jossa kriittinen raja l määrätään siten, että P r(z l H 0 ) = α Vilkkumaa / Kuusinen 13

Hylkäysalueen määrääminen kaksisuuntaisessa testissä Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0, on hylkäysalue (yleensä) joukko (a, l) (u, b), jossa kriittiset rajat l ja u määrätään siten, että P r(z u H 0 ) = P r(z l H 0 ) = α/2 Huom. Jos testisuureen Z jakauma on symmetrinen origon suhteen, pätee kriittisille rajoille l = u Vilkkumaa / Kuusinen 14

Testin voimakkuus Olkoon parametria θ koskeva nollahypoteesi muotoa H 0 : θ = θ 0 Testin voimakkuus parametrin arvolla θ on ehdollinen todennäköisyys γ(θ ) = P r(h 0 hylätään θ = θ ) Voidaan myös kirjoittaa γ(θ ) = 1 P r(h 0 hyväksytään θ = θ ) = 1 β, missä β on hyväksymisvirheen todennäköisyys, kun θ = θ. Vilkkumaa / Kuusinen 15

Klikkeri-kysely Nollahypoteesin H 0 : θ = θ 0 pätiessä ˉX N(θ 0, σ 2 /n). Mikä alue kuvaa yksisuuntaisen testin voimakkuutta, kun todellisuudessa ˉX N(θ, σ 2 /n)? 1. Sininen alue, 2. Vihreä alue, 3. Vihreä + punainen alue Vilkkumaa / Kuusinen 16

p-arvo Etukäteen valitun merkitsevyystason ja hylkäysalueen sijasta päätös nollahypoteesin hylkäämisestä voidaan perustaa testin p-arvoon. Testin p-arvo on pienin merkitsevyystaso, jolla nollahypoteesi H 0 voidaan hylätä. Jos testin p-arvoksi saadaan pieni luku, testisuure on saanut arvon, joka nollahypoteesin H 0 pätiessä kuuluu epätodennäköisten testisuureen arvojen joukkoon. Mitä pienempi on testin p-arvo, sitä vahvempia todisteita havainnot sisältävät nollahypoteesia H 0 vastaan. p-arvo riippuu vaihtoehtoisen hypoteesin muodosta. Vilkkumaa / Kuusinen 17

Tilastollisen testin suorittamisen vaiheet Tilastollisen testin suorittaminen sisältää seuraavat vaiheet: (1) Asetetaan testin hypoteesit. (2) Valitaan testisuure. (3) Valitaan merkitsevyystaso α ja muodostetaan sitä vastaava hylkäysalue. (4) Poimitaan otos niin, että yleisen hypoteesin oletukset pitävät. (5) Lasketaan testisuureen arvo havainnoista. (6) Tehdään päätös nollahypoteesin hylkäämisestä. Vilkkumaa / Kuusinen 18

Tilastollisia testejä Vilkkumaa / Kuusinen 19

Testi perusjoukon odotusarvolle, kun otos on normaalijakaumasta Yleinen hypoteesi H : (1) X i N(μ, σ 2 ), i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : μ = μ 0 Vaihtoehtoiset hypoteesit H 1 : μ > μ 0, H 1 : μ < μ 0, H 1 : μ μ 0 Testisuure T = ˉX μ 0 s/ n Testisuureen jakauma: jos nollahypoteesi pätee, T t(n 1). Vilkkumaa / Kuusinen 20

Keskeinen raja-arvolause Olkoon X i, i = 1, 2,..., n, riippumattomia, samoin jakautuneita satunnaismuuttujia, joiden odotusarvo ja varianssi ovat E(X i ) = μ ja D 2 (X i ) = σ 2. Keskeisen raja-arvolauseen mukaan n:n suurille, mutta äärellisille arvoille pätee: ˉX n = 1 n n i=1 ) X i a N (μ, σ2 n Vilkkumaa / Kuusinen 21

Testi perusjoukon odotusarvolle, kun otos ei ole normaalijakaumasta Yleinen hypoteesi H : (1) E(X i ) = μ, Var(X i ) = σ 2, i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : μ = μ 0 Vaihtoehtoiset hypoteesit H 1 : μ > μ 0, H 1 : μ < μ 0, H 1 : μ μ 0 Testisuure T = ˉX μ 0 s/ n Testisuureen jakauma: jos nollahypoteesi pätee, T a t(n 1). Vilkkumaa / Kuusinen 22

Kahden perusjoukon odotusarvojen vertailutesti, kun otokset ovat riippumattomia ja normaalijakautuneita 1/2 Yleinen hypoteesi H : (1) X i1 N(μ 1, σ 2 1), i = 1,..., n 1 (2) X i2 N(μ 2, σ 2 2), i = 1,..., n 2 (3) Satunnaismuuttujat X i1 ja X i2 ovat riippumattomia kaikilla i Nollahypoteesi H 0 : μ 1 = μ 2 Vaihtoehtoiset hypoteesit H 1 : μ 1 > μ 2, H 1 : μ 1 < μ 2, H 1 : μ 1 μ 2 Testisuure T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 Testisuureen jakauma: jos H 0 pätee, T a t(min[(n 1 1), (n 2 1)]). Vilkkumaa / Kuusinen 23

Kahden perusjoukon odotusarvojen vertailutesti, kun otokset ovat riippumattomia ja normaalijakautuneita 2/2 t-jakauman vapausasteiden lukumäärälle saadaan parempi approksimaatio Satterthwaiten kaavalla df = ( 1 s 2 1 n 1 1 n 1 ( s 2 1 + s2 2 n 1 n 2 ) 2 ) 2 + 1 n 2 1 ( s 2 2 n 2 ) 2 Suurissa otoksissa testisuureelle T pätee T a N(0, 1) Vilkkumaa / Kuusinen 24

Klikkeri-kysely Oletetaan 30 riippumattoman havainnon otoksen olevan peräisin normaalijakaumasta. Testaat nollahypoteesia, jonka mukaan perusjoukon odotusarvo μ = μ 0 vaihtoehtoisen hypoteesin ollessa μ > μ 0. Testisuureen arvoksi on saatu 1.8. Minkä johtopäätöksen voit tehdä? Käytä t-jakauman taulukkoa. 1. Nollahypoteesi voidaan hylätä 0.05 merkitsevyystasolla. 2. Nollahypoteesi voidaan hylätä 0.01 merkitsevyystasolla. 3. Nollahypoteesia ei voida hylätä kummallakaan merkitsevyystasolla. Vilkkumaa / Kuusinen 25

Yhteenveto Jakauman parametreista on usein perusteltua esittää hypoteeseja, joita voidaan testata Testi perustuu testisuureeseen, joka testattavan nollahypoteesin pätiessä noudattaa tiettyä jakaumaa Nollahypoteesi - jätetään voimaan, jos testisuureen arvo on todennäkösesti peräisin ko. jakaumasta (merkitsevyystasoa α suuremmalla todennäköisyydellä) - hylätään, jos jakaumaoletus on epätodennäköinen (merkitsevyystasoa α pienempi) Testin p-arvo = todennäköisyys saada vielä saatuakin poikkeuksellisempi testisuureen arvo nollahypoteesin pätiessä pieni p-arvo johtaa nollahypoteesin hylkäämiseen Vilkkumaa / Kuusinen 26

Ilkka Mellinin kaavakokoelmasta Sovellettu todennäköisyyslasku: Kaavat ja taulukot löytyy hyvät esitykset monista parametreja koskevista testeistä. Vilkkumaa / Kuusinen 27