Tilastollinen testaus Vilkkumaa / Kuusinen 1
Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää oletuksia tai väitteitä - Esim. kone tuottaa keskimäärin (satunnaisvaihtelun puitteissa) 7cm pituisia nauloja Tilastollisessa testauksessa tutkitaan oletusten tai väitteiden paikkansapitävyyttä tutkimuskohteista tehtyjen havaintojen avulla. - Mitataan usean naulan todellinen pituus = havaintoaineisto - Lasketaan naulojen keskimääräinen pituus - Selittyykö keskimääräisen pituuden poikkeama 7cm:stä satunnaisvaihtelulla, vai onko poikkeama tilastollisesti merkitsevä? Vilkkumaa / Kuusinen 2
Testausasetelman hypoteesit Testattavat oletukset tai väitteet esitetään jakaumaa tai sen parametreja koskevina hypoteeseina Testausasetelma kiinnitetään tekemällä seuraavat kolme oletusta: (i) Testausasetelmaa koskevia yleisiä oletuksia kutsutaan testin yleiseksi hypoteesiksi. (ii) Testattavaa väitettä tai oletusta kutsutaan testin nollahypoteesiksi. (iii) Jos nollahypoteesi hylätään testissä, astuu voimaan vaihtoehtoinen hypoteesi. Vilkkumaa / Kuusinen 3
Yleinen hypoteesi Yleinen hypoteesi H sisältää oletukset - perusjoukosta - käytetystä otantamenetelmästä - perusjoukon jakaumasta Yleisen hypoteesin oletuksista pidetään kiinni koko testauksen ajan. Yleisen hypoteesin sisältämiä jakaumaoletuksia voidaan ja on yleensä syytä testata erikseen. Vilkkumaa / Kuusinen 4
Nollahypoteesi Sitä perusjoukon jakauman parametreja koskevaa väitettä tai oletusta, jota halutaan testata kutsutaan nollahypoteesiksi, ja merkitään H 0. Nollahypoteesista H 0 pidetään kiinni, elleivät havaintojen sisältämät todisteet nollahypoteesia vastaan ole kyllin voimakkaita. Olkoon f(x; θ) tutkimuksen kohteena olevaa perusjoukon ominaisuutta kuvaavan todennäköisyysjakauman pistetodennäköisyys- tai tiheysfunktio. Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa H 0 : θ = θ 0 Vilkkumaa / Kuusinen 5
Vaihtoehtoinen hypoteesi Vaihtoehtoinen hypoteesi H 1 on oletus, joka astuu voimaan, jos nollahypoteesi H 0 hylätään. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0 tai muotoa H 1 : θ < θ 0, vaihtoehtoista hypoteesia kutsutaan yksisuuntaiseksi. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0 vaihtoehtoista hypoteesia kutsutaan kaksisuuntaiseksi. Vilkkumaa / Kuusinen 6
Testisuure Tilastollinen testi perustuu testisuureeseen, joka mittaa havaintojen ja nollahypoteesin H 0 yhteensopivuutta. Testisuure on satunnaismuuttuja, jonka arvo riippuu havainnoista ja nollahypoteesista H 0. Havaintojen ja nollahypoteesin H 0 yhteensopivuuden mittaaminen tarkoittaa sitä, että tutkitaan kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on saatu, ehdolla että H 0 pätee. Yhteensopivuuden mittaaminen vaatii siis testisuureen jakauman tuntemista. Vilkkumaa / Kuusinen 7
Esimerkki: testi perusjoukon odotusarvolle, kun otos on normaalijakaumasta Yleinen hypoteesi H : (1) X i N(μ, σ 2 ), i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : μ = μ 0 Vaihtoehtoiset hypoteesit H 1 : μ > μ 0, H 1 : μ < μ 0, H 1 : μ μ 0 Testisuure T = ˉX μ 0 s/ n Testisuureen jakauma: jos nollahypoteesi pätee, T t(n 1). Vilkkumaa / Kuusinen 8
Testisuureen normaaliarvo Testisuureen odotusarvoa nollahypoteesin H 0 pätiessä kutsutaan testisuureen normaaliarvoksi. Jos testisuureen havaittu arvo on lähellä normaaliarvoa, havainnot ovat sopusoinnussa nollahypoteesin H 0 kanssa. Jos testisuureen havaittu arvo poikkeaa merkitsevästi normaaliarvosta, havainnot sisältävät todisteita nollahypoteesia H 0 vastaan. Vilkkumaa / Kuusinen 9
Virheet testauksessa Jos nollahypoteesi H 0 hylätään silloin kun se on tosi, tehdään hylkäysvirhe. Hylkäysvirheen todennäköisyys α on muotoa P r(h 0 hylätään H 0 on tosi) = α Jos nollahypoteesi H 0 jätetään voimaan silloin kun se ei ole tosi, tehdään hyväksymisvirhe. Hyväksymisvirheen todennäköisyys β on muotoa P r(h 0 jätetään voimaan H 0 ei ole tosi) = β Vilkkumaa / Kuusinen 10
Hylkäys- ja hyväksymisalueet Tilastollisessa testauksessa testisuureen mahdollisten arvojen joukko jaetaan kahteen osaan: (i) Jos testisuureen havainnoista laskettu arvo joutuu hylkäysalueelle, nollahypoteesi H 0 hylätään. (i) Jos testisuureen havainnoista laskettu arvo joutuu hyväksymisalueelle, nollahypoteesi H 0 jätetään voimaan. Vilkkumaa / Kuusinen 11
Merkitsevyystaso Testin merkitsevyystaso α on todennäköisyys sille, että testisuureen havainnoista laskettu arvo joutuu hylkäysalueelle nollahypoteesin H 0 pätiessä. Merkitsevyystaso α on siis hylkäysvirheen todennäköisyys. Ns. tavanomaiset merkitsevyystasot ovat α = 0.05 α = 0.01 α = 0.001 Vilkkumaa / Kuusinen 12
Hylkäysalueen määrääminen yksisuuntaisessa testissä Olkoon parametria θ koskeva nollahypoteesi muotoa H 0 : θ = θ 0. Olkoon testisuureena satunnaismuuttuja Z, jonka mahdolliset arvot ovat välillä (a, b). Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0, on hylkäysalue (yleensä) väli (u, b), jossa kriittinen raja u määrätään siten, että P r(z u H 0 ) = α Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ < θ 0, on hylkäysalue (yleensä) väli (a, l), jossa kriittinen raja l määrätään siten, että P r(z l H 0 ) = α Vilkkumaa / Kuusinen 13
Hylkäysalueen määrääminen kaksisuuntaisessa testissä Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0, on hylkäysalue (yleensä) joukko (a, l) (u, b), jossa kriittiset rajat l ja u määrätään siten, että P r(z u H 0 ) = P r(z l H 0 ) = α/2 Huom. Jos testisuureen Z jakauma on symmetrinen origon suhteen, pätee kriittisille rajoille l = u Vilkkumaa / Kuusinen 14
Testin voimakkuus Olkoon parametria θ koskeva nollahypoteesi muotoa H 0 : θ = θ 0 Testin voimakkuus parametrin arvolla θ on ehdollinen todennäköisyys γ(θ ) = P r(h 0 hylätään θ = θ ) Voidaan myös kirjoittaa γ(θ ) = 1 P r(h 0 hyväksytään θ = θ ) = 1 β, missä β on hyväksymisvirheen todennäköisyys, kun θ = θ. Vilkkumaa / Kuusinen 15
Klikkeri-kysely Nollahypoteesin H 0 : θ = θ 0 pätiessä ˉX N(θ 0, σ 2 /n). Mikä alue kuvaa yksisuuntaisen testin voimakkuutta, kun todellisuudessa ˉX N(θ, σ 2 /n)? 1. Sininen alue, 2. Vihreä alue, 3. Vihreä + punainen alue Vilkkumaa / Kuusinen 16
p-arvo Etukäteen valitun merkitsevyystason ja hylkäysalueen sijasta päätös nollahypoteesin hylkäämisestä voidaan perustaa testin p-arvoon. Testin p-arvo on pienin merkitsevyystaso, jolla nollahypoteesi H 0 voidaan hylätä. Jos testin p-arvoksi saadaan pieni luku, testisuure on saanut arvon, joka nollahypoteesin H 0 pätiessä kuuluu epätodennäköisten testisuureen arvojen joukkoon. Mitä pienempi on testin p-arvo, sitä vahvempia todisteita havainnot sisältävät nollahypoteesia H 0 vastaan. p-arvo riippuu vaihtoehtoisen hypoteesin muodosta. Vilkkumaa / Kuusinen 17
Tilastollisen testin suorittamisen vaiheet Tilastollisen testin suorittaminen sisältää seuraavat vaiheet: (1) Asetetaan testin hypoteesit. (2) Valitaan testisuure. (3) Valitaan merkitsevyystaso α ja muodostetaan sitä vastaava hylkäysalue. (4) Poimitaan otos niin, että yleisen hypoteesin oletukset pitävät. (5) Lasketaan testisuureen arvo havainnoista. (6) Tehdään päätös nollahypoteesin hylkäämisestä. Vilkkumaa / Kuusinen 18
Tilastollisia testejä Vilkkumaa / Kuusinen 19
Testi perusjoukon odotusarvolle, kun otos on normaalijakaumasta Yleinen hypoteesi H : (1) X i N(μ, σ 2 ), i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : μ = μ 0 Vaihtoehtoiset hypoteesit H 1 : μ > μ 0, H 1 : μ < μ 0, H 1 : μ μ 0 Testisuure T = ˉX μ 0 s/ n Testisuureen jakauma: jos nollahypoteesi pätee, T t(n 1). Vilkkumaa / Kuusinen 20
Keskeinen raja-arvolause Olkoon X i, i = 1, 2,..., n, riippumattomia, samoin jakautuneita satunnaismuuttujia, joiden odotusarvo ja varianssi ovat E(X i ) = μ ja D 2 (X i ) = σ 2. Keskeisen raja-arvolauseen mukaan n:n suurille, mutta äärellisille arvoille pätee: ˉX n = 1 n n i=1 ) X i a N (μ, σ2 n Vilkkumaa / Kuusinen 21
Testi perusjoukon odotusarvolle, kun otos ei ole normaalijakaumasta Yleinen hypoteesi H : (1) E(X i ) = μ, Var(X i ) = σ 2, i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : μ = μ 0 Vaihtoehtoiset hypoteesit H 1 : μ > μ 0, H 1 : μ < μ 0, H 1 : μ μ 0 Testisuure T = ˉX μ 0 s/ n Testisuureen jakauma: jos nollahypoteesi pätee, T a t(n 1). Vilkkumaa / Kuusinen 22
Kahden perusjoukon odotusarvojen vertailutesti, kun otokset ovat riippumattomia ja normaalijakautuneita 1/2 Yleinen hypoteesi H : (1) X i1 N(μ 1, σ 2 1), i = 1,..., n 1 (2) X i2 N(μ 2, σ 2 2), i = 1,..., n 2 (3) Satunnaismuuttujat X i1 ja X i2 ovat riippumattomia kaikilla i Nollahypoteesi H 0 : μ 1 = μ 2 Vaihtoehtoiset hypoteesit H 1 : μ 1 > μ 2, H 1 : μ 1 < μ 2, H 1 : μ 1 μ 2 Testisuure T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 Testisuureen jakauma: jos H 0 pätee, T a t(min[(n 1 1), (n 2 1)]). Vilkkumaa / Kuusinen 23
Kahden perusjoukon odotusarvojen vertailutesti, kun otokset ovat riippumattomia ja normaalijakautuneita 2/2 t-jakauman vapausasteiden lukumäärälle saadaan parempi approksimaatio Satterthwaiten kaavalla df = ( 1 s 2 1 n 1 1 n 1 ( s 2 1 + s2 2 n 1 n 2 ) 2 ) 2 + 1 n 2 1 ( s 2 2 n 2 ) 2 Suurissa otoksissa testisuureelle T pätee T a N(0, 1) Vilkkumaa / Kuusinen 24
Klikkeri-kysely Oletetaan 30 riippumattoman havainnon otoksen olevan peräisin normaalijakaumasta. Testaat nollahypoteesia, jonka mukaan perusjoukon odotusarvo μ = μ 0 vaihtoehtoisen hypoteesin ollessa μ > μ 0. Testisuureen arvoksi on saatu 1.8. Minkä johtopäätöksen voit tehdä? Käytä t-jakauman taulukkoa. 1. Nollahypoteesi voidaan hylätä 0.05 merkitsevyystasolla. 2. Nollahypoteesi voidaan hylätä 0.01 merkitsevyystasolla. 3. Nollahypoteesia ei voida hylätä kummallakaan merkitsevyystasolla. Vilkkumaa / Kuusinen 25
Yhteenveto Jakauman parametreista on usein perusteltua esittää hypoteeseja, joita voidaan testata Testi perustuu testisuureeseen, joka testattavan nollahypoteesin pätiessä noudattaa tiettyä jakaumaa Nollahypoteesi - jätetään voimaan, jos testisuureen arvo on todennäkösesti peräisin ko. jakaumasta (merkitsevyystasoa α suuremmalla todennäköisyydellä) - hylätään, jos jakaumaoletus on epätodennäköinen (merkitsevyystasoa α pienempi) Testin p-arvo = todennäköisyys saada vielä saatuakin poikkeuksellisempi testisuureen arvo nollahypoteesin pätiessä pieni p-arvo johtaa nollahypoteesin hylkäämiseen Vilkkumaa / Kuusinen 26
Ilkka Mellinin kaavakokoelmasta Sovellettu todennäköisyyslasku: Kaavat ja taulukot löytyy hyvät esitykset monista parametreja koskevista testeistä. Vilkkumaa / Kuusinen 27