Väliestimointi (jatkoa) Heliövaara 1
Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p). Suhteellinen frekvenssi ˆp = f n on Bernoulli-jakauman odotusarvoparametrin p harhaton estimaattori. Olkoon n = havaintojen lukumäärä z α/2 = häntätodennäköisyyttä α/2 vastaava piste standardoidusta normaalijakaumasta N(0, 1). Heliövaara 2
Bernoulli-jakauman odotusarvon luottamusväli 2/2 Suhteellisen frekvenssin ˆp odotusarvo ja varianssi ovat: E(ˆp) = p V ar(ˆp) = pq n Suhteellinen ferkvenssi ˆp noudattaa suurissa otoksissa approksimatiivisesti normaalijakaumaa. Bernoulli-jakauman odotusarvoparametrin p approksimatiivinen luottamusväli luottamustasolla (1 α) on ( ) ˆp(1 ˆp) ˆp(1 ˆp) ˆp z α/2, ˆp + z α/2. n n Heliövaara 3
Otoskoon määrääminen 1/2 Ennakkotiedon mukaan Bernoulli-jakauman odotusarvoparametrin arvoksi oletetaan p. Kuinka suuri otos on otettava, jotta p:lle voidaan muodostaa (1 α)-luottamusväli, jonka pituus on 2A? Parametrin p luottamusväli luottamustasolla (1 α) on ( ) ˆp(1 ˆp) ˆp(1 ˆp) ˆp z α/2, ˆp + z α/2. n n Ennakkotiedon perusteella oletetaan ˆp = p. Heliövaara 4
Otoskoon määrääminen 2/2 Jotta luottamusvälin pituus olisi 2A, on oltava z α/2 p(1 p) n = A. josta voidaan ratkaista tarvittava otoskoko n: n = ( ) zα/2 p(1 p) 2. A Huomaa, että otoskoko saavuttaa maksiminsa n = ( zα/2 2A ) 2, kun p = 1/2. Heliövaara 5
Tilastollinen testaus Heliövaara 6
Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai väitteet tulee pukea tutkimuskohteiden tutkittavaa ominaisuutta kuvaavaa jakaumaa tai sen parametreja koskeviksi hypoteeseiksi. Heliövaara 7
Testausasetelman hypoteesit Testausasetelma kiinnitetään tekemällä seuraavat kolme oletusta: (i) Testausasetelmaa koskevia yleisiä oletuksia kutsutaan testin yleiseksi hypoteesiksi. (ii) Testattavaa väitettä tai oletusta kutsutaan testin nollahypoteesiksi. (iii) Jos nollahypoteesi hylätään testissä, astuu voimaan vaihtoehtoinen hypoteesi. Heliövaara 8
Yleinen hypoteesi Yleinen hypoteesi H sisältää oletukset - perusjoukosta - käytetystä otantamenetelmästä - perusjoukon jakaumasta Yleisen hypoteesin oletuksista pidetään kiinni koko testauksen ajan. Yleisen hypoteesin sisältämiä jakaumaoletuksia voidaan ja on yleensä syytä testata erikseen. Heliövaara 9
Nollahypoteesi Sitä perusjoukon jakauman parametreja koskevaa väitettä tai oletusta, jota halutaan testata kutsutaan nollahypoteesiksi, ja merkitään H 0. Nollahypoteesista H 0 pidetään kiinni, elleivät havaintojen sisältämät todisteet nollahypoteesia vastaan ole kyllin voimakkaita. Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa H 0 : θ = θ 0 Heliövaara 10
Vaihtoehtoinen hypoteesi Vaihtoehtoinen hypoteesi H 1 on oletus, joka astuu voimaan, jos nollahypoteesi H 0 hylätään. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0 tai muotoa H 1 : θ < θ 0 vaihtoehtoista hypoteesia kutsutaan yksisuuntaiseksi. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0 vaihtoehtoista hypoteesia kutsutaan kaksisuuntaiseksi. Heliövaara 11
Testisuure Tilastollinen testi perustuu testisuureeseen, joka mittaa havaintojen ja nollahypoteesin H 0 yhteensopivuutta. Testisuure on satunnaismuuttuja, jonka arvo riippuu havainnoista ja nollahypoteesista H 0. Havaintojen ja nollahypoteesin H 0 yhteensopivuuden mittaaminen tarkoittaa sitä, että tutkitaan kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on saatu, ehdolla että H 0 pätee. Yhteensopivuuden mittaaminen vaatii siis testisuureen jakauman tuntemista. Heliövaara 12
Testisuureen normaaliarvo Testisuureen odotusarvoa nollahypoteesin H 0 pätiessä kutsutaan testisuureen normaaliarvoksi. Jos testisuureen havaittu arvo on lähellä normaaliarvoa, havainnot ovat sopusoinnussa nollahypoteesin H 0 kanssa. Jos testisuureen havaittu arvo poikkeaa merkitsevästi normaaliarvosta, havainnot sisältävät todisteita nollahypoteesia H 0 vastaan. Heliövaara 13
Virheet testauksessa Jos nollahypoteesi H 0 hylätään silloin kun se on tosi, tehdään hylkäysvirhe. Hylkäysvirheen todennäköisyys α on muotoa P r(h 0 hylätään H 0 on tosi) = α Jos nollahypoteesi H 0 jätetään voimaan silloin kun se ei ole tosi, tehdään hyväksymisvirhe. Hyväksymisvirheen todennäköisyys β on muotoa P r(h 0 jätetään voimaan H 0 ei ole tosi) = β Heliövaara 14
Hylkäys- ja hyväksymisalueet Tilastollisessa testauksessa testisuureen mahdollisten arvojen joukko jaetaan kahteen osaan (i) Jos testisuureen havainnoista laskettu arvo joutuu hylkäysalueelle, nollahypoteesi H 0 hylätään. (i) Jos testisuureen havainnoista laskettu arvo joutuu hyväksymisalueelle, nollahypoteesi H 0 jätetään voimaan. Heliövaara 15
Merkitsevyystaso Testin merkitsevyystaso α on todennäköisyys sille, että testisuureen havainnoista laskettu arvo joutuu hylkäysalueelle, jos nollahypoteesi H 0 pätee. Merkitsevyystaso α on siis hylkäysvirheen todennäköisyys. Ns. tavanomaiset merkitsevyystasot ovat α = 0.05 α = 0.01 α = 0.001 Heliövaara 16
Hylkäysalueen määrääminen yksisuuntaisessa testissä Olkoon parametria θ koskeva nollahypoteesi muotoa H 0 : θ = θ 0. olkoon testisuureena satunnaismuuttuja Z, jonka mahdolliset arvot ovat välillä (a, b). Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0, on hylkäysalue (yleensä) väli (u, b), jossa kriittinen raja u määrätään siten, että P r(z u H 0 ) = α Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ < θ 0, on hylkäysalue (yleensä) väli (a, l), jossa kriittinen raja l määrätään siten, että P r(z l H 0 ) = α Heliövaara 17
Hylkäysalueen määrääminen kaksisuuntaisessa testissä Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0, on hylkäysalue (yleensä) joukko (a, l) (u, b), jossa kriittiset rajat l ja u määrätään siten, että P r(z u H 0 ) = P r(z l H 0 ) = α/2 Huom. Jos testisuureen Z jakauma on symmetrinen origon suhteen, pätee kriittisille rajoille l = u Heliövaara 18
Tilastollisen testin suorittamisen vaiheet Tilastollisen testin suorittaminen sisältää seuraavat vaiheet: (1) Asetetaan testin hypoteesit. (2) Valitaan testisuure. (3) Valitaan merkitsevyystaso α ja muodostetaan sitä vastaava hylkäysalue. (4) Poimitaan otos niin, että yleisen hypoteesin oletukset pitävät. (5) Lasketaan testisuureen arvo havainnoista. (6) Tehdään päätös nollahypoteesin hylkäämisestä. Heliövaara 19
Tilastollisia testejä Heliövaara 20
Testi perujoukon odotusarvolle, kun otos on normaalijakaumasta Yleinen hypoteesi H : (1) X i N(µ, σ 2 ), i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : µ = µ 0 Vaihtoehtoiset hypoteesit H 1 : µ > µ 0, H 1 : µ < µ 0, H 1 : µ µ 0 Testisuure T = X µ 0 s/ n Testisuureen jakauma Jos nollahypoteesi pätee, T t(n 1). Heliövaara 21
Keskeinen raja-arvolause Olkoon X i, i = 1, 2, 3,..., n riippumattomia, samoin jakautuneita satunnaismuuttujia, joiden odotusarvo ja varianssi ovat E(X i ) = µ ja D 2 (X i ) = σ 2. Tällöin satunnaismuuttujien X i, i = 1, 2, 3,..., n summan Y n = n i=1 X i odotusarvo ja varianssi ovat E(Y n ) = nµ ja D 2 (Y n ) = nσ 2. Keskeisen raja-arvolauseen mukaan n:n suurille, mutta äärellisille arvoille pätee: X n = 1 n n i=1 ) X i a N (µ, σ2 n Heliövaara 22
Testi perujoukon odotusarvolle, kun otos ei ole normaalijakaumasta Yleinen hypoteesi H : (1) E(X i ) = µ, Var(X i ) = σ 2, i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : µ = µ 0 Vaihtoehtoiset hypoteesit H 1 : µ > µ 0, H 1 : µ < µ 0, H 1 : µ µ 0 Testisuure T = X µ 0 s/ n Testisuureen jakauma Jos nollahypoteesi pätee, T a t(n 1). Heliövaara 23
Kahden perusjoukon odotusarvojen vertailutesti, kun otokset ovat riippumattomia ja normaalijakautuneita 1/2 Yleinen hypoteesi H : (1) X i1 N(µ 1, σ 2 1), i = 1,..., n 1 (2) X i2 N(µ 2, σ 2 2), i = 1,..., n 2 (3) Satunnaismuuttujat X i1 ja X i2 ovat riippumattomia kaikilla i Nollahypoteesi H 0 : µ 1 = µ 2 Vaihtoehtoiset hypoteesit H 1 : µ 1 > µ 2, H 1 : µ 1 < µ 2, H 1 : µ 1 µ 2 Testisuure T = X 1 X 2 s 2 1 + s2 2 n 1 n 2 Testisuureen jakauma Jos H 0 pätee, T a t(min[(n 1 1), (n 2 1)]). Heliövaara 24
Kahden perusjoukon odotusarvojen vertailutesti, kun otokset ovat riippumattomia ja normaalijakautuneita 2/2 t-jakauman vapausasteiden lukumäärälle saadaan parempi approksimaatio Satterthwaiten kaavalla df = ( 1 s 2 1 n 1 1 n 1 ( s 2 1 + s2 2 n 1 n 2 ) 2 ) 2 + 1 n 2 1 ( s 2 2 n 2 ) 2 Suurissa otoksissa testisuureelle T pätee T a N(0, 1) Heliövaara 25
Testin voimakkuus Olkoon parametria θ koskeva nollahypoteesi muotoa H 0 : θ = θ 0 Testin voimakkuus parametrin arvolla θ on ehdollinen todennäköisyys γ(θ ) = P r(h 0 hylätään θ = θ ) Voidaan myös kirjoittaa γ(θ ) = 1 P r(h 0 hyväksytään θ = θ ) Heliövaara 26
Ilkka Mellinin kaavakokoelmasta Sovellettu todennäköisyyslasku: Kaavat ja taulukot Löytyy hyvät esitykset monista parametreja koskevista testeistä. Heliövaara 27