Luku 6 Otatajakaumie teoria 6.1 Riippumattomat satuaismuuttujat Muistamme edellisistä luvuista, että satuaismuuttujat X 1 ja X 2 ovat riippumattomat (määritelmät 4.6 ja 5.5), jos f(x 1, x 2 ) f 1 (x 1 )f 2 (x 2 ) kaikilla x 1 S 1, x 2 S 2, missä f(x 1, x 2 ) o X 1 : ja X 2 : yhteisjakauma tiheysfuktio, f 1 (x 1 ) o X 1 : ja f 2 (x 2 ) o X 2 : tiheysfuktio. Määritelmä yleistyy suoraviivaisesti usea satuaismuuttuja tapauksee. Satuaismuuttujat X 1, X 2,..., X ovat riippumattomat, jos f(x 1, x 2,...,x ) f 1 (x 1 )f 2 (x 2 ) f (x ). Jos satuaismuuttujat X 1, X 2,..., X ovat riippumattomat, ii myös iide fuktiot u 1 (X 1 ), u 2 (X 2 ),..., u (X ) ovat riippumattomat, mikäli kuki fuktio u i, i 1, 2,..., riippuu vai satuaismuuttujasta X i eikä siis satuaismuuttujista X j, j i. Silloi erityisesti Lausee 3.10 mukaa E[u 1 (X 1 )u 2 (X 2 ) u (X )] E[u(X 1 )] E[u 2 (X 2 )] E[u (X )]. Jos riippumattomat satuaismuuttujat X 1, X 2,..., X oudattavat samaa jakaumaa (RSJ), joka kertymäfuktio o F(x), ii saomme, että X 1, X 2,...,X o : kokoie otos jakaumasta F. Kertymäfuktio edustaa populaatiota, josta otos tehdää. Esimerkki 6.1 Olkoo X 1, X 2,...,X otos ormaalijakaumasta N(µ, σ 2 ). Silloi X i N(µ, σ 2 ), i 1, 2,..., ja X 1, X 2,..., X ovat riippumattomat. 213
214 Luku 6. Otatajakaumie teoria Otokse X 1, X 2,...,X yhteisjakauma tiheysfuktio o siis f(x 1, x 2,...,x ) f(x i ) missä 1 2πσ e [1/(2σ2 )](x i µ) 2 ( 1 ) 2 e [1/(2σ2 )] 2πσ 2 (x i µ) 2, f(x i ) 1 2πσ e [1/(2σ2 )](x i µ) 2, i 1, 2,...,. Lause 6.1 (Apulausee 5.1 yleistys) Satuaisvektorit X (X 1, X 2,..., X ) ja Y (Y 1, Y 2,...,Y ) ovat riippumattomat jos ja vai jos o olemassa sellaiset fuktiot g(x) ja h(y ), että f(x, y) g(x)h(y) kaikilla x: ja y: arvoilla, missä g ei riipu y:stä ja h ei riipu x:stä. 6.2 Riippumattomie satuaismuuttujie summa jakauma Tilastollisissa sovelluksissa tarkastellaa tavallisesti erilaisia satuaismuuttujie fuktioita. Otoksesta X 1, X 2,...,X laskettua reaali-, tai vektoriarvoista suuretta T(X 1, X 2,...,X ) saotaa otokse tuusluvuksi (statistics). Kaksi tärkeää otokse tuuslukua ovat otoskeskiarvo X ja otosvariassi S 2. Esimerkiksi T 1 (X 1, X 2,...,X ) X o reaaliarvoie ja T 2 (X 1, X 2,...,X ) (X, S 2 ) o vektoriarvoie. Lause 6.2 Olkoo X 1, X 2,...,X otos jakaumasta, joka tiheysfuktio o f(x). Silloi satuaismuuttujie X 1, X 2,..., X yhteisjakuma tiheysfuktio o f 1 (x 1 )f 2 (x 2 ) f (x ). Jos g(y) o satuaismuuttuja Y u(x 1, X 2,...,X ) tiheysfuktio, ii E(Y ) yg(y) dy S y u(x 1, x 2,...,x )f 1 (x 1 )f 2 (x 2 ) f (x ) dx 1 dx 2... dx, S S S mikäli odotusarvo o olemassa. Diskreettejä satuaismuuttujia koskeva vastaava tulos saadaa korvaamalla itegraalit summalausekkeilla. Satuaismuuttujie X 1, X 2,..., X arvoalue o S ja Y : arvoalue o S y.
6.2. Riippumattomie satuaismuuttujie summa jakauma 215 Esimerkki 6.2 Heitetää kahta oppaa. Olkoo 1. opa silmäluku X 1 ja 2. opa silmäluku X 2. Määritetää yt silmälukuje summa Y X 1 +X 2 todeäköisyysfuktio g(y). Tarkastellaa esi yksittäise arvo, esimerkiksi y 4, todeäköisyyde g(4) laskemista. Tapahtuma {Y 4} voi sattua kolmella toisesa poissulkevalla tavalla: {X 1 1, X 2 3}, {X 1 2, X 2 2} ja {X 1 3, X 2 1}. Siksi g(4) P(Y 4) P(X 1 1, X 2 3) + P(X 1 2, X 2 2) + P(X 1 3, X 2 1) 1 6 1 6 + 1 6 1 6 + 1 6 1 6 3. Jatkamalla samalla periaatteella saadaa todeäköisyysfuktio g(y): y 2 3 4 5 6 7 8 9 10 11 12 g(y) 1 2 3 4 5 6 5 4 3 2 1 Yleisesti Esimerki 6.2 todeäköisyydet voidaa laskea s. kovoluutiokaavalla y 1 g(y) P(Y y) f(k)f(y k), missä f(k) 1, k 1, 2, 3, 4, 5, 6 6 o opa silmäluvu todeäköisyysfuktio. Toie tapa johtaa g(y), o käyttää momettifuktiota. Nopa silmäluvu momettifuktio o k1 M X (t) E ( e tx) 1 6 et + 1 6 e2t + 1 6 e3t + 1 6 e4t + 1 6 e5t + 1 6 e6t. Koska silmäluvut ovat riippumattomat, ii Y : momettifuktio o M Y (t) M X1 (t)m X2 (t) [M X (t)] 2. Koska e kt : kerroi M Y (t): lausekkeessa o todeäköisyys P(Y k), k 2, 3,..., 12, e muodostavat Y : todeäköisyysfuktio. Lause 6.3 Olkoot riippumattomie satuaismuuttujie X 1, X 2,..., X odotusarvot µ 1, µ 2,..., µ ja variassit σ1 2, σ2 2,..., σ2. Silloi satuaismuuttuja Y a ix i odotusarvo ja variassi ovat µ Y a i µ i ja σy 2 a 2 i σ2 i, missä a 1, a 2,..., a ovat aettuja vakioita.
216 Luku 6. Otatajakaumie teoria Todistus. Koska odotusarvo o lieaarie operaattori, ii ( ) E(Y ) E a i X i a i E(X i ) Vastaavasti [ ( σ 2 E[(Y µ Y ) 2 ] E a i X i missä [ ] 2 [ E a i (X i µ i ) E E(a i X i ) a i µ i. ) ] 2 a i µ i ] a i a j (X i µ i )(X j µ j ) j1 a i a j E[(X i µ i )(X j µ j )] j1 σ ij E[(X i µ i )(X j µ j )]. a i a j σ ij, Koska X i ja X j ovat riippumattomat, ii σ ij 0, ku i j. Tästä seuraa, että σ 2 a 2 i σ2 i. Esimerkki 6.3 Olkoot X 1 ja X 2 riippumattomat satuaismuuttujat, joide odotusarvot ovat µ 1 4 ja µ 2 3 sekä variassit vastaavasti σ 2 1 4 ja σ 2 2 9. Silloi satuaismuuttuja Y 3X 1 2X 2 odotusarvo ja variassi ovat µ Y 3 ( 4) + ( 2) 3 18 ja σ 2 Y 3 2 4 + ( 2) 2 9 72. Esimerkki 6.4 Olkoo X 1, X 2,...,X otos jakaumasta, joka odotusarvo o µ ja variassi σ 2. Silloi otoskeskiarvo X X 1 + X 2 + + X odotusarvo ja variassi ovat ( ) 1 µ X µ µ ja σ 2 X j1 ( 1 ) 2 σ 2 σ2.
6.2. Riippumattomie satuaismuuttujie summa jakauma 217 Otosvariassi o muotoa S 2 1 (X i X) 2 1 ( Xi 2 X 2), 1 1 jote E(S 2 ) 1 1 [ ] E(Xi 2 ) E(X 2 ). Koska E(Xi 2) σ2 + µ 2 ja E(X 2 ) σ 2 / + µ 2, ii laskemalla o helppo todeta, että E(S 2 ) σ 2. Olemme siis osoittaeet, että X o µ: ja S 2 o σ 2 : harhato estimaattori. Lause 6.4 Jos X 1, X 2,..., X ovat riippumattomat satuaismuuttujat, joide momettifuktiot ovat M Xi (t), i 1, 2,...,, ii satuaismuuttuja Y a ix i momettifuktio o M Y (t) M Xi (a i t). Todistus. Satuaismuuttuja Y momettifuktio o M Y (t) E ( e ty ) E ( e t(a 1X 1 +a 2 X 2 + +a X ) ) E ( e a 1tX1 e a 2tX2 e atx) E ( e a 1tX 1 ) E(e a 2tX 2 ) E(e atx), koska satuaismuuttujat e a itx i ovat keskeää riippumattomat. Momettifuktio määritelmä mukaa E ( e tx i) MXi (t), jote E ( e a itx i ) MXi (a i t). Siksi M Y (t) M X1 (a 1 t)m X2 (a 2 t) M X (a t) M Xi (a i t). Esimerkki 6.5 Olkoo X 1, X 2,..., X otos Beroulli jakaumasta Ber ( 1 3). Silloi M(t) 2 3 + 1 3 et. Jos Y X 1 + X 2 + + X, ii ( M Y (t) 2 + 1et) ( 2 + 1 3 3 3 3 et). Tästä äemme, että Y Bi (, 1 3).
218 Luku 6. Otatajakaumie teoria Seuraus 6.1 Jos X 1, X 2,...,X o otos jakaumasta, joka momettifuktio o M(t), ii 1. satuaismuuttuja Y X i momettifuktio o M Y (t) M(t) [M(t)]. 2. otoskeskiarvo X (1/)X i momettifuktio o ( ) [ ( )] t t M X (t) M M. Esimerkki 6.6 Olkoo X 1, X 2, X 3 otos ekspoettijakaumasta, joka odotusarvo o θ. Ekspoettijakauma momettifuktio o M(t) 1/(1 θt), t < 1/θ. Silloi summa Y X 1 + X 2 + X 3 momettifuktio o M Y (t) [1/(1 θt)] 3 (1 θt) 3, t < 1 θ, mikä o gammajakauma Gamma(3, θ) momettifuktio, jote Y Gamma(3, θ). Toisaalta X: momettifuktio o [( M X (t) 1 θt ) 1 ] 3 ( 1 θt ) 3, ku t < 3 3 3 t. Otoskeskiarvo X oudattaa siis gammajakaumaa Gamma(3, θ/3). 6.3 Normaalijakaumaa liittyvät jakaumat Lause 6.5 Jos X 1, X 2,...,X o otos ormaalijakaumasta N(µ, σ 2 ), ii otoskeskiarvo X (1/)X i jakauma o N(µ, σ 2 /). Todistus. Koska X i N(µ, σ 2 ), ii ) M Xi (t) exp (µt + σ2 t 2. 2 Seurauslausee 6.1 mukaa [ ( M X (t) exp µ t )] + σ2 (t/) 2 2 ) exp (µt + (σ2 /)t 2, 2 joka o ormaalijakauma N(µ, σ 2 /) momettifuktio. Koska momettifuktio määrittää yksikäsitteisesti satuaismuuttuja jakauma, ii X N(µ, σ 2 /).
6.3. Normaalijakaumaa liittyvät jakaumat 219 Lause 6.6 Olkoot X i χ 2 (r i ), i 1, 2,...,. Jos X 1, X 2,..., X ovat riippumattomat, ii satuaismuuttuja Y X 1 + X 2 + + X jakauma o χ 2 (r 1 + r 2 + + r k ). Todistus. Satuaismuuttuja Y momettifuktio voidaa kirjoittaa muodossa M Y (t) E [ e t(x 1+X 2 + +X ) ] E ( e ) tx 1 E ( e ) tx 2 E ( e tx) M Xi (t). Koska ii M Y (t) M Xi (t) (1 2t) ri/2 ; t < 1 2, (1 2t) ri/2 (1 2t) (r 1+r 2 + +r )/2, t < 1 2 o χ 2 -jakauma χ 2 (r 1 + r 2 + + r ) momettifuktio. Tästä seuraa, että Y χ 2 (r 1 + r 2 + + r ). Lause 6.7 Olkoo Z 1, Z 2,...,Z otos stadardimuotoisesta ormaalijakaumasta N(0, 1). Silloi W Z 2 1 + Z 2 2 + + Z 2 oudattaa jakaumaa χ 2 (). Todistus. Koska Z i χ 2 (1), i 1, 2,..., ja Z1, 2 Z2, 2..., Z 2 ovat keskeää riippumattomat, ii tulos seuraa Lauseesta 6.6. Seuraus 6.2 Olkoot X 1, X 2,..., X riippumattomat ja X i N(µ i, σ 2 i ), i 1, 2,...,. Silloi satuaismuuttuja W (X i µ i ) 2 σ 2 i oudattaa jakaumaa χ 2 (). Lause 6.8 Olkoo X 1, X 2,...,X otos ormaalijakaumasta N(µ, σ 2 ), X (1/)X i o otoskeskiarvo ja S 2 [1/( 1)] (X i X) 2 o otosvariassi. Silloi 1. X ja S 2 ovat riippumattomat satuaismuuttujat, 2. X oudattaa ormaalijakaumaa N(µ, σ 2 /), 3. ( 1)S 2 /σ 2 oudattaa χ 2 -jakaumaa χ 2 ( 1).
220 Luku 6. Otatajakaumie teoria Todistus. Kohda 1 todistus sivuutetaa tässä yhteydessä. Kohta 2 o lause 6.5. Todistetaa yt väite, että ( 1)S 2 Laskemalla voidaa todeta, että ( Xi µ σ 2 χ 2 ( 1). σ ) 2 [ (Xi X) + (X µ) ] 2 σ ( ) 2 Xi X (X µ)2 + σ σ 2 ( ) 2 ( 1)S2 X µ + σ 2 σ/. Koska Z X µ σ/ N(0, 1), ii Z2 χ 2 (1). Vastaavasti Seurauslausee 6.2 mukaa W ( Xi ) µ 2 σ χ 2 (). Koska S 2 ja Z 2 ovat kohda 1 mukaa riippumattomat, ii E ( e tw) E ( e ) t[( 1)S2 /σ 2 +Z 2 ] E ( ) e t( 1)S2 /σ 2 e tz2 E ( e t( 1)S2 /σ 2 ) E ( e tz 2 ). Koska W χ 2 () ja Z 2 N(0, 1), ii Tästä seuraa, että (1 2t) /2 E [ e t( 1)S/σ2 ] (1 2t) 1/2. E [ e t( 1)S/σ2 ] (1 2t) ( 1)/2 ; t < 1 2, joka o jakauma χ 2 ( 1) momettifuktio. Näi o lausee väite 3 todistettu. Lause 6.9 Olkoot X 1, X 2,..., X keskeää riippumattomat ormaalijakaumaa oudattavat satuaismuuttujat, joide odotusarvot ovat µ 1, µ 2,..., µ ja variassit σ 2 1, σ 2 2,..., σ 2. Silloi lieaarikombiaatio Y a i X i oudattaa ormaalijakaumaa ( N a i µ i, a 2 i σ2 i Todistus. Tulos saadaa soveltamalla Lausetta 6.4 ormaalijakaumaa. ).
6.4. Järjestyssuureet 221 6.4 Järjestyssuureet Otokse suuri ja piei arvo sekä keskimääräie arvo, mediaai, ovat tärkeitä otossuureide arvoje järjestyksee perustuvia tuuslukuja. Olkoo X 1, X 2,...,X otos. Merkitää otokse pieitä arvoa X (1) seuraavaksi pieitä X (2) ja ii edellee, jote X (1) X (2) X (). Tämä ideksoiti tarkoittaa sitä, että otosarvot paaa kasvavaa järjestyksee. Jos otos o esimerkiksi 5.0, 3.1, 2.7, 6.1, 5.3, ii järjestetty otos o 2.7, 3.1, 5.0, 5.3, 6.1. Nyt siis esimerkiksi X 1 5.0, X (1) 2.7 ja X (3) 5.0 o mediaai ja X 3 2.7. Nyt siis ja X (1) mi(x 1,...,X ) X () max(x 1,..., X ). Tuusluku X (k) o otokse k. järjestystuusluku. 6.4.1 Maksimi ja miimi Olkoo X 1, X 2,...,X otos jakaumasta, joka kertymäfuktio o F(x). Maksimi kertymäfuktio o F () (x) P(X () x) P(X 1 x, X 2 x,..., X x) P(X 1 x)p(x 2 x) P(X x), koska X 1, X 2,..., X ovat riippumattomat. Kertymäfuktio määritelmä mukaa P(X i x) F(x), jote Miimi kertymäfuktio o F (1) (x) P(X (1) x) F () (x) [F(x)]. 1 P(X (1) > x) 1 P(X 1 > x, X 2 > x,..., X > x) 1 P(X 1 > x)p(x 2 > x) P(X > x) 1 [1 F(x)]. Esimerkki 6.7 Olkoo X 1, X 2,...,X otos ekspoettijakaumasta Exp(λ). Määritetää miimi X (1) jakauma. Ekspoettijakauma Exp(λ) kertymäfuktio o { 0, ku x < 0; F(x) 1 e λx, ku x 0.
222 Luku 6. Otatajakaumie teoria Silloi miimi kertymäfuktio o { 0, ku x < 0; F (1) (x) 1 e λx, ku x 0. Miimi oudattaa siis ekspoettijakaumaa Exp(λ). Jos otos o jatkuvasta jakaumasta, joka tiheysfuktio o f(x), saadaa X (1) : ja X () : jakaumie tiheysfuktiot derivoimalla kertymäfuktiot F () (x) ja F (1) (x). Nyt siis maksimi tiheysfuktio o ja miimi tiheysfuktio o f () (x) d dx [F(x)] [F(x)] 1 f(x) f (1) (x) d ( ) 1 [1 F(x)] [1 F(x)] 1 f(x). dx 6.4.2 Järjestyssuuree X (k) jakauma Olkoo X 1, X 2,...,X otos jakaumasta, joka kertymäfuktio o F(x). Johdetaa yt järjestystuusluvu X (k), 1 < k <, jakauma. Jos {X (k) x}, ii silloi aiaki k otosarvoa o pieempiä tai korkeitaa yhtä suuria kui x. Tarkastellaa yksikertaisuude vuoksi tapausta 3. Johdetaa mediaai X (2) jakauma. Tapahtuma {X (2) x} toteutuu täsmällee silloi, ku {X 1 x, X 2 x} tai {X 1 x, X 3 x} tai {X 2 x, X 3 x} tai {X 1 x, X 2 x, X 3 x}. Koska P(X i x, X j x) [F(x)] 2 [1 F(x)], i j ja ii (6.4.1) P(X 1 x, X 2 x, X 3 x) [F(x)] 3, F (2) (x) P(X (2) x) 3[F(x)] 2 [1 F(x)] + [F(x)] 3 3 ( ) 3 [F(x)] i [1 F(x)] 3 i. i i2 Yleisessä tapauksessa vastaava kaava voidaa johtaa samalla periaatteella. Emme kuitekaa käsittele yleise kaava johtoa se tarkemmi, toteamme vai, että X (k) : kertymäfuktio o (6.4.2) F (k) (x) P(X (k) x) ik ( ) [F(x)] i [1 F(x)] i. i
6.5. Keskeie rajaväittämä 223 Jos otos o jatkuvasta jakaumasta, saadaa vastaava tiheysfuktio derivoimalla kertymäfuktio. Esitetää esi X (2) : tiheysfuktio, ku 3. Ku kertymäfuktio (6.4.1) derivoidaa, saadaa f (2) (x) F (2)(x) 3 2F(x)f(x)[1 F(x)] 3[F(x)] 2 f(x) + 3[F(x)] 2 f(x) 3!F(x)[1 F(x)]f(x). Derivoimalla lauseke (6.4.2) saadaa satuaismuuttuja X (k) tiheysfuktio yleisessä tapauksessa (1 k ): (6.4.3) f (k) (x)! (k 1)!( k)! [F(x)]k 1 [1 F(x)] k f(x). Esimerkki 6.8 Olkoo X 1, X 2, X 3, X 4, X 5 otos jakaumasta, joka tiheysfuktio o f(x) 2x, 0 < x < 1. Jakauma kertymäfuktio o 0, x < 0; F(x) x 2, 0 x 1; 1, x > 1. Silloi mediaai tiheysfuktio o lausekkee (6.4.3) ojalla f (3) (x) 5! 2!2! x4 (1 x 2 ) 2 2x 60x 5 (1 x 2 ) 2, 0 < x < 1. Vastaavasti miimi tiheysfuktio o ja maksimi tiheysfuktio o f (1) (x) 10x(1 x 2 ) 4, 0 < x < 1 f (5) (x) 10x 9, 0 < x < 1. 6.5 Keskeie rajaväittämä Olemme havaieet, että otossuuree jakauma riippuu tavallisesti otoskoosta. Jos X 1, X 2,...,X o otos Beroulli jakaumasta Ber(p), ii X X 1 +X 2 + +X Bi(, p). Satuaismuuttuja X jakauma riippuu siis otoskoosta. Jos X 1, X 2,..., X o otos ormaalijakaumasta N(µ, σ 2 ), ii otoskeskiarvo X jakauma N(µ, σ 2 /) riippuu :stä. Olkoo (X i ; i 1) X 1, X 2, X 3,... satuaismuuttujie joo, missä satuaismuuttujie X, 1, 2, 3,... jakauma riippuu :stä. Merkitää satuaismuuttuja X kertymäfuktiota F (x), joka siis riippuu :stä. Seuraavassa määritellää satuaismuuttujie joo (X i ; i 1) suppeemie jakaumamielessä.
224 Luku 6. Otatajakaumie teoria 10 f (5) (x) f (1) (x) f (3) (x) 0.2 0.4 0.6 0.8 1.0 Kuvio 6.1. Miimi, maksimi ja mediaai tiheysfuktio, ku otos o jakaumasta f(x) 2x, 0 < x < 1. Määritelmä 6.1 Satuaismuuttujie X 1, X 2, X 3,... joo suppeee jakaumaltaa kohti satuaismuuttujaa X, jos lim F (x) F(x) kaikissa pisteissä x, joissa F(x) o jatkuva. Ku joo {X } suppeee jakaumaltaa kohti satuaismuuttujaa X, d merkitää X X. Momettifuktioide yhteydessä esitettii momettifuktio ja ja jakauma (kertymäfuktio) yksikäsitteistä vastaavuutta koskeva Lause 3.12. Samassa yhteydessä esitettii myös momettifuktioide suppeemista koskeva Lause 3.15, jota voidaa soveltaa raja-jakaumie määrittämisee. Merkitää satuaismuuttujie X 1, X 2,..., X summaa ja keskiarvoa seuraavasti: S X i ja X S Lause 6.10 (Keskeie rajaväittämä) Olkoo X 1, X 2,...,X otos jakaumasta, joka keskiarvo o µ ja variassi σ 2. Merkitää Z X µ σ/ S µ σ. Silloi Z : jakauma läheee ormaalijakaumaa N(0, 1), ku. Keskeise rajaväittämä mukaa riippumattomie satuaismuuttujie summa oudattaa likimai ormaalijakaumaa, ku o suuri. Merkitsemme Z N(0, 1), ku o suuri. Merkki tarkoittaa oudattaa likimai jakaumaa. Käytäössä keskeise rajaväittämä avulla voidaa arvioida Z : jakaumaa, ku
6.6. Jakaumie likiarvot ormaalijakauma avulla 225 o riittävä suuri. Silloi P(Z z) z 1 2π e z2 /2 dx Φ(z), missä Φ(z) o ormitetu ormaalijakauma kertymäfuktio. Voimme merkitä sama asia myös seuraavasti: ku. P(Z z) Φ(z), Esimerkki 6.9 Olkoo X 1, X 2,...,X 15 otos jakaumasta, joka tiheysfuktio o f(x) ( 3 2) x 2, 1 < x < 1. Jakauma odotusarvo µ 0 ja variassi σ 2 3/5. Esimerkiksi todeäköisyys P(X 0.15) voidaa laskea johtamalla esi X: jakauma ja määrittämällä siitä kysytty todeäköisyys. Keskeise rajaväittämä avulla saadaa tämä todeäköisyyde tarkka arvio ilma tietoa X: tarkasta jakaumasta: ( X 0 P(X 0.15) P / 0.15 0 ) / 3/5 15 3/5 15 P(Z 15 0.75) Φ(0.75) 0.7734. Arvio tarkkuudesta keskeie rajaväittämä ei kuitekaa aa käsitystä. 6.6 Jakaumie likiarvot ormaalijakauma avulla Olkoo X 1, X 2,...,X otos Beroulli jakaumasta Ber(p). Silloi S X 1 + X 2 + +X oudattaa biomijakaumaa Bi(, p). Keskeise rajaväittämä mukaa Z X p p(1 p)/ S p p(1 p) oudattaa likimai ormaalijakaumaa N(0, 1), ku o suuri. Tulokse mukaa biomijakauma läheee ormaalijakaumaa, ku kasvaa. Peukalosäätöä voidaa pitää, että o riittävä suuri, ku p 5 ja (1 p) 5. Mitä eemmä p poikkeaa 0.5:stä, sitä suurempi tarvitaa. Esimerkki 6.10 Oletetaa, että X Bi(10, 0.5). Lasketaa todeäköisyys P(3 X < 6). Voidaa kirjoittaa P(3 X < 6) P(2.5 X 5.5).
226 Luku 6. Otatajakaumie teoria Arvioidaa yt jälkimmäistä todeäköisyyttä keskeise rajaväittämä ojalla ormaalijakauma avulla. Silloi ( 2.5 5 P(2.5 X 5.5) P X 5 5.5 5 ) 10/4 10/4 10/4 Φ(0.316) Φ( 1.581) 0.5670. Tarkka todeäköisyys biomijakauma avulla o P(3 X < 6) 0.5683. 6.7 t-jakauma ja F-jakauma Oletetaa, että X 1, X 2,...,X o otos jakaumasta N(µ, σ 2 ), joka variassi σ 2 tuetaa. Tarkastellaa lauseketta T X µ S/ X µ σ/ ( 1)S 2 σ 2 / ( 1), joka tuetaa t-testisuureea. Tiedämme, että ja Lausee 6.8 mukaa U Z X µ σ/ N(0, 1) ( 1)S2 σ 2 χ 2 ( 1). Lisäksi Lausee 6.8 mukaa Z ja U ovat riippumattomat. Tällaie satuaismuuttuja oudattaa t-jakaumaa vapausastei r 1. Alaluvussa 5.9.2 esitettii t-jakauma tiheysfuktio. Usei halutaa verrata kahde ormaalijakauma N(µ 1, σ1 2) ja N(µ 2, σ2 2) variasseja. Teemme 1 : kokoise otokse jakaumasta N(µ 1, σ1 2) ja 2: kokoise otokse jakaumasta N(µ 2, σ2). 2 Oletetaa, että otokset ovat toisistaa riippumattomat. Olkoot S1 2 ja S2 2 äistä eri otoksista lasketut otosvariassit. Lausee 6.8 mukaa U ( 1 1) S2 1 σ 2 1 χ 2 ( 1 1) ja V ( 2 1) S2 2 σ 2 2 χ 2 ( 2 1). Koska otokset ovat keskeää riippumattomat, ii satuaismuuttujat U ja V ovat riippumattomat. Variassie yhtäsuuruutta voidaa testatata tarkastelemalla suhdetta (6.7.1) F U/r 1 V/r 2, missä r 1 1 1 ja r 2 2 1. Alaluvussa 5.9.2 osoitettii, että suhde (6.7.1) oudattaa F-jakaumaa vapausastei r 1 ja r 2.
6.8. Momettifuktio rajafuktiot 227 6.8 Momettifuktio rajafuktiot Tarkastelemme yt satuaismuuttuja (usei otokse tuusluku) jakauma riippuvuutta otoskoosta. Otoskeskiarvo ja otosvariassi ovat tavallisimmat otoksesta lasketut tuusluvut. Oletetaa esimerkiksi, että X Bi(, p). Eri : arvoilla saamme eri biomijakauma. Mite jakauma muuttuu : kasvaessa? Olemme keskeise rajaväittämä avulla jo osoittaeet, että Bi(, p) läheee ormaalijakaumaa, ku kasvaa. Voimme tutkia Bi(, p): rajajakaumaa myös ehdolla, että jakauma odotusarvo p pidetää vakioa λ. Jos p λ o vakio ja, ii p 0. Satuaismuuttuja X Bi(, p) momettifuktio o Koska p λ/, ii M (t) M (t) (1 p + pe t ). [ 1 λ + λ ] [ ] et 1 + λ(et 1). Käyttäe hyväksi aalyysi tulosta ( 1 + ) a e a, saadaa lim lim M (t) e λ(et 1) M(t), joka o olemassa kaikilla t R. Koska M(t) e λ(et 1) o Poissoi jakauma Poi(λ) momettifuktio, ii Lausee 3.15 mukaa X : jakauma lähestyy siis Poissoi jakaumaa Poi(λ), ku. 6.9 Suppeemiskäsitteet Olemme edellä jo useaa otteesee tutustueet suppeemisee jakaumamielessä. Käsite määriteltii alaluvussa 4.3.4 (Määritelmä 4.2). Satuaismuuttujie joo (X, 1) (X 1, X 2,...) suppeee jakaumaltaa kohti satuaismuuttujaa X (X X, ku ), d jos lim F X (x) F X (x) kaikssa pisteissä x, joissa F X (x) o jatkuva. Tässä yhteydessä o myös syytä muistaa, että momettifuktioide joo suppeemisesta seuraa vastaavie jakaumie suppeemie jakaumamielessä.
228 Luku 6. Otatajakaumie teoria Esimerkki 6.11 Olkoo {X } sellaie satuaismuuttujie joo, että { 1, ku x 2 + 1 p (x) P(X x) ; 0, ku x 2 + 1. Huomaa, että p (2) 0 kaikilla. Tästä seuraa, että p (x) p(x), missä p(x) 0 kaikilla x. Satuaismuuttuja X kertymäfuktio o muotoa { 0, ku x < 2 + 1 F (x) ; 1, ku x 2 + 1. Ku, ii F (x) F(x), missä { 0, x < 2; F(x) 1, x 2. F(x) o pisteesee x 2 degeeroituee jakauma kertymäfuktio eli P(X 2) 1. Todeäköisyysfuktioide p (x) joo ei kuitekaa suppee kohti tämä jakauma todeäköisyysfuktiota. Olkoo {X } joo satuaismuuttujia, joide odotusarvo o µ ja variassi σ 2. Silloi keskeise rajaväittämä mukaa Z X µ σ/ d Z, missä Z N(0, 1). Huomattakoo, että Z : jakaumat ovat usei diskreettejä, mutta silti rajajakauma o ormaalijakauma. Ku o riittävä suuri, ii ( P a X ) µ σ/ b Φ(b) Φ(a). Jos esimerkiksi X Bi(, p), ii silloi keskeise rajaväittämä mukaa (X p) d Z, p(1 p) missä Z N(0, 1). Tätä tulosta kutsutaa De Moivre ja Laplace lauseeksi. Osoitimme alavuvussa 3.4 Tšebyševi epäyhtälö avulla, että otoskeskiarvo X o hyvä populaatio keskiarvo tuusluku. Tarkastelu ei perustuut suppeemisee jakaumamielessä vaa s. stokastisee suppeemisee. Määritelmä 6.2 Satuaismuuttujie joo {X } suppeee stokastisesti kohti satuaismuuttujaa X, jos kaikilla ε > 0 tai yhtäpitävästi lim P( X X ε) 0 lim P( X X < ε) 1.
6.9. Suppeemiskäsitteet 229 Stokastista suppeemista saotaa myös suppeemiseksi todeäköisyyde mielessä ja merkitää X X. Usei tarkastellaa tilaetta, että P satuaismuuttuja, jota lähestytää, o vakio. Tällaie tilae o heikossa suurte lukuje laissa (Lause 3.11, HSLL). Esitetty heiko suurte lukuja lai todistus oli sillä tavalla yleie, että se o pätevä myös jatkuville satuaismuuttujille. HSLL saoo, että otoskeskiarvo suppeee stokastisesti kohti populaatio keskiarvoa, ku otoskoko kasvaa. Olkoo {X } sellaiste satuaismuuttujie joo, että E(X ) µ ja Var(X ) σ 2. Heiko suurte lukuje lai mukaa X P µ, missä X (X 1 +X 2 + +X )/. Lause todistettii Tšebyševi epäyhtälö avulla. Esimerkki 6.12 Olkoo {X } joo sellaisia diskreettejä satuaismuuttujia, että Silloi P(X 1) 1 ja P(X 0) 1 1. P(X 1) 1, ku 0 < ε < 1; P( X > ε) 0, ku ε 1. Tästä ähdää, että P( X > ε) 0, ku. Voimme siis saoa, että P 0. X Esimerkki 6.13 (Otosvariassi tarketuvuus) Olkoo {X } sellaie satuaismuuttujie joo, että E(X ) µ ja Var(X ) σ 2 <. Otosvariassi o S 2 1 (X i X) 2. 1 Tiedämme, että E(S 2 ) σ2. Tšebyševi epäyhtälö mukaa P( S 2 σ 2 ε) E(S2 σ2 ) ε 2 Var(S2 ) ε 2. Jos yt Var(S 2) 0, ku, ii lim P( S 2 σ2 ε) 0 ja (S 2, 1) suppeee stokastisesti kohti populaatio variassia. Tässä yhteydessä o tietysti luoollista kysyä, mite stokastie suppeemie ja suppeemie jakaumamielessä suhteutuvat toisiisa. Voidaa osoittaa, että stokastie suppeemie implikoi suppeemise jakaumamielessä. Jos siis X X, ii X X. Jos joo {X } suppeee kohti va- P d P d kiota µ, ii silloi X µ jos ja vai jos X µ. Rajoitumme tässä esityksessä kahtee edellä esitettyy suppeemiskäsitteesee: stokastisee suppeemisee ja suppeemisee jakaumamielessä. Esitämme kuiteki vielä s. melkei varma (m.v.) suppeemise.
230 Luku 6. Otatajakaumie teoria Määritelmä 6.3 Joo {X } suppeee melkei varmasti kohti satuaismuuttujaa X, jos P ( lim X X < ε ) 1. Näeäisesti määritelmä muistuttaa stokastise suppeemise määritelmää, vaikka käsitteet ovat sisällöllisesti erilaisia. 6.10 Estimaattorit 6.10.1 Estimaattoreide omiaisuuksia Olkoo X 1, X 2,...,X otos jakaumasta, joka tiheysfuktio o f(x, θ). Jos haluamme estimoida jakauma tuuslukua θ jollaki otokse tuusluvulla, merkitsemme usei tätä otokse tuuslukua ˆθ. O siis muistettava, että ˆθ o otokse fuktio ja täydellisempi merkitä olisi ˆθ(X 1, X 2,...,X ). Havaitusta otoksesta x 1, x 2,...,x laskettua estimaattori arvoa ˆθ ˆθ(x 1, x 2,...,x ) saotaa estimaatiksi. Olemme edellä jo tarkastelleet useita estimaattoreita. Tavaomaisia odotusarvo µ ja variassi σ 2 estimaattoreita ovat otoskeskiarvo X ja otosvariassi S 2, eli ˆµ X ja ˆσ 2 S 2. Määritelmä 6.4 Estimaattori ˆθ o parametri harhato estimaattori, jos E(ˆθ) θ kaikilla θ: arvoilla. Muutoi ˆθ o harhaie ja ˆθ: harha o harha(ˆθ) E(ˆθ) θ. Olemme jo aikaisemmi osoittaeet, että ˆµ X ja ˆσ 2 S 2 ovat harhattomia estimaattoreita. Eräs ituitiivisesti hyväksyttävä estimaattorille asetettava vaatimus o, että se ataa tarkempia estimaatteja ku otoskoko kasvaa. Tarka estimaattori arvot osuvat suurella todeäköisyydellä lähelle parametri θ oikeata arvoa. Tarketvuvuus sisältää tämä ajatukse. Määritelmä 6.5 Tuusluku ˆθ o parametri θ tarketuva estimaattori, jos ˆθ P θ, ku otoskoko kasvaa rajatta. Selvempi olisi merkitä ˆθ ˆθ(X 1, X 2,...,X ), missä (ˆθ ; 1) o satuaismuuttujie joo. Jos ˆθ o θ: tarketuva estimaattori, ii joo (ˆθ ; 1) suppeee stokastisesti kohti parametri arvoa θ. Määritelmä 6.6 Estimaattori ˆθ keskieliövirhe (MSE Mea Square Error) o MSE(ˆθ) E[(ˆθ θ) 2 ]. Määritelmästä seuraa suoraviivaisesti, että MSE(ˆθ) Var(ˆθ) + [harha(ˆθ)] 2. Voidaa osoittaa, että ˆθ o θ: tarketuva estimaattori, jos MSE(ˆθ) 0 otoskoo kasvaessa rajatta.
6.10. Estimaattorit 231 6.10.2 Delta-meetelmä Määritelmä 6.7 Fuktio g(x) r. astee Taylori polyomi pisteessä a o (6.10.1) T r (x) g(a) +g (a)(x a) + g (a) 2! missä g (r) (x) dr dx r g(x) o fuktio g(x) r. derivaatta. Taylori lausee mukaa (6.10.2) lim x a g(x) T r (x) (x a) r 0, (x a) 2 + + g(r) (a) (x a) r, r! jos g (r) (a) o olemassa. Fuktio g(x) voidaa lausua pistee x a ympäristössä muodossa g(x) T r (x) + R r+1 (x), missä R r+1 (x) g(x) T r (x) o jääöstermi, joka siis toteuttaa ehdo 6.10.2. Oletetaa, että X o satuaismuuttuja, joka odotusarvo o E(X) µ 0. Jos estimoidaa fuktiota g(µ), ii se Taylori polyomii perustuva 1. kertaluvu likiarvo pisteessä µ o (6.10.3) g(x) g(µ) + g (µ)(x µ). Jos käytetää g(µ): estimaattoria fuktiota g(x), ii E[g(X)] g(µ) ja Var[g(X)] [g (µ)] 2 Var(X). Esimerkki 6.14 Tarkastellaa odotusarvo E(X) µ 0 fuktio g(µ) 1/µ estimoitia. Olkoo estimaattoria 1/X. Silloi edellise mukaa ( ) 1 E 1 X µ ja ( ) 1 Var X ( ) 4 1 Var(X). µ Lause 6.11 (Delta-meetelmä) Olkoo {X } sellaie satuaismuuttujie joo, että (X θ) läheee jakaumamielessä ormaalijakaumaa N(0, σ 2 ). Oletetaa, että aetulla fuktiolla g o määrätyllä arvolla θ derivaatta g (θ) 0. Silloi [g(x ) g(θ)] N ( 0, σ 2 [g (θ)] 2) jakaumamielessä.
232 Luku 6. Otatajakaumie teoria Esimerkki 6.15 Olkoo X 1,..., X otos jakaumasta Ber(p). Oistumise todeäköisyyde p estimaattori o tavallisesti ˆp 1 X i. Oistumise mahdollisuus (odds) p/(1 p) o vedolyöissä ja biostatiikassa tavaomaie parametri. Voimme käyttää p/(1 p): estimaattoria ˆp: fuktiota ˆp/(1 ˆp). Mitä voimme saoa tämä estimaattori omiaisuuksista? Nyt estimoidaa siis fuktiota g(p) p/(1 p). Koska g (p) 1/(1 p) 2, ii lausekkee 6.10.3 mukaa ( ) ˆp Var [g (p)] 2 Var(ˆp) 1 ˆp [ 1 (1 p) 2 ] 2 p(1 p) p (1 p) 3.