Tilastollinen päättely II, kevät 207 Harjoitus A Heikki Korpela 23. tammikuuta 207 Tehtävä. Kertausta todennäköisyyslaskennasta. Ilmoita satunnaismuuttujan Y jakauman nimi ja pistetodennäköisyys- tai tiheysfunktio seuraavissa tapauksissa. Ilmoita myös satunnaismuuttujan Y odotusarvo sekä varianssi. Huom. Jakaumat on tällä kurssilla nimetty hieman eri tavoin kuin TN 2 -kurssilla, joten seuraavassa on merkitty ne molemmilla tavoin.) a) Y X + + X n, kun X,..., X n, ja X i Bθ) Bernoulliθ) otos Bernoullijakaumasta) b) Y U + V, kun U N, σ 2 ), V N 2, σ 2 2) ja U V. c) Y U 2, kun U N0, ). d) Y ax + b, kun X Tas0, ) U0, ) ja a > 0, b R. e) Y X + + X n, kun X,..., X n Expλ). f) Y X + X 2, kun X Poi ) Poisson ), X2 Poi 2 ) ja X X 2. Vastaus:. a) Bernoulli-jakauman momenttiemäfunktio on M Xi t) q + θe t, missä q θ. Riippumattomuuden ja momenttiemäfunktion ominaisuuksien nojalla sm:n Y mef on q + θe t ) n, joka on binomijakauman mef. Koska mef määrää jakauman, Y Binn, θ). Binomijakauman odotusarvo on nθ ja varianssi nθ θ). b) Normaalijakauman mef on M U t) exp t + 2 σ2 t 2 ), josta riippumattomuuden nojalla M Y exp + 2 )t + 2 σ2 σ 2 2)t 2 ), joten Y N + 2, σ 2 + σ 2 2). Odotusarvo on + 2 ja varianssi σ 2 + σ 2 2. c) Kyseessä on jakauma Gamma 2, 2 ) johto TN 2 -kurssin materiaalissa osiossa 5.3.7), joka voidaan tunnistaa myös khiin neliön jakaumaksi yhdellä vapausasteella χ 2. Odotusarvo on ja varianssi 2 / 2 2) 2. d) Skaalausta ja siirtoa koskevien laskusääntöjen mukaan f Y y) ) y b a f X a { a 0 < y b } < {b < y < a + b} a a + b) b Vastaavasti momenttiemäfunktiosta M X t) et e t0 t 0) e bt M X at) e bt eat at et t t 0) saadaan M Y t) eb+a)t e bt b+a b)t t 0), jonka perusteella Y Tasb, b + a). Odotusarvo on b+a+b 2 a b+a b)2 2 + b ja varianssi 2 a2 2. e) Eksponenttijakauman mef:stä M Xi t) λ λ t ) ja riippumattomuudesta saadaan, että M Y t) λ λ t )n, joka on Gamman, λ)-jakauman mef. Odotusarvo on n/λ ja varianssi n/λ 2. f) Poisson-jakauman mef:stä M Xi t) exp i e t )) ja riippumattomuudesta saadaan, että M Y t) exp + 2 )e t )), joka on Poi + 2 )-jakauman mef. Odotusarvo ja varianssi ovat + 2.
Tehtävä 2. Tilanne on sama kuin monisteen Esimerkissä.2.2. Nyt ei kuitenkaan ole mahdollista mitata kunkin laitteen elinikää erikseen, vaan käytetään halvempaa koejärjestelyä, jossa n laitetta pannaan yhtä aikaa käyntiin ja kuukauden 30 päivää) kuluttua tullaan tarkastamaan, mitkä niistä ovat ehjiä ja mitkä rikki. Muodosta tätä asetelmaa kuvaava tilastollinen malli parametrille /λ EY i. Vihje. Ajattele koeasetelmaa n-kertaisena toistokokeena, jossa onnistuminen merkitsee, että laite on ehjä, ja epäonnistuminen, että se on rikki. Mikä on onnistumistodennäköisyys :n avulla lausuttuna?) 2. Vastaus: Oletetaan, että kunkin laitteen kestoikä päivissä edelleen noudattaa Expλ) Exp/) -jakaumaa. Todennäköisyys sille, että yksittäinen laite on ehjä vielä 30 päivän päästä, saadaan eksponenttifunktion tiheyttä integroimalla tai kertymäfunktiosta): PY i 30) PY i 30) F Yi 30) exp λ30)) exp 30λ) exp 30 ) Merkitään Z:lla ehjänä säilyneiden laitteiden lukumäärää arvojoukko 0,..., n). Jos oletetaan lisäksi edelleen, että laitteiden rikkoutumistodennäköisyydet ovat samoja ja toisistaan riippumattomia, saadaan yhteisjakaumaltaan periaatteessa hierarkkinen) malli, jossa todennäköisyyden sille, että k laitetta on ehjiä kuukauden kuluttua, määrittelee binomijakauma: Z Bin n, exp 30 )) ) n f Z k) exp 30 )) k exp 30 )) n k k Tehtävä 3. a) a) Satunnaismuuttuja Y on diskreetti, arvojoukkonaan {, 2, 3, 4, 5}. Sille on kaksi vaihtoehtoista pistetodennäköisyysfunktiota, jotka on taulukoitu alla. y 2 3 4 5 f Y y; ) 0,2 0,5 0,2 0, 0 f Y y; 2) 0 0, 0,2 0,6 0, Emme tiedä, kumpaa näistä sattuma käyttää arpoessaan Y :n arvon. Tulkitse tämä parametrisena tilastollisena mallina, jonka parametria merkitään θ:lla. Mikä on parametriavaruus? Jos havaitaan Y 4, mitä voit päätellä θ:sta? Kuinka varmasti? b) Kyseisestä jakaumasta tehdään myös toinen havainto Y 2, jonka arvoksi saadaan Y 2. Mitä nyt voit päätellä θ:sta? 3. Vastaus: a) Tilastollinen malli voidaan esittää toteamalla, että taulukko määrittelee tiheyden täydellisesti 2
lähtö- ja maalijoukon karteesisena tulona), tai esimerkiksi seuraavasti 0,2, y, θ, 0, y, θ 2, 0,5, y 2, θ, 0,, y 2, θ 2, 0,2, y 3, θ, f Y y; θ) 0,2, y 3, θ 2, 0,, y 4, θ, 0,6, y 4, θ 2, 0, y 5, θ, 0,, y 5, θ 2, Parametriavaruus on siis joukko {, 2}. Jos havaitaan Y 4, parametrin arvo 2 on uskottavampi kuin parametrin arvo. Parametrin arvoon liittyy kuitenkin huomattavan suurta epävarmuutta, koska otoskoko on niin pieni, ja epävarmuuden kvantifiointikin on samasta syystä vaikeaa. b) Mallin mukaan tapahtuma Y i on mahdoton tapahtuma, jos parametrin arvo on 2. Tällöin voitaisiin siis sanoa, että parametrin arvo on varmasti, jos malli on määritelty oikein ja tapahtuman havainnointi tehty oikein. Tehtävä 4. Luennolla ja monisteessa Esimerkissä.2.. käytettiin ajatusta pienestä otoksesta suuresta perusjoukosta, jonka avulla voitiin tehdä mukava jakaumaoletus satunnaismuuttujista Y,..., Y n, ja päädyttiin mukavan selkeään tilastolliseen malliin. Entä jos tehdas onkin valmistanut vain 20 lamppua? Testaaja poimii viisi lamppua ilman takaisinpanoa) ja saa vastaavan aineiston y,..., y 5 ). Millainen yptnf f Y y; θ) olisi ilman ajatusta riippumattomuudesta? Vihje: jos testaaja poimisi yhden lampun, muuttuisiko Y :n jakauma esimerkkiin verrattuna? Jos tiedetään että Y y, millaista ehdollista jakaumaa Y 2 noudattaisi? Jos tiedetään Y y, Y 2 y 2, niin millaista ehdollista jakaumaa Y 3 noudattaisi? Päättele yptnf jatkamalla samoin ja soveltamalla kertolaskusääntöä tästä lisää TN 2:n luvuissa 8.2 ja 9.3.)) Vastaus: Sovitaan, että θ kuvaa edelleen rikkinäisten lamppujen osuutta, eli rikkinäisiä lamppuja on otoksessa Nθ kappaletta, missä N 20 ja K Nθ 0,,..., 20). Nostoja tehdään n 5 4. 3
kappaletta. Tällöin f Y y ) {y }Nθ/N) + {y 0} θ) θ y θ) y f Y2 Y y 2 y ) PY y, Y 2 y 2 ) PY y ) θnθ )/N θ Nθ )/N ), y, y 2, θn ) Nθ ))/N ) θ N ) Nθ + )/N ), y, y 2 0, Nθ 0)/N ), y 0, y 2, N ) Nθ 0)/N ), y 0, y 2 0 2) {y 2 }Nθ y )/N ) + {y 2 0} Nθ y )/N )), eli Y 2 Y BNθ Y )/N )), f Y3 Y,Y 2 y 3 y, y 2 ) PY y, Y 2 y 2, Y 3 y 3 ) PY y, Y 2 y ) {y 3 }Nθ y y 2 )/N 2) + {y 3 0} Nθ y y 2 )/N 2)), Y 3 Y, Y 2 ) BNθ Y Y 2 )/N 2)),. Y n Y n BNθ Y... Y n )/N n + )) 3) ) missä kohdassa ) viitataan ehdollisen todennäköisyyden määritelmään. Kohdassa 2) perusteluna on klassinen todennäköisyystulkinta jäljellä olevien suotuisten tapausten määrä jaettuna kaikkien tapausten määrällä). Kohdassa 3) merkintä Y n viittaa vektoriin Y,..., Y n ). Kertolaskukaavaa soveltamalla saadaan f Y y) f Y y )f Y2 Y y 2 y ) f Yn Y n y n y n ) θ) y θ) y ) y2 Nθ y Nθ y ) y2 N N ) yn Nθ y... y n Nθ y ) yn... y n N n + N n + ) y ) y Nθ N Nθ N N ) y2 ) y2 Nθ y N Nθ + y N N ) yn Nθ y... y n N n + Nθ + y +... + y n N n + N n + y i n i i Nθ N i ) Nθ + N N n + ) i n i Nθ i j j y i i N i ) Nθ + j ) yn j y i y i 4
Vaihtoehtoinen, ehkä havainnollisempi muotoilu olisi 5 {y i } 20 i + i:s lamppu rikki? i:llä nostolla lamppuja i {y i 0} i:s lamppu ehjä? i 20θ j i:llä nostolla rikkin. lamppuja + i 20 i ) 20θ + j } {{ } i:llä nostolla ehjiä lamppuja )) Tarkastellaan vielä vektorien sijaan pelkkää onnistumisten lukumäärää k. Tarkastellaan ensin yksinkertaista tapausta, jossa onnistumiset sattuvat olemaan ensimmäisinä ja epäonnistumiset viimeisinä. Tarkastellaan tapahtuman W todennäköisyyttä aiemman yhteispistetodennäköisyysfunktion avulla siirrymme merkitsemään N θ K) PW ) n i K i j y i i N i ) K + j y i Oletusten mukaan ensimmäiset k alkiota ovat ykkösiä ja loput k + :stä n:ään nollia, eli tulo voidaan jakaa PW ) n lk+ 0 k i i K N i ) K + j j i 0 l K N l ) K + j k i K j i k n K i + ) i i lk+ n lk+ k + j l jk+ 0 N l ) K + N l + K + k) 0 k j k K +) K k + ) N k + K +k) N n + K + k) K) K k + ) N K) N K n + k + ) K) K k) N K) N K n + k) K)! K k)! N K)! N K n + k)! Tämän jälkeen olennaisesti tapahtumien symmetriatulkinnan esimerkiksi jono,,, 0, 0) on yhtä todennäköinen kuin esimerkiksi 0, 0,,, )) nojalla voidaan todeta, että samaan onnistumisten lukumäärään voidaan päätyä kaikilla jonoilla, joissa on samat alkiot, mutta eri järjestyksessä. k onnistumista ja n k epäonnistumista voidaan järjestää jonoksi n k) eri tavalla. Toisin sanoen todennäköisyys pitää vielä kertoa tekijällä ) n k n! 5 n k)!k!.
f K k) n! n k)!k! K)! K k)! n! K! K k)!k! ) K! n! K k)!k! )) ) ) N K N K n k n k K ) N K ) k n k N n), N K)! N K n + k)! N K)! N K n + k)!n k)! N K)! N K n + k)!n k)! eli hypergeometrisen jakauman ptnf kuten pitikin). 6