Mat-2.091 Sovellettu todennäköisyyslasku 4. harjoitukset/ratkaisut Aiheet: Diskreetit jakaumat Avainsanat: Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen jakauma, Kertymäfunktio, Negatiivinen binomijakauma, Odotusarvo, Otanta ilman takaisinpanoa, Otantasuhde, Otanta takaisinpanolla, Pistetodennäköisyysfunktio, Poisson-jakauma, Standardipoikkeama, Varianssi 4.1. Pelaaja heittää virheetöntä noppaa kymmenen kertaa. (Virheettömässä nopassa jokaisella silmäluvulla i = 1, 2, 3, 4, 5, 6 on sama todennäköisyys tulla tulokseksi.) Laske silmälukujen summan odotusarvo, varianssi ja standardipoikkeama. Pelaaja saa voittona silmälukujen summan euroina kymmenkertaisena. Mikä on voiton odotusarvo ja standardipoikkeama? Kannattaako peliin osallistua, kun se maksaa 400 euroa? Nopanheiton tulos X on satunnaismuuttuja, joka noudattaa diskreettiä tasaista jakaumaa. f() = Pr(X = ) = 1/6, = 1, 2, 3, 4, 5, 6 Satunnaismuuttujan X odotusarvo, 2. momentti, varianssi ja standardipoikkeama: 6 1+ 2+ 3+ 4+ 5+ 6 21 E( X) = Pr( X = ) = = = 3.5 = 1 6 6 6 2 2 + + + + + E( X ) = Pr( X = ) = = 6 6 = 1 [ ] 2 2 2 2 2 2 1 2 3 4 5 6 91 2 2 2 2 91 21 D ( ) E( ) E( ) 2.917 X = X X = 6 6 D( X ) = 2.917 1.708 Heitetään noppaa 10 kertaa. Jokaisen heiton tulos X k on satunnaismuuttuja, joka noudattaa ym. diskreettiä tasaista jakaumaa. Voimme lisäksi olettaa, että heittojen tulokset ovat toisistaan riippumattomia. Heittotulosten summa 10 Z = X k= 1 on satunnaismuuttuja. i Summan Z odotusarvo on ( k) E( Z) = E X = E( X ) = 10 3.5 = 35 k TKK/SAL @ Ilkka Mellin (2004) 1/10
Huomaa, että satunnaismuuttujien summan odotusarvo on satunnaismuuttujien odotusarvojen summa myös, kun ko. satunnaismuuttujat eivät ole riippumattomia. Summan Z varianssi on ( k) 2 2 2 D ( Z) = D X = D ( Xk) 10 2.917 = 29.17 Huomaa, että satunnaismuuttujien summan varianssi on satunnaismuuttujien varianssien summa vain, kun ko. satunnaismuuttujat ovat riippumattomia. Summan Z standardipoikkeama on D( Z ) = 29.17 = 5.401 Huomaa, että D(Z) 10 D(X k ) ts. satunnaismuuttujien summan standardipoikkeama ei ole satunnaismuuttujien standardipoikkeamien summa. Pelaajan voitto Y = 10 Z on satunnaismuuttuja. Voiton odotusarvo: E(Y) = 10 E(Z) = 350 e Voiton varianssi: D 2 (Y) = 10 2 D 2 (Z) = 2917 e 2 Voiton standardipoikkeama: D(Y) = 54.01 e Koska peliin osallistuminen maksaa 400 e, pelaajat kärsivät keskimäärin tappion, jonka suuruus on 400 E(Y) = 400 350 = 50 e 4.2. Kone tekee viallisia tuotteita todennäköisyydellä 0.2. Eräänä päivänä kone tekee 10 tuotetta. Mikä on todennäköisyys, että viallisia tuotteita löytyy 2 kpl? Mikä on todennäköisyys, että viallisia tuotteita löytyy? (c) Mikä on odotettavissa oleva viallisten tuotteiden lukumäärä? Ko. päivän aikana tehtyjen viallisten tuotteiden lukumäärä X on satunnaismuuttuja, joka noudattaa binomijakaumaa: X Bin(n, p) n = 10 p = 0.2 TKK/SAL @ Ilkka Mellin (2004) 2/10
n n f ( ) = Pr( X = ) = p (1 p), = 0,1,2,, n Todennäköisyys, että viallisia tuotteita löytyy 2 kpl on 10 2 2 8 Pr( X = 2) = 0.2 0.8 0.302 Todennäköisyys, että viallisia tuotteita löytyy on 10 0 0 10 Pr( X > 0) = 1 Pr( X = 0) = 1 0.2 0.8 1 0.107 = 0.893 (c) Odotettavissa oleva viallisten tuotteiden lukumäärä on E(X) = np = 10 0.2 = 2 4.3. Kone valmistaa kuulalaakerin kuulia, joiden halkaisija vaihtelee satunnaisesti. Halkaisijan on oltava tiettyjen rajojen sisällä, jotta kuula olisi käyttökelpoinen. Osa kuulista ei mahdu ko. rajojen sisälle ja ne ovat käyttökelvottomia. Kuulien laadunvalvonta on toteutettu niin, että joka sadas valmistettu kuula mitataan. Jos mitatun kuulan halkaisija on ko. rajojen ulkopuolella, koneen toiminta keskeytetään tarkastusta varten. Oletetaan, että koneen valmistamista kuulista keskimäärin 1/10 on käyttökelvottomia. Millä todennäköisyydellä joudutaan tutkimaan 10 kuulaa tai enemmän, ennen kuin kone joudutaan pysäyttämään? Millä todennäköisyydellä joudutaan tutkimaan 13 kuulaa tai enemmän, jos on tutkittu 9 kuulaa löytämättä yhtään käyttökelvotonta? (c) Mikä on niiden kuulien odotettavissa oleva lukumäärä, jotka joudutaan tutkimaan ennen ensimmäisen käyttökelvottoman löytymistä? Ensimmäisen viallisen kuulan järjestysnumero X on satunnaismuuttuja, joka noudattaa geometrista jakaumaa: X Geom(p) p = 0.1 TKK/SAL @ Ilkka Mellin (2004) 3/10
1 f( ) = Pr( X = ) = (1 p) p, = 1,2, On helppo nähdä (esimerkiksi täydellisellä induktiolla), että satunnaismuuttujan X kertymäfunktio on [ ] F( ) = 1 (1 p) [] = suurin kokonaisluku, joka Todennäköisyys, että joudutaan tutkimaan 10 kuulaa tai enemmän on ( X ) = ( X > ) = 1 Pr( X 9) Pr 10 Pr 9 = 1 F(9) 9 = 1 1 (1 p) = (1 p) = 0.9 9 0.387 9 Todennäköisyys, että joudutaan tutkimaan 13 kuulaa tai enemmän ennen viallisen löytymistä ehdolla, että on jouduttu tutkimaan 9 kuulaa löytämättä yhtään viallista on Pr( X 13 ja X 10) Pr ( X 13 X 10) = Pr( X 10) Pr( X 13) = Pr( X 10) 1 F(12) = 1 F(9) 12 0.9 3 = = 0.9 = 0.729 9 0.9 Toisaalta todennäköisyys, että joudutaan tutkimaan 4 kuulaa tai enemmän ennen viallisen löytymistä on 3 Pr( X 4) = 1 F(3) = 0.9 = 0.729 Se, että tässä Pr( X 13 X 10) = Pr(X 4) ei ole sattumaa, vaan tulos voidaan yleistää seuraavaan muotoon: TKK/SAL @ Ilkka Mellin (2004) 4/10
jo Jos satunnaismuuttuja X noudattaa geometrista jakaumaa, niin ( X a+ b X a) = ( X + b) Pr Pr 1 Tulos merkitsee sitä, että geometrisella jakaumalla on ns. unohtamisominaisuus: Todennäköisyys joutua tutkimaan b kuulaa lisää ei riipu siitä, kuinka monta kuulaa on jouduttu tutkimaan löytämättä ensimmäistä viallista. Prosessi on siis unohtanut oman historiansa. (c) Odotettavissa oleva lukumäärä kuulille, jotka joudutaan tutkimaan ennen ensimmäisen käyttökelvottoman löytymistä, on E(X) = 1/p = 1/0.1 = 10 4.4. Tehdas valmistaa tuotetta, jolla on erittäin korkeat laatukriteerit. Keskimäärin vain 60 % tuotteista täyttää kriteerit. Valitaan satunnaisesti tuotteita tarkastettavaksi, kunnes on löydetty 3 kelvollista tuotetta. Mikä on todennäköisyys, että joudutaan tarkastamaan enemmän kuin 4 tuotetta? Kuinka monta tuotetta joudutaan keskimäärin tarkastamaan? Kolmannen kelvollisen tuotteen järjestysnumero X on satunnaismuuttuja, joka noudattaa negatiivista binomijakaumaa: X NegBin(r, p) r = 3 p = 0.6 1 r r f( ) = Pr( X = ) = (1 p) p, r = 1, 2,, = r, r+ 1, r+ 2, r 1 Todennäköisyys joutua tutkimaan enemmän kuin 4 tuotetta on ( X ) Pr > 4 = 1 Pr( X 4) = 1 Pr( X = 3) Pr( X = 4) 3 = 1 0.6 0.4 0.6 2 = 1 0.216 0.2592 = 0.5248 3 3 TKK/SAL @ Ilkka Mellin (2004) 5/10
Odotettavissa oleva tuotteiden lukumäärä, jotka joudutaan tarkastamaan, ennen kuin löydetään 3 kelvollista, on r 3 E( X ) = = = 5 p 0.6 4.5. Pakkauksessa on 100 tuotetta, joista 30 on viallista. Poimitaan pakkauksesta 5 tuotetta tarkastettavaksi ilman takaisinpanoa. Mikä on todennäköisyys, että tarkastettujen joukossa on 1 viallinen tuote? Poimitaan pakkauksesta 5 tuotetta tarkastettavaksi takaisinpanolla. Mikä on todennäköisyys, että tarkastettujen joukossa on 1 viallinen tuote? Olkoon satunnaismuuttuja X = Viallisten lukumäärä tarkastettujen 5 tuotteen joukossa. Satunnaismuuttujan X jakauma riippuu siitä poimitaanko otos ilman takaisinpanoa tai takaisinpanolla: Jos otanta tehdään ilman takaisinpanoa, X noudattaa hypergeometrista jakaumaa. Jos otanta tehdään takaisinpanolla, X noudattaa binomijakaumaa. On kuitenkin syytä huomata, että hypergeometrista jakaumaa voidaan approksimoida riittävällä tarkkuudella binomijakaumalla, jos ns. otantasuhde n/n n = otoskoko N = perusjoukon koko on kyllin pieni. Näin on käytännössä, jos n/n < 0.05 Koska otos poimitaan ilman takaisinpanoa, X HyperGeom(N, r, n) N = 100 r = 30 n = 5 TKK/SAL @ Ilkka Mellin (2004) 6/10
r N r n f ( ) = Pr( X = ) =, ma[ 0, n ( N r) ] min( n, r) N n Siten todennäköisyys, että tarkastettujen joukossa on 1 viallinen on 30 100 30 1 5 1 f(1) = Pr( X = 1) = = 0.365 100 5 Koska otos poimitaan takaisinpanolla, X Bin(n, p) n = 5 p = r/n = 0.3 n n f ( ) = Pr( X = ) = p (1 p), = 0,1,2,, n Siten todennäköisyys, että tarkastettujen joukossa on 1 viallinen on f 5 1 4 (1) = Pr( X = 1) = 0.3 0.7 = 0.360 4.6. Tehdas väittää, että korkeintaan 1 % tuotteista on viallisia. Ostat 1000 tuotetta ja poimit satunnaisesti tarkastettavaksi 25 tuotetta ilman takaisinpanoa. Mikä on todennäköisyys, että löydät tarkastettujen tuotteiden joukosta useampia kuin 2 viallista, jos valmistajan väite on oikeutettu? Viallisten lukumäärä X tarkastettujen tuotteiden joukossa on satunnaismuuttuja, joka noudattaa hypergeometrista jakaumaa: X HyperGeom(N, r, n) N = 1000 r = 1000/100 = 10 n = 25 TKK/SAL @ Ilkka Mellin (2004) 7/10
Koska otantasuhde n/n = 25/1000 = 0.025 < 0.05 hypergeometrista jakaumaa voidaan approksimoida binomijakaumalla: X a Bin(n, p) n = 25 p = 0.01 Satunnaismuuttujan X pistetodennäköisyysfunktiota voidaan siis approksimoida pistetodennäköisyysfunktiolla n n f ( ) = Pr( X = ) = p (1 p), = 0,1,2,, n Siten todennäköisyys löytää 2 useampia kuin 2 viallista on ( X ) Pr > 2 = 1 Pr( X 2) = 1 Pr( X = 0) Pr( X = 1) Pr( X = 2) = 1 f(0) f(1) f(2) 25 25 25 = 1 0.01 0.99 0.01 0.99 0.01 0.99 0 1 2 0.0195 0 25 24 2 23 4.7. Puhelinkeskukseen tulee keskimäärin 3 puhelua minuutissa. Määrää seuraavien tapahtumien todennäköisyydet: 30 sekunnissa ei tule yhtään puhelua? Minuutissa tulee korkeintaan 4 puhelua? (c) Seuraavan minuutin aikana ei tule yhtään puhelua, kun edellisenä minuuttina puheluita oli 4? (d) Mikä on odotettavissa olevien puheluiden lukumäärä 1 tunnin aikana? Oletetaan, että puhelinkeskukseen s aikayksikköä kohden tulevien puheluiden lukumäärä X on satunnaismuuttuja, joka noudattaa Poisson-jakaumaa: X Poisson(λs) s = 1 min λ = 3 TKK/SAL @ Ilkka Mellin (2004) 8/10
λs e ( λs) f( ) = Pr( X = ) =, = 0,1,2,! Nyt s = 0.5 min joten λs = 3 0.5 = 1.5 Siten todennäköisyys, että ½ minuutissa ei tule puheluita, on 1.5 0 e (1.5) Pr( X = 0) = = 0.223 0! Nyt s = 1 min joten λs = 3 1 = 3 Siten todennäköisyys, että minuutissa tulee korkeintaan 4 puhelua, on 4 4 Pr( X = ) = = 0 = 0 e λs ( λs)! 0 1 2 3 4 3 3 3 3 3 3 = e + + + + 0! 1! 2! 3! 4! = 0.0498 (1 + 3 + 4.5 + 4.5 + 3.375) = 0.0498 16.375 = 0.8153 (c) Olkoon X i = minuutin i aikana tulleiden puheluiden lukumäärä, i = 1, 2. Satunnaismuuttujia X 1 ja X 2 voidaan pitää riippumattomina ja lisäksi kumpikin noudattaa Poisson-jakaumaa: X i Poisson(λs) s = 1 min λ = 3 TKK/SAL @ Ilkka Mellin (2004) 9/10
Riippumattomuuden nojalla ( ) Pr X = 0 ja X = 4 = Pr( X = 0) Pr( X = 4) 1 2 1 2 e 3 e 3 = 0! 4! 6 = e 3.375 3 0 3 4 0.00837 (d) Odotettavissa oleva puheluiden määrä 1 minuutin aikana on E(X) = λs = 3 Siten odotettavissa oleva puheluiden määrä 1 tunnissa on 60 3 = 180. 4.8. Pikkupullaan käytetään 1 dl taikinaa. Kuinka monta rusinaa 10 litraan taikinaa on pantava, jotta jokaisesta pullasta löytyisi ainakin 1 rusina vähintään todennäköisyydellä 0.95? Rusinoiden lukumäärä X tilavuusyksikössä hyvin sekoitettua taikinaa noudattaa Poissonjakaumaa: X Poisson(λs) s = tilavuusyksikkö λ = rusinoiden keskimääräinen lukumäärä tilavuusyksikössä Todennäköisyys, että taikinassa on vähintään 1 rusina tilavuusyksikössä on Pr ( X 1) = 1 Pr( X < 1) = 1 Pr( X = 0) 0 λ λ = 1 e 0! λ = 1 e Asetetaan ehto ( X ) Pr 1 = 1 e λ 0.95 joka toteutuu, jos log(0.05) λ = 2.996 log( e) 10 litrassa taikinaa on 100 dl. Koska 100 2.996 = 299.6 taikinaan pitää laittaa vähintään 300 rusinaa, jotta jokaisesta pullasta löytyisi vähintään 1 rusina vähintään todennäköisyydellä 0.95. TKK/SAL @ Ilkka Mellin (2004) 10/10