ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus 4 Ratkaisuehdotuksia 1. Omppukone Oy valmistaa liukuhihnalla muistipiirejä kymmenen piirin sarjoissa. Omppukone arvioi, että keskimäärin 80% sarjoista sisältää 10% viallisia piirejä ja 20% sarjoista sisältää 50% viallisia piirejä. Jos hyvä sarja (siis sellainen, jossa on vain 10% viallisia piirejä) lähetetään liukuhihnalla eteenpäin se tulee maksamaan prosessointikuluina 1.000C. Jos huono sarja (siis sellainen, jossa on 50% viallisia piirejä) lähetetään liukuhihnalla eteenpäin se tulee maksamaan prosessointikuluina 4.000C. Omppukone voi vaihtoehtoisesti korjata sarjan hinnalla 1.000C. Korjattu sarja on automaattisesti hyvä sarja. Lisäksi Omppukone voi halutessaan 100C hinnalla testata täsmälleen yhden piirin sarjasta. (a) Mitä Omppukoneen tulee tehdä? (b) Kuinka paljon Omppukoneen kannattaa korkeintaan maksaa piirin testaamisesta? (c) Kuinka paljon Omppukoneen kannattaa maksaa oraakkelille, joka ilmoittaa jokaisesta sarjasta, onko se hyvä sarja vai huono sarja? Huomautus: Tämä on siis harjoitusten 3 tehtävä 5 korjattuna versiona. Merkitään H sarja on hyvä, V testi havaitsee viallisen piirin. Tällöin P(H) 0,8, P(eiH) 0,2, P(V H) 0,1, P(eiV H) 0,9, P(V eih) 0,5, P(eiV eih) 0,5. Kokonaistodennäköisyyden kaavan ja komplementtikaavan nojalla P(V ) P(H)P(V H) + P(eiH)P(V eih) 0,18, P(eiV ) 1 P(V ) 0,82. 1
Bayesin kaavan ja komplementtikaavan nojalla P(H V ) P(H)P(V H) P(V ) 0,444, P(eiH V ) 1 P(H V ) 0,556, P(H eiv ) P(H)P(eiV H) P(eiV ) 0,878, P(eiH eiv ) 1 P(H eiv ) 0,122. Tilannetta kuvaava täytetty päätöspuu on Viallinen (0,18) Eteenpäin 2.767 Hyvä sarja (0,444) Huono sarja (0,556) 1.100 4.100 1.580 Testataan 1.580 Korjataan Eteenpäin 2.100 Ei viallinen (0,82) 1.466 Korjataan Eteenpäin 1.466 Korjataan 1.600 Hyvä sarja (0,878) Huono sarja (0,122) Hyvä sarja (0,8) Huono sarja (0,2) 2.100 1.100 4.100 2.100 2.000 1.000 4.000 (a) Omppukoneen kannattaa testata sarja, ja jos tulos on viallinen piiri, niin korjata sarja ja muutoin viedä sarja eteenpäin korjaamatta. (b) Testaamisesta kannattaa maksaa korkeintaan ( 1.580 + 100) ( 1.600) 120 euroa. (c) Oraakkelitiedoilla, huono sarja kannattaa korjata ja hyvä sarja kannattaa viedä eteenpäin. Siten oraakkelipuun arvo on 0,8 ( 1.000)+0,2 ( 2.000) 1.200. Siten oraakkeli-informaation arvo on 1.200 ( 1.600) 400 euroa. 2. Tarkastelemme esimerkin 4.2 leipuri Pullaa. Kuinka monta pullaa tulee leipuri Pullan paistaa aamuisin, kun hän on riskineutraali, ja uskoo että (potentiaalisesti) myytyjen pullien lukumäärä lounastauolla on 2
(a) binomijakautunut parametrein n 10 ja p 0,5, (b) Poisson-jakautunut parametrilla 5, (c) Pearson Tukey-jakautunut fraktiiliparametrein 1, 5, 10? (a) Leipuri Pullan arvotukset vaihtoehdoille i 0, 1,..., 10 ovat V (a i ) E(a i ) 10 j0 (min(i, j) 0,2i) ( ) 10 0,5 10. j Laskemalla yllä olevan kaavan mukaan (esim. tietokoneella) saamme V (a 0 ) 0,00000 V (a 1 ) 0,79902 V (a 2 ) 1,58828 V (a 3 ) 2,33359 V (a 4 ) 2,96172 V (a 5 ) 3,38477 V (a 6 ) 3,56172 V (a 7 ) 3,53359 V (a 8 ) 3,38828 V (a 9 ) 3,19902 V (a 10 ) 3,00000 Optimaalinen ratkaisu on siis paistaa 6 pullaa. (b) Leipuri Pullan arvotukset vaihtoehdoille i 0, 1,... ovat V (a i ) E(a i ) 5 5j (min(i, j) 0,2i) e j!. j0 Laskemalla yllä olevan kaavan mukaan (esim. tietokoneella, riittävän iso luku) saamme seuraavat alkupään luvut V (a 0 ), V (a 1 ),...: 0, 00000 0, 76092 1, 43762 1, 97394 2, 33479 2, 52018 2, 55934 2, 49406 2, 36350 2, 19668 2, 01172 1, 81852 1, 62189 1, 42393 1, 22551 1, 02692 0, 82829 Optimaalinen ratkaisu on siis paistaa 6 pullaa (taas). 3
(c) Nyt arvotukset ovat V (a i ) ( ) min(i, 1) 0,2i 0,185 ( ) + min(i, 5) 0,2i 0,630 ( ) + min(i, 10) 0,2i 0,185. Saamme luvut V (a 0 ),..., V (a 10 ): 0, 00000 0, 80000 1, 41500 2, 03000 2, 64500 3, 26000 3, 24500 3, 23000 3, 21500 3, 20000 3, 18500 Näemme, että nyt kannattaa paistaa 5 pullaa. 3. Satunnaismuuttuja X on geometrisesti jakautunut parametrilla θ, jos n 0, 1, 2,.... P(X n) (1 θ) n θ, (a) Millaista tilannetta geometrisesti jakautunut satunnaismuuttuja kuvaa? (b) Johda parametrin θ suurimman uskottavuuden estimaattori. (a) Geometrinen jakauma on dikotomisen riippumattoman toistokokeen ensimmäistä onnistunutta koetta edeltävien epäonnistuneiden kokeiden lukumäärän jakauma. (b) Log-uskottavuus on (kun on havaittu n epäonnistumista ennen onnistumista) l(θ) ln(1 θ) n θ n ln(1 θ) + ln θ. 4
Siten dl dθ (θ) n d dθ ln(1 θ) + d dθ ln θ n 1 θ + 1 θ 1 θ nθ (1 θ)θ 1 (n 1)θ (1 θ)θ 0, kun θ ˆθ 1 n 1. 4. Sinikka Sateen tulee päättää ottaako aamulla sateenvarjo mukaan vai ei. Hän on riskineutraali harmituksen suhteen. Jos hän ottaa sateenvarjon, eikä sada, häntä harmittaa 1 verran. Jos hän ei ota sateenvarjoa, ja sataa, häntä harmittaa 2 verran. Muissa tapauksissa häntä ei harmita ollenkaan. Sinikka Sade on kerännyt dataa sadepäivistä (1 tarkoittaa sataa, 0 tarkoittaa ei sada ): Lokakuu 2009 Viikko Ma Ti Ke To Pe La Su 40 1 0 0 0 41 0 0 1 1 1 1 1 42 1 0 0 0 1 1 1 43 1 0 0 0 0 0 0 44 0 0 0 0 0 1 1 Marraskuu 2009 Viikko Ma Ti Ke To Pe La Su 45 0 0 1 0 0 0 1 46 1 1 0 0 0 0 0 47 1 1 1 0 0 1 1 48 0 0 0 0 0 0 0 49 0 (a) Tulisiko Sinikka Sateen ottaa sateenvarjo aamuisin mukaan? (b) Voisiko Sinikka Sade päättää paremmin ottaako sateenvarjo huomenna mukaan vai ei käyttäen tietoa tämän päivän säästä? Jos tänään sataa, tulisiko Sinikka Sateen ottaa huomenna sateenvarjo mukaan? Entä jos tänään ei sada? Vihje: Kannattaa estimoida ehdolliset todennäköisyydet huomenna sataa/ei sada ehdolla tänään sataa/ei sada. 5
(a) Otoksessa on 61 päivää, joista 22 on sateisia. Saamme estimaatit p 0 (61 22)/61 0,63934, p 1 22/61 0,36066. Siten keskimääräiset (eli odotetut) harmituksen ovat Ottaa varjon: 1 p 0 1 0,63934 0,63934, Ei ota varjoa: 2 p 1 2 0,36066 0,72131. Sinikan tulee siis ottaa varjo aamuisin mukaan. (b) Nyt pitää estimoida siirtymätodennäköisyydet p ij P(Sää huomenna j Sää tänään i). Datassa on 60 siirtymää: 22 sateesta (johonkin), 38 poudasta (johonkin), 31 poudasta poutaan, 7 poudasta sateeseen, 8 sateesta poutaan ja 14 sateesta sateeseen. Saamme estimaatit p 00 31/38 0,64583, p 01 7/38 0,18421, p 10 8/22 0,36364, p 11 14/22 0,63636. Nyt keskimääräiset ehdolliset harmitukset ovat Ottaa varjon, kun tänään ei sada: 1 p 00 1 0,64583 0,645830, Ei ota varjoa, kun tänään ei sada: 2 p 01 2 0,18421 0,36842, Ottaa varjon, kun tänään sataa: 1 p 10 1 0,36364 0,36364, Ei ota varjoa, kun tänään sataa: 2 p 11 2 0,63636 1,2727. Näemme, että poudan jälkeen ei kannatta ottaa varjoa, mutta sateen jälkeen kannattaa. 5. Esimerkin 4.2 data on generoitu seuraavasti: ensiksi pyhäpäivät, viikonloput ja aatot on poistettu. Sitten perjantaisin myydyt pullat ovat riippumattomia Poisson(2)-jakautuneita satunnaismuuttujia ja maanantaista torstaihin myydyt pullat ovat riippumattomia Poisson(6)- jakautuneita satunnaismuuttujia. (Aikariippuvutta ei siis ollut, mutta epähomogeenisuutta oli. Toisin sanoen havainnot olivat riippumattomia, mutteivät samankaltaisia.) (a) Piirrä myytyjen pullien todennäköisyysjakaumat (ma to ja pe). (b) Piirrä umpimähkään valittuna päivänä myytyjen pullien todennäköisyysjakauma. 6
(a) Jakaumat ovat (suluissa Poisson-parametri, Pe yllä ja Ma To alla) p j (2) e p j (6) e 2 2j 6 6j, j 0, 1, 2,..., j!, j 0, 1, 2,.... j! Ensimmäiset 15 arvoa molemmista kuvana (Poisson(2) on sininen ja Poisson(6) on punainen): 0,25 0,20 0,15 0,10 0,05 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 (b) Umpimähkään valitun päivän jakauma on sekoitusjakauma: p n 4 5 p n(6) + 1 5 p n(2) Ensimmäiset 15 arvoa kuvana: 0,25 0,20 0,15 0,10 0,05 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 7