ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus 4

Samankaltaiset tiedostot
ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2016 Harjoitusten 4 ja 5 ratkaisuehdotuksia

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus 3

Maximum likelihood-estimointi Alkeet

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy Tehtävissä 1, 2, ja 3 tarkastelemme seuraavaa tilannetta:

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus 5 (Koetentti)

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Osa 2: Otokset, otosjakaumat ja estimointi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

11. laskuharjoituskierros, vko 15, ratkaisut

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Todennäköisyyden ominaisuuksia

Tilastollinen aineisto Luottamusväli

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MS-A0004/A0006 Matriisilaskenta

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

D ( ) E( ) E( ) 2.917

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät Ratkaisuehdotuksia

Mat Tilastollisen analyysin perusteet, kevät 2007

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

4. laskuharjoituskierros, vko 7, ratkaisut

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus Mitkä todennäköisyystulkinnat sopivat seuraaviin väitteisiin?

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

9. laskuharjoituskierros, vko 12-13, ratkaisut

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy päätöspuiden avulla tarkastellaan vasta seuraavissa harjoituksissa.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Harjoitus 2: Matlab - Statistical Toolbox

Tilastollinen päättely, 10 op, 4 ov

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Mallipohjainen klusterointi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

Mat Tilastollisen analyysin perusteet, kevät 2007

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

Mat Tilastollisen analyysin perusteet, kevät 2007

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Bayesilainen päätöksenteko / Bayesian decision theory

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Kertausluento. Tilastollinen päättely II - 1. kurssikoe

3.6 Su-estimaattorien asymptotiikka

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

Kertausluento. Tilastollinen päättely II - 2. kurssikoe

Mat Sovellettu todennäköisyyslasku A

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Väliestimointi (jatkoa) Heliövaara 1

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Varikko Ruokala Elokuu 2014

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Luento 9. June 2, Luento 9

Sovellettu todennäköisyyslaskenta B

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Mikrobikriteereiden arviointi esimerkkinä kampylobakteeri

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

031021P Tilastomatematiikka (5 op) viikko 4

Luento 2. Yksiparametrisia malleja. Binomi-malli. Posteriorijakauman esittämisestä. Informatiivisista priorijakaumista. Konjugaattipriori.

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Pelaisitko seuraavaa peliä?

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Transkriptio:

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus 4 Ratkaisuehdotuksia 1. Omppukone Oy valmistaa liukuhihnalla muistipiirejä kymmenen piirin sarjoissa. Omppukone arvioi, että keskimäärin 80% sarjoista sisältää 10% viallisia piirejä ja 20% sarjoista sisältää 50% viallisia piirejä. Jos hyvä sarja (siis sellainen, jossa on vain 10% viallisia piirejä) lähetetään liukuhihnalla eteenpäin se tulee maksamaan prosessointikuluina 1.000C. Jos huono sarja (siis sellainen, jossa on 50% viallisia piirejä) lähetetään liukuhihnalla eteenpäin se tulee maksamaan prosessointikuluina 4.000C. Omppukone voi vaihtoehtoisesti korjata sarjan hinnalla 1.000C. Korjattu sarja on automaattisesti hyvä sarja. Lisäksi Omppukone voi halutessaan 100C hinnalla testata täsmälleen yhden piirin sarjasta. (a) Mitä Omppukoneen tulee tehdä? (b) Kuinka paljon Omppukoneen kannattaa korkeintaan maksaa piirin testaamisesta? (c) Kuinka paljon Omppukoneen kannattaa maksaa oraakkelille, joka ilmoittaa jokaisesta sarjasta, onko se hyvä sarja vai huono sarja? Huomautus: Tämä on siis harjoitusten 3 tehtävä 5 korjattuna versiona. Merkitään H sarja on hyvä, V testi havaitsee viallisen piirin. Tällöin P(H) 0,8, P(eiH) 0,2, P(V H) 0,1, P(eiV H) 0,9, P(V eih) 0,5, P(eiV eih) 0,5. Kokonaistodennäköisyyden kaavan ja komplementtikaavan nojalla P(V ) P(H)P(V H) + P(eiH)P(V eih) 0,18, P(eiV ) 1 P(V ) 0,82. 1

Bayesin kaavan ja komplementtikaavan nojalla P(H V ) P(H)P(V H) P(V ) 0,444, P(eiH V ) 1 P(H V ) 0,556, P(H eiv ) P(H)P(eiV H) P(eiV ) 0,878, P(eiH eiv ) 1 P(H eiv ) 0,122. Tilannetta kuvaava täytetty päätöspuu on Viallinen (0,18) Eteenpäin 2.767 Hyvä sarja (0,444) Huono sarja (0,556) 1.100 4.100 1.580 Testataan 1.580 Korjataan Eteenpäin 2.100 Ei viallinen (0,82) 1.466 Korjataan Eteenpäin 1.466 Korjataan 1.600 Hyvä sarja (0,878) Huono sarja (0,122) Hyvä sarja (0,8) Huono sarja (0,2) 2.100 1.100 4.100 2.100 2.000 1.000 4.000 (a) Omppukoneen kannattaa testata sarja, ja jos tulos on viallinen piiri, niin korjata sarja ja muutoin viedä sarja eteenpäin korjaamatta. (b) Testaamisesta kannattaa maksaa korkeintaan ( 1.580 + 100) ( 1.600) 120 euroa. (c) Oraakkelitiedoilla, huono sarja kannattaa korjata ja hyvä sarja kannattaa viedä eteenpäin. Siten oraakkelipuun arvo on 0,8 ( 1.000)+0,2 ( 2.000) 1.200. Siten oraakkeli-informaation arvo on 1.200 ( 1.600) 400 euroa. 2. Tarkastelemme esimerkin 4.2 leipuri Pullaa. Kuinka monta pullaa tulee leipuri Pullan paistaa aamuisin, kun hän on riskineutraali, ja uskoo että (potentiaalisesti) myytyjen pullien lukumäärä lounastauolla on 2

(a) binomijakautunut parametrein n 10 ja p 0,5, (b) Poisson-jakautunut parametrilla 5, (c) Pearson Tukey-jakautunut fraktiiliparametrein 1, 5, 10? (a) Leipuri Pullan arvotukset vaihtoehdoille i 0, 1,..., 10 ovat V (a i ) E(a i ) 10 j0 (min(i, j) 0,2i) ( ) 10 0,5 10. j Laskemalla yllä olevan kaavan mukaan (esim. tietokoneella) saamme V (a 0 ) 0,00000 V (a 1 ) 0,79902 V (a 2 ) 1,58828 V (a 3 ) 2,33359 V (a 4 ) 2,96172 V (a 5 ) 3,38477 V (a 6 ) 3,56172 V (a 7 ) 3,53359 V (a 8 ) 3,38828 V (a 9 ) 3,19902 V (a 10 ) 3,00000 Optimaalinen ratkaisu on siis paistaa 6 pullaa. (b) Leipuri Pullan arvotukset vaihtoehdoille i 0, 1,... ovat V (a i ) E(a i ) 5 5j (min(i, j) 0,2i) e j!. j0 Laskemalla yllä olevan kaavan mukaan (esim. tietokoneella, riittävän iso luku) saamme seuraavat alkupään luvut V (a 0 ), V (a 1 ),...: 0, 00000 0, 76092 1, 43762 1, 97394 2, 33479 2, 52018 2, 55934 2, 49406 2, 36350 2, 19668 2, 01172 1, 81852 1, 62189 1, 42393 1, 22551 1, 02692 0, 82829 Optimaalinen ratkaisu on siis paistaa 6 pullaa (taas). 3

(c) Nyt arvotukset ovat V (a i ) ( ) min(i, 1) 0,2i 0,185 ( ) + min(i, 5) 0,2i 0,630 ( ) + min(i, 10) 0,2i 0,185. Saamme luvut V (a 0 ),..., V (a 10 ): 0, 00000 0, 80000 1, 41500 2, 03000 2, 64500 3, 26000 3, 24500 3, 23000 3, 21500 3, 20000 3, 18500 Näemme, että nyt kannattaa paistaa 5 pullaa. 3. Satunnaismuuttuja X on geometrisesti jakautunut parametrilla θ, jos n 0, 1, 2,.... P(X n) (1 θ) n θ, (a) Millaista tilannetta geometrisesti jakautunut satunnaismuuttuja kuvaa? (b) Johda parametrin θ suurimman uskottavuuden estimaattori. (a) Geometrinen jakauma on dikotomisen riippumattoman toistokokeen ensimmäistä onnistunutta koetta edeltävien epäonnistuneiden kokeiden lukumäärän jakauma. (b) Log-uskottavuus on (kun on havaittu n epäonnistumista ennen onnistumista) l(θ) ln(1 θ) n θ n ln(1 θ) + ln θ. 4

Siten dl dθ (θ) n d dθ ln(1 θ) + d dθ ln θ n 1 θ + 1 θ 1 θ nθ (1 θ)θ 1 (n 1)θ (1 θ)θ 0, kun θ ˆθ 1 n 1. 4. Sinikka Sateen tulee päättää ottaako aamulla sateenvarjo mukaan vai ei. Hän on riskineutraali harmituksen suhteen. Jos hän ottaa sateenvarjon, eikä sada, häntä harmittaa 1 verran. Jos hän ei ota sateenvarjoa, ja sataa, häntä harmittaa 2 verran. Muissa tapauksissa häntä ei harmita ollenkaan. Sinikka Sade on kerännyt dataa sadepäivistä (1 tarkoittaa sataa, 0 tarkoittaa ei sada ): Lokakuu 2009 Viikko Ma Ti Ke To Pe La Su 40 1 0 0 0 41 0 0 1 1 1 1 1 42 1 0 0 0 1 1 1 43 1 0 0 0 0 0 0 44 0 0 0 0 0 1 1 Marraskuu 2009 Viikko Ma Ti Ke To Pe La Su 45 0 0 1 0 0 0 1 46 1 1 0 0 0 0 0 47 1 1 1 0 0 1 1 48 0 0 0 0 0 0 0 49 0 (a) Tulisiko Sinikka Sateen ottaa sateenvarjo aamuisin mukaan? (b) Voisiko Sinikka Sade päättää paremmin ottaako sateenvarjo huomenna mukaan vai ei käyttäen tietoa tämän päivän säästä? Jos tänään sataa, tulisiko Sinikka Sateen ottaa huomenna sateenvarjo mukaan? Entä jos tänään ei sada? Vihje: Kannattaa estimoida ehdolliset todennäköisyydet huomenna sataa/ei sada ehdolla tänään sataa/ei sada. 5

(a) Otoksessa on 61 päivää, joista 22 on sateisia. Saamme estimaatit p 0 (61 22)/61 0,63934, p 1 22/61 0,36066. Siten keskimääräiset (eli odotetut) harmituksen ovat Ottaa varjon: 1 p 0 1 0,63934 0,63934, Ei ota varjoa: 2 p 1 2 0,36066 0,72131. Sinikan tulee siis ottaa varjo aamuisin mukaan. (b) Nyt pitää estimoida siirtymätodennäköisyydet p ij P(Sää huomenna j Sää tänään i). Datassa on 60 siirtymää: 22 sateesta (johonkin), 38 poudasta (johonkin), 31 poudasta poutaan, 7 poudasta sateeseen, 8 sateesta poutaan ja 14 sateesta sateeseen. Saamme estimaatit p 00 31/38 0,64583, p 01 7/38 0,18421, p 10 8/22 0,36364, p 11 14/22 0,63636. Nyt keskimääräiset ehdolliset harmitukset ovat Ottaa varjon, kun tänään ei sada: 1 p 00 1 0,64583 0,645830, Ei ota varjoa, kun tänään ei sada: 2 p 01 2 0,18421 0,36842, Ottaa varjon, kun tänään sataa: 1 p 10 1 0,36364 0,36364, Ei ota varjoa, kun tänään sataa: 2 p 11 2 0,63636 1,2727. Näemme, että poudan jälkeen ei kannatta ottaa varjoa, mutta sateen jälkeen kannattaa. 5. Esimerkin 4.2 data on generoitu seuraavasti: ensiksi pyhäpäivät, viikonloput ja aatot on poistettu. Sitten perjantaisin myydyt pullat ovat riippumattomia Poisson(2)-jakautuneita satunnaismuuttujia ja maanantaista torstaihin myydyt pullat ovat riippumattomia Poisson(6)- jakautuneita satunnaismuuttujia. (Aikariippuvutta ei siis ollut, mutta epähomogeenisuutta oli. Toisin sanoen havainnot olivat riippumattomia, mutteivät samankaltaisia.) (a) Piirrä myytyjen pullien todennäköisyysjakaumat (ma to ja pe). (b) Piirrä umpimähkään valittuna päivänä myytyjen pullien todennäköisyysjakauma. 6

(a) Jakaumat ovat (suluissa Poisson-parametri, Pe yllä ja Ma To alla) p j (2) e p j (6) e 2 2j 6 6j, j 0, 1, 2,..., j!, j 0, 1, 2,.... j! Ensimmäiset 15 arvoa molemmista kuvana (Poisson(2) on sininen ja Poisson(6) on punainen): 0,25 0,20 0,15 0,10 0,05 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 (b) Umpimähkään valitun päivän jakauma on sekoitusjakauma: p n 4 5 p n(6) + 1 5 p n(2) Ensimmäiset 15 arvoa kuvana: 0,25 0,20 0,15 0,10 0,05 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 7