TKK / Systeemianalyysin laboratorio Nordlund Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 5 (vko 4/003) (Aihe: jatkuvia satunnaismuuttujia ja jakaumia, sekamalli, Laininen luvut 5.1 5.7, 6.1 6.3) 1. Erään projektin arvioidaan tuottavan voittoa parhaimmillaan 3 miljoonaa euroa ja pahimmassa tapauksessa miljoonaa euroa tappiota. Projektin tuotto on satunnaismuuttuja X, jonka jakaumalla on seuraavat ominaisuudet: (i) Tiheysfunktio on kuvion mukaista 'kolmio'-tyyppiä. Kolmion kanta on jana [-, 3]. - -1 0 1 3 x [milj. euroa] (ii) Projekti on tappiollinen todennäköisyydellä 0.0. Määritä näiden tietojen pohjalta X:n tiheysfunktio ja vastaa kysymyksiin: a) Millä todennäköisyydellä projekti tuottaa voittoa vähintään 1.8 miljoonaa euroa? b) Määritä projektin tuoton odotusarvo ja keskihajonta. Mikä on odotusarvon tulkinta? c) Määritä projektin tuoton mediaani. Mikä on mediaanin tulkinta? d) Jos yritetään arvata projektin tuotto etukäteen (esim. 10000 euron tarkkuudella), mikä on paras arvaus? Kolmion pinta-ala on 1 (tiheysfunktio!), kannan pituus 5, P(X < 0) = 0.0 ja P(X > 0) = 0.80. Merkitään kolmion huipun y-koordinaattia kirjaimella h. Korkeus saadaan yhtälöstä: 5 h = 1 h = 0.4 y-akselin vasemmalla puolella olevan kolmion osan pinta-ala on 0.0 ja kannan pituus. Tästä saadaan ratkaistua korkeus k, jolla kolmio leikkaa y-akselin: k = 0. k = 0. Tästä nähdään, että kolmion vasemman kyljen kulmakerroin on 0.1 ja huipun x-koordinaatti on. Tiheysfunktioksi saadaan:
0 kun x 0.1x + 0. kun x f ( x) = 0.4x + 1. kun x 3 0 kun x 3 ( 1.8 ( ) )( 0.1 1.8 + 0.) a) P( X 1.8) = 1 P( X < 1.8) = 1 = 0.78 Tämä ratkaisu perustuu geometriaan (kolmion ala on kanta kertaa korkeus jaettuna kahdella). Todennäköisyyden voi laskea myös integroimalla tai tarkastelemalla yhdenmuotoisia kolmioita (alojen suhde on sama kuin janojen pituuksien suhteen neliö). 3 1.6 1.4 b) E( X) = x( 0.1x + 0.) dx + x( 0.4x + 1.) dx = + = 1 3 3 Tulkinta: Jos vastaavia projekteja on paljon, toistokertojen kasvaessa rajatta projektien keskimääräinen tuotto on 1 miljoona euroa. 3 3. 6.5 E( X ) = x ( 0.1x + 0.) dx + x ( 0.4x + 1.) dx = + 1.1 = 3 3 6.5 3.5 3.5 = = =, D( X ) = 1.080 3 3 3 ( X) ( X ) [ ( X) ] Var E E 1 1.167 c) Mediaani m d jakaa jakauman kahteen yhtä suureen osaan siten, että P(X < m d ) = P(X > m d ) = 0.5. Selvästi mediaani on positiivinen, koska projektit ovat tappiollisia todennäköisyydellä 0.. Koska jakauma on vasemmalle vino, on syytä olettaa, että mediaani sijaitsee tiheysfunktion huipun vasemmalla puolella. Integroidaan kolmion vasenta puolta: m d ( 0.1x + 0.) dx = 0.05m + 0.m + 0. d d Saadaan yhtälö 0.05md + 0.md + 0. = 0.5, jonka (positiivinen) ratkaisu on 0. + 0.1 m d = 1.16. 0.1 Tulkinta: Puolet vastaavista projekteista tuottaa alle 1.16 miljoonaa euroa. d) Paras arvaus on jakauman moodi eli tiheysfunktion maksimi ( miljoonaa euroa).. (satunnaismuuttujan funktion tiheysfunktio, Laininen 5.7) Keppi, jonka pituus on m, taitetaan kahtia täysin satunnaisesti valitusta paikasta (katkaisukohta on tasajakautunut) ja muodostetaan suorakulmainen kolmio, jonka kateetteina ovat syntyneet kepin palaset. Kolmion pinta-ala on satunnaismuuttuja A. a) Määritä A:n tiheysfunktio. b) Määritä A:n odotusarvo A:n tiheysfunktion avulla. c) Määritä A:n odotusarvo helpommalla tavalla. d) Keppi katkeaa keskimäärin keskeltä (tasajakauman odotusarvo). Mitä käy, jos lasketaan kolmion pinta-ala olettaen, että keppi katkeaa keskeltä?
Merkitään katkaisukohtaa satunnaismuuttujalla X: X ~ Tas(0, ) (usein jatkuvasta tasaisesta jakaumasta käytetään myös merkintää X ~ Uniform(0, )). Toisen kateetin pituudeksi tulee X ja toisen pituudeksi X. Tällöin kolmion ala on A = 0.5 X ( X). a) A:n kertymäfunktio saadaan tarkastelemalla paraabelia y = 0.5 x ( x) ja tutkimalla millä x:n arvoilla paraabelin pisteet ovat vaakasuoran y = a alapuolella, missä kiinnostavat arvot ovat 0 < a < 0.5 (paraabelin huippu on korkeudella 0.5). Tarkastellaan vain paraabelin vasenta puolta eli arvoja 0 < x < 1 (näillä arvoilla funktio A on kasvava). 0.5x( x) a 0.5x + x a 0 Merkitään epäyhtälön arvo nollaksi ja ratkaistaan x:n suhteen: x = 1± 1 a Tarkastellaan vain paraabelin vasenta puolta ja saadaan epäyhtälö: x 1 1 a Näin saatiin pinta-alalle kertymäfunktio: F ( a) = 1 1 a, kun 0 < a < 0.5 A Pinta-alan tiheysfunktio: f a = F a =, kun 0 < a < 0.5 1 a ' 1 ( ) ( ) A A Toinen muotoilu: Merkitään lyhyemmän kepin palan pituutta satunnaismuuttujalla X: X ~Tas(0, 1). Tällöin pidemmän kepin palan pituus on X. 0, x 0 f ( x) = 1, 0 < x < 1 0, x 1 0, x 0 F( x) = P( X x) = x, 0 < x < 1 1, x 1 Tällöin muodostuvan kolmion alan kertymäfunktio F A (a) voidaan kirjoittaa muotoon: ( ) ( ) F ( ) A a = P( A a) = P 0.5X( X) a = P 0.5X + X a 0 Asetetaan epäyhtälön arvo nollaksi ja hylätään toinen juuri (koska 0 < x < 1). Saadaan: F a = P X 1 1 a = F 1 1 a = 1 1 a, 0< a < 0.5 A ( ) ( ) X ( ) b) E( A) = 0.5 0 a da 1 a
Luntataan laiskuuden vuoksi kirjasta valmis integrointikaava, joka sanoo: x dx = ( kx l ) kx + l + C, missä k, l ja C ovat vakioita. Saadaan: kx + l 3k 0.5 0.5 a ( ) ( ) ( ) 1 E A = da a a 1 = + = 1 a 3 3 0 0 c) E(A) voidaan määrittää suoraan E( A) = E 0.5X( X) = 0.5 E X X [ ] [ ( )] 1 = 0.5 ( ) ( ) x x fx x dx = 0.5 x ( x) 0.5dx = 3 0 0 (tasajakauman tiheysfunktion f X (x) arvo välillä [0, ] on 0.5. d) Kun keppi katkeaa keskeltä, X saa arvon 1. Tällöin kolmion pinta-alaksi tulee 0.5 1( 1) = 0.5, joka on pinta-alan maksimi. Yleensä E[H(X)] H[E(X)], missä H(x) on satunnaismuuttujan muunnokseen käytettävä funktio. 3. Vertaillaan tasajakauma- ja eksponenttijakaumamalleja: Säähavaintojärjestelmään kuuluva mittalaite toimii ilman huoltoa moitteettomasti ajan, joka on satunnaismuuttuja Y. Oletetaan, että (i) Y:n jakauma on tasajakauma välillä (1, ) (aikayksikkönä vuosi) (ii) Y:n jakauma on eksponenttijakauma parametrilla λ = /3 (yksikkönä vuosi). Tarkastele molempien mallien kohdalla seuraavia kysymyksiä: a) Kuinka kauan laite keskimäärin toimii ilman huoltoa? b) Mikä on Y:n jakauman mediaani m d? (Mediaani jakaa jakauman kahteen yhtä suureen osaan siten, että tapahtumat Y < m d ja Y > m d ovat yhtä todennäköiset) c) Jos laite on asennettu tasan vuosi sitten, millä todennäköisyydellä se toimii vielä nyt? Jos laite toimii nyt, millä todennäköisyydellä se toimii vielä kuukauden kuluttua? d) Samat kysymykset kuin c-kohdassa, mutta oletetaan, että laite on asennettu 0 kk sitten. e) Samat kysymykset kuin c-kohdassa, mutta oletetaan, että laite on asennettu 4 kk sitten. f) Mittalaitteita hankitaan 10 kappaletta ja kaikkia käytetään yhtä paljon samoissa olosuhteissa. Mikä on ensimmäisen 1.5 vuoden aikana hajonneiden mittalaitteiden lukumäärän X odotusarvo? Eksponenttijakauman tiheysfunktio: f ( x) = λe λx, x 0 Eksponenttijakauman kertymäfunktio: x λt λt λx F( x) = P( X x) = λe dt = e = 1 e, x 0 0 0 Eksponenttijakauman häntätodennäköisyydet saadaan laskettua helposti: λx P( X > x) = 1 P ( X x) = e, x 0 x
(1, ) tasajakauman tiheysfunktio: f(x) = 1, kun 1 < x <, ja 0 muualla (1, ) tasajakauman kertymäfunktio: x F( x) = P( X x) = 1dt = x 1, kun 1 < x <, ja 0, kun x 1, ja 1, kun x 1 (1, ) tasajakauman häntätodennäköisyydet: P( X > x) = 1 P( X x) = x, kun 1 < x <, ja 1, kun x 1, ja 0, kun x a) Molemmissa tapauksissa E(Y) = 1.5 (vuotta). b) Tasajak: m d = 1.5 m d ln( 0.5) 3 Eksp: F( md) = 1 e = 0.5 md = 1.04 3 (Mediaania kutsutaan ajan yhteydessä usein puoliintumisajaksi: kun aikaa on kulunut mediaanin verran, puolet samaan aikaan käyttöönotetuista mittalaitteista on hajonnut) c) Tasajak: P(Y > 1) = 1 P(Y > 13/1 Y > 1) = P(Y > 13/1) = 11/1 0.917 Eksp: P(Y > 1) = e λ 0.513 13 λ 1 λ λ e 1 P(Y > 13/1 Y > 1) = = e 0.946 e d) Tasajak: P(Y > 0/1) = 1/3 0.333 P(Y > 1/1 Y > 0/1) = 3/4 = 0.750 0 3 1 Eksp: P(Y > 0/1) = e 0.39 P(Y > 1/1 Y > 0/1) 0.946 e) Tasajak: P(Y > 4/1) = 0 P(Y > 5/1 Y > 4/1) ei ole määritelty (0/0) 4 Eksp: 3 1 P(Y > 4/1) = e 0.64 P(Y > 5/1 Y > 4/1) 0.946 f) Tasajak: Hajonneiden mittalaitteiden lukumäärä on binomijakautunut. E(X) = n P("yksi laite kestää alle 1.5 vuotta") = 10 0.5 = 5. Eksp: Hajonneiden mittalaitteiden lukumäärä on binomijakautunut. E(X) = n P("yksi laite kestää alle 1.5 vuotta") = 10 (1 3 3 e ) 6.3. Eksponenttijakaumaan liittyy unohtamisominaisuus, jonka vuoksi laite toimii vielä yhden kuukauden lisää todennäköisyydellä 0.946 riippumatta siitä, miten kauan laite on jo toiminut. Eksponenttijakauma liittyy kiinteästi Poisson-jakaumaan: jos tapahtumien aikavälit (tässä tapauksessa mittalaitteiden hajoamisten välit) ovat riippumattomia, eksponenttijakautuneita ja tapahtumia on äärettömän paljon, aikavälillä t tapahtuvien tapahtumien (tässä hajonneiden laitteiden lukumäärä) on Poisson-jakautunut. Vastaavasti jos tapahtumien lukumäärä aikavälillä on Poisson-jakautunut, tapahtumien väliajat ovat eksponenttijakautuneita.
4. a) Olkoon satunnaismuuttujan X momentit generoiva funktio m X (t). Määritä lineaarisen muunnoksen Y = a + bx (missä a ja b ovat vakioita ja b > 0) momentit generoiva funktio m Y (t). t b) Standardoidun normaalijakauman N(0, 1) momentit generoiva funktio on m Z (t) = / e. Määritä tämän ja a-kohdan tuloksen perusteella N(µ, σ )-jakautuneen satunnaismuuttujan W momentit generoiva funktio m W (t). a) () ( ) ty ta ( + bx) ( ) ( at btx ) at X ( ) m t = E e = E e = E e e = e m bt Y b) Jos W ~ N(µ, σ ), voidaan kirjoittaa W = µ +σz, missä Z ~N(0, 1). Tästä seuraa: tw µ t σ tz µ t µ t σ t / µ t+ σ t / Z m () t E( e ) E( e e ) e m ( σt) e e e W = = = = =. 5. Varastossa on 8 kpl 0 litran ja 1 kpl 45 litran viinitynnyreitä, joissa kussakin on satunnainen määrä viiniä (tässä tapauksessa "satunnainen" tarkoittaa välille 0 % 100 % tasajakautunut osa tynnyrin tilavuudesta). Varastosta satunnaisesti valittu tynnyri sisältää Y litraa viiniä. Määritä Y:n kertymäfunktio, tiheysfunktio ja odotusarvo. Lasketaan ensin esim. kertymäfunktion arvo F(18). Tämä ratkeaa helpoiten puumallin avulla: 18/0 Y < 18 0.36 0.4 0 Y > 18 0.04 /0 0.6 18/45 45 Y < 18 0.4 7/45 Y > 18 0.36 Puumallin avulla on helppo määrätä todennäköisyys, että satunnaisesti valitussa viinikanisterissa on korkeintaan 18 litraa viiniä: F(18) = P(Y 18) = 0.4 18/0 + 0.6 18/45 = 0.36 + 0.4 = 0.6 Tämän jälkeen määrätään kertymäfunktio yleisessä tapauksessa samaan tapaan. Merkitään: A = "valitaan 0 l tynnyri", B = "valitaan 45 l tynnyri" (jolloin B = A C ). Y:n kertymäfunktio on F(Y) = P(Y y) = P(A)P(Y y A) + P(B) P(Y y B). y y Arvoilla 0 y 0 saadaan P(Y y) = 0.4 + 0.6 ja 0 45 y arvoilla 0 < y 45 saadaan P(Y y) = 0.4 1 + 0.6. Siis 45
0, kun y < 0 y, kun 0 y 0 30 F( y) = 1 + 0.4 y, kun 0 < y 45 30 1, kun y > 45 Tiheysfunktio saadaan derivoimalla kertymäfunktio: 0, kun y < 0 1, kun 0 y 0 30 f ( y) = 0.4, kun 0 < y 45 30 0, kun y > 45 Odotusarvon saa laskettua tiheysfunktion avulla integroimalla paloittain: 0 45 1 1 E( Y) = ydy + ydy = 17.5 30 75 0 0 Tai suoraan viinien määrän odotusarvoista (ks. puumalli): 0 45 E( Y ) = 0.4 + 0.6 = 17.5 HUOM! Laskuharjoituspaperissa luki "esimerkki sekamallista". Tämä on painovirhe, kyseessä ei ole sekajakauma vaan kahden tiheysfunktion lineaarikombinaatio, josta käytetään termiä "sekoitettu jakauma" (sekamallissa on mukana diskreetti komponentti eikä sillä ole siten tiheysfunktiota). 6. Suuressa kalansaaliissa kalojen paino X on normaalijakautunut odotusarvona 600 g ja keskihajontana 160 g. Kaikki alle 400 g painavat kalat syötetään kissoille. Määritä jäljelle jäävien kalojen painojakauman mediaani ja odotusarvo. Arvoa x = 400 vastaavan standardoidun muuttujan arvo on z = (x µ) / σ = 1.5. Siis P(X < 400) = Φ( 1.5) = 1 0.8944 = 0.1056 (eli 10.56 % kaloista heitetään pois). Jäljelle jäävän jakauman mediaani x Med toteuttaa ehdon P(X > x Med ) = 0.8944/ = 0.447 (piirrä kuvio!). Vastaava arvo z Med toteuttaa ehdon Φ(z Med ) = 1 0.447 = 0.558, joten z Med 0.13 (taulukosta luettava tarkkuus, Φ(z) on standardoidun normaalijakauman kertymäfunktio). Kysytty mediaani on x Med = µ + 0.13σ = 60.8 g. 1 Katkaistun N(0, 1)-jakauman tiheysfunktio on e, z > 1.5. Huomaa, että 0.8944 π termi 0.8944 nimittäjässä skaalaa katkaistun tiheysfunktion, jotta pinta-alaksi tulee 1. z
Odotusarvo saadaan integroimalla: + + z z ( 1.5) 1 1 1 ze dz e e 0.04 0.8944 π = 0.8944 π = 0.8944 π 1.5 1.5 Yli 400 g painavien kalojen painon odotusarvo on µ + 0.04σ 63.7 g. 7. Tätä tehtävää ei käydä laskuharjoituksissa läpi, vaan kaikkien on tarkoitus tehdä se itsenäisesti kaavakokoelman taulukon avulla. Kysy tuntiopettajaltasi, jos et osaa jotakin kohtaa. Olkoon satunnaismuuttuja Z ~ N(0, 1). a) Määrää P(Z > 1) (vastaus: 0.1587) b) Määrää P(Z 1.5) (vastaus: 0.0668) c) Määrää z siten, että P(Z z) = 0.95 (vastaus: z = 1.64) d) Määrää z siten, että P(Z z) = 0.01 (vastaus: z =.33) e) Määrää P( Z ). (vastaus: 0.9544) f) Määrää z siten, että P( Z z) = 0.05 (vastaus: z = 1.96) Olkoon satunnaismuuttuja X ~N(1, 9). g) Määrää P(X 1) (vastaus: 0.514) h) Määrää x siten, että P(X x) = 0.05 (vastaus: x = 5.9) Kannattaa hahmottaa paperille kuva, johon on varjostettu kysytty todennäköisyys (joka siis vastaa tiheysfunktion pinta-alaa). Standardoidun normaalijakauman (odotusarvo 0, varianssi 1) kertymäfunktiota P(Z z) merkitään tyypillisesti Φ(z). a) P(Z > 1) = 1 P(Z 1) = 1 0.8413 = 0.1587 b) P(Z 1.5) = P(Z 1.5) = 1 P(Z < 1.5) = 1 0.933 = 0.0668 c) P(Z z) = 0.95 z = 1.64 d) P(Z z) = 0.01 P(Z < z) = 0.99 z =.33 e) P( Z ) = P( Z ) = P(Z ) P(Z < ) = 1 P(Z < ) = 1 (1 P(Z )) = P(Z ) 1 = 0.977 1 = 0.9544 f) P( Z z) = 0.05 P(Z z) = 0.05 P(Z z) = 0.05 P(Z < z) = 0.975 z = 1.96 Olkoon satunnaismuuttuja X ~N(1, 9). Standardoitu satunnaismuuttuja Z noudattaa standardoitua normaalijakaumaa: Z = (X µ X ) / σ X = (X 1) / 3 ~ N(0, 1) Vastaavasti standardoidusta satunnaismuuttujasta Z saadaan N(1, 9)-normaalijakaumaa noudattava satunnaismuuttuja X seuraavasti: X = σ X Z + µ X = 3 Z + 1 ~ N(1, 9)
g) P(X 1) = P(Z ( 1 1)/3) = P(Z /3) = 1 P(Z < /3) = 1 0.7486 = 0.514 h) P(Z z) = 0.05 P(Z < z) = 0.95 z = 1.64 x = 3 z + 1 = 5.9 Pistetehtävä 1. Kahvilan päivittäinen myynti on satunnaismuuttuja, joka oletetaan normaalijakautuneeksi. Jos oletetaan, että kuukaudessa (30 päivää) on pitkällä ajalla keskimäärin.7 päivää, jolloin myynti alittaa 1000 mk, ja keskimäärin 6 päivää, jolloin myynti ylittää 000 mk, niin kuinka usein sattuu päivä, jolloin myynti ylittää 3000 mk? Merkitään X = "kahvilan päivittäinen myynti", x 1 = 1000 ja x = 000. Näitä vastaavat standardoidun muuttujan arvot z i = (x i µ)/σ, (i = 1, ), jotka toteuttavat ehdot: P(X x 1 ) = P(Z z 1 ) = Φ(z 1 ) =.7/30 = 0.09 z 1 = 1.34 (taulukosta) P(X x ) = P(Z z ) = Φ(z ) = 1 6/30 = 0.80 z = 0.84 (taulukosta) Saadaan yhtälöpari (x i = z i σ + µ, i = 1, ): 1.34σ + µ = 1000 0.84σ + µ = 000 Ratkaistaan σ 458.7, µ 1614.7. Tällöin arvoa x 3 = 3000 vastaa z 3 = (x 3 µ)/σ 3.0. P(X > 3000) = 1 P(X 3000) = 1 Φ((3000 1614.7)/458.7) = 1 Φ(3.0) = 1 0.9987 = 0.0013, joten päivämyynti ylittää 3000 mk keskimäärin 0.0013 1 769. päivän eli 5.6 kuukauden välein.
Pistetehtävä. (Kirjan tehtävä 5.9.10, ks. luku 5.7) Satunnaismuuttuja X on Tas(0, 1)-jakautunut. Määritä satunnaismuuttujien a) X b) X c) e X tiheys- ja kertymäfunktiot. Muista myös mainita, millä väleillä (eli millä y:n arvoilla) funktiot on määritelty. Merkitään X:n kertymäfunktiota F X (x) = x, 0 < x < 1. a) Y = X : F Y (y) = P(Y y) = P( X y) = P(X y ) = F X ( y ) = y, 0 < y < 1 ' 1 f Y (y) = FY ( y ) = y, 0 < y < 1 b) Y = X : F Y (y) = P(Y y) = P( X y) = P(X y ) = F X (y ) = y, 0 < y < 1 ' f Y (y) = FY ( y ) = y, 0 < y < 1 X c) Y = e : F Y (y) = P(Y y) = P(e X y) = P(X ln(y)) = F X (ln(y)) = ln(y), ' f Y (y) = F ( y ) = 1 y, 1 < y < e Y 1 < y < e