1A Satunnaisluvut, satunnaisvektorit ja niiden jakaumat Ensimmäisen harjoituksen tavoitteena on kerrata todennäköisyyden peruskäsitteitä, jotka ovat välttämättömiä stokastisten prosessien käsittelyssä. Kertaamisen apuna voi käyttää esim. luentomonisteita [Koi09, Les13] tai vapaasti verkosta ladattavaa kirjaa [GS97]. Alla on kuhunkin tehtävään esitetty malliratkaisut punaisella sekä malliratkaisujen lisämateriaalit sinisellä. Tuntitehtävät 1A1 Tero Pitkämäki heittää yleisurheilukilpailussa keihästä kuusi kertaa. Oletetaan, että heittojen pituudet metreinä (Z 1,..., Z 6 ) ovat riippumattomia jatkuvan välin (80, 92) tasajakaumaa noudattavia satunnaislukuja. (a) Laske Teron ensimmäisen heittotuloksen odotusarvo ja varianssi. Ratkaisu. (Leskelä, luvut 1.4 ja 1.9) Merkitään a 80 ja b 92 sekä h b a 12. Tällöin ensimmäisen heiton tulos voidaan esittää muodossa Z 1 a+hu 1, missä U 1 noudattaa jatkuvan yksikkövälin (0, 1) tasajakaumaa. U 1 :n tiheysfunktio on 1 (0,1) (u), joten odotusarvo on toinen momentti ja varianssi Näin ollen ja varianssi EU 1 EU 2 1 1 0 1 0 u du 1 2 u 2 du 1 3, Var(U 1 ) EU 2 1 (EU 1 ) 2 1 3 ( 1 2 EZ 1 a + heu 1 86 Var(Z 1 ) h 2 Var(U 1 ) 12. ) 2 1 12. Lisäys. Kuljetetaanpa yksiköitä mukana: heitto on Z 1 metriä. Siis Var(Z 1 m) E([(Z 1 m) E(Z 1 m)] 2 ) 12m 2. Varianssi on siis 12 neliömetriä. Tämän vuoksi Teron suoriutusvarmuutta kuvaakin paremmin keskihajonta Var(Z 1 ) 3.46m. (b) Selvitä satunnaisluvun Y max(z 1,..., Z 6 ) kertymäfunktio F Y ja tiheysfunktio f Y sekä laske todennäköisyys, että Teron pisin heitto kantaa vähintään 91 metriä. Ratkaisu. (Leskelä, luku 1.5) (i) Määritelmän mukaan yleisesti satunnaisluvun Y kertymäfunktio F Y on F Y (y) P(Y y). 1 / 11
Todennäköisyyslaskennan ja tilastotieteen peruskurssilta muistamme, että kertymäfunktio määrittelee jakauman. Yllä kuvatun satunnaisluvun Y max(z 1,..., Z 6 ) kertymäfunktio on siis F Y (y) P(max(Z 1,..., Z 6 ) y) P(Z 1 y,..., Z 6 y) P(Z 1 y) 6 ((y a)/h) 6 h 6 (y a) 6, kun y [a, b]. Lisäksi F Y (y) 0 kun y < a ja F Y (y) 1 kun y > b. Näin saadaan 0, y a F Y (y) h 6 (y a) 6, a y b 1, y b. (ii) Yleisesti f Y : R R 0 on satunnaisluvun Y tiheysfunktio, jos kaikilla y R pätee F Y (y) y a f Y (a)da. (1) Kaikilla satunnaisluvuilla ei ole tiheysfunktiota. Erityisesti kaavasta (1) seuraa Analyysin Peruslauseen mukaan, että (a) jotta tiheysfunktio olisi olemassa, on F Y :n oltava jatkuva (b) jos F Y on jatkuva ja lisäksi derivaatta F Y on olemassa ja jatkuva (mahdollisesti äärellisen montaa poikkeuspisteettä lukuunottamatta), niin Y :llä on tiheysfunktio f Y F Y (määritelmällä poikkeuspisteissä ei ole merkitystä). Käytännössä tiheysfunktio selvitetään yleensä helpoiten kohdan (b) avulla derivoimalla jatkuvaa kertymäfunktiota ja asettamalla f Y F Y. Jos ehtoa (b) on vaikea muistaa, voi aina veikata, että f Y F Y, ja osoittaa integroimalla, että (1) pätee tällä valinnalla. Tehtävänannossa kuvatulle satunnaisluvulle Y max(z 1,..., Z 6 ) saatiin kohdassa (i) jatkuva kertymäfunktio. Derivoidaan osan (i) vastausta: 0, y < a F Y (y) 6h 6 (y a) 5, a < y < b 0, y > b. Derivaatta on olemassa ja jatkuva kaikkialla paitsi mahdollisesti pisteissä a ja b, joten tiheysfunktioksi voidaan y.o. ominaisuuden (b) perusteella asettaa esimerkiksi 0, y a f Y (y) 6h 6 (y a) 5, a < y < b 0, y b. 2 / 11
(iii) Teron pisin heitto kantaa yli 91 m tn:llä P(Y > 91) 1 P(Y 91) 1 F Y (91) 0.407. (c) Selvitä satunnaisluvun X min(z 1,..., Z 6 ) kertymäfunktio F X ja laske todennäköisyys, että vähintään yksi Teron heitoista jää alle 85 metrin. Ratkaisu. Tämä on analoginen kohtaan (b): F X (x) 0, jos x < 80 ja F X (x) 1, jos x > 92. Muutoin, F X (x) P(X x) 1 P(Z 1 > x &... & Z 6 > x) 1 [1 P(Z 1 x)] 6 1 [1 (x a)/h] 6. Y.o. kertymäfunktio on jatkuva. Käyttäen tätä tietoa saadaan P(X < 85) P(X 85) F X (85) 1 [1 (85 80)/12] 6 0.96. (d) Onko satunnaisvektorilla (X, Y ) (yhteis)tiheysfunktiota f X,Y? Ovatko satunnaisluvut X ja Y riippumattomat? Perustele vastauksesi. Ratkaisu. (i) (Leskelä, luku 1.6) Satunnaisvektorilla (X, Y ) on tiheysfunktio. Perustellaan etsimällä tiheysfunktio. Aloitetaan kuitenkin yhteiskertymäfunktiosta. Määritelmän mukaan yleisesti satunnaisvektorin (X 1,..., X n ) yhteiskertymäfunktio F (X1,...,X n) on F (X1,...,X n)(x 1,..., x n ) P(X 1 x 1,..., X n x n ). Todennäköisyyslaskennan ja tilastotieteen peruskurssilta muistamme, että yhteiskertymäfunktio määrittelee satunnaisvektorin jakauman. Satunnaisvektorilla (X 1,..., X n ) on yhteistiheysfunktio f (X1,...,X n) : R n R 0, jos kaikilla (x 1,..., x n ) R n pätee x1 xn F (X1,...,X n)(x 1,..., x n )... f (X1,...,X n)(a 1,..., a n )da n... da 1. a 1 a n Kaikilla satunnaisvektoreilla ei ole yhteistiheysfunktiota. Erityisesti kaavasta yllä seuraa, että (a) jotta yhteistiheysfunktio olisi olemassa, on F (X1,...,X n):n oltava jatkuva (b) jokaisessa alueessa, jossa F (X1,...,X n) on jatkuva ja sen derivaatat kertalukuun n asti ovat olemassa ja jatkuvia, kuvaa (X 1,..., X n ):n jakaumaa paikallisesti k.o. alueessa yhteistiheysfunktio f (X1,...,X n) 1 n F (X1,...,X n). (T.s. k.o. alueen osajoukkojen todennäköisyydet saadaan integroimalla f (X1,...,X n):ää.) 3 / 11
Käytännössä yhteistiheysfunktio selvitetään usein helpoiten kohdan (b) avulla derivoimalla jatkuvaa yhteiskertymäfunktiota kaikkien muuttujien suhteen ja tarkistamalla, että näin saadut paikalliset yhteistiheysfunktiot f (X1,...,X n) 1 n F (X1,...,X n) sisältävät tn-massan 1 määrittelyalueissaan. Palataan itse tehtävänannon satunnaisvektoriin (X, Y ) (min(z 1,..., Z 6 ), max(z 1,..., Z 6 )). Yhteistiheysfunktio määritetään seuraavasti: jos x y, selvästi F (X,Y ) (x, y) P(X x, Y y) P(Y y) F Y (y), koska X min(z 1,..., Z 6 ) max(z 1,..., Z 6 )) Y. Jos taas x < y, saadaan F (X,Y ) (x, y) P(X x, Y y) P(Y y) P(X > x, Y y) F Y (y) P(x < Z 1 y,..., x < Z 6 y) F Y (y) P(x < Z 1 y) 6 F Y (y) [F Z1 (y) F Z1 (x)] 6. Muistetaan, että yllä 0, y a F Y (y) h 6 (y a) 6, a y b 1, y b 0, x a F Z1 (x) h 1 (x a), a x b 1, x b. Erityisesti Y :n ja Z 1 :n kertymäfunktiot ovat jatkuvia, joten myös F (X,Y ) on jatkuva. Lisäksi derivoimalla ylläolevia lausekkeita havaitaan, että joukossa A : {(x, y) R 2 : a < x < y < b} pätee x y F (X,Y ) (x, y) 30h 6 (y x) 4, ja kaikkien muiden F (X,Y ) :n paloittaisten määrittelyalueiden sisäpisteissä x y F (X,Y ) (x, y) 0. Helposti havaitaan, että y.o. derivaatta integroituna joukon A yli tuotta ykkösen. Erityisesti siis ylläolevan kohdan (b) mukaan yhteistiheysfunktioksi käy seuraava valinta: { 30h 6 (y x) 4, a < x < y < b, f (X,Y ) (x, y) 0, muutoin. (ii) (Leskelä, luku 1.7) Muistetaan, että määritelmän mukaan yleiset satunnaismuuttujat X ja Y ovat riippumattomat, jos kaikille joukoille B X, B Y R pätee P(X B X, Y B Y ) P(X B X )P(Y B Y ). 4 / 11
Väite: tehtävän X ja Y ovat riippuvat. Todistus: olkoot B X, B Y R avoimia välejä, B X (90, 91), B Y (88, 89). Koska X Y, pätee P(X B X, Y B Y ) 0. Edellä johdetuista kertymäfunktioista F X ja F Y taas havaitaan, että P(X B X ) ja P(Y B Y ) ovat molemmat positiivisia. Näin ollen löydettiin B X, B Y R, joille P(X B X, Y B Y ) P(X B X )P(Y B Y ). (e) Onko satunnaisvektorilla (Z 1, Y ) (yhteis)tiheysfunktiota f Z1,Y? Ratkaisu. Väite: Ei ole. Todistus: Jokainen Teron heitto jää lyhyimmäksi samalla todennäköisyydellä, eli P(Z 1 Y ) 1/6. Jos yhteistiheysfunktio f Z1,Y olisi olemassa, sen pintaintegraali (nollapinta-alaisen) suoran Z 1 Y yli olisi siis positiivinen 1/6. Tämä ei ole mahdollista. Kotitehtävät (palautettava kirjallisina pe 15.9. klo 10:15 mennessä) 1A2 Olkoon X satunnaisluku, joka noudattaa joukon Z + {0, 1, 2,... } geometrista jakaumaa onnistumistodennäköisyydellä p (0, 1), jolloin X:llä on pistemassafunktio π X (k) (1 p) k p, kun k 0, 1, 2,... (a) Määritä ehdollinen todennäköisyys P [ X t + h X t ] kokonaisluvuille t, h 0. Ratkaisu. (Leskelä, luku 1.8) Yleisesti P(A B) P(A B)/P(B). Soveltamalla tähän saadaan P(X t + h X t) P(X t + h) P(X t) p kt+h (1 p)k p (1 p)k kt (merkitään q 1 p) qt+h 1 1 q q t 1 1 q q h (1 p) h. Lisäys. Erityisesti tulos yllä ei riipu t:stä. Tämä on geometrisen jakauman muistittomuusominaisuus: jos on odotettava geometrisesti jakautunut (diskreetti) aika X, ja on odotettu jo t aikayksikköä, on vielä jäljellä oleva odotus jakautunut kuten tapauksessa t 0, eli edelleen saman geometrisen jakauman mukainen satunnaismuuttuja. Muistittomuusominaisuus myös karakterisoi geometrisen jakauman; oletetaan, että meillä on odotusaika X Z + :sta, ja se on muistiton. Tällöin siis kaikilla t, P(X 1 + t X 1) P(X t) 1 P(X 1 + t) P(X 1) P(X t), 1 eli peräkkäisten tn-massojen suhde on vakio, ja jakauma on siis geometrinen. P(X 1) 5 / 11
(b) Laske X:n odotusarvo ja varianssi. Ratkaisu. (Leskelä, luvut 1.3 ja 1.9) Lasketaan odotusarvo ja varianssi suoraan määritelmästä. Vaihtoehtoinen tapa olisi vaikkapa momenttiemäfunktion avulla. (i) EX kp(x k) kp(1 p) k Sarja voidaan laskea geometrisen sarjan derivaatan avulla. Merkitään q 1 p: kq k q q k (2) q joten EX p q 1 q 1 q 1 q (1 q) 1 p 2 p 2 k(1 p) k p 1 p p 2 1 p p. (ii) Varianssin laskemiseksi muistetaan Var(X) EX 2 (EX) 2, joten riittää laskea neliön odotusarvo, EX 2 p k 2 (1 p) k. Sarja saadaan taas derivointikikalla: k 2 q k (3) ( q ) kq k q q ( ) q q (1 q) 2 q q + 1 (1 q) 3 6 / 11
joten Lopulta EX 2 p(1 p) 2 p p 3 Var(X) EX 2 (EX) 2 (1 p)(2 p) p 2. (1 p)(2 p) (1 p)2 p 2 p 2 1 p. p 2 Lisäys. Yllä esintyneet vaikeat sarjat (2) ja (3) voidaan myös laskea elementääristi pelkän geometrisen sarjan kaavan avulla. Tämä perustuu termien sopivaan ryhmittelyyn (koska kaikki äärettömän monta sarjan termiä ovat positiivisia, voidaan ne summata vapaavalintaisessa järjestyksessä). Ensin (2): kq k q k + q k + q k +... k1 k2 k3 q 1 q + q2 1 q + q3 1 q +... 1 q k 1 q k1 q (1 q). 2 Lasketaan seuraavaksi samaan tapaan varianssiin tarvittu sarja (3). Tätä varten tarvitaan ensin lievä yleistys edellisestä sarjasta (2): kun l 1, kq k l q k + q k + q k +... kl ja edelleen (3) voidaan laskea k 2 q k kl kl+1 lql 1 q + ql+1 (1 q) 2 kq k + k1 1 1 q l1 kq k + k2 kl+2 kq k +... k3 lq l q + (1 q) 2 q (1 q) + q 2 3 (1 q) 3 q q + 1 (1 q). 3 l1 q l 7 / 11
Huomataan, että saatiin samat tulokset kuin geometristä sarjaa derivoimalla. Olkoon Y satunnaisluku, joka noudattaa eksponenttijakaumaa vauhtiparametrilla λ > 0, jolloin Y :llä on tiheysfunktio { f Y (x) λe λx λe λx, kun x > 0, 1 (0, ) (x) 0, muuten. (c) Määritä ehdollinen todennäköisyys P [ Y > t + h Y > t ] reaaliluvuille t, h > 0. Ratkaisu.KPätee P [ Y > t + h Y > t ] P [ Y > t + h ] /P [ Y > t ]. Tätä varten tarvitaan eksponenttifunktion integraali: joten xa λe λx dx e aλ P [ Y > t + h Y > t ] e (t+h)λ /e tλ e hλ. Lisäys. Tämäkään tulos ei riipu t:stä, joten jatkuvalla eksponttijakaumalla on diskreettiä geometrista jakaumaa vastaava jatkuva-aikaisen odotusajan muistittomuusominaisuus. Jatkuva muistittomuusominaisuus myös karakterisoi eksponenttijakauman: olkoon X positiivinen muistiton odotusaika. Merkitään kertymäfunktion komplementtia G X :llä, G X 1 F X. Tällöin G X (0) 1, G X (x) x 0 ja kaikilla t, h > 0 G X (h) P(X > h) P(X > t + h X > t) P(X > t + h) G X(t + h) P(X > t) G X (t) G X (t + h) G X (h)g X (t). Käyttämällä nyt i kertaa y.o. kaavaa saadaan G X (i/2 j ) G X (1/2 j ) i kiinnitetyllä j. Näin ollen kaikilla x i/2 j, i 1, 2,... ja millä tahansa kiinnitetyllä j on G X (x) muotoa G X (x) e xλ j, jollakin λ j > 0. Lukujono x i/2 j, i 1, 2,... sisältyy jonoon x i/2 j+1, i 1, 2,.... Näin ollen λ j ei riipu j:stä, joten päätellään, että G X (x) on eksponentiaalinen fuktio G X (x) e xλ kaikilla dyadisilla luvuilla x i/2 j, i, j Z 0. Koska dyadiset luvut ovat tiheitä R:ssä ja kertymäfunktio F X on aina oikealta jatkuva, seuraa että G X (x) on eksponenttifuktio e xλ kaikilla x R. 8 / 11
(d) Laske Y :n odotusarvo ja varianssi. Ratkaisu. (i) Osittaisintegroinnilla sekä tietämällä tiheysfunktion normalisointi saadaan EY yf Y (y)dy y R λ ye λy dy y R + λ 1 / ( y) y R + λ e λy dy + 1 λ e λy y0 1 λe λy dy λ y R + 1/λ (ii) Y.o. osittaisintegrointia voidaan helposti muokata antamaan rekursiokaava eksponenttijakauman momenteille: EY 0 1 ja E[Y k ] y k f Y (y)dy y R λ y k e λy dy y R + λ 1 / y R + λ e λy ky k 1 dy + ( 1λ ) e λy y k y0 k λe λy y k 1 dy λ y R + k λ E[Y k 1 ]. Näin ollen E[Y k ] k!/λ k ja erityisesti Var(Y ) E[Y 2 ] E[Y ] 2 1/λ 2. 9 / 11
1A3 Otaniemi Eulers ja Leppävaaran Algebra mittelevät robottijalkapalloliigan mestaruudesta pelaamalla sarjan otteluita paras kolmesta -järjestelmällä, jolloin kaksi voittoa saavuttanut joukkue voittaa mestaruuden. Oletetaan, että otteluiden tulokset ovat toisistaan riippumattomia ja Eulers voittaa kunkin ottelun todennäköisyydellä p 0.55. (a) Millä todennäköisyydellä Eulers vie mestaruuden? Ratkaisu. Olkoon satunnaisluku X k se, kuinka monta voittoa Eulers saa k:sta ensimmäisestä ottelusta. Eulers voittaa mestaruuden, mikäli se voittaa ottelusarjasta kaksi. Jos toinen joukkueista voittaa kaksi ensimmäistä peliä peräkkäin, ei kolmatta peliä tarvitse pelata. Tästä huolimatta voidaan kuvitella, että kolmaskin peli pelattaisiin, vaikka sillä ei olisikaan merkitystä lopputulokseen. Näin tekemällä havaitaan, että Eulers voittaa tn:llä P(X 3 2). Tutkitaan nyt X k :n jakaumaa. X k voidaan ilmaista indikaattorimuuttujien avulla: merkitään { 1, jos Eulers voittaa ottelun j, θ j 0, muuten. Tällöin esimerkiksi X 3 θ 1 +θ 2 +θ 3 on kolmen riippumattoman Ber(p)-jakautuneen satunnaismuuttujan summa, missä p 0.55. Peruskurssilta muistetaan, että X k noudattaa binomijakaumaa Bin(k, p). Näin ollen kysytty tn siis on P(X 3 2) ( ) 3 p 2 (1 p) 1 + 2 ( 3 3 ) p 3 (1 p) 0 3p 2 (1 p) + p 3 0.575. (b) Mikä on todennäköisyys, että mestaruus ratkeaa vasta kolmannessa pelissä? Ratkaisu. Ottelusarja ratkeaa vasta kolmannessa pelissä, joss (θ 1, θ 2 ) (1, 0) tai (θ 1, θ 2 ) (0, 1). Summamalla näiden tn:t nähdään, että kysytty tn on 2(1 p)p 0.495. (c) Mikä on ratkaisuun tarvittavien pelien lukumäärän odotusarvo? Ratkaisu. Mestaruus ratkeaa joko toisessa tai kolmannessa pelissä. Edellisen kohdan myötä kolmannessa pelissä tn:llä p 3 2(1 p)p, joten kahdessa pelissä ottelu ratkeaa tn:llä p 2 1 p 3. Näin siis kysytty odotusarvo on 2p 2 + 3p 3 2(1 p 3 ) + 3p 3 2 + p 3 2.495. Pohditaan mahdollista liigan sääntömuutosta. Analysoi seuraavaksi ottelusarjaa, jossa käytetään paras seitsemästä -järjestelmää, jolloin neljä voittoa ottanut joukkue voittaa mestaruuden: (d) Millä todennäköisyydellä Eulers nyt vie mestaruuden? Ratkaisu. Jälleen kuvitellaan, että myös ne ottelut pelataan, joilla ei ole mestaruuden kannalta merkitystä. Tällöin Eulersin voittojen lukumärää seitsemästä 10 / 11
Viitteet pelistä on X 7 7 j1 θ j ja Algebran voitot saadaan kaavalla 7 X 7. Eulers voittaa mestaruuden täsmälleen silloin, kun X 7 4. Koska X 7 on Bin(7, p)-jakautunut, havaitaan että kysytty tn on P(X 7 4) 7 j4 ( ) 7 p j (1 p) 7 j 0.608. j Lisäys. Siirtyminen paras seitsemästä -syteemiin siis kasvatti ennakkosuosikki Eulersin mestaruustodennäköisyyttä. Oletetaan yleisemmin, että ottelusarjassa pelataan 2l + 1 ottelua ja mestariksi tulee l + 1 voitolla. Tällöin Eulersin mestaruustodennäköisyyden pitäisi intuitiivisesti kasvaa l:n funktiona kohti yhtä. Todista tämä. (Vihje: Raja: suurten lukujen laki. Kasvavuus: merkitään Eulersin johtoa otteluvoitoissa 2l + 1 ottelun jälkeen Y l : X 2l+1 (2l + 1 X 2l+1 ) 2X 2l+1 2l 1. Prosessia Y l voi ajatella esim. satunnaiskävelynä ajassa l Z +. Kävely kulkee parittomilla luvuilla ja ottaa askeleita 0, ±2. Miten tn-massaa kulkee 1:stä 1:een ja päinvastoin, kun l kasvaa yhdellä?) (e) Mikä on todennäköisyys, että mestaruus ratkeaa vasta seitsemännessä pelissä? Ratkaisu. Ottelusarja ratkeaa vasta seitsemännessä pelissä jos ja vain jos kuudennen pelin jälkeen otteluvoitot ovat tasan 3 3, eli X 6 3. Binomijakaumasta saadaan ( ) 6 P(X 6 3) p 3 (1 p) 3 0.303. (4) 3 [GS97] Charles M. Grinstead and J. Laurie Snell. Introduction to Probability. American Mathematical Society, http://www.dartmouth.edu/~chance/teaching_aids/books_ articles/probability_book/book.html, 1997. [Koi09] Petri Koistinen. Todennäköisyyslaskennan kurssin luentomoniste. http://www.rni. helsinki.fi/~pek/papers/tn09.pdf, 2009. [Les13] Lasse Leskelä. Stokastiset prosessit. Luentomoniste. https://math.aalto.fi/ %7Elleskela/LectureNotes002.html, 2015. 11 / 11