1A Satunnaisluvut, satunnaisvektorit ja niiden jakaumat Ensimmäisen harjoituksen tavoitteena on kerrata todennäköisyyden peruskäsitteitä, jotka ovat välttämättömiä stokastisten prosessien käsittelyssä. Kertaamisen apuna voi käyttää esim. luentomonisteita [Koi09, Les13] tai vapaasti verkosta ladattavaa kirjaa [GS97]. Alla on kuhunkin tehtävään esitetty malliratkaisut punaisella sekä malliratkaisujen lisämateriaalit sinisellä. Tuntitehtävät 1A1 HIFK ja Tappara mittelevät jääkiekon SM-liigan mestaruudesta pelaamalla sarjan otteluita paras kolmesta -järjestelmällä, jolloin kaksi voittoa ottanut joukkue voittaa mestaruuden. Oletetaan, että otteluiden tulokset ovat toisistaan riippumattomia ja Tappara voittaa kunkin ottelun todennäköisyydellä p 0.55. (a) Millä todennäköisyydellä Tappara vie mestaruuden? Ratkaisu. Olkoon satunnaisluku X k se, kuinka monta voittoa Tappara saa k:sta ensimmäisestä ottelusta. Tappara voittaa mestaruuden, mikäli se voittaa ottelusarjasta kaksi. Jos toinen joukkueista voittaa kaksi ensimmäistä peliä peräkkäin, ei kolmatta peliä tarvitse pelata. Tästä huolimatta voidaan kuvitella, että kolmaskin peli pelattaisiin, vaikka sillä ei olisikaan merkitystä lopputulokseen. Näin tekemällä havaitaan, että Tappara voittaa tn:llä P(X 3 2). Tutkitaan nyt X k :n jakaumaa. X k voidaan ilmaista indikaattorimuuttujien avulla: merkitään { 1, jos Tappara voittaa ottelun j, θ j 0, muuten. Tällöin esimerkiksi X 3 θ 1 +θ 2 +θ 3 on kolmen riippumattoman Ber(p)-jakautuneen satunnaismuuttujan summa, missä p 0.55. Peruskurssilta muistetaan, että X k noudattaa binomijakaumaa Bin(k, p). Näin ollen kysytty tn siis on P(X 3 2) ( 3 2 ) p 2 (1 p) 1 + ( 3 3 ) p 3 (1 p) 0 3p 2 (1 p) + p 3 0.575. (b) Mikä on todennäköisyys, että mestaruus ratkeaa vasta kolmannessa pelissä? Ratkaisu. Ottelusarja ratkeaa vasta kolmannessa pelissä, joss (θ 1, θ 2 ) (1, 0) tai (θ 1, θ 2 ) (0, 1). Summamalla näiden tn:t nähdään, että kysytty tn on 2(1 p)p 0.495. (c) Mikä on ratkaisuun tarvittavien pelien lukumäärän odotusarvo? Ratkaisu. Mestaruus ratkeaa joko toisessa tai kolmannessa pelissä. Edellisen kohdan myötä kolmannessa pelissä tn:llä p 3 2(1 p)p, joten kahdessa pelissä ottelu ratkeaa tn:llä p 2 1 p 3. Näin siis kysytty odotusarvo on 2p 2 + 3p 3 2(1 p 3 ) + 3p 3 2 + p 3 2.495. 1 / 10
Pohditaan mahdollista SM-liigan sääntömuutosta. Analysoi seuraavaksi ottelusarjaa, jossa käytetään paras seitsemästä -järjestelmää, jolloin neljä voittoa ottanut joukkue voittaa mestaruuden: (d) Millä todennäköisyydellä Tappara nyt vie mestaruuden? Ratkaisu. Jälleen kuvitellaan, että myös ne ottelut pelataan, joilla ei ole mestaruuden kannalta merkitystä. Tällöin Tapparan voittojen lukumärää seitsemästä pelistä on X 7 7 j1 θ j ja HIFK:n voitot saadaan kaavalla 7 X 7. Tappara voittaa mestaruuden täsmälleen silloin, kun X 7 4. Koska X 7 on Bin(7, p)-jakautunut, havaitaan että kysytty tn on P(X 7 4) 7 j4 ( ) 7 p j (1 p) 7 j 0.608. j Lisäys. Oletetaan ottelusarjassa pelataan 2l + 1 ottelua ja mestariksi tulee l + 1 voitolla. Tällöin Tapparan mestaruustodennäköisyyden pitäisi intuitiivisesti kasvaa l:n funktiona kohti yhtä (miksi?). Todista tämä. (e) Mikä on todennäköisyys, että mestaruus ratkeaa vasta seitsemännessä pelissä? Ratkaisu. Ottelusarja ratkeaa vasta seitsemännessä pelissä jos ja vain jos kuudennen pelin jälkeen otteluvoitot ovat tasan 3 3, eli X 6 3. Binomijakaumasta saadaan ( ) 6 P(X 6 3) p 3 (1 p) 3 0.303 (1) 3 1A2 Tero Pitkämäki heittää yleisurheilukilpailussa keihästä kuusi kertaa. Oletetaan, että heittojen pituudet metreinä (Z 1,..., Z 6 ) ovat riippumattomia jatkuvan välin (80, 92) tasajakaumaa noudattavia satunnaislukuja. (a) Laske Teron ensimmäisen heittotuloksen odotusarvo ja varianssi. Ratkaisu. Merkitään a 80 ja b 92 sekä h b a 12. Tällöin ensimmäisen heiton tulos voidaan esittää muodossa Z 1 a + hu 1, missä U 1 noudattaa jatkuvan yksikkövälin (0, 1) tasajakaumaa. U 1 :n tiheysfunktio on 1 (0,1) (u), joten odotusarvo on toinen momentti ja varianssi EU 1 EU 2 1 1 0 1 0 u du 1 2 u 2 du 1 3, Var(U 1 ) EU 2 1 (EU 1 ) 2 1 3 ( 1 2 ) 2 1 12. 2 / 10
Näin ollen ja varianssi EZ 1 a + heu 1 86 Var(Z 1 ) h 2 Var(U 1 ) 12. Lisäys. Kuljetetaanpa yksiköitä mukana: heitto on Z 1 metriä. Siis Var(Z 1 m) E([(Z 1 m) E(Z 1 m)] 2 ) 12m 2. Varianssi on siis 12 neliömetriä. Tämän vuoksi Teron suoriutumista kuvaakin paremmin keskihajonta Var(Z 1 ) 3.46m. (b) Selvitä satunnaisluvun Y max(z 1,..., Z 6 ) kertymäfunktio F Y ja tiheysfunktio f Y sekä laske todennäköisyys, että Teron pisin heitto kantaa vähintään 91 metriä. Ratkaisu. Satunnaisluvun Y kertymäfunktio on F Y (y) P(Z 1 y,..., Z 6 y) P(Z 1 y) 6 P(a + hu 1 y) 6 P(U 1 (y a)/h) 6 ((y a)/h) 6 h 6 (y a) 6, kun y (a, b). Lisäksi F Y (y) 0 kun y a ja F Y (y) 1 kun y b. Y :n tiheysfunktio saadaan derivaattana f Y (y) F Y (y) 6h 6 (y a) 5, kun y (a, b), ja f Y (y) 0 välin (a, b) ulkopuolella. Teron pisin heitto kantaa yli 91 m tn:llä P(Y > 91) 1 F Y (91) 0.407. Ratkaisu. (Tapa 2.) Jaetaan 12 m pituinen väli (80, 92) kahteentoista yhtäpitkään osaväliin. Tn, että yksittäinen heitto osuu osavälille (91, 92) on tasajakauman perusteella 1/12. Kaikki kuusi heittoa lentävät välin (91, 92) ulkopuolelle tn:llä (11/12) 6. Näin siis tn, että pisin heitto on yli 91 m saadaan myös kaavalla 1 (11/12) 6 0.407. (c) Selvitä satunnaisvektorin (Z 1, Z 6 ) (yhteis)tiheysfunktio f Z1,Z 6. Ratkaisu. Z 1 ja Z 6 ovat riippumattomat, joten f Z1,Z 6 (z 1, z 6 ) f Z1 (z 1 )f Z6 (z 6 ). Tässä f Z1 (z 1 ) 1/12I [80,92] (z 1 ), joten f Z1,Z 6 (z 1, z 6 ) 1/144I [80,92] 2(z 1, z 6 ). (d) Selvitä satunnaisvektorin (Z 1, Y ) (yhteis)tiheysfunktio f Z1,Y. Ratkaisu. Muistetaan, että yleisesti pätee f Z1,Y (z 1, y) f Z1 (z 1 )f Y Z1 z 1 (y). Tässä siis {Y Z 1 z 1 } on ehdollinen satunnaismuuttuja. Ensimmäinen tulon tekijä 3 / 10
tunnetaan, ja toinen saadaan b-kohdan tapaan: F Y Z1 z 1 (y) P(max{Z 1,..., Z 6 } y Z 1 z 1 ) { 0, y < z 1 P(max{Z 2,..., Z 6 } y), z 1 y 0, y < z 1 h 5 (y a) 5, z 1 y < b 1, y b Huomataan, että kertymäfunktio on epäjatkuva loikka kohdassa y z 1 kuvaa tapahtumaa, jossa Z 1 on pisin heitto. Kertymäfunktion epäjatkuvuus tarkoittaa massapistettä todennäköisyystiheydessä. Saadaan siis 0, y < z 1 f Y Z1 z 1 (y) h 5 (z 1 a) 5 δ z1 (y) + 5h 5 (y a) 4, z 1 y < b 0, y b, Eli tiheysfunktio f Y Z1 z 1 (y) on deltamassan ja varsinaisen tiheysfunktion summa. (e) Selvitä satunnaisluvun X min(z 1,..., Z 6 ) kertymäfunktio F X ja laske todennäköisyys, että vähintään yksi Teron heitoista jää alle 85 metrin. Ratkaisu. Tämä on analoginen kohtaan (b): ja F X (x) P(X x) sama tulos saadaan jälleen tavalla 2. 1 P(Z 1 > x &... & Z 6 > x) 1 [1 P(Z 1 x)] 6 1 [1 (x a)/h] 6 F X (85) 1 [1 (85 80)/12] 6 0.96 (f) Ovatko X ja Y riippuvat vai riippumattomat? Perustele vastauksesi. Ratkaisu. Riippuvat. Intuitiivinen perustelu: niitä sitoo relaatio X Y. Laskennallinen perustelu: kuvitellaan, että Terolla on huippupäivä ja lyhyinkin kaari X on mahtava. Oletetaan vaikkapa X 91.99. Tämän tapahtuman todennäköisyys ei ole nolla, vaikkakin hyvin pieni (kuten Riossa havaitsimme). Näin ollen ehdollistus X 91.99 on suoraviivainen määritellä. Jos X ja Y olisivat riippumattomat, Y noudattaisi edelleen kohdassa (b) laskettua tiheysfunktiota. Erityisesti kohdan (b) tiheysfunktiolla saadaan EY < 91.99 mutta toisaalta tiedosta X 91.99 seuraa Y 91.99, joten E{Y X 91.99} > EY. Näin ollen X ja Y eivät voi olla riippumattomia. 4 / 10
Kotitehtävät 1A3 Olkoon X satunnaisluku, joka noudattaa joukon Z + {0, 1, 2,... } geometrista jakaumaa onnistumistodennäköisyydellä p (0, 1), jolloin X:llä on pistemassafunktio π X (k) (1 p) k p, kun k 0, 1, 2,... (a) Määritä ehdollinen todennäköisyys P [ X t + h X t ] kokonaisluvuille t, h 0. Ratkaisu. P(X t + h X t) P(X t + h) P(X t) p kt+h (1 p)k p (1 p)k kt (merkitään q 1 p) qt+h 1 1 q q t 1 1 q q h (1 p) h. Lisäys. Erityisesti tulos yllä ei riipu t:stä. Tämä on geometrisen jakauman muistittomuusominaisuus: jos on odotettava geometrisesti jakautunut (diskreetti) aika X, ja on odotettu jo t aikayksikköä, on vielä jäljellä oleva odotus jakautunut kuten tapauksessa t 0, eli edelleen saman geometrisen jakauman mukainen satunnaismuuttuja. Muistittomuusominaisuus myös karakterisoi geometrisen jakauman; oletetaan, että meillä on odotusaika X Z + :sta, ja se on muistiton. Tällöin siis kaikilla t, (0, 1) c : P(X 1) P(X t + 1 X t) P(X t + 1) P(X t) P(X t + 1) P(X t) + P(X t + 1) 1 P(X t)/p(x t + 1) + 1 P(X t) 1 c P(X t + 1) c Toisaalta, koska tämä päti kaikilla t, saadaan myös P(X t 1) 1 c P(X t) c 1 c (P(X t) + P(X t + 1)) c 1 c (1 + c )P(X t) c 1 c 1 P(X t), c 5 / 10
Ja siis edelleen kaikilla t, P(X t 1)/P(X t) 1 c vakio, eli X:n pistemassafunktion peräkkäisten massojen suhde on vakio. Näin ollen X on geometrisesti jakautunut. (b) Laske X:n odotusarvo ja varianssi. Ratkaisu. Lasketaan odotusarvo ja varianssi suoraan. Vaihtoehtoinen tapa olisi momenttiemäfunktion avulla. (i) EX kp(x k) k0 kp(1 p) k k0 Sarja voidaan laskea geometrisen sarjan derivaatan avulla. Merkitään q 1 p: joten kq k q q k0 EX p k0 q k q 1 q 1 q 1 q (1 q) 1 p 2 p 2 k(1 p) k k0 p 1 p p 2 1 p p. (ii) Varianssin laskemiseksi muistetaan Var(X) EX 2 (EX) 2, joten riittää laskea neliön odotusarvo. EX 2 p k 2 (1 p) k k0 6 / 10
Sarja saadaan taas derivointikikalla: k 2 q k joten Lopulta k0 ( q ) kq k q k0 q ( ) q q (1 q) 2 q q + 1 (1 q) 3 EX 2 p(1 p) 2 p p 3 Var(X) EX 2 (EX) 2 (1 p)(2 p) p 2. (1 p)(2 p) (1 p)2 p 2 p 2 1 p. p 2 Lisäys. Yllä esintyneet vaikeat sarjat voidaan myös laskea elementääristi pelkän geometrisen sarjan kaavan avulla. Tämä perustuu termien ryhmittelyyn: koska kaikki äärettömän monta sarjan termiä ovat positiivisia, voidaan ne summata vapaavalintaisessa järjestyksessä. Ensin k(1 p) k (1 p) k + (1 p) k + (1 p) k +... k0 (merkitään q 1 p) k1 k2 k3 [ ] q 1 q + q2 1 q + q3 1 q +... 1 q k 1 q k1 q (1 q). 2 Jälkimmänen voidaan laskea edellistä muokkaamalla: kun l 1, k(1 p) k l (1 p) k + (1 p) k + (1 p) k +... kl kl lql 1 q + ql+1 (1 q) 2 kl+1 kl+2 7 / 10
ja edelleen k 2 (1 p) k k0 k(1 p) k + k1 1 1 q l1 k(1 p) k + k2 lq l q + (1 q) 2 q (1 q) + q 2 3 (1 q) 3 q q + 1 (1 q). 3 l1 q l k(1 p) k +... Huomataan, että saatiin samat tulokset kuin geometristä sarjaa derivoimalla. Olkoon Y satunnaisluku, joka noudattaa eksponenttijakaumaa vauhtiparametrilla λ > 0, jolloin Y :llä on tiheysfunktio { f Y (x) λe λx λe λx, kun x > 0, 1 (0, ) (x) 0, muuten. (c) Määritä ehdollinen todennäköisyys P [ Y > t + h Y > t ] reaaliluvuille t, h > 0. Ratkaisu. P [ Y > t + h Y > t ] P [ Y > t + h ] /P [ Y > t ] Tätä varten tarvitaan eksponenttifunktion integraali: joten xa λe λx dx e aλ P [ Y > t + h Y > t ] e (t+h)λ /e tλ e hλ Lisäys. Tämäkään tulos ei riipu t:stä, joten jatkuvalla eksponttijakaumalla on diskreettiä geometrista jakaumaa vastaava jatkuva-aikaisen odotusajan muistittomuusominaisuus. Jatkuva muistittomuusominaisuus myös karakterisoi eksponenttijakauman: olkoon X positiivinen muistiton odotusaika. Merkitään kertymäfunktion komplementtia G X :llä, G X 1 F X. Tällöin G X (0) 1, G X (x) x 0 ja k3 G X (h) P(X > h) P(X > t + h X > t) P(X > t + h) G X(t + h) P(X > t) G X (t) G X (t + h) G X (h)g X (t) 8 / 10
Käyttämällä nyt i kertaa y.o. kaavaa saadaan G X (i/2 j ) G X (1/2 j ) i kiinnitetyllä j. Näin ollen G X on muotoa G X (x) e xλ j kaikilla x i/2 j, i 1, 2,... ja millä tahansa j. Lukujono x i/2 j, i 1, 2,... sisältyy jonoon x i/2 j+1, i 1, 2,.... Näin ollen λ j ei riipu j:stä, joten päätellään, että G X (x) on eksponentiaalinen fuktio G X (x) e xλ kaikilla dyadisilla luvuilla x i/2 j, i, j Z 0. Koska dyadiset luvut ovat tiheitä R:ssä ja kertymäfunktio F X on aina oikealta jatkuva, seuraa että G X (x) on eksponenttifuktio e xλ. (d) Laske Y :n odotusarvo ja varianssi. Ratkaisu. (i) Osittaisintegroinnilla sekä tietämällä tiheysfunktion normalisointi saadaan EY yf Y (y)dy y R λ ye λy dy y R + λ 1 / ( y) y R + λ e λy dy + 1 λ e λy y0 1 λe λy dy λ y R + 1/λ (ii) Y.o. osittaisintegrointia voidaan helposti muokata antamaan rekursiokaava eksponenttijakauman momenteille: EY 0 1 ja E[Y k ] y k f Y (y)dy y R λ y k e λy dy y R + λ 1 / y R + λ e λy ky k 1 dy + ( 1λ ) e λy y k y0 k λe λy y k 1 dy λ y R + k λ E[Y k 1 ] Näin ollen E[Y k ] k!/λ k ja erityisesti Var(Y ) E[Y 2 ] E[Y ] 2 1/λ 2. 9 / 10
1A4 Olkoon X (X 1, X 2, X 3 ) tilajoukossa S {(1, 0, 0), (0, 1, 0), (0, 0, 1), (1, 1, 1)} tasajakautunut satunnaisvektori. Tällöin (X 1, X 2, X 3 ):n jakauma voidaan esittää käyttäen pistemassafunktiota 1 (pmf) { 1 4 π X (x 1, x 2, x 3 ), jos (x 1, x 2, x 3 ) S, 0, muutoin. Viitteet (a) Määritä satunnaisluvun X i pmf π Xi (x i ) kullekin i. Ratkaisu. Taulukoimalla eri arvojen todennäköisyydet havaitaan, että kaikilla i ja x i, π Xi (x i ) 1/2, eli X i Ber(1/2). (b) Määritä satunnaisvektorin (X i, X j ) pmf π (Xi,X j )(x i, x j ) kaikille i < j. (c) Ovatko satunnaisvektorin (X i, X j ) komponentit riippumattomat, kun i < j? Ratkaisu. Taulukoimalla eri arvojen todennäköisyydet havaitaan, että kaikilla i < j ja (x i, x j ), π (Xi,X j )(x i, x j ) 1/4, eli X i ja X j ovat riippumattomat, (X i, X j ) Ber(1/2) Ber(1/2). (d) Ovatko X 1, X 2, X 3 riippumattomat? Ratkaisu. Eivät. Oletetaan esim. että (X 1, X 2 ) (1, 1). Tällöin tiedetään, että X 3 1. Tämä on hyvä yksinkertainen esimerkki siitä, että satunnaismuuttujien pareittainen riippumattomuus on heikompi ominaisuus kuin riippumattomuus, mikä kannattaa aina pitää mielessä. Lisäys. Gaussisilla satunnaismuuttujilla on satumaisia ominaisuuksia, joista muut satunnaismuutujat voivat vain uneksia. Esimerkiksi Gaussiset muuttujat ovat riippumattomia jos ja vain jos ne ovat korreloimattomia. Samoin voidaan todistaa y.o. ominaisuuden seurauksena, että Gaussiset muuttujat ovat riippumattomia jos ja vain jos ne ovat pareittain riippumattomia. [GS97] Charles M. Grinstead and J. Laurie Snell. Introduction to Probability. American Mathematical Society, http://www.dartmouth.edu/~chance/teaching_aids/books_ articles/probability_book/book.html, 1997. [Koi09] Petri Koistinen. Todennäköisyyslaskennan kurssin luentomoniste. http://www.rni. helsinki.fi/~pek/papers/tn09.pdf, 2009. [Les13] Lasse Leskelä. Stokastiset prosessit. Luentomoniste. https://math.aalto.fi/ %7Elleskela/LectureNotes002.html, 2015. 1 Satunnaisvektorin X pistemassafunktio (engl. probability mass function) on kuvaus x P[X x]. Tätä funktiota kutsutaan myös termeillä todennäköisyysfunktio, pistetodennäköisyysfunktio tai tiheysfunktio. 10 / 10