5B Poisson-prosessien ominaisuuksia ja esimerkkilaskuja Alla on kuhunkin tehtävään esitetty malliratkaisut punaisella sekä malliratkaisujen lisämateriaalit sinisellä. Tuntitehtävät 5B1 Teemu Selänne on tehnyt NHL:ssä keskimäärin λ = 1 tehopistettä (maali tai maaliin johtanut syöttö) per peli. Oletetaan, että 30% tehopisteistä on maaleja ja 70% maaliin johtaneita syöttöjä. Oletetaan, että Teemu saa jokaisesta tekemästään maalista $3000 ja jokaisesta maaliin johtaneesta syötöstä $1000 bonuksen. Mallinna tehopisteiden syntyhetkiä 60 min kestävän pelin aikana Poisson-prosessilla ja vastaa seuraaviin kysymyksiin. (a) Mikä on yksittäisen pelin bonuskertymän odotusarvo? Ratkaisu. Olkoon X t Teemun maalien lukumäärä ja Y t Teemun maaliin johtaneiden syöttöjen lukumäärä aikavälillä 0, t. Tällöin Teemun saamien tehopisteiden lukumäärä aikavälillä 0, t on Z t = X t + Y t. Valitaan aikayksiköksi yhden pelin kesto (eli yksi tunti). Tehtävänannon perusteella voidaan kehittää kaksi mallinnustapaa, joilla kuitenkin päästään samaan lopputulokseen. (1) Oletetaan, että tehopisteiden syntyhetket ovat Poisson-prosessi intensiteetillä 1, ja kukin tehopiste on toisistaan ja Poissonpistekuviosta riippumatta syöttö tn:llä 0.7 ja maali tn:llä 0.3. (2) Oletetaan, että maalien ja syöttöjen syntyhetket muodostavat toisistaan riippumattomat, tasaisesti sironneet satunnaiset pistekuviot, joiden yhteisintensiteetti on 1, siten että pitkällä aikavälillä syötöt muodostavat 70% kaikista pisteistä. Molemmissa tapauksissa (X t ) ja (Y t ) ovat riipumattomat Poisson-prosessit intensiteetteinään λ 1 = 0.3 ja λ 2 = 0.7 Leskelä 2015, Lauseet 9.1 ja 9.9. Yksittäisen pelin bonuskertymä (dollareina) voidaan esittää muodossa ax 1 + by 1, missä a = 3000 ja b = 1000. Koska X 1 on Poi(λ 1 )-jakautunut ja Y 1 on Poi(λ 2 )- jakautunut, kysytty odotusarvo on aex 1 + bey 1 = aλ 1 + bλ 2 = 1600. (b) Mikä on yksittäisen pelin bonuskertymän keskihajonta? Ratkaisu. Koska X 1 ja Y 1 ovat stokastisesti riippumattomat, bonuskertymän varianssi on a 2 Var(X 1 ) + b 2 Var(Y 1 ) = a 2 λ 1 + b 2 λ 2 = 3.4 10 6 ja vastaava keskihajonta on likimain 1843.91. () Millä todennäköisyydellä Teemu tekee 1 maalin ja 2 maaliin johtanutta syöttöä yhdessä pelissä? Ratkaisu. P(X 1 = 1, Y 1 = 2) = P(X 1 = 1)P(Y 1 = 2) = e λ 1 λ1 1 1 e λ 2 λ2 2 2 = 0.027. 1 / 8
5B2 Olkoon X = (X n ) n Z+ Markov-ketju äärellisellä tilajoukolla S ja siirtymätodennäköisyysmatriisilla P = (p x,y ) x,y S. Olkoon ( N(t) ) tästä riippumaton Poisson-prosessi t 0 intensiteetillä λ > 0. Määritellään jatkuva-aikainen prosessi ( Y (t) ) Markov-ketjun t 0 X satunnaisena aikamuunnoksena kaavalla Y (t) = X N(t). (a) Aputulokseksi todista, että Poisson-jakaumaa parametrilla λ noudattavalle satunnaisluvulle M on voimassa estimaatit Ratkaisu. P M 1 λ ja P M 2 λ2 2. i) Poisson-jakaumaa noudattavan satunnaisluvun M pistetodennäköisyysfunktio on PM = i = λi i! e λ, joten PM 1 = 1 PM = 0 = 1 e λ On siis osoitettava, että 1 e λ λ eli että f(λ) := λ 1 + e λ 0 kaikilla λ 0. Nyt f(0) = 0, joten riittää osoittaa, että f on kasvava, mikä puolestaan selviää derivaatan positiivisuudesta: Siis PM 1 λ. ii) Pätee Df(λ) = 1 1 e λ 0 kaikilla λ 0 PM 2 = 1 PM = 0 PM = 1 = 1 e λ λe λ, joten on osoitettava, että f(λ) := λ 2 /2 + (1 + λ)e λ 1 0 kaikilla λ 0. Taas f(0) = 0 ja joten P M 2 λ2 2 Df(λ) = λ + e λ (1 + λ)e λ = λ (1 1e ) 0, λ pätee (kaikilla λ 0). Olkoot sitten x, y S, x y, kaksi eri tilaa. (b) Näytä, että P Y (t) = y Y (0) = x λt. Ratkaisu. Päätellään P Y (t) = y Y (0) = x P N(t) N(0) 1 λt, 2 / 8
sillä Y (t) Y (0) eli X N(t) X N(0) implikoi, että N(t) > N(0). Prosessi N on Poisson-prosessi, joten N(t) N(0) = st Poi(λ(t 0)) = st Poi(λt), jolloin yläraja λt saadaan a-kohdan tuloksesta. () Näytä, että P Y (t) = y Y (0) = x λte λt p x,y 1 2 λ2 t 2. Ratkaisu. Jaetaan tn kahteen termiin P Y (t) = y Y (0) = x = P Y (t) = y & N(t) = 1 Y (0) = x + P Y (t) = y & N(t) 2 Y (0) = x. Huomaa, että N(t) = 0 ei vaikuta, koska y x. Poisson-prosessin ja Markov-ketjun riippumattomuuden perusteella ensimmäinen termi saadaan P Y (t) = y & N(t) = 1 Y (0) = x = P(N(t) = 1)P(X 1 = y X 0 = x) = λte λt p x,y. Näin ollen P Y (t) = y Y (0) = x λte λt p x,y = P Y (t) = y & N(t) 2 Y (0) = x P N(t) 2 Y (0) = x (r-ttomuus) teht. (a)ii = P(N(t) 2) 1 2 λ2 t 2. (d) Päättele aiempien kohtien avulla, että P Y (t) = y Y (0) = x lim t 0 + t = λ p x,y. Ratkaisu. Seuraa suppiloperiaatteesta, sillä -kohdasta saataville majorantille ja minorantille (± vastaavasti) pätee lim t 0 + 1 2 λ2 t 2 ± λte λt p x,y t 1 = lim t 0 + 2 λ2 t ± λe λt p x,y = λ p x,y (e) Selitä, miksi myös kaikille t > 0 pätee P Y (t + s) = y Y (t) = x lim s 0 + s = λ p x,y. Ratkaisu. Tapahtuma {Y (t + s) = y Y (t) = x} = {XN(t+s) = y XN(t) = x} vastaa sitä, että askeleiden lukumäärällä N(t + s) N(t) siirrytään diskreetissä Markov-ketjussa X alkutilasta x tilaan y. Vastaavasti tapahtuma {Y (s) = y Y (0) = x} = {XN(s) = 3 / 8
y XN(0) } vastaa sitä, että askeleiden lukumäärällä N(s) N(0) siirrytään ketjussa X alkutilasta x tilaan y. Poisson-prosessin määritelmän mukaan N(t + s) N(t) ja N(s) N(0) ovat kummatkin Poi(λs)-jakautuneita (ja riippumattomia ketjun X siirtymistä), joten todennäköisyydet P Y (s) = y Y (0) = x ja P Y (t + s) = y Y (t) = x ovat samat. Siten vertailtavat rajat arvot ovat myös samat. (Tässä käytettiin d-kohdan todennäköisyydessä selkeyden vuoksi muuttujan t sijaan muuttujaa s.) Pohdi, mitä ylläolevat laskut kertovat jatkuva-aikaisen prosessin Y = ( Y (t) ) t 0 hetkittäisistä tilajakaumista ν t = ( ν t (y) ) y S, missä ν t(y) = P Y (t) = y. Ratkaisu. Yllä on lasketut derivaatat kuvaavat differentiaalista tn-massan siirtymää kutakin Markov-siirtymäkaavion (suunnistettua) kaarta pitkin, ts. tn-massan vuontiheyttä kullakin Markov-siirtymäkaavion kaarella. Koska kunkin kaavion solmun sisältämän tn-massan derivaatta on vuo sisään miinus vuo ulos, voidaan nyt laskea tn-massan derivaatat. Formaalisti: tutkitaan tn-jakaumaa vaakavektorina ν t =: (ν t (y)) y S ja sen aikaderivaattaa t ν t. Lasketaan ensin ν t+s (y) = x S P(Y (t + s) = y Y (t) = x)ν t (x) = x y P(Y (t + s) = y Y (t) = x)ν t (x) + ( 1 z y P(Y (t + s) = z Y (t) = y) ) ν t (y) Tämä voidaan nyt sijoittaa (oikean) derivaatan määritelmään: + t ν t (y) (määr.) = lim (yltä) = lim s 0 + (e) = ν t+s (y) ν t (y) s 0 + s x y x y P(Y (t + s) = y Y (t) = x)ν t(x) ( ) λp x,y ν t (x) λp y,z ν t (y) z y (lisätään ja vähennetään λp y,y ν t (y)) s ( z y P(Y (t + s) = z Y (t) = y) ) ν t (y) = λp x,y ν t (x) λν t (y) = λ(ν(p I)) y. x S Kiinnostava kysymys on nyt, miten vasen derivaatta t ν t (y) käyttäytyy. Tähän on kaksi tapaa: (1) erillinen tämän tehtävän kaltainen johto (2) Osoittaa, että ν t on jatkuva 4 / 8
t:n suhteen (helppo). Tällöin myös oikea derivaatta + t ν t on y.o. laskun mukaan jatkuva. Yleinen fakta on, että jos jokin funktio on avoimella välillä jatkuva ja oikealta derivoituva ja sen oikea derivaatta on lisäksi jatkuva, niin k.o. funktio on derivoituva (ht). Näin ollen ν t on derivoituva, ja t ν t = λν t (P I). Tämä on diskreetti diffuusioyhtälö. Sen jatkumorajana saadaan fysiikan konvektio diffuusioyhtälö eli Fokker Plank-yhtälö. Saatu yhtälö on lineaarinen, joten ν t riippuu lineaarisesti alkutilasta ν 0. Näin ollen on olemassa aikakehitysmatriisi P t s.e. Y.o. DY voidaan nyt kirjoittaa P t :lle ν t = ν 0 P t. t P t = λp t (P I). Ollaan johdettu ns. Kolmogorovin etuperoinen DY Leskelä 2015, Lause 11.4. Lisäys. (Johdetun DY:n järkevyyden tarkistus sopivalla esimerkillä.) Tutkitaan symmetristä satunnaiskävelyä Z:lla, joka on siis eräänlainen diskreetti hiukkasten diffuusio. Tällöin ν(p I) j = 1 2 ν(j + 1) ν(j) + 1 ν(j 1) 2 on toisen derivaatan diskretisaatio, joten sitä voidaan hyvällä omallatunnolla merkitä Laplae-operaattorina. Näin saadaan t ν t (x) = λ ν t (x). Toisaalta R:n jatkuvaa diffusiota tutkittaessa tiedetään, että hiukkastiheys ν t (x) (ts. yksittäisen diffusoituvan hiukkasen sijainnin tn-tiheys) toteuttaa diffuusioyhtälön t ν t (x) = λ ν t (x), jossa λ on diffusiivisuusvakio. Uskottavalta siis näyttää. 5 / 8
Kotitehtävät 5B3 Vaalimaan raja-asemalle saapuu rekkoja riippumattomin eksponenttijakautunein väliajoin, joiden odotusarvo on 15 min. Saapuvista rekoista kolmasosa ohjataan riippumattomalla satunnaisotannalla tulliin tarkastettavaksi. (a) Millä todennäköisyydellä raja-asemalle ei tunnin aikana saavu yhtään rekkaa? Ratkaisu. Valitaan aikayksiköksi 1 tunti. Tällöin raja-asemalle saapuvien rekkojen laskuriprosessi on Poisson-prosessi intensiteetillä λ = 4 (rekkaa per tunti). (Muistetaan, että tehtävän 5A3 perusteella prosessi, jolla on riippumattomat Exp(λ) -odotusajat on ekvivalentisti Poisson(λ)-prosessi.) Todennäköisyys, että tunnin aikana ei saavu yhtään rekkaa on P(N(1) = 0) = e λ = e 4 = 0.01831564. (b) Millä todennäköisyydellä tullin tarkastukseen saapuu vartin aikana vähintään 2 rekkaa? Ratkaisu. Tullin tarkastukseen saapuvien rekkojen laskuriprosessi N 1 (t) on harvennettu Poisson-prosessi, joka luentomonisteen mukaan on myös Poisson-prosessi Leskelä 2015, Lause 9.9. Harvennetun Poisson-prosessin intensiteetti on λ 1 = λ/3 = 4/3 (rekkaa per tunti). Tn, että vähintään 2 rekkaa saapuu aikavälillä 0, t 0, missä t 0 = 1/4, on yhtä kuin P(N 1 (t 0 ) 2) = 1 P(N 1 (t 0 ) = 0) P(N 1 (t 0 ) = 1) = 1 e λ 1t 0 e λ 1t 0 (λ 1 t 0 ) 1 = 1 e (4/3) 1/4 (4/3) 1/4 ((4/3) 1/4)1 e 1! = 1 e 1/3 e 1/3 (1/3) 1! = 1 0.7165313 0.2388438 = 0.04462492. 5B4 Olkoon n N ja > 0. Olkoot U 1, U 2,..., U n riippumattomia ja välin 0, n tasajakaumaa noudattavia satunnaislukuja. Tarkastellaan välin 0, n satunnaista pistekuviota S = {U 1, U 2,..., U n }. (a) Olkoon (a, b 0, n jokin osaväli. Merkitään N ( (a, b ) ( ) = # S (a, b = # { j Uj (a, b, j n } 6 / 8
pistekuviossa S tälle välille osuvien pisteiden lukumäärää. Laske todennäköisyydet P N ( (a, b ) = k, k = 0, 1,..., n, ja selvitä siten lukumäärän N ( (a, b ) jakauma. Ratkaisu. Voidaan kirjoittaa N((a, b) = n i=1 I(U i (a, b). Satunnaismuuttujat I(U i (a, b), i {1,..., n} ovat keskenään riippumattomia ja Bernoullijakautuneita parametrilla (b a)/n, joten N((a, b) = st Bin(n, (b a)/n). Siten P N ( (a, b ) = k = ( n k ) ( b a n ) k ( 1 b a ) n k n (b) Kiinnitetään väli (a, b ja tarkastellaan mitä tapahtuu, kun parametri n kasvaa. Laske raja-arvo n kohdassa (a) esiintyvistä todennäköisyyksistä. Ratkaisu. Koska n ( ) ( b a n = b a ) ( b a ), kun n, voidaan soveltaa pienten lukujen lakia Leskelä 2015, Lemma 8.6, josta saadaan, että P N ( (a, b ) = k e ( b a b a )k k! kun n, kaikilla k 0. Lisäys. Huomaa, että saatu arvo on sama kuin Poisson-jakauman pistemassa P Poi((b a)/) (k). Vaikuttaisi siis siltä, että kuvailtu satunnainen pistekuvio lähestyisi Poisson-prosessia intensiteetillä 1/. Tämä on myös uskottavaa, kun muistetaan Poisson-prosessin konstruktio tasakoosteisena sirontakuviona. () Olkoot (a 1, b 1 ja (a 2, b 2 erilliset osavälit, a 1 < b 1 a 2 < b 2 n. Laske näille väleille osuvien pisteiden yhteisjakauman todennäköisyydet P N ( (a 1, b 1 ) = k 1 ja N ( (a 2, b 2 ) = k 2. Ratkaisu. Saadaan P N ( (a 1, b 1 ) = k 1 ja N ( (a 2, b 2 ) = k 2. = P N ( (a 1, b 1 ) = k 1 P N ( (a 2, b 2 ) = k 2 N ( (a 1, b 1 ) = k 1 = P N ( (a 1, b 1 ) = k 1 P N ( (a 2, b 2 ) = k 2 {U i } i {1,...n} (a 1, b 1 = {U i } i {1,...,k1 }, Viimeinen askel on intuitiivisesti selvä, ja se voidaan perustella ehdollistamalla sen suhteen, mitkä satunnaismuuttujista U i osuvat välille (a 1, b 1. Ehdolla {U i } i {1,...n} (a 1, b 1 = {U i } i {1,...,k1 } kukin U i, i {k 1 + 1,..., n} on tasajakautunut joukossa 0, n\(a 1, b 1, siis edelleen kyseisellä ehdolla N ( (a 2, b 2 ) = n i=k 1 +1 I(U i (a 2, b 2 ) = st Bin(n k 1, (b 2 a 2 )/(n (b 1 a 1 )). Siis 7 / 8
P N ( (a 1, b 1 ) = k 1 ja N ( (a 2, b 2 ) = k 2 ( ) ( ) k1 ( n b1 a 1 = 1 b ) n k1 1 a 1 k 1 n ( ) ( n k1 k 2 n b 2 a 2 n (b 1 a 1 ) ) k2 ( 1 ) n k1 k b 2 a 2 2 n (b 1 a 1 ) Tässä oletetaan, että k 1, k 2 0 ja k 1 + k 2 n, muuten todennäköisyys on nolla. (d) Kiinnitetään välit (a 1, b 1 ja (a 2, b 2. Laske raja-arvo n kohdassa () esiintyvistä todennäköisyyksistä. Ratkaisu. Taas voidaan hyödyntää pienten lukujen lakia Leskelä 2015, Lemma 8.6, laskemalla edellisen kohdan lausekkeen raja-arvo lausekkeen kummallekin osalle erikseen. Jälkimmäiselle osalle tämä voidaan tehdä, sillä: b 2 a 2 (n k 1 ) n (b 1 a 1 ) = (1 k 1/n)(b 2 a 2 ) (b 1 a 1 )/n b 2 a 2, kun n mikä k 1 :n ollessa vakio on sama kuin raja-arvo kun n k 1 (joka lemmassa lasketaan). Siten P N ( (a 1, b 1 ) = k 1 ja N ( (a 2, b 2 ) = k 2 e b 1 a 1 ( b 1 a 1 ) k 1 k 1! e b 2 a 2 ( b 2 a 2 ) k 2 k 2! kun n. Lisäys. Huomaa, että saatu arvo on sama kuin riipumattomien Poisson-jakaumien yhteispistemassa P Poi((b1 a 1 )/)(k 1 )P Poi((b2 a 2 )/)(k 2 ). Vaikuttaisi siis entistäkin vahvemmin siltä, että kuvailtu satunnainen pistekuvio lähestyisi Poisson-prosessia intensiteetillä 1/., 8 / 8