Galton Watson prosessi

Samankaltaiset tiedostot
HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

Positiivitermisten sarjojen suppeneminen

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

k S P[ X µ kσ] 1 k 2.

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3.1 Kaksiulotteinen satunnaisvektori ja sen jakauma

Injektio (1/3) Funktio f on injektio, joss. f (x 1 ) = f (x 2 ) x 1 = x 2 x 1, x 2 D(f )

Johdatus matemaattiseen päättelyyn

Cantorin joukon suoristuvuus tasossa

30A02000 Tilastotieteen perusteet

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Derivaattaluvut ja Dini derivaatat

Alkulukujen harmoninen sarja

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Diskreetti derivaatta

Ratkaisuehdotus 2. kurssikoe

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

6. laskuharjoitusten vastaukset (viikot 10 11)

Matemaattisen analyysin tukikurssi

Ratkaisuehdotus 2. kurssikokeeseen

Matematiikan tukikurssi, kurssikerta 2

2 Funktion derivaatta

Vaihtoehtoinen tapa määritellä funktioita f : N R on

Tilastomatematiikka Kevät 2008

Matematiikan tukikurssi

Mat Sovellettu todennäköisyyslasku A

Todistusmenetelmiä Miksi pitää todistaa?

Rekursio. Funktio f : N R määritellään yleensä antamalla lauseke funktion arvolle f (n). Vaihtoehtoinen tapa määritellä funktioita f : N R on

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

MATEMATIIKAN KOE, PITKÄ OPPIMÄÄRÄ HYVÄN VASTAUKSEN PIIRTEITÄ

Tenttiin valmentavia harjoituksia

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

DIFFERENTIAALI- JA INTEGRAALILASKENTA I.1. Ritva Hurri-Syrjänen/Syksy 1999/Luennot 6. FUNKTION JATKUVUUS

Analyysi III. Jari Taskinen. 28. syyskuuta Luku 1

Moniulotteisia todennäköisyysjakaumia

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Ensimmäinen induktioperiaate

Kuinka määritellään 2 3?

Ensimmäinen induktioperiaate

0 3 y4 dy = 3 y. 15x 2 ydx = 15. f Y (y) = 5y 4 1{0 y 1}.

x 7 3 4x x 7 4x 3 ( 7 4)x 3 : ( 7 4), 7 4 1,35 < ln x + 1 = ln ln u 2 3u 4 = 0 (u 4)(u + 1) = 0 ei ratkaisua

on Abelin ryhmä kertolaskun suhteen. Tämän joukon alkioiden lukumäärää merkitään

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

1 sup- ja inf-esimerkkejä

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

7. Olemassaolo ja yksikäsitteisyys Galois n kunta GF(q) = F q, jossa on q alkiota, määriteltiin jäännösluokkarenkaaksi

IV. TASAINEN SUPPENEMINEN. f(x) = lim. jokaista ε > 0 ja x A kohti n ε,x N s.e. n n

k=1 b kx k K-kertoimisia polynomeja, P (X)+Q(X) = (a k + b k )X k n+m a i b j X k. i+j=k k=0

4.0.2 Kuinka hyvä ennuste on?

Tehtävä 1. Arvioi mitkä seuraavista väitteistä pitävät paikkansa. Vihje: voit aloittaa kokeilemalla sopivia lukuarvoja.

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

Konvergenssilauseita

Funktiot. funktioita f : A R. Yleensä funktion määrittelyjoukko M f = A on jokin väli, muttei aina.

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Matematiikan johdantokurssi, syksy 2016 Harjoitus 11, ratkaisuista

Johdatus matematiikkaan

Johdatus reaalifunktioihin P, 5op

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä, todistuksia ym., osa I

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä, todistuksia ym., osa I

Toispuoleiset raja-arvot

Sekalaiset tehtävät, 11. syyskuuta 2005, sivu 1 / 13. Tehtäviä

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3.1 Väliarvolause. Funktion kasvaminen ja väheneminen

1 Reaaliset lukujonot

Mitään muita operaatioita symbolille ei ole määritelty! < a kaikilla kokonaisluvuilla a, + a = kaikilla kokonaisluvuilla a.

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Matematiikan tukikurssi, kurssikerta 5

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

MS-A010{3,4} (ELEC*) Differentiaali- ja integraalilaskenta 1 Luento 3: Jatkuvuus

Miten perustella, että joukossa A = {a, b, c} on yhtä monta alkiota kuin joukossa B = {d, e, f }?

Ortogonaaliprojektio äärellisulotteiselle aliavaruudelle

Matemaattisten tieteiden kandiohjelma / MTL Todennäköisyyslaskenta IIb Kurssikoe (kesto 2h 30 min)

Yhdistetty funktio. Älä sekoita arvo- eli kuvajoukkoa maalijoukkoon! (wikipedian ongelma!)

Vastaus 1. Lasketaan joukkojen alkiot, ja todetaan, että niitä on 3 molemmissa.

Reaalilukuvälit, leikkaus ja unioni (1/2)

1 Määrittelyjä ja aputuloksia

Matematiikan tukikurssi

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

1 Kertaus. Lineaarinen optimointitehtävä on muotoa:

= 5! 2 2!3! = = 10. Edelleen tästä joukosta voidaan valita kolme särmää yhteensä = 10! 3 3!7! = = 120

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

Sovellettu todennäköisyyslaskenta B

5 Differentiaalilaskentaa

Luonnollisten lukujen ja kokonaislukujen määritteleminen

Matematiikan tukikurssi

Transkriptio:

Galton Watson prosessi LuK-tutkielma Timo Lintonen 2192796 Matemaattisten tieteiden laitos Oulun yliopisto Kevät 2017

Sisältö Johdanto 2 1 Diskreetit satunnaismuuttujat 2 1.1 Diskreettien satunnaismuuttujien merkintöjä........... 2 1.2 Todennäköisyys generoiva funktio.................. 5 2 Galton Watson prosessin analysointia 8 2.1 Galton Watson prosessin määritelmä................ 8 2.2 Sukupuuton todennäköisyys..................... 9 3 Yhteenveto 13 Lähdeluettelo 15 1

Johdanto Galton Watson prosessi on populaation kehittymisen mallintamiseen luotu matemaattinen malli. Prosessi tunnetaan myös nimellä haarautumisprosessi (branching process). Galton Watson prosessilla on mallinnettu muun muassa bakteerikannan kehitystä ja sukunimen periytymistä. Galton Watson prosessi luo satunnaisen lukujono Z 0, Z 1,..., jossa satunnaismuuttujat Z n kuvaavat populaation kokoa ajanhetkellä n. Galton Watson prosessissa aika on diskreetti ja notaation Z n vakio n viittaakin sukupolven järjestyslukuun. Galton Watson prosessi määritellään tarkasti myöhemmin luvussa 2. Tutkielmassa on käytetty pääasiassa teosta [1]. Tutkielman rakenne noudattaakin tätä teosta luvussa 2. Kuva 1 on mukaelma tässä teoksessa sivulla 146 esiintyvästä kuvasta. Galton Watson prosessi on määritelty määritelmässä 2.1 samalla tavalla kuin teoksessa [1]. Todistukset lauseisiin 1.13, 2.5 ja 2.6 olen suomentanut lähteistä. Alkuperäiset todistukset löytyvät teoksesta [3] lauseelle 1.13 ja teoksesta [2] lauseille 2.5 ja 2.6. 1 Diskreetit satunnaismuuttujat Galton Watson prosessin mallintamiseen tarvitaan diskreetin satunnaismuuttujan käsitettä. Tästä lähtien jokainen tutkielmassa mainittu satunnaismuuttuja on diskreetti, ellei toisin mainita. 1.1 Diskreettien satunnaismuuttujien merkintöjä Olkoon X satunnaismuuttuja. Satunnaismuuttujalla X on arvojoukko X = {x 0, x 1, x 2,...}, missä arvot x i ovat satunnaismuuttujan X mahdollisia arvoja. Arvojoukko voi olla äärellinen tai ääretön. Esimerkiksi arpakuution silmäluku voi saada arvon vain joukosta {1, 2, 3, 4, 5, 6}, mutta jääkiekkoilijan tehopisteiden määrä voi teoriassa saada minkä tahansa arvon joukosta N. Kun satunnaismuuttuja X saa jonkin arvon x i, on kyseessä tapahtuma (X = x i ). Tällaisella tapahtumalla on todennäköisyys, jota merkitään P(X = x i ) = p i. Nämä todennäköisyydet määräävät satunnaismuuttujan pistetodennäköisyysfunktion, joka kuvastaa satunnaismuuttujan jakaumaa. Eräs satunnaismuuttujan jakaumaa kuvaavista suureista on odotusarvo. Se kuvaa tavallaan jakauman "painopistettä". Määritelmä 1.1. Odotusarvo satunnaismuuttujalle X määritellään summana E(X) = x X xp(x = x). Jos satunnaismuuttujia on kaksi, on kyse satunnaismuuttujaparista (X, Y ). Useampiulotteisessa tilanteessa puhutaan satunnaisvektorista (X 0, X 1,..., X n ). Tapahtumat (X = x) ja (Y = y) voivat vaikuttaa toisiinsa tavalla tai toisella. Tätä yhteisvaikutusta voidaan kuvata määrittelemällä käsitteet ehdollinen todennäköisyys ja riippumattomuus. 2

Määritelmä 1.2. Satunnaismuuttujan Y ehdollinen todennäköisyys ehdolla X = x on P(Y = y X = x) P(Y = y X = x) =, P(X = x) kun P(X = x) 0. Jos P(X = x) = 0, niin sopimuksen perusteella ehdollinen todennäköisyys saa arvon 0. Huomautus 1.3. Määritelmästä 1.2 seuraa suoraan kokonaistodennäköisyyden kaava P(X = x)p(y = y X = x) = P(Y = y X = x). Määritelmä 1.4. Satunnaismuuttujat X ja Y ovat toisistaan riippumattomia jos ja vain jos P(X = x Y = y) = P(X = x)p(y = y) kaikilla x X ja y Y. Näistä määritelmistä on helppo huomata, että riippumattomien satunnaismuuttujien tapauksessa P(Y = y X = x) = P(Y = y) kaikilla x X. Satunnaismuuttujan X saama arvo ei siis vaikuta satunnaismuuttujan Y saamaan arvoon. Määritellään seuraavissa määritelmissä vielä kaksi ehdollisiin jakaumiin liittyvää käsitettä. Määritelmä 1.5. Satunnaismuuttujan Y ehdollinen odotusarvo ehdolla X = x on E(Y X = x) = y Y yp(y = y X = x). Määritelmä 1.6. Satunnaismuuttujan Y marginaalijakauma on P(Y = y) = P(Y = y X = x). x X Seuraava lause pätee yleisesti kahden satunnaismuuttujan välillä. Lauseen voi yleistää myös moniulotteiseen tapaukseen. Todistetaan tässä diskreetin satunnaismuuttujaparin tapaus, sillä sitä tarvitaan Galton Watson prosessin analysoinnissa. Lause 1.7 (Iteroitu odotusarvo). Satunnaismuuttujien X ja Y iteroitu odotusarvo on E(Y ) = E(E(Y X)). Todistus. Marginaalijakauman määritelmän 1.6 nojalla odotusarvo E(Y ) voidaan saattaa muotoon E(Y ) = yp(y = y) = y P(Y = y X = x). (1) y Y y Y Kun satunnaismuuttujaparin todennäköisyyteen P(Y = y X = x) sovelletaan kokonaistodennäköisyyden kaavaa 1.3, niin y P(Y = y X = x) = y P(Y = y X = x)p(x = x). (2) y Y x X y Y x X x X Järjestämällä summan termit uudelleen, saamme y P(Y = y X = x)p(x = x) = yp(y = y X = x)p(x = x). y Y x X x X y Y (3) 3

Huomaamme, että yhtälössä (3) esiintyy satunnaismuuttujan Y ehdollinen odotusarvo. Siten määritelmän 1.5 nojalla yp(y = y X = x)p(x = x) = E(Y X = x)p(x = x) x X y Y x X (4) = E(E(Y X)). Näin ollen yhtälöiden (1), (2), (3) ja (4) nojalla E(Y ) = E(E(Y X)). Lauseessa 1.13 tarvitsemme vielä keinon laskea riippumattoman satunnaismuuttujaparin tulon odotusarvon. Seuraava lemma 1.8 ei vielä oleta riippumattomuutta, mutta lauseessa 1.9 todistamme, että E(XY ) = E(X)E(Y ), kun satunnaismuuttujat X ja Y ovat toisistaan riippumattomia. Lemma 1.8. E(XY ) = x X y Y xyp(x = x Y = y). Todistus. Olkoot x X ja y Y satunnaismuuttujien X ja Y arvojoukot. Merkitään Z := XY ja olkoon tämän satunnaismuuttujan arvojoukko Z = {z 0,..., z n } = {z N z = xy}. Tällöin kaikilla i = 0,..., n muuttuja z i voidaan esittää joukkojen X ja Y alkioiden tulona siten, että z i = x 1 i y1 i =... = xki i yki i, missä (x j i, yj i ) (xl i, yl i ) kaikilla j l ja k i 1. Kun z määritellään tällä tavalla, käydään läpi kaikki joukkojen X ja Y alkiot. Tapahtuman (Z = z i ) todennäköisyys voidaan nyt laskea siten, että P(Z = z i ) = P(X = x 1 i Y = y1 i ) +... + P(X = xki i Y = y ki i ). Lasketaan odotusarvo E(XY ). E(XY ) = E(Z) = = = n i=0 n z i P(Z = z i ) i=0 z i [P(X = x 1 i Y = y 1 i ) +... + P(X = x ki i n [x 1 i yi 1 P(X = x 1 i Y = yi 1 ) +... + x ki i=0 = x X y Y xyp(x = x Y = y) i yki i Y = y ki i )] P(X = xki i Y = y ki i )] Lause 1.9. Olkoot satunnaismuuttujat X ja Y riippumattomia. Tällöin niiden tulon odotusarvo on E(XY ) = E(X)E(Y ). Todistus. Lemman 1.8 nojalla odotusarvo E(XY ) voidaan laskea satunnaismuuttujien X ja Y yhteisjakauman avulla. Riippumattomuuden määritelmän 4

1.4 nojalla yhteisjakauman arvot saadaan marginaalijakaumien tulona siten, että P(X = x Y = y) = P(X = x)p(y = y). Siten E(XY ) = xyp(x = x Y = y) = xyp(x = x)p(y = y). (5) x X y Y x X y Y Järjestelemällä summien termit uudelleen, huomaamme, että kyseessä on kahden satunnaismuuttujan odotusarvojen tulo. xyp(x = x)p(y = y) = xp(x = x) yp(y = y) = E(X)E(Y ) x X y Y x X y Y (6) Yhtälöiden (5) ja (6) nojalla riippumattomien satunnaismuuttujien tulon odotusarvo on odotusarvojen tulo E(XY ) = E(X)E(Y ). Tämä tulos on helppo yleistää satunnaisvektorille. Kun merkitsemme satunnaismuuttujaa S := XY ja satunnaismuuttuja Z on riippumaton satunnaismuuttujista X ja Y, niin Z on riippumaton myös satunnaismuuttujasta S. Siten E(XY Z) = E(SZ) = E(S)E(Z) = E(XY )E(Z) = E(X)E(Y )E(Z). 1.2 Todennäköisyys generoiva funktio Todennäköisyys generoiva funktio on erityistapaus generoivista funktioista. Todennäköisyys generoiva funktio on diskreetin satunnaismuuttujan tapauksessa pistetodennäköisyysfunktion muunnos. Se voidaan määritellä diskreeteille satunnaismuuttujille, joiden arvojoukko on luonnollisten lukujen joukon N osajoukko. Todennäköisyys generoiva funktio voidaan määritellä muissakin tilanteissa, mutta Galton Watson prosessin analyysiin tällainen ehto on riittävä prosessin luonteen vuoksi. Todennäköisyys generoiva funktio on hyödyllinen momenttien ja riippumattomien satunnaismuuttujien summien jakaumia laskettaessa. Molemmat sovelluskohteet ilmenevät Galton Watson prosessin analyysissä. Ensimmäinen momentti, eli odotusarvo, on prosessissa tärkeä syntyvyyden tunnusluku. Mielivaltaisen sukupolven koko taas on satunnaismuuttuja, joka on edellisen sukupolven jälkeläisten summa. Määritelmä 1.10. Satunnaismuuttujan X todennäköisyys generoiva funktio on G(t) = E(t X ). Odotusarvon määritelmän 1.1 mukaan todennäköisyys generoiva funktio voidaan esittää muodossa G(t) = k=0 p kt k, missä lyhennysmerkintä p k tarkoittaa todennäköisyyttä P(X = x k ). Jos satunnaismuuttujan arvojoukko on luonnollisten lukujen aito osajoukko {x 0,..., x n }, niin edellinen lauseke voidaan tulkita siten, että P(X = x i ) = 0, kun x i N, mutta x i / {x 0,..., x n }. Näin tulkittuna lauseke on mielekäs myös tässä tapauksessa. Todennäköisyys generoiva funktio on määritelty ainakin välillä [0, 1]. Pistetodennäköisyysfunktion arvoina arvoille p k pätee, että niiden summa k=0 p k = 1. Arvoilla t k on yläraja t k 1, kun t 1 ja k N. Tämän perusteella voimme 5

arvioida funktiota G ylöspäin siten, että G(t) 1 k=0 p k = 1, kun t [0, 1]. Näin ollen tällä välillä arvo G(t) on olemassa ja se on äärellinen. Osoitetaan seuraavassa lemmassa muutama Galton Watson prosessin kannalta hyödyllinen todennäköisyys generoivan funktion ominaisuus. Lemma 1.11. Oletetaan, että p 0 +p 1 < 1. Toisin sanoen todennäköisyys P(X > 1) > 0. Tällöin i) G(t) on aidosti kasvava ainakin välillä [0, 1] ii) G(t) on aidosti konveksi, eli G (t) on aidosti kasvava, ainakin välillä [0, 1] iii) G(0) = p 0. Todistus. Aiemmin osoitettiin, että G(t) on määritelty välillä [0, 1]. Lisäksi G on ääretönasteisena polynomifunktiona jatkuva ja äärettömän monta kertaa differentioituva määrittelyjoukossaan. i) Ensimmäisen asteen derivaatta on määritelty joukossa (0, 1). Ehdon p 0 + p 1 < 1 nojalla p k > 0 ainakin jollain k = 1, 2,.... Näin ollen G (t) = p k kt k 1 > 0, k=1 kun t (0, 1). Funktio G on siten aidosti kasvava joukossa [0, 1]. ii) Vastaavasti toisen asteen derivaatta on myös määritelty joukossa (0, 1) ja ehdon p 0 + p 1 < 1 nojalla p k > 0 ainakin jollain k = 2, 3,.... Siten G (t) = p k k(k 1)t k 2 > 0, k=2 kun t (0, 1). Funktio G on aidosti konveksi joukossa [0, 1]. iii) Viimeisen kohdan osoittamiseen tarvitaan sopimukseen perustuva tulkinta 0 0 = 1. Tällöin G(0) = p 0 0 0 + p 1 0 1 + p 2 0 2 +... = p 0. Huomautus 1.12. Lemmassa 1.11 laskettiin todennäköisyys generoivan funktion ensimmäinen derivaatta. Sen avulla voidaan laskea satunnaismuuttujan odotusarvo. Oletetaan, että G(t) on satunnaismuuttujan X todennäköisyys generoiva funktio. G (1) = p k k1 k 1 = 0p 0 + p k k = kp k = E(X) k=1 Tässä merkintä G (1) tarkoittaa vasemmanpuoleista raja-arvoa lim t 1 G (t). k=1 k=0 6

Edellisessä huomautuksessa 1.12 löydettiin keino satunnaismuuttujan ensimmäisen momentin, eli odotusarvon, laskemiselle hyödyntäen todennäköisyys generoivaa funktiota. Toinen tärkeä todennäköisyys generoivan funktion sovellus on aiemmin mainittu satunnaismuuttujien summan analysointi. Todistetaan seuraavaksi lause, jonka avulla voimme laskea todennäköisyys generoivan funktion satunnaismuuttujalle, joka on satunnaisen monen samoinjakautuneen ja toisistaan riippumattoman satunnaismuuttujan summa. Lause 1.13. Olkoot satunnaismuuttujat X 1, X 2,... samoinjakautuneita ja toisistaan riippumattomia, ja olkoon niillä yhteinen todennäköisyys generoiva funktio G X. Olkoon N näistä satunnaismuuttujista X i riippumaton satunnaismuuttuja arvojoukolla N ja olkoon sillä todennäköisyys generoiva funktio G N. Olkoon satunnaismuuttuja Y satunnaismuuttujien X i summa siten, että Y = N i=1 X i. Tällöin satunnaismuuttujalla Y on todennäköisyys generoiva funktio G Y (t) = G N (G X (t)). Todistus. Iteroidun odotusarvon 1.7 ja odotusarvon määritelmän 1.1 nojalla G Y (t) = E(t Y ) = E(E(t Y N)) = E(t Y N = n)p(n = n). (7) Tapahtuma (Y = y N = n) on yhtäpitävä tapahtuman ( n i=1 X i = y) kanssa kaikilla y Y ja n N satunnaismuuttujan Y määritelmän perusteella, joten myös muunnokselle t Y pätee, että n=0 E(t Y N = n)p(n = n) = E(t n i=1 Xi )P(N = n) n=0 = n=0 n E( t Xi )P(N = n). n=0 i=1 (8) Yhtälössä (8) tulon odotusarvo voidaan laskea lauseen 1.9 avulla, sillä satunnaismuuttujat X i ovat toisistaan riippumattomia kaikilla i = 1, 2,... ja sen perusteella myös muunnokset t Xi ovat toisistaan riippumattomia kaikilla i = 1, 2,.... Siten saadaan yhtälö n n E( t Xi )P(N = n) = E(t Xi )P(N = n). (9) n=0 i=1 n=0 i=1 Kaikilla i = 1, 2,... satunnaismuuttujalla X i on yhteinen todennäköisyys generoiva funktio G X (t). Siten kaikilla i = 1, 2,... pätee määritelmä 1.10, eli E(t Xi ) = G X (t). n E(t Xi )P(N = n) = G X (t) n P(N = n) (10) n=0 i=1 n=0 7

Yhtälön (10) oikeassa puolessa esiintyy satunnaismuuttujan N muunnoksen G X (t) N odotusarvo. Tästä seuraa, että G X (t) n P(N = n) = E(G X (t) N ) = G N (G X (t)). (11) n=0 Yhtälöiden (7),..., (11) perusteella G Y (t) = G N (G X (t)). Tässä vaiheessa olemme käyneet läpi kaikki tärkeimmät diskreettien satunnaismuuttujien ominaisuudet, joita tarvitsemme tässä tutkielmassa Galton Watson prosessin analysointiin. Seuraavassa luvussa 2 keskitymme varsinaiseen Galton Watson prosessiin. Hyödynnämme Galton Watson prosessin analyysissä tähän mennessä tässä tutkielmassa johdettuja diskreettien satunnaismuuttujien tuloksia. 2 Galton Watson prosessin analysointia 2.1 Galton Watson prosessin määritelmä Galton Watson prosessi generoi satunnaisen lukujonon Z 0, Z 1,..., kuten johdannossa todettiin. Tämä lukujono kuvaa mallinnettavan populaation kehitystä. Sovitaan seuraavaksi käytettävistä merkinnöistä. Satunnaismuuttuja Z n kuvaa järjestysluvultaan n:nnännen sukupolven kokoa. Sukupolven n yksilöihin viitataan muuttujalla i. Yksilölle i syntyy k kappaletta jälkeläisiä todennäköisyydellä p k. Satunnaismuuttuja L kuvaa syntyvyyttä ja sen arvojoukko on luonnollisten lukujen joukko N. Satunnaismuuttuja L on siis diskreetti satunnaismuuttuja ja sen pistetodennäköisyysfunktio määritellään todennäköisyyksien P(L = k) = p k avulla siten, että f(k) = p k, missä k N., missä i N + = {1, 2,...} ja n N, satunnaismuuttujan L kopioita. Satunnaismuuttuja L (n) i kuvaa sukupolven n yksilölle i syntyvien jälkeläisten lukumäärää. Tehdään oletus, että yksittäiselle yksilölle syntyvien jälkeläisten lukumäärä ei riipu muille yksilöille syntyvien jälkeläisten lukumäärästä. Lisäksi oletetaan, että tämä riippumattomuus on voimassa niin kyseisen kuin minkä tahansa sukupolven yksilöiden välillä. 1 Oletuksen nojalla Olkoot satunnaismuuttujat L (n) i voimme todeta, että satunnaismuuttujat L (n) kaikilla i N + ja n N. Näin ollen L (n) i i iid ovat toisistaan riippumattomia L kaikilla i N+ ja n N. Määritellään seuraavaksi Galton Watson prosessi sovittuja merkintöjä käyttäen. Määritelmä 2.1. Galton Watson prosessi on sellainen prosessi, joka generoi satunnaisen lukujonon Z 0, Z 1,... rekursiivisesti siten, että i) Z 0 1 1 Tämä on tietysti epärealistinen oletus. Todellisuudessa syntyvyys lähtee laskuun, kun populaation yksilöiden lukumäärä lähestyy ekosysteemin kantokykyä. Tämä oletus ei kuitenkaan ole liian rajoittava, jos olemme kiinnostuneita lähinnä sukupuuton todennäköisyydestä. 8

ii) Z n+1 = Z n i=1 L(n) i, missä i N + ja n N. Avataan määritelmä 2.1 ensin sanallisesti ja sitten vielä esimerkin avulla. Määritelmän 2.1 mukaan populaation koko alussa on identtisesti yksi. Sukupolven 0 koko on siis aina Z 0 = 1. Seuraavan sukupolven 1 koko on edellisen sukupolven ainoalle yksilölle syntyvien jälkeläisten määrä Z 1 = Z 0 i=1 L(0) i = L (0) 1. Edelleen seuraavan sukupolven 2 koko on sukupolven 1 kaikkien yksilöiden jälkeläisten lukumäärien summa Z 2 = Z 1 i=1 L(1) i. Näin prosessi jatkuu äärettömästi tai kunnes prosessi kuolee sukupuuttoon. Määritellään sukupuuton tapahtuma seuraavassa esimerkissä 2.2. Esimerkki 2.2. Olkoot Z 0 1 ja L satunnaismuuttuja, joka on jakautunut pistetodennäköisyysfunktiolla f. Olkoot edelleen satunnaismuuttujan L arvojoukko N ja L (n) iid i L kaikilla i N+ ja n N. Tarkastellaan tilannetta Galton Watson prosessina, joka etenee kuvan 1 mukaisesti. Nollannen sukupolven koko Z 0 on identtisesti 1. Kuvasta 1 näemme, että tälle nollannen sukupolven yksilölle syntyy kaksi jälkeläistä, eli L (0) 1 = 2. Viitataan näihin jälkeläisiin myöhemmin luvuilla 1 ja 2. Nyt voimme laskea ensimmäisen sukupolven koon Z 1 määritelmän 2.1 mukaisesti, joka on Z 1 = L (0) 1 = 2. Edelleen kuvasta 1 näemme, että ensimmäisen sukupolven yksilölle 1 syntyy kaksi jälkeläistä ja yksilölle 2 yksi jälkeläinen. Siten vastaavat satunnaismuuttujat saavat arvot L (1) 1 = 2 ja L (1) 2 = 1. Sukupolven 2 kooksi saamme Z 2 = L (1) 1 + L (1) 2 = 2 + 1 = 3. Tässä lausekkeessa laskemme yhteen kaksi termiä, sillä edellisen sukupolven koko on Z 1 = 2. Tämä prosessi joko jatkuu äärettömään tai kunnes saavutetaan tapahtuma Z n = 0 jonkin sukupolven n kohdalla, missä tietysti n > 0. Siinä tapauksessa myös seuraavien sukupolvien koko on 0. Tällaista tapahtumaa kutsutaan sukupuutoksi. Kuvasta 1 näemme, että haara L (2) 1 = 0, eli kyseinen haara kuoli sukupuuttoon. 2.2 Sukupuuton todennäköisyys Esimerkissä 2.2 sukupuutto määriteltiin siten, että se tapahtuu, kun Z n = 0 jollain n N +. Tällöin on kiinnostavaa, millä todennäköisyydellä sukupuutto tapahtuu, eli mikä on todennäköisyys q = P( sukupuutto ). Sukupuuton kannalta ratkaisevaa on, eroaako populaation koko nollasta kaikissa sukupolvissa. Lause 2.3. Sukupuuton todennäköisyys on q = lim n P(Z n = 0). Todistus. Galton Watson prosessin luonteen vuoksi määritelmän 2.1 nojalla, jos jonkin sukupolven n kohdalla populaation koko on 0, niin populaation koko on 0 myös kaikkien tulevien sukupolvien kohdalla. Tapahtumasta (Z n = 0) seuraa väistämättä tapahtuma (Z n+1 = 0), eli P(Z n+1 = 0 Z n = 0) = 1. Tapahtumat (Z n = 0) ja (Z n+1 = 0) ovat siis sisäkkäisiä siten, että (Z n = 0) (Z n+1 = 0) ja niiden yhdiste on (Z n = 0) (Z n+1 = 0) = (Z n+1 = 0). Nämä tulokset pätevät 9

Yksilöt 0 1 2 3 Sukupolvi Z Kuva 1: Esimerkki Galton Watson prosessin etenemisestä kaikilla n N +. Näiden tulosten avulla sukupuuton todennäköisyys voidaan laskea raja-arvona siten, että ( ) q = P( sukupuutto ) = P( (Z 1 = 0) tai (Z 2 = 0) tai... ) = P (Z i = 0) = lim n P(Z n = 0). i=1 Galton Watson prosessin määritelmän 2.1 nojalla mielivaltaisen sukupolven koko on summa satunnaismuuttujista L (n) i nollatta sukupolvea lukuunottamatta. Edelleen ensimmäistä sukupolvea lukuunottamatta satunnaismuuttujien L (n) i lukumäärä on edellisen sukupolven koko, eli sekin on satunnaismuuttuja. Lähdetään tästä syystä tarkastelemaan sukupuuton todennäköisyyden ongelmaa todennäköisyys generoivan funktion avulla. Oletetaan tästä eteenpäin, että p 0 + p 1 < 1. Tämä oletus tehdään siitä syystä, että Galton Watson prosessin kulku on triviaali, jos p 0 + p 1 = 1. Tässä tapauksessa P(L 2) = 0, eli jokaisen sukupolven yksilöille syntyy vain yksi tai ei yhtään jälkeläistä. Tällöin prosessi etenee siten, että jokaisen sukupolven kohdalla sukupolven koko on Z n = 1, kunnes prosessi kuolee sukupuuttoon jonkin sukupolven kohdalla m, missä m > n ja Z m = 0. Sukupuuton todennäköisyys on tällöin 1, jos p 0 1. 10

Toisaalta oletetaan myös, että p 0 1. Tällöin jokaiselle yksilölle syntyy ainakin yksi jälkeläinen, eli Z n Z n+1. Koska määritelmän 2.1 nojalla Z 0 = 1, niin Z n > 0 kaikilla n N, eli sukupuuton todennäköisyys on silloin 0. Seuraava lause 2.4 osoittaa, miten mielivaltaisen sukupolven koon Z n todennäköisyys generoiva funktio voidaan ilmaista yhdistettyjen funktioiden avulla. Käytetään tästä lähtien merkintää G n (t) = (G G)(t). Funktio G n on siis }{{} n kpl yhdistetty funktio n:stä kappaleesta funktioita G. Osoittautuu, että tämä on itse asiassa satunnaismuuttujan Z n todennäköisyys generoiva funktio. Lause 2.4. Mielivaltaisen sukupolven n, missä n N +, kohdalla populaation koon Z n todennäköisyys generoiva funktio on G n (t). Todistus. Olkoot satunnaismuuttujien Z n ja Z n 1 todennäköisyys generoivat funktiot H ja F Zn 1. Galton Watson prosessin määritelmän 2.1 mukaan Z n = Zn 1 i=1 L (n 1) i, eli satunnaismuuttuja Z n on summa Z n 1 :stä kappaleesta sa-. Lisäksi L (n 1) iid (n 1) i L, joten satunnaismuuttujat L i tunnaismuuttujia L (n 1) i ovat samoin jakautuneita ja toisistaan riippumattomia kaikilla i N +. Lisäksi niillä on yhteinen todennäköisyys generoiva funktio G(t). Siten lauseen 1.13 nojalla H(t) = F Zn 1 (G(t)) = (F Zn 1 G)(t). (12) Galton Watson prosessin rekursiivisen luonteen vuoksi satunnaismuuttujalle Z n 2 pätee vastaavanlainen yhtälö F Zn 1 (t) = F Zn 2 (G(t)) = (F Zn 2 G)(t). (13) Yhdistämällä yhtälöt (12) ja (13) saamme tuloksen H(t) = (F Zn 2 G G)(t). (14) Iteroimalla tätä tulosta (14) päädymme rekursiivisuuden nojalla yhtälöön H(t) = (F Z1 G } {{ G } )(t). (15) n 1 Tässä F Z1 on todennäköisyys generoiva funktio sukupolven 1 koolle Z 1 ja se on helppo ratkaista, sillä Z 1 = Z 0 i=1 L(0) i = 1 i=1 L(0) i = L (0) 1. Siten F Z 1 = E(t Z1 ) = E(t L(0) 1 ) = E(t L ) = G(t). Tämän nojalla yhtälöstä (15) seuraa, että E(t Zn ) = H(t) = (G } {{ G } )(t) = G n (t). n Seuraus 2.5. Sukupuuton todennäköisyys voidaan ilmaista myös populaation koon todennäköisyys generoivan funktion avulla siten, että q = lim n G n (0). 11

Todistus. Todennäköisyys generoivan funktion ominaisuuksiin 1.11 perustuen G(0) = p 0. Edellisen lauseen 2.4 perusteella n:nännen sukupolven koon Z n todennäköisyys generoiva funktio on G n (t). Näin päädymme yhtälöön P(Z n = 0) = G n (0). (16) Kun yhtälön (16) molemmilla puolilla muuttujan n annetaan lähestyä ääretöntä, saamme sukupuuton todennäköisyydelle tuloksen q = lim n P(Z n = 0) = lim n G n (0). Seuraavaksi todistamme lemman, joka yhdistää sukupuuton todennäköisyyden q syntyvyyden L todennäköisyys generoivaan funktioon G. Lemma 2.6. Todennäköisyys q on pienin positiivinen juuri yhtälölle G(t) = t. Todistus. Lemman todistus on kaksivaiheinen. Ensin todistetaan, että q on yhtälön G(t) = t juuri, ja sitten, että q on pienin positiivinen juuri. Seurauksen 2.5 nojalla funktion G arvo pisteessä q on G(q) = G( lim n G n(0)). (17) Lemmassa 1.11 osoitettiin, että funktio G on jatkuva ainakin välillä [0, 1]. Todennäköisyytenä q saa arvoja vain väliltä [0, 1]. Näin ollen raja-arvolle pätee, että G( lim G n(0)) = lim G(G n(0)) = lim G n+1(0) = q. (18) n n n Yhtälöiden (17) ja (18) perusteella q on yhtälön G(t) = t juuri välillä [0, 1]. Todistetaan seuraavaksi, että q on myös pienin positiivinen juuri. Olkoon s 0 mielivaltainen yhtälön G(t) = t juuri. Yhtälön G(t) = t juurena s on juuri myös yhtälölle G 2 (t) = t, sillä G 2 (s) = G(G(s)) = G(s) = s. Induktiolla voidaan helposti osoittaa, että G n (s) = s kaikilla n N +. Lemmassa 1.11 osoitettiin myös, että funktio G on aidosti kasvava ainakin välillä [0, 1]. Siten G n (0) G n (s) = s. (19) Otetaan epäyhtälöstä (19) molemmin puolin raja-arvo äärettömyydessä n:n suhteen. Tällöin saadaan epäyhtälö lim G n(0) lim s. (20) n n Epäyhtälössä (20) vasemmalla puolella on todennäköisyys q. Juuri s puolestaan ei riipu muuttujasta n, joten q s. Näin ollen q on pienin positiivinen juuri yhtälölle G(t) = t. Seuraava lause on tutkielman keskeisin tulos. Se osoittaa, millä ehdolla Galton Watson prosessi kuolee sukupuuttoon todennäköisyydellä 1. Kääntäen se kertoo, poikkeaako sukupuuton todennäköisyys arvosta 1 tutkittavalla keskimääräisen syntyvyyden arvolla E(L). 12

Lause 2.7. Olkoon p 0 + p 1 < 1. Tällöin Galton Watson prosessi kuolee sukupuuttoon todennäköisyydellä q = 1 jos ja vain jos odotusarvo E(L) on pienempi kuin yksi. Todistus. Määritellään funktio φ siten, että φ(t) = G(t) t. Funktio φ on määritelty ainakin välillä t [0, 1], sillä funktio G on määritelty ainakin tällä välillä lemman 1.11 mukaan. Lisäksi funktio φ on jatkuva välillä t [0, 1] ja derivoituva välillä t (0, 1) funktion G jatkuvuuden ja derivoituvuuden perusteella. Funktiolla φ on nollakohta pisteessä 1, sillä φ(1) = G(1) 1 = 1 1 = 0, missä G(1) = 1 todennäköisyys generoivan funktion määritelmän 1.10 nojalla. Olkoon q = 1. Tällöin lemman 2.6 nojalla yhtälöllä G(t) = t ei ole juuria välillä t [0, 1). Siten funktiolla φ ei ole nollakohtia välillä t [0, 1). Toisaalta φ(0) = G(0) 0 = p 0 > 0. Näin ollen φ(t) = G(t) t > 0, kun t [0, 1). Tästä seuraa, että G(t) > t, kun t [0, 1). Lasketaan seuraavaksi, mitä on G (1). Tämä merkintä tarkoittaa tässä yhteydessä tietysti vasemmanpuoleista derivaattaa. Oletetaan siis, että t [0, 1). Tuloksen G(t) > t nojalla G(t) G(1) = G(t) 1 > t 1. Kun tämä epäyhtälö jaetaan puolittain luvulla t 1, joka on pienempi kuin nolla, päädytään epäyhtälöön G(t) G(1) t 1 < t 1 t 1 = 1. Kun tästä epäyhtälöstä otetaan molemmin puolin raja-arvo vasemmalta pisteessä t 0 = 1, niin saamme todennäköisyys generoivan funktion derivaatalle ylärajan G(t) G(1) lim = G (1) < lim t 1 t 1 1 = 1 t 1 pisteessä t 0 = 1. Näin ollen, koska G (1) = E(L), niin E(L) < 1. Olkoon seuraavaksi E(L) < 1. Kun laskemme funktion φ derivaatan muuttujan t suhteen, saamme funktion φ (t) = G (t) 1. Funktio φ on määritelty ainakin välillä t (0, 1). Lemman 1.11 nojalla funktio G (t) on aidosti kasvava välillä t (0, 1), joten G (t) < G (1) = E(L) < 1. Näin ollen φ (t) = G (t) 1 < 0, eli funktio φ(t) on aidosti laskeva ja jatkuva välillä t (0, 1). Koska φ(0) > 0 ja φ(1) = 0, niin φ(t) > 0 välillä t (0, 1). Tämän perusteella G(t) > t, eli G(t) t, kun t [0, 1). Näin ollen yhtälön G(t) = t pienin positiivinen juuri on q = 1, eli sukupuuton todennäköisyys on q = 1 lemman 2.6 nojalla. 3 Yhteenveto Lauseessa 2.7 päädyttiin tulokseen, että ei-triviaaleissa tapauksissa Galton Watson prosessi kuolee varmasti sukupuuttoon, kun populaation yksilöille syntyy keskinmäärin vähemmän kuin yksi jälkeläinen yksilöä kohden. Vastaavasti tässä lauseessa osoitettiin myös käänteinen tilanne: jos prosessi kuolee sukupuuttoon todennäköisyydellä yksi, ei keskimääräinen syntyvyys voi ylittää yhtä jälkeläistä yksilöä kohden. 13

Galton Watson prosessin teoria toimii lähtökohtana monelle muulle haarautumisprosessille. Näistä esimerkkeinä toimivat Yulen prosessi, biseksuaalinen Galton Watson prosessi ja ikäriippuvainen haarautumisprosessi. Yulen prosessissa aikaa käsitellään diskreettinä muuttujana. Jälkeläisten saamisen asemesta puhutaan fissiosta, joka tapahtuu satunnaisena ajanhetkenä. Tällä tavalla Yulen prosessi onkin Galton Watson prosessia tarkempi malli muun muassa atomin ydinten hajoamiselle. Biseksuaalisessa Galton Watson prosessissa jälkeläisten saaminen edellyttää kahta eri sukupuolta olevaa yksilöä. Tässä prosessissa jälkeläisten saaminen muistuttaa enemmän muun muassa nisäkkäiden tapaa lisääntyä. Ikäriippuvaisessa haarautumisprosessissa taas Galton Watson prosessin mallia laajennetaan antamalla oma muuttuja yksilön iälle. Tällöin populaation yksilöt voivat kuolla vanhuuteen. 14

Lähdeluettelo [1] R. Lyons & Y. Peres: Probability on Trees and Networks. Cambridge University Press, New York, 2016. [2] S. Lalley: Branching Processes [pdf-tiedosto]. Noudettu osoitteesta http://galton.uchicago.edu/ lalley/courses/312/branching.pdf, 2016. [3] G. Grimmett & D. Stirzaker: Probability and Random Processes. Oxford University Press Inc., New York, 2001. 15