Satunnaismuuttujat ja jakaumat

Samankaltaiset tiedostot
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Stokastiikka ja tilastollinen ajattelu

Stokastiikka ja tilastollinen ajattelu

Stokastiikka ja tilastollinen ajattelu

Satunnaismuuttujan odotusarvo ja laskusäännöt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Stokastiikka ja tilastollinen ajattelu

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset

Satunnaismuuttujan odotusarvo ja laskusäännöt

Keskihajonta ja korrelaatio

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Satunnaismuuttujien summa ja keskiarvo

Sovellettu todennäköisyyslaskenta B

Todennäköisyyden käsite ja laskusäännöt

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien muunnokset ja niiden jakaumat

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Poisson-prosessien ominaisuuksia ja esimerkkilaskuja

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

Mat Sovellettu todennäköisyyslasku A

30A02000 Tilastotieteen perusteet

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jatkuvat satunnaismuuttujat

V ar(m n ) = V ar(x i ).

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Johdatus tn-laskentaan perjantai

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Tilastomatematiikka Kevät 2008

Satunnaisluvut, satunnaisvektorit ja niiden jakaumat

Harjoitus 2: Matlab - Statistical Toolbox

Satunnaismuuttujien summa ja keskiarvo

Moniulotteiset satunnaismuuttujat ja jakaumat

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Todennäköisyyden käsite ja laskusäännöt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Bayesläiset tilastolliset mallit

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

1. laskuharjoituskierros, vko 4, ratkaisut

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Moniulotteisia todennäköisyysjakaumia

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Satunnaisluvut, satunnaisvektorit ja niiden jakaumat

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

(x, y) 2. heiton tulos y

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin (2008) 1/5

Todennäköisyyslaskun kertaus. Heliövaara 1

Varma tapahtuma, Yhdiste, Yhdistetty tapahtuma, Yhteenlaskusääntö

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Poisson-prosessien ominaisuuksia ja esimerkkilaskuja

Sovellettu todennäköisyyslaskenta B

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

k S P[ X µ kσ] 1 k 2.

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Talousmatematiikan perusteet: Luento 17. Integraalin sovelluksia kassavirta-analyysissa Integraalin sovelluksia todennäköisyyslaskennassa

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

4. laskuharjoituskierros, vko 7, ratkaisut

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Satunnaismuuttujat ja todennäköisyysjakaumat

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

4.0.2 Kuinka hyvä ennuste on?

Tehtävä 1. Arvioi mitkä seuraavista väitteistä pitävät paikkansa. Vihje: voit aloittaa kokeilemalla sopivia lukuarvoja.

3. laskuharjoituskierros, vko 6, ratkaisut

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

0 3 y4 dy = 3 y. 15x 2 ydx = 15. f Y (y) = 5y 4 1{0 y 1}.

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

Generoivat funktiot, Poisson- ja eksponenttijakaumat

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Valintahetket ja pysäytetyt martingaalit

a) Mikä on integraalifunktio ja miten derivaatta liittyy siihen? Anna esimerkki = 16 3 =

Johdatus matemaattiseen päättelyyn

J. Virtamo Jonoteoria / Poisson-prosessi 1

031021P Tilastomatematiikka (5 op) viikko 7

3.1 Kaksiulotteinen satunnaisvektori ja sen jakauma

8.1 Ehdolliset jakaumat

MATEMATIIKAN KOE, PITKÄ OPPIMÄÄRÄ HYVÄN VASTAUKSEN PIIRTEITÄ

Transkriptio:

Luku 2 Satunnaismuuttujat ja jakaumat Lasse Leskelä Aalto-yliopisto 2. syyskuuta 207 2. Satunnaismuuttujan käsite Käytännön tilanteissa ei yleensä olla kiinnostuneita satunnaisilmiön kaikista yksityiskohdista, vaan ainostaan tietyn ilmiöön liittyvän suureen arvosta. Esimerkiksi kaupan varastonhallinnassa riittää yksittäisten myyntitapahtumien sijaan yleensä tietää päiväkohtaiset myyntimäärät. Satunnaismuuttuja X on suure, jonka arvo määräytyy satunnaisilmiön toteumasta. Sattuma siis määrää satunnaisilmiön toteuman s S ja toteuma satunnaismuuttujan arvon X(s). Tapahtuma X saa arvon a sisältää ne toteumat s, joille X(s) = a merkitään. Sitä merkitään X = a} = s S : X(s) = a}. Esimerkki 2. (Kaksi noppaa). Kahta nopanheittoa mallintavan satunnaisilmiön toteumia ovat lukuparit s = (s, s 2 ), jossa s i on heiton i tulos. Satunnaisilmiöön liittyviä satunnaismuuttujia ovat esimerkiksi heittotulosten summa N(s) = s + s 2, heittotulosten maksimi M(s) = maxs, s 2 }. Matemaattisesti satunnaismuuttuja on mitallinen funktio X : S S perusjoukosta S arvojoukkoon S. Tässä monisteessa käsitellään pääasiassa lukuarvoisia satunnaismuuttujia. Yleisemmistä satunnaismuuttujista saatetaan arvojoukon tyypin mukaan käyttää allaolevia nimityksiä: Mitallisuus, ks. kohta todo 9

Nimitys Arvojoukko Satunnaisluku S R Satunnaisvektori S R n Satunnaismatriisi S R m n Stokastinen prosessi S R T (aikavälin T funktiot) Satunnaiskenttä S R U (alueen U funktiot) Satunnaisverkko S 0, } V V (solmujoukon V verkot) 2.2 Jakauma ja kertymäfunktio Satunnaismuuttujan X jakauma on taulukko tai funktio, josta voidaan määrittää X:n mahdolliset arvot ja niiden todennäköisyydet. Esimerkki 2.2 (Kaksi nopanheittoa). Kahta nopanheittoa mallinnetaan perusjoukolla S =,..., } 2, jonka alkioita ovat tulosparit s = (s, s 2 ). Satunnaismuuttujan N(s) = s +s 2 arvojoukko on 2,..., 2}. Tapahtuma N saa arvon on joukko N = } = (, 2), (2, )}. Koska jokainen tulospari on yhtä todennäköinen, on P(N = ) = 2. Samalla tapaa voidaan määrittää muidenkin arvojen todennäköisyydet ja satunnaismuuttujan N jakauma voidaan esittää alla olevana taulukkona. 0.5 x 2 4 5 7 8 9 0 2 0.0 P(N = x) 2 4 5 5 4 2 0.05 0.00 2 4 5 7 8 9 02 Heittotulosten maksimi on satunnaismuuttuja M(s) = maxs, s 2 }, jonka arvojoukko on,..., }. Tapahtuma M saa arvon on joukko M = } = (, ), (2, ), (, ), (, 2), (, )}. Koska jokainen tulospari on yhtä todennäköinen, on P(M = ) = 5. Vastaavaan tapaan voidaan määrittää muidenkin arvojen todennäköisyydet ja satunnaismuuttujan M jakauma voidaan esittää alla olevana taulukkona. 0. x 2 4 5 P(M = x) 5 7 9 0.2 0. 0.0 2 4 5 20

Kaikkien satunnaismuuttujien jakaumia ei voi esittää taulukon avulla. Tarkastellaan seuraavaa esimerkkiä. Esimerkki 2. (Metron odotusaika). Asemalle saapuu metroja 0 minuutin väliajoin. Asemalle saapuu matkustaja tasaisen satunnaisella ajanhetkellä. Millä todennäköisyydellä seuraavan metron odotusaika on minuuttia? Satunnaismuuttujan X mahdollisia arvoja ovat kaikki reaaliluvut jatkuvalta väliltä [0, 0], kun aikayksikkönä on minuutti. Jakauman määrittämiseksi pilkotaan väli [0,0] sataan osaväliin [0.0, 0.], [0., 0.2],..., [9.9, 0.0]. Symmetrian perusteella ovat tapahtumien X [0.0, 0.],..., X [9.9, 0.0] todennäköisyydet yhtäsuuret, joten P(2.9 X ) = 00. Vastaava päättely voidaan toistaa pilkkomalla väli [0,0] tuhanteen, kymmeneentuhanteen, sataantuhanteen jne. osaväliin. Näin ollen P(2.99 X ) = 0.00, P(2.999 X ) = 0.000, P(2.9999 X ) = 0.0000. Koska tapahtuma X = sisältyy jokaiseen ylläolevaa muotoa olevaan tapahtumaan, seuraa todennäköisyyden monotonisuuden (.5) perusteella P(X = ) = 0. Tehty havainto yleistyy muotoon P(X = t) = 0 kaikilla reaaliluvuilla t. Tämä silminnähden paradoksaalinen tulos selittyy sillä, että jatkuvan arvojoukon satunnaismuuttujalle X = t tarkoittaa, että X:n arvo on yhtäsuuri kuin t äärettömän monen desimaalin tarkkuudella. Odotusajan jakaumaa ei selvästikään voi esittää yksittäisten arvojen todennäköisyyksiä taulukoimalla, vaan tarvitaan jokin muu tapa. Lukuarvoisen satunnaismuuttujan kertymäfunktio määritellään kaavalla F X (t) = P(X t). Esimerkin 2. odotusajan kertymäfunktiolle voidaan johtaa kaava F X (t) =.0 0, t < 0, t 0, 0 t 0, 0.5, t >. 0.0 0 5 0 Kertymäfunktion avulla voi laskea tapahtumien todennäköisyyksiä hyödyntämällä todennäköisyyden yleisiä laskusääntöjä. Esimerkiksi erotuksen laskusäännön (.) mukaan P(s < X t) = P(X t) P(X s) = F X (t) F X (s). 2

Vastakohdan (.4) laskusäännöstä seuraa puolestaan P(X > t) = P(X t) = F X (t). Itse asiassa on mahdollista todistaa, että kertymäfunktio määrää lukuarvoisen satunnaismuuttujan jakauman yksikäsitteisesti (ks. liite). Useimmat käytännön laskut on kuitenkin hankala toteuttaa kertymäfunktion avulla. Paremman tavan tarjoavat tiheysfunktiot, joita käsitellään seuraavaksi. 2. Jakauman tiheysfunktio Satunnaismuuttuja X on diskreetti, jos sen todennäköisyydet voidaan esittää funktion f X (x) 0 avulla muodossa P(X A) = f X (x), (2.) x A S X missä joukko S X on numeroituva 2, ja jatkuva, jos sen todennäköisyydet voidaan esittää funktion f X (x) 0 avulla muodossa P(X A) = f X (x) dx. (2.2) Kaavassa (2.) joukko S X sisältää ne arvot, joita X voi saada positiivisella todennäköisyydellä. Funktio f X (x) on X:n jakauman tiheysfunktio. Kuvassa 2. on esitetty todennäköisyyden laskeminen diskreetin ja jatkuvan jakauman tiheysfunktion avulla. A 0. 0. 0.2 0.2 0. 0. 0.0 0 2 4 5 7 8 9 0 0.0 0 2 4 5 7 8 9 0 Kuva 2.: Tapahtuman X 5 todennäköisyys lasketaan diskreetille jakaumalle punaisten pylväiden korkeuksien summana (vasen) ja jatkuvalle jakaumalle punaisen alueen pinta-alana (oikea). 2 Joukko on numeroituva, jos sen alkiot voidaan numeroida äärellisenä tai äärettömänä listana. Numeroituvia joukkoja: äärelliset joukot, kokonaisluvut, rationaaliluvut. 22

Diskreetin satunnaismuuttujan tiheysfunktio tunnetaan myös termeillä pistemassafunktio, pistetodennäköisyysfunktio ja todennäköisyysfunktio. Jatkuvan jakauman tiheysfunktio ei välttämättä ole jatkuva; tässä yhteydessä jatkuva tarkoittaa, että satunnaismuuttujan arvojoukko on jatkumo. Diskreetin satunnaismuuttujan tiheysfunktio voidaan kirjoittaa muodossa ja se toteuttaa ehdot f X (x) 0 f X (x) = P(X = x) (2.) ja x S X f X (x) =. (2.4) Vastaavasti mikä tahansa ehdot toteuttava (2.4) toteuttava funktio on jonkin diskreetin jakauman tiheysfunktio. Esimerkki 2.4 (Noppa). Yksittäisen nopanheiton tulos X on diskreetti satunnaismuuttuja, jonka tiheysfunktio on f X (x) =, x, 2,..., }. Kyseinen jakauma on lukujoukon,..., } diskreetti tasajakauma. 0.2 0. 0.0 0 2 4 5 7 8 90 Esimerkki 2.5 (Poisson-jakauma). Lukujoukossa Z + = x 0,, 2,... } on määritelty funktio f(x) = e. Eksponenttifunktion sarjaesityksen perusteella f(x) toteuttaa eh- 0. 0.2 x! dot (2.4), joten se on erään diskreetin jakauman tiheysfunktio. Kyseinen jakauma on Poisson-jakauma parametrina. 0.0 0 5 0 Jatkuvan jakauman tiheysfunktiota ei voi kirjoittaa muodossa (2.), sillä P(X = x) = x x f X (t) dt = 0. Tämä tarkoittaa sitä, että jatkuvalle satunnaismuuttujalle todennäköisyys saada arvo x äärettömän monen desimaalin tarkkuudella on nolla (vrt. esimerkki 2.). Oikea tapa tulkita jatkuvan satunnaismuuttujan tiheysfunktio on todennäköisyys suhteessa reaalilukujen esitystarkkuuteen, nimittäin tiheysfunktion jatkuvuuspisteissä pätee pienillä h > 0 arvoilla f X (x) P(X = x ± h/2), (2.5) h missä merkintä X = x ± h/2 tarkoittaa tapahtumaa x h/2 X x + h/2. Jatkuvan jakauman tiheysfunktio toteuttaa ehdot f X (x) 0 ja ao. lausekkeen vasen puoli = lim h 0 oikea puoli f X (x) dx =, (2.) 2

ja vastaavasti mikä tahansa ehdot (2.) toteuttava funktio on jonkin jatkuvan jakauman tiheysfunktio. Jatkuvan jakauman kertymäfunktio määrittyy tiheysfunktiosta kaavalla F X (t) = t f X (s) ds. Vastaavasti F X (t) = f X(t) niissä pisteissä, joissa F X (t) on derivoituva. Esimerkki 2.. Valitaan vakiot a < b ja tarkastellaan funktiota b a f(t) =, a < t < b, /(b a) 0, muuten. Tämä funktio toteuttaa ehdot (2.), joten se on erään jatkuvan jakauman tiheysfunktio. Kyseinen jakauma on lukuvälin [a, b] jatkuva tasajakauma. Sitä vastaava kertymäfunktio saadaan integraalina t 0, t < a, t F (t) = f(s) ds = b a, a t b, 0 a b, t > b. Sijoittamalla tähän a = 0 ja b = 0 havaitaan, että esimerkissä 2. tarkasteltu jakauma on välin [0, 0] jatkuva tasajakauma. Esimerkki 2.7 (Eksponenttijakauma). Valitaan vakio λ > 0 ja tarkastellaan funktiota 0, t < 0, f(t) = λe λt, t 0. 0 Tämä funktio toteuttaa ehdot (2.), joten se on erään jatkuvan jakauman tiheysfunktio. Kyseinen jakauma on eksponenttijakauma parametrina λ. 0 a b F (t) = t f(s) ds = 0, t < 0, e λt, t 0. 0 0 2.4 Monen satunnaismuuttujan yhteisjakauma Samaan satunnaisilmiöön liittyvien satunnaismuuttujien X ja Y yhteisjakauma on taulukko tai funktio, josta voidaan määrittää parin (X, Y ) mahdolliset arvot ja niiden todennäköisyydet. Esimerkki 2.8 (Kaksi noppaa). Mallinnetaan kahta nopanheittoa kuten esimerkissä 2.2. Merkitään X = ensimmäisen heiton tulos, Y = toisen heiton tulos 24

ja M = heittotulosten maksimi. Määritä satunnaismuuttujien X ja Y yhteisjakauma. Määritä myös satunnaismuuttujien X ja M yhteisjakauma. Parin (X, Y ) mahdolliset arvot ovat tulojoukon,..., } 2 lukuparit (x, y), jossa x, y,..., }. Koska jokainen tulospari on yhtä todennäköinen, pätee kaikille tulojoukon lukupareille P(X = x, Y = y) =. Satunnaismuuttujien X ja Y yhteisjakauma voidaan esittää myös ao. taulukkona. X 2 4 5 2 4 5 Myös parin (X, M) mahdolliset arvot sisältyvät tulojoukkoon,..., } 2, mutta kaikki tulojoukon lukuparit eivät ole yhtä todennäköisiä. Esimerkiksi tapahtumaa X =, M = } vastaa perusjoukon alkiot (, ), (, 2), (, )}, joten P(X =, M = ) =. Samalla tapaa kohta kohdalta päätellen voidaan todeta, että kaikille tulojoukon lukupareille (x, m) pätee, x < m, x P(X = x, M = m) =, x = m, 0, x > m. Satunnaismuuttujien X ja M yhteisjakauma voidaan myös esittää ao. taulukkona. Y M X 2 4 5 2 0 2 0 0 4 0 0 0 4 5 0 0 0 0 5 0 0 0 0 0 25

Usean muuttujan tiheysfunktiot on helpointa kirjoittaa indikaattorifunktioiden avulla. Joukon A indikaattorifunktio määritellään kaavalla, x A, A (x) = 0, muuten, ja sen avulla voidaan yhden muuttujan jakaumien esityskaavat (2.) ja (2.2) kirjoittaa muodossa P(X A) = A (x)f X (x) x S X ja P(X A) = A (x)f X (x) dx. Yhteisjakaumien tiheysfunktiot määritellään ylläolevien kaavojen yleistyksinä. Satunnaismuuttujilla X ja Y on diskreetti yhteisjakauma, niiden todennäköisyydet voidaan esittää funktion f X,Y (x, y) 0 avulla muodossa P((X, Y ) A) = A (x, y)f X,Y (x, y), (2.7) y S Y x S X missä joukot S X ja S Y ovat numeroituvia, ja jatkuva yhteisjakauma, jos niiden todennäköisyydet voidaan esittää funktion f X,Y (x, y) 0 avulla muodossa P((X, Y ) A) = A (x, y)f X,Y (x, y) dx dy. (2.8) Ylläolevissa yhtälöissä A tarkoittaa mielivaltaista 4 lukuparien joukkoa. Kaavassa (2.7) joukot S X ja S Y sisältävät ne arvot, joita X ja Y voivat saada positiivisella todennäköisyydellä. Kaavoissa esiintyvä funktio f X,Y (x, y) on yhteisjakauman tiheysfunktio. Samanlaiset määritelmät ovat voimassa myös kolmelle ja useammalle satunnaismuuttujalle. Diskreetin yhteisjakauman tiheysfunktio voidaan kirjoittaa muodossa ja se toteuttaa ehdot f X,Y (x, y) 0 f X,Y (x, y) = P(X = x, Y = y) (2.9) ja x S X y S Y f X,Y (x, y) =. (2.0) Vastaavasti mikä tahansa ehdot toteuttava (2.0) toteuttava funktio on jonkin diskreetin yhteisjakauman tiheysfunktio. Satunnaismuuttujien X ja Y tiheysfunktiot saadaan yhteisjakauman tiheysfunktiosta kaavoilla f X (x) = f X,Y (x, y) (2.) y S Y 4 mitallista 2

Y X 2 4 5 Yht 2 4 5 Yht Taulukko 2.: Kahden nopanheiton tuloksen X ja Y yhteisjakauma. M X 2 4 5 Yht 2 2 0 0 0 4 4 0 0 0 5 5 0 0 0 0 0 0 0 0 0 Yht 5 7 9 Taulukko 2.2: Ensimmäisen nopanheiton X ja nopanheittojen maksimin M yhteisjakauma. ja f Y (y) = x S X f X,Y (x, y). (2.2) Kun diskreetti yhteisjakauma esitetään taulukkona, jonka rivejä ovat X:n arvot ja sarakkeita Y :n arvot, vastaavat f X (x):n arvot taulukon rivisummia ja f Y (y):n arvot taulukon sarakesummina. Esimerkissä 2.8 tarkasteltuja yhteisjakaumia f X,Y (x, y) =, x < m,, f x X,M(x, m) =, x = m, 0, x > m, kuvaavien taulukoiden rivi- ja sarakesummat on esitetty taulukoissa 2. ja 2.2. Taulukon rivisummat vastaavat joukon,..., } tasajakaumaa eli yksittäisen nopanheiton tuloksia. Sarakesummat puolestaan vastaavat esimerkissä 2.2 johdettua kahden nopanheiton maksimin jakaumaa. Tästä syystä X:n ja Y :n jakaumia kutsutaan satunnaisvektorin (X, Y ) reunajakaumiksi ja kaavojen (2.) ja (2.2) määrittämiä funktioita funktion f X,Y (x, y) reunatiheysfunktioiksi. Jatkuvaa yhteisjakaumaa noudattavien satunnaismuuttujien X ja Y jakaumat ovat jatkuvia, mutta käänteinen tulos ei yleisesti pidä paikkaansa. Jatkuvan yhteisjakauman tiheysfunktiota ei voi kirjoittaa muodossa (2.9). Oikea tapa on 27

tulkita f X,Y (x, y) todennäköisyytenä suhteessa reaalilukujen esitystarkkuuteen. Jatkuvan yhteisjakauman tiheysfunktion jatkuvuuspisteissä pätee lausekkeen (2.5) merkinnöin pienillä h > 0 arvoilla f X,Y (x, y) P(X = x ± h/2, Y = y ± h/2) h 2. (2.) Jatkuvan yhteisjakauman tiheysfunktio toteuttaa ehdot f X,Y (x, y) 0 ja f X,Y (x, y) dx dy =, (2.4) ja vastaavasti jokainen ehdot toteuttava (2.) toteuttava funktio on jonkin jatkuvan yhteisjakauman tiheysfunktio. Satunnaismuuttujien X ja Y tiheysfunktiot saadaan yhteisjakauman tiheysfunktiosta kaavoilla f X (x) = f X,Y (x, y) dy (2.5) ja f Y (y) = f X,Y (x, y) dx. (2.) Myös jatkuvassa tapauksessa X:n ja Y :n jakaumia kutsutaan satunnaisvektorin (X, Y ) reunajakaumiksi ja kaavojen (2.5) ja (2.) määrittämiä funktioita funktion f X,Y (x, y) reunatiheysfunktioiksi. Esimerkki 2.9 (Yksikköneliön tasajakauma). Valitaan vakiot a < b ja määritellään kahden muuttujan funktio f X,Y (x, y) =, (b a) 2 0, muuten. kun x (a, b) ja y (a, b), Tämä funktio toteuttaa ehdot (2.), joten se on joidenkin satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio. Integroimalla muuttujan y:n suhteen havaitaan, että f X (x) = f X,Y (x, y) dy =, b a kun x (a, b), 0, muuten. Vastaavasti integroimalla muuttujan x suhteen, f Y (y) = f X,Y (x, y) dx =, b a kun x (a, b), 0, muuten. Tiheysfunktiot f X (x) ja f Y (y) ovat molemmat samoja kuin esimerkissä 2., joten sekä X että Y noudattavat välin [a, b] jatkuvaa tasajakaumaa. 28

2.5 Ehdolliset jakaumat Satunnaismuuttujan X ehdollinen jakauma tietyn tapahtuman suhteen on funktio tai taulukko, josta voidaan määrittää tapahtumien X A todennäköisyydet kyseisen tapahtuman toteutuessa. Yleensä ehdollistava tapahtuma määrittyy jonkin toisen satunnaismuuttujan Y kautta ja ehdollisia jakaumia voi käsitellä ehdollisten tiheysfunktioiden avulla. Jos satunnaismuuttujien X ja Y diskreetillä tai jatkuvalla yhteisjakaumalla on tiheysfunktio f X,Y (x, y), niin satunnaismuuttujan Y ehdollinen tiheysfunktio satunnaismuuttujan X suhteen määritellään kaavalla f Y X (y x) = f X,Y (x, y). f X (x) Kun f X (x) = 0, ei ylläolevan kaavan oikea puoli ole määritelty; tällöin myös f Y X (y x) jätetään määrittelemättä. Kun f X (x) > 0, havaitaan diskreetissä tapauksessa kaavan (2.) avulla, että f Y X (y x) 0 ja f Y X (y x) =, y S Y ja jatkuvassa tapauksessa kaavan (2.5) avulla, että f Y X (y x) 0 ja f Y X (y x) dy =. Yhden muuttujan funktio y f Y X (y x) on näin ollen jonkin jakauman tiheysfunktio. Kyseinen jakauma on satunnaismuuttujan Y ehdollinen jakauma tapahtuman X = x suhteen. Ehdollisen jakauman tiheysfunktiolla voi laskea samaan tapaan kuin tavallisillakin tiheysfunktioilla, joissa muuttujaksi valitaan y. Diskreetissä tapauksessa havaitaan ehdollisen todennäköisyyden määritelmää sekä kaavoja (2.) ja (2.9) käyttämällä, että f Y X (y x) = P(Y = y X = x). Jatkuville jakaumille ei ylläoleva tulkinta ole mahdollinen, sillä tapahtumien X = x ja Y = y todennäköisyydet ovat nollia. Yhdistämällä kaavat (2.5) ja (2.) havaitaan, että yhteisjakauman jatkuvuuspisteissä pienillä h > 0 arvoilla pätee P(Y = y ± h/2 X = x ± h/2) f Y X (y x). h 2. Stokastinen riippuvuus ja riippumattomuus Kaksi satunnaismuuttujaa ovat riippumattomat, jos informaatio toisen muuttujan arvosta ei vaikuta toisen muuttujan todennäköisyyksiin. Matemaattisesti 29

ilmaistuna satunnaismuuttujat X ja Y ovat riippumattomat, jos kaikilla A ja B pätee P(X A, Y B) = P(X A)P(Y B). (2.7) Silloin kun tapahtumien X A ja Y B todennäköisyydet poikkeavat nollasta, voidaan ylläoleva yhtälö ilmaista myös muodossa tai P(Y B X A) = P(Y B) P(X A Y B) = P(X A). Useamman satunnaismuuttujan kokoelma puolestaan on riippumaton, jos mille tahansa siitä valituille satunnaismuuttujille X,..., X k ja kaikille A,..., A k pätee P(X A,..., X k A k ) = P(X A ) P(X k A k ). (2.8) Fakta 2.0. Diskreettiä tai jatkuvaa yhteisjakaumaa noudattavat satunnaismuuttujat X ja Y ovat riippumattomat jos ja vain niiden yhteisjakauman tiheysfunktio voidaan esittää muodossa f X,Y (x, y) = f X (x)f Y (y) (2.9) Todistus. Todistetaan ensiksi diskreetti tapaus. (i) Ehdon (2.9) riittävyyden perustelemiseksi palautetaan mieleen tulojoukon määritelmä: joukko A B sisältää ne lukuparit (x, y), joille x A ja y B. Tästä syystä tulojoukon indikaattorifunktio voidaan kirjoittaa muodossa A B (x, y) = A (x) B (y) ja tapahtuma X A ja Y B toteutuu täsmälleen silloin kun, satunnaismuuttujien pari (X, Y ) kuuluu tulojoukkoon A B. Mikäli X:n ja Y :n yhteisjakauman tiheysfunktio voidaan esittää muodossa (2.9), voidaan näin ollen päätellä, että P(X A, Y B) = P((X, Y ) A B) = A B (x, y)f X,Y (x, y) x S X y S Y = A (x) B (y)f X (x)f Y (y) x S X y S ( Y ) ( ) = A (x)f X (x) B (y)f Y (y) x S X y S Y = P(X A)P(Y B). Koska ylläoleva yhtälö pätee kaikille A ja B, ovat X ja Y riippumattomat. 0

(ii) Käänteisen seuraussuhteen todistamiseksi tehdään oletus, että X ja Y ovat riippumattomat. Tällöin soveltamalla kaavaa (2.7) yhden alkion joukkoihin A = x} ja B = y} havaitaan, että f X,Y (x, y) = P(X = x, Y = y) = P(X A, Y B) = P(X A)P(Y B) = P(X = x)p(y = y) = f X (x)f Y (y). Jatkuvan yhteisjakauman tapauksessa ehdon (2.9) riittävyys voidaan perustella vaihtamalla summat integraaleiksi kohdassa (i). Käänteisen seuraussuhteen perustelemiseksi voidaan todeta, että jos X ja Y ovat riippumattomat, niin lausekkeen (2.) merkinnöin kaikilla h > 0 pätee P(X = x ± h/2, Y = y ± h/2) = P(X = x ± h/2)p(y = y ± h/2). Jakamalla ylläolevan yhtälön molemmat puolet luvulla h 2 ja ottamalla rajaarvot kun h 0, voidaan tästä päätellä että (2.9) on voimassa funktion f X,Y (x, y) jatkuvuuspisteissä. Esityksen (2.9) perustelu funktion f X,Y (x, y) epäjatkuvuuspisteille vaatii syvällisempiä mittateorian menetelmiä ja se sivuutetaan. Esimerkki 2. (Kaksi noppaa). Merkitään kahden nopanheiton tuloksia satunnaismuuttujilla X ja Y sekä tulosten maksimia satunnaismuuttujalla M = maxx, Y }. Ovatko satunnaismuuttujat X ja Y toisistaan riippuvat vai riippumattomat? Entä X ja M? Intuitiivisesti on selvää, että X ja Y ovat toisistaan riippumattomat. Matemaattisesti tämän voi vahvistaa toteamalla, että yhtälö f X,Y (x, y) = f X (x)f Y (y) pitää paikkansa, sillä yhteisjakauman taulukon 2. alkiot vastaavat rivi- ja sarakesummien alkioiden tuloja. Satunnaismuuttujat X ja M puolestaan ovat riippuvat, sillä esimerkiksi P(X = 2 M = ) = 0 poikkeaa arvosta P(X = 2) =, joten f X,M (2, ) f X (2)f M (). Tämän voi havaita myös tarkastelemalla yhteisjakauman taulukosta 2.2 rivin 2 ja sarakkeen alkioita. Esimerkki 2.2 (Satunnaisotanta). Korissa on punaista ja 7 valkoista palloa. Korista poimitaan umpimähkään yksi pallo ja selvitetään sen väri. Sama toimenpide suoritetaan kaksi kertaa peräkkäin ja poimintojen tuloksia merkitään, jos. pallo on punainen, X = 0, muuten,

ja X 2 =, jos 2. pallo on punainen 0, muuten. Määritä satunnaismuuttujien X ja X 2 yhteisjakauma. Ylläoleva kysymys on huonosti asetettu, sillä vastaus riippuu siitä, palautetaanko poimittu pallo koriin ennen seuraavan poiminnan suorittamista. Satunnaismuuttujan X todennäköisyydet ovat kuitenkin poimintatavasta huolimatta f X (0) = 7 ja f 0 X () =. Jos poiminnat suoritetaan palauttaen, niin eri poimintakierrosten tulokset ovat toisistaan riippumattomat ja samoin jakautuneet, 0 joten yhteisjakauma voidaan kirjoittaa muodossa f X,X 2 (x, y) = f X (x)f X (y). Jos taas poiminnat suoritetaan palauttamatta, niin tulokset X ja X 2 riippuvat stokastisesti toisistaan eikä ylläolevaa kaavaa voi käyttää. Yleisen tulosäännön mukaan yhteisjakauma voidaan kuitenkin aina kirjoittaa muodossa f X,X 2 (x, y) = f X (x)f X2 X (y x). Riittää siis laskea ehdollisen jakauman f X2 X (y x) arvot. Tapahtuman X = 0 toteutuessa korissa on toisen poimintakierroksen alussa valkoista ja punaista palloa, jolloin todennäköisyys saada valkoinen pallo on P(X 2 = 0 X = 0) = 9. Muut ehdolliset todennäköisyydet päätellään vastaavasti, ja ne on merkitty kuvan 2.2 puukaaviossa lehtisolmuihin johtavien linkkien yhteyteen. Satunnais- Kuva 2.2: Satunnaisotanta ilman palautusta. Tapahtuman X = 0, X 2 = 0} todennäköisyydeksi voidaan kaaviosta lukea f X,X 2 (0, 0) = 7/0 /9 = 42/90. muuttujien yhteisjakaumat voidaan esittää ao. taulukkoina. Palauttaen Palauttamatta X 2 X 0 Yht 49 0 00 2 00 Yht 7 0 2 00 9 00 0 7 0 0 X 2 X 0 Yht 42 0 90 2 90 Yht 7 0 2 90 90 0 7 0 0 2

Kummankin taulukon reunajakaumat ovat samat, mikä tarkoittaa että molemmat satunnaismuuttujat X ja X 2 noudattavat jakaumaa f Xi (0) = 7/0 ja f Xi () = /0 poimintatavasta huolimatta. Muuttujien yhteisjakauma sen sijaan riippuu siitä, suoritetaanko poiminnat palauttaen vai palauttamatta. Tämä esimerkki osoittaa, että satunnaismuuttujien jakaumista f X ja f X2 ei voi päätellä niiden yhteisjakaumaa. 2.7 Yhteenveto Allaolevassa taulukossa on tiivistelmä tämän luvun tärkeimmistä käsitteistä. Diskreetti jakauma X:n arvot sisältyvät äärelliseen tai numeroituvasti äärettömään arvojoukkoon S X P(X = x) = f X (x) kaikilla x S X Jakauma määräytyy tiheysfunktiosta kaavalla P(X A) = A (x)f X (x) x S X Jatkuva jakauma X:n arvot sisältyvät ylinumeroituvasti äärettömään reaalilukujen joukkoon P(X = x) = 0 kaikilla reaaliluvuilla x Jakauma määräytyy tiheysfunktiosta kaavalla P(X A) = A (x)f X (x) dx Tiheysfunktion arvot ovat tarkkoja todennäköisyyksiä f X (x) = P(X = x) Tiheysfunktion arvot ovat suhteellisia likiarvoisia todennäköisyyksiä f X (x) h P(X = x ± h/2) Esim. joukon,..., } tasajakauma Esim. välin [0, 0] tasajakauma 2.8 Kommentteja Tämän luvun lopuksi vielä yksi esimerkkitapaus kahden satunnaismuuttujan yhteisjakaumasta, joka ei ole diskreetti eikä jatkuva, vaan niiden sekoite. Esimerkki 2.. Merkitään X = satunnaisesti saapuvan matkustajan odotusaika (min) asemalla, jonne metroja saapuu tasaisin 0 min välein, ja jossa metrot pysähtyvät min ajan. Määritä X:n jakauma. Todennäköisyys että matkustaja asemalle saapuessaan näkee häntä odottavan metron on symmetrian perusteella /0, ja tämän tapahtuman toteutuessa odotusaika on 0. Muussa tapauksessa odotusaika noudattaa jatkuvan välin [0, 9] tasajakaumaa. Satunnaismuuttujan X jakauma ei ole diskreetti, sillä välin [0, 9] lukuja ei voi numeroida listaan, eikä se ole jatkuva, sillä P(X =

0) = poikkeaa nollasta. Jakauman kertymäfunktiolle voidaan kuitenkin johtaa lauseke 0 F X (t) = 0 F X 0 (t) + 9 0 F X (t), missä F X0 (t) = 0, t < 0,, t 0, F X (t) = 0, t 0, t 9, 0 < t < 9,, t 9, Tästä nähdään, että X:n jakauma on diskreetin ja jatkuvan jakauman sekoitus: X 0 on diskreetti satunnaismuuttuja, joka varmuudella saa arvon 0 (X:n jakauma ehdolla, että metro on odottamassa asemalla). X on jatkuva satunnaismuuttuja, joka noudattaa välin [0, 9] tasajakaumaa (X:n jakauma ehdolla, että metroa joudutaan odottamaan). Näin ollen X:llä ei ole olemassa tiheysfunktiota tavanomaisessa mielessä. Yleistetyssä mielessä tiheysfunktion voi kuitenkin kirjoittaa viitemitan λ(dx) = δ 0 (dx) + dx suhteen muodossa, x = 0, 0 f(x) = 9, 0 < x < 9, 0, muuten, missä δ 0 on pisteen 0 Diracin mitta. Tällaisia yleisempiä mittoja ei tässä monisteessa käsitellä. Niistä voi lukea lisää esim. kirjoista [Kal02] tai [Wil9]. 4

Hakemisto eksponenttijakauma, indikaattorifunktio, 8 jakauma, 2 diskreetti, 4 jatkuva, 4 kertymäfunktio, pistetodennäköisyysfunktio, 5 Poisson-jakauma, 5 reunajakauma diskreetti, 9 jatkuva, 0 reunatiheysfunktio diskreetti, 9 jatkuva, 0 riippumattomat satunnaismuuttujat, 2 satunnaismuuttuja, diskreetti, 4 tasajakauma diskreetti, 5 jatkuva, tiheysfunktio, 4 todennäköisyysfunktio, 5 yhteisjakauma, diskreetti, 8 jatkuva, 8 tiheysfunktio, 8 45

Kirjallisuutta [Kal02] Olav Kallenberg. Foundations of Modern Probability. Springer, second edition, 2002. [Wil9] David Williams. Probability with Martingales. Cambridge University Press, 99. 4