3.1 Kaksiulotteinen satunnaisvektori ja sen jakauma

Samankaltaiset tiedostot
3.1 Kaksiulotteinen satunnaisvektori ja sen jakauma

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

8.1 Ehdolliset jakaumat

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

30A02000 Tilastotieteen perusteet

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset

2.1 Satunnaismuuttuja ja sen jakauma

8.1 Ehdolliset jakaumat

Moniulotteisia todennäköisyysjakaumia

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Galton Watson prosessi

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

4. Todennäköisyyslaskennan kertausta

11 Raja-arvolauseita ja approksimaatioita

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

1. Matkalla todennäköisyyteen

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

DISKREETIT JAKAUMAT Generoiva funktio (z-muunnos)

Ratkaisu: a) Kahden joukon yhdisteseen poimitaan kaikki alkiot jotka ovat jommassakummassa joukossa (eikä mitään muuta).

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

2.1 Satunnaismuuttuja ja sen jakauma

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

k S P[ X µ kσ] 1 k 2.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Yleistä tietoa kokeesta

1. Matkalla todennäköisyyteen (kertausta TN I)

Kopulafunktiot. Joonas Ollila 12. lokakuuta 2011

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

Johdatus matemaattiseen päättelyyn

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

9 Moniulotteinen jakauma

0 3 y4 dy = 3 y. 15x 2 ydx = 15. f Y (y) = 5y 4 1{0 y 1}.

031021P Tilastomatematiikka (5 op) viikko 7

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

031021P Tilastomatematiikka (5 op) viikko 3

811120P Diskreetit rakenteet

Kopuloiden teoria pähkinänkuoressa

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Tilastomatematiikka Kevät 2008

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Johdatus tn-laskentaan torstai

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Funktiot. funktioita f : A R. Yleensä funktion määrittelyjoukko M f = A on jokin väli, muttei aina.

Vastaus 1. Lasketaan joukkojen alkiot, ja todetaan, että niitä on 3 molemmissa.

Todennäköisyyslaskennan kurssin luentomoniste. Petri Koistinen Matematiikan ja tilastotieteen laitos Helsingin yliopisto

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden ominaisuuksia

Todennäköisyyslaskenta I. Ville Hyvönen

Miten perustella, että joukossa A = {a, b, c} on yhtä monta alkiota kuin joukossa B = {d, e, f }?

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Täydellisyysaksiooman kertaus

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 4 Ratkaisuehdotuksia. Tehtäväsarja I

Sovellettu todennäköisyyslaskenta B

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

JOHDATUS TEKOÄLYYN LUENTO 4.

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Multinomijakauman ja Dirichlet-jakauman käytöstä bayesilaisessa päättelyssä

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Johdatus matematiikkaan

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Joukot. Georg Cantor ( )

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

Satunnaismuuttujat ja jakaumat

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

031021P Tilastomatematiikka (5 op) viikot 5 6

031021P Tilastomatematiikka (5 op) viikko 2

3.7 Todennäköisyysjakaumia

=p(x) + p(y), joten ehto (N1) on voimassa. Jos lisäksi λ on skalaari, niin

Johdatus tn-laskentaan perjantai

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo.

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Ilkka Mellin (2008) 1/5

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

1 Määrittelyjä ja aputuloksia

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

Positiivitermisten sarjojen suppeneminen

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Todennäköisyyslaskenta I

Satunnaismuuttujien muunnokset ja niiden jakaumat

The CCR Model and Production Correspondence

7 Kaksiulotteinen jakauma

Antti Rasila. Kevät Matematiikan ja systeemianalyysin laitos Aalto-yliopisto. Antti Rasila (Aalto-yliopisto) MS-A0204 Kevät / 16

1. Kuinka monella tavalla joukon kaikki alkiot voidaan järjestää jonoksi? Tähän antaa vastauksen: tuloperiaate ja permutaatio

Transkriptio:

3 Yhteisjakauma Kappaleessa 2 tarkastelimme aina yhtä satunnaismuuttujaa kerrallaan. Tässä kappaleessa näemme, miten aikaisemmat käsitteet yleistyvät siihen tilanteeseen, jossa samalla perusjoukolla on määriteltynä useampi kuin yksi satunnaismuuttuja. Yksi päätavoitteista on määritellä, milloin satunnaismuuttujat ovat riippumattomia. Syvenämme moniulotteisten jakaumien käsittelyä myöhemmissä luvuissa. 1 / 54

3.1 Kaksiulotteinen satunnaisvektori ja sen jakauma Määritelmä 3.1 (Kaksiulotteinen satunnaisvektori) Olkoot X ja Y samalla perusjoukolla Ω määriteltyjä satunnaismuuttujia, X : Ω R ja Y : Ω R. Tällöin (X, Y ) on kaksiulotteinen satunnaisvektori (lyh. sv) (engl. two-dimensional random vector; bivariate random vector). Kaksiulotteinen sv (X, Y ) on siis kuvaus (funktio) (X, Y ) : Ω R 2, siten, että (X, Y )(ω) = (X (ω), Y (ω)). Satunnaisvektorista (X, Y ) käytetään myös nimitystä kaksiulotteinen satunnaismuuttuja (engl. two-dimensional random variable, sv. tvådimensionell stokastisk variabel) tai satunnaismuuttujapari. 2 / 54

Satunnaisvektorin jakauma, eli yhteisjakauma Määritelmä 3.2 (Satunnaisvektorin jakauma, yhteisjakauma) Satunnaisvektorin (X, Y ) jakauma eli satunnaismuuttujien X ja Y yhteisjakauma (engl. joint distribution, sv. simultana fördelning) on R 2 :n osajoukoilla A määritelty funktio P((X, Y ) A) = P({ω Ω : (X (ω), Y (ω)) A}). 3 / 54

Merkintäsopimus: pilkku tarkoittaa leikkausta Kun lasketaan tapahtumien leikkauksen todennäköisyyttä, niin tapahtumien väliin voidaan symbolin sijasta merkitä pilkku, seuraavaan tapaan P(X A, Y B) = P({X A, Y B}) = P({X A} {Y B}). Tässä yhteydessä voidaan käyttää jaksossa 2.1 esiteltyjä merkintöjä. Erityisesti merkintä P(X x, Y y) tarkoittaa seuraavaa P(X x, Y y) = P({X x ja Y y}). 4 / 54

Satunnaisvektorin kf, eli yhteiskertymäfunktio Määritelmä 3.3 (Satunnaisvektorin kertymäfunktio, yhteiskertymäfunktio) Satunnaisvektorin (X, Y ) kertymäfunktio eli satunnaismuuttujien X ja Y yhteiskertymäfunktio (lyh. ykf) (engl. joint (cumulative) distribution function, joint cdf, sv. simultana fördelningsfunktion) on F X,Y (x, y) = F (x, y) = P(X x, Y y), x, y R. 5 / 54

Merkintätapa Kuten yksiulotteisessa tapauksessa, niin myös kaksi- ja useampiulotteisessa tapauksessa kyseessä olevat satunnaismuuttujat voidaan ilmoittaa kertymäfunktion (tai muun jakauman esityksen) alaindekseillä, ellei asiayhteyden perusteella muuten ole selvää, minkä muuttujien yhteisjakauman esityksestä on kyse. 6 / 54

Yhteisjakaumat ja ykf:t vastaavat toisiaan Yhteisjakauma määrää ykf:n, sillä P(X x, Y y) = P((X, Y ) (, x] (, y]). Mikäli tunnetaan ykf, niin mittateoriaa käyttäen on mahdollista osoittaa, että ykf:n avulla voidaan laskea kaikkien joukkojen A todennäköisyydet kaavassa Lause 3.1 P((X, Y ) A), A R 2, eli yhteisjakauma määräytyy yhteiskertymäfunktiosta. Yhteiskertymäfunktio määrää jakauman. The joint cdf determines the joint distribution. 7 / 54

Esimerkki: osumistodennäköisyys suorakaiteelle Olkoot x 1 < x 2 ja y 1 < y 2. Lasketaan ykf:n F avulla P(x 1 < X x 2, y 1 < Y y 2 ) = P((X, Y ) (x 1, x 2 ] (y 1, y 2 ]). Nyt (piirrä kuva!) {X x 2, Y y 2 } = {x 1 < X x 2, y 1 < Y y 2 } C, jossa joukot ovat erillisiä, ja C = A B, jossa A = {X x 1, Y y 2 }, B = {X x 2, Y y 1 }. Niinpä P(x 1 < X x 2, y 1 < Y y 2 ) = F (x 2, y 2 ) P(C) = F (x 2, y 2 ) (P(A) + P(B) P(A B)) = F (x 2, y 2 ) F (x 1, y 2 ) F (x 2, y 1 ) + F (x 1, y 1 ). 8 / 54

Reunajakaumien kertymäfunktiot Kun tarkastellaan kahta satunnaismuuttujaa X ja Y, niin yksittäisen sm:n X (tai Y ) (yksiulotteista) jakaumaa kutsutaan sen reunajakaumaksi (engl. marginal distribution). Näiden jakaumien kertymäfunktiot eli X :n ja Y :n reunakertymäfunktiot (engl. marginal cdf s) saadaan yhteiskertymäfunktiosta F X,Y raja-arvoina, F X (x) = P(X x, Y R) = lim y F X,Y (x, y) = F X,Y (x, ), ja vastaavasti F Y (y) = lim x F X,Y (x, y) = F X,Y (, y). 9 / 54

Ykf:a tarvitaan harvoin käytännön laskuissa Poikkeus: kopula (engl. copula). (Googlaa esim. the formula that destroyed Wall Street) Ykf:n sijasta kaksiulotteisia jakaumia käsitellään yleensä niiden yhteispistetodennäköisyysfunktioiden tai yhteistiheysfunktioiden avulla. Yhteisjakauma kuvaillaan usein kertolaskusäännön eli ketjusäännön avulla, mitä varten pitää ensin kuvailla yhden muuttujan reunajakauma sekä toisen muuttujan ehdollinen jakauma. Käymme seuraavaksi nämä asiat läpi diskreetin yhteisjakauman tapauksessa. Jatkuvan yhteisjakauman tapaus käsitellään myöhemmässä luvussa. 10 / 54

3. 2 Diskreetti kaksiulotteinen jakauma Määritelmä 3.4 Sv (X, Y ) on diskreetti, eli satunnaismuuttujilla X ja Y on diskreetti yhteisjakauma, jos sv:lla (X, Y ) on enintään numeroituva arvojoukko, ts. on olemassa enintään numeroituva joukko S R 2 siten, että P((X, Y ) S) = 1. Joukko S on satunnaisvektorin (X, Y ) arvojoukko eli sen jakauman kantaja. Sv:n (X, Y ) pistetodennäköisyysfunktio eli satunnaismuuttujien X ja Y yhteispistetodennäköisyysfunktio (lyh. yptnf) (engl. joint probability (mass) function, joint pmf) on f (x, y) = f X,Y (x, y) = P(X = x, Y = y), x, y R. 11 / 54

Yptnf:n ominaisuuksia Yptnf:llä on analogiset ominaisuudet yksiulotteisen jakauman ptnf:n kanssa. Lause 3.2 Olkoon f ja S kuten määritelmässä 3.4. Tällöin a) 0 f (x, y) 1, ja f (x, y) = 0, kun (x, y) S. b) f määrää yhteisjakauman kaavalla P((X, Y ) B) = (x,y) B f (x, y). 12 / 54

Properties of joint pmf The joint pmf has analogous properties as the pmf in 1D. Theorem (3.2) Let f and S be as in Definition 3.4. Then a) 0 f (x, y) 1, and f (x, y) = 0, when (x, y) S. b) f determines the joint distribution with formula P((X, Y ) B) = f (x, y). (x,y) B 13 / 54

Lisää yptnf:n ominaisuuksia Seurauksena edellisestä, X :n ja Y :n (reuna)pistetodennäköisyydet saadaan summaamalla tarpeeton muuttuja pois yptnf:stä, f X (x) = P(X = x) = P(X = x, Y R) = y f (x, y), f Y (y) = P(Y = y) = P(X R, Y = y) = x f (x, y). (3.1) (3.2) Nämä tulokset sisältyvät kokonaistodennäköisyyden kaavaan (tai sen yleistykseen numeroituvasti äärettömälle ositukselle). Lisäksi yptnf summautuu ykköseksi, sillä 1 = P((X, Y ) S) = f (x, y). (x,y) S 14 / 54

Diskreetin jakauman yptnf:n tunnistaminen Kuten yhdessä dimensiossa, myös kahdessa dimensiossa pistetodennäköisyysfunktio on mahdollista tunnistaa suoraan sen ominaisuuksien avulla. Lause 3.3 Olkoon S R 2 äärellinen tai numeroituvasti ääretön joukko, ja olkoon f : S R ei-negatiivinen funktio siten, että f (x, y) = 1. (x,y) S Tällöin se on eräiden diskreettien satunnaismuuttujien X ja Y yptnf. 15 / 54

Recognising joint pmf of discrete distribution As in one dimensional case, also two dimensional joint pmf of a discrete distribution can be recognised from its properties. Theorem Let S R 2 be a finite or countably infinite set, and let f : S R be a non-negative function st. f (x, y) = 1. (x,y) S Then f is a joint pmf of certain discrete random variables X and Y. 16 / 54

Yhteisjakauma on diskreetti jos ja vain jos reunajakaumat ovat diskreettejä Lause 3.4 Satunnaismuuttujien X ja Y yhteisjakauma on diskreetti silloin ja vain silloin, kun reunajakaumat ovat diskreettejä. Theorem The joint distribution of X and Y is discrete if and only if the marginal distributions of both X and Y are discrete. Johdimme edellä reunajakaumien ptnf:t. Myöhemmin nähdään: jos reunajakaumat ovat jatkuvia, niin yhteisjakauma ei välttämättä ole jatkuva. 17 / 54

Esimerkki: reunajakaumat eivät määrää yhteisjakaumaa Tarkastellaan diskreettiä yhteisjakaumaa, jonka yptnf:n kantaja S on {0, 1} {0, 1} ja yptnf on f (x, y). Tällainen yptnf voidaan esittää taulukon muodossa seuraavasti, x\y 0 1 y 0 f (0, 0) f (0, 1) f X (0) 1 f (1, 0) f (1, 1) f X (1) x f Y (0) f Y (1) 18 / 54

Eskimerkki jatkuu 1 Reunajakaumien ptnf:t ovat taulukon reunasummia ts. f X (x) = y f Y (y) = x f (x, y) = f (x, 0) + f (x, 1), x = 0, 1, f (x, y) = f (0, y) + f (1, y), y = 0, 1. Termi reunajakauma selittyy tällaisesta huomiosta. Nyt tietenkin X Bernoulli(f X (1)) ja Y Bernoulli(f Y (1)). 19 / 54

Esimerkki jatkuu 2 Moni erilainen yhteisjakauma tuottaa samat reunajakaumat. Esim. reunajakaumat X Bernoulli(1/2) Y Bernoulli(1/2) saadaan seuraavasta taulukosta millä tahansa arvolla 0 a 1 2. x\y 0 1 1 0 a 2 a 1 2 1 1 1 2 2 a a 1 2 1 2 20 / 54

3.3 Useampiulotteinen satunnaisvektori Avaruuden R n vektoria (x 1,..., x n ) merkitään x = x = (x 1,..., x n ). Silloin, kun se esiintyy matriisien kanssa samassa lausekkeessa, se ymmäretään pystyvektoriksi eli n 1-matriisiksi, x 1 x n x 1 x = (x 1,..., x n ) =. =. x n 21 / 54

Merkinnöistä Luentomonisteessa ja kalvoilla välillä vektorit esiintyvät tummennettuina. Taululla ja siten myös kalvoilla vektorien tummennus voi jäädä merkkaamatta, mutta yritän käsinkirjoituksessa merkitä vektorit seuraavasti X = X (= X ). 22 / 54

n-ulotteinen satunnaisvektori Määritelmä 3.5 Jos X 1,..., X n ovat samalla perusjoukolla Ω määriteltyjä satunnaismuuttujia, niin X = = (X 1,..., X n ) on n-ulotteinen satunnaisvektori (lyh. sv), (engl. X random vector). Se on kuvaus Ω R n siten, että X 1 (ω) X 1 (ω) X(ω) = (ω) = (X 1 (ω),..., X n (ω)) =. =. X X n (ω) X n (ω) 23 / 54

Yhteiskertymäfunktio Määritelmä 3.6 (Yhteiskertymäfunktio) Satunnaismuuttujien X 1,..., X n yhteiskertymäfunktio (ykf, cdf) eli satunnaisvektorin X = X = (X 1,..., X n ) kertymäfunktio on F X1,...,X n (x 1,..., x n ) = F X (x) = F X ( x) = P(X 1 x 1,..., X n x n ), jossa x = x = (x 1,..., x n ) R n. Satunnaisvektorin jakauma määritellään samoin kuin aikaisemmin: B P(X B), B R n. Ykf määrää jakauman myös dimensiossa n. Korkeissa dimensioissa ykf:a käytetään harvoin konkreettisissa laskuissa, vaan se on lähinnä teoreettinen apuväline. 24 / 54

Yhteispistetodennäköisyysfunktio Jos kaikki satunnaisvektorin X komponentit X i ovat diskreettejä sm:ia, niin sen ptnf eli sm:ien X i yhteispistetodennäköisyysfunktio (yptnf) on f X (x) = f X ( x) = P(X = x) = P(X 1 = x 1,..., X n = x n ). (3.3) 25 / 54

3.4 Satunnaismuuttujien riippumattomuus Määritelmä 3.7 (Kahden sm:n riippumattomuus) Satunnaismuuttujat X ja Y ovat riippumattomia, jos P(X A ja Y B) = P(X A) P(Y B), kaikilla A, B R. Tämä voidaan merkitä X Y. Huom. Luonnollisesti vaadimme joukoilta A ja B sen, että { X A } ja { Y B } ovat tapahtumia. 26 / 54

Riippumattomuuden tulkinta Jos X Y ja P(Y B) > 0, niin mille tahansa A pätee P(X A Y B) = = P(X A, Y B) P(Y B) P(X A) P(Y B) P(Y B) = P(X A). Lasku voidaan tietenkin toistaa vaihtamalla X :n ja Y :n roolit. Jos X Y, niin tieto Y :n arvosta ei anna tietoa X :n jakaumasta ja kääntäen tieto X :n arvosta ei anna tietoa Y :n jakaumasta. 27 / 54

Riippumattomien sm:ien ykf faktoroituu Lause 3.5 Seuraavat seikat ovat yhtäpitäviä, (a) X Y (b) Yhteiskertymäfunktio faktoroituu reunakertymäfunktioiden tuloksi, eli F X,Y (x, y) = F X (x) F Y (y) kaikilla x, y R. 28 / 54

The cdf of rv s factorizes Theorem The following are equivalent, (a) X Y (b) The cumulative distribution function factorizes to the product of the marginal distribution function, i.e. F X,Y (x, y) = F X (x) F Y (y) for every x, y R. 29 / 54

Riippumattomien diskreettien sm:ien yptnf faktoroituu Lause 3.6 Jos X ja Y ovat diskreettejä satunnaismuuttujia, niin seuraavat seikat ovat yhtäpitäviä, (a) X Y (b) Yhteispistetodennäköisyysfunktio faktoroituu reunapistetodennäköisyysfunktioiden tuloksi, eli f X,Y (x, y) = f X (x) f Y (y) kaikilla x, y. 30 / 54

The joint pmf of discrete rv s factorizes Theorem If X and Y are discrete rv s, then the following are equivalent, (a) X Y (b) The joint probability mass function factorizes to the product of the marginal probability mass functions, i.e. f X,Y (x, y) = f X (x) f Y (y) for every x, y. 31 / 54

Riippumattomien satunnaismuuttujien muunnokset ovat riippumattomia Lause 3.7 Jos X Y, ja g : R R sekä h : R R ovat funktioita, niin myös g(x ) h(y ). Todistus. Olkoot A, B R mielivaltaisia. Tällöin {g(x ) A, h(y ) B} = {X g 1 (A), Y h 1 (B)}. Koska X Y, on P(g(X ) A, h(y ) B) = P(X g 1 (A), Y h 1 (B)) = P(X g 1 (A)) P(Y h 1 (B)) = P(g(X ) A) P(h(Y ) B). 32 / 54

The transformations of independent random variables stay independent Theorem Suppose X Y. If g : R R and h : R R are functions, then g(x ) h(y ). Proof. Let A, B R be freely chosen. Then {g(x ) A, h(y ) B} = {X g 1 (A), Y h 1 (B)}. Since X Y, we have P(g(X ) A, h(y ) B) = P(X g 1 (A), Y h 1 (B)) = P(X g 1 (A)) P(Y h 1 (B)) = P(g(X ) A) P(h(Y ) B). 33 / 54

Usean sm:n riippumattomuus Määritelmä 3.8 Satunnaismuuttujat X 1,..., X n ovat riippumattomia, jos n n P( {X i B i }) = P(X i B i ), kaikilla B 1,..., B n R. i=1 i=1 Tämä voidaan merkitä X 1,..., X n. 34 / 54

Independence of multiple rv s Defintion The random variables X 1,..., X n are independent, if n n P( {X i B i }) = P(X i B i ), for every B 1,..., B n R. i=1 i=1 This can be denoted by X 1,..., X n. 35 / 54

Esimerkki: binomijakauman synty toistetussa Bernoullin kokeessa Olkoot Y 1,..., Y n riippumattomia Bernoullin jakaumaa noudattavia satunnaismuuttujia, joilla on yhteinen onnistumistn 0 p 1. Kullakin Y i :llä on ptnf:na f (y) = p y (1 p) 1 y, kun y = 0, 1. Jos Y i = 1 niin onnistutaan toistossa i, ja muuten epäonnistutaan toistossa i. Olkoon X onnistumisten lukumäärä n toistossa, eli X = Y 1 + + Y n = n Y i. i=1 Mikä on X :n jakauma? 36 / 54

X :n jakauman johto, 1/2 Jos (y 1,..., y n ) on jokin jono nollia ja ykkösiä, niin riippumattomuuden nojalla P(Y 1 = y 1, Y 2 = y 2,..., Y n = y n ) = n p y i (1 p) 1 y i i=1 = p s (1 p) n s, jossa s = n i=1 y i, eli s on ykkösten ja n s on nollien lukumäärä jonossa (y 1,..., y n ). 37 / 54

X :n jakauman johto, 2/2 Satunnaismuuttuja X saa arvon 0 x n jos ja vain jos satunnaismuuttujat Y 1,..., Y n saavat sellaiset arvot y 1,..., y n, että jonossa (y 1,..., y n ) on x ykköstä (ja n x nollaa). Tällaisia jonoja on ( n x) kappaletta, ja niistä kunkin tn on p x (1 p) n x. Todennäköisyyden additiivisuuden nojalla ( ) n f X (x) = P(X = x) = p x (1 p) n x, kun x = 0, 1,..., n. x Ts. X Bin(n, p), eli X noudattaa binomijakaumaa otoskokoparametrilla n ja onnistumistodennäköisyydellä p. 38 / 54

Numeroituvasti äärettömän monen satunnaismuuttujan riippumattomuus Määritelmä 3.9 Satunnaismuuttujat X 1, X 2,... ovat riippumattomia, jos satunnaismuuttujat X 1,..., X n ovat riippumattomia kaikilla n 2. Tätä käsitettä tarvitaan myöhemmin, kun puhutaan jonosta riippumattomia satunnaismuuttujia. 39 / 54

Independence of countably infinitely many random variables Defintion The random variables X 1, X 2,... are independent, if the random variables X 1,..., X n are independent for every n 2. We will later need this concept, while discussing sequences of independent random variables. 40 / 54

3.5 Trinomijakauma ja multinomijakauma Trinomijakauma yleistää binomijakauman mutkattomasti kaksiulotteiseksi diskreetiksi jakaumaksi. Multinomijakauma on trinomijakauman yleistys korkeampaan ulottuvuuteen. 41 / 54

Trinomijakauma Olkoot p 1, p 2 > 0 todennäköisyyksiä siten, että p 1 + p 2 < 1. Olkoon n 1 positiivinen kokonaisluku. Tällöin ( f (x, y) = n x, y, n x y on trinomijakauman Trin(n, (p 1, p 2 )) yptnf. ) p x 1 p y 2 (1 p 1 p 2 ) n x y, x, y 0, x + y n. Kaavassa esiintyvä trinomikerroin (tai yleisemmin multinomikerroin) on (ks. jakso 1.7) ( ) n n! = x, y, n x y x! y! (n x y)! 42 / 54

Kuva trinomijakauman Trin(8, (0.3, 0.4)) yptnf:stä Ensimmäisessä tavassa funktio z = f (x, y) on esitetty perspektiivikuvana. Toisessa tavassa kolmas dimensio esitetään piirtosymbolin koon avulla: funktion f (x, y) arvo on verrannollinen pisteeseen (x, y) piirretyn ympyrän pinta-alaan. 0.08 0.06 z 0.04 0.02 y 0 2 4 6 8 0.00 y 0 2 4 6 8 x x 43 / 54

Miksi f (x, y) on ypntf Multinomikaavan perusteella 1 = [p 1 + p 2 + (1 p 1 p 2 )] n = ( ) n p1 x p y 2 x, y, n x y (1 p 1 p 2 ) n x y, x,y jossa summa otetaan niiden kokonaislukuparien (x, y) yli, joille x, y 0 ja x + y n. Lisäksi jokainen summan termeistä on positiivinen. 44 / 54

Trinomijakauman toistokoetulkinta Tarkastellaan koetta, jonka yhdessä toistossa saadaan täsmälleen yksi tuloksista A, B tai C. Olkoon yhdessä toistossa p 1 = P(A), p 2 = P(B), p 3 = P(C) = 1 p 1 p 2. Toistetaan tätä koetta riippumattomasti n kertaa. 45 / 54

Toistokoetulkinta (jatkoa 1) Z i kertoo lopputuloksen toistossa numero i siten, että 1 jos tulos on A, Z i = 2 jos tulos on B, 3 jos tulos on C. Tällöin kaikilla i P(Z i = z) = p z, kun z = 1, 2, 3. Määritellään, että sm X on niiden i lkm, joilla Z i = 1 (eli lopputuloksen A lkm) ja sm Y on niiden i lkm, joilla Z i = 2 (eli lopputuloksen B lkm). niitä i, joilla Z i = 3 (eli lopputuloksen C lkm) on n X Y. 46 / 54

Toistokoetulkinta (jatkoa 2) Jos (z 1, z 2,..., z n ) on arvoista 1, 2 tai 3 koostuva jono, niin P(Z 1 = z 1, Z 2 = z 2,..., Z n = z n ) = p z1 p z2... p zn = p x 1 p y 2 pn x y 3. x on lopputuloksen A lkm annetussa jonossa eli niiden i lkm, joilla z i = 1 y on lopputuloksen B lkm eli niiden i lkm, joilla z i = 2 lopputuloksen C lkm eli niiden i lkm, joille z i = 3 on n x y. 47 / 54

Toistokoetulkinta (jatkoa 3) Kiinnitetään kokonaisluvut x ja y siten, että x, y 0 ja x + y n. Sellaisia jonoja (z 1, z 2,..., z n ) jotka koostuvat arvoista 1, 2 tai 3, joissa tulosta 1 on x kpl ja tulosta 2 on y kpl on multinomikertoimen ( ) n x, y, n x y ilmaisema määrä, sillä kukin tälläinen jono vastaa täsmälleen yhtä tapaa osittaa n-alkionen joukko kolmeen osaan siten, että ensimmäiseen osaan tulee x kpl alkioita ja toiseen osaan y kpl alkioita (jolloin kolmanteen osaan jää n x y kpl alkioita). Jokaiselle tällaiselle jonolle P(Z 1 = z 1, Z 2 = z 2,..., Z n = z n ) = p x 1 p y 2 pn x y 3. 48 / 54

Toistokoetulkinta (loppu) Tällä tavalla nähdään, että ( P(X = x, Y = y) = jossa p 3 = 1 p 1 p 2. n x, y, n x y ) p x 1 p y 2 pn x y 3, Toisin sanoen satunnaismuuttujien X ja Y yhteisjakauma on trinomijakauma otoskokoparametrilla n ja todennäköisyysparametreilla (p 1, p 2 ). 49 / 54

Reunajakaumat toistokoetulkinnan avulla Sm:n X reunajakauma on X Bin(n, p 1 ). Ajattele toistokoetta, jossa onnistutaan, kun saadaan lopputulos A ja muuten epäonnistutaan. Vastaavasti, Y Bin(n, p 2 ). 50 / 54

Multinomijakauma Olkoon (p 1,..., p n ) todennäköisyysvektori, eli kukin p i 0, ja p 1 + + p n = 1. Multinomijakauman Mult(k, (p 1,..., p n )) ptnf on ( ) k f (x 1,..., x n ) = p x 1 1 x 1,..., x... pxn n, (3.4) n kun x 1 + + x n = k ja nolla muuten. Tässä multinomijakaumaa pidetään n-ulotteisena jakauma, mutta joissakin yhteyksissä on mielekkäämpää pitää sitä (n 1)-ulotteisena jakauma (jolloin X n = k X 1 X n 1 ). Tällä konventiolla binomijakauma ja trinomijakauma ovat multinomijakauman erikoistapauksia. 51 / 54

Multinomijakauman toistokoetulkinta Multinomijakauma syntyy, kun tarkastellaan k-kertaista toistokoetta, jossa kussakin toistossa toteutuu yksi n:sta vaihtoehdosta, jossa toistot ovat toisistaan riippumattomia. Muuttujat x 1,..., x n ovat eri lopputulosten frekvenssit k:ssa toistossa. Kaava (3.4) perustellaan samalla tavalla kuin trinomijakauman tapauksessa; viimekädessä vedotaan jaksossa 1.7 esitettyyn multinomikertoimien kombinatoriseen luonnehdintaan. 52 / 54

3.6 Satunnaisvektoreiden riippumattomuus Satunnaisvektoreille X ja Y määritellään riippumattomuus täysin vastaavasti kuin satunnaismuuttujille. Samalla päättelyllä kuin aikaisemmin, X Y g(x) h(y), kun g ja h ovat mielivaltaisia vektoriargumentin reaaliarvoisia funktioita. 53 / 54

Riippumattomista satunnaismuuttujista kootut satunnaisvektorit ovat riippumattomia Jos satunnaismuuttujat X 1, X 2,..., X k ; Y 1, Y 2,..., Y m ovat riippumattomia, niin tällöin niistä koostuvat satunnaisvektorit X ja Y ovat riippumattomia, jossa X = (X 1,..., X k ), Y = (Y 1,..., Y m ). Perustelu: satunnaisvektoreiden ykf faktoroituu reunasatunnaisvektoreiden kertymäfunktioiden tuloksi, ts. F X,Y (x, y) = F X (x) F Y (y), kaikilla x, y, koska se faktoroituu peräti komponenttisatunnaismuuttujien kertymäfunktioiden tuloksi. 54 / 54