8.1 Ehdolliset jakaumat

Samankaltaiset tiedostot
8.1 Ehdolliset jakaumat

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Harjoitus 4 Tehtävä 1

Tilastomatematiikka Kevät 2008

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Todennäköisyyden ominaisuuksia

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Moniulotteiset satunnaismuuttujat ja jakaumat

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

3.1 Kaksiulotteinen satunnaisvektori ja sen jakauma

Matemaattisten tieteiden kandiohjelma / MTL Todennäköisyyslaskenta IIb Kurssikoe (kesto 2h 30 min)

Johdatus tn-laskentaan torstai

4.0.2 Kuinka hyvä ennuste on?

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3.6 Su-estimaattorien asymptotiikka

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

7 Kaksiulotteinen jakauma

Sovellettu todennäköisyyslaskenta B

7 Kaksiulotteinen jakauma

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

3.1 Kaksiulotteinen satunnaisvektori ja sen jakauma

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

k S P[ X µ kσ] 1 k 2.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

4. Todennäköisyyslaskennan kertausta

11 Raja-arvolauseita ja approksimaatioita

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin (2008) 1/5

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Yleistä tietoa kokeesta

Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat

Todennäköisyyslaskun kertaus. Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

0 3 y4 dy = 3 y. 15x 2 ydx = 15. f Y (y) = 5y 4 1{0 y 1}.

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Satunnaismuuttujien muunnokset ja niiden jakaumat

4.1 Diskreetin satunnaismuuttujan odotusarvo

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Mat Sovellettu todennäköisyyslasku A

Johdatus tn-laskentaan perjantai

Olkoon R S otosavaruuksien R ja S karteesinen tulo: Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan:

2. Uskottavuus ja informaatio

805306A Johdatus monimuuttujamenetelmiin, 5 op

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

5 Tärkeitä yksiulotteisia jakaumia

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Generointi yksinkertaisista diskreeteistä jakaumista

Differentiaali- ja integraalilaskenta 1 Ratkaisut 5. viikolle /

031021P Tilastomatematiikka (5 op) viikko 3

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

9 Moniulotteinen jakauma

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

1. Tilastollinen malli??

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

Todennäköisyyslaskenta, syksy Petri Koistinen Matematiikan ja tilastotieteen laitos Helsingin yliopisto

Sallitut apuvälineet: kirjoitusvälineet, laskin sekä käsinkirjoitettu, A4-kokoinen lunttilappu ja MAOL taulukkokirjaa

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

30A02000 Tilastotieteen perusteet

IV. TASAINEN SUPPENEMINEN. f(x) = lim. jokaista ε > 0 ja x A kohti n ε,x N s.e. n n

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Jatkuvat satunnaismuuttujat

Satunnaismuuttujan odotusarvo ja laskusäännöt

Matematiikan tukikurssi

JATKUVAT JAKAUMAT Laplace-muunnos (Laplace-Stieltjes-muunnos)

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

Mat Sovellettu todennäköisyyslasku A

Luento 9: Yhtälörajoitukset optimoinnissa

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 3. Kaksiulotteiset satunnaismuuttujat

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

r > y x z x = z y + y x z y + y x = r y x + y x = r

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

Tutkimustiedonhallinnan peruskurssi

6. laskuharjoitusten vastaukset (viikot 10 11)

Transkriptio:

8 Ehdollinen jakauma Tämän kappaleen tärkeitä käsitteitä: Ehdollinen jakauma; ehdollinen ptnf/tf. Kertolaskusääntö eli ketjusääntö yhteisjakauman esittämiseksi. Ehdollinen odotusarvo ja ehdollinen varianssi. Yhteisjakauman määrittely hierarkkisesti kertolaskusäännön avulla.

8.1 Ehdolliset jakaumat Jos sv:lla (X, Y ) on diskreetti jakauma, niin sm:n X ehdollinen ptnf ehdolla Y = y määritellään ehdollisen todennäköisyyden kaavan avulla, P(X = x, Y = y) f X Y (x y) = P(X = x Y = y) = P(Y = y) = f X,Y (x, y), kun f Y (y) > 0. f Y (y) (8.1) Funktio f X Y ( y) on satunnaismuuttujan X ptnf, kun tiedetään, että Y = y. Ehdollinen ptnf f Y X (y x) määritellään analogisesti. Kaavaa (8.1) pidetään mallina, kun määritellään ehdollinen tiheysfunktio jatkuvan yhteisjakauman tapauksessa.

Ehdollinen tiheysfunktio, kun yhteisjakauma on jatkuva Määritelmä 8.1 Olkoon (X, Y ):llä jatkuva jakauma tiheysfunktiolla f X,Y. Tällöin sm:n X ehdollinen tiheysfunktio ehdolla Y = y on f X Y (x y) = f X,Y (x, y), x R, f Y (y) kun y on sellainen, että f Y (y) > 0. Vastaavasti määritellään kun f X (x) > 0. f Y X (y x) = f X,Y (x, y), y R, f X (x)

Conditional density function, when the joint distribution is continuous Definition Suppose (X, Y ) has continuous joint distribution with joint density function f X,Y. Then the conditional density function of the rv X given Y = y is f X Y (x y) = f X,Y (x, y), x R, f Y (y) when y is such that f Y (y) > 0. Similarly, we define when f X (x) > 0. f Y X (y x) = f X,Y (x, y), y R, f X (x)

Huomautuksia ehdollisen tiheysfunktion määritelmästä Jos f Y (y) > 0, niin ehdollinen tiheysfunktio x f X Y (x y) on tiheysfunktio, sillä se on ei-negatiivinen ja f X Y (x y) dx = 1 f Y (y) f X,Y (x, y) dx = 1. Geometrinen tulkinta: Funktio x f X Y (x y) saadaan yhteistiheysfunktiosta f X,Y normalisoimalla sen vaakasuora leike x f X,Y (x, y) tiheysfunktioksi. Funktio y f Y X (y x) saadaan normalisoimalla pystysuora leike y f X,Y (x, y) tiheysfunktioksi.

Ytf ja ehdollisia tiheysfunktioita x f X Y (x y) y = 6 y 5 0 5 10 15 0 2 4 6 8 x 0.0 0.2 0.4 0.6 0.0 0.2 0.4 0.6 0.0 0.2 0.4 0.6 0 2 4 6 8 y = 3 0 2 4 6 8 y = 0 0 2 4 6 8

Onko ehdollinen tiheysfunktio hyvin määritelty? Jatkuvan yhteisjakauman voi esittää useamman kuin yhden tiheysfunktion avulla kunhan ne vain yhtyvät melkein kaikkialla. Ehdollisen tf:n määrittelyyn saadaan käyttää mitä tahansa ytf:n versiota, joten ehdollinen tf ei ole yksikäsitteinen funktio. Monikäsitteisyydestä ei synny ongelmia, minkä takia sitä ei oteta huomioon puhetavassa: puhutaan ehdollisesta tiheysfunktiosta (eikä esim. ehdollisen tiheysfunktion tietystä versiosta). Jatkuvan yhteisjakauman tapauksessa ehdon {Y = y} todennäköisyys on aina nolla. Tämän takia ehdolliselle tiheysfunktiolle ei voida antaa suoraan tulkintaa ehdollisen todennäköisyyden avulla, vaan ehdollisten todennäköisyyksien raja-arvojen kautta.

Ehdollisen tf:n tulkinta ehdollisten tn:ien raja-arvojen avulla Teemme uskottavaksi, että jos ytf f X,Y on riittävän sileä ja f Y (y) > 0, niin tällöin P(X A y Y y + h) f X Y (x y) dx, h 0+ A (8.2) kaikilla A R. Ts. pienillä h > 0 ehdollinen todennäköisyys P(X A y Y y + h) saadaan osapuilleen selville integroimalla ehdollista tiheysfunktiota f X Y (x y) muuttujan x suhteen joukon A yli mielivaltaiselle A R. Jatkuvan sm:n arvo havaitaan vain tietyllä tarkkuudella, joten sovelluksissa tehdään tämän tapainen tulkinta, kun käsitellään ehdollista tf:a ehdolla Y = y, jossa y on havaittu arvo.

Raja-arvotuloksen perustelu Lähdetään liikkeelle esityksestä P(X A y Y y + h) = = 1 hp(x A, y Y y + h) P(y Y y + h) 1 h A dx 1 y+h h y 1 h f X,Y (x, t) dt y+h y f Y (u) du Sekä osoittajassa että nimittäjässä esiintyy muotoa 1 h y+h y g(u) du olevia integraalikeskiarvoja, jotka lähestyvät arvoa g(y) aika yleisillä oletuksilla, kun h 0+.

Miksi integraalikeskiarvo suppenee Oletetaan esimerkin vuoksi, että funktio g on jatkuva pisteessä y ja integroituva jossakin sen ympäristössä. Olkoon ɛ > 0 mielivaltainen. Valitaan (jatkuvuuden nojalla) δ > 0 siten, että g(u) g(y) ɛ kaikilla u, joille u y < δ. Jos 0 < h < δ, niin g(y) ɛ = 1 h y+h y 1 h (g(y) ɛ) du 1 h y+h y y+h y g(u) du (g(y) + ɛ) du = g(y) + ɛ. Tämä todistaa, että integraalikeskiarvo lähestyy raja-arvoa g(y), kun h 0+.

Perustelu päättyy Sovelletaan integraalikeskiarvon raja-arvoa kaavassa P(X A y Y y + h) = A dx 1 y+h h y 1 h f X,Y (x, t) dt y+h y f Y (u) du Vaihdetaan osoittajassa huolettomasti rajankäynnin ja integroinnin järjestys A P(X A y Y y + h) f X,Y (x, y) dx h 0+ f y (y) f X,Y (x, y) = dx. f Y (y) Mitkä olisivat tyylikkäät oletukset, joilla kaikki tämän perustelun askeleet saataisiin vietyä läpi täsmällisesti? A

8.2 Kertolaskusääntö eli ketjusääntö Ehdollisen ptnf/tf:n määritelmästä saadaan kertolaskusääntö eli ketjusääntö, f X,Y (x, y) = f X (x) f Y X (y x) = f Y (y) f X Y (x y), kaikilla x, y. (8.3) Mitä tämä tarkoittaa jatkuvan jakauman tapauksessa, jossa ytf ei ole yksikäsitteinen? Jos reunatiheysfunktio f X (x) ja ehdollinen tf f Y X (y x) johdetaan lähtemällä liikkeelle joistakin ytf:n (mahdollisesti toisistaan eriävistä) versioista, niin niiden tulo kelpaa yhteistiheysfunktioksi.

Ongelma kertolaskusäännön f X (x) f Y X (y x) soveltamisessa Ehdollinen tiheys f Y X (y x) ei ole välttämättä määritelty kaikilla x. Kertolaskusäännön yhteydessä ehdollisen tf:n tai ptnf:n määritelmää laajennetaan (tarvittaessa) jollakin tavalla niihin pisteisiin, joissa ehtomuuttujan tiheys on nolla, esim. sopimalla, että f X,Y (x, y), kun f X (x) > 0, f Y X (y x) = f X (x) (8.4) 0, muuten. Toiselle ehdolliselle tf:lle f X Y (x y) käytetään samanlaista laajennusta. Tämän jälkeen kertolaskusääntö pitää ongelmattomasti paikkansa kaikilla x, y R. Nämä komplikaatiot eivät aiheuta todellisia ongelmia käytännön laskuissa.

Bayesin kaava (tiheysfunktioille) Kertolaskusäännöstä voidaan ratkaista toinen ehdollisista tiheysfunktioista, jos reunatiheydet sekä toinen ehdollinen tf tunnetaan. Esim., kun f X (x) > 0 (ja muut x-arvot eivät ole relevantteja), on f Y X (y x) = f X,Y (x, y) f X (x) = f Y (y) f X Y (x y). (8.5) f X (x) Tämä on Bayesin kaava tiheysfunktioille.

Bayesin kaava tulkittuna verrannollisuustulokseksi Bayesin kaavasta seuraa, että kiinteällä x f Y X (y x) = 1 f X (x) f Y (y) f X Y (x y) f Y (y) f X Y (x y) = f X,Y (x, y). Verrannollisuus g(y) h(y) tarkoittaa sitä, että g(y) = c h(y) jollakin verrannollisuusvakiolla c (joka saa riippua parametreista, ja muista muuttujista paitsi muuttujasta y). Tämän ansiosta ehdollinen jakauma on toisinaan helppo tunnistaa tarkastelemalla ytf:n lauseketta.

Esimerkki verrannollisuustarkastelusta Esimerkissä 7.2 (tasajakauma funktion h(x) = exp( 1 2 x 2 ) kuvaajan alla) ytf:llä on lauseke f X,Y (x, y) = 1 2π 1{0 < y < exp( 1 2 x 2 )}. Ehdolliset tf:t voidaan laskea joko jakamalla ytf esimerkissä johdetuilla reunatf:oilla, tai seuraavalla päättelyllä.

f Y X esimerkissä Kiinteällä x on ytf:llä f X,Y (x, y) nollaa suurempi vakioarvo, kun 0 < y < exp( 1 2 x 2 ) ja muuten arvo nolla. Tämän takia ehdollinen jakauma on tasajakauma, Y (X = x) U(0, exp( 1 2 x 2 )). Kun muistetaan, että reunajakaumassaan X N(0, 1), niin yhteisjakauma voidaan esittää muodossa Y X U(0, exp( 1 2 X 2 )), X N(0, 1). Tämä on esimerkki yhteisjakauman hierarkkisesta määrittelystä (reunajakauma f X ja ehdollinen jakauma f Y X ).

f X Y esimerkissä Kiinteällä 0 < y < 1 on ytf:llä nolla suurempi vakioarvo tietyllä x-akselin välillä, joka saadaan ratkaisemalla epäyhtälö 0 < y < exp( 1 2 x 2 ) muuttujan x suhteen. Tämä lasku ratkaistiin jo aiemmin. Tuloksesta tunnistetaan, että ehdollinen jakauma on tasajakauma X (Y = y) U( 2 ln y, 2 ln y), 0 < y < 1. Tämä tulos ja Y :n reunajakauma (ks. esimerkki 7.2) kertovat yhteisjakaumalle toisen hierarkkisen esityksen (f Y ja f X Y ).

8.3 Diskreetin ja jatkuvan muuttujan yhteisjakauma Tarkastellaan sm:ien X ja Y yhteisjakaumaa siinä tapauksessa, kun X :n jakauma on diskreetti Y :n jatkuva. Olkoon X :n mahdolliset arvot x 1, x 2,... ja olkoon sen (reuna-)ptnf f X. Voidaan osoittaa, että tällöin on olemassa ehdolliset tiheysfunktiot y f Y X (y x i ), i 1 siten, että P(X = x i, Y B) = f X (x i ) f Y X (y x i ) dy, B kaikilla i ja kaikilla B R, mutta todistuksessa tarvitaan mittateoriaa (tulos seuraa ns. Radonin-Nikodymin lauseesta).

Diskreetin X ja jatkuvan Y yhteisjakauma Yhteisjakauman esittää funktio f X,Y (x, y) = f X (x) f Y X (y x). Seuraavantyyppiset todennäköisyydet saadaan laskettua summaamalla diskreetin muuttujan ja integroimalla jatkuvan muuttujan suhteen, P(X A, Y B) = f X,Y (x, y) dy, A, B R. x A B Voimme myös tässä tapauksessa kutsua yhteisjakauman esitystä f X,Y tiheydeksi tai tiheysfunktioksi, mutta on tärkeää pitää mielessä, että yhden muuttujan suhteen summataan ja toisen suhteen integroidaan.

Ehdolliset jakaumat, kun X diskreetti ja Y jatkuva Jos P(X = x i ) > 0, niin jatkuvan muuttujan Y ehdollinen tiheys on f Y X (y x i ). Diskreetin muuttujan X ptnf ehdolla Y = y määritellään Bayesin kaavalla, siis kun f Y (y) > 0. f X Y (x y) = f X,Y (x, y), f Y (y) Tämän kaavan voisi myös motivoida rajankäynnin kautta samaan tapaan kuin jatkuvan yhteisjakauman tapauksessa tehtiin. Edellä f Y (y) = x f X,Y (x, y).

Diskreetti X ja jatkuva Y Kertolaskusääntö ja Bayesin kaava ovat voimassa myös tässä tapauksessa. Tarvittaessa ehdollisen tiheyden f Y X (y x) ja ehdollisen ptnf:n f X Y (x y) määritelmää voidaan laajentaa myös sellaisille argumenteille, joilla ne eivät vielä tulleet määriteltyä.

Diskreetti X ja jatkuva Y : tiedostamattoman tilastotieteilijän laki Lause 8.1 Olkoon (X, Y ) sv, jossa X :llä on diskreetti ja Y :llä jatkuva jakauma, ja olkoon Z = g(x, Y ) jokin sen reaaliarvoinen muunnos. Tällöin EZ = g(x, y) f X,Y (x, y) dy = g(x, y) f X,Y (x, y) dy x x mikäli x g(x, y) f X,Y (x, y) dy <. Diskreetin muuttujan suhteen summataan ja jatkuvan suhteen integroidaan.

Discrete X and continuous Y : law of the unconscious statistician Theorem Let (X, Y ) be random vector, where X has discrete and Y has continuous distribution, and let Z = g(x, Y ) be its realvalued transformation. Then EZ = g(x, y) f X,Y (x, y) dy = g(x, y) f X,Y (x, y) dy x x provided x g(x, y) f X,Y (x, y) dy <. We sum over discrete variable and integrate over the continuous.

8.4 Ehdollinen odotusarvo Määritelmä 8.2 (Ehdollinen odotusarvo ehdolla sm:n arvo) Olkoon (X, Y ) sv, g(x, Y ) jokin sen muunnos, ja oletetaan, että osaamme määritellä sm:n Y ehdollisen jakauman ehdolla X = x. Sm:n g(x, Y ) ehdollinen odotusarvo ehdolla X = x, E(g(X, Y ) X = x), on satunnaismuuttujan g(x, Y ) odotusarvo, kun Y :n jakaumana käytetään sen ehdollista jakaumaa ehdolla X = x. Ts. { g(x, y) fy E(g(X, Y ) X = x) = X (y x) dy, Y jatkuva y g(x, y) f Y X (y x), Y diskreetti.

8.4 Conditional expectation Definition (Conditional expectation given the value of rv) Let (X, Y ) be random vector, g(x, Y ) its transformatio, and suppose we can define the conditional distribution of Y given X = x. The conditional expectation of rv g(x, Y ) given X = x, E(g(X, Y ) X = x), is the expectation of rv g(x, Y ), when we use the conditional distribution of Y given X = x as its distribution. In other words, { g(x, y) fy E(g(X, Y ) X = x) = X (y x) dy, Y continuous y g(x, y) f Y X (y x), Y discrete.

Tunnetut tekijät voidaan vetää ulos Jos funktio g on muotoa niin tietenkin g(x, y) = g 1 (x) g 2 (x, y), E(g 1 (X ) g 2 (X, Y ) X = x) = g 1 (x) E(g 2 (X, Y ) X = x). (8.7) Tämä voidaan ilmaista sanomalla, että tunnetut tekijät saadaan vetää ulos ehdollisesta odotusarvosta. Jos ehtona on X = x, niin kaikki yksinomaan sm:sta X riippuvat tekijät ovat tunnettuja.

Regressiofunktio Määritelmä 8.3 (Y :n ehdollinen odotusarvo ehdolla X = x; regressiofunktio) Sm:n Y ehdollinen odotusarvo ehdolla X = x on sen ehdollisen jakauman odotusarvo, E(Y X = x). Funktiota x E(Y X = x) kutsutaan Y :n regressiofunktioksi X :n suhteen (engl. regression function of Y on X ). Regressiofunktio saadaan kaavoilla { y fy E(Y X = x) = X (y x) dy, jos Y jatkuva, y y f Y X (y x), jos Y diskreetti.

Ehdollinen varianssi Määritelmä 8.4 (Ehdollinen varianssi ehdolla sm:n arvo) Sm:n g(x, Y ) ehdollinen varianssi ehdolla X = x, var(g(x, Y ) X = x), on satunnaismuuttujan g(x, Y ) varianssi, kun Y :n jakaumana käytetään sen ehdollista jakaumaa ehdolla X = x. Kun merkitään m(x) = E(g(X, Y ) X = x), niin { ( ) 2 g(x, y) m(x) fy var(g(x, Y ) X = x) = X (y x) dy, Y jva, ( ) 2 y g(x, y) m(x) fy X (y x), Y diskr.

Conditional variance Definition (Conditional variance given the value of rv) The conditional variance of rv g(x, Y ) given X = x, var(g(x, Y ) X = x), it the variance of the random variable g(x, Y ), when we use the conditional distribution of Y given X = x as its distribution. If we denote m(x) = E(g(X, Y ) X = x), then { ( ) 2 g(x, y) m(x) fy var(g(x, Y ) X = x) = X (y x) dy, Y cont, ( ) 2 y g(x, y) m(x) fy X (y x), Y discr.

Toinen kaava ehdolliselle varianssille Ts. kun merkitään m(x) = E(g(X, Y ) X = x), niin var(g(x, Y ) X = x) = E ( (g(x, Y ) m(x )) 2 X = x ) Jos tässä binomi kerrotaan auki, lasketaan odotusarvo ja järjestellään termejä, nähdään että var(g(x, Y ) X = x) = E ( (g(x, Y )) 2 X = x ) m(x) 2. (8.6) Tämä on tutun kaavan var Z = EZ 2 (EZ) 2 vastine ehdolliselle varianssille.

Ehdollinen odotusarvo ja ehdollinen varianssi esimerkissä 1 Yhteisjakauma, ehdollisia tiheysfunktioita y f Y X (y x) ja ehdollinen odotusarvo E(Y X = x). 2 Ehdollinen varianssi var(y X = x). y 5 0 5 10 15 ehdollinen varianssi 0.0 0.5 1.0 1.5 2.0 2.5 0 2 4 6 8 x 0 2 4 6 8 x

Ehdollinen odotusarvo satunnaismuuttujana Määritelmä 8.5 (Ehdollinen odotusarvo ehdolla satunnaismuuttuja) Merkitään väliaikaisesti m(x) = E(g(X, Y ) X = x). Sovitaan, että m(x) = 0 niillä x, joilla m(x) se ei muuten tule määritellyksi, eli joilla ehdollinen jakauma Y (X = x) ei ole määritelty. Tämän jälkeen voidaan vapaasti puhua satunnaismuuttujasta m(x ). Sitä kutsutaan sm:n g(x, Y ):n ehdolliseksi odotusarvoksi ehdolla sm X. Ehdolliselle odotusarvolle ehdolla sm käytetään merkintää E(g(X, Y ) X ) = m(x ).

Conditional expectation as random variable Definition (Conditional expectation given random variable) Let us temporarily define m(x) = E(g(X, Y ) X = x). Let s agree, that m(x) = 0 for those x, for which m(x) is not yet defined i.e. for those for which the conditional distribution of Y (X = x) is not defined. Then we can freely talk about random variable m(x ). This random variable is called the conditional expectation of g(x, Y ) given rv X. We will use the notation E(g(X, Y ) X ) = m(x ) for the conditional expectation given rv.

Huomautuksia ehdollisesta odotusarvosta E(g(X, Y ) X ) Määrittelimme E(g(X, Y ) X ) = m(x ), jossa m(x) = E ( g(x, Y ) X = x ). Mieleen saattaa juolahtaa käyttää merkintää E(g(X, Y ) X = X ), mutta se olisi järjetön. Ts. vakiintunut merkintä E ( g(x, Y ) X = x ) on ongelmallinen, koska siihen ei saa sijoittaa symbolin x tilalle satunnaismuuttujaa X. Ehdollinen odotusarvo E(g(X, Y ) X ) on sellainen sm, joka saa arvon E(g(X, Y ) X = x) (todennäköisyydellä yksi) silloin, kun X saa arvon x.

Ehdollisen odotusarvon ominaisuuksia Ehdollisella odotusarvolla E(g(X, Y ) X = x) ehdolla sm:n arvo on seuraavat odotusarvon ominaisuudet: lineaarisuus, positiivisuus, säilyttää järjestyksen, vakion ehdollinen odotusarvo on vakio jos W on sm ja f W (w) = f Y X (w x), niin E(g(X, Y ) X = x) = Eg(x, W )

Ehdollinen odotusarvo on paras ennuste Lause 8.2 Olkoon Z = g(x, Y ). Jos EZ 2 <, niin E(Z X ) on keskineliövirheen mielessä paras sm:n Z = g(x, Y ) ennuste sm:n X funktion avulla, ts. E ( Z E(Z X ) ) 2 E ( Z h(x ) ) 2 valitaan funktio h : R R miten tahansa. Todistus on harjoitustehtävä. Jos tehtävänä on ennustaa sm:n Y arvo jollakin sm:n X arvon funktiolla, niin keskineliövirheen mielessä paras mahdollinen ennuste on m(x), jossa m on regressiofunktio m(x) = E(Y X = x).

Odotusarvon laskeminen iteroituna odotusarvona Lause 8.3 Odotusarvo voidaan laskea iteroituna odotusarvona, eli Eg(X, Y ) = EE(g(X, Y ) X ), mikäli odotusarvo Eg(X, Y ) on olemassa laajennettuna reaalilukuna. Todistus Esitetään perustelu diskreetissä tapauksessa. Eg(X, Y ) = x,y g(x, y) f X,Y (x, y) = x,y g(x, y) f X (x) f Y X (y x) = x f X (x) y g(x, y) f Y X (y x) = EE(g(X, Y ) X ).

Esimerkki iteroidusta odotusarvosta Tarkastellaan yhteisjakaumaa X Y Bin(Y, θ), Y Poi(λ) jossa λ > 0 ja 0 < θ < 1. Nyt E(X Y ) = Y θ, joten EX = EE(X Y ) = E(Y θ) = θ EY = θλ.

Ehdollinen varianssi satunnaismuuttujana Kuten ehdollinen odotusarvo, myös ehdollinen varianssi voidaan laskea ehtona satunnaismuuttuja X (eikä ehdolla sen arvo X = x). Ensin määritellään funktio v(x) = var(g(x, Y ) X = x), ja määritelmää jatketaan koko reaaliakselille sopimalla, että v(x) = 0 niillä argumenteilla, joilla ehdollinen jakauma Y (X = x) ei ole luonnostaan määritelty. Tämän jälkeen määritellään, että var(g(x, Y ) X ) = v(x ).

Kaava varianssille Lause 8.4 Sm:n varianssi on yhtä kuin sen ehdollisen varianssin odotusarvon sekä ehdollisen odotusarvon varianssin summa, eli var(g(x, Y )) = E var(g(x, Y ) X ) + var E(g(X, Y ) X ). (8.8) Todistus: Harjoitustehtävä.

8.5 Yhteisjakauman määrittely hierarkkisesti Tilastollisia malleja spesifioidaan usein kertomalla, mikä on yhden sm:n reunajakauma ja toisen ehdollinen jakauma. Tällöin yhteisjakauma saadaan kertolaskusäännöllä, esim. f X,Y (x, y) = f X (x) f Y X (y x). Tällöin voidaan puhua hierarkkisesta mallista.

Esimerkki 1 (kaksi diskreettiä sm:a) Hyönteisen munimien munien lkm Y Poi(λ), jossa λ > 0. Kukin munista kehittyy toukaksi toisistaan riippumatta tn:llä 0 < θ < 1. Olkoon X toukaksi kehittyvien munien lkm. Tällöin X (Y = y) Bin(y, θ). Yhteisjakauma on diskreetti, ja sen yptnf on λ λy f X,Y (x, y) = f Y (y) f X Y (x y) = e y! ( y x ) θ x (1 θ) y x, jossa x ja y ovat kokonaislukuja 0, 1, 2,..., ja x y.

Esimerkki 1 jatkuu Tämä malli voidaan määritellä myös sanomalla, että X Y Bin(Y, θ), Y Poi(λ) jossa λ > 0 ja 0 < θ < 1 ovat vakioita. Voidaan esim. kysyä, mikä on X :n reunajakauma. Sen ptnf voidaan esittää summana f X (x) = y f X,Y (x, y). Joidenkin laskujen jälkeen havaitaan, että reunajakauma on X Poi(λθ). (Edellä laskettiin EX iteroidun odotusarvon kaavalla, ja silloin saatiin EX = λ θ.)

Esimerkki 2 (jatkuvan ja diskreetin sm:n yhteisjakauma) Olkoon sm:lla Θ betajakauma Be(α, β), jossa α, β > 0 ovat vakioita. Kolikkoa heitetään n kertaa, ja lasketaan kuinka monta kertaa saadaan klaava, kun klaavan todennäköisyys on Θ. Ehdolla Θ = θ klaavojen lukumäärällä X on jakauma Bin(n, θ). Yhteisjakauma voidaan esittää funktiolla f Θ,X (θ, x) = 1 B(α, β) θα 1 (1 θ) β 1 jossa 0 < θ < 1 ja x = 0, 1,..., n. ( ) n θ x (1 θ) n x, x

Esimerkki 2 jatkuu Tämä malli voitaisiin spesifioida myös sanomalla, että X Θ Bin(n, Θ), Θ Be(α, β) jossa α, β > 0 ja n 0 ovat vakioita. Mikä on sm:n Θ jakauma, kun havaitaan, että X = x? Kysymys saadaan ratkaistua tarkastelemalla hetken yhteisjakauman esitystä muuttujan θ funktiona, minkä jälkeen on selvää, että Θ (X = x) Be(α + x, β + n x). Tämä on esimerkki Bayes-päättelystä.

Esimerkki 3 (kahden jatkuvan muuttujan yhteisjakauma) Useasta ohjelmistoista löytyy satunnaislukugeneraattori normaalijakaumalle. Tarkastellaan seuraavaa algoritmia, jossa σ X > 0, µ X ja σ Z > 0 ovat annettuja lukuja ja m on jokin funktio, joka palauttaa reaaliluvun reaalilukuargumentilla. 1 Simuloi X N(µ X, σ 2 X ). 2 Simuloi Z N(0, σ 2 Z ). 3 Aseta Y = m(x ) + Z. Kuvaile sm:ien X ja Y yhteisjakauma hierarkkisesti. Kun satunnaislukugeneraattoria kutsutaan monta kertaa, niin eri kerroilla palautettavia lukuja voidaan pitää keskenään riippumattomien satunnaismuuttujien arvoina, sillä todelliset satunnaislukugeneraattorit toimivat tällä tavoin.

Esimerkki 3: yhteisjakauman kuvailu hierarkkisella mallilla Yhteisjakauma voidaan esittää kaavoilla Y X N(m(X ), σ 2 Z ) X N(µ X, σ 2 X ). Ehdollinen jakauma (Y X = x) nähdään siitä, että simuloinnissa X Z, joten X :n arvolla x ehdollistaminen ei muuta Z:n jakaumaa. Kyseisessä ehdollisessa jakaumassa sm:n X arvo on vakio x, ja lopuksi vakion x:n tilalle kirjoitetaan satunnaismuuttuja X.

Esimerkki 3: yhteistiheysfunktio Koska X :n jakauma on jatkuva, ja Y :n ehdollinen jakauma ehdolla X = x on jatkuva kaikilla x, on myös yhteisjakauma jatkuva. Ytf on f X,Y (x, y) = f X (x) f Y X (y x) = 1 σ X 2π exp 1 σ Z 2π exp ( 1 2 ( 1 2 (x µ X ) 2 ) σ 2 X (y m(x)) 2 ) σ 2 Z

Esimerkki 4: jatkoa esimerkille 3 Valitaan regressiofunktiolle m edellisessä esimerkissä lineaarinen muoto, m(x) = α + β (x µ X ). Tällöin m(x ) antaa keskineliövirheen mielessä parhaan ennusteen satunnaismuuttujan Y arvolle. Koska m(x ) on lineaarinen, sen täytyy myös olla keskineliövirheen mielessä paras lineaarinen ennuste.

Esimerkki 4 jatkuu Jakson 7.6 mukaan täytyy olla m(x) = µ Y + ρ σ Y σ X (x µ X ), jossa µ Y ja σ Y > 0 (oletus) ovat sm:n Y odotusarvo ja keskihajonta ja 1 < ρ < 1 (oletus) on X :n ja Y :n korrelaatiokerroin. Lisäksi σ 2 Z = σ2 Y (1 ρ2 ). Vektorille (X, Y ) syntyy ns. kaksiulotteinen normaalijakauma, jonka tiheysfunktion lauseke löytyy luentomonisteesta. Moniulotteista normaalijakaumaa käsitellään tarkemmin kappaleessa 10.