4.1 Diskreetin satunnaismuuttujan odotusarvo

Samankaltaiset tiedostot
Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

11 Raja-arvolauseita ja approksimaatioita

k S P[ X µ kσ] 1 k 2.

031021P Tilastomatematiikka (5 op) viikko 3

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,

Tilastomatematiikka Kevät 2008

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

8.1 Ehdolliset jakaumat

Satunnaismuuttujien muunnokset ja niiden jakaumat

Johdatus tn-laskentaan torstai

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyslaskun kertaus. Heliövaara 1

031021P Tilastomatematiikka (5 op) viikot 5 6

IV. TASAINEN SUPPENEMINEN. f(x) = lim. jokaista ε > 0 ja x A kohti n ε,x N s.e. n n

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

4.0.2 Kuinka hyvä ennuste on?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

8 Potenssisarjoista. 8.1 Määritelmä. Olkoot a 0, a 1, a 2,... reaalisia vakioita ja c R. Määritelmä 8.1. Muotoa

8.1 Ehdolliset jakaumat

Satunnaismuuttujien tunnusluvut

Keskihajonta ja korrelaatio

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

30A02000 Tilastotieteen perusteet

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset

Kompleksianalyysi, viikko 6

Analyysi III. Jari Taskinen. 28. syyskuuta Luku 1

Yleistä tietoa kokeesta

Määritelmä 3.1 (Ehdollinen todennäköisyys) Olkoot A ja B otosavaruuden Ω tapahtumia. Jos P(A) > 0, niin tapahtuman B ehdollinen todennäköisyys

Satunnaismuuttujan odotusarvo ja laskusäännöt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Diskreetti derivaatta

3.6 Su-estimaattorien asymptotiikka

V ar(m n ) = V ar(x i ).

Matematiikan ja tilastotieteen laitos Reaalianalyysi I Harjoitus Malliratkaisut (Sauli Lindberg)

Todennäköisyyden ominaisuuksia

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3.1 Kaksiulotteinen satunnaisvektori ja sen jakauma

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

Mat Sovellettu todennäköisyyslasku A

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

Moniulotteisia todennäköisyysjakaumia

Positiivitermisten sarjojen suppeneminen

6. laskuharjoitusten vastaukset (viikot 10 11)

Vastaus: 10. Kertausharjoituksia. 1. Lukujonot lim = lim n + = = n n. Vastaus: suppenee raja-arvona Vastaus:

4. Todennäköisyyslaskennan kertausta

Sallitut apuvälineet: kirjoitusvälineet, laskin sekä käsinkirjoitettu, A4-kokoinen lunttilappu ja MAOL taulukkokirjaa

Matemaattisten tieteiden kandiohjelma / MTL Todennäköisyyslaskenta IIb Kurssikoe (kesto 2h 30 min)

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

0 3 y4 dy = 3 y. 15x 2 ydx = 15. f Y (y) = 5y 4 1{0 y 1}.

Matematiikan tukikurssi, kurssikerta 5

Matematiikan tukikurssi

w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1.

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

Momentit generoiva funktio

Konvergenssilauseita

Yleistä tietoa kokeesta

Sarja. Lukujonosta (a k ) k N voi muodostaa sen osasummien jonon (s n ): s 1 = a 1, s 2 = a 1 + a 2, s 3 = a 1 + a 2 + a 3,...,

Funktion raja-arvo ja jatkuvuus Reaali- ja kompleksifunktiot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Todennäköisyyslaskenta, syksy Petri Koistinen Matematiikan ja tilastotieteen laitos Helsingin yliopisto

Täydellisyysaksiooman kertaus

Satunnaismuuttujat Satunnaismuuttuja kuvaa kokeen tuloksen reaaliakselille Satunnaismuuttuja on siis funktio X(s) joka saa reaalisia arvoja Koe s

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0102 Differentiaali- ja integraalilaskenta 1

Oletetaan, että funktio f on määritelty jollakin välillä ]x 0 δ, x 0 + δ[. Sen derivaatta pisteessä x 0 on

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

7 Kaksiulotteinen jakauma

MS-A010{3,4,5} (ELEC*, ENG*) Differentiaali- ja integraalilaskenta 1 Luento 2: Sarjat

1 Reaaliset lukujonot

Funktiojonot ja funktiotermiset sarjat Funktiojono ja funktioterminen sarja Pisteittäinen ja tasainen suppeneminen

4. laskuharjoituskierros, vko 7, ratkaisut

MS-A010{3,4} (ELEC*) Differentiaali- ja integraalilaskenta 1 Luento 2: Sarjat

5 Tärkeitä yksiulotteisia jakaumia

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Matematiikan tukikurssi, kurssikerta 3

Satunnaismuuttujan odotusarvo ja laskusäännöt

MS-A010{2,3,4,5} (SCI, ELEC*, ENG*) Differentiaali- ja integraalilaskenta 1 Luento 2: Sarjat

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

riippumattomia ja noudattavat samaa jakaumaa.

2.1 Satunnaismuuttuja ja sen jakauma

Transkriptio:

4 Odotusarvo Seuraavaksi kertaamme, miten satunnaismuuttujan odotusarvo (sv. väntevärde) määritellään diskreetissä ja jatkuvassa tapauksessa. Odotusarvolle käytetään englannikielisessä kirjallisuudessa lukuisia nimityksiä, kuten seuraavia: mean (value), (mathematical) expectation, expected value. Satunnaisvektorin odotusarvo määritellään myöhemmässä kappaleessa.

4.1 Diskreetin satunnaismuuttujan odotusarvo Määritelmä 4.1 Jos X on diskreetti sm, jonka arvojoukko on S = {x 1, x 2,... } ja ptnf on f, niin sen odotusarvo on reaaliluku EX = EX = E(X ) = i x i f (x i ) = x x f (x) mikäli sarja on itseisesti summautuva, eli mikäli x i f (x i ) <. i Muussa tapauksessa sanotaan että X :llä ei ole odotusarvoa. Se seikka, että X :llä on odotusarvo voidaan ilmaista myös sanomalla, että X on integroituva sm.

Vähän sarjaoppia Äärellinen summa suppenee tietenkin itseisesti; itseinen suppeneminen on relevantti ehto silloin, kun summattavia arvoja on äärettömän monta. Jos sarja summautuu itseisesti, niin sille saadaan sama äärellinen summa kaikilla summausjärjestyksillä. Toinen tapaus, jossa sarjan summausjärjestyksellä ei ole väliä on se, jossa kaikki summan termit ovat ei-negatiivisia; tällöin sarjan summa voi olla jokin reaaliluku tai. Jos summa suppenee kohti jotakin reaalilukua, mutta ei suppene itseisesti, niin erilaisilla summausjärjestyksillä sarjalle voidaan saada erilaisia summia. Itseisen suppenemisen takia odotusarvon määritelmässä ei tarvitse kiinnittää tiettyä summausjärjestystä.

Huomautuksia odotusarvosta Jos satunnaismuuttujilla X ja Y on sama diskreetti jakauma, niin niillä on sama odotusarvo. Diskreetin jakauman odotusarvo määritellään lukuna EX, jossa X on mikä tahansa kyseistä jakaumaa noudattava sm. Odotusarvolla on fysikaalinen tulkinta massajakauman painopisteenä. Jos massattoman sauvan (=reaaliakseli) pisteisiin x i asetetaan massat p i, niin sauva pysyy tasapainossa, mikäli sitä tuetaan altapäin pisteestä EX. Tämä odotusarvon tulkinta säilyy myös muunlaisille jakaumille.

Odotusarvon kaavan motivointia Olkoon diskreetti sm X sinun voittamasi rahasumma tietyn uhkapelin yhdessä toistossa. Jos toistat peliä riippumattomasti N kertaa, niin voitat summan x i osapuilleen N P(X = x i ) kertaa. Keskimääräinen voittosi yhtä peliä kohti on 1 N x i N P(X = x i ) = i i x i f (x i ) = EX.

Odotusarvon frekvenssitulkinta ja suurten lukujen laki Odotusarvon frekvenssitulkinnan mukaan EX on osapuilleen sama kuin keskiarvo suuresta määrästä X 1,..., X N keskenään riippumattomia ja X :n kanssa samoin jakautuneita satunnaismuuttujia: EX 1 N N X i. (4.1) Kaavan oikealla puolella esintyy satunnaismuuttuja, joka suppenee ns. vahvan suurten lukujen lain perusteella melkein kaikilla ω kohti odotusarvoa EX, kun N kasvaa rajatta. Vahva suurten lukujen laki on voimassa, mikäli X :n odotusarvo on olemassa (yksi todennäköisyysteorian kuuluisimpia tuloksia). Odotusarvoa arvioidaan tietokonesimuloinneissa usein näin, eli laskemalla keskiarvo satunnaismuuttujien simuloiduista arvoista. i=1

Esimerkki: vakion odotusarvo Vakiota a R voidaan pitää diskreettinä satunnaismuuttujana, joka saa aina arvon a eli voimme ajatella että a = a1 Ω Vastaavaa jakaumaa sanotaan degeneroituneeksi jakaumaksi. Vakion a odotusarvo on a, sillä Ea = xp(a1 Ω = x) = x f (x) = a 1 = a, x { a } x { a }

Esimerkki: tapahtuman indikaattorin odotusarvo Olkoon A tapahtuma, ja asetetaan p = P(A). Jos X = 1{ A }, niin X Bernoulli(p), ja EX = x { 0,1 } xp(x = x) = 0 (1 p) + 1 p = p. Tapahtuman indikaattorin odotusarvo on sama kuin kyseisen tapahtuman todennäköisyys eli jokaisella tapahtumalla A. E(1{ A }) = P(A)

Esimerkki: tapahtuman indikaattorin odotusarvo Olkoon A tapahtuma, ja asetetaan p = P(A). Jos X = 1{ A }, niin X Bernoulli(p), ja EX = x { 0,1 } xp(x = x) = 0 (1 p) + 1 p = p. Tapahtuman indikaattorin odotusarvo on sama kuin kyseisen tapahtuman todennäköisyys eli E(1{ A }) = P(A) jokaisella tapahtumalla A. Iversonin sulkeilla merkittynä sama olisi jännittävä sulkujenvaihtokaava E[ A ] = P(A)

Esimerkki: binomijakauman odotusarvo Olkoon X Bin(n, p), ja asetetaan q = 1 p. EX = n xf (x) = x=0 = np x=1 n 1 n xf (x) = x=1 n x x=1 n (n 1)! (x 1)!(n x)! px 1 q n x ( n 1 = np k k=0 = np(p + q) n 1 = np ) p k q n 1 k n! x!(n x)! px q n x Tässä laskussa käytettiin suoraan odotusarvon määritelmää. Johdamme saman tuloksen myöhemmin helpommalla tavalla.

Esimerkki: diskreetti jakauma, jolla ei ole odotusarvoa Tunnetusti sarja x=1 1/x 2 suppenee, ja sarja x=1 1/x hajaantuu. Olkoon c = x=1 1/x 2. Määritellään sm X siten, että sen arvojoukko on kokonaisluvut poislukien nolla, ja ptnf on f (x) = P(X = x) = 1 1, x = ±1, ±2,... 2c x 2 Tällöin X :llä ei ole odotusarvoa.

Johdattelua seuraavaan lauseeseen Jos diskreetin sm:n X arvojoukko on {x 1, x 2,... }, niin X voidaan esittää erillisten tapahtumien A i = {X = x i } indikaattorien avulla summana X = i 1 x i 1{ A i }. Mikäli X :llä on odotusarvo, niin se saadaan summasta EX = x i f (x i ) = x i P(A i ). i 1 i 1 Joskus on kätevää käyttää jotakin muuta perusjoukon Ω ositusta B 1, B 2,... Jos X on vakio kussakin osituksen palassa B i, niin seuraava lause totetaa, että edellinen kaava pitää yhä paikkansa.

Apulause Lause 4.1 Jos B 1, B 2,... on perusjoukon (äärellinen tai numeroituvasti ääretön) ositus, ja X on integroituva sm, joka saa vakioarvon y j kullakin palalla B j, eli X = j 1 y j 1 Bj, niin EX = y j P(B j ). j 1

Odotusarvon ominaisuuksia Lause 4.2 Olkoot X ja Y diskreettejä satunnaismuuttujia, joiden odotusarvot ovat olemassa. Odotusarvolla on seuraavat ominaisuudet. (a) (Positiivisuus) Jos X 0, niin EX 0. (b) Jos X 0 ja EX = 0, niin X on vakio nolla, ts. P(X = 0) = 1. (c) (Säilyttää järjestyksen) Jos X Y, niin EX EY. (d) (Vakion odotusarvo) Jos a R, niin Ea = a. (e) (Lineaarisuus) Jos a, b R, niin E(aX + by ) = a EX + b EY. (f) Jos X Y, niin satunnaismuuttujalla XY on odotusarvo, ja E(XY ) = E(X ) E(Y ). (g) EX riippuu vain X :n jakaumasta: jos X :llä ja Y :llä on sama jakauma, niin EX = EY.

Lineaarisuus n:lle satunnaismuuttujalle Jos X 1, X 2 ja X 3 ovat integroituvia sm:ia, niin E(X 1 + X 2 + X 3 ) = E ( ) (X 1 + X 2 ) + X 3 = E(X1 + X 2 ) + EX 3 = EX 1 + EX 2 + EX 3. Tämä ominaisuus yleistyy mille tahansa äärelliselle lukumäärälle integroituvia satunnaismuuttujia, ts. ( n ) n E X i = EX i, i=1 i=1 mikäli kaikki odotusarvot EX i ovat reaalilukuja.

Esimerkki: binomijakauman odotusarvo helpommin Jos X Bin(n, p), niin se voidaan esittää summana X = n Y i, i=1 jossa Y i Bernoulli(p) ja Y i :t ovat riippumattomia. Odotusarvon lineaarisuuden nojalla ( n ) EX = E Y i = i=1 n EY i = np. i=1 Tässä laskussa ei tarvittu satunnaismuuttujien Y i riippumattomuutta.

4.2 Jatkuvasti jakautuneen satunnaismuuttujan odotusarvo Määritelmä 4.2 Jos X on jatkuvasti jakautunut sm, ja sen tiheysfunktio on f, niin sen odotusarvo on luku EX = E(X ) = x f (x) dx, mikäli kyseinen integraali suppenee itseisesti, eli mikäli x f (x) dx <. Muussa tapauksessa sanotaan että X :llä ei ole odotusarvoa. Se seikka, että X :llä on odotusarvo voidaan ilmaista myös sanomalla, että X on integroituva sm.

Esimerkkejä Tasajakauman odotusarvo: jos X U(a, b), niin (helppo lasku) EX = 1 2 (a + b). Cauchyn jakaumalla ei ole odotusarvoa. Sm X noudattaa Cauchyn jakaumaa, jos sillä on tiheys f (x) = 1 π Tämä on tf, sillä f 0 ja f (x) dx = 2 π X :llä ei ole odotusarvoa, sillä 0 x f (x) dx = 1 π 1 1 + x 2, x R. 1 1 + x 2 dx = 2 π 0 2x 1 + x 2 dx = 1 π lim M 0 / arctan x = 2 π 0 π 2 = 1 M/ ln(1+x 2 ) =.

4.3 Odotusarvon ominaisuuksia Diskreettien ja jatkuvien jakaumien lisäksi on olemassa myös muunlaisia jakaumia. Todennäköisyysteoriassa odotusarvo EX määritellään perusjoukon Ω yli laskettuna abstraktina Lebesguen integraalina EX = X dp = X (ω) P(dω) = x P X (dx) mikäli integrandi on itseisesti integroituva. Ω Emme varsinaisesti käytä tätä määritelmää, mutta teemme joitakin sitä koskevia huomautuksia. R

Satunnaismuuttujan odotusarvo todennäköisysteoriassa Todennäköisyysteoriassa määritellään ensin ei-negatiivisen sm:n Y 0 integraali EY tietyn rajankäynnin kautta. Tulokseksi saadaan joko jokin ei-negatiivinen reaaliluku (jolloin sanotaan, että Y on integroituva) tai. Itse asiassa, jos sm Y 0 saa korkeintaan numeroituvan monta arvoa, niin integraali määritellään kuten diskreetin sm:n odotusarvo edellä rajankäynti liittyy tn-mitan monotoniseen jatkuvuuteen. Hieman oikoen jokaista Y 0 kohti löytyy kasvava jono diskreettejä sm:ia 0 Y 1 Y 2 Y 3 Y ja Y (ω) = lim k Y k (ω) kullakin ω. Odotusarvo EY voidaankin määritellä EY = lim k EY k (tosin olisi perusteltava, miksi raja-arvo on sama kaikille soveltuville jonoille (Y k ))

Merkiltään rajoittamattoman sm:n odotusarvo Merkiltään rajoittamattoman sm:n X odotusarvo määritellään jakamalla se ensin positiiviseen osaan X + 0 sekä negatiiviseen osaan X 0 seuraavasti Tällöin X + = max(x, 0), X = max( X, 0). (4.2) X = X + X, ja X = X + + X. (4.3) Mikäli sekä EX + ja EX ovat äärellisiä, niin EX määritellään kaavalla EX = EX + EX. (4.4) Tällöin sanotaan, että X on integroituva.

Laajennetut reaalilukujoukot Joissakin tarkasteluissa odotusarvolle sallitaan reaalilukujen lisäksi arvot + tai, ts. odotusarvo saa olla laajennettu reaaliluku (engl. extended real number). Jos vain toinen integraaleista EX + ja EX on äärellinen, niin EX voidaan määritellä käyttämällä kaavaa EX = EX + EX sekä laskusääntöjä a =, a =, a R. Huomaa, että lausekkeelle ei voida määritellä arvoa.

Sanontatapoja Mikäli X :n odotusarvo on määriteltävissä laajennettujen reaalilukujen avulla kaavalla EX = EX + EX, sanomme, että odotusarvo on olemassa laajennettuna reaalilukuna tai että se on olemassa laajennetussa mielessä. Jos sanomme, että odotusarvo on olemassa tai että satunnaismuuttuja on integroituva, niin tämä tarkoittaa sitä, että odotusarvo EX on reaaliluku. Tällöin E X <. Edellä nähtiin esimerkit sekä diskreetistä että jatkuvasti jakautuneesta satunnaismuuttujasta, joilla kummallakaan ei ole olemassa odotusarvoa edes tässä laajennetussa mielessä.

Odotusarvon ominaisuuksia (yleinen tapaus) Lause 4.3 Olkoot X ja Y integroituvia satunnaismuuttujia (siis: odotusarvot EX, EY R). (a) (Positiivisuus) Jos X 0, niin EX 0. (b) Jos X 0 ja EX = 0, niin X on vakio nolla, ts. P(X = 0) = 1. (c) (Säilyttää järjestyksen) Jos X Y, niin EX EY. (d) (Vakion odotusarvo) Jos a R, niin Ea = a. (e) (Lineaarisuus) Jos a, b R, niin E(aX + by ) = a EX + b EY. (f) Jos X Y, niin satunnaismuuttujalla XY on odotusarvo, ja E(XY ) = E(X ) E(Y ). (g) EX riippuu vain X :n jakaumasta: jos X :llä ja Y :llä on sama jakauma, niin EX = EY.

Tärkeä epäyhtälö Lause 4.4 X on integroituva jos ja vain jos X on integroituva. Tällöin EX E X. Todistus. Jos X on integroituva, niin EX + R ja EX R, joten E X = E(X + + X ) = EX + + EX R. Toisaalta, jos E X <, niin välttämättä 0 EX + <, ja 0 EX <, joten EX = EX + EX R. Jos X on integroituva, niin kolmioepäyhtälön nojalla EX = EX + EX EX + + EX = E X.

4.4 Muunnoksen odotusarvo Olkoon X sm, ja g : R R funktio. Määritellään sm Y = g(x ) = g X. Yksi tapa laskea Y :n odotusarvo olisi ensin johtaa sm:n Y jakauma. Mikäli Y :n jakauma on joko diskreetti tai jatkuva, voidaan soveltaa tuttuja kaavoja. Seuraava lause tarjoaa erilaisen tavan.

Satunnaismuuttujan muunnoksen odotusarvo Lause 4.5 Olkoon X sm, g : R R ja Y = g(x ). (a) Jos X :llä on diskreetti jakauma ptnf:lla f X, niin EY = Eg(X ) = x g(x) f X (x), mikäli summa suppenee itseisesti, eli mikäli x g(x) f X (x) < (b) Jos X :llä on jatkuva jakauma tf:lla f X, niin EY = Eg(X ) = g(x) f X (x) dx, mikäli integraali suppenee itseisesti, eli mikäli g(x) f X (x) dx <.

Tiedostamattoman tilastotieteilijän laki Mikäli kyseinen odotusarvo on olemassa, niin { x g(x) f X (x) jos X :llä on diskreetti jakauma Eg(X ) = g(x) f X (x) dx jos X :llä on jatkuva jakauma (4.5) Myös EX voidaan laskea tällä kaavalla (valitsemalla funktioksi g identiteettifunktio, jolle g(x) = x). Englanninkielisissä oppikirjoissa kaavalle käytetään usein nimitystä law of the unconscious statistician, koska tilastotieteilijät toisinaan käyttävät sitä huomaamatta, että kyseessä ei ole määritelmä vaan että kyseinen kaava pitäisi jollakin tavalla johtaa.

Onko Eg(X ) yhtä kuin g(ex )? Ensimmäisellä kertaa odotusarvoon tutustuvat luulevat usein, että Eg(X ) on aina yhtäsuuri kuin g(ex ). Tämä pitää paikkansa affiinille funktiolle g(x) = a + bx, mutta ei (yleisesti) muille funktioille.

Riippumattomien sm:ien muunnoksien tulon odotusarvo Lause 4.6 Olkoot satunnaismuuttujat X Y, ja g : R R ja h : R R sellaisia funktioita, että g(x ) ja h(y ) ovat integroituvia sm:ia. Tällöin E(g(X ) h(y )) = E(g(X )) E(h(Y )). Todistus. Koska g(x ) h(y ) lauseen 3.7 nojalla, niin tämä lause seuraa riippumattomien satunnaismuuttujien tulon kaavasta.

4.5 Momentit Määritelmä 4.3 Satunnaismuuttujan X k:s origomomentti eli k:s momentti µ k on µ k = EX k, kun k = 1, 2,... k:s keskusmomentti (engl. central moment) µ k on µ k = E((X EX ) k ), kun k = 1, 2,... kertaluvun r absoluuttinen momentti (engl. absolute moment) on E X r, r > 0 mikäli kyseiset odotusarvot ovat olemassa. Muuten sanotaan, että kyseinen momentti ei ole olemassa.

Huomautuksia momenteista Jos a < 0 ja r 0, niin a r on hyvin määritelty, mutta a r ei ole reaalinen, ellei r ole kokonaisluku. Tämän takia rajoitutaan kokonaislukukertalukuihin. Odotusarvo EX on 1. momentti µ 1, ja 1. keskusmomentti µ 1 = 0. Keskusmomentti µ k voidaan esittää origomomenttien µ j, j k avulla kehittämällä lauseke (X EX )k binomikaavalla. Toinen keskusmomentti µ 2 eli varianssi on sovelluksissa tärkeä. Korkeammista momenteista esim. kolmas keskusmomentti kuvaa jakauman vinoutta ja neljäs keskusmomentti sen huipukkuutta. Tätä korkeampia momentteja käytetään harvoin.

Milloin momentit ovat olemassa? Jos E X s < jollekin s > 0, niin E X r <, kaikilla 0 < r < s. Tällöin myös kaikki origomomentit sekä keskusmomentit kertalukua 1 k s ovat olemassa. Todistus: Jos 0 < r < s ja E X s <, niin X r = X r 1{ X 1} + X r 1{ X > 1} 1 + X s 1{ X > 1} 1 + X s, joten E X r 1 + E X s <

4.6 Varianssi, keskihajonta ja kovarianssi Määritelmä 4.4 (Varianssi ja keskihajonta) Satunnaismuuttujan X varianssi var X on sen 2. keskusmomentti, eli var X = var(x ) = E((X EX ) 2 ), mikäli kyseinen odotusarvo on hyvin määritelty. Tällöin X :n keskihajonta (engl. standard deviation, sv. standardavvikelse) on varianssin var X (positiivinen) neliöjuuri. Usein X :n varianssia merkitään σ 2 (tai σx 2 ). Tällöin varianssin positiivinen neliöjuuri σ 0 (tai σ X 0) on X :n keskihajonta.

Huomautuksia varianssista Varianssi voidaan määritellä vain integroituvalle satunnaismuuttujalle, jolle siis EX R. Jos EX on äärellinen, mutta E((X EX ) 2 ) =, niin voidaan sanoa, että var X =. Varianssille var X käytetään yleisesti myös merkintää D 2 (X ). Mikäli EX 2 on äärellinen, niin myös EX ja var X ovat äärellisiä, ja var X = EX 2 (EX ) 2. (4.6) Johto: Jos µ = EX, niin E(X µ) 2 = E(X 2 2 µ X + µ 2 ) = EX 2 2 µ EX + µ 2.

Varianssin ominaisuuksia Lause 4.7 (i) Mikäli var X on olemassa, niin var X 0. Jos var X = 0, niin X on vakio. (ii) Jos a, b R ja var X on olemassa, niin var(ax + b) = a 2 var X. Todistus kohdalle (ii): E(aX + b) = aex + b, joten var(ax + b) = E ( a(x EX ) ) 2 = a 2 E((X EX ) 2 ).

Kovarianssi Määritelmä 4.5 Satunnaismuuttujien X ja Y (välinen) kovarianssi cov(x, Y ) on odotusarvo cov(x, Y ) = E ( (X EX )(Y EY ) ), mikäli kyseinen odotusarvo on olemassa. Myöhemmin nähdään (Cauchyn Schwarzin epäyhtälön avulla), että odotusarvo cov(x, Y ) on äärellinen ainakin silloin, jos EX 2 < ja EY 2 <.

Kovarianssin ominaisuuksia Mikäli kyseiset suureet ovat äärellisiä, niin cov(y, X ) = cov(x, Y ), var X = cov(x, X ), Kun kerrotaan sulut auki, ja lasketaan odotusarvo termi termiltä, saadaan cov(x, Y ) = E ( (X EX )(Y EY ) ) = E ( XY X EY Y EX + EX EY ) = E(XY ) + ( 1 1 + 1) E(X ) E(Y ), joten kovarianssi voidaan laskea myös kaavalla cov(x, Y ) = E(XY ) E(X ) E(Y ). (4.7)

Kovarianssin bilineaarisuus Lause 4.8 Kovarianssi on bilineaarinen, eli molempien argumenttiensa suhteen lineaarinen operaattori. Ts. jos a 1, a 2 R ovat vakioita ja X 1, X 2 ja Z ovat satunnaismuuttujia, niin cov(a 1 X 1 + a 2 X 2, Z) = a 1 cov(x 1, Z) + a 2 cov(x 2, Z) cov(z, a 1 X 1 + a 2 X 2 ) = a 1 cov(z, X 1 ) + a 2 cov(z, X 2 ) Jos lisäksi b 1, b 2 R ja Y 1, Y 2 ovat satunnaismuuttujia, niin cov(a 1 X 1 + a 2 X 2, b 1 Y 1 + b 2 Y 2 ) = 2 2 a i b j cov(x i, Y j ). i=1 j=1 Nämä kaavat pitävät paikkansa, mikäli kyseiset odotusarvot ovat olemassa.

Esimerkki: lineaarikombinaation varianssin laskeminen kovarianssin bilineaarisuuden avulla var(ax + by ) = cov(ax + by, ax + by ) = a cov(x, ax + by ) + b cov(y, ax + by ) = a 2 cov(x, X ) + ab cov(x, Y ) + ab cov(y, X ) + b 2 cov(y, Y ) = a 2 var(x ) + 2ab cov(x, Y ) + b 2 var(y ).

Summan ja erotuksen varianssi Edellisen erikoistapauksena var(x + Y ) = var X + var Y + 2 cov(x, Y ) (4.8) var(x Y ) = var X + var Y 2 cov(x, Y ). (4.9) Erityisesti, jos cov(x, Y ) = 0, niin var(x + Y ) = var(x Y ) = var X + var Y.

Korreloimattomuus ja riippumattomuus Summan X + Y varianssi on yhtä kuin muuttujien varianssien summa täsmälleen silloin, kun cov(x, Y ) = 0. Jos cov(x, Y ) = 0, niin sanotaan, että X ja Y eivät korreloi eli että X ja Y ovat korreloimattomia. Jos X Y, niin cov(x, Y ) = 0, sillä tällöin cov(x, Y ) = E ( (X EX )(Y EY ) ) = E(X EX ) E(Y EY ) = 0. Siis riippumattomuudesta seuraa korreloimattomuus. Korreloimattomat satunnaismuuttujat eivät välttämättä ole riippumattomia.

Esimerkki: korreloimattomat muuttujat, jotka eivät ole riippumattomia Olkoon sm:lla X jatkuva jakauma tf:lla f, ja olkoon f parillinen funktio. Oletetaan lisäksi, että EX 4 on äärellinen. Tf:n parillisuuden ansiosta EX = E(X 3 ) = 0, joten cov(x, X 2 ) = E(X X 2 ) EX E(X 2 ) = 0. Siis X ja X 2 eivät korreloi, mutta ne eivät tietenkään ole riippumattomia satunnaismuuttujia.

n:n riippumattoman satunnaismuuttujan summan varianssi Helpolla laskulla nähdään, että jos X 1,..., X n ovat riippumattomia ja niillä on kaikilla äärellinen varianssi, niin tällöin n n var( X i ) = var(x i ) i=1 i=1

Esimerkki: binomijakauman varianssi Jos X Bin(n, p), niin se voidaan esittää summana n i=1 Y i, jossa Y i Bernoulli(p) ja Y i :t ovat riippumattomia. Nyt EY i = p, joten var Y i = E ( (Y i p) 2) = (0 p) 2 (1 p)+(1 p) 2 p = p(1 p). Riippumattomuuden nojalla var X = n var Y i = np(1 p). i=1

4.7 Momenttiemäfunktio ja kumulanttiemäfunktio Määritelmä 4.6 (Momenttiemäfunktio) Satunnaismuuttujan X (jakauman) momenttiemäfunktio eli momenttigeneroivafunktio eli momentit generoiva funktio (engl. moment generating function, mgf, sv. moment genererande funktion) on funktio M(t) = M X (t) = Ee tx, joka on (reaalifunktiona) olemassa niissä pisteissä t, joissa kyseinen odotusarvo on (äärellisenä) olemassa. Huomaa, että M(0) = Ee 0 = 1. Momenttiemäfunktio on (argumentin merkkiä vaille) sama asia kuin Laplacen muunnos (engl. Laplace transform).

Momentit momenttiemäfunktion avulla: heuristinen johto Jos seuraavassa laskussa derivoinnin ja odotusarvon järjestyksen vaihto pystytään jotenkin perustelemaan, niin M X (t) = d dt M X (t) = d dt EetX = E t etx = EX e tx, joten EX = M X (0). Laskemalla toinen derivaatta nähdään, että M X (t) = d dt EX etx = E t X etx = EX 2 e tx, joten EX 2 = M X (0). Samalla tavalla edeten nähdään, että aina EX k = M (k) (0).

Momentit momenttiemäfunktion avulla: lause Lause 4.9 Jos momenttiemäfunktio M X (t) on reaalisena olemassa jossakin origon ympäristössä t < h, jossa h > 0, niin M X (t) on äärettömän monta kertaa derivoituva origossa, X :n kaikki momentit ovat olemassa, ja M X voidaan esittää suppenevana Taylorin sarjana M X (t) = k=0 t k k! EX k, t < h. Erityisesti EX k = M (k) X (0), k 1.

Määritelmä 4.7 (Kumulanttiemäfunktio) Jos momenttiemäfunktio M X (t) on määritelty jossakin origon ympäristössä, niin X :n (jakauman) kumulanttiemäfunktio K(t) = K X (t) (engl. cumulant generating function, cgf) määritellään kyseisessä ympäristössä momenttiemäfunktion logaritmina, K(t) = K X (t) = ln M X (t).

Odotusarvo ja varianssi kumulanttiemäfunktion avulla Odotusarvo ja varianssi saadaan laskettua derivoimalla kumulanttiemäfunktiota origossa: K X (0) = M X (0) M X (0) = EX 1 = EX, K X M X (0) = (0)M X (0) M (0)M (0) M X (0) 2 = EX 2 (EX ) 2 = var X. Tämä tarjoaa näppärän tavan johtaa odotusarvo ja varianssi joillekin jakaumille, mutta toisille jakaumille sattaa olla kätevämpää johtaa odotusarvo ja varianssi suoraan määritelmistä.

Binomijakauman odotusarvo ja varianssi kumulanttiemäfunktion avulla Jos X Bin(n, p), niin binomikaavan avulla nähdään helposti, että M X (t) = (p e t + 1 p) n. Siis K X (t) = n ln(p e t + 1 p). Laskemalla ensimmäinen ja toinen derivaatta origossa nähdään, että EX = K X (0) = np, var X = K X (0) = np(1 p).

Momenttiemäfunktion ominaisuuksia Lause 4.10 (a) Jos a, b ovat vakioita, niin M ax +b (t) = e bt M X (at). (b) Jos X Y, niin M X +Y (t) = M X (t) M Y (t). Todistus: M ax +b (t) = E exp(t(ax + b)) = e bt E exp(atx ) = e bt M X (at), ja kun X Y, niin M X +Y (t) = E exp(t(x + Y )) = E(exp(tX ) exp(ty )) = Ee tx Ee ty. Yhtäsuuruus pätee joko muodossa = tai reaalilukujen yhtäsuuruutena.

Momenttiemäfunktio määrää jakauman tietyillä edellytyksillä Lause 4.11 Jos X :n ja Y :n momenttiemäfunktiot ovat molemmat olemassa jossakin origon ympäristössä, ja ovat siellä yhtäsuuret, niin X :llä ja Y :llä on sama jakauma.

Momenttiemäfunktion käytön hankaluuksia Jos jokin X :n momentti ei ole olemassa, niin momenttiemäfunktio on määritelty origossa, mutta ei missään origon ympäristössä. On olemassa jakaumia (esim. log-normaalinen jakauma), joilla on kaikkien kertalukujen momentit, mutta joiden momenttiemäfunktio ei ole olemassa missään origon ympäristössä. Edistyneemmissä todennäköisyyslaskennan kirjoissa käytetään momenttiemäfunktion sijasta jakauman karakteristista funktiota. Momenttiemäfunktiota ja kumulanttiemäfunktio ovat tästä huolimatta oleellisia apuvälineitä tietyissä asymptoottisissa tarkasteluissa (esim. suurten poikkeamien teoriassa sekä satulapistekehitelmässä).

sm:n Y tiheysfunktio 1 2π e 1 2 x2 y 0.0 0.1 0.2 0.3 0.4-4 -2 0 2 4 x

sm X = e Y tf f (x) = 1 x 2π e 1 2 (ln x)2 1 {x>0} y 0.0 0.1 0.2 0.3 0.4 0.5 0.6-1 0 1 2 3 4 x

sin(2π log x)1 {x>0} y -1.0-0.5 0.0 0.5 1.0-1 0 1 2 3 4 x

1 2 f (x) sin(2π log x)1 {x>0} y -0.3-0.2-0.1 0.0 0.1 0.2 0.3-1 0 1 2 3 4 x

tf f Z (x) = f (x) ( 1 + 1 2 sin(2π log x)1 ) {x>0} y 0.0 0.2 0.4 0.6 0.8-1 0 1 2 3 4 x

tf:t f ja f Z yhtäaikaa y 0.0 0.2 0.4 0.6 0.8-1 0 1 2 3 4 x

4.8 Karakteristinen funktio Tietyiltä vaikeuksilta vältytään, mikäli momenttiemäfunktion sijasta käytetään jakauman karakteristista funktiota, sillä karakteristinen funktio on kaikille jakaumille kaikkialla määritelty. Karakteristisen funktion määrittelyssä tarvitaan kompleksilukuja. Karakteristinen funktio on (argumentin skaalausta vaille) sama asia kuin Fourier n muunnos (engl. Fourier transform).

Karakteristinen funktio Määritelmä 4.8 Satunnaismuuttujan X karakteristinen funktio (engl. characteristic function) on koko reaaliakselilla määritelty kompleksiarvoinen funktio φ(t) = φ X (t) = Ee itx, jossa i = 1. Kompleksinen eksponentti saadaan laskettua kaavalla e itx = cos(tx ) + i sin(tx ), Sen odotusarvo määritellään laskemalla yhteen reaaliosan ja imaginääriosan odotusarvot, Ee itx = E cos(tx ) + i E sin(tx ). Karakteristinen funktio φ X (t) on määritelty kaikilla X ja kaikilla t sen takia, että se on rajoitetun funktion odotusarvo.

Karakteristinen funktio Lause 4.12 Jos momenttiemäfunktio M X (t) on määritelty jossakin origon ympäristössä, niin X :n karakteristinen funktio on φ X (t) = M X (it). Lause 4.13 (Karakteristinen funktio määrää jakauman) Jos X :n ja Y :n karakteristiset funktiot ovat samat, niin X :llä ja Y :llä on sama jakauma. Todistus: Ks. esim. Billingsleyn teos.