Satunnaismuuttujan odotusarvo ja laskusäännöt

Samankaltaiset tiedostot
Satunnaismuuttujan odotusarvo ja laskusäännöt

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Keskihajonta ja korrelaatio

Bayesläiset tilastolliset mallit

Satunnaismuuttujien summa ja keskiarvo

Satunnaismuuttujien summa ja keskiarvo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Liite B. Suomi englanti-sanasto

11.1 Nollahypoteesi, vastahypoteesi ja p-arvo

11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot

Todennäköisyyden käsite ja laskusäännöt

Satunnaismuuttujat ja jakaumat

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

30A02000 Tilastotieteen perusteet

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien muunnokset ja niiden jakaumat

Stokastiikka ja tilastollinen ajattelu

Stokastiikka ja tilastollinen ajattelu

Stokastiikka ja tilastollinen ajattelu

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Todennäköisyyden käsite ja laskusäännöt

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Jatkuvat satunnaismuuttujat

Stokastiikka ja tilastollinen ajattelu

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

Tilastomatematiikka Kevät 2008

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tn-laskentaan perjantai

Harjoitus 2: Matlab - Statistical Toolbox

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

8.1 Ehdolliset jakaumat

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Todennäköisyyslaskun kertaus. Heliövaara 1

Todennäköisyyden ominaisuuksia

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

6. laskuharjoitusten vastaukset (viikot 10 11)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Johdatus tn-laskentaan torstai

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

4. laskuharjoituskierros, vko 7, ratkaisut

V ar(m n ) = V ar(x i ).

ABHELSINKI UNIVERSITY OF TECHNOLOGY

11 Raja-arvolauseita ja approksimaatioita

031021P Tilastomatematiikka (5 op) viikko 3

Ilkka Mellin (2008) 1/5

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Verkot ja todennäköisyyslaskenta Verkko Verkko eli graafi muodostuu pisteiden joukosta V, särmien joukosta A ja insidenssikuvauksesta : A V V jossa

3. laskuharjoituskierros, vko 6, ratkaisut

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Sovellettu todennäköisyyslaskenta B

k S P[ X µ kσ] 1 k 2.

031021P Tilastomatematiikka (5 op) viikot 5 6

Mat Sovellettu todennäköisyyslasku A

Poisson-prosessien ominaisuuksia ja esimerkkilaskuja

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Osa 2: Otokset, otosjakaumat ja estimointi

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

8.1 Ehdolliset jakaumat

3.6 Su-estimaattorien asymptotiikka

Inversio-ongelmien laskennallinen peruskurssi Luento 7

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

dx=2&uilang=fi&lang=fi&lvv=2015

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Transkriptio:

Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään tiheysfunktion f X (x) avulla diskreetille jakaumalle kaavalla 1 E(X) = xf X (x), missä S X R sisältää X:n mahdolliset arvot, ja jatkuvalle jakaumalle kaavalla 2 E(X) = xf X (x) dx. Esimerkki 3.1 (Noppa). Nopanheiton tuloksen X mahdolliset arvot sisältyvät joukkoon S X = {1,..., 6} ja jokainen arvo on yhtä todennäköinen. Näin ollen X:n odotusarvo on E(X) = 1 1 6 + + 6 1 6 = 3.5. Esimerkki 3.2 (Jatkuva tasajakauma). Välin [a, b] jatkuvaa tasajakaumaa noudattavalla satunnaismuuttujalla X on tiheysfunktio f X (x) = (b a) 1 1 [a,b] (x), joten integroimalla saadaan X:n odotusarvoksi E(X) = (b a) 1 b a x dx = (b a) 1 1 2 (b2 a 2 ) = a + b 2. 1 silloin kun oikean puolen summa suppenee (ks. luku 3.6) 2 silloin kun oikean puolen integraali suppenee (ks. luku 3.6) 39

Odotusarvo voidaan tulkita X:n jakauman massakeskipisteenä: jos äärettömän pitkään ohueen palkkiin kohdistetaan massa f X (x) kohdassa x, niin silloin odotusarvo on se piste, johon tuettuna palkki pysyy tasapainossa. Fysikaalisen tulkinnan sijaan on kuitenkin tärkeämpää muodostaa mielikuva siitä, mitä odotusarvo kertoo satunnaismuuttujasta X. Odotusarvo ei tarkoita satunnaismuuttujan tyypillistä arvoa, koska esimerkiksi noppa ei milloinkaan voi saada arvoa 3.5. Kelvollisen tulkinnan odotusarvon käsitteelle tarjoaa seuraava tulos, joka tunnetaan nimellä suurten lukujen laki 3. Fakta 3.3 (Suurten lukujen laki). Jos X 1, X 2,... ovat riippumattomia ja samoin jakautuneita satunnaislukuja, joilla on odotusarvona µ = E(X k ), niin mielivaltaisen pienellä ɛ > 0, tapahtuman n 1 n X k = µ ± ɛ (3.1) k=1 todennäköisyys lähestyy ykköstä suurilla n:n arvoilla 4. Todistus. Tulos seuraa erikoistapauksena faktasta 5.7, joka esitetään luvussa 5, jossa pohjatiedoksi ensin tutustutaan keskihajonnan käsitteeseen. Ylläolevassa tuloksessa merkillepantavaa on se, että lausekkeen (3.1) vasen puoli on satunnaismuuttuja, mutta oikea puoli on tavallinen, ei-satunnainen luku. Keskiarvoon n 1 n k=1 X k liittyvä satunnaisuus ja epävarmuus siis katoavat, kun summattavien määrä kasvaa suureksi. Tulosta merkitään usein n 1 n X P k µ k=1 ja sanotaan että n 1 n k=1 X k suppenee stokastisesti kohti lukua µ. Suurten lukujen laki on yksi stokastiikan tärkeimmistä tuloksista, sillä siihen kiteytyy esim. rahoitus- ja vakuutusyhtiöiden toimintaperiaate: riskiä voidaan pienentää hajauttamalla varat useisiin toisistaan riippumattomiin kohteisiin. Suurten lukujen lain avulla saadaan odotusarvolle tulkinta: Satunnaismuuttujan odotusarvo E(X) on likiarvo keskiarvolle, joka lasketaan suuresta määrästä X:n tavoin jakautuneita riippumattomia satunnaislukuja. Esimerkki 3.4 (Noppapelin tuotto). Noppapelissä voittaa kierroksella k silmäluvun X k verran euroja. Yhden kierroksen tuoton odotusarvo on E(X k ) = 3.5 3 suurten lukujen laista on myös vahva versio (ks. luku 3.6) 4 Tarkemmin ilmaistuna lim n P( n 1 n k=1 X k µ ɛ) = 1. 40

EUR. Kertynyt tuotto suurelta määrältä kierroksia on suurten lukujen lain mukaan suurella todennäköisyydellä ( ) n 1 n X k = X k n 3.5n. n k=1 i=k Kuvassa 3.1 on esitetty kolme simuloitua pelin toteumaa. Sadan pelikierroksen tuottokertymät ovat lähellä odotusarvoa 350 EUR, mutta poikkeavat siitä kuitenkin jonkun verran. 400 300 200 100 0 0 50 100 Kuva 3.1: Noppapelin tuottokertymän odotusarvo (punainen) ja kolme simuloitua toteumaa (sininen) pelikierrosten lukumäärän funktiona. Mitä odotusarvo kertoo sellaisista satunnaismuuttujista, joista riippumattomia toistoja ei ole saatavilla, esim. X = startup-yrityksen seuraavan vuoden liikevaihto, Y = taloyhtiön materiaalivahingot ensi vuonna tapahtuvista tulipaloista? Yksittäisen yrityksen perustajan näkökulmasta E(X) ei välttämättä ole erityisen tärkeä luku, mutta useaan toisistaan riippumattomasti toimivaan startupyritykseen sijoittavan rahoittajan näkökulmasta tilanne on toinen. Vastaavasti E(Y ) ei välttämättä ole yksittäisen taloyhtiön kannalta oleellinen luku, mutta samankaltaisia taloyhtiöitä vakuuttavan vakuutusyhtiön kannalta kylläkin. Esimerkki 3.5 (Yksi miljoonasta). Arvonnassa voittaa miljoona euroa todennäköisyydellä yksi miljoonasta. Yksittäisen arvan tuottoa kuvaavan satunnaismuuttujan X jakauma on ao. taulukossa ja sen odotusarvo on k 0 1000000 P(X = k) 0.999999 0.000001 E(X) = 0 0.999999 + 1000000 0.000001 = 1. 41

Tämä odotusarvo ei kerro kyseisen satunnaisilmiön luonteesta paljoakaan. Esimerkiksi jos X:n tavoin jakautuneita satunnaislukuja generoidaan toisistaan riippumattomasti, niin 10000 ensimmäistä satunnaislukua ovat kaikki nollia todennäköisyydellä 0.999999 10000 99%. 3.2 Todennäköisyyden frekvenssitulkinta Kolikonheitosta puhuttaessa on tapana sanoa, että kruunan todennäköisyys on 1. Intuitiivisesti tämä tarkoittaa sitä, että pitkässä heittosarjassa odotetaan 2 kruunien osuuden olevan lähellä puolikasta, mutta onko tälle intuitiolle matemaattisia takeita? Merkitään { 1, jos heitolla k saadaan kruuna, I k = 0, muuten, jolloin n:llä heitolla saatujen kruunien lukumäärä on satunnaismuuttuja S n = n k=1 I k ja kruunien suhteellinen esiintyvyys satunnaismuuttuja S n /n. Kun kolikkoa heitetään tasaisen satunnaisesti, ovat satunnaismuuttujat I 1, I 2,... toisistaan riippumattomia ja samoin jakautuneita, odotusarvona E(I k ) = 0 P(I k = 0) + 1 P(I k = 1) = 1 2. Näin ollen suurten lukujen lain mukaan kruunan suhteellinen esiintyvyys n heiton sarjassa toteuttaa S n /n = 1 n I k P 1 n 2. k=1 Vastaava päättely voidaan yleistää mielivaltaisille jakaumille, ja saatua tulosta kutsutaan todennäköisyyden frekvenssitulkinnaksi. Fakta 3.6. Jos X 1, X 2,... ovat riippumattomia ja X:n tavoin jakautuneita satunnaislukuja, niin mielivaltaisen arvojoukon B suhteellinen esiintyvyys tulossarjassa (X 1,..., X n ) toteuttaa suurilla n arvoilla. #{k n : X k B} n P P(X B) Todistus. Tulos perustellaan samalla argumentilla kuin yllä tehty kruunan suhteellisen esiintyvyyden analyysi, jossa vaihdetaan satunnaismuuttujan I k paikalle tapahtuman {X k B} indikaattori, eli { 1, jos X k B, I k = 0, muuten, 42

Tällöin satunnaismuuttujat I 1, I 2,... ovat toisistaan riippumattomia ja samoin jakautuneita {0, 1}-arvoisia satunnaismuuttujia, odotusarvona E(I k ) = 0 P(I k = 0) + 1 P(I k = 1) = P(X B). Tulos siis seuraa soveltamalla heikkoa suurten lukujen lakia keskiarvoon n 1 n k=1 I k. Esimerkki 3.7 (Kruunien lukumäärä). Suurten lukujen lain perusteella kruunan suhteellinen esiintyvyys pitkässä heittosarjassa (X 1,..., X n ) on suurella todennäköisyydellä #{k n : X k = kruuna } n 1 2. Allaolevassa taulukossa on esitetty toteutunut kruunien lukumäärä, kun on simuloitu 8 kappaletta n = 1000 kolikonheiton sarjaa. Toteutuneet kruunien osuudet ovat kohtuullisen lähellä arvoa 0.5, mutta vaihtelevat silti jonkun verran kyseisen arvon molemmin puolin. Simulaatio 1 2 3 4 5 6 7 8 Kruunien lkm 478 490 504 531 501 514 518 471 Kruunien osuus 0.478 0.490 0.504 0.531 0.501 0.514 0.518 0.471 3.3 Satunnaismuuttujan muunnos Jos X on perusjoukolla S määritelty satunnaismuuttuja ja g(x) jokin X:n arvojoukolla määritelty funktio, niin Y = g(x). on samalla perusjoukolla S määritelty satunnaismuuttuja, joka voidaan tulkita yhdistettynä funktiona Y (s) = g(x(s)). Satunnaismuuttuja Y saa arvon g(x) silloin kun X saa arvon x. Tarkastellaan seuraavaksi kahden esimerkin näkökulmasta, miten satunnaismuuttujan muunnoksen odotusarvon voi laskea. Esimerkki 3.8 (Diskreetin satunnaisluvun neliö). Laske E(X 2 ), kun X:n jakauma on esitetty muodossa 0.5 k 0 1 2 P(X = k) 0.2 0.5 0.3 0.4 0.3 0.2 0.1 0.0 0 1 2 3 4 43

Satunnaismuuttuja Y = X 2 on diskreetti satunnaisluku, jonka arvojoukko on {0, 1, 4} ja jakauma on 0.5 k 0 1 4 P(Y = k) 0.2 0.5 0.3 0.4 0.3 0.2 0.1 0.0 0 1 2 3 4 Näin ollen kysytty odotusarvo saadaan kaavasta E(Y ) = 0 0.2 + 1 0.5 + 4 0.3 = 1.7. Esimerkki 3.9 (Jatkuvan satunnaisluvun kuutio). Laske E(X 3 ), kun X noudattaa välin [0, 2] tasajakaumaa tiheysfunktiona 1.5 f X (t) = { 1 2 0 < t < 2, 0, muuten. f 1.0 0.5 0.0 0 2 4 6 8 x Satunnaisluvun Y = X 3 mahdolliset arvot sisältyvät joukkoon [0, 8]. Tiheysfunktion määrittämiseksi on ensiksi helpointa määrittää kertymäfunktio. Koska funktio g(x) = x 3 on kasvava, pätee X 3 t täsmälleen silloin kun X t 1/3. Näin ollen kertymäfunktion arvot pisteissä t [0, 8] saadaan laskettua kaavasta F Y (t) = P(X 3 t) = P(X t 1/3 ) = t 1/3 0 1 2 dt = 1 2 t1/3. Derivoimalla havaitaan, että Y :n tiheysfunktio voidaan esittää muodossa 1.5 f Y (t) = { 1 6 t 2/3, 0 < t < 8, 0, muuten. f 1.0 0.5 0.0 0 2 4 6 8 x Kysytty odotusarvo saadaan integroimalla E(Y ) = t f Y (t)dt = 1 6 8 0 t 1/3 dt = 1 6 ( 3 4 84/3 3 ) 4 04/3 = 2. Satunnaismuuttujan X 3 odotusarvon laskeminen esimerkissä 3.9 osoittautui melko työlääksi, koska laskutehtävän yhteydessä samalla määritettiin kertymäfunktio ja tiheysfunktio. Usein ollaan kiinnostuneita pelkästään satunnais- 44

muuttujan muunnoksen odotusarvosta, jolloin alla esitetty yleinen odotusarvon laskukaava on hyödyllinen. Fakta 3.10. Mille tahansa satunnaismuuttujan X arvojoukolla määritellylle reaalifunktiolle g pätee diskreetissä tapauksessa E(g(X)) = g(x) f X (x) (3.2) ja jatkuvan jakauman tapauksessa E(g(X)) = g(x) f X (x)dx. (3.3) Todistus. Kun X:n jakauma on diskreetti ja sen arvot sisältyvät joukkoon S X, on myös Y = g(x) jakaumaltaan diskreetti ja sen arvot sisältyvät joukkoon S Y = {g(x) : x S X }. Lisäksi havaitaan, että Y saa arvon y täsmälleen silloin, kun X:n arvo osuu joukkoon B y = {x S X : g(x) = y}. Näin ollen Y :n tiheysfunktio määräytyy kaavalla f Y (y) = P(Y = y) = P(X B y ) = x B y f X (x) ja odotusarvo kaavalla E(Y ) = y f Y (y) = y S Y y S Y y x B y f X (x) = y S Y x B y yf X (x). Koska g(x) = y kaikilla x B y ja koska joukot B y, y S Y muodostavat joukon S X osituksen, voidaan oikeanpuolimmainen summa kirjoittaa muodossa yf X (x) = g(x)f X (x) = g(x)f X (x), x B y x B y y S Y y S Y ja näin ollen yhtälö (3.2) pitää paikkansa. Jatkuva tapaus voidaan perustella samaan tapaan. Seuraavaksi nähdään, miten esimerkkien 3.8 ja 3.9 odotusarvot voidaan laskea helposti odotusarvon muunnoskaavojen (3.2) ja (3.3) avulla. Esimerkki 3.11 (Diskreetin satunnaisluvun neliö). Laske E(X 2 ), kun X:n jakauma on esitetty muodossa 0.5 x 0 1 2 f X (x) 0.2 0.5 0.3 0.4 0.3 0.2 0.1 0.0 0 1 2 3 4 45

Soveltamalla odotusarvon muunnoskaavaa (3.2) funktioon g(x) = x 2 saadaan tulokseksi 2 E(X 2 ) = x 2 f X (x) = 0 2 0.2 + 1 2 0.5 + 2 2 0.3 = 1.7. x=0 Esimerkki 3.12 (Jatkuvan satunnaisluvun kuutio). Laske E(X 3 ), kun X noudattaa välin [0, 2] tasajakaumaa tiheysfunktiona 1.5 f X (t) = { 1 2 0 < t < 2, 0, muuten. f 1.0 0.5 0.0 0 2 4 6 8 x Soveltamalla odotusarvon muunnoskaavaa (3.3) funktioon g(x) = x 3 saadaan tulokseksi 2 E(X 3 ) = x 3 f X (x)dx = x 3 1 0 2 dx = 1 ( 1 2 4 24 1 ) 4 04 = 2. Odotusarvo E(X) tunnetaan myös nimellä X:n ensimmäinen momentti. Vastaavasti luku E(X 2 ) on X:n toinen momentti ja luku E(X 3 ) sen kolmas momentti. Samaan tapaan määritellään myös korkeamman kertaluvun momentit. Kuten yllä nähtiin, momentit voidaan laskea muunnoskaavoilla E(X n ) = x n f X (x) ja E(X n ) = x n f X (x) dx. Esimerkki 3.13 (Entropia). Miten paljon informaatiota sisältyy viestiin, jossa paljastetaan että satunnaismuuttujan X arvo on x? On luontevaa ajatella, että viestissä on sitä enemmän informaatiota, mitä epätodennäköisemmästä tapahtumasta on kyse. Merkitään symbolilla I(p) informaatiota, joka sisältyy viestiin tapahtumasta, jonka todennäköisyys on p. Tällöin I(p):n tulee olla vähenevä p:n funktio. On myös luonteva olettaa, että jos tapahtumat X = x ja Y = y toteutuvat toisistaan riippumatta todennäköisyyksillä p ja q, niin tällöin näiden toteutumisen paljastava viesti sisältää informaatiota I(p) + I(q) yksikköä. Koska tapahtuma {X = x, Y = y} toteutuu todennäköisyydellä pq, on sitä vastaava informaatio I(pq), joten I(pq) = I(p) + I(q). Voidaan näyttää, että kaikki ei-negatiiviset, vähenevät ja ylläolevan yhtälön toteuttavat funktiot ovat muotoa I(p) = c log 2 (p), missä c on positiivinen vakio. Yleensä valitaan c = 1, jolloin informaation yksikkönä on bitti. 46

Jos X on diskreetti satunnaismuuttuja arvojoukkona S X ja tiheysfunktiona f(x), niin silloin viesti {X = x} sisältää log 2 f(x) bittiä informaatiota. Vastaavasti viesti, joka sisältää satunnaismuuttujan X tuntemattoman arvon, sisältää odotusarvoisesti H(X) = f(x) log 2 f(x) bittiä informaatiota. Ylläoleva luku on satunnaismuuttujan X Shannonin entropia ja se voidaan tulkita X:n muunnoksen odotusarvona Eg(X), missä g(x) = log 2 f(x). Minkä tahansa n:n alkion joukossa tasajakaumaa noudattavan satunnaismuuttujan entropia on ylläolevan kaavan mukaan H(X) = log 2 n. Näin ollen yhden kolikonheiton entropia on 1 bitti ja yhden nopanheiton entropia log 2 6 2.58 bittiä. 3.4 Odotusarvon laskusäännöt Tärkeimmät odotusarvon laskusäännöt voidaan johtaa seuraavan tuloksen avulla, joka yleistää yhden muuttujan muunnoskaavat (fakta 3.10) kahden muuttujan tapaukseen. Fakta 3.14. Mille tahansa X:n ja Y :n arvojoukkojen tulojoukolla määritellylle reaalifunktiolle g pätee diskreetin yhteisjakauman tapauksessa E(g(X, Y )) = g(x, y) f X,Y (x, y) (3.4) y S Y ja jatkuvan yhteisjakauman tapauksessa E(g(X, Y )) = g(x, y) f X,Y (x, y) dx dy. (3.5) Todistus. Kaava (3.4) seuraa yhden muuttujan muunnoskaavasta (3.2), kun tulkitaan pari Z = (X, Y ) diskreetiksi satunnaismuuttujaksi, joka saa arvonsa tulojoukossa S Z = S X S Y ja jonka tiheysfunktio on X:n ja Y :n yhteisjakauman tiheysfunktio. Kaavan (3.5) perustelu vaatii teknisempiä mittateorian taustatietoja ja se sivuutetaan tässä yhteydessä. Fakta 3.15. Kaikille satunnaismuuttujille X, Y ja kaikille reaaliluvuille a pätee E(1) = 1, (3.6) E(aX) = ae(x), (3.7) E(X + Y ) = E(X) + E(Y ). (3.8) Todistus. Kaava (3.6) on selvä, kun sen vasemmalla puolella esiintyvä ykkönen tulkitaan diskreettinä satunnaismuuttujana, joka saa arvon yksi todennäköisyydellä yksi. 47

Oletetaan seuraavaksi, että X ja Y ovat diskreettejä, jolloin myös niiden yhteisjakauma on diskreetti. Tällöin soveltamalla odotusarvon muunnoskaavaa (3.4) funktioon g(x, y) = ax + by, ja yhteisjakauman reunatiheyksien laskentakaavoja (2.11) (2.12) havaitaan, että 5 E(aX + by ) = x (ax + by) f X,Y (x, y) y ( ) ( ) = a x x f X,Y (x, y) + b y y f X,Y (x, y) y x = a x x f X (x) + b y y f Y (y) = ae(x) + be(y ). Kaava (3.7) seuraa sijoittamalla ylläolevaan yhtälöön b = 0. Kaava (3.8) puolestaan seuraa sijoittamalla a = 1 ja b = 1. Kaavojen todistaminen ei-diskreeteille satunnaismuuttujille sivuutetaan. 3.5 Yhteenveto Odotusarvo E(X) ei ole satunnaismuuttujan tyypillinen arvo, vaan se kertoo likiarvon keskiarvolle, joka lasketaan suuresta määrästä X:n kanssa samoin jakautuneita riippumattomia satunnaismuuttujia. Odotusarvo on lineaarinen operaatio eli aina pätee E(aX) = ae(x), E(X + Y ) = E(X) + E(Y ), huolimatta siitä ovatko X ja Y riippuvia vai riippumattomia. Diskreetin ja jatkuvan jakauman odotusarvot ja muunnosten odotusarvot voidaan laskea seuraavan taulukon mukaisilla kaavoilla. 5 mukavuussyistä merkitään summia ja y S Y lyhyesti x ja y 48

Diskreetti jakauma Esim. joukon {1,..., 6} tasajakauma Jakauma määräytyy tiheysfunktiosta kaavalla P(X A) = 1 A (x)f X (x) Jatkuva jakauma Esim. välin [0, 10] tasajakauma Jakauma määräytyy tiheysfunktiosta kaavalla P(X A) = 1 A (x)f X (x) dx E(X) = x f X (x) E(X) = x f X (x)dx Eg(X) = g(x) f X (x) Eg(X) = g(x) f X (x)dx 3.6 Kommentteja Diskreettiä jakaumaa noudattavan satunnaismuuttujan odotusarvo on olemassa silloin, kun summa xf X (x) suppenee, eli silloin kun vähintään toinen summista max{x, 0}f X (x) ja max{ x, 0}f X (x) on äärellinen. Vastaavasti jatkuvaa jakaumaa noudattavan satunnaismuuttujan odotusarvo on olemassa silloin, kun vähintään toinen integraaleista max{x, 0}f X (x) dx ja max{ x, 0}f X (x) dx on äärellinen. Odotusarvojen muunnoskaavoissa (fakta (3.10) ja fakta (3.14)) tulee myös olettaa, että odotusarvot ovat olemassa. Käytännössä kaikilla stokastiikan ja tilastotieteen sovelluksiin liittyvillä satunnaismuuttujille on olemassa odotusarvo, ja lähes aina odotusarvo on äärellinen reaaliluku. Tietyissä sovelluksissa kuitenkin toisinaan kohdataan satunnaismuuttujia, joilla on olemassa odotusarvo, mutta odotusarvo on ääretön. Alla yksi sellainen. Esimerkki 3.16 (Pietarin paradoksi). Kasinolla on uhkapeli, jossa kolikkoa heitetään kunnes saadaan klaava. Pelin tuotto on 2 EUR, jos ensimmäinen klaava ilmestyy 1. heitolla 4 EUR, jos ensimmäinen klaava ilmestyy 2. heitolla 49

8 EUR, jos ensimmäinen klaava ilmestyy 3. heitolla... Paljonko olisit valmis maksamaan oikeudesta osallistua peliin? Pelin tuotto on g(t ) = 2 T, missä pelin kesto T on diskreetti satunnaisluku, jonka tiheysfunktio on f T (k) = (1/2) k, k = 1, 2, 3,... Pelin tuoton odotusarvo on E(g(T )) = 2 1 (1/2) 1 + 2 2 (1/2) 2 + 2 3 (1/3) 3 + =. Näin ollen pelistä ansaittava nettotuotto on positiivinen (ja vieläpä äärettömän suuri) huolimatta siitä, kuinka suuren summan joutuisi maksamaan oikeudesta osallistua peliin. Luvussa 3.1 esitettyä suurten lukujen lakia (fakta 3.3) vahvempi tulos on vahva suurten lukujen laki, jonka mukaan samojen oletusten vallitessa keskiarvo n 1 n k=1 X k lähestyy odotusarvoa µ todennäköisyydellä yksi. Suurten lukujen lakeja voidaan myös yleistää tapauksiin, joissa summattavat ovat riippuvia toisistaan. Suurten lukujen lain toteuttavaa satunnaisjonoa X 1, X 2,... kutsutaan ergodiseksi. 3.7 Sanastoa Alla tässä luvussa esiintynyttä sanastoa englanniksi käännettynä. Monet tähän aihepiiriin liittyvät termit eivät kuitenkaan ole täysin vakiintuneita kummassakaan kielessä. suomi bitti entropia ergodinen momentti odotusarvo satunnaismuuttujan muunnos suurten lukujen laki supeta stokastisesti englanti bit entropy ergodic moment expectation, mean transformation of a random variable law of large numbers converge in probability 50

Hakemisto alakvartiili, 76 Bayesin kaava, 15, 92 Bernoulli-jakauma, 59 betajakauma, 96 binomijakauma, 59 binomikerroin, 18 bitti, 43 Chebyshevin epäyhtälö, 50 datajoukko, 72 datakehikko, 72 eksponenttijakauma, 25 entropia, 43 ergodinen, 46 erotus, 9 esiintyvyysharha, 15 estimaattori, 83 harhaton estimaattori, 83 hylkäysalue, 114 hyperparametri, 98 indikaattorifunktio, 26 jakauma, 21 diskreetti, 23 empiirinen, 73 jatkuva, 23 kertoma, 18 kertymäfunktio, 22 keskiarvo, 75 keskihajonta jakauman, 48 satunnaismuuttujan, 48 kombinatoriikka, 16 komplementti, 9 korrelaatio yhteisjakauman, 52 kovarianssi yhteisjakauman, 51 kvantiili, 75 leikkaus, 9 lukumäärä listat, 17 osajoukot, 18 lukumäärä, järjestykset, 18 mediaani, 75 merkitsevyystaso, 111 mitallinen funktio, 34 joukko, 19 momentti, 42 moodi, 75 multinomijakauma, 120 muuttuja, 72 nollahypoteesi, 108 normaalijakauma normitettu, 65 osajoukko, 8 ositus, 8 osituskaava, 14 otoskeskihajonta, 76 otoskorrelaatio, 77 otoskovarianssi, 77 p-arvo, 109 perusjoukko, 7 pistemassafunktio, 23 pistetodennäköisyysfunktio, 23 Poisson-jakauma, 24, 70 posteriorijakauma, 92 123

priorijakauma, 92 prosentiili, 76 reunajakauma diskreetti, 29 jatkuva, 29 reunatiheysfunktio diskreetti, 29 jatkuva, 29 riippumattomat satunnaismuuttujat, 30 tapahtumat, 12 satunnaismuuttuja, 20 diskreetti, 23 sigma-algebra, 19 suppeneminen stokastinen, 37 suurimman uskottavuuden estimaatti, 81 suurten lukujen laki, 37 vahva, 46 uskottavuusfunktio, 81, 92 logaritminen, 81 varianssi jakauman, 48 satunnaismuuttujan, 48 vastahypoteesi, 108 yhdiste, 9 yhteisjakauma, 25 diskreetti, 27 jatkuva, 27 tiheysfunktio, 27 yläkvartiili, 76 tapahtuma, 7 poissulkevat, 8 tasajakauma diskreetti, 24 jatkuva, 24 tiheysfunktio, 23 empiirinen, 73 tilastollinen merkitsevyys, 109 tilastollinen testi, 108 todennäköisyys aksiooma, 10 ehdollinen, 12 frekvenssitulkinta, 39 jakauma, 10 mitta, 10 monotonisuus, 10 summasääntö, 10 tulosääntö, 12 todennäköisyysfunktio, 23 todennäköisyysväli, 105 toteuma, 7 tulojoukko, 9 tyhjä joukko, 9 124

Kirjallisuutta [JP04] Jean Jacod and Philip Protter. Probability Essentials. Springer, second edition, 2004. [Kal02] Olav Kallenberg. Foundations of Modern Probability. Springer, second edition, 2002. [Wil91] David Williams. Probability with Martingales. Cambridge University Press, 1991. 125