Johdatus tn-laskentaan torstai 16.2.2012 Muunnoksen jakauma (ei pelkkä odotusarvo ja hajonta) Satunnaismuuttujien summa; Tas ja N Vakiokerroin (ax) ja vakiolisäys (X+b) Yleinen muunnos: neulanheittoesimerkki (sin)
Satunnaismuuttujien muunnoksia Muunnos Odotusarvo Varianssi vakion lisäys E(X + b) = E(X) + b Var(X + b) = Var(X) vakiokerroin E(aX) = a E(X) Var(aX) = a 2 Var(X) sm:ien summa E(X+Y) = E(X) + E(Y) Var(X+Y) = Var(X) + Var(Y) josx Y sm:ien tulo E(XY) = E(X) E(Y) josx Y yleinen muunnos g(x) (Lause 3.1.8) E[ g ( X )] g( x) f ( x) dx
Summan jakauma Edellä on todettu, että summan odotusarvo ja varianssi ovat yleensä helposti laskettavissa. Mutta summan jakauma onkin hankalampi juttu. Huom: odotusarvo ja varianssi eivät kerro kaikkea jakaumasta. Esim. satunnaismuuttujilla X~Exp(1), Y~N(1, 1 2 ) on sama odotusarvo =1 ja sama varianssi =1, mutta jakaumat ovat erimuotoiset. Ts. ne antavat samalle tapahtumalle (esim. 0<X<2) eri todennäköisyyden. 1 0.8 0.6 0.4 0.2 0-2 0 2 4 0.4 0.3 0.2 0.1 0-2 0 2 4
Kahden tasajakautuneen sm:n summa Herra K:n bussimatka koostuu osista bussin odotus Y ~ Tas( 0, 4) E(Y)=2 min D(Y)=1.15 min ajoaika Z ~ Tas(15, 25) E(Z)=20 min D(Z)=2.89 min Koko matka-aika M = Y+Z vähintään 0 + 15 = 15 min enintään 4 + 25 = 29 min odotusarvo E(M) = EY + EZ = 22 min varianssi Var(M) = Var(Y) + Var(Z) (jos Y Z, hmm) = 1.15 2 + 2.89 2 = 9.67 min 2 hajonta D(M) = Var(M) = 3.11 min Jatkokysymys: Mikä on M:n jakauma välillä (15, 29)? (Olisiko tasajakauma? Jos on, mikä on sen hajonta? Laske Jakauman Tas(15, 29) hajonta olisi = (29-15)/ 12 = 4.04 min 3.11 min!?)
Empiirinen kokeilu Bussin odotusaika Tas(0,4) ja ajoaika Tas(15,25). Miten summa on jakautunut? Arvotaan miljoona kertaa Y~Tas(0,4) ja Z~Tas(15,25) ja lasketaan summat. (Empiirinen histogrammi antaa tällöin hyvän käsityksen tiheysfunktion muodosta.) (Esim. Matlabissa Y = rand(1, 1e6)*4; Z=rand(1, 1e6)*10 + 15; M=Y+Z) 15000 kpl 10000 5000 Y ~ Tas(0,4) 0 0 5 10 15 20 25 30 odotusaika Y ~ Tas(0,4) 15000 kpl 10000 5000 Z ~ Tas(15,25) kpl 0 0 5 10 15 20 25 30 ajoaika Z ~ Tas(15,25) 15000 10000 5000 0 0 5 10 15 20 25 30 summa Y+Z M = Y+Z: ei tasajakauma (Miten poikkeaa? Miksi?)
Neljän tasajakautuneen summa (Herra K matkustaa kahdella bussilla) odotus1 X ~ Tas(0,4) E(X) = 2 ajoaika1 Y ~ Tas(10,14) E(Y) = 12 odotus2 Z ~ Tas(0,6) E(Z) = 3 ajoaika2 W ~ Tas(20,26) E(W) = 23 Matka-aika M=X+Y+Z+W E(M) = 40 M vähintään 0+10+0+20 = 30 M enintään 4+14+6+26 = 50 hajonta ( jos X,Y,Z,W ) D(M) = 2,94 Minkä muotoinen jakauma M:llä on?
Neljän tasajakautuneen summa (Herra K matkustaa kahdella bussilla) X ~ Tas(0,4) Y ~ Tas(10,14) Z ~ Tas(0,6) W ~ Tas(20,26) 0 5 10 15 20 25 30 35 40 45 50 M = X+Y+Z+W M melkein normaalijakautunut! (mutta M [30,50])
Summan jakauma: yleistä Jos X Y, voidaan summan X+Y tiheysfunktio laskea ns. konvoluutiolla (Lause 2.6.13, sivut 71-72) Tulos ei välttämättä enää samaa muotoa! Esim. X,Y ~ Tas summan tf on kolmio tai puolisuunnikas Esim. X,Y ~ Exp summalla on ns. gammajakauma Yleensä summan jakauma muodoltaan jotenkin pyöreämpi Itse asiassa: olipa summattavien jakauma mitä tahansa, niin summa muistuttaa normaalijakaumaa sitä tarkemmin mitä useampia termejä (raja-arvotulos ns. keskeisessä raja-arvolauseessa) Normaalijakauma on erikoistapaus: jos jo summattavat ovat normaaleja (ja riippumattomia), summakin on täsmälleen normaalijakautunut: Jos X, Y ~ N( ), niin X+Y ~ N( ) Normaalisuus siis säilyy yhteenlaskussa. Tämä voidaan todistaa useammallakin tavalla (kirjassa 2 tapaa; ei käsitellä tässä.)
Normaalijakautuneiden summa Oletetaan, että X Y, ja X ~ N( 1, 12 ) Y ~ N( 2, 22 ) Tällöin myös X+Y ~ N(jollain parametreilla). Mutta millä parametreilla? Muistetaan odotusarvon ja varianssin summakaavat: E(X+Y)=E(X)+E(Y) ja Var(X+Y)=Var(X)+Var(Y) Parametrit on siis helppo päätellä X+Y ~ N( 1 + 2, 12 + 22 ) Odotusarvot summataan ja varianssit summataan (kun X Y).
Normaalijakautuneiden summa Kahden eri bussilinjan ajoajat (riippumattomasti) Bussi 1: X ~ N(20, 4 2 ) Bussi 2: Y ~ N(24, 4 2 ) Matkat tehdään peräkkäin. Koko matka-aika X+Y ~ N(20+24, 4 2 +4 2 ) = N(44, 5.66 2 ) Huom: Hajonta ei kasvanut kovin paljon (ei siis 4 + 4 = 8 min ). Varianssit laskettiin yhteen ja hajonta on varianssin neliöjuuri. Mikä on tn, että matka-aika < 50 min? F X+Y (50) = ((50 44) / 5.66) = 0,855
Normaalijakautuneiden erotus Kahden eri bussilinjan ajoajat (riippumattomasti) Bussi 1: X ~ N(20, 4 2 ) Bussi 2: Y ~ N(24, 4 2 ) Bussit lähtevät samaan aikaan eri paikoista, ja saapuvat em. ajassa samalle pysäkille. Herra K on ykkösbussin kyydissä ja haluaa vaihtaa kakkosbussiin. Mikä on vaihtamiseen jäävän ajan V = (Y X) jakauma? Huomataan, että V on normaalijakautuneiden summa: V = Y + ( X), missä X ~ N( 20, 4 2 ) (normaalijak. kertominen vakiolla 1) Siis V ~ N(24 20, 4 2 +4 2 ) = N(4, 5,66 2 ) Odotusarvot vähennettiin toisistaan (ei yllätys) mutta varianssit summattiin. Vaihtoaikaa on keskimäärin 4 min. Hajonta 5,66 on siihen nähden melko suuri. Mikä on tn, että vaihtoaika on negatiivinen (jolloin vaihto epäonnistuu)? P(V < 0) = F V (0) = ((0 4) / 5,66) = 0,24
Diskreettien summa: Bernoulli(p) Jos summattavat ovat Bernoulli(p), niin kyse on toistokokeesta ja summa ~ Bin(n, p). Esim. n=3 kolikonheittoa, p=0.5, kruunien lukumäärä ~ Bin(3, 0.5)
Diskreettien summa: Bin() Oletetaan, että X Y, ja X ~ Bin(n 1, p) Y ~ Bin(n 2, p) Tällöin X+Y voidaan tulkita toistokokeeksi, jossa n 1 +n 2 riippumatonta yritystä samalla tn:llä p. Ilmeisesti siis X+Y ~ Bin(n 1 +n 2, p) Binomijakaumakin siis säilyy summauksessa (jos p- parametri on sama). (Toisenlainen todistus samalle asialle kirjassa s. 98, perustuu generoiviin funktioihin, ei kuulu tähän kurssiin)
Muiden diskreettien summa Muilla diskreeteillä sm:illa summa ei ole aivan niin yksinkertainen (kuin Bernoulli tai Bin) Sekin voidaan ratkaista konvoluutiolla (kuten jatkuvienkin sm:ien summa) Tässä esimerkkinä kahden ja kolmen nopanheiton summien jakaumat (ptnf). 1 2 3 4 5 6 7 8 9 10 11 12 Huom. Summa on edelleen diskreetti sm (joskin muodoltaan normaalia muistuttava, kun termejä on monta) 0 5 10 15 20
Muunnoksen jakauma: ax ja X+b Nämä ns. affiinimuunnokset ovat helppoja kertymäfunktiolle Lasketaan auki ax:n ja X+b:n kf Tästä derivoimalla niiden tf
Yleinen muunnoksen jakauma: Neulanheitto Tasolle heitetään 1 yksikön pituinen neula, jonka ylempi pää osoittaa umpimähkään johonkin suuntaan A radiaania, välillä (0, ), missä 0 tarkoittaa oikealle ja tarkoittaa vasemmalle: A ~ Tas(0, ) Neulan projektio pystyakselille on pituudeltaan Y = sin(a). Selvästi Y on jotain välillä (0,1], mutta mikä on sen jakauma? Viime luennolla laskettiin E(Y) = 2/ 0.637 Muunnoksen kf voidaan laskea yleisellä lauseella, mutta kokeillaan nyt vain empiirisesti: 1. arvotaan lukuja A ~ Tas(0, ) katsotaan niiden histogrammia 1 Y A 2. lasketaan vastaavat Y=sin(A) katsotaan niiden histogrammia Havaitaan, että Y ei ole ollenkaan tasajakautunut: Y saa erittäin usein lähellä ykköstä olevia arvoja. Tämä johtuu muunnoksen (sinifunktion) muodosta.