Satunnaismuuttujat Satunnaismuuttuja kuvaa kokeen tuloksen reaaliakselille Satunnaismuuttuja on siis funktio X(s) joka saa reaalisia arvoja Koe s kuuluu todennäköisyysavaruuteen S (s S) Esimerkkejä Kolikonheitossatodennäköisyysavaruus S = {kruunu,klaava} Satunnaismuuttuja voisi olla { 1 (s = kruunu) X(s) = 1 (s =klaava) 50
Nopan heitossa S = {1, 2, 3, 4, 5, 6}. Satunnaismuuttuja voi olla X(s) =s, jolloin mahdolliset tulokset ovat 1,2,3,4,5,6 Satunnaismuuttuja voi olla myös X(s) =s 2, jolloin mahdolliset tulokset ovat 1,4,9,16,25,36 Usein merkitään yksinkertaisuuden vuoksi X(s) = X, mutta on syytä muistaa mistä on kysymys Kompleksinen satunnaismuuttuja Z on kahden reaalisen satunnaismuuttujan X ja Y funktio siten että Z = X + jy. Muuttujan Z ominaisuuksia tarkasteltaessa on tiedettävä ko. summan omaisuudet 51
Satunnaismuuttuja voi saada äärellisen määrän eri arvoja diskreetti satunnaismuuttuja (kuten edellisissä esimerkeissä) Satunnaismuuttuja voi myös saada kaikkia mahdollisia arvoja joltain tietyltä väliltä reaaliakselilla jatkuva satunnaismuuttuja (kuten elektronisten laitteiden generoiman kohinan amplitudi) 52
Käytännön tutkimustyössä tehdään usein seuraavaa: Näytteistetyn satunnaissignaalin (tiedonsiirtokanavasta vastaanotettu signaali) elementit ovat diskreettejä satunnaismuuttujia, mutta analyysissä niitä kohdellaan jatkuvina, koska jatkuvia muuttujia on helpompi käsitellä Jos sananleveys on riittävä (useita bittejä, ei kahta), niin näin tehty analyysi vastaa kokeellisia tuloksia Pienille sananleveyksille (muutama bitti) näin tehty analyysi ei ole tarkka vaan analyysi ja simulaatiotulokset (joissa käytetään ko. sananleveyttä) poikkevat jonkin verran toisistaan 53
Satunnaismuuttujat ja todennäköisyys Tarkastellaan tapahtumaa jossa satunnaismuuttuja X on lukua x pienempi eli tarkastellaan tapahtumaa {X x}. x voi olla mikä tahansa reaaliluku väliltä ( < x < ) Tapahtuman todennäköisyys on P(X x) Yleensä se merkitään lyhyesti F (x) (tai F X (x) jos on vaara seikoittaa johonkin muuhun vastaavaan funktioon) eli F (x) =P(X x) ( <x< ) (22) Funktiota F (x) kutsutaan todennäköisyys kertymäfunktioksi tai kumulatiiviseksi kertymäfunktioksi (CDF, cumulative distribution funktion) CDF siis kuvaa millä todennäköisyydellä satunnaismuuttuja X on lukua x pienempi 54
CDF on todennäköisyys joten 0 F (x) 1 On myös helppo havaita että F () =0jaF ( ) =1 CDF on kasvava funktio eli F (x 1 ) F (x 2 ), x 1 <x 2 Seuraavassaesimerkkejä diskreetistä ja jatkuvasta kertymäfunktiosta sekä näiden sekoituksesta 55
F (x) 1 F (x) 1 5 6 4 6 jatkuva CDF 3 6 2 6 1 6 Nopanheiton CDF kun X(s) =s sekoitus CDF 1 2 3 4 5 6 x 0 x Diskreetti CDF Jatkuva ja sekoitus CDF:t 56
Kertymäfunktion F (x) derivaattaa p(x)(myös p X (x)) kutsutaan satunnaismuuttujan X todennäköisyys tiheysfunktioksi (PDF, probability density function) Nyt siis pätee p(x) = df(x) ( <x< ) (23a) dx ja F (x) = x p(u) du ( <x< ) (23b) Koska F (x) on kasvava, niin p(x) 0 Selvästi p(x) dx = F ( ) = 1 (pinta-ala on 1) 57
Diskreettien muuttujien tapauksessa p(x)sisältää impulssinf (x):n epäjatkuvuuskohdassa x i eli tälläisessa kohdassa p(x) on p(x i )=P(X = x i )δ(x x i ) (24) jossa δ(x) on impulssifunktio eli { 1 x =0 δ(x) = 0 x 0 (25) 58
Satunnaismuuttujalla X sanotaan olevan jakauma. Jakaumat on usein nimetty henkilöiden (mahdollisesti keksijä) tai PDF funktion mukaan Esimerkkinä ensimmäisestä on Gaussin jakauma ja toisesta eksponentiaalinen jakauma, jossa PDF on eksponentiaalinen. Kullakin jakaumalla on PDF ja CDF, joista se on tunnistettavissa. 59
Usein halutaan tietää todennäköisyys jolla satunnaismuuttuja on jollain välillä eli tapahtuman {x 1 <X x 2 } todennäköisyys (x 1 <x 2 ) Tapahtuma voidaan aina esittää kahden toisensa poissulkevan tapahtuman unionina (usein käytetty temppu) Tapahtuma {X x 2 } on selvästi tapahtumien {X x 1 } ja {x 1 <X x 2 } unioni X x 2 X x 1 x 1 <X X 2 x 1 x 2 x 60
Tällöin eli Tästä seuraa x1 P(X x 2 )=P(X x 1 )+P(x 1 <X x 2 ) F (x 2 )=F (x 1 )+P(x 1 <X x 2 ) P(x 1 <X x 2 )=F (x 2 ) F (x 1 ) x2 x 1 x 2 = = x2 x2 p(x) dx x1 p(x) dx x 1 p(x) dx (26) Todennäköisyys että satunaismuuttuja X saa arvoja väliltä x 1 < X x 2 on siis PDF:n integraali yli tuon alueen 61
Useita satunnaismuutujia Kun tarkastellaan useita yhtäaikaisia tapahtumia tai peräkkäisiä tapahtumiapitäätietää näiden yhteis kertymä- ja/tai tiheysfunktiot (yhteisjakauma) Useat satunnaismuuttujat muodostavat periaatteessa moniulotteisen funktion, joka on määritelty yhdistetyssä näyteavaruudessa Tarkastellaan ensin kahden muuttujan X 1 ja X 2 yhteisjakaumaa ja yleistetään tulokset sen jälkeen useammille muuttujille 62
Yhteiskertymäfunktio (yhteis (joint) CDF) on F (x 1,x 2 )=P(X 1 x 1,X 2 x 2 ) = x1 x2 p(u 1,u 2 ) du 1 du 2 (27) jossa p(x 1,x 2 ) on yhteis todennäköisyys tiheysfunktio (yhteis PDF), joka on p(x 1,x 2 )= 2 x 1 x 2 F (x 1,x 2 ) (28) 63
Kun yhteis PDF integroidaan yli toisen satunnaismuuttujan saadaan p(x 1,x 2 ) dx 2 = p(x 1 ) (29) jota kutsutaan marginaaliseksi PDF:ksi (erotukseksi varsinaisesta PDF:stä, jota ei ole saatu integroimalla) On helppo havaita että p(x 1,x 2 ) dx 1 dx 2 =1 F (, ) =F (,x 2 )=F (x 1, ) =0 64
Yleistys useampiulotteisiin tapauksiin on suoraviivaista F (x 1,...,x n )=P(X 1 x 1,...,X n x n ) = x1 xn p(u 1,...,u n ) du 1...du n n p(x 1,...,x n )= F (x 1,...,x n ) x 1 x n Marginaaliset PDF:t voidaan generoida mille tahansa määrälle satunnaismuuttujia eli p(x 1,x 2,x 3,x 4,x 5,...,x n ) dx 2 dx 4 = p(x 1,x 3,x 5,...,x n ) Havaitaan myös että F (x 1,,x 3,,x 5,...,x n )=F (x 1,x 3,x 5,...,x n ) F (x 1,,x 2,...,x n )=0 65
Ehdollinen tiheysfunktio Ehdollinen todennäköisyyshän oli P(A B) =P (A, B)/P (B) Ehdollisen todennäköisyyden, että muuttuja X 1 on pienempi kuin x 1 kun satunnaismuuttuja X 2 on saanut arvon x 2 eli todennäköisyyden P(X 1 x 1 X 2 = x 2 ) laskeminen ei yleisessä tapauksessa onnistu suoraan, koska tyypillisesti P(X 2 = x 2 )=0 ( 0 vain jos kyseessä distreetti muuttuja jolla jokin arvo ko. pisteessä) Lasketaan siis tapahtuman {X 1 x 1 x 2 <X 2 x 2 } todennäköisyys, jossa on pieni positiivinen luku 66
Tällöin x1 x2 x P(X 1 x 1 x 2 <X 2 x 2 )= 2 p(u 1,u 2 ) du 1 du 2 x2 x 2 p(u 2) du 2 = F (x 1,x 2 ) F (x 1,x 2 ) F (x 2 ) F (x 2 ) (30) Olettaen, että vaaditut PDF:t ovat jatkuvia alueella (x 2,x 2 ) voidaan osoittaja ja nimittäjä yhtälössä (30) jakaa :lla ja ottaa raja-arvo 0 ( ) Derivaatan määritelmä: lim h 0 f(x) f(x + h) /h 67
Tällöin P(X 1 x 1 X 2 = x 2 ) F (x 1 x 2 ) (31) = F(x 1,x 2 )/ x 2 F(x 2 )/ x 2 = [ x 1 x2 p(u ] 1,u 2 ) du 1 du 2 / x2 [ x 2 p(u ] 2) du 2 / x2 x1 = p(u 1,x 2 ) du 1 p(x 2 ) Derivoimalla tämä x 1 :sen suhteen saadaan p(x 1 x 2 )= p(x 1,x 2 ) p(x 2 ) joka on ehdollinen PDF. (32) (33) 68
Selvästi meillä onmyös p(x 1,x 2 )=p(x 1 x 2 )p(x 2 )=p(x 2 x 1 )p(x 1 ) (34) Yhtälön (34) yleistys on joskus hyödyllinen jakaumia määrättäessä. Se on p(x 1,x 2,...,x n )=p(x 1,...,x k x k+1,...,x n )p(x k+1,...,x n ) 69
Riippumattomat satunnaismuuttujat Riippumattomuushan tarkoitti että eri kokeiden ulostulot eivät millään lailla vaikuta toisiinsa. Havaittiin, että tällöin P(A 1,...,A n )=P(A 1 ) P(A n ) Koska satunnaismuuttujat liittyvät kokeisiin ja P (X x) = F (x) niin satunnaismuuttujat ovat tilastollisesti riippumattomia jos ja vain jos n F (x 1,...,x n )=F(x 1 ) F(x n )= F (x i ) (35) tai p(x 1,...,x n )=p(x 1 ) p(x n )= i=1 n p(x i ) (36) i=1 70
Tämä tarkoittaa siis sitä, että riippumattomien satunnaismuuttujien CDF tai PDF on yksittäisten satunnaismuuttujien CDF:ien tai PDF:ien tulo Tämä on hyvin usein käytetty ja hyödyllinen tieto 71
Satunnaismuuttujien funktiot Usein tarvitsee tietää mikä on satunnaismuuttujan/muuttujien funktion jakauma Tämä tarkoittaa, että halutaan tietää muuttujan Y = g(x) jakauma, kun tiedetään muuttujan X jakauma Tämä on varsin suoraviivaista jos kuvaus g on yksi-yhteen (yksikäsitteinen) Jos kuvaus ei ole yksikäsitteinen, esim. Y = X 2, niin jakauman määräämisessätäytyy olla hyvin huolellinen Tätä tietoutta tullaan käyttämään esim. joidenkin tiedonsiirtomenetelmien suorituskyvyn määräämisessä (DTS) 72
Esimerkki 1 Tarkastellaan muuttujaa Y = ax + b, jossa a>0jab ovat vakioita Kuvaus on lineaarinen ja monotooninen (= joko kasvava tai vähenevä funktio, nyt kasvava) Kuvaus on siis yksikäsitteinen Olkoon F X (x) jaf Y (y) muuttujien X ja Y CDF:t Selvästi ( F Y (y) =P(Y y) =P(aX + b y) =P X y b ) a ( y b ) (y b)/a = F X = p X (x) dx a Derivoimalla F Y (y) saadaan p Y (y) = 1 ( y b ) a p X a 73
Lineaarisessa muunnoksessa muuttujan Y = ax + b jakauma on helposti esitettävissä muuttujan X jakauman avulla y Y = ax + b p X (x) p Y (y) x -1 1 x b a 0 b b + ay siirtää (b) venyttää (a) Esimerkin 1 havainnollistaminen 74
Esimerkki 2 Tarkastellaan muuttujaa Y = ax 3 + b Kuvaus on yksikäsitteinen 15 10 y 5 b Y=aX 3 +b 0 5 10 10 8 6 4 2 0 2 4 6 8 10 x 75
Nyt on siis F Y (y) =P(Y y) =P(aX 3 + b y) ( ( y b ) 1/3 ) (( y b ) 1/3 ) =P X = F X a a josta derivoimalla 1 (( y b ) 1/3 ) p Y (y) = 3a[(y b)/a] p 2/3 X a 76
Esimerkki 3 Nyt tarkastellaan muuttujaa Y = ax 2 + b Kuvaus ei ole yksikäsitteinen sillä yhtä Y :n arvoa vastaa kaksi X:n arvoa 10 9 8 7 6 y 5 4 Y=aX 2 +b 3 b 2 1 0 10 8 6 4 2 0 2 4 6 8 10 x 77
Nyt =P F Y (y) =P(aX 2 + b y) ( y b ) ( y b y b ) X =P <X a a a ( y b ) ( y b ) = F X F X a a Derivoimalla saadaan p Y (y) = p ( ) X (y b)/a 2a (y b)/a + p ( ) X (y b)/a 2a (y b)/a 78
Esimerkissä 3 havaittiin, että yhtälöllä g(x) =ax 2 + b on kaksi ratkaisua x 1 = (y b)/a ja x 2 = (y b)/a ja että muuttujan Y = ax 2 + b PDF on muotoa p Y (y) = p X(x 1 ) g (x 1 ) + p X(x 2 ) g (x 2 ) jossa x 1 ja x 2 ovat yhtälön g(x) =ax 2 + b juuret ja g (x) on g(x):än derivaatta x:n suhteen Yleisesti muuttujalle Y = g(x) päteekin p Y (y) = p X(x 1 ) g (x 1 ) + + p X(x n ) g (x n ) = n i=1 p X (x i ) g (x i ) jossa x i,i=1,...,n ovat yhtälön y = g(x) reaaliset juuret (37) 79
Sovelletaan edellistä tulosta (37) esimerkkiin 1 Nyt Y = ax + b, mutta ei rajoituta tilanteeseen a>0kuten esimerkkissä 1 Yhtälön y = g(x) juuri on y =(y b)/a ja funktion g(x) = ax + b derivaatta on a. Täten p Y (y) = p ( ) X (y b)/a a 80
Usean muuttujan tilanne Olkoon X =[x 1... x n ] n dimensioinen satunnaisvektori Sen CDF on F (X) =F (x 1,...,x n ) ja PDF vastaavasti p(x) = p(x 1,...,x n ). Nämä ovat siis muuttujien X 1,...,X n yhteis CDF ja PDF. Vektorimerkintä on siis oiva tapa yksinkertaistaa merkintöjä Meillä on lisäksi yksiarvoiset (yksi ulostulo) funktiot g i (X) jasatunnaismuuttujat Y i = g i (X), jotka riippuvat muuttujista X i,i= 1,...,n Myös Y i :t ja g i (X):t voidaan vektorisoida eli Y =[Y 1... Y n ]ja g(x) =[g 1 (X)... g n (X)] Lisäksi oletetaan että käänteiskuvaukset x i = g 1 (Y) ovatolemassa ja käänteisfunktiot ovat yksiarvoisia. Lisäksi vaaditaan, että funktioiden osittaisderivaatat ovat jatkuvia 81
(seuraava tulos ei siis sovi joka tilanteeseen) Silloin p(y) on ( p Y (Y) =p X g 1 (Y) ) g 1 (Y) (38) Y = p ( X g 1 (Y) ) g(x) (39) X Determinantit g 1 (Y) Y ja g(x) ovat kuvausten g 1 (Y)jag(X) X Jacobiaanit Jacobiaanit ovat g1 1 g1 g 1 y (Y) 1 1 y n Y =..... ja g g(x) 1 g x 1 1 x n gn 1 X =..... (40) g y 1 n g x 1 n x n g 1 n y n 82
Jacobiaanit ovat siis muunnosten osittaisderivaatoista muodostettujen matriisien determinatteja Tulos (38) on esitetty oppikirjassa Tulosta (39) ei ole esitetty oppikirjassa mutta se voi olla hyödyllinen, sitähän käytettiin jo yhden muuttujan funktion jakauman löytämisessä eli yksikäsitteisessä tapauksessa tulos (37) on suora seuraus tuloksesta (39) 83
Tulos (37) on hieman yleisempi (yhdelle muuttujalle) kuin (39), sillä siinä voiyhtälöllä y = g(x) voi olla useita ratkaisuja, mutta ratkaisussa (39) on oletettu yksi ratkaisu yhtälöryhmälle Y = g(x). Tulos (39) on toki yleistettävissä Otetaan seuraava lineaarisen muunnoksen yleistys esimerkiksi kummankin tavan käytöstä. Kyseistä muunnosta käytetään hyvin usein, joten esimerkki on hyödyllinen Olkoon Y = AX + b, jossa A on ei-singulaarinen n n muunnosmatriisi, Y ja X ovat n 1 satunnaisvektoreita ja b on n 1 vakiovektori Tällöin matriisin A käänteismatriisi A 1 on olemassa Käytetään ensin tapaa (38) Nyt X = A 1 (Y b) =g 1 (Y) Käänteiskuvauksen g 1 (Y) Jacobiaani on A 1 84
Näin on koska A 1 (Y b)/ Y = {A 1 Y A 1 b}/ Y = A 1 Miksi näin? Tarkastellaan matriisi vektoritulon Ay i:nettäelementtiä x i = j a ijy j, jossa a ij ja y j ovat m n matriisin A ja n 1 vektorin y elementit. Silloin x i = { j a } ijy j y k y k = { } a i1 y 1 +...+ a ik y k +...+ a in y n = a ik y k eli matriisin A (i, k) :s elementti Osittaisderivaattoja x i y on m n kpl jotka järjestettynä matriisiin antavat halutun tuloksen eli k x y = {Ay} = A y 85
Tuloksen (38) mukaan saadaan siis ( p(y) =p X A 1 (Y b) ) A 1 = p ( X A 1 (Y b) ) A sillä determinanteille pätee A 1 =1/ A Käytetään sitten tapaa (39) Tarkasteltava muunnos on Y = AX + b = g(x) Muunnoksen g(x) Jacobiaani on A Tuloksen (39) mukaan p(y) = p ( X A 1 (Y b) ) A joka on sama kuin tuloksen (38) avulla laskettu tulos 86
Tilastolliset keskiarvot Satunnaismuutujien tilastolliset keskiarvot ovat usein tarvittu ominaisuus ja ne ilmenevät useissa eri yhteyksissä, esim. demodulaattorien ja kanavakorjainten suunnittelussa Tärkeimpinä ovat ehkäpä ensimmäinen ja toinen momentti ja 2. keskeismomentti. Satunnaismuuttujan n:s momentti on E{X n } = x n p(x) dx (41) 1. momenttia kutsutaan satunnaismuuttujan tilastolliseksi keskiarvoksi tai odotusarvoksi (mean or expected value) ja se on E{X} m x = xp(x) dx (42) 87
Olkoon satunnaismuuttuja Y = g(x). Sen odotusarvo on E{Y } = g(x)p(x) dx (43) Miksi tämä kuvaa (yleisesti) keskiarvoa? Diskreetissä tapauksessa E{Y } = i g(x i)p (x = x i )δ(x x i ) selvästi kuvaa muuttujien g(x i )keskimääräistä arvoa Esim. nopanheitossa, jos g(x) = nopan silmäluku, saadaan 1 1/6+2 1/6+ +6 1/6 =3, 5 eli 1 esiintyy frekvenssillä 1/6, 2 frekvenssillä 1/6 jne. ja keskimääräinen arvo on 3,5 jatkuville muuttujille keskimääräinen arvo vastaa ylläolevaa integraalia 88
Olkoon Y =(X m x ) n eli X josta on vähennetty keskiarvo (potenssiin n) Tämän keskiarvo on E{(X m x ) n } = (x m x ) n p(x) dx (44) jota kutsutaan n:ksi keskeismomentiksi Se on momentti keskiarvon suhteen 2. keskeismomenttia kutsutaan varianssiksi ja se on E{(X m x ) 2 } σ 2 x = (x m x ) 2 p(x) dx (45) ja se kuvaa muuttujan arvon heilumista keskiarvon ympärillä eli hajontaa 89
Purkamalla neliöinti saadaan σx 2 = (x 2 2xm x + m 2 x)p(x) dx = x 2 2 p(x) dx 2m x xp(x) dx +mx p(x) dx }{{}}{{}}{{} E{X 2 } m x 1 =E{X 2 } m 2 x (46) joka muodostaa yhteyden varianssin sekä ensimmäisen ja toisen momentin välille Nollakeskiarvoiselle satunnaismuuttujalle varianssi ja toinen momentti ovat samat 90
Kahden muuttujan tapauksessa saadaan yhteismomentti E{X k 1 X n 2 } = sekä yhteis keskeismomentti E{(X 1 m 1 ) k (X 2 m 2 ) n } = x k 1x n 2p(x 1,x 2 ) dx 1 dx 2 (47) (x 1 m 1 ) k (x 2 m 2 ) n p(x 1,x 2 ) dx 1 dx 2 (48) jossa m i =E{X i }. Kiinnostavin tilanne on kun n = k = 1. Silloin muuttujien X i ja X j yhteismomenttia kutsutaan korrelaatioksi ja yhteiskeskeismomenttia kovarianssiksi 91
Korrelaatio on siis ja kovarianssi on E{X i X j } (49) µ ij =E{(X i m i )(X j m j )} (50) eli ne ovat muuttujien tulojen odotusarvot Kovarianssin sekä korrelaation ja keskiarvojen välillä onyhteys µ ij =E{X i X j X i m j m i X j + m i m j } =E{X i X j } E{X i } m }{{} j m i E{X j } +m }{{} i m j m i =E{X i X j } m i m j (51) Nollakeskiarvoisille muuttujille korrelaatio ja kovarianssi ovat samat m j 92
Useamman muuttujan tapauksessa voidaan myös määritellä erilaisia yhteismomentteja mutta useimmiten ollaan kiinnostuttu vain korrrelaatiosta ja kovarianssista eri muuttujien välillä. Olkoon meillä satunnaisvektori X = [X 1 X 2... X n ] T jossa yläindeksi T tarkoittaa transpoosia. X on siis n 1 pystyvektori Korrelaattiomatriisi sisältää vektorin X alkioiden väliset korrelaatiot ja kovarianssimatriisi niiden väliset kovarianssit Korrelaatiomatriisi on siis E{X 1 X 1 } E{X 1 X 2 }... E{X 1 X n } E{XX T } = E{X 2 X 1 } E{X 2 X 2 }... E{X 2 X n }...... (52) E{X n X 1 } E{X n X 2 }... E{X n X n } Diagonaali sisältää kunkin alkion 2. keskeismomentin ja diagonaalin ulkopuoliset elementit alkioiden välisiä yhteismomentteja 93
... m n ] T muuttujien X i keskiarvo- Olkoon m =E{X} =[m 1 vektori Kovarianssimatriisi on E{(X m)(x m) T } = µ 11 µ 12... µ 1n µ 21 µ 22... µ 2n...... (53) µ n1 µ n2... µ nn Diagonaali sisältää alkioiden varianssit sillä µ ii = σ 2 i Vastaavasti voidaan määrittää satunnaisvektorien X ja Y väliset ristikorrelaatio- ja -kovarianssimatriisi eli E{XY T } ja E{(X m x )(Y m y ) T } 94
Korreloimattomuus Kahta satunnaismuuttujaa X i ja X j sanotaan korreloimattomiksi jos niiden välinen kovarianssi on nolla eli µ ij =0 Tästä seuraa se, että korrelaatio on keskiarvojen tulo, silläyhtälöstä µ ij =E{X i X j } m i m j = m i m j =0 saadaan E{X i X j } = m i m j =E{X i } E{X j } Tästä seuraa että tilastollisesti riippumattomat satunnaismuuttujat ovat korreloimattomia Tästä ei seuraa että korreloimattomat satunnaismuuttujat ovat välttämättä riippumattomia (näin toki voi olla) Satunnaismuuttujien sanotaan olevan ortogonaalisia jos E{X i X j } =0 95
Näin on esim. jos muuttujat ovat korreloimattomia ja jompi kumpi tai molemmat keskiarvoista ovat nollia 96
Karakteristinen funktio Määritelmän mukaan satunnaismuuttujan karakteristinen funktio on E{e jvx } ψ(jv)= e jvx p(x) dx, j = 1 (54) Tämä vastaa Fourier muunnosta (lukuunottamatta eksponentin miinus merkkiä, mutta sillä eioleväliä) Fourier käänteismuunnoksesta seuraa että muuttujan PDF karakteristisen funktion avulla ilmaistuna on p(x) = 1 ψ(jv)e jvx dv (55) 2π Karakteristisen funktion avulla voidaan siis määrittää muuttujan PDF 97
Toinen hyödyllinen seikka on yhteys momentteihin Derivoimalla karakteristien funktio muuttujan v suhteen saadaan dψ(jv) = j xe jvx p(x) dx dv Ratkaisemalla tämä pisteessä v = 0 saadaan dψ(jv) = j xp(x) dx dv v=0 eli 1. momentti (keskiarvo) on ilmaistavissa myös muodossa E{X} = j dψ(jv) (56) dv v=0 98
Korkeamman asteen derivaatoista saadaan korkeammille momenteille yhtälö E{X n } =( j) ndn ψ(jv) v=0 (57) dv n Karakteristisen funktion avulla voidaan siis määrätä muuttujan momentit 99
Karakteristinen funktio voidaan esittää sarjamuodossa Karakteristisen funktion Taylorin sarja pisteen v = 0ympäristössä on d n ψ(jv) v=0 v n ψ(jv)= dv n n! k=0 Sijoittamalla tähän derivaatan paikalle yhtälöstä (56) saatu derivaatta saadaan ψ(jv)= E{X n } (jv)n (58) n! k=0 Karakteristinen funktio voidaan siis esittää myös momenttien avulla 100
Karakteristisen funktion avulla on helppo löytää riippumattomien satunnaismuuttujien summan PDF Tarkastellaan usean muuttujan summaa eli muuttujaa n Y = i=1 X i 101
Sen karakteristinen funktio on ψ Y (jv)=e{e jvy } { =E exp ( jv n ) } X i i=1 { n ( ) } =E e jvx i (sillä e a+b = e a e b ) = i=1 ( n i=1 ) e jvx i p(x 1,...,x n ) dx 1...,dx n 102
Koska muuttujat X i ovat riippumattomia, niin p(x 1,...,x n )= p(x 1 ) p(x n ) jolloin n [ ] ψ Y (jv)= e jvx i p(x i ) dx i = i=1 n ψ Xi (jv) (59) i=1 Riippumattomien muuttujien summan karakteristinen funktio on siis yksittäisten muuttujien karakterististen funktioiden tulo Summan PDF on tämän käänteinen Fourier muunnos Jos muuttujat ovat identtisesti jakautuneita eli p(x i )=p(x j ) i, j niin ψ Y (jv)= [ ψ X (jv)] n (60) 103
Fourier muunnoksen ominaisuuksista seuraa, ettäpdf:iäkäyttäen riippumattomien muuttujien summan PDF on yksittäisten PDF:ien konvoluutio Tulo on kuitenkin usein helpompi laskea kuin konvoluutio, joten karakteristisen funktion käyttö ko. summanpdf:n määräämiseen on useimmiten järkevää 104
Usean muuttujan yhteisjakauman tapauksessa tarvitaan moniulotteista Fourier muunnosta n:lle muuttujalle karakteristinen funktio on { n } ψ(jv 1,...,jv n )=E exp (j v i X i ) = i=1 exp (j n v i x i )p(x 1,...,x n ) dx 1...dx n i=1 Kahden muuttujan tapauksessa meillä on ψ(jv 1,jv 2 )= e j(v 1x 1 +v 2 x 2 ) p(x 1,x 2 ) dx 1 dx 2 105
Momentit saadaan generoitua vastaavasti kuten yhden muuttujan tapauksessa ottamalla osittaisderivaatat muuttujien suhteen ja ratkaisemalla se pisteissä v i =0 i. Esimerkiksi kahden muuttujan tapauksessa saadaan }{{} jj E{X 1 X 2 } = 2 ψ(jv 1,jv 2 ) v1 v 1 v 2 =v 2 =0 1 Korkeammat momentit voidaan käsitellä vastaavasti 106