P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

Yhteenveto: Satunnaisvektorit ovat kuvauksia tn-avaruudelta seillaiselle avaruudelle, johon sisältyy satunnaisvektorin kaikki mahdolliset reaalisaatiot. Satunnaisvektorin realisaatio eli otos on jokin sen arvo ω 0 = x 0, missä ω 0 Ω. Satunnaisvektorin : Ω R n jakauma on sellainen joukkofunktio 5 avaruuden R n Borelin joukoilta välille [0, ], joka kuvaa B P B = BωP dω. Jakauma vastaa kysymykseen "kuinka todennäköisesti satuunaisvektorista saatava otos sisältyy joukkoon B". Valitsemalla erilaisia joukkoa B esim. pieniä hyperkuutioita tai hyperpalloja on mahdollista etsiä epätodennäköisiä tai todennäköisiä arvojoukkoja. Satunnaisvektorilla on aina jakauma. Satunnaisvektori voidaan muuntaa toiseksi satunnaisvektoriksi G, kun G on jatkuva funktio. Odotusarvo E[g] = aina kun integraali on hyvin määritelty. Ω Ω gωp dω R n -arvoisen satunnaisvektorin tiheysfunktio f : R n [0, on sellainen integroituva funktio, että P B = f xdx kaikilla hyperkuutioilla B R n.erityisesti f xdx =. Kaikilla satunnaisvektoreilla ei ole tiheysfunktiota. B Satunnaisvektorin odotusarvo m = E[] = xf xdx. Muunoksen g odotusarvo E[g] = gxf xdx. Kovarianssimatriisi Ristikovarianssimatriisi C = E[x E[x]x E[x] T ]. C Y = E[x E[x]y E[y] T ]. 5 Tn-laskennan yksi erikoisalue on tutkia jakaumien olemassaoloa. Tällöin pyritään näyttämään, että annettu joukkofunktio on tn-mitta. Muulloin käsitellään jo aiemmin tutkittuja tapauksia tai käytetään oletusta "olkoon satunnaisvektori". 0

Satunnaisvektorin ehdollinen tntf, kun Y = y on annettu, on f x Y = y = f,y x, y, x R n. f Y y Bayesin kaava f x Y = yf Y y = f,y x, y = f Y y = xf x. Erityisesti f x Y = y = f Y y = xf x. f Y y 4.2 Tilastollinen inversio-ongelma Tarkastellaan inversio-ongelmaa, jossa tuntemattomasta vektorista x 0 R n on annettu häiriöinen data y 0 = F x 0 + R m, missä suora teoria F : R n R m on jatkuva funktio. Datassa esiintyvästä häiriöstä saatavilla oleva tieto on usein luonteeltaan tilastollista. Eräissä tilanteissa häiriötä mallinnetaan esimerkiksi satunnaisvektorina =,..., m, jonka komponentit ovat riippumattomia ja niiden todennäköisyydet ovat P a i b = b exp 2πσ 2σ y2 dy, missä i =,..., m, a < b R ja σ > 0. a Kun F on lineaarinen kuvaus, jonka matriisi on M, niin edellisessä luvussa esitelty Morozovin diskrepanssiperiaate soveltuu huonosti tällaisen tapauksen käsittelyyn, sillä häiriön normi ei ole rajoitettu koska P > e P i > e > 0 millä tahansa e 0. Eräs vaihtoehto on siirtyä tilastollisiin ratkaisumenetelmiin. Olkoon Ω, Σ, P todennäköisyysavaruus. 02

Äärellisulotteisen tilastollisen inversio-ongelman ratkaisuperiaate. Osa II:. Tuntematon : Ω R n ja häiriö : Ω R n ovat satunnaisvektoreita. Suora teoria F : R n R m on jatkuva funktio. 2. Data Y = F + on silloin satunnaisvektori Y : Ω R m Esimerkki 36. 3. Datan annettu arvo y 0 = F x 0 + 0 R m on otoksen Y ω 0 = F ω 0 + ω 0 arvo eli y 0 = Y ω 0. 4. Tuntemattoman jakaumaa B P B nimitetään priorijakaumaksi ja sen tiheysfunktiota f x prioritodennäköisyystiheysfunktioksi. Yleisesti merkitään f pr x = f x sekaannusten välttämiseksi. 5. Tilastollisen inversio-ongelman ratkaisu on posteriorijakauma, jonka tntf on f post x := f x Y = y 0 = f Y y 0 = xf pr x fy y 0 = xf pr xdx Kor. 5 Posteriorijakauma on tuntemattoman jakauma, jota on päivitetty datan y 0 perusteella. 4.2. Lineaarinen Gaussinen inversio-ongelma Oletetaan, että häiriö N0, C, tuntematon N0, C, tuntematon ja häiriö ovat riippumattomia, F : R n R m on lineaarinen ja merkitään sen matriisia M. Annettu data y 0 = Mx 0 +ɛ 0 on näyte satunnaismuuttujasta Y = M+. Samoin kuin Esimerkissä 45 f Y y = x = f y Mx = 2πm detc e 2 y MxT C y Mx, joka on jatkuva ja rajoitettu funktio. Prioritntf f pr x = 2πm detc e 2 xt C on myös jatkuva ja rajoitettu funktio. Korollaarin 5 nojalla posterioritntf f post x = missä C y on normitusvakio. Tarkastellaan eksponenttia: f Y y 0 = xf pr x fy y 0 = xf pr xdx = C y 0 e 2 y 0 Mx T C x y 0 Mx e 2 xt C x, 2 y 0 Mx T C y 0 Mx 2 xt C x = 2 yt 0 C y 0 + 2 xt M T C y 0 + 2 yt 0 C Mx 2 xt M T C M + C x. 03

Merkitään C post = M T C ja täydennetään eksponentti neliömuodoksi 2 y 0 Mx T C y 0 Mx 2 xt C M + C x = 2 yt 0 C y 0 + 2 xt C postc post M T C y 0 + 2 yt 0 C MC post Cpostx 2 xt Cpostx = 2 yt 0 C y 0 + 2 mt postcpostm post 2 x m post T C postx m post missä m post = C post M T C y 0 = M T C Posterioritntf on Gaussinen funktio. Voimme määrätä nyt normitustekijän C y0, ja saamme f post x = M + C M T C y 0. 2πn detc post e 2 x mpostt C post x mpost. Posteriorijakauma on multinormaalijakauma ja sen odotusarvo ja kovarianssimatriisi on m post = M T C C post = M T C Erityisesti, jos C = δi ja C = ci, niin eli m post = M + C M T C M + C. M T M + δ c I M T y 0, y 0 m post = argmin x R n Mx y 0 2 + δ c x 2. Kun häiriön jakauma on N0, δi ja priorijakauma on N0, ci, niin posterioriodotusarvo on Tikhonov-regularisoitu ratkaisu, kun regularisaatioparametriksi on valittu α = δ/c. Posteriorijakaumasta saamme Tikhonov-regularisoidun ratkaisun lisäksi tuntemattoman posteriorikovarianssimatriisin C post = δ M T M + c I. Esimerkki 46. Olkoon matriisi 0 4 M = 2 3 4 3 66 04

0 0 0 0. 0 0 ja olkoot N 0, 0, 0, 0 0 0 ja N 0, 0, 0, 0 0. 0 0 0 0 0 0 0. riippumattomia satunnaisvektoreita. Määrää posterioritntf satunnaisvektorille, kun satunnaisvektorista Y = M +, on saatu otos Y = 4., 3., 65.9. Todellinen tuntematon x 0 = 0, 0,. Ratkaisu: Prioritntf on f pr x = f x = ja riippumattomuuden nojalla f Y y = x = f y Mx = = 2π3 0 exp 3 20 x2 + x 2 2 + x 2 3 2π3 0. exp 0 3 2 2π3 0. exp 0 3 y y 2 y 3 Tällöin posterioritntf on normitustekijää c vaille 6 y Mx 2 2 0 4 2 3 4 3 66 f post x, x 2, x 3 = cf Y y = xf pr x = c exp 0 0 4 x 4. 2 2 3 x 2 3. 4 3 66 x 3 65.9 2 x x 2 x 3 2. x 2 20 x 2. x 3 Koska kyseessä on lineaarinen Gaussinen ongelma, voidaan posterioritntf muoto sieventää Gaussisen jakauman Nm post, C post tiheysfunktioksi, missä m post = M T M + δ c I M T y 0 T T 0 4 0 4 = 2 3 2 3 + 0. 0 0 0 4 4. 0 0 2 3 3. 0 4 3 66 4 3 66 0 0 4 3 66 65.9 0.004 0.007 ja.000 C post = δ M T M + c I 0 4 = 0 2 3 4 3 66 4.5 5 0.02 5 5.5 0.02 0.02 0.02 0.000 0 4 0 0 2 3 + 0. 0 0 4 3 66 0 0 6 On tapana, että erisuuruisia normitustekijöitä ei ryhdytä merkitsemään eri symboleilla, vaan käytetään samaa symbolia c, vaikka sen arvo muuttuisi yhtälöjä sievennettäessä 05 T

Komponenttien posteriorireunatiheysfunktiot ovat post. N 0.004, 4.5 2 post. N0.007, 5.5 3 post. N.000, 0 4 Komponenttien ja 2 varianssi on selvästi suurempi kuin komponentin 3 varianssi. Priorijakaumaa voi tulkita niin, että i N0, c edustaa etukäteistietoa, jonka mukaan emme tiedä tarkalleen minkä arvo tuntemattoman komponentti saa, mutta mielestämme komponentin negatiiviset ja positiiviset arvot ovat yhtä mahdollisia mistä odotusarvo nolla ja suuret arvot ovat epätodennäköisiä. Riippumattomuus komponenttien välillä tarkoittaa, että emme rajoita vaihteluja komponenttien välillä. Äärellisulotteinen Gaussinen lineaarinen inversio-ongelma lyhyesti: Annettu data on y 0 = Mx 0 + 0, missä M R m n. Häiriön tilastollinen malli on m-ulotteinen Gaussinen satunnaisvektori, jonka jakauma on N0, C eli f y = 2πm detc e 2 yt C y, kaikilla y R m. Tuntematonta mallinnetaan n-ulotteisella Gaussisella satunnaisvektorilla, joka on riippumaton satunnaisvektorista ja jonka jakauma on N0, C eli prioritntf on f pr x = 2πn detc e 2 xt C x Datan tilastollinen malli on Y = M +. kaikilla x R n. Ratkaisu on posterioritntf f post x = f Y y 0 = xf pr x f R n Y y 0 = xf pr xdx = c y0 e 2 y 0 Mx T C y 0 Mx e 2 xt C x, jolle saadaan sievennetty lauseke f post x = 2πn detc post e 2 x mpostt Cpost x mpost, missä ja m post = M T C C post = M T C M + C M T C M + C. y 0 Yleisemmässä tapauksessa häiriön ja tuntemattoman prioriodotusarvo ei ole nolla Lisäksi häiriön ja tuntemattoman välillä voi olla riippuvuus. 06