P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

Samankaltaiset tiedostot
4.2.2 Uskottavuusfunktio f Y (y 0 X = x)

4.0.2 Kuinka hyvä ennuste on?

4.3.6 Eräitä diskreettejä Markov-kenttiä

Määritelmä 17. Olkoon Ω joukko ja Σ sen jokin σ-algebra. Kuvaus P : Σ [0, 1] on todennäköisyysmitta (eng. probability measure), jos

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Tilastolliset inversio-ongelmat

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Sovellettu todennäköisyyslaskenta B

3.2.2 Tikhonovin regularisaatio

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Likimääräisratkaisut ja regularisaatio

9. Tila-avaruusmallit

1. Tilastollinen malli??

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Likimääräisratkaisut ja regularisaatio

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

2. Uskottavuus ja informaatio

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Mallipohjainen klusterointi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

0 3 y4 dy = 3 y. 15x 2 ydx = 15. f Y (y) = 5y 4 1{0 y 1}.

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

Todennäköisyyden ominaisuuksia

Tilastomatematiikka Kevät 2008

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

peitteestä voidaan valita äärellinen osapeite). Äärellisen monen nollajoukon yhdiste on nollajoukko.

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Moniulotteiset satunnaismuuttujat ja jakaumat

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Inversio-ongelmien laskennallinen peruskurssi Luento 2

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

031021P Tilastomatematiikka (5 op) viikko 3

Matemaattisten tieteiden kandiohjelma / MTL Todennäköisyyslaskenta IIb Kurssikoe (kesto 2h 30 min)

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

8.1 Ehdolliset jakaumat

805306A Johdatus monimuuttujamenetelmiin, 5 op

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Matriisilaskenta, LH4, 2004, ratkaisut 1. Hae seuraavien R 4 :n aliavaruuksien dimensiot, jotka sisältävät vain

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

031021P Tilastomatematiikka (5 op) viikko 7

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Sallitut apuvälineet: kirjoitusvälineet, laskin sekä käsinkirjoitettu, A4-kokoinen lunttilappu ja MAOL taulukkokirjaa

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Lineaariset luokittelumallit: regressio ja erotteluanalyysi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Tilastollisia peruskäsitteitä ja Monte Carlo

SGN-2500 Johdatus hahmontunnistukseen 2007 Luennot 4 ja 5

JATKUVAT JAKAUMAT Laplace-muunnos (Laplace-Stieltjes-muunnos)

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

6.2.3 Spektrikertymäfunktio

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Tilastollinen aineisto Luottamusväli

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Regressioanalyysi. Vilkkumaa / Kuusinen 1

ARMA(p, q)-prosessin tapauksessa maksimikohdan määrääminen on moniulotteinen epälineaarinen optimointiongelma.

Satunnaismuuttujien muunnokset ja niiden jakaumat

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

Dynaamiset regressiomallit

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

r > y x z x = z y + y x z y + y x = r y x + y x = r

Sovellettu todennäköisyyslaskenta B

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Testejä suhdeasteikollisille muuttujille

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

riippumattomia ja noudattavat samaa jakaumaa.

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Väliestimointi (jatkoa) Heliövaara 1

Todennäköisyyslaskun kertaus. Heliövaara 1

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

, c) x = 0 tai x = 2. = x 3. 9 = 2 3, = eli kun x = 5 tai x = 1. Näistä

Jatkuvat satunnaismuuttujat

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

7 Vapaus. 7.1 Vapauden määritelmä

Satunnaismuuttujat Satunnaismuuttuja kuvaa kokeen tuloksen reaaliakselille Satunnaismuuttuja on siis funktio X(s) joka saa reaalisia arvoja Koe s

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Regressioanalyysi. Kuusinen/Heliövaara 1

pitkittäisaineistoissa

Tutkimustiedonhallinnan peruskurssi

3. laskuharjoituskierros, vko 6, ratkaisut

4.3.7 Epäoleellinen integraali

Transkriptio:

Yhteenveto: Satunnaisvektorit ovat kuvauksia tn-avaruudelta seillaiselle avaruudelle, johon sisältyy satunnaisvektorin kaikki mahdolliset reaalisaatiot. Satunnaisvektorin realisaatio eli otos on jokin sen arvo ω 0 = x 0, missä ω 0 Ω. Satunnaisvektorin : Ω R n jakauma on sellainen joukkofunktio 5 avaruuden R n Borelin joukoilta välille [0, ], joka kuvaa B P B = BωP dω. Jakauma vastaa kysymykseen "kuinka todennäköisesti satuunaisvektorista saatava otos sisältyy joukkoon B". Valitsemalla erilaisia joukkoa B esim. pieniä hyperkuutioita tai hyperpalloja on mahdollista etsiä epätodennäköisiä tai todennäköisiä arvojoukkoja. Satunnaisvektorilla on aina jakauma. Satunnaisvektori voidaan muuntaa toiseksi satunnaisvektoriksi G, kun G on jatkuva funktio. Odotusarvo E[g] = aina kun integraali on hyvin määritelty. Ω Ω gωp dω R n -arvoisen satunnaisvektorin tiheysfunktio f : R n [0, on sellainen integroituva funktio, että P B = f xdx kaikilla hyperkuutioilla B R n.erityisesti f xdx =. Kaikilla satunnaisvektoreilla ei ole tiheysfunktiota. B Satunnaisvektorin odotusarvo m = E[] = xf xdx. Muunoksen g odotusarvo E[g] = gxf xdx. Kovarianssimatriisi Ristikovarianssimatriisi C = E[x E[x]x E[x] T ]. C Y = E[x E[x]y E[y] T ]. 5 Tn-laskennan yksi erikoisalue on tutkia jakaumien olemassaoloa. Tällöin pyritään näyttämään, että annettu joukkofunktio on tn-mitta. Muulloin käsitellään jo aiemmin tutkittuja tapauksia tai käytetään oletusta "olkoon satunnaisvektori". 0

Satunnaisvektorin ehdollinen tntf, kun Y = y on annettu, on f x Y = y = f,y x, y, x R n. f Y y Bayesin kaava f x Y = yf Y y = f,y x, y = f Y y = xf x. Erityisesti f x Y = y = f Y y = xf x. f Y y 4.2 Tilastollinen inversio-ongelma Tarkastellaan inversio-ongelmaa, jossa tuntemattomasta vektorista x 0 R n on annettu häiriöinen data y 0 = F x 0 + R m, missä suora teoria F : R n R m on jatkuva funktio. Datassa esiintyvästä häiriöstä saatavilla oleva tieto on usein luonteeltaan tilastollista. Eräissä tilanteissa häiriötä mallinnetaan esimerkiksi satunnaisvektorina =,..., m, jonka komponentit ovat riippumattomia ja niiden todennäköisyydet ovat P a i b = b exp 2πσ 2σ y2 dy, missä i =,..., m, a < b R ja σ > 0. a Kun F on lineaarinen kuvaus, jonka matriisi on M, niin edellisessä luvussa esitelty Morozovin diskrepanssiperiaate soveltuu huonosti tällaisen tapauksen käsittelyyn, sillä häiriön normi ei ole rajoitettu koska P > e P i > e > 0 millä tahansa e 0. Eräs vaihtoehto on siirtyä tilastollisiin ratkaisumenetelmiin. Olkoon Ω, Σ, P todennäköisyysavaruus. 02

Äärellisulotteisen tilastollisen inversio-ongelman ratkaisuperiaate. Osa II:. Tuntematon : Ω R n ja häiriö : Ω R n ovat satunnaisvektoreita. Suora teoria F : R n R m on jatkuva funktio. 2. Data Y = F + on silloin satunnaisvektori Y : Ω R m Esimerkki 36. 3. Datan annettu arvo y 0 = F x 0 + 0 R m on otoksen Y ω 0 = F ω 0 + ω 0 arvo eli y 0 = Y ω 0. 4. Tuntemattoman jakaumaa B P B nimitetään priorijakaumaksi ja sen tiheysfunktiota f x prioritodennäköisyystiheysfunktioksi. Yleisesti merkitään f pr x = f x sekaannusten välttämiseksi. 5. Tilastollisen inversio-ongelman ratkaisu on posteriorijakauma, jonka tntf on f post x := f x Y = y 0 = f Y y 0 = xf pr x fy y 0 = xf pr xdx Kor. 5 Posteriorijakauma on tuntemattoman jakauma, jota on päivitetty datan y 0 perusteella. 4.2. Lineaarinen Gaussinen inversio-ongelma Oletetaan, että häiriö N0, C, tuntematon N0, C, tuntematon ja häiriö ovat riippumattomia, F : R n R m on lineaarinen ja merkitään sen matriisia M. Annettu data y 0 = Mx 0 +ɛ 0 on näyte satunnaismuuttujasta Y = M+. Samoin kuin Esimerkissä 45 f Y y = x = f y Mx = 2πm detc e 2 y MxT C y Mx, joka on jatkuva ja rajoitettu funktio. Prioritntf f pr x = 2πm detc e 2 xt C on myös jatkuva ja rajoitettu funktio. Korollaarin 5 nojalla posterioritntf f post x = missä C y on normitusvakio. Tarkastellaan eksponenttia: f Y y 0 = xf pr x fy y 0 = xf pr xdx = C y 0 e 2 y 0 Mx T C x y 0 Mx e 2 xt C x, 2 y 0 Mx T C y 0 Mx 2 xt C x = 2 yt 0 C y 0 + 2 xt M T C y 0 + 2 yt 0 C Mx 2 xt M T C M + C x. 03

Merkitään C post = M T C ja täydennetään eksponentti neliömuodoksi 2 y 0 Mx T C y 0 Mx 2 xt C M + C x = 2 yt 0 C y 0 + 2 xt C postc post M T C y 0 + 2 yt 0 C MC post Cpostx 2 xt Cpostx = 2 yt 0 C y 0 + 2 mt postcpostm post 2 x m post T C postx m post missä m post = C post M T C y 0 = M T C Posterioritntf on Gaussinen funktio. Voimme määrätä nyt normitustekijän C y0, ja saamme f post x = M + C M T C y 0. 2πn detc post e 2 x mpostt C post x mpost. Posteriorijakauma on multinormaalijakauma ja sen odotusarvo ja kovarianssimatriisi on m post = M T C C post = M T C Erityisesti, jos C = δi ja C = ci, niin eli m post = M + C M T C M + C. M T M + δ c I M T y 0, y 0 m post = argmin x R n Mx y 0 2 + δ c x 2. Kun häiriön jakauma on N0, δi ja priorijakauma on N0, ci, niin posterioriodotusarvo on Tikhonov-regularisoitu ratkaisu, kun regularisaatioparametriksi on valittu α = δ/c. Posteriorijakaumasta saamme Tikhonov-regularisoidun ratkaisun lisäksi tuntemattoman posteriorikovarianssimatriisin C post = δ M T M + c I. Esimerkki 46. Olkoon matriisi 0 4 M = 2 3 4 3 66 04

0 0 0 0. 0 0 ja olkoot N 0, 0, 0, 0 0 0 ja N 0, 0, 0, 0 0. 0 0 0 0 0 0 0. riippumattomia satunnaisvektoreita. Määrää posterioritntf satunnaisvektorille, kun satunnaisvektorista Y = M +, on saatu otos Y = 4., 3., 65.9. Todellinen tuntematon x 0 = 0, 0,. Ratkaisu: Prioritntf on f pr x = f x = ja riippumattomuuden nojalla f Y y = x = f y Mx = = 2π3 0 exp 3 20 x2 + x 2 2 + x 2 3 2π3 0. exp 0 3 2 2π3 0. exp 0 3 y y 2 y 3 Tällöin posterioritntf on normitustekijää c vaille 6 y Mx 2 2 0 4 2 3 4 3 66 f post x, x 2, x 3 = cf Y y = xf pr x = c exp 0 0 4 x 4. 2 2 3 x 2 3. 4 3 66 x 3 65.9 2 x x 2 x 3 2. x 2 20 x 2. x 3 Koska kyseessä on lineaarinen Gaussinen ongelma, voidaan posterioritntf muoto sieventää Gaussisen jakauman Nm post, C post tiheysfunktioksi, missä m post = M T M + δ c I M T y 0 T T 0 4 0 4 = 2 3 2 3 + 0. 0 0 0 4 4. 0 0 2 3 3. 0 4 3 66 4 3 66 0 0 4 3 66 65.9 0.004 0.007 ja.000 C post = δ M T M + c I 0 4 = 0 2 3 4 3 66 4.5 5 0.02 5 5.5 0.02 0.02 0.02 0.000 0 4 0 0 2 3 + 0. 0 0 4 3 66 0 0 6 On tapana, että erisuuruisia normitustekijöitä ei ryhdytä merkitsemään eri symboleilla, vaan käytetään samaa symbolia c, vaikka sen arvo muuttuisi yhtälöjä sievennettäessä 05 T

Komponenttien posteriorireunatiheysfunktiot ovat post. N 0.004, 4.5 2 post. N0.007, 5.5 3 post. N.000, 0 4 Komponenttien ja 2 varianssi on selvästi suurempi kuin komponentin 3 varianssi. Priorijakaumaa voi tulkita niin, että i N0, c edustaa etukäteistietoa, jonka mukaan emme tiedä tarkalleen minkä arvo tuntemattoman komponentti saa, mutta mielestämme komponentin negatiiviset ja positiiviset arvot ovat yhtä mahdollisia mistä odotusarvo nolla ja suuret arvot ovat epätodennäköisiä. Riippumattomuus komponenttien välillä tarkoittaa, että emme rajoita vaihteluja komponenttien välillä. Äärellisulotteinen Gaussinen lineaarinen inversio-ongelma lyhyesti: Annettu data on y 0 = Mx 0 + 0, missä M R m n. Häiriön tilastollinen malli on m-ulotteinen Gaussinen satunnaisvektori, jonka jakauma on N0, C eli f y = 2πm detc e 2 yt C y, kaikilla y R m. Tuntematonta mallinnetaan n-ulotteisella Gaussisella satunnaisvektorilla, joka on riippumaton satunnaisvektorista ja jonka jakauma on N0, C eli prioritntf on f pr x = 2πn detc e 2 xt C x Datan tilastollinen malli on Y = M +. kaikilla x R n. Ratkaisu on posterioritntf f post x = f Y y 0 = xf pr x f R n Y y 0 = xf pr xdx = c y0 e 2 y 0 Mx T C y 0 Mx e 2 xt C x, jolle saadaan sievennetty lauseke f post x = 2πn detc post e 2 x mpostt Cpost x mpost, missä ja m post = M T C C post = M T C M + C M T C M + C. y 0 Yleisemmässä tapauksessa häiriön ja tuntemattoman prioriodotusarvo ei ole nolla Lisäksi häiriön ja tuntemattoman välillä voi olla riippuvuus. 06