The Metropolis-Hastings Algorithm

Samankaltaiset tiedostot
Satunnaislukujen generointi

4.0.2 Kuinka hyvä ennuste on?

Matematiikan ja tilastotieteen laitos Reaalianalyysi I Harjoitus Malliratkaisut (Sauli Lindberg)

DIFFERENTIAALI- JA INTEGRAALILASKENTA I.1. Ritva Hurri-Syrjänen/Syksy 1999/Luennot 6. FUNKTION JATKUVUUS

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

IV. TASAINEN SUPPENEMINEN. f(x) = lim. jokaista ε > 0 ja x A kohti n ε,x N s.e. n n

Markovin ketjut jatkuvalla tila-avaruudella sekä Metropolisin ja Hastingsin algoritmi

. Kun p = 1, jono suppenee raja-arvoon 1. Jos p = 2, jono hajaantuu. Jono suppenee siis lineaarisesti. Vastaavasti jonolle r k+1 = r k, suhde on r k+1

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Toispuoleiset raja-arvot

Funktiot. funktioita f : A R. Yleensä funktion määrittelyjoukko M f = A on jokin väli, muttei aina.

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

saadaan kvanttorien järjestystä vaihtamalla ehto Tarkoittaako tämä ehto mitään järkevää ja jos, niin mitä?

4.3 Moniulotteinen Riemannin integraali

Sinin jatkuvuus. Lemma. Seuraus. Seuraus. Kaikilla x, y R, sin x sin y x y. Sini on jatkuva funktio.

Osakesalkun optimointi

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

BM20A0900, Matematiikka KoTiB3

MS-A010{3,4} (ELEC*) Differentiaali- ja integraalilaskenta 1 Luento 3: Jatkuvuus

Tutkimustiedonhallinnan peruskurssi

Jatkuvat satunnaismuuttujat

Generointi yksinkertaisista diskreeteistä jakaumista

Konvergenssilauseita

Funktion raja-arvo ja jatkuvuus Reaali- ja kompleksifunktiot

peitteestä voidaan valita äärellinen osapeite). Äärellisen monen nollajoukon yhdiste on nollajoukko.

Johdatus reaalifunktioihin P, 5op

Positiivitermisten sarjojen suppeneminen

Mitta- ja integraaliteoria 2 Harjoitus 1, Olkoon f : A! [0, 1] mitallinen ja m(a) < 1. Näytä, että josonp>1javakio M<1, joille

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

Satunnaismuuttujien muunnokset ja niiden jakaumat

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 3

3.6 Su-estimaattorien asymptotiikka

saadaan kvanttorien järjestystä vaihtamalla ehto Tarkoittaako tämä ehto mitään järkevää ja jos, niin mitä?

031021P Tilastomatematiikka (5 op) viikot 5 6

5. laskuharjoituskierros, vko 8, ratkaisut

Tutkimustiedonhallinnan peruskurssi

Osakesalkun optimointi. Anni Halkola Turun yliopisto 2016

Analyysi 1. Harjoituksia lukuihin 1 3 / Syksy Osoita täsmällisesti perustellen, että joukko A = x 4 ei ole ylhäältä rajoitettu.

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Reaaliarvoisen yhden muuttujan funktion raja arvo LaMa 1U syksyllä 2011

Dynaamiset regressiomallit

MATA172 Sami Yrjänheikki Harjoitus Totta vai Tarua? Lyhyt perustelu tai vastaesimerkki!

3. laskuharjoituskierros, vko 6, ratkaisut

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

BM20A0300, Matematiikka KoTiB1

MCMC-menetelmien ongelmakohtia ja ratkaisuja

Martingaalit ja informaatioprosessit

Erilaisia Markov-ketjuja

Matematiikan peruskurssi (MATY020) Harjoitus 10 to

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

P (A)P (B A). P (B) P (A B) = P (A = 0)P (B = 1 A = 0) P (B = 1) P (A = 1)P (B = 1 A = 1) P (B = 1)

Kuinka määritellään 2 3?

Ilkka Mellin (2008) 1/5

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

MS-A0207 Differentiaali- ja integraalilaskenta 2 (Chem) Yhteenveto, osa I

Tilastotieteen aihehakemisto

Luento 10: Optimointitehtävien numeerinen ratkaiseminen; optimointi ilman rajoitusehtoja

2. Todista Lause 1.2 : Jos I on ylinumeroituva indeksijoukko ja a i > 0kaikillai 2 I, niin P i2i a i = 1.

Luento 11: Rajoitusehdot. Ulkopistemenetelmät

MS-C1350 Osittaisdifferentiaaliyhtälöt Harjoitukset 5, syksy Mallivastaukset

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

8.1 Ehdolliset jakaumat

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Martingaalit ja informaatioprosessit

Analyysin peruslause

Osa 2: Otokset, otosjakaumat ja estimointi

y = 3x2 y 2 + sin(2x). x = ex y + e y2 y = ex y + 2xye y2

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,

MATEMATIIKAN JA TILASTOTIETEEN LAITOS

3. Teoriaharjoitukset

Epälineaaristen yhtälöiden ratkaisumenetelmät

Valintahetket ja pysäytetyt martingaalit

2 Konveksisuus ja ratkaisun olemassaolo

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

JOHDATUS LUKUTEORIAAN (syksy 2017) HARJOITUS 1, MALLIRATKAISUT

Luento 8: Epälineaarinen optimointi

Gradient Sampling-Algoritmi

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

Markov-ketjut pitkällä aikavälillä

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastomatematiikka Kevät 2008

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo Ratkaisut ja pisteytysohjeet

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Duaalisuus kokonaislukuoptimoinnissa. Mat , Sovelletun matematiikan tutkijaseminaari, kevät 2008, Janne Karimäki

6. Toisen ja korkeamman kertaluvun lineaariset

JATKUVUUS. Funktio on jatkuva jos sen kuvaaja voidaan piirtää nostamatta kynää paperista.

Analyysi 1. Harjoituksia lukuihin 4 7 / Syksy Tutki funktion f(x) = x 2 + x 2 jatkuvuutta pisteissä x = 0 ja x = 1.

Numeeriset menetelmät

Transkriptio:

The Metropolis-Hastings Algorithm Chapters 6.1 6.3 from Monte Carlo Statistical Methods by Christian P. Robert and George Casella 08.03.2004 Harri Lähdesmäki The Metropolis-Hastings Algorithm p. 1/21

Taustaa päämääränä laskea (approksimoida) integraali h(x)f(x)dx tähän tarkoitukseen ei välttämättä tarvita näytteitä X f (Accept-Reject, Importance sampling) idea: X 1,..., X n f käyttämällä ergodista Markovin-ketjua, jonka stationäärinen jakauma on f aloituspiste x (0) ei (periaatteesa) vaikuta, koska ketju (X (t) ) ergodinen isolle T 0 voidaan olettaa, että X (T 0),... f saadaan riippuva näyte X (T 0),... The Metropolis-Hastings Algorithm p. 2/21

MCMC Määritelmä 6.1.1. Markovin-ketju Monte Carlo menetelmä jakauman f simuloimiseksi on mikä tahansa menetelmä, joka tuottaa ergodisen Markovin-ketjun (X (t) ), jonka stationäärinen jakauma on f tässä kappaleessa keskitytään Metropolis-Hastings (M-H) menetelmään The Metropolis-Hastings Algorithm p. 3/21

MCMC (2) alustavia huomioita riippuvien näytteiden käyttö samankaltaista kuin i.i.d. näytteiden, sillä ergodisuus lause (Th. 4.7.4) takaa, että keskiarvo 1 T T h(x (t) ) t=1 suppenee kohti arvoa E f [h(x)] riippumattomia näytteitä saataisiin esim. generoimalla n ketjua (X (t) i ), i = 1,... n, ja ottamalla vain (X (T 0) i ) The Metropolis-Hastings Algorithm p. 4/21

Metropolis-Hastings menetelmä Määritelmän 6.1.1 pohjalta voitaisiin keksiä useita menetelmiä M-H asettaa minimaaliset vaatimukset jakaumalle f M-H:n perustana kohde jakauma f ja ehdollinen jakauma q(y x) The Metropolis-Hastings Algorithm p. 5/21

Metropolis-Hastings menetelmä (2) M-H algoritmi [A.24] annettuna x (t) 1. generoi Y t = q(y x (t) ) 2. valitse { X (t+1) Y t, todennäköisyydellä ρ(x (t), Y t ), = x (t), todennäköisyydellä 1 ρ(x (t), Y t ), missä ρ(x, y) = min { f(y) f(x) } q(x y) q(y x),1 The Metropolis-Hastings Algorithm p. 6/21

Metropolis-Hastings menetelmä (3) lisää huomioita M-H riippuu ainoastaan osamääristä f(y t )/f(x (t) ) ja q(x (t) y t )/q(y t x (t) ) M-H ei riipu f:n ja q:n normalisoinnista olettaen, että q( y):n normalisointi on riippumaton y:stä M-H määritelty vain jos f(x (t) ) > 0 jos f(x (0) ) > 0 niin f(x (t) ) > 0, t = 1,2,... ketjussa (X (t) ) voi olla toistoja The Metropolis-Hastings Algorithm p. 7/21

M-H:n konvergoinnista vaatimukset f:lle ja q:lle, jotta f on (X (t) ):n stationäärinen jakauma oletetaan, että E = supp f on kytketty (ei välttämätön ehto: jos E ei kytketty, niin jokainen komponentti täytyy käsitellä erikseen ja osoittaa, että komponentit ovat kytkettyjä M-H:n ytimellä) jos supp q supp f, niin f ei ole M-H:n stat. jakauma, sillä jos olemassa A E s.e. A f(x)dx > 0 ja A q(y x)dx = 0 kaikilla x E, niin jos x (0) / A (X (t) ) ei koskaan käy A:ssa minimi vaatimus x supp f supp q( x) supp f The Metropolis-Hastings Algorithm p. 8/21

M-H:n konvergoinnista (2) Määritelmä 6.2.1 Markovin-ketju ytimellä K toteuttaa tasapainoehdon jos olemassa f s.e. K(y, x)f(y) = K(x, y)f(x) (x, y) E E Teoreema 6.2.2 Jos määritelmän 6.2.1 tasapainoehto voimassa s.e. f on tdn. tiheysfunktio, niin 1. tiheysfunktio f on ketjun stationäärinen jakauma 2. ketju on kääntyvä Tod. kohta 1. kaikille mitallisille B K(y, B)f(y)dy = K(y, x)f(y)dxdy Y = Y Y B B K(x, y)f(x)dxdy = B f(x)dx. The Metropolis-Hastings Algorithm p. 9/21

M-H:n konvergoinnista (3) Teoreema 6.2.3 Jos supp q supp f, niin f on M-H menetelmän tuottaman ketjun (X (t) ) stat. jakauma Tod. M-H:n siirtymäydin on K(x, y) = ρ(x, y)q(y x) + (1 r(x))δ x (y), missä r(x) = ρ(x, y)q(y x)dy. Selvästi ja ρ(x, y)q(y x)f(x) = ρ(y, x)q(x y)f(y) (1 r(x))δ x (y)f(x) = (1 r(y))δ y (x)f(y). Laskemalla puolittain yhteen nähdään, että tasapainoehto toteutuu, ja tulos seuraa Teoreemasta 6.2.2. The Metropolis-Hastings Algorithm p. 10/21

M-H:n konvergoinnista (4) M-H:n konstruktiosta seuraa invarianttijakauma f ergodisuus teoreema voimassa jos f on myös aperiodinen ja Harris palautuva riittävä ehto aperiodisuudelle: askeleet X (t+1) = X (t) ovat mahdollisia, ts. P[ρ(X (t), Y t ) 1] < 1 P[f(X (t) )q(y t X (t) ) f(y t )q(x (t) Y t )] < 1 (1) ketjun (X (t) ) redusoitumattomuus riippuu ehdollisesta jakaumasta q: riittävä ehto q(y x) > 0 (y, x) E E (2) The Metropolis-Hastings Algorithm p. 11/21

M-H:n konvergoinnista (5) redusoitumattomuus seuraa ehdosta (2): A E s.e. λ(a) > 0, K(x, A) > 0 kaikille x E koska f on ketjun invarianttijakauma, niin ketju on positiivinen ja Teoreeman 4.7.2 nojalla palautuva Lemma 6.2.4 Jos M-H ketju (X (t) ) on f-redusoitumaton, niin se on Harris palautuva Tod. kirjan sivut 236 237 The Metropolis-Hastings Algorithm p. 12/21

M-H:n konvergoinnista (6) Teoreema 6.2.5 Oletetaan, että M-H ketju (X (t) ) in f-redusoitumaton 1. jos h(x) f(x)dx <, niin lim T 1 T T h(x (t) ) = t=1 h(x)f(x)dx 2. jos ketju (X (t) ) on lisäksi aperiodinen, niin lim n K n (x, )µ(dx) f = 0 TV Tod. Jos (X (t) ) on f-redusoitumaton, se on Harris palautuva Teoreeman 6.2.4 nojalla. Kohta 1. seuraa Erg. teoreemasta Th. 4.7.4. Kohta 2. on sama kuin Teoreema 4.6.5. The Metropolis-Hastings Algorithm p. 13/21

M-H:n konvergoinnista (7) Seurauslause 6.2.6. Jos ehdollinen jakauma q toteuttaa ehdot ja P[f(X (t) )q(y t X (t) ) f(y t )q(x (t) Y t )] < 1 q(y x) > 0 (y, x) E E, niin Teoreeman 6.2.5 johtopäätökset ovat voimassa. Lemma 6.2.7. Oletaan, että f on rajoitettu ja positiivinen joukoissa A E, A kompakti. Jos olemassa ɛ, δ > 0 s.e. q(y x) > ɛ if x y < δ, niin M-H ketju (X (t) ) on f-redusoitumaton ja aperiodinen. Lisäksi jokainen ei-tyhjä kompakti joukko on pieni joukko. Tod. kirjan sivu 238. The Metropolis-Hastings Algorithm p. 14/21

M-H:n konvergoinnista (8) Seurauslause 6.2.8. Jos M-H ketjun invarianttijakauma on f ja ehdollinen jakauma toteuttaa Lemman 6.2.7 ehdot, niin Teoreeman 6.2.5 johtopäätökset ovat voimassa. The Metropolis-Hastings Algorithm p. 15/21

Erilaisia M-H algoritmeja riippumaton M-H menetelmä [A.25] annettuna x (t) 1. generoi Y t = g(y) 2. valitse { Yt, todennäköisyydellä min X (t+1) = x (t), muulloin, vain Y t :t ovat riippumattomia, eivät X (t) :t edelliset konvergenssilauseet voimassa jos g(y) > 0 melkein kaikkialla y E { f(yt ) f(x (t) ) g(x (t) ) g(y t ),1 }, The Metropolis-Hastings Algorithm p. 16/21

Erilaisia M-H algoritmeja (2) Teoreema 6.3.1 Jos olemassa vakio M s.e. f(x) Mg(x) kaikilla x supp f, (3) niin algoritmi [A.25] tuottaa tasaisesti ergodisen ketjun. Tällöin K n (x, ) f TV 2(1 1/M) n. Jos ehto (3) ei ole voimassa, niin ketju ei ole edes geometrisesti ergodinen. Tod. Kirjan sivut 239 241 The Metropolis-Hastings Algorithm p. 17/21

Erilaisia M-H algoritmeja (3) Lemma 6.3.2 Jos ehto (3) voimassa, niin [A.25]:n hyväksymistodennäköisyyden odotusarvo on vähintään 1/M. Tod. Kirjan sivu 241. i.i.d. M-H parempi kuin Accept-Reject menetelmä, sillä se hyväksyy enemmän näytteitä tarkempi vertailu hankalaa esimerkkejä The Metropolis-Hastings Algorithm p. 18/21

Erilaisia M-H algoritmeja (4) Esimerkki 6.3.3. gamma satunnaismuuttujien Ga(α, β) generointi Ga([α],[α]/α) instrumenttijakaumaa käyttäen Accept-Reject ja riippumattoman M-H menetelmän vertailu E f [X 2 ] estimoimiseksi kirjan sivut 242 243 The Metropolis-Hastings Algorithm p. 19/21

Erilaisia M-H algoritmeja (5) satunnaiskävelyt Y t = x (t) + ɛ t, ɛ t g q(y x) on nyt muotoa g(y x) ketju on ergodinen jos g(x) > 0, kun x B(0, δ) jollekin δ satunnaiskävely M-H menetelmä [A.28] annettuna x (t) 1. generoi Y t g(y x (t) ) 2. valitse { { } X (t+1) Yt, todennäköisyydellä min 1, f(y t) = f(x (t) ), x (t), muulloin, The Metropolis-Hastings Algorithm p. 20/21

Erilaisia M-H algoritmeja (6) Esimerkki 6.3.5 normaalijakauman generointi satunnaiskävelyllä generoi N(0, 1) satunnaismuuttujia käyttäen U[ δ, δ] jakautuneita muuttujia tulokset: kirjan sivu 246 ei tasaisesti ergodinen (ehdot geometriselle ergodisuudelle) Esimerkki 6.3.7 Häntäilmiön tutkiminen: geometrisen ja ei-geometrisen ergodisuuden vertailu kirjan sivut 247 248 The Metropolis-Hastings Algorithm p. 21/21