Bayesläiset tilastolliset mallit

Samankaltaiset tiedostot
Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3

11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

11.1 Nollahypoteesi, vastahypoteesi ja p-arvo

Satunnaismuuttujan odotusarvo ja laskusäännöt

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien summa ja keskiarvo

Liite B. Suomi englanti-sanasto

Satunnaismuuttujien summa ja keskiarvo

Satunnaismuuttujan odotusarvo ja laskusäännöt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Keskihajonta ja korrelaatio

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden käsite ja laskusäännöt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

30A02000 Tilastotieteen perusteet

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Satunnaismuuttujat ja jakaumat

Osa 2: Otokset, otosjakaumat ja estimointi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Vilkkumaa / Kuusinen 1

Harjoitus 2: Matlab - Statistical Toolbox

Tilastollinen päättely, 10 op, 4 ov

Sovellettu todennäköisyyslaskenta B

Todennäköisyyden käsite ja laskusäännöt

Stokastiikka ja tilastollinen ajattelu

Stokastiikka ja tilastollinen ajattelu

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Stokastiikka ja tilastollinen ajattelu

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Stokastiikka ja tilastollinen ajattelu

805306A Johdatus monimuuttujamenetelmiin, 5 op

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

tilastotieteen kertaus

Tilastollinen aineisto Luottamusväli

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Todennäköisyyden ominaisuuksia

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Inversio-ongelmien laskennallinen peruskurssi Luento 7

4.2.2 Uskottavuusfunktio f Y (y 0 X = x)

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Moniulotteisia todennäköisyysjakaumia

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Maximum likelihood-estimointi Alkeet

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Sovellettu todennäköisyyslaskenta B

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

Jatkuvat satunnaismuuttujat

3.7 Todennäköisyysjakaumia

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Sovellettu todennäköisyyslaskenta B

2. Uskottavuus ja informaatio

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

Satunnaismuuttujien muunnokset ja niiden jakaumat

,ܾ jaü on annettu niin voidaan hakea funktion

Todennäköisyyslaskenta. β versio. Todennäköisyyslaskenta. Ilkka Mellin. Teknillinen korkeakoulu, Matematiikan laboratorio. Ilkka Mellin (2006) I

Mat Sovellettu todennäköisyyslasku A

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Kun datasta halutaan muodostaa malleja, ne ovat yleensä tilastollisia (esim. regressio, luokittelu, ryhmittely...) F(x 0 ) = P(x x 0 ) (1)

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

Sovellettu todennäköisyyslaskenta B

Testejä suhdeasteikollisille muuttujille

dx=2&uilang=fi&lang=fi&lvv=2015

Tilastolliset luottamusvälit

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Transkriptio:

Luku 9 Bayesläiset tilastolliset mallit Lasse Leskelä Aalto-yliopisto 8. lokakuuta 07 9. Priorijakauma ja posteriorijakauma Bayesläisen tilastollisen päättelyn lähtökohtana on päivittää satunnaisilmiöön liittyvien tapahtumien todennäköisyyksiä sitä mukaa kuin ilmiöstä saadaan uutta dataa. Tämä edellyttää todennäköisyyden käsitteen subjektiivista tulkintaa. Bayesläisessä ajattelussa datalähteen käyttäytymistä kuvaava tuntematon parametri mielletään satunnaismuuttujaksi, jonka jakauma kuvaa havainnoijan uskomusta parametrin arvosta. Uskomusta päivitetään, kun havaitaan uutta dataa. Havainnoijan uskomusta parametrin arvosta kuvaa priorijakauma p(θ), joka kertoo millä todennäköisyydellä havainnoija uskoo parametrin arvon olevan θ. Kun datalähteestä havaitaan uusi datapiste x, uskomus päivitetään uudeksi jakaumaksi. Päivitetty jakauma p(θ x) on parametrin posteriorijakauma. Uskomuksen päivittäminen perustuu uskottavuusfunktioon f(x θ), joka määrittää parametrin θ mukaan käyttäytyvän datalähteen tuottamien arvojen jakauman. Diskreetti priorijakauma p(θ) päivitetään posteriorijakaumaksi soveltamalla Bayesin päivityskaavaa p(θ x) = p(θ)f(x θ) θ p(θ )f(x θ ). (9.) Posteriorijakauma saadaan siis priorijakauman ja uskottavuusfunktion normitettuna tulona. Päivityskaava jatkuville priorijakaumille saadaan vaihtamalla lat. prior = edeltävä, posterior = seuraava Funktiota f(x θ) kutsutaan tiheysfunktioksi silloin, kun se tulkitaan x:n funktiona, ja uskottavuusfunktioksi silloin, kun se tulkitaan θ:n funktiona. 96

summa integraaliksi ylläolevassa kaavassa. Päivityskaava voidaan johtaa luvun.7 tuloksista ja siinä esiintyvät funktiot voidaan tulkita satunnaismuuttujien yhteisjakauman reunajakaumina (luku 9.6). Esimerkki 9. (Tuntematon kolikko). Laatikossa tiedetään olevan kolme tasaista (kruunan tn θ = 0.5), yksi lievästi vino (θ = ) ja yksi vahvasti vino (θ = 0.9) kolikko. Satunnaisesti valittua kolikkoa heitettäessä havaitaan klaava. Millä todennäköisyydellä heitetty kolikko oli tasainen? Ennen datan havaitsemista laatikosta satunnaisesti valittu kolikko on tasainen todennäköisyydellä 3, lievästi vino todennäköisyydellä ja vahvasti vino 5 5 todennäköisyydellä. Kun tuntematonta parametria θ mallinnetaan satunnaismuuttujana Θ, on parametrin jakauma ennen datan havaitsemista ao. taulukon 5 mukainen..0 θ 0.5 0.9 p(θ) 0. 0. 0. 0..0 Koska θ edustaa kruunan todennäköisyyttä, on parametrin θ uskottavuusfunktio havainnon klaava suhteen f(klaava θ) = θ. Näin ollen p(θ)f(klaava θ) = ( 0.5) + 0. ( ) + 0. ( 0.9) θ =, joten kaavan (9.) mukaan parametriarvon 0.5 posterioritodennäköisyys on p(0.5 klaava) = p(0.5)f(klaava 0.5) ( 0.5) = p(θ)f(klaava θ) θ = 0.75. Klaavan havaitseminen siis kasvatti kolikon tasaisuuden todennäköisyyttä arvosta 0.5 arvoon 0.75, mutta kolikolle itselleen ei heiton aikana tapahtunut mitään. Satunnaismuuttuja Θ ei siis kuvasta heitettyä kolikkoa, vaan kolikon heittäjän subjektiivista uskomusta heitetyn kolikon tyypistä. Kaavan (9.) avulla voidaan laskea posterioritodennäköisyydet myös parametriarvoille ja 0.9. Tuloksena saadaan allaolevassa taulukossa esitetty posteriorijakauma. 97

.0 θ 0.5 0.9 p(θ klaava) 0.75 5 0. 0..0 Käytännössä posteriorijakauman kannattaa laskea vaiheittain sarake sarakkeelta allaolevan taulukon avulla. Kolme ensimmäistä saraketta saadaan suoraan tehtävänannosta. Sarake 4 eli normittamaton posterioritiheys saadaan kertomalla pareittain sarakkeiden ja 3 alkiot. Päivityskaavassa (9.) esiintyvä normitusvakio saadaan summaamalla sarakkeen 4 alkiot, eli tässä tapauksessa. Sarake 5 saadaan jakamalla sarakkeen 4 alkiot normitusvakiolla. Parametri Prioritiheys Uskottavuus Normittamaton posterioritiheys Posterioritiheys θ p(θ) f(klaava θ) p(θ)f(klaava θ) p(θ klaava) 0.5 0.5 0.30 0.75 0. 8 0.9 0. 0. 5 Lasketaan samalla tapaa vielä posteriorijakauma havainnon x = kruuna suhteen. Laskelman välivaiheet on esitetty allaolevassa taulukossa. Parametri Prioritiheys Uskottavuus Normittamaton posterioritiheys Posterioritiheys θ p(θ) f(kruuna θ) p(θ)f(kruuna θ) p(θ kruuna) 0.5 0.5 0.30 0.50 0. 0. 0.9 0. 0.9 0.30 Alkuperäinen priorijakauma ja tuloksena saadut kaksi posteriorijakaumaa on esitetty alla..0.0.0 0. 0. 0. 0..0 0..0 0..0 Priorijakauma p(θ) Posteriorijakauma p(θ klaava) Posteriorijakauma p(θ kruuna) 98

9. Usean datapisteen posteriorijakauma Bayesin päivityskaavaa (9.) voidaan soveltaa myös silloin, kun havaitaan monta datapistettä. Tällöin kaavan muuttuja x tulkitaan datapisteiden listaksi x = (x,..., x n ). Tarkastellaan esimerkiksi saman kolikon heittämistä monta kertaa peräkkäin. Kun havaitaan kaksi klaavaa, uskottavuusfunktio datajoukolle (x, x ) = (0, 0) on f(0, 0 θ) = f(0 θ)f(0 θ) = ( θ). Parametrin θ posteriorijakauma kahden klaavan suhteen saadaan allaolevan taulukon mukaisilla laskuilla. Parametri Prioritiheys Uskottavuus Normittamaton posterioritiheys Posterioritiheys θ p(θ) f(0, 0 θ) p(θ)f(0, 0 θ) p(θ 0, 0) 0.5 0.5 0.50 5 0. 3 0.74 0.9 0. 0 0 Samaan tapaan voidaan laskea posteriorijakauma useampienkin klaavojen sarjoille. Alla muutama posteriorijakauma..0 0..0 0..0 0. 0..0 Posteriorijakauma p(θ 0) 0..0 Posteriorijakauma p(θ 0, 0) 0..0 Posteriorijakauma p(θ 0, 0, 0, 0, 0) Sadan klaavan havaitsemisen jälkeen posteriorijakauman massa keskittyy tähtitieteellisen pientä poikkeamaa vaille arvoon 0.5. Tämä tuntuu paradoksaaliselta, sillä tn saada 00 klaavaa peräkkäin tasaisella kolikolla on 00. Paradoksi selittyy priorin valinnalla: Ylläoleva priorijakauma p(θ) kuvastaa absoluuttista 00% varmuutta siitä, että kolikko ei puolla klaavan suuntaan. 9.3 Uskomuksen vaiheittainen päivittäminen Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia satunnaismuuttujia. Havainnoijan uskomusta tuntemattoman parametrin arvosta kuvastaa priorijakauma p(θ). Havaittuaan datapisteen x hän päivittää uskomuksensa posteriorijakaumaksi p(θ x ). Miten uskomus tulee päivittää, kun sen jälkeen havaitaan vielä toinen uusi datapiste x? 99

Havaittuja datapisteitä x ja x vastaava posteriorijakauma voidaan laskea soveltamalla Bayesin päivityskaavaa (9.) muodossa p(θ x, x ) = p(θ)f(x, x θ) θ p(θ )f(x, x θ ), (9.) missä f(x, x θ) on todennäköisyys havaita pistepari (x, x ) parametrin θ mukaan käyttäytyvästä datalähteestä. Toinen tapa päivittää uskomusta on ensin laskea posteriorijakauma ˆp(θ) = p(θ x ) datapisteen x suhteen ja sen jälkeen laskea uusi posteriorijakauma priorijakaumasta ˆp(θ) datapisteen x suhteen. Seuraava tärkeä tulos osoittaa, että vaiheittainen päivitys saman tuloksen kuin suorakin tapa. Tästä seuraa, että sarjamuotoista dataa havainnoivan henkilön tai tietokoneohjelman ei tarvitse pitää kirjaa menneistä datapisteitä: nykyinen uskomus jakaumaksi koodattuna sisältää ennustamisen kannalta kaiken oleellisen informaation menneestä. Fakta 9.. Kaavan (9.) määrittämä posteriorijakauma voidaan laskea vaiheittain muodossa ˆp(θ)f(x θ) p(θ x, x ) = θ ˆp(θ )f(x θ ), missä ˆp(θ) = p(θ x ). Todistus. Bayesin päivityskaavan (9.) mukaan ˆp(θ) = p(θ x ) = c p(θ)f(x θ), missä normitusvakio c = θ p(θ)f(x θ). Koska datalähde tuottaa riippumattomia satunnaismuuttujia, pätee lisäksi Näin ollen f(x, x θ) = f(x θ)f(x θ). ˆp(θ)f(x θ) θ ˆp(θ )f(x θ ) = c p(θ)f(x θ)f(x θ) θ c p(θ )f(x θ )f(x θ ) p(θ)f(x, x θ) = θ p(θ )f(x, x θ ) = p(θ x, x ). 9.4 Bayesläinen binaarimalli Binaarinen datalähde tuottaa riippumattomia {0, }-arvoisia satunnaislukuja siten, että arvon todennäköisyys on θ. Lähtökohtaisesti parametrista θ ei tiedetä mitään, joten sen uskotaan noudattavan jatkuvan välin [0, ] tasajakaumaa tiheysfunktiona {, x (0, ), p(θ) = 0, muuten. 00

Kun datalähteestä havaitaan arvot x = (x,..., x n ), halutaan priorijakauma päivittää posteriorijakaumaksi. Bayesläisen binaarisen mallin kannalta keskeisiä jatkuvia jakaumia ovat betajakaumat. Yleinen betajakauma parametreina a > 0 ja b > 0 on jatkuva jakauma, jonka tiheysfunktio on { c a,b f(θ) = θa ( θ) b, kun θ [0, ], 0, muuten, missä normitusvakio 3 c a,b = (a )!(b )!. Betajakaumien tiheysfunktioita on piirretty kuvaan 9.. Yksikkövälin [0, ] tasajakauma on erikoistapaus betajakau- (a+b )! masta parametreina a = ja b =. 3 3 3 0 0.5.0 a =, b = 0 0.5.0 a = 3, b = 9 Kuva 9.: Betajakaumien tiheysfunktioita. 0 0.5.0 a = 9, b = 3 Bayesläisen binaarimallin erityispiirre on, että päivityskaavassa datajoukosta x riittää tietää ykkösten lukumäärä x ja nollien lukumäärä n x. Betajakauma parametreina a ja b päivittyy betajakaumaksi parametreina a + x ja b + n x. Erityistapauksessa a = ja b = allaolevasta tuloksesta saadaan päivityskaava tasaiselle priorijakaumalle. Fakta 9.3. Jos binaarisen datalähteen parametrin priorijakauma on betajakauma parametreina a ja b, niin posteriorijakauma havainnon x = (x,..., x n ) suhteen on betajakauma parametreina a + x ja b + n x, missä x = n i= x i on ykkösten lukumäärä datajoukossa x. Todistus. Yksittäisen datapisteen x i uskottavuusfunktio on { θ, x i = 0, f(x i θ) = θ, x i =, joten riippumattomuuden perusteella koko datajoukon uskottavuusfunktioksi saadaan n f(x θ) = f(x i θ) = θ x ( θ) n x. i= 3 Betajakauma voidaan määritellä myös silloin, kun a ja b eivät ole kokonaislukuja. Tällöin normitusvakiossa esiintyvät kertomat korvataan gammafunktiolla. 0

Normittamaton posteriorijakauma saadaan priorijakauman ja uskottavuusfunktion tulona muotoon p(θ)f(x θ) = ( c a,b θa ( θ) b ) θ x ( θ) n x = c a,b θa+ x ( θ) b+n x. Bayesin päivityskaavan (9.) mukaan posteriorijakauma on näin ollen p(θ x) = p(θ)f(x θ) p(η)f(x η)dη = θ a ( θ) b η a ( η) b dη, missä a = a + x ja b = b + x. Ylläoleva lauseke on betajakauman tiheysfunktio parametreina a ja b. Esimerkki 9.4 (Tuntematon kolikko). Tuntematonta kolikkoa heitettäessä havaittiin kruunaa ja 8 klaavaa. Kolikosta ei ole ennalta mitään taustatietoja. Määritä kruunan todennäköisyyttä kuvaavan parametrin posteriorijakauma. Kuvaile posteriorijakauma myös tapauksessa, kun havaitaan 0 kruunaa ja 80 klaavaa. Koska kolikosta ei ennalta tiedetä mitään, valitaan kruunan todennäköisyyttä kuvaavan parametrin θ priorijakaumaksi yksikkövälin [0, ] tasajakauma, joka on erityistapaus betajakaumasta parametreina a = ja b =. Posteriorijakauma on faktan 9.3 mukaan betajakauma parametreina a + = 3 ja b + 8 = 9. Jos havaittaisiinkin 0 kruunaa ja 80 klaavaa, saataisiin posteriorijakaumaksi betajakauma parametreina a + 0 = ja b + 80 = 8. Molempien tapauksien posteriorijakaumat on esitetty alla. 0 9 8 7 6 5 4 3 0 0.5.0 Kuva 9.: Binaarimallin posteriorijakauma havainnon kruunaa ja 8 klaavaa suhteen (punainen) sekä havainnon 0 kruunaa ja 80 klaavaa suhteen (pinkki). Priorijakauma on esitetty sinisellä. 0

9.5 Bayesläinen normaalimalli Tarkastellaan datalähdettä, joka tuottaa riippumattomia normaalijakautuneita satunnaislukuja X, X,..., joiden odotusarvo θ on tuntematon ja keskihajonta σ tunnettu. Mallin tuntematon odotusarvoparametri tulkitaan satunnaismuuttujaksi, joka noudattaa normaalijakaumaa odotusarvona µ 0 ja keskihajontana σ 0. Priorijakauman parametreja µ 0 ja σ 0 kutsutaan hyperparametreiksi erotuksena datalähteen käyttäytymistä suoraan kuvaaville parametreille. Datalähteen varsinaiset parametrit (θ, σ) kuvaavat siis datalähteen toimintaa, ja hyperparametrit (µ 0, σ 0 ) havainnoijan uskomusta mallin tuntemattomasta parametrista θ. Normaalimallissa datalähteen odotusarvoparametrin priorijakauma on normaalijakauma tiheysfunktiona p(θ) = (πσ0) / e (θ µ 0) σ 0 (9.3) ja uskottavuusfunktio havaitun datajoukon (x,..., x n ) suhteen on f(x,..., x n θ) = n i= n f(x i θ) = (πσ ) n/ e i= (x i θ) σ. (9.4) Normaalimallin tekee erityisen käyttökelpoiseksi se, että normaalijakautunutta prioria vastaa normaalijakautunut posteriori. Lisäksi posteriorijakauman odotusarvon ja keskihajonnan laskemiseksi riittää tietää havaitun datajoukon keskiarvo m(x) ja koko n. Allaolevassa normaalimallin päivityskaavassa posteriorijakauman odotusarvo on painotettu keskiarvo priorijakauman odotusarvosta ja havaitun datajoukon keskiarvosta. Fakta 9.5. Bayesläisen normaalimallin posteriorijakauma on normaalijakauma, jonka odotusarvo ja keskihajonta saadaan kaavoista µ = µ σ0 0 + n m(x) σ σ 0 + n σ ja σ = σ0 + n σ, (9.5) missä m(x) = n n i= x i on havaitun datajoukon keskiarvo. Todistus. Posterijakauman normittamaton tiheysfunktio saadaan lausekkeiden (9.3) ja (9.4) tulona kirjoitettua muotoon p(θ)f(x θ) = c 0 e h(θ), missä h(θ) = (θ µ 0) σ 0 + i (x i θ) σ. ja c 0 = (πσ 0) / (πσ ) n/. Ylläoleva toisen asteen polynomi voidaan sieventää muotoon h(θ) = aθ + bθ + c, 03

missä a = (σ 0 +nσ ), b = ( σ0 µ 0 + σ i x ) i ja c = Yleistä neliöksi täydentämisen kaavaa ( aθ + bθ + c = a θ + b ) + c b a 4a soveltamalla saadaan funktiolle h(θ) esitys (σ 0 µ 0+σ i x i ). h(θ) = (θ µ ) σ + c b 4a, missä ja µ = b a = σ 0 µ 0 + nσ m(x) σ0. + nσ σ = (a) / = (σ 0 + nσ ) /. Posterijakauman normittamaton tiheysfunktio saadaan siis muotoon p(θ)f(x θ) = c 0 e h(θ) = c 0 e (θ µ ) σ Posterijakauman tiheysfunktio on siis +c b 4a. p(θ x) = p(θ)f(x θ) p(θ )f(x θ )dθ = e (θ µ ) σ = (θ µ ) e σ dθ e (θ µ ) πσ σ, missä viimeinen yhtälö on seurausta siitä, että normaalijakauman tiheysfunktio integroituu ykköseksi. Esimerkki 9.6 (Kohinainen kanava). Lukuarvoisia signaaleja lähetetään kohinaisen tiedonsiirtokanavan välityksellä. Kohinan seurauksena pisteestä A lähetetyn signaalin arvo θ vastaanotetaan pisteessä B satunnaismuuttujana, joka noudattaa normaalijakaumaa odotusarvona θ ja keskihajontana σ =. Tiedonsiirtovirheiden kompensoimiseksi sama signaali lähetetään kolme kertaa peräkkäin. Vastaanottaja arvelee ennalta, että lähetetyn signaalin arvo on peräisin normaalijakaumasta, jonka odotusarvo on µ 0 = 5 ja keskihajonta σ 0 =. Mikä on lähetetyn signaalin posteriorijakauma vastaanotettujen signaaliarvojen x = (3., 7.9, 7.0) suhteen? Lähetetyn signaalin posteriorijakauma on normaalijakauma, jonka parametrit saadaan sijoittamalla normaalimallin päivityskaavoihin (9.5) havaitun datajoukon keskiarvo m(x) = 6.0 ja koko n = 3. Posteriorijakauman odotusarvo on µ = µ σ0 0 + n m(x) σ σ 0 + n σ = 5 + 3 6 + 3 5.43 04

ja keskihajonta σ = σ 0 + n σ = 0.76. + 3 Vastaanotettu datajoukko x = (3., 7.9, 7.0) päivittää vastaanottajan uskomusta lähetetyn signaalin arvosta niin, että odotusarvo siirtyy tasolta 5 tasolle 5.43 ja keskihajonta pienenee tasolta tasolle 0.76. Priori- ja posterijakauma on esitetty kuvassa 9.3 0. 3 4 5 6 7 8 Kuva 9.3: Lähetetyn signaalin priorijakauma (sininen) ja posteriorijakauma (punainen). 9.6 Kommentteja ja täsmennyksiä Diskreetti bayesläinen malli voidaan tulkita satunnaismuuttujien parina (Θ, X), jonka yhteisjakaumalla on tiheysfunktio f Θ,X (θ, x) = p(θ)f(x θ). Satunnaismuuttujien Θ ja X jakaumien tiheysfunktiot voidaan kirjoittaa yhteisjakauman reunajakaumina (luku.4) muodossa f Θ (θ) = x p(θ)f(x θ) = p(θ) ja f X (x) = θ p(θ)f(x θ) = f(x). Lisäksi uskottavuusfunktio f(x θ) = f X Θ (x θ) voidaan mieltää satunnaismuuttujan X ehdolliseksi tiheysfunktioksi satunnaismuuttujan Θ suhteen (luku.5). Vastaavat kaavat ovat voimassa jatkuville jakaumille, kun summat vaihdetaan integraaleiksi. 05

Jos havaintoa x vastaava Bayesin päivityskaava (9.) tulkitaan todennäköisyysjakaumien avaruudessa operoivana kuvauksena U x : priorijakauma posteriorijakauma, voidaan fakta 9. ilmaista ytimekkäästi muodossa U x (U x (p)) = U (x,x )(p). Tai vielä ytimekkäämmin muodossa U x U x = U x,x. Tämä kaava yleistyy induktiolla muotoon U xn U x = U x,x,,x n, josta saadaan rekursiokaavat U x,x,,x n = U xn U x,x,,x n, U x,x,,x n = U x,x 3,...,x n U x. Bayesläinen binaarimalli oli Thomas Bayesin 763 artikkelin keskeinen tutkimuskohde. 06

Hakemisto Bayesin kaava, 5, 96 Bernoulli-jakauma, 57 betajakauma, 00 binomijakauma, 57 binomikerroin, 8 bitti, 4 Chebyshevin epäyhtälö, 49 eksponenttijakauma, 5 entropia, 4 ergodinen, 45 erotus, 9 esiintyvyysharha, 5 estimaattori, 80 harhaton estimaattori, 8 hylkäysalue, 8 hyperparametri, 0 indikaattorifunktio, 6 jakauma, diskreetti, 3 empiirinen, 70 jatkuva, 3 kertoma, 7 kertymäfunktio, keskihajonta jakauman, 47 satunnaismuuttujan, 47 kombinatoriikka, 6 komplementti, 9 korrelaatio yhteisjakauman, 50 kovarianssi yhteisjakauman, 50 leikkaus, 9 lukumäärä listat, 7 osajoukot, 8 lukumäärä, järjestykset, 7 merkitsevyystaso, 5 mitallinen funktio, 33 joukko, 9 momentti, 4 multinomijakauma, 4 nollahypoteesi, normaalijakauma normitettu, 6 osajoukko, 8 ositus, 8 osituskaava, 4 otoskeskihajonta, 73 otoskorrelaatio, 74 otoskovarianssi, 74 p-arvo, 3 perusjoukko, 7 pistemassafunktio, 3 pistetodennäköisyysfunktio, 3 Poisson-jakauma, 4, 67 posteriorijakauma, 96 priorijakauma, 96 reunajakauma diskreetti, 8 jatkuva, 8 reunatiheysfunktio diskreetti, 8 jatkuva, 8 riippumattomat satunnaismuuttujat, 30 7

tapahtumat, satunnaismuuttuja, 0 diskreetti, 3 sigma-algebra, 9 suppeneminen stokastinen, 36 suurimman uskottavuuden estimaatti, 78 suurten lukujen laki, 36 vahva, 45 diskreetti, 6 jatkuva, 6 tiheysfunktio, 7 tapahtuma, 7 poissulkevat, 8 tasajakauma diskreetti, 4 jatkuva, 4 tiheysfunktio, 3 empiirinen, 70 tilastollinen merkitsevyys, 3 tilastollinen testi, todennäköisyys aksiooma, 0 ehdollinen, frekvenssitulkinta, 38 jakauma, 0 mitta, 0 monotonisuus, 0 summasääntö, 0 tulosääntö, todennäköisyysfunktio, 3 todennäköisyysväli, 09 toteuma, 7 tulojoukko, 9 tyhjä joukko, 9 uskottavuusfunktio, 78, 96 logaritminen, 79 varianssi jakauman, 47 satunnaismuuttujan, 47 vastahypoteesi, yhdiste, 9 yhteisjakauma, 5 8

Kirjallisuutta [JP04] Jean Jacod and Philip Protter. Probability Essentials. Springer, second edition, 004. [Kal0] Olav Kallenberg. Foundations of Modern Probability. Springer, second edition, 00. [Wil9] David Williams. Probability with Martingales. Cambridge University Press, 99. 9