S-114.600 Bayesilaisen mallintamisen perusteet



Samankaltaiset tiedostot
Bayesilaisen mallintamisen perusteet kurssin sisältö

Tentin materiaali. Sivia: luvut 1,2, , ,5. MacKay: luku 30. Gelman, 1995: Inference and monitoring convergence

Luento 2. Yksiparametrisia malleja. Binomi-malli. Posteriorijakauman esittämisestä. Informatiivisista priorijakaumista. Konjugaattipriori.

Bayesilaisen mallintamisen perusteet

Mitä on bayesilainen päättely?

Pikajohdatus bayesilaiseen tilastoanalyysiin ja monimuuttuja-analyysiin

Bayesilainen päätöksenteko / Bayesian decision theory

Luento 11. Muutama hyödyllinen Monte Carlo-menetelmä. Muutama hyödyllinen Monte Carlo-menetelmä. Mitä muuta hyödyllistä Gelman et al kirjasta löytyy

Bayes-mallinnus siltana teorian ja empiirisen evidenssin välillä

- voidaan käyttä lisämään tieteellistä ymmärrystä ilmiöstä. - joidenkin havaittavien suureiden vaikutus voi olla paljon suurempi kuin toisten

p(θ 1 y) on marginaalijakauma p(θ 1 θ 2, y) on ehdollinen posteriorijakauma Viime kerralla Termejä viime kerralta Marginalisointi Marginaalijakauma

Binomi Jacob Bernoulli ( ), Bayes ( ) Normaali de Moivre ( ), Laplace ( ), Gauss ( )

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Gaussiset prosessit derivaattahavainnoilla regressio-ongelmassa (valmiin työn esittely)

Tilastotieteen aihehakemisto

ABTEKNILLINEN KORKEAKOULU Tietoverkkolaboratorio

Tutkimustiedonhallinnan peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Markov-ketju Monte Carlo - konvergenssidiagnostiikka (convergence diagnostics) - odotettu hyöty tai kustannus (expected utility or cost)

Posteriorijakauman normaalijakauma-approksimaatio. Usein posteriorijakauma lähestyy normaalijakaumaa kun n

Kuinka monta riippumatonta simulaationäytettä tarvitaan. - tämä varianssi on riippumaton jakauman ulottuvuuksien määrästä

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

p(y θ, M) p(θ M)dθ p(θ y, M) = p(y M) Luento 10 Marginaaliuskottavuus Bayes-tekijä Mallin odotettu hyöty DIC (Deviance Information Criterion)

Tilastotiede ottaa aivoon

Bayesiläinen tilastollinen vaihtelu

AB TEKNILLINEN KORKEAKOULU

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

ABTEKNILLINEN KORKEAKOULU Tietoverkkolaboratorio

AB TEKNILLINEN KORKEAKOULU

Tilastollinen päättely, 10 op, 4 ov

1. Tilastollinen malli??

Viime kerralla. Luento 6. Normaalijakauma-approksimaatio - moodi. - havaittu informaatio

Tilastollisia peruskäsitteitä ja Monte Carlo

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

Akateemisen ajattelun alkeiskurssi

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.

JOHDATUS TEKOÄLYYN LUENTO 4.

Markkinoitten mallintaminen ja Internet-markkinat

S Bayesilaisen mallintamisen perusteet

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

MS-C2111 Stokastiset prosessit

HAHMONTUNNISTUKSEN PERUSTEET

Parametristen mallien identifiointiprosessi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

OPETUSSUUNNITELMALOMAKE

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL

Tilastotiede ottaa aivoon

TUKIMATERIAALI: Arvosanan kahdeksan alle jäävä osaaminen

AS Automaation käyttöliittymät L Opetussuunnitelma

ENG3042.Kand Kandidaatintyö ja seminaari (10 op) ENY ENG3044.Kand Kandidaatintyö ja seminaari (10 op) RYM Saija Toivonen

Parametristen mallien identifiointiprosessi

exp Luento 3 Normaalijakauma (Gaussian) Normaalijakauma tunnetulla varianssilla Normaalijakauma tunnetulla keskiarvolla Poisson-mallli

Sovellettu todennäköisyyslaskenta B

1 Bayesin teoreeman käyttö luokittelijana

HAHMONTUNNISTUKSEN PERUSTEET

TILASTOLLINEN OPPIMINEN

exp p(y θ) = 1 2πσ θ)2 2σ 2(y y N(θ, σ 2 ) Luento 3 Normaalijakauma (Gaussian) Normaalijakauma tunnetulla varianssilla

AS Automaatiotekniikan seminaarikurssi. Kevät 2008

Inversio-ongelmien laskennallinen peruskurssi Luento 7

TEKNILLINEN KORKEAKOULU ERIKOISTYÖ. koulutusohjelma MUUTOSPISTEIDEN TUNNISTAMINEN BAYESILAISELLA ANALYYSILLA

PHYS-A3131 Sähkömagnetismi (ENG1) (5 op)

MATEMAATTIS- LUONNONTIETEELLINEN OSAAMINEN

JOHDATUS TEKOÄLYYN TEEMU ROOS

Talousmatematiikan perusteet: Johdanto. Kurssin tavoitteet Käytännön järjestelyt Suosituksia suorittamiseen

Luento 2: Liikkeen kuvausta

TN-IIa (MAT22001), syksy 2017

Laskut käyvät hermoille

Aalto-yliopiston perustieteiden korkeakoulu Versio 2 Teknillisen fysiikan ja matematiikan koulutusohjelma tbh

Kurssiesite Lausekielinen ohjelmointi Syksy Jorma Laurikkala Tietojenkäsittelytieteet Informaatiotieteiden yksikkö Tampereen yliopisto

hyvä osaaminen

OPETUSSUUNNITELMALOMAKE

Viikko 1: Johdantoa Matti Kääriäinen

Vastuuopettaja. Kurssiesite Lausekielinen ohjelmointi Syksy Tavoitteet ja keinot. Lausekielinen ohjelmointi (10 op)

Mikrobikriteereiden arviointi esimerkkinä kampylobakteeri

Yhteistyötä sisältämätön peliteoria jatkuu

Todennäköisyys (englanniksi probability)

ELEC-C5210 Satunnaisprosessit tietoliikenteessä

Sovellettu todennäköisyyslaskenta B

OPETUSSUUNNITELMALOMAKE

Flippauksen arvioinnista

JOHDATUS TEKOÄLYYN TEEMU ROOS

Kurssiesite. Rakentamisen tekniikat RAK-C3004

805306A Johdatus monimuuttujamenetelmiin, 5 op

AS Automaation käyttöliittymät L Opetussuunnitelma

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE

Mallin tarkistus (luku 6) - onko mallin puutteilla havaittava vaikutus oleelliseen päättelyyn?

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Palautekysely tilastollisen signaalinkäsittelyn kurssiin

Sovellettu todennäköisyyslaskenta B

PHYS-A0120 Termodynamiikka (TFM) Maanantai

Suomenlahden öljykuljetusten biologisten riskien mallintaminen ja päätösanalyysi Bayes-verkoilla

CHEM-A1200 Kemiallinen rakenne ja sitoutuminen, syksy 2016

Transkriptio:

S-114.600 Bayesilaisen mallintamisen perusteet Laajuus: 2 ov Opettajat: TkT Aki Vehtari, DI Toni Tamminen Slide 1 Sisältö: Bayesilainen todennäköisyysteoria ja bayesilainen päättely. Bayesilaiset mallit ja mallien analysointi. Laskennalliset menetelmät, Markov-ketju Monte Carlo. Suorittaminen: Tentti tai oppimispäiväkirja, ja harjoitustyö Kirjallisuus: Gelman, Carlin, Stern & Rubin: Bayesian Data Analysis, Second Edition Aikataulu: Luennot maanantaisin klo 12-14 sali E111 (Alkaen 15.9.2002). Mikroharjoitukset tiistaisin klo. 14-16, mikroluokka F402 (Alkaen 16.9.2002). URL: http://www.lce.hut.fi/teaching/s-114.600/ Bayesilaisen mallintamisen perusteet Johdanto Yksiparametrisia malleja Moniparametrisia malleja Slide 2 Päättely suurten otosten tapauksessa ja bayesilaisen päättelyn frekvenssiominaisuudet Hierarkiset mallit Laskennallisia menetelmiä, Markov-ketju Monte Carlo Päätösanalyysi Mallien tarkistus, vertailu ja parannus Datankeruuprosessin mallintaminen Yhteenveto ja katsaus lisäaiheisiin

Suorittaminen Harjoitusraportti ja tentti tai Harjoitusraportti ja oppimispäiväkirja Slide 3 Kurssin arvosana määräytyy kahdesta osasuorituksesta seuraavasti arvosana = 0.5 * harjoitusraportti + 0.5 * tentti tai arvosana = 0.5 * harjoitusraportti + 0.5 * oppimispäiväkirja Harjoitusraportti palautetaan osasta (11 tehtävää) viikottaisista mikroluokkaharjoitustehtävistä Tentti on perinteisen mukainen kurssin aihealueesta Tentin voi korvata oppimispäiväkirjalla Mikroluokkaharjoitukset Läpikäytävät tehtävät listattu kurssin www-sivulla Alkupäässä joitakin laskutehtäviä, loput simulaatioita Assistentti auttaa tehtävien tekemisessä Slide 4 Tähdellä merkatuista palautetaan raportti - 1 piste per tulokset - 1 piste per analyysi Parityöskentely suositeltavaa

Oppimispäiväkirja Lyhyt essee ja vastaus kotitehtävään joka viikko liittyen viikon luennon ja harjoituksen aiheeseen Opiskelija oppii miettimällä oppimaansa ja kirjoittamalla siitä Toimii myös palautekanavana Slide 5 Katsokaa lisää TKK:n Opetuksen ja opiskelun tuen www-sivulta (linkki kurssin sivulta) Jokaisesta esseestä 1 piste ja jokaisesta kotitehtävästä 1 piste Joitakin Bayes-menetelmien sovellusalueita Slide 6 Arkeologia Astronomia Biotieteet Ekonomia Epidemiologia Fysiikka Genetiikka Kognitiotiede Kuvankäsittely Lakitiede Luotettavuusanalyysi Lääketiede Metereologia Prosessimallinnus Päätösanalyysi Signaalinkäsittely Sosiaalitieteet Tiedon louhinta

Bayesilaisen mallintamisen perusteet Bayesilaiseen todennäköisyysteoriaan perustuva - epävarmuus esitetään todennäköisyyksillä - todennäköisyyksien päivittäminen uuden tiedon avulla - Laskutoimitukseksi pelkistettyä tervettä järkeä, Laplace 1819 Thomas Bayes (1702 1761) Slide 7 - englantilainen antikonformisti, presbyteeri reviisori, harrastelijamatemaatikko - Richard Price julkaisi Bayesin artikkelin ehdollisista todennäköisyyksistä Bayesin kuoleman jälkeen 1763 - käsitteli seuraavaa probleemaa: Jos X Bin(n,θ), niin mikä on p(a <θ<b X = x)? Bayesilainen-termi käyttöön 1900-luvun puolivälissä Todennäköisyys epävarmuuden mittana E tapahtuma, H taustatieto (joskus hypoteesi) p(e H) E:n todennäköisyys ehdolla H Mittaa epävarmuutta tiedon H valossa: - p(e H) = 1 jos olet varma, että E tapahtuu Slide 8 - p(e H) = 0 jos olet varma, että E ei tapahdu - p(e H) = 0.4: E:hen liittyy epävarmuutta (mutta ei välttämättä satunnaisuutta) - jos E:n epävarmuus on pienempi kuin F:n, niin p(e H) >p(f H) Kahdella tarkastelijalla voi olla eri käsitys epävarmuudesta ( eri H ) Todennäköisyys muuttuu, kun informaatio muuttuu Bayes-teoria perustuu subjektiivisiin todennäköisyyksiin

Subjektiivisuus vs. objektiivisuus Subjektiivisuus - (In Bayesian theory)...any probability assignment is necessarily "subjective" in the sense that it describes only a state of knowledge... - "Kenen tietämyksen tila?" - "Kenen tahansa joka saa saman informaation ja päättelee vaatimusten mukaan." Slide 9 Objektiivisuus - Inter-subjektiivisuus Miksi todennäköisyys on järkevä tapa määrittää epävarmuutta Analogiat Axiomatiiviset ja normatiiviset perustelut Vedonlyöntiargumentti Pragmaattisuus Slide 10

Mistä saadaan p(e H)? Suoraan - symmetria tai vaihtokelpoisuus - frekvenssit Slide 11 Mallin avulla - kiinnitetään rakenteellisia asioita joita tiedetään ja epävarmoja asioita varten käytetään parametreja - päivitetään epävarmoja uudella informaatiolla - uutta informaatioita kutsutaan usein dataksi Bayesilaisen mallintamisen perusteet Malli - Pyrkii ennustamaan ilmiön käyttäytymistä - Usein yksinkertaistaa todellisuutta - Voidaan käyttää ennustamaan tulevaisuutta - Voidaan käyttä lisämään tieteellistä ymmärrystä ilmiöstä Slide 12

Malli Mallin parametrien ja datan yhteistodennäköisyys annettuna malli p(θ, y M) Usein kiinnostuksen kohteena päivittää prioritietämys p(θ M) posterioritietämyksesi p(θ y, M) Slide 13 Bayesin kaava p(θ y, M) = p(θ, y M) p(y M) = p(y θ, M)p(θ M) p(y M) Bayesin kaava p(θ M) = prior p(θ y, M) = p(y θ, M)p(θ M) p(y M) p(y θ, M) = likelihood Slide 14 p(y M) = p(y θ, M)p(θ M)dθ = normalization, evidence p(θ y, M) = posterior

Mistä saadaan M, p(θ M), ja p(y θ, M)? Erittäin hyvä kysymys! Sama ongelma myös ei-bayesilaisissa lähestymistavoissa! Slide 15 Esimerkki: Hemofilia Perinnöllinen tauti, X-kromsomiin kytkeytyvä, väistyvä Naisen veli sairastaa hemofiliaa, äiti ja isä terveitä Nainen on kantaja (θ = 1) tai ei (θ = 0) p(θ = 1 M) = p(θ = 0 M) = 1 2 Slide 16 Naisella on 2 tervettä poikaa p(y 1 = 0, y 2 = 0 θ = 1, M) = (0.5)(0.5) = 0.25 p(y 1 = 0, y 2 = 0 θ = 0, M) = (1)(1) = 1 Posteriori p(y θ = 1)p(θ = 1) p(θ = 1 y, M) = p(y θ = 1)p(θ = 1) + p(y θ = 0)p(θ = 0) (0.25)(0.5) p(θ = 1 y, M) = (0.25)(0.5) + (1.0)(0.5) = 0.125 0.625 = 0.2

Ennustaminen Esim, y = (y 1,...,y n ) ovat mittauksia jostakin asiasta ỹ on uusi ei vielä tehty mittaus samasta asiasta Slide 17 ỹ:n ennuste p(ỹ y, M) = = p(ỹ θ, y, M)p(θ y, M)dθ p(ỹ θ, M) p(θ y, M)dθ Esimerkki: Hemofilia Kolmas poika? p(y 3 = 0 y 1, y 2, M) Ennuste p(y 3 = 0 y 1, y 2, M) = p(y 3 = 0 θ, M)p(θ y 1, y 2, M)dθ Slide 18 p(y 3 = 0 y 1, y 2, M) = p(y 3 = 0 θ = 1, M)p(θ = 1 y 1, y 2, M) +p(y 3 = 0 θ = 0, M)p(θ = 0 y 1, y 2, M) p(y 3 = 0 y 1, y 2, M) = (0.5)(0.2) + (1)(0.8) = 0.9

Esimerkki: Hemofilia Kolmas poika syntyy ja on terve Slide 19 Käytetään ketjusääntöä p(θ = 1 y 1, y 2, y 3 ) = p(y 3 θ = 1, M)p(θ = 1 y 1, y 2, M) θ=1,2 p(y 3 θ, M)p(θ y 1, y 2, M) (0.5)(0.2) = (0.5)(0.2) + (1)(0.8) = 0.111 Integrointi Bayes-menetelmissä Normalisointitermi p(y M) = p(y θ, M) p(θ M)dθ Slide 20 Ennustaminen p(ỹ y, M) = p(ỹ θ, M) p(θ y, M)dθ

Integrointi Bayes-menetelmissä Integroinnin korvaaminen optimoinilla: MAP - toimii helpoissa tapauksissa Analyyttinen integrointi - toimii yksinkertaisilla malleilla Slide 21 Analyytiset approksimaatiot - toimii yksinkertaisilla malleilla tai vaatii paljon vaivaa Numeerinen integrointi - tarvitaan laskentatehoa Numeerinen Integrointi Slide 22 Monte Carlo (MC) - integraali approksimoidaan posteriorijakaumsta vedettyjen näytteiden (A (t) ) avulla E(A) 1 N N t=1 A (t) - vaikea saada riippumattomia näytteitä tehokkaasti Markov Chain Monte Carlo (MCMC) - käytettään apuna Markov-ketjuja - riippuvia näytteitä (ei haittaa) - yleistynyt 1990-luvulla huomattavasti

Bayes-menetelmien suosion kasvu 1990-luvulle asti käytettiin analyyttisiä menetelmiä mallit välttämättä yksinkertaisempia Konetehon jatkuva kasvu ja numeeristen integrointimentelmien kehitys suosio jyrkkään kasvuun 1990-luvulla Slide 23 mahdollisuus käyttää monipuolisempia paremmin todellisuutta kuvaavia malleja käyttöön lukuisilla vaikeilla sovellusalueilla Joitakin LCE:n projekteja, joissa käytetty Bayes-menetelmiä Betonin laadun mallintaminen ja ennustaminen Ihmisen aivotoiminnan kuvantaminen MEG:llä Teollisuusputken sisällön kuvantaminen impedanssitomografialla Puiden tilavuuden arviointi kuvasta Slide 24 Viemäriputkien kunnonvalvonta Robotin näköjärjestelmä

Esimerkki: Betonin laadun ennustaminen Reseptin ja kiviaineksen vaikutus betonin laatuun - paljonko vettä, sementtiä, kiviainesta ja lisäaineita - kiviaineksen fysikaaliset ja kemialliset ominaisuudet Slide 25 Esimerkki: Betonin laadun ennustaminen Bayesilaisen mallin ja siihen pohjautuvien TkT Hanna Järvenpään tekemien johtopäätösten avulla on mahdollista - vähentää raaka-ainekustannuksia 5-15% - vähentää luonnon soran osuus betonin kiviaineksista 5-20%:iin verrattuna nykyiseen 60-100%:iin Slide 26