Bayesilaisen mallintamisen perusteet kurssin sisältö

Koko: px
Aloita esitys sivulta:

Download "Bayesilaisen mallintamisen perusteet kurssin sisältö"

Transkriptio

1 S Bayesilaisen mallintamisen perusteet Laajuus: 5 op, L Opettajat: Dos. TkT Aki Vehtari, DI Jarno Vanhatalo Slide 1 Sisältö: Bayesilainen todennäköisyysteoria ja bayesilainen päättely. Bayesilaiset mallit ja mallien analysointi. Laskennalliset menetelmät, Markov-ketju Monte Carlo. Suorittaminen: Tentti ja harjoitustyö Kirjallisuus: Gelman, Carlin, Stern & Rubin: Bayesian Data Analysis, Second Edition. Aikataulu: Luennot maanantaisin klo sali E111 Mikroharjoitukset keskiviikkoisin klo , mikroluokka Maari-B (Alkaen 12.9.). URL: Bayesilaisen mallintamisen perusteet kurssin sisältö Johdanto Yksiparametrisia malleja Moniparametrisia malleja Slide 2 Päättely suurten otosten tapauksessa ja bayesilaisen päättelyn frekvenssiominaisuudet Hierarkkiset mallit Laskennallisia menetelmiä, Markov-ketju Monte Carlo Päätösanalyysi Mallien tarkistus, vertailu ja parannus Yhteenveto ja katsaus lisäaiheisiin

2 Suorittaminen Harjoitusraportti ja tentti Arvosana lasketaan tentin ja raportin pisteiden keskiarvosta - kummastakin osasuorituksesta max 90 pistettä - alustava pistetaulukko 45-53=1, 54-62=2, 63-71=3, 72-80=4, 81-90=5 Slide 3 Harjoitusraportti palautetaan osasta (14 tehtävää, joista yksi tuplatehtävä) viikottaisista mikroluokkaharjoitustehtävistä Tenttiin voi saada 6 lisäpistettä palauttamalla 3 laskutehtävää Mikroluokkaharjoitukset Läpikäytävät tehtävät listattu kurssin www-sivulla - raportoitavista koko ohjeet - muihin vinkkejä Alkupäässä joitakin laskutehtäviä, loput simulaatioita Assistentti auttaa tehtävien tekemisessä Slide 4 * merkityistä (14 kpl) palautetaan raportti - parityöskentely erittäin suositeltavaa + merkityt itseopiskeluun, osa muistuttaa tenttitehtäviä ++ merkityistä voi saada 3x2 lisäpistettä tenttiin

3 Harjoitusraportti */** merkityistä palautetaan raportti pistettä per tulokset pistettä per pohdinta - **-merkityistä tuplapisteet - maksimipisteet 15*6=90 Slide 5 - välipalautus Luennot ja kirja Melkein kaikki tentissä kysyttävä löytyy kirjasta - lisäksi pieni lisämateriaali täydentämään kirjaa liittyen Monte Carlo-menetelmiin ja mallien arviointiin (kurssin www-sivulla) - kirja erittäin suositeltava, toimii myös referenssikirjana myöhemmin Luennot helpottavat kirjallisen materiaalin lukemista Slide 6 - jos luennolla käydään extramateriaalia, mainitaan siitä erikseen (kalvoissa merkattu *:llä) - extramateriaalin tarkoitus on auttaa hahmottamaan kokonaisuuksia paremmin Luentokalvot päivittyvät verkkoon ennen luentoa (viimeistään samana aamuna)

4 Tiedotus s at lists lce hut fi - Topin kautta ilmoittautuneet lisätään listalle tänään - voit itse lisätä tai poistaa itsesi - erikseen englanninkielinen lista (s en) Slide 7 Luento 1 Joitakin sovellusalueita Bayesilainen-termin historiasta Todennäköisyys epävarmuuden mittana Epävarmuuksien yhdistäminen todennäköisyyslaskennalla Slide 8 Bayesin kaava Bayesilainen malli Integroinnin merkityksestä

5 Joitakin Bayes-menetelmien sovellusalueita Slide 9 Arkeologia Astronomia Biotieteet Ekonomia Epidemiologia Fysiikka Genetiikka Kognitiotiede Kuvankäsittely Lakitiede Luotettavuusanalyysi Lääketiede Metereologia Prosessimallinnus Päätösanalyysi Signaalinkäsittely Sosiaalitieteet Tiedon louhinta Mikä tahansa todelliseen maailmaan liittyvä sovellusalue, jossa havaintojen perusteella halutaan päätellä jotakin Joitakin LCE:n projekteja, joissa käytetty Bayes-menetelmiä Betonin laadun mallintaminen ja ennustaminen Ihmisen aivotoiminnan kuvantaminen MEG:llä Teollisuusputken sisällön kuvantaminen impedanssitomografialla Kaupan alueellisen kulutuskysynnän mallintaminen Slide 10 Puiden tilavuuden arviointi kuvasta Robotin näköjärjestelmä Spatiaalinen epidemiologia Terveydenhuollon prosessit Teräksen valuprosessi Biospektroskopia

6 Bayesilaisen mallintamisen perusteet Bayesilaiseen todennäköisyysteoriaan perustuva - epävarmuus esitetään todennäköisyyksillä - todennäköisyyksien päivittäminen uuden tiedon avulla - Laskutoimitukseksi pelkistettyä tervettä järkeä, Laplace 1819 Thomas Bayes (170? 1761) Slide 11 - englantilainen antikonformisti, presbyteeri reviisori, harrastelijamatemaatikko - Richard Price julkaisi Bayesin artikkelin ehdollisista todennäköisyyksistä Bayesin kuoleman jälkeen käsitteli käänteisen todennäköisyyden ongelmaa oleellinen osa bayesilaista teoriaa palataan tähän kohta Moderni bayesilainen teoria perusteellisine todistuksineen kehittyi 1900-luvulla Bayesilainen-termi käyttöön 1900-luvun puolivälissä Aiemmin oli vain "probability theory" - todennäköisyyden käsite ei ollut vielä tiukasti määritelty vaikkakin vastasi nykyistä bayesilaista tulkintaa luvun lopulla ja lisääntyivät vaatimukset todennäköisyyskäsitteen tiukalle määrittelylle (matemaattinen ja tieteenfilosofinen ongelma) Slide luvun alkupuoliskolla yleistyi frekventistinen näkökulma - hyväksyy todennäköisyyksien määrittelyn vain frekvenssien kautta - ei hyväksy käänteistä todennäköisyyttä tai priorin käyttöä - yleistyi näennäisen objektiivisuutensa ja keittokirjamaisten kirjojen ansiosta Frekventistiläinen R. A. Fisher käytti 1950 ensimmäistä kertaa termiä bayesilainen korostaessaan eroa aiempaan todennäköisyysteoriaan - termi yleistyi nopeasti, koska vaihtoehtoiset kuvaukset ovat pidempiä - bayesilaiset ottivat tämän jälkeen käyttöön termin frekventistiläinen

7 Bayesilaisten menetelmien suosio kasvaa kovaa vauhtia Todennäköisyyksille modernin Bayes-teorian mukainen aksiomaattinen perusta 1900-luvulla - filosofinen kiista frekventistien kanssa jatkui Laskentatehon kasvaessa bayesilaisen lähestymistavan vahvuus kompleksisten ongelmien mallintamisessa johtanut suosion valtavaan kasvuun Slide 13 - suurin osa käyttäjistä pragmaattisia, eli käyttävät koska menetelmät toimivat Huom. bayesilainen teoria ei sulje pois frekvenssejä ja frekvenssiominaisuudet tärkeitä (tästä lisää myöhemmin) Joillakin aloilla säilynyt yksinkertaisesti probability theory termi, koska se on ollut ainoa järkevä todennäköisyyspohjainen vaihtoehto Bayesilaisen mallintamisen perusteet Epävarmuus kuvataan todennäköisyyksillä Epävarmuudet yhdistetään todennäköisyyslaskennan säännöillä - käänteinen todennäköisyys Slide 14

8 Todennäköisyys epävarmuuden mittana A tapahtuma, I taustatieto p(a I) A:n todennäköisyys ehdolla I Mittaa epävarmuutta tiedon I valossa: - p(a I) = 1 jos olet varma, että A tapahtuu - p(a I) = 0 jos olet varma, että A ei tapahdu Slide 15 - p(a I) = 0.4: A:han liittyy epävarmuutta (mutta ei välttämättä satunnaisuutta) - jos A:n tapahtumisen varmuus on suurempi kuin B:n, niin p(a I) > p(b I) Aleatorinen vs. episteeminen epävarmuus Epävarmuus voidaan jakaa Aleatoriseen (satunnaiseen) epävarmuuteen, joka johtuu satunnaisuudesta - emme voi saada havaintoja, jotka auttaisivat sen epävarmuuden pienentämisessä Episteemiseen (tietämykselliseen) epävarmuuteen, joka johtuu tiedon puutteesta Slide 16 - voimme saada havaintoja jotka auttavat sen epävarmuuden pienentämisessä Vertaa kolikko - kahdella tarkastelijalla voi olla eri episteeminen epävarmuus - episteeminen todennäköisyys muuttuu, kun informaatio muuttuu

9 Esimerkki: Kahdenvärisiä nappuloita pussissa Jos eriväristen nappuloiden määrän suhde tunnettu - aleatorista epävarmuutta seuraavaksi ilmestyvän nappulan väristä Jos eriväristen nappuloiden määrän suhde tuntematon - lisäksi episteemistä epävarmuutta - episteeminen epävarmuus muuttuu kun nappuloita nostetaan Slide 17 Jos yksittäin noston sijasta aikoisimme kumota koko pussin ja laskea värien määrän suhteen - ei aleatorista epävarmuutta - vain episteeminen epävarmuus pussin sisällöstä Epävarmuuksien yhdistäminen? Merkitään - y havaitut nappulat - θ nappuloiden suhde - I taustatieto ongelmasta Aleatorinen epävarmuus, jos nappuloiden suhde θ tunnettu Slide 18 p(y θ, I) Episteeminen epävarmuus ennen havaintoja p(θ I) Kuinka päivittää episteeminen epävarmuus kun nappuloita havaittu? p(θ y, I)? - θ tuntematon, eli halutaan tietää käänteinen todennäköisyys

10 Aksiomaattiset perustelut todennäköisyydelle* Todennäköisyyksien käyttö epävarmuuden esittämiseen ja todennäköisyyskalkyyli voidaan perustella aksiomaattisesti - useita variaatioita, joissa samat perusideat, mutta hieman esitystavassa eroa Slide 19 - kaksi peruslinjaa todennäköisyys ja hyöty erikseen (esim. Cox, DeGroot,...) todennäköisyys ja hyöty erottamattomia (esim. de Finetti, Savage, Bernardo & Smith,...) Eräs aksiomaattinen formulointi (sanallisesti)* (A1) Kaikkia tapahtumia voidaan vertailla (A2) Vertailut ovat transitiivisia ja mielivaltaisen tarkkoja vertailuja voidaan tehdä (A3) Mikään tapahtuma ei ole epätodennäköisempi kuin varmasti epätosi ja varmasti epätosi on epätodennäköisempi kuin varmasti tosi Slide 20 (A4) Numeroituva additiivisuus alenevalle joukolle tapahtumia (A5) Kvantifiointi mittatikulla (esim. idealisoitu ruletti) - uniikit kvantitatiiviset todennäköisyysarvot

11 Aksiomaattinen formulointi* Aksioomista saadaan todennäköisyyskalkyyli, ja muuta ei tarvitakaan (P1) p(tapahtuma) 0 ja p(varmastitosi) = 1. (P2) Summasääntö jos A ja B eksklusiiviset, niin p(a, B) = p(a) + p(b) Slide 21 (P3) Summasääntö äärettömille sarjoille (P4) Bayesin kaava p(a B) = p(a, B)/p(B) - tulosääntö johdettavissa tästä p(a, B) = p(b A)p(A) Jos epävarmuudet yhdistetään jotenkin muuten, rikkoo silloin kyseinen tapa jotakin edellämainituista aksioomista Bayesin kaava Voidaan siis valita p(y θ, I) sekä p(θ I) ja laskea Bayesin kaavalla p(θ y, I) = p(y θ, I)p(θ I) p(y I) Kaavan osien nimet Slide 22 - p(θ y, I) = posteriori (posterior) - p(y θ, I) = malli / uskottavuus (likelihood) - p(θ I) = priori (prior) - p(y I) = normalisointitermi

12 Bayesilaisen mallin osat Malli p(y θ, I) - matemaattinen kuvaus havaintomallille / datan generoivalle prosessille / aleatorinen osa - jos ilmiö tunnettu θ, I millä todennäköisyydellä havaittaisiin / generoituisi y tietyllä arvolla Slide 23 Uskottavuus (likelihood) p(y θ, I) - kun y fiksattu p(y θ, I) kutsutaan myös uskottavuusfunktioksi (likelihood function) θ:n suhteen - usein uskottavuustermiä käytetetty myös tilanteessa, missä pitäisi käyttää termiä malli Bayesilaisen mallin osat Priori p(θ I) - matemaattinen kuvaus mitä tiedetään θ:sta - episteeminen epävarmuus ennen havaintoja - malli (uskottavuus) ja priori erottamattomat (kytketty mallin kautta) + jos ilmiö tunnettu, ei episteemistä epävarmuutta Slide 24 + jos ei havaintoja, ei episteeminen epävarmuus muutu

13 Bayesin kaava Posteriorijakauma esittää päivitetyn episteemisen epävarmuuden kun informaatio havainnoista ja priorista yhdistetään Slide 25 p(y θ, I)p(θ I) p(θ y, I) = p(y I) p(y θ, I)p(θ I) = p(y θ, I)p(θ I)dθ p(y θ, I)p(θ I) Normalisointitermi normalisoi posteriorin kokonaistodennäköisyyden olemaan 1 Mistä saadaan I, p(θ I), ja p(y θ, I)? Erittäin hyvä kysymys! Sama ongelma ei-bayesilaisissa lähestymistavoissa! - malli on kuitenkin valittava - prioria p(θ I) vastaava termi, esim. regularisointitermi, usein myös mukana - priorin poisjättäminen vastaa uniformiprioria θ:lle Slide 26

14 Subjektiivisuus Aletorinen epävarmuus näennäisen objektiivinen - aletorista epävarmuutta kuvaavan mallin valinta subjektiivista Episteeminen epävarmuus selkeästi subjektiivista - ehdolla tarkastelijan tietämys - kahdella tarkastelijalla voi olla eri käsitys epävarmuudesta ( eri I ) Slide 27 Tieteellinen objektivisuus saavutetaan inter-subjektiivisuudella - jos tieteentekijät samaa mieltä oletuksista ( sama I ) Bayesilaisen mallintamisen perusteet Malli - pyrkii ennustamaan ilmiön käyttäytymistä - usein yksinkertaistaa todellisuutta - voidaan käyttää ennustamaan tulevaisuutta - voidaan käyttä lisämään tieteellistä ymmärrystä ilmiöstä Slide 28 Yksinkertaistaa koska - ilmiöstä saadut havainnot rajoitettuja - joidenkin havaittavien suureiden vaikutus voi olla paljon suurempi kuin toisten - yksinkertainenkin malli voi tuottaa hyödyllisiä ennusteita

15 Esimerkki Pudotetaan palloa eri korkeuksilta ja mitataan putoamisaika sekunttikellolla käsivaralla - Newtonin mekaniikka - ilmanvastus, ilmanpaine, pallon muoto, pallon pintarakenne - ilmavirtaukset Slide 29 - suhteellisuusteoria Ottaen huomioon mittaukset, kuinka tarkka malli kannattaa tehdä? On olemassa hyvin paljon tilanteita, joissa yksinkertaiset mallit hyödyllisiä ja käytännön kannalta yhtä tarkkoja kuin monimutkaisemmat! "Kaikki mallit ovat vääriä, mutta jotkut niistä ovat hyödyllisiä", George P. Box Laskuesimerkki: Hemofilia Perinnöllinen tauti, X-kromosomiin kytkeytyvä, väistyvä Naisen veli sairastaa hemofiliaa, äiti ja isä terveitä Slide 30

16 Laskuesimerkki: Hemofilia Perinnöllinen tauti, X-kromosomiin kytkeytyvä, väistyvä Naisen veli sairastaa hemofiliaa, äiti ja isä terveitä Slide 31 Taustatietojen perusteella muodostetaan malli M - malli on yksinkertaistettu todellisuudesta, koska ei huomioi kaksosia ei huomioi mutaation mahdollisuutta oltetaan, että geenin olemassaolo ei vaikuta lapsen syntymätodennäköisyyteen jne. Esimerkki: Hemofilia Perinnöllinen tauti, X-kromosomiin kytkeytyvä, väistyvä Naisen veli sairastaa hemofiliaa, äiti ja isä terveitä Nainen on kantaja (θ = 1) tai ei (θ = 0) p(θ = 1 M) = p(θ = 0 M) = 1 2 Slide 32 Naisella on 2 tervettä poikaa p(y 1 = 0, y 2 = 0 θ = 1, M) = (0.5)(0.5) = 0.25 p(y 1 = 0, y 2 = 0 θ = 0, M) = (1)(1) = 1 Posteriori p(y θ = 1)p(θ = 1) p(θ = 1 y, M) = p(y θ = 1)p(θ = 1) + p(y θ = 0)p(θ = 0) (0.25)(0.5) p(θ = 1 y, M) = (0.25)(0.5) + (1.0)(0.5) = = 0.2

17 Ennustaminen Esim, y = (y 1,..., y n ) ovat mittauksia jostakin asiasta ỹ on uusi ei vielä tehty mittaus samasta asiasta - ỹ on tuntematon johon liittyy epävarmuutta Slide 33 ỹ:n ennuste p(ỹ y, M) = p(ỹ θ, y, M)p(θ y, M) θ=0,1 = p(ỹ θ, M)p(θ y, M) θ=0,1 Ennusteen epävarmuus sisältää sekä aleatorista että episteemistä epävarmuutta Esimerkki: Hemofilia Kolmas poika? p(y 3 = 0 y 1, y 2, M) Slide 34 Ennuste p(y 3 = 0 y 1, y 2, M) = p(y 3 = 0 θ, M)p(θ y 1, y 2, M) θ=0,1 p(y 3 = 0 y 1, y 2, M) = p(y 3 = 0 θ = 1, M)p(θ = 1 y 1, y 2, M) + p(y 3 = 0 θ = 0, M)p(θ = 0 y 1, y 2, M) p(y 3 = 0 y 1, y 2, M) = (0.5)(0.2) + (1)(0.8) = 0.9

18 Esimerkki: Hemofilia Kolmas poika syntyy ja on terve - uutta havaintoa voidaan käyttää päivittämään äidin tilan todennäköisyys Ketjusääntö - edellinen posteriori on nyt uusi priori Slide 35 p(θ = 1 y 1, y 2, y 3 ) = p(y 3 θ = 1, M)p(θ = 1 y 1, y 2, M) θ=0,1 p(y 3 θ, M)p(θ y 1, y 2, M) (0.5)(0.2) = (0.5)(0.2) + (1)(0.8) = Integrointi Bayes-menetelmissä Summa yleistyy integroinniksi jatkuville muuttujille - usein notaation yksinkertaistamiseksi integrointimerkkiä käytetään myös diskreeteille muuttujille Slide 36 Normalisointitermi Ennustaminen p(y M) = p(ỹ y, M) = p(y θ, M) p(θ M)dθ p(ỹ θ, M)p(θ y, M)dθ Marginalisointi p(y θ 1, M) = p(y θ 1, θ 2, M)p(θ 2 M)dθ 2

19 Integrointi Bayes-menetelmissä Integroinnin korvaaminen optimoinilla: posteriorin maksimi (MAP) - toimii helpoissa tapauksissa Analyyttinen integrointi - toimii yksinkertaisilla malleilla Slide 37 Analyytiset approksimaatiot - toimii yksinkertaisilla malleilla tai vaatii paljon vaivaa Numeerinen integrointi - tarvitaan laskentatehoa Numeerinen Integrointi Slide 38 Monte Carlo (MC) - integraali approksimoidaan posteriorijakaumsta vedettyjen näytteiden (A (t) ) avulla E(A) 1 N N t=1 A (t) - vaikea saada riippumattomia näytteitä tehokkaasti Markov Chain Monte Carlo (MCMC) - käytetään apuna Markov-ketjuja - riippuvia näytteitä (vaikeuttaa tarkkusarvioita) - yleistyi 1990-luvulla huomattavasti

20 Bayes-menetelmien suosion kasvu 1990-luvulle asti käytettiin analyyttisiä menetelmiä mallit välttämättä yksinkertaisempia Konetehon jatkuva kasvu ja numeeristen integrointimentelmien kehitys suosio jyrkkään kasvuun 1990-luvulla Slide 39 mahdollisuus käyttää monipuolisempia paremmin todellisuutta kuvaavia malleja käyttöön lukuisilla vaikeilla sovellusalueilla Bayesilaisen mallintamisen vaiheet Oletusten perusteella muodostetaan malli - malli/uskottavuustermi - rakenteellinen priori Täydennetään taustaoletuksilla - priori parametreille Slide 40 Lasketaan Bayesin kaavaa ja marginalisointia hyväksi käyttäen jakaumat halutuille tuntemattomille - esim. ennuste tulevalle havainnolle

21 Esimerkki: Saturnuksen massa Malli ja havainnot - θ = Saturnuksen massa (tuntematon) - D = observatorioiden mittaamaat häiriöt Jupiterin ja Saturnuksen radoissa (havainnot) - M = Newtonilainen mekaniikka (mallioletukset) Slide 41 - p(d θ, M) = jos Saturnuksen massa olisi θ, niin kuinka todennäköistä olisi havaita mittaukset D - p(θ M) = järkevä rajoitus massalle; ei niin pieni että Saturnus menettäisi renkaansa, ei niin suuri että koko aurinkokunta järkkyisi (priori) Laplace laski ja totesi...veikkaus 11000:1, että tämän tuloksen virhe ei ole 1% arvostaan - nykyestimaatista Laplacen tulos poikkesi 0.63% Huomatkaa, että Laplace laski jakauman Saturnuksen massan epävarmuudelle, jolloin pystyi esittämään myös arvion estimaatin tarkkudesta Esimerkki: Betonin laadun ennustaminen Reseptin ja kiviaineksen vaikutus betonin laatuun - paljonko vettä, sementtiä, kiviainesta ja lisäaineita - kiviaineksen fysikaaliset ja kemialliset ominaisuudet Slide 42

22 Esimerkki: Betonin laadun ennustaminen Mallina gaussinen prosessi - epälineaarinen regressiomalli - samankaltaiset lähtötiedot tuottavat samankaltaista laatua - samankaltaisuus kuvataan kovarianssifunktiolla, jonka parametrit tuntemattomia Slide 43 Mallin ja siihen pohjautuvien TkT Hanna Järvenpään tekemien johtopäätösten avulla oli mahdollista - vähentää raaka-ainekustannuksia 5-15% - vähentää luonnon soran osuus betonin kiviaineksista 5-20%:iin verrattuna aiempaan %:iin Yhteenveto Bayesilaisen mallintamisen taustaa Todennäköisyys epävarmuuden mittana Epävarmuuksien yhdistäminen todennäköisyyslaskennalla Bayesin kaava Slide 44 Bayesilainen malli

S-114.600 Bayesilaisen mallintamisen perusteet

S-114.600 Bayesilaisen mallintamisen perusteet S-114.600 Bayesilaisen mallintamisen perusteet Laajuus: 2 ov Opettajat: TkT Aki Vehtari, DI Toni Tamminen Slide 1 Sisältö: Bayesilainen todennäköisyysteoria ja bayesilainen päättely. Bayesilaiset mallit

Lisätiedot

Pikajohdatus bayesilaiseen tilastoanalyysiin ja monimuuttuja-analyysiin

Pikajohdatus bayesilaiseen tilastoanalyysiin ja monimuuttuja-analyysiin ja monimuuttuja-analyysiin Loppuseminaari: Terveydenhuollon uudet analyysimenetelmät (TERANA) Aki Vehtari AB HELSINKI UNIVERSITY OF TECHNOLOGY Department of Biomedical Engineering and Computational Science

Lisätiedot

Mitä on bayesilainen päättely?

Mitä on bayesilainen päättely? Metodifestivaali 29.5.2009 Aki Vehtari AB TEKNILLINEN KORKEAKOULU Lääketieteellisen tekniikan ja laskennallisen tieteen laitos Esityksen sisältö Miksi? Epävarmuuden esittäminen Tietämyksen päivittäminen

Lisätiedot

Luento 2. Yksiparametrisia malleja. Binomi-malli. Posteriorijakauman esittämisestä. Informatiivisista priorijakaumista. Konjugaattipriori.

Luento 2. Yksiparametrisia malleja. Binomi-malli. Posteriorijakauman esittämisestä. Informatiivisista priorijakaumista. Konjugaattipriori. Luento 2 Binomi-malli Posteriorijakauman esittämisestä Informatiivisista priorijakaumista Konjugaattipriori Slide 1 Yksiparametrisia malleja Binomi Jacob Bernoulli (1654-1705), Bayes (1702-1761) Normaali

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

- voidaan käyttä lisämään tieteellistä ymmärrystä ilmiöstä. - joidenkin havaittavien suureiden vaikutus voi olla paljon suurempi kuin toisten

- voidaan käyttä lisämään tieteellistä ymmärrystä ilmiöstä. - joidenkin havaittavien suureiden vaikutus voi olla paljon suurempi kuin toisten Viime kerralla Normaalijakauma tunnetulla varianssilla Normaalijakauma tunnetulla keskiarvolla Poisson-mallli Exponentiaalinen malli Slide 1 Cauchy-jakauma Ei-informatiivisista priorijakaumista Bayesilaisen

Lisätiedot

Tentin materiaali. Sivia: luvut 1,2, , ,5. MacKay: luku 30. Gelman, 1995: Inference and monitoring convergence

Tentin materiaali. Sivia: luvut 1,2, , ,5. MacKay: luku 30. Gelman, 1995: Inference and monitoring convergence Tentin materiaali Sivia: luvut 1,2,3.1-3.3,4.1-4.2,5 MacKay: luku 30 Gelman, 1995: Inference and monitoring convergence Gelman & Meng, 1995: Model checking and model improvement Kalvot Harjoitustyöt Tentin

Lisätiedot

Bayesilainen päätöksenteko / Bayesian decision theory

Bayesilainen päätöksenteko / Bayesian decision theory Bayesilainen päätöksenteko / Bayesian decision theory Todennäköisyysteoria voidaan perustella ilman päätösteoriaa, mutta vasta päätösteorian avulla siitä on oikeasti hyötyä Todennäköisyyteoriassa tavoitteena

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi

Lisätiedot

Bayesilaisen mallintamisen perusteet

Bayesilaisen mallintamisen perusteet Bayesilaisen mallintamisen perusteet Johdanto Yksiparametrisia malleja Moniparametrisia malleja Slide 1 Päättely suurten otosten tapauksessa ja bayesilaisen päättelyn frekvenssiominaisuudet Hierarkiset

Lisätiedot

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu 1. Tyhjentävä tunnusluku (sucient statistics ) Olkoon (P(X = x θ) : θ Θ) todennäköisyysmalli havainnolle X. Datan funktio T (X ) on Tyhjentävä tunnusluku jos ehdollinen todennäköisyys (ehdollinen tiheysfunktio)

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Binomi Jacob Bernoulli ( ), Bayes ( ) Normaali de Moivre ( ), Laplace ( ), Gauss ( )

Binomi Jacob Bernoulli ( ), Bayes ( ) Normaali de Moivre ( ), Laplace ( ), Gauss ( ) Luento 2 Binomi-malli Posteriorijakauman esittämisestä Informatiivisista priorijakaumista Konjugaattipriori Slide 1 Yksiparametrisia malleja Binomi Jacob Bernoulli (1654-1705), Bayes (1702-1761) Normaali

Lisätiedot

Bayes-mallinnus siltana teorian ja empiirisen evidenssin välillä

Bayes-mallinnus siltana teorian ja empiirisen evidenssin välillä Bayes-mallinnus siltana teorian ja empiirisen evidenssin välillä Antti Penttinen Jyväskylän yliopisto Matematiikan ja tilastotieteen laitos Metodifestivaalit Jyväskylän yliopisto 21.5.2013 Suunnitelma

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Gaussiset prosessit derivaattahavainnoilla regressio-ongelmassa (valmiin työn esittely)

Gaussiset prosessit derivaattahavainnoilla regressio-ongelmassa (valmiin työn esittely) Gaussiset prosessit derivaattahavainnoilla regressio-ongelmassa (valmiin työn esittely) Ohjaaja: TkT Aki Vehtari Valvoja: Prof. Harri Ehtamo Kandidaattiseminaari 21 1.11.21 Esityksen rakenne Tausta Derivaattahavaintojen

Lisätiedot

Luento 11. Muutama hyödyllinen Monte Carlo-menetelmä. Muutama hyödyllinen Monte Carlo-menetelmä. Mitä muuta hyödyllistä Gelman et al kirjasta löytyy

Luento 11. Muutama hyödyllinen Monte Carlo-menetelmä. Muutama hyödyllinen Monte Carlo-menetelmä. Mitä muuta hyödyllistä Gelman et al kirjasta löytyy Luento 11 Muutama hyödyllinen Monte Carlo-menetelmä Mitä muuta hyödyllistä Gelman et al kirjasta löytyy Kertaus koko kurssiin - tenttiinlukuohjeet Slide 1 Muutama hyödyllinen Monte Carlo-menetelmä Hylkäyspoiminta

Lisätiedot

S Bayesilaisen mallintamisen perusteet

S Bayesilaisen mallintamisen perusteet S-114.2601 Bayesilaisen mallintamisen perusteet Laajuus: 5 op, L Opettajat: TkT Aki Vehtari, DI Simo Särkkä Slide 1 Sisältö: Bayesilainen todennäköisyysteoria ja bayesilainen päättely. Bayesilaiset mallit

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 14. syyskuuta 2007 Antti Rasila () TodB 14. syyskuuta 2007 1 / 21 1 Kokonaistodennäköisyys ja Bayesin kaava Otosavaruuden ositus Kokonaistodennäköisyyden

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

p(θ 1 y) on marginaalijakauma p(θ 1 θ 2, y) on ehdollinen posteriorijakauma Viime kerralla Termejä viime kerralta Marginalisointi Marginaalijakauma

p(θ 1 y) on marginaalijakauma p(θ 1 θ 2, y) on ehdollinen posteriorijakauma Viime kerralla Termejä viime kerralta Marginalisointi Marginaalijakauma Viime kerralla Marginalisointi Marginaalijakauma Posteriorijakauman faktorointi Ehdollinen posteriorijakauma Slide 1 Posteriorijakaumasta simulointi Normaalijakauma - tuntematon keskiarvo ja varianssi

Lisätiedot

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI 1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI Edellä esitelty Bayesiläinen luokittelusääntö ( Bayes Decision Theory ) on optimaalinen tapa suorittaa luokittelu, kun luokkien tnjakaumat tunnetaan Käytännössä tnjakaumia

Lisätiedot

JOHDATUS TEKOÄLYYN LUENTO 4.

JOHDATUS TEKOÄLYYN LUENTO 4. 2009 CBS INTERACTIVE JOHDATUS TEKOÄLYYN LUENTO 4. TODENNÄKÖISYYSMALLINNUS II: BAYESIN KAAVA TEEMU ROOS Marvin Minsky Father of Artificial Intelligence, 1927 2016 PINGVIINI(tweety) :- true. Wulffmorgenthaler

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Tervetuloa! Matematiikka tutuksi

Tervetuloa! Matematiikka tutuksi Tervetuloa! Matematiikka tutuksi Tavoitteet Yritetään vastata seuraaviin kysymyksiin: Mitä matematiikassa tutkitaan ja mihin sitä tarvitaan? Mitä tarkoitetaan todistuksella ja mitä hyötyä on käsitteiden

Lisätiedot

Tilastotieteen aihehakemisto

Tilastotieteen aihehakemisto Tilastotieteen aihehakemisto hakusana ARIMA ARMA autokorrelaatio autokovarianssi autoregressiivinen malli Bayes-verkot, alkeet TILS350 Bayes-tilastotiede 2 Bayes-verkot, kausaalitulkinta bootstrap, alkeet

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30. FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten Todennäköisyys Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten tietoliikennejärjestelmien ymmärtämisessä

Lisätiedot

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI 1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI Edellä esitelty Bayesiläinen luokittelusääntö ( Bayes Decision Theory ) on optimaalinen tapa suorittaa luokittelu, kun luokkien tnjakaumat tunnetaan Käytännössä tnjakaumia

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

TILASTOLLINEN OPPIMINEN

TILASTOLLINEN OPPIMINEN 301 TILASTOLLINEN OPPIMINEN Salmiakki- ja hedelmämakeisia on pakattu samanlaisiin käärepapereihin suurissa säkeissä, joissa on seuraavat sekoitussuhteet h 1 : 100% salmiakkia h 2 : 75% salmiakkia + 25%

Lisätiedot

031021P Tilastomatematiikka (5 op)

031021P Tilastomatematiikka (5 op) 031021P Tilastomatematiikka (5 op) Jukka Kemppainen Mathematics Division Yleinen todennäköisyys Kertausmateriaalissa esiteltiin koulusta tuttuja todennäköisyysmalleja. Tällä kurssilla todennäköisyys on

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1 T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

3.6 Su-estimaattorien asymptotiikka

3.6 Su-estimaattorien asymptotiikka 3.6 Su-estimaattorien asymptotiikka su-estimaattorit ovat usein olleet puutteellisia : ne ovat usein harhaisia ja eikä ne välttämättä ole täystehokkaita asymptoottisilta ominaisuuksiltaan ne ovat yleensä

Lisätiedot

2. Uskottavuus ja informaatio

2. Uskottavuus ja informaatio 2. Uskottavuus ja informaatio Aluksi käsittelemme uskottavuus- ja log-uskottavuusfunktioita Seuraavaksi esittelemme suurimman uskottavuuden estimointimenetelmän Ensi viikolla perehdymme aiheeseen lisääkö

Lisätiedot

Tilastollinen päättely, 10 op, 4 ov

Tilastollinen päättely, 10 op, 4 ov Tilastollinen päättely, 0 op, 4 ov Arto Luoma Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede 3304 TAMPEREEN YLIOPISTO Syksy 2006 Kirjallisuutta Garthwaite, Jolliffe, Jones Statistical Inference,

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Nollasummapelit ja bayesilaiset pelit

Nollasummapelit ja bayesilaiset pelit Nollasummapelit ja bayesilaiset pelit Kristian Ovaska HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Seminaari: Peliteoria Helsinki 18. syyskuuta 2006 Sisältö 1 Johdanto 1 2 Nollasummapelit 1 2.1

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Mikrobikriteereiden arviointi esimerkkinä kampylobakteeri

Mikrobikriteereiden arviointi esimerkkinä kampylobakteeri Mikrobikriteereiden arviointi esimerkkinä kampylobakteeri Taustaa: NMDD-projekti 2011-2012 Rahoitus: pohjoismaiden ministerineuvosto Vast.tutkija: Maarten Nauta, DTU Epävarmuusanalyysin Bayes-mallinnus,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila Kalvoissa käytetään materiaalia P. Palon vuoden 2005 kurssista. 07.09.2007 Antti Rasila () SovTodB 07.09.2007 07.09.2007 1 / 24 1 Todennäköisyyslaskennan

Lisätiedot

Posteriorijakauman normaalijakauma-approksimaatio. Usein posteriorijakauma lähestyy normaalijakaumaa kun n

Posteriorijakauman normaalijakauma-approksimaatio. Usein posteriorijakauma lähestyy normaalijakaumaa kun n Luento 5 Päättely suurten otosten tapauksessa, n - normaalijakauma-approksimaatio - suurten otosten teoria - asymptoottinen normaalius ja konsistenttisuus - vastaesimerkkejä Slide 1 Bayesilaisen päättelyn

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Todennäköisyyslaskennan käsitteitä Satunnaisuus ja deterministisyys Deterministisessä ilmiössä alkutila määrää lopputilan yksikäsitteisesti. Satunnaisilmiö puolestaan arpoo - yhdestä alkutilasta voi päätyä

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

P (A)P (B A). P (B) P (A B) = P (A = 0)P (B = 1 A = 0) P (B = 1) P (A = 1)P (B = 1 A = 1) P (B = 1)

P (A)P (B A). P (B) P (A B) = P (A = 0)P (B = 1 A = 0) P (B = 1) P (A = 1)P (B = 1 A = 1) P (B = 1) Harjoitustehtäviä (erä 1) 1 1. Käytetään yksinkertaisesti Bayesin kaavaa: P (A B) = P (A)P (B A). P (B) Tapauksessa B = 1 saadaan P (A = 0 B = 1) = P (A = 1 B = 1) = P (A = 0)P (B = 1 A = 0) P (A = 1)P

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 Luku 1 Bayesläiset estimaattorit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 217 1.1 Bayesläiset piste-estimaatit Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia

Lisätiedot

T Luonnollisten kielten tilastollinen käsittely

T Luonnollisten kielten tilastollinen käsittely T-61.281 Luonnollisten kielten tilastollinen käsittely Vastaukset 3, ti 11.2.2003, 16:15-18:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

p(y θ, M) p(θ M)dθ p(θ y, M) = p(y M) Luento 10 Marginaaliuskottavuus Bayes-tekijä Mallin odotettu hyöty DIC (Deviance Information Criterion)

p(y θ, M) p(θ M)dθ p(θ y, M) = p(y M) Luento 10 Marginaaliuskottavuus Bayes-tekijä Mallin odotettu hyöty DIC (Deviance Information Criterion) Luento 10 Bayes-tekijä Mallin odotettu hyöty DIC (Deviance Information Criterion) Mallin valinta Slide 1 Marginaaliuskottavuus Bayesin kaava missä p(θ y, M) = p(y M) = p(y θ, M)p(θ M) p(y M) p(y θ, M)

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)

Lisätiedot

&idx=2&uilang=fi&lang=fi&lvv=2015

&idx=2&uilang=fi&lang=fi&lvv=2015 20.10.2015/1 MTTTP5, luento 20.10.2015 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

30A02000 Tilastotieteen perusteet

30A02000 Tilastotieteen perusteet 30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi

Lisätiedot

exp p(y θ) = 1 2πσ θ)2 2σ 2(y y N(θ, σ 2 ) Luento 3 Normaalijakauma (Gaussian) Normaalijakauma tunnetulla varianssilla

exp p(y θ) = 1 2πσ θ)2 2σ 2(y y N(θ, σ 2 ) Luento 3 Normaalijakauma (Gaussian) Normaalijakauma tunnetulla varianssilla Luento 3 Normaalijakauma tunnetulla varianssilla Normaalijakauma tunnetulla keskiarvolla Poisson-malli Exponentiaalinen malli Slide 1 Cauchy-jakauma Lisää konjugaattiprioreista Ei-informatiivisista priorijakaumista

Lisätiedot

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 5.-7.11.2008. 1 Tällä viikolla Sisältösuunnitelma: Ennustamisstrategioista Koneoppimismenetelmiä: k-nn (luokittelu

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL Mallin arviointi ja valinta Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL Sisältö Otoksen ennustevirheen estimointi AIC - Akaiken informaatiokriteeri mallin valintaan Parametrimäärän

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Matemaattinen tilastotiede Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Alkusanat Tämä moniste perustuu vuosina 2002-2004 pitämiini matemaattisen tilastotieteen luentoihin

Lisätiedot

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Inversio-ongelmien laskennallinen peruskurssi Luento 7 Inversio-ongelmien laskennallinen peruskurssi Luento 7 Kevät 2012 1 Tilastolliset inversio-ongelmat Tilastollinen ionversio perustuu seuraaviin periaatteisiin: 1. Kaikki mallissa olevat muuttujat mallinnetaan

Lisätiedot

Bayesiläinen tilastollinen vaihtelu

Bayesiläinen tilastollinen vaihtelu Bayesiläinen tilastollinen vaihtelu Janne Pitkäniemi FT, dos. (biometria), joht. til. tiet Suomen Syöpärekisteri Hjelt-instituutti /Helsingin yliopisto Periaatteet Tilastollinen vaihtelu koskee perusjoukon

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 25.10.2016/1 MTTTP5, luento 25.10.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Frekventistiset vs. bayeslaiset menetelmät Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Viime kerralla. Luento 6. Normaalijakauma-approksimaatio - moodi. - havaittu informaatio

Viime kerralla. Luento 6. Normaalijakauma-approksimaatio - moodi. - havaittu informaatio Viime kerralla Normaalijakauma-approksimaatio - moodi - havaittu informaatio Suurten otosten teoria - asymptoottinen normaalius ja konsistenttisuus Slide 1 - vastaesimerkkejä Bayesilaisen päättelyn frekvenssiarviointi

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Markov-ketju Monte Carlo - konvergenssidiagnostiikka (convergence diagnostics) - odotettu hyöty tai kustannus (expected utility or cost)

Markov-ketju Monte Carlo - konvergenssidiagnostiikka (convergence diagnostics) - odotettu hyöty tai kustannus (expected utility or cost) Viime kerralla Markov-ketju Monte Carlo - konvergenssidiagnostiikka (convergence diagnostics) - kuinka monta riippuvaa simulaationäytettä tarvitaan - joitakin perus-mcmc-menetelmien parannuksia Slide 1

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12

Lisätiedot

Parametristen mallien identifiointiprosessi

Parametristen mallien identifiointiprosessi Parametristen mallien identifiointiprosessi Koesuunnittelu Identifiointikoe Epäparametriset menetelmät Datan esikäsittely Mallirakenteen valinta Parametrien estimointi Mallin validointi Mallin käyttö &

Lisätiedot

6. laskuharjoitusten vastaukset (viikot 10 11)

6. laskuharjoitusten vastaukset (viikot 10 11) 6. laskuharjoitusten vastaukset (viikot 10 11) 1. a) Sivun 102 hypergeometrisen jakauman määritelmästä saadaan µ µ 13 39 13! 13 12 11 10 9 µ 0! 8! 1! 2 2! 2 1 0 49 48! 47!! 14440 120 31187200 120 1287

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

S Laskennallinen systeemibiologia

S Laskennallinen systeemibiologia S-114.2510 Laskennallinen systeemibiologia 3. Harjoitus 1. Koska tilanne on Hardy-Weinbergin tasapainossa luonnonvalintaa lukuunottamatta, saadaan alleeleista muodostuvien eri tsygoottien genotyyppifrekvenssit

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Kysymystyypit. Tentin kysymystyypit. Monivalinta

Kysymystyypit. Tentin kysymystyypit. Monivalinta Kysymystyypit Tentin kysymystyypit Monivalinta Tosi/Epätosi Lyhytvastaus Numeerinen kysymys Laskutehtävä Essee Yhdistämistehtävä Yhdistämistehtävä lyhytvastauksista Aukkotehtävät Matemaattinen monivalinta

Lisätiedot

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä: 4. Tyhjentyvyys Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä: Voidaanko päätelmät perustaa johonkin tunnuslukuun t = t(y) koko aineiston y sijasta? Mitä

Lisätiedot

Parametristen mallien identifiointiprosessi

Parametristen mallien identifiointiprosessi Parametristen mallien identifiointiprosessi Koesuunnittelu Identifiointikoe Epäparametriset menetelmät Datan esikäsittely Mallirakenteen valinta Parametrien estimointi Mallin validointi Mallin käyttö &

Lisätiedot

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava TKK (c) Ilkka Mellin (2005) 1 Kokonaistodennäköisyys ja Bayesin kaava Kokonaistodennäköisyys ja Bayesin kaava: Johdanto Kokonaistodennäköisyyden

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

exp Luento 3 Normaalijakauma (Gaussian) Normaalijakauma tunnetulla varianssilla Normaalijakauma tunnetulla keskiarvolla Poisson-mallli

exp Luento 3 Normaalijakauma (Gaussian) Normaalijakauma tunnetulla varianssilla Normaalijakauma tunnetulla keskiarvolla Poisson-mallli Luento 3 Normaalijakauma tunnetulla varianssilla Normaalijakauma tunnetulla keskiarvolla Poisson-mallli Exponentiaalinen malli Slide Cauchy-jakauma Ei-informatiivisista priorijakaumista *-merkatut kalvot

Lisätiedot

Pohdiskeleva ajattelu ja tasapainotarkennukset

Pohdiskeleva ajattelu ja tasapainotarkennukset Pohdiskeleva ajattelu ja tasapainotarkennukset Sanna Hanhikoski 24.3.2010 Sisältö Pohdiskeleva ajattelu Nashin tasapainotarkennukset Täydellinen tasapaino Täydellinen bayesiläinen tasapaino Vaiheittainen

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS X Y Z Å BAYES-VERKKO ON TODENNÄKÖISYYSMALLIN ESITYS VERKON SOLMUT OVAT SATUNNAISMUUTTUJIA (ESIM. NOPAN SILMÄLUKU) VERKON KAARET ( NUOLET ) VASTAAVAT SUORIA RIIPPUUKSIA: EI

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Bayesläiset tilastolliset mallit

Bayesläiset tilastolliset mallit Luku 9 Bayesläiset tilastolliset mallit Lasse Leskelä Aalto-yliopisto 8. lokakuuta 07 9. Priorijakauma ja posteriorijakauma Bayesläisen tilastollisen päättelyn lähtökohtana on päivittää satunnaisilmiöön

Lisätiedot

TN-IIa (MAT22001), syksy 2017

TN-IIa (MAT22001), syksy 2017 TN-IIa (MAT22001), syksy 2017 Petteri Piiroinen 4.9.2017 Todennäköisyyslaskennan IIa -kurssin asema opetuksessa Tilastotieteen pääaineopiskelijoille pakollinen aineopintojen kurssi. Suositus: toisen vuoden

Lisätiedot