DBN Mitä sillä tekee? Dynaamisten Bayes-verkkojen määrittely aikasarja-analyysissä Janne Toivola jtoivola@iki.fi



Samankaltaiset tiedostot
= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

Simulation model to compare opportunistic maintenance policies

Luku 8. Aluekyselyt. 8.1 Summataulukko

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

JOHDATUS TEKOÄLYYN TEEMU ROOS

10. Painotetut graafit

JOHDATUS TEKOÄLYYN TEEMU ROOS

Datatähti 2019 loppu

Muuttujien riippumattomuus

Laskennan vaativuus ja NP-täydelliset ongelmat

Graafit ja verkot. Joukko solmuja ja joukko järjestämättömiä solmupareja. eli haaroja. Joukko solmuja ja joukko järjestettyjä solmupareja eli kaaria

JOHDATUS TEKOÄLYYN TEEMU ROOS

Mallipohjainen klusterointi

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

JOHDATUS TEKOÄLYYN TEEMU ROOS

Algoritmit 2. Luento 2 Ke Timo Männikkö

JOHDATUS TEKOÄLYYN TEEMU ROOS

1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

v 1 v 2 v 3 v 4 d lapsisolmua d 1 avainta lapsen v i alipuun avaimet k i 1 ja k i k 0 =, k d = Sisäsolmuissa vähint. yksi avain vähint.

Algoritmit 2. Luento 2 To Timo Männikkö

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

Bayesilainen päätöksenteko / Bayesian decision theory

Laskuharjoitus 5. Mitkä ovat kuvan 1 kanavien kapasiteetit? Kuva 1: Kaksi kanavaa. p/(1 p) ) bittiä lähetystä kohti. Voidaan

JOHDATUS TEKOÄLYYN LUENTO 4.

Esimerkkejä vaativuusluokista

Tietorakenteet, laskuharjoitus 10, ratkaisuja. 1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

Bayesiläinen tilastollinen vaihtelu

Algoritmit 1. Luento 8 Ke Timo Männikkö

TILASTOLLINEN OPPIMINEN

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Reikä. Säätila. Hammassärky Osuma

Verkon värittämistä hajautetuilla algoritmeilla

Harjoitus 3 ( )

Algoritmit 1. Luento 9 Ti Timo Männikkö

58131 Tietorakenteet (kevät 2009) Harjoitus 11, ratkaisuja (Topi Musto)

6.4. Järjestyssuhteet

Laskennallinen data-analyysi II

Tehtävän V.1 ratkaisuehdotus Tietorakenteet, syksy 2003

1 Johdanto Uskomusverkko -jota kutsutaan myos Bayesilaiseksi verkoksi, vaikutus kaavioksi tai seuraamus verkko - on tapa esitaa informaatiota, siten e

Yhteistyötä sisältämätön peliteoria jatkuu

Rinnakkaistietokoneet luento S

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

T Luonnollisen kielen tilastollinen käsittely Vastaukset 8, ti , 8:30-10:00 Tilastolliset yhteydettömät kieliopit, Versio 1.

Tentin materiaali. Sivia: luvut 1,2, , ,5. MacKay: luku 30. Gelman, 1995: Inference and monitoring convergence

P (A)P (B A). P (B) P (A B) = P (A = 0)P (B = 1 A = 0) P (B = 1) P (A = 1)P (B = 1 A = 1) P (B = 1)

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

Algoritmi on periaatteellisella tasolla seuraava:

Algoritmit 1. Luento 13 Ti Timo Männikkö

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

811312A Tietorakenteet ja algoritmit, , Harjoitus 5, Ratkaisu

Harjoitus 4 ( )

GA & robot path planning. Janne Haapsaari AUTO Geneettiset algoritmit

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

4. Tietokoneharjoitukset

Laskennallinen data-analyysi II

4. Tietokoneharjoitukset

Johdatus tn-laskentaan perjantai

Englannin lausekerakenteita ja taulukkojäsentäminen

T Kevät 2009 Logiikka tietotekniikassa: perusteet Laskuharjoitus 8 (Predikaattilogiikka )

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Harjoitus 3 ( )

1. Tilastollinen malli??

XML prosessori. XML prosessointi. XML:n kirjoittaminen. Validoiva jäsennin. Tapahtumaohjattu käsittely. Tapahtumaohjattu käsittely.

j(j 1) = n(n2 1) 3 + (k + 1)k = (k + 1)(k2 k + 3k) 3 = (k + 1)(k2 + 2k + 1 1)

Harjoitus 7: NCSS - Tilastollinen analyysi

MTTTP5, luento Luottamusväli, määritelmä

Muuttujien eliminointi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

A TIETORAKENTEET JA ALGORITMIT

Approksimatiivinen päättely

Algoritmit 1. Luento 7 Ti Timo Männikkö

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Joonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen

Etsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen

Bayes-mallinnus siltana teorian ja empiirisen evidenssin välillä

Yleinen paikallinen vakautuva synkronointialgoritmi

Avainsanojen poimiminen Eeva Ahonen

811120P Diskreetit rakenteet

58131 Tietorakenteet ja algoritmit Uusinta- ja erilliskoe ratkaisuja (Jyrki Kivinen)

Dynaaminen ohjelmointi ja vaikutuskaaviot

Tieverkon kunnon stokastinen ennustemalli ja sen soveltaminen riskienhallintaan

805306A Johdatus monimuuttujamenetelmiin, 5 op

Lineaaristen monitavoiteoptimointitehtävien ratkaiseminen Bensonin algoritmilla

58131 Tietorakenteet (kevät 2009) Harjoitus 6, ratkaisuja (Antti Laaksonen)

Miten käydä läpi puun alkiot (traversal)?

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015

f(n) = Ω(g(n)) jos ja vain jos g(n) = O(f(n))

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Itsestabilointi: perusmääritelmiä ja klassisia tuloksia

T Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet )

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen

Algoritmit 2. Luento 6 Ke Timo Männikkö

Tietorakenteet ja algoritmit

Transkriptio:

DBN Mitä sillä tekee? Dynaamisten Bayes-verkkojen määrittely aikasarja-analyysissä Janne Toivola jtoivola@iki.fi

Historiaa Bayesin kaavan hyödyntäminen BN-ohjelmistoja ollut ennenkin Tanskalaisten Hugin Expert Adnan Darwiche & co: SAMIAM Ei tarkoitettuja aikasarja-analyysiin

Mitä iloa päättelystä Bayesilaisella päättelyllä tehdään optimaalisia johtopäätöksiä havaitsemattomista asioista Otetaan huomioon esim. aika, paikka, positio kromosomissa tms. konteksti Luokittelu, segmentointi jne. piilomuuttujien avulla Automaattinen puutteellisen datan käsittely

BN: verkko Pohjana muuttujien riippuvuudet ilmaiseva suunnattu syklitön verkko DAG Mallin parametrit muotoa p(c pa(c)) C on riippumaton muista kuin vanhemmistaan pa(c) Muuttujia kuvaavien solmujen välillä kaaret vanhemmista lapsiin

BN: liittymäpuu E.m. verkko soveltuu huonosti inferenssin vaatimiin laskutoimituksiin Täysi yhteis-tn-jakauma tuhlaa muistia Käytettävä vaihtoehtoista esitystapaa nimeltä liittymäpuu Puun solmut tallentavat nk. perheiden yhteistodennäköisyysjakaumia

BN: liittymäpuu Puuhun tallennetut jakaumat nimeltään potentiaaleja (mahd. normalisoimaton) Minimaalinen tapa esittää yhteis-tn-jakauma pienempien tulona Vrt. p(x, y, z) = p(x y) p(y z) p(z) Myös ns. running intersection property

BN: liittymäpuu Esimerkki graafista ja liittymäpuusta A A,B A A,C B C

BN: päättely Päättely tapahtuu levittämällä potentiaaleja painottavia jakaumia naapurisolmuihin puussa Marginalisoimalla saadaan pienempi projektio potentiaalista: φ(a) = B φ(a, B) Kertolaskulla päivitetään potentiaalia uuden evidenssin mukaan: φ(a, C) := φ(a, C) φ(a)

Lisää historiaa Kevin Murphy 2002 Väitöskirja: Dynamic Bayesian Networks: Representation, Inference & Learning Esittää 1.5DBN käsitteen

DBN: aikaviipaleet Aikasarjoja varten toistuvarakenteiset mallit Esim. HMM toistaa pientä verkkoa Esitetään malli viipaleena, jota toistetaan Määritettävä toistuva osa liittymäpuusta laskutoimituksia varten Viipaleen käyttö päättelyssä puoliaskelin

DBN: aikaviipaleet Esimerkki aikaviipaleesta: HMM Q 0 Q 1 Q 2 Q 3 Q t 1 Q t... Y 1 Y 2 Y 3 staattinen BN Y t 1.5DBN

Toteutus: yleistä C-kielinen ohjelmakirjasto Huginin net-tiedostojen jäsennys Muunnos graafeista liittymäpuuksi Aikasarjan lukeminen tiedostosta Edellä kuvattu inferenssi mahd. aikaviipalein EM-algoritmi parametrien oppimiseen

Hugin net-formaatti Malli luetaan Huginin asettaman standardin mukaisesta tiedostosta node-määrittelyt kertovat muuttujat Oma NIP_next kenttä aikaviipalemalleille potential-määrittelyt ehdollisille todennäköisyysjakaumille Graafin rakenne samassa implisiittisesti

Graafista liittymäpuuksi NP-kova osuus liittymäpuun käytössä Muunnos heti net-tiedoston jäsennyksen jälkeen malli = liittymäpuu + muu kirjanpito Nip model = parse_model( hmm.net );

Datan luku tiedostosta Tiedoston 1. rivillä muuttujien nimet Loput rivit aikasarjan askelia Kullakin rivillä muuttujien arvojen nimet Luetaan data tiedostosta aikasarjaa esittäväksi tietorakenteeksi n = read_timeseries(model, data.txt, &n_timeseries);

Päättely Inferenssialgoritmi antaa esim. epävarman aikasarjan UncertainSeries ucs = forward_inference(ts, ts->hidden, ts->num_of_hidden); Annettujen muuttujien kunkin arvon todennäköisyys kullakin hetkellä Esim. yhteistodennäköisyydetkin mahdollisia, mutta implementoimatta

EM-algoritmi Datan likelihoodin laskenta oli hankala Algoritmille annetaan opetettava malli, aikasarjoittain dataa ja kynnysarvo lopetusehtoa varten Aikasarja sisältää viittauksen malliin em_learn(n_timeseries, n, threshold, &learning_curve);

Käytännön kokeilut Laboratoriotesti tunnetusta mallista generoidulla datalla - Havainnollistaa menetelmien toimintaa Kopiolukumuutosten aiheuttamat amplifikaatiot ihmisen perimässä - Osasyyllisiä kasvaimiin (l. syöpään)

Keinodatan mallit Alkuperäinen ja vaihtoehtoinen malli D t C t 1 C t C t 1 C t B t A t B t A t

Oppimiskäyrät 0.8 0.9 Original model Alternative model Average log.likelihood of data during EM algorithm 1 Log. likelihood / time step 1.1 1.2 1.3 1.4 1.5 1.6 0 50 100 150 200 250 Iterations

Inferenssituloksia: C Original samples of C (hidden) Results of inference using the original model & parameters Results of inference using the original model & estimated parameters 10 20 30 40 50 60 70 80 time

Inferenssituloksia: D Original samples of D Input data with missing s Results of inference using the original model & parameters Results of inference using the original model & estimated parameters 10 20 30 40 50 60 70 80 time

Inferenssituloksia: B Original samples of B Input data with missing s Results of inference using the original model & parameters Results of inference using the original model & estimated parameters 10 20 30 40 50 60 70 80 time

Inferenssituloksia: C Vaihtoehtoisen mallin piilotila Original samples of C (hidden) Results of inference using an estimated alternative model 10 20 30 40 50 60 70 80 time

Inferenssituloksia: B Original samples of B Input data with missing s Results of inference using an estimated alternative model 10 20 30 40 50 60 70 80 time

Amplifikaatiodata 100 Samples from DNA copy number amplification data 90 80 70 Tumor cases 60 50 40 30 20 10 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y Chromosome bands

Amplifikaatiomalli Kasvaintyyppi ja amplifikaatiot riippuvat piilomuuttujaketjusta E t 1 E t B t C D t

Oppimiskäyrä 0 Model 1 Average log.likelihood of data during EM algorithm 0.5 1 Log. likelihood / time step 1.5 2 2.5 3 3.5 0 5 10 15 20 25 30 35 40 45 Iterations

Amplifikaatioprofiilit Amplification profiles Urinary_tract Skin_tumor Respiratory_tract Nervous_system Male_genital_organs Hematologic_neoplasms Female_genital_organs Eye_tumor Endocrine_glands Digestive_tract Breast Bone_and_soft_tissue 8p23 8p22 8p21 8p12 8p11.2 8p11.1 8q11.1 8q11.2 8q12 8q13 8q21.1 chromosome band 8q21.2 8q21.3 8q22 8q23 8q24.1 8q24.2 8q24.3

Vielä muuta? Myös ns. pehmeää evidenssiä voisi syöttää havaintoina Jatkuvat muuttujat graafin lehtisolmuina? Paljon sovelluksia ja dataa?