S Laskennallinen systeemibiologia

Samankaltaiset tiedostot
LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3

Osa 2: Otokset, otosjakaumat ja estimointi

Sovellettu todennäköisyyslaskenta B

Tilastollinen päättely II, kevät 2017 Harjoitus 3B

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen

Yhden selittäjän lineaarinen regressiomalli

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Satunnaismuuttujien muunnokset ja niiden jakaumat. Satunnaismuuttujien muunnokset ja niiden jakaumat

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Osa 2: Otokset, otosjakaumat ja estimointi

RATKAISUT x 2 3 = x 2 + 2x + 1, eli 2x 2 2x 4 = 0, joka on yhtäpitävä yhtälön x 2 x 2 = 0. Toisen asteen yhtälön ratkaisukaavalla saadaan

Markov-ketjun hetkittäinen käyttäytyminen

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Johda jakauman momenttiemäfunktio ja sen avulla jakauman odotusarvo ja varianssi.

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

8. laskuharjoituskierros, vko 11, ratkaisut

2.1. Parametrien estimointi 2.2. Regressiokertoimien estimointi kovariansseista ja korrelaatioista

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

1. Valitaan tilanteeseen sopiva stokastinen malli. 2. Sovitetaan malli havaittuun dataan (estimoidaan mallin parametrit).

EX1 EX 2 EX =

Maximum likelihood-estimointi Alkeet

4 KORKEAMMAN KERTALUVUN LINEAARISET DIFFERENTIAALIYHTÄLÖT. Kertaluvun n lineaarinen differentiaaliyhtälö ns. standardimuodossa on

1. osa, ks. Solmu 2/ Kahden positiivisen luvun harmoninen, geometrinen, aritmeettinen ja + 1 u v 2 1

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

1 Eksponenttifunktion määritelmä

Mat Tilastollisen analyysin perusteet, kevät 2007

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Yhden selittäjän lineaarinen regressiomalli: Lisätiedot. Yhden selittäjän lineaarinen regressiomalli

xe y = ye x e y + xe y y = y e x + e x y xe y y y e x = ye x e y y (xe y e x ) = ye x e y y = yex e y xe y e x = x 3 + x 2 16x + 64 = D(x)

Mat Lineaarinen ohjelmointi

Kohdeyleisö: toisen vuoden teekkari

Yleinen lineaarinen malli. Yleinen lineaarinen malli. Yleinen lineaarinen malli: Mitä opimme? 2/4. Yleinen lineaarinen malli: Mitä opimme?

Tehtäviä neliöiden ei-negatiivisuudesta

Markov-ketjun hetkittäinen käyttäytyminen

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

5. Lineaarisen optimoinnin perusprobleemat

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

Sovellettu todennäköisyyslaskenta B

MS-A0003/A0005 Matriisilaskenta Laskuharjoitus 2 / vko 45

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 5 (6 sivua)

Insinöörimatematiikka IA

8.3. Yleinen lineaarinen malli ja yleistetty pienimmän neliösumman menetelmä

2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

Parametrien oppiminen

2 u = 0. j=1. x 2 j=1. Siis funktio v saavuttaa suurimman arvonsa jossakin alueen Ω pisteessä x. Pisteessä x = x on 2 v. (x ) 0.

Sovellettu todennäköisyyslaskenta B

6.1 Riippumattomat satunnaismuuttujat

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Laaja matematiikka 2 Kertaustehtäviä Viikko 17/ 2005

tilavuudessa dr dk hetkellä t olevien elektronien

Mat Tilastollisen analyysin perusteet, kevät 2007

2. Teoriaharjoitukset

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

BM20A Integraalimuunnokset Harjoitus 8

Ominaisarvo ja ominaisvektori

811312A Tietorakenteet ja algoritmit , Harjoitus 1 ratkaisu

Mat Tilastollisen analyysin perusteet, kevät 2007

3 b) Määritä paljonko on cos. Ilmoita tarkka arvo ja perustele vastauksesi! c) Muunna asteiksi 2,5 radiaania. 6p

1 Rajoittamaton optimointi

Otantajakauman käyttö päättelyssä

2. Uskottavuus ja informaatio

4.3 Signaalin autokorrelaatio

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

2 avulla. Derivaatta on nolla, kun. g( 3) = ( 3) 2 ( 3) 5 ( 3) + 6 ( 3) = 72 > 0. x =

Teoria. Tilastotietojen keruu

3.2 Polynomifunktion kulku. Lokaaliset ääriarvot

Inversio-ongelmien laskennallinen peruskurssi Luento 4

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Matematiikan tukikurssi

Matematiikan tukikurssi

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

11. Virheen arvioin-

Lineaariset yhtälöryhmät ja matriisit

Epäyhtälöoppia matematiikkaolympialaisten tehtäviin

Matematiikan tukikurssi

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

MS-C1340 Lineaarialgebra ja

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

9. laskuharjoituskierros, vko 12-13, ratkaisut

Johdatus regressioanalyysiin. Heliövaara 1

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Moniulotteisia todennäköisyysjakaumia

Luku 7. Parametrien estimointi. 7.1 Parametriset jakaumat. Lasse Leskelä Aalto-yliopisto 29. marraskuuta 2017

Matematiikan tukikurssi

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

Transkriptio:

S-4250 Laskeallie systeemibiologia Harjoitus Mittaustuloksea o saatu havaitoparia (x, y ),, (x, y ) Muuttuja y käyttäytymistä voidaa selittää muuttuja x avulla esimerkiksi yksikertaise lieaarise riippuvuude kautta Muodosta mitatulle ilmiölle malli sovittamalla suora y i θ x i + θ 2 pistejoukkoo Maximum Likelihood -meetelmällä (Malli o tällöi y i θ x i + θ 2 + ε i, jossa viimeie termi kattaa satuaise mittausvirhee) Oleta mittaustulokset riippumattomiksi ja ε i ormaalijakautueeksi: ε i N(0, σ 2 ) Aloitetaa määrittämällä yhdelle havaiolle y i likelihood, eli todeäköisyys havaita y i kohdassa x i aettua malli Koska kohta x i selittää havaio y i malli mukaisesti satuaista virhetermiä lukuuottamatta, vastaa arvo y i havaitsemise todeäköisyyttä residuaali e i y i θ x i θ 2 todeäköisyys Yhde pistee likelihood o siis p(y i x i ; θ) p(e i ) Mittausvirhe e i oletettii ormaalijakautueeksi odotusarvolla olla ja vakiovariassilla; ε i N(0, σ 2 ), jolloi kirjoittamalla ormaalijakauma auki saadaa yhde mittauspistee likelihood muotoo p(y i x i ; θ) p(e i ) exp { (y i θ x i θ 2 ) 2 } 2πσ 2σ 2 Ku oletetaa mittaukset riippumattomiksi, voidaa koko mittausdata likelihood kirjoittaa yksittäiste mittauspisteide likelihoodie tuloa p(y x; θ) exp { (y i θ x i θ 2 ) 2 } 2πσ 2σ 2 ( ) { } exp (y 2πσ 2σ 2 i θ x i θ 2 ) 2 Likelihood voidaa kirjoittaa pelkästää parametrie fuktioa: ( ) { } L(θ) exp (y 2πσ 2σ 2 i θ x i θ 2 ) 2

Parametrie θ Maximum Likelihood -estimaatit ovat sellaiset parametriarvot, jotka maksimoivat likelihoodi L(θ) arvo Etsitää siis likelihoodi maksimi Tässä tapauksessa maksimi löytyy helpoite ottamalla likelihoodista logaritmi ja etsimällä tämä maksimikohta (Logaritmi o mootoie fuktio, jote maksimi löytyy samasta kohtaa kui likelihoodilla) Käytäössä yleesä etsitää egatiivise log likelihoodi miimi, joka seki vastaa samaa asiaa Kirjoitetaa aluksi egatiivie log likelihood auki: l(θ) l L(θ) ( ( ) { l exp 2πσ 2σ 2 ( ) ( { l l exp 2πσ l( 2πσ ) + 2σ 2 }) (y i θ x i θ 2 ) 2 2σ 2 }) (y i θ x i θ 2 ) 2 (y i θ x i θ 2 ) 2 Viimeisestä muodosta havaitaa, että pieimmä arvosa lauseke saa ku jälkimmäise termi summa miimoituu Summalauseke o itseasiassa malli eliövirheide summa Tästä ähdää, että oletettaessa ormaalijakautueet mittausvirheet Maximum Likelihood -ratkaisu parametrie estimoiissa o sama kui pieimmä eliösumma (PNS) ratkaisu Miimi l(θ):lle löytyy tässä tapauksessa aalyyttisesti derivoimalla lauseke parametrie θ ja θ 2 suhtee, ja asettamalla derivaatat olliksi: l(θ) θ 2σ 2 (y 2 i θ x i θ 2 )( x i ) σ 2 (y i θ x i θ 2 )x i 0 l(θ) θ 2 2σ 2 (y 2 i θ x i θ 2 )( ) σ 2 (y i θ x i θ 2 ) 0 Tästä saadaa yhtälöt y i x i θ xi 2 θ 2 x i 0 y i θ joista saadaa ratkaistua suora parametrit θ ja θ 2 2 x i θ 2 0,

Haluttu ratkaisu o siis suora ŷ i θ x i + θ 2 parametreilla θ y ix i + x i y i x 2 i + ( x i ) 2 θ 2 y i θ x i 2 Moiulotteisessa tapauksessa tarkasteltava muuttuja y käyttäytymistä pyritää selittämää useide eri muuttujie x, x 2, x m avulla Lieaarimalli o tällöi y i a x i + a 2 x i2 + a m x im + ε i Mittauksessa o saatu havaitoa, ja selittäviä muuttujia o m kappaletta Muodosta matriisiyhtälö ja ratkaise siitä kertoimet a pieimmä eliösumma meetelmällä Kyseie ogelma voidaa kirjoittaa matriisimuodossa seuraavasti: y x x m a + y x x m a m Pieimmä eliösumma meetelmässä pyritää löytämää parametriarvot, jotka miimoivat malli ja mittaustuloste erotukse eliöllise arvo Ku mittauksia o kpl, saadaa eliövirheeksi E (y i a x i a 2 x i2 a m x im ) 2 Jos mallissa o mukaa vakiotermi, o se yleesä sisällytetty mukaa site, että x i, i Kute tehtävässä, derivoidaa eliösummalauseke ja asetetaa derivaatat olliksi Tästä seuraa m yhtälö lieaarie yhtälöryhmä, josta voidaa ratkaista kertoite arvot Derivaattalausekkeiksi (m kpl) saadaa E a j 2(y i a x i a m x im )( x ij ) 0, j m, joista saadaa edellee ε ε y i x ij (a x i + + a m x im )x ij, j m 3

Yhtälöt voidaa kirjoittaa matriisimuodossa, jolloi saadaa X T y X T Xa Tämä voidaa ratkaista ormaali matriisialgebra keioi; X T X o eliömatriisi, jolle löytyy kääteismatriisi, ku X o täysiasteie Ratkaisuksi saadaa a (X T X) X T y Pieimmä eliösumma kertoimet saadaa siis pseudoiverssi X + (X T X) X T avulla Jos oletetaa, että virhetermi o ormaalijakautuut, ovat ML-estimaatit lieaarimalli parametreille PNS-estimaatit, jotka puolestaa saadaa helposti pseudoiverssi avulla Moimutkaie moemuuttuja likelihood-termi maksimoiti yksikertaistuu siis yhde rivi matriisilaskuksi, jos ormaalisuusoletus pitää paikkasa 3 DNA-sekvessi malliuksessa käytetää astee Markov-mallia, joka siirtymätodeäköisyysmatriisi o P 0 08 005 005 035 0 0 045 03 02 02 03 06 0 025 005 (Matriisi rivejä ja sarakkeita vastaava emäsjärjestys o a, c, g, t) Etsi Markovi ketju statioaarie tila Merkitää statioaarista tilaa vektorilla ϕ Statioaarie tila toteuttaa ehdo ϕ T ϕ T P, eli [ ϕ ϕ 2 ϕ 3 ϕ 4 ] [ ϕ ϕ 2 ϕ 3 ϕ 4 ] P Muistetaa ehto ϕ + ϕ 2 + ϕ 3 + ϕ 4, 4

jolloi saadaa yhtälöryhmä 0ϕ + 035ϕ 2 + 03ϕ 3 + 06ϕ 4 ϕ 08ϕ + 0ϕ 2 + 02ϕ 3 + 0ϕ 4 ϕ 2 005ϕ + 0ϕ 2 + 02ϕ 3 + 025ϕ 4 ϕ 3 005ϕ + 045ϕ 2 + 03ϕ 3 + 005ϕ 4 ϕ 4 ϕ + ϕ 2 + ϕ 3 + ϕ 4 Ratkaistaa yhtälöryhmä, jolloi statioaariseksi tilaksi saadaa 038 ϕ 03357 0295 0266 5