S-4.50 Lsknnllinn systmiiologi 4. Hrjoitus. Viill tutkittvll ljill (,, c, j ) on määrätty täisyyt c 0 8 8 8 0 8 8 8 c 0 4 4 0 0 Määritä puurknn käyttän UPGMA-mntlmää. Näytä kunkin vihn osrkntt vstvin täisyyksinn. Rtkisu: Algoritmin nsimmäinn kirros loittn tsimällä täisyystulukost lyhin khn yksikön välinn täisyys. Jos löytyy usmpi vihtohtoj, vlitn niistä stunnissti jokin. Tulukost c 0 8 8 8 0 8 8 8 c 0 4 4 0 0 nähään, ttä lyhin täisyys on yksiköin j välillä, min = ist(, ) =. Yhisttään nämä yhtisksi solmuksi ; täisyys :st kumpnkin solmuun, on puoliks solmujn täisyystä. Sn siis survnlinn rknn:
Survksi lsktn yhisttyn solmun täisyyt muihin yksiköihin. Etäisyyt lsktn yksinkrtissti kskirvoin: ist(, c) = ist(, ) = ist(, ) = ist(, c) + ist(, c) ist(, ) + ist(, ) ist(, ) + ist(, ) Muoosttn täisyyksistä uusi täisyystulukko: c 0 8 8 8 c 0 4 4 0 0 j loittn lgoritmin kirros lust. Vlitn jälln pinin täisyys, tällä krt min = ist(, ) =. Yhisttään j : Lsktn jälln uut täisyyt ist(, ) = ist(, ) + ist(, )
ist(, c) = ist(, c) + ist(, c) = 4 + 4 = 4, j sijoittn n täisyystulukkoon: c 0 8 8 c 0 4 0 Nyt pinin täisyys on min = ist(, c) = 4. Yhisttään j c, sn surv tilnn: c c c c Lsktn khn jäljllä olvn solmun välinn täisyys ist(c, ) = jolloin khn solmun välinn täisyys tunntn: ist(, ) + ist(c, ) c 0 8 c 0, Nyt voin määrittää lopullisn puun muoto täisyyksinn: 3
4 c 4 c 3 4 c c 4
. HMM λ on määritlty survin prmtrin: mlliss on kolm til S, S, S 3, hvintokkosto A = {,, 3}, siirtymätonnäköisyysmtriisi 0 / / P = 0 0, 0 0 lkutilvktori π = [ 0 0] T skä hvintojn tonnäköisyyt () = / () = / (3) = 0 () = / () = 0 (3) = / 3 () = 0 3 () = / 3 (3) = / Määritä hvitull skvnssill O kikki mhollist tilskvnssit skä hvitun skvnssin tonnäköisyys p(o λ). ) O =,, 3 ) O =, 3,. Rtkisu: Mlli voin kuvt grfissti hlposti survll tvll: / / S p() = ½ p() = ½ p(3) = 0 S p() = ½ p() = 0 p(3) = ½ S 3 p() = 0 p() = ½ p(3) = ½ ) Alkutilvktorist nähään, ttä loitus tphtuu in tilst S. Siirtymätonnäköisyysmtriisist puolstn huomtn, ttä tilst S voin siirtyä tonnäköisyyllä / joko tiln S ti S 3. Tässä vihss mhollist ritit ovt siis S, S j S, S 3. Tilss S on kuitnkin tonnäköisyys 0 mittoi hvittu, jotn ino mhollinn tilskvnssi, jok tuottisi hvinnot, on S, S 3. Tilst S 3 siirrytään tonnäköisyyllä tiln S, joss on mhollist mittoi viiminn hvinto 3. Tällä prustll ino mhollinn tilskvnssi on S, S 3, S. 5
Nyt voin lsk siis hvintojn tonnäköisyys: p(o λ) = (π(s ) ()) ( P S S 3 3 () ) ( P S3 S (3) ) = ( /)(/ /)( /) = /6 ) Jälln loitustil on S. Tkisin smn tiln i voi siirtyä, jotn mhollist siirtymäkohtt ovt S j S 3. Huomtn, ttä molmmt tilt voivt mittoi hvinnon 3. Tässä vihss on siis kksi mhollist rittiä, S, S j S, S 3. Tilst S siirrytään tonnäköisyyllä tkisin tiln S, joss voin kuin voinkin mittoi viiminn hvinto,. Ritti S, S, S voi siis tuott hvinnot. Tilst S 3 siirrytään tonnäköisyyllä tiln S, joss voin myös mittoi viiminn hvinto. Ritti S, S 3, S voi siis myös tuott hvintosrjn. Tonnäköisyys hvintosrjll sn lskmll yhtn tonnäköisyyt kikill mhollisill tvoill tuott hvinnot. Tällöin tuloksksi sn p(o λ) = (π(s ) ()) ( P S S (3) ) ( P S S () ) + (π(s ) ()) ( P S S 3 3 (3) ) ( P S3 S () ) = ( /)(/ /)( /) + ( /)(/ /)( /) = /6 + /6 = /8. Tällisn hvintosrjn tkminn on siis kksi krt tonnäköismpää kuin )-kohn hvintojn. Tämä on titnkin ootttviss, sillä smnlist hvinnot voivt tull khst ritistä, jotk tonnäköisyyltään vstvt )-kohn polku. 3. Tutkitn viittä minohpposkvnssiä WRCCTGC, WCCGGCC, WCGCC, WCCCGCC, WCCGC. Käyttään HMM-protiinimlli (pituus 8), jolloin Vitri-lgoritmi tuott survt tonnäköisimmät polut: m 0 m i m m 3 m 4 m 5 6 m 7 m 8 m 0 m m m 3 m 4 m 5 m 6 m 7 m 8 m 0 m m 3 4 m 5 m 6 m 7 m 8 m 0 m m m 3 m 4 m 5 m 6 m 7 m 8 m 0 m m m 3 4 m 5 6 m 7 m 8 Määritä Vitri-lgoritmin tulostn prustll linjus nntuill skvnssill. 6
Rtkisu: Vitri-lgoritmin tuloksist muoosttn linjus survsti. Polun nsimmäinn til m 0 on loitustil j m 8 loptustil, jotn n ivät vst minohppoj. Jokinn polun mtch- j insrt-til vst yhtä minohppo, jotn nnttu skvnssi sijoittn optimlisn polun mukissti ri tiloill: m j i -tilt svt linjuksn minohpon j -tilt ukon knss. Esimrkiksi nsimmäinn skvnssi: m 0 m i m m 3 m 4 m 5 6 m 7 m 8 W R C C T G C Sm totuttn myös muill skvnssill. Linjus sn linjmll jokisst skvnssistä vstvt mtch-tilt (ti mtch-tiln puuttuss vstv lt-til) ksknään. Lopult linjuksn sn WRCCTG-C W-CCGGCC W-C--GCC W-CCCGCC W-CC-G-C 7