13.11. Tulosten arviointi. tulosten arviointi. voimmeko luottaa saamiimme tuloksiin?

Samankaltaiset tiedostot
Fylogeneettiset puut. Fylogeneettiset puut. UPGMA: esimerkki 2/2 UPGMA

Molekyylisystematiikka 1.osa

5.1 Semanttisten puiden muodostaminen

Johdatus graafiteoriaan

Algoritmit 1. Luento 13 Ti Timo Männikkö

58131 Tietorakenteet ja algoritmit (syksy 2015) Toinen välikoe, malliratkaisut

Molekyylisystematiikka, 2. osa

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

Poistettavien puiden valinta laatuperustein harvennushakkuulla

Johdatus verkkoteoriaan 4. luento

Algoritmi on periaatteellisella tasolla seuraava:

Algoritmi III Vierekkäisten kuvioiden käsittely. Metsätehon tuloskalvosarja 7a/2018 LIITE 3 Timo Melkas Kirsi Riekki Metsäteho Oy

Tietorakenteet, laskuharjoitus 7, ratkaisuja

Algoritmit 1. Luento 8 Ke Timo Männikkö

A TIETORAKENTEET JA ALGORITMIT

Harjoitus 6 ( )

Algoritmi I kuvioiden ja niille johtavien ajourien erottelu. Metsätehon tuloskalvosarja 7a/2018 LIITE 1 Timo Melkas Kirsi Riekki Metsäteho Oy

Paikkatiedon käsittely 6. Kyselyn käsittely

OULUN YLIOPISTO, BIOLOGIAN LAITOS Puututkimus

811312A Tietorakenteet ja algoritmit V Verkkojen algoritmeja Osa 2 : Kruskalin ja Dijkstran algoritmit

Aasianrunkojäärä. Tilanne Vantaalla

KLAPI-ILTA PUUVILLASSA

Pienpuun paalauksen tuottavuus selville suomalais-ruotsalaisella yhteistyöllä

Harjoitus 1 ( )

Poiminta- ja pienaukkohakkuut. kaupunkimetsissä

Graafit ja verkot. Joukko solmuja ja joukko järjestämättömiä solmupareja. eli haaroja. Joukko solmuja ja joukko järjestettyjä solmupareja eli kaaria

Harjoitus 4 ( )

KASVIKUNTA kl 2016

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

SSL syysseminaari Juha Hyssälä

Viimeistely Ajourien huomiointi puutiedoissa ja lopullinen kuviointi. Metsätehon tuloskalvosarja 5/2018 LIITE 4 Timo Melkas Kirsi Riekki Metsäteho Oy

Mat Lineaarinen ohjelmointi

Korvausvastuun ennustejakauma bootstrap-menetelmän avulla

Algoritmit 1. Luento 7 Ti Timo Männikkö

Englannin lausekerakenteita ja taulukkojäsentäminen

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä

2.8. Kannanvaihto R n :ssä

Lineaarisen kokonaislukuoptimointitehtävän ratkaiseminen

(p j b (i, j) + p i b (j, i)) (p j b (i, j) + p i (1 b (i, j)) p i. tähän. Palaamme sanakirjaongelmaan vielä tasoitetun analyysin yhteydessä.

V. V. Vazirani: Approximation Algorithms, luvut 3-4 Matti Kääriäinen

v 8 v 9 v 5 C v 3 v 4

Laskennan vaativuus ja NP-täydelliset ongelmat

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari

Stabiloivat synkronoijat ja nimeäminen

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Miten käytän tulisijaa oikein - lämmitysohjeita

Matriisilaskenta Luento 12: Vektoriavaruuden kannan olemassaolo

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali

4.5 Kaksivaiheinen menetelmä simplex algoritmin alustukseen

Algoritmit 2. Luento 11 Ti Timo Männikkö

1. asukasinfo aiheesta Pro Westend ry toimitti saadun asukaspalautteen pohjalta 6/2014 kaupungille

Lineaariset kongruenssiyhtälöryhmät

Algoritmit 1. Luento 13 Ma Timo Männikkö

AVL-puut. eräs tapa tasapainottaa binäärihakupuu siten, että korkeus on O(log n) kun puussa on n avainta

10. Painotetut graafit

Tehtävän V.1 ratkaisuehdotus Tietorakenteet, syksy 2003

Tehokas ja ympäristöystävällinen tulisijalämmitys käytännön ohjeita

Determinantti. Määritelmä

Evoluutio ja luominen. Mian tekemä esitys Jannen esittämänä

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä

LIITO-ORAVASELVITYS VAMMALAN KUKKURISSA

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Harjoitus 6 ( )

Kymmenen vuotta maastolaserkeilaustutkimusta käytännön kokemuksia

Koskenkylän päiväkoti Vanha Viipurintie 2, Koskenkylä

Neliömatriisin adjungaatti, L24

Diskreetit rakenteet

2.5 Liikeyhtälö F 3 F 1 F 2

Kandidaatintyön esittely: Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu

Lahopuu ja tekopökkelöt: vaikutukset lahopuukovakuoriaislajistoon. Juha Siitonen, Harri Lappalainen. Metsäntutkimuslaitos, Vantaan toimintayksikkö

Jäsenyysverkostot Kytkökset ja limittyneet aliryhmät sosiaalisten verkostojen analyysissä

(a) L on listan tunnussolmu, joten se ei voi olla null. Algoritmi lisäämiselle loppuun:

Algoritmit 2. Luento 4 Ke Timo Männikkö

Malliratkaisut Demot

Kognitiivinen mallintaminen 1

Matriisit ja vektorit Matriisin käsite Matriisialgebra. Olkoon A = , B = Laske A + B, , 1 3 3

Tietorakenteet ja algoritmit

1 Tieteellinen esitystapa, yksiköt ja dimensiot

Mat Lineaarinen ohjelmointi

Hakusuosikit. Unifaun Online

Malliratkaisut Demot

Mat Lineaarinen ohjelmointi

811312A Tietorakenteet ja algoritmit, VI Algoritmien suunnitteluparadigmoja

811312A Tietorakenteet ja algoritmit Kertausta jälkiosasta

Perusnäkymä yksisuuntaiseen ANOVAaan

Ohjelmoinnin peruskurssi Y1

Suhteellisia osuuksia ilmaistaessa käytetään prosenttilukujen ohella myös murtolukuja.

Teknillinen korkeakoulu T Tietojenkäsittelyopin ohjelmatyö. Testitapaukset - Koordinaattieditori

Determinantti. Määritelmä

TEKIJÄNOIKEUSNEUVOSTO LAUSUNTO 2016:2

58131 Tietorakenteet ja algoritmit Uusinta- ja erilliskoe ratkaisuja (Jyrki Kivinen)

Metsätuholakiesitys ja monimuotoisuus

monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.

Tohtoriohjelman käytänteet vanhaa, uutta, lainattua ja itse keksittyä. OHA-forum Oulun yliopistossa Suunnittelija Sirje Liukko

Algoritmit 2. Luento 12 Ke Timo Männikkö

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

KÄYTTÖOHJE ILMAVERHOT vesilämmitys R 515 MAN. / AUT.

"Voiko olla elämää ilman metsiä?" Vuorenmäen koulun 1a luokan ja 1-2 d luokkien ilmiöpohjainen oppimiskokonaisuus Kevät 2015

7.4 Variability management

Transkriptio:

13.11. tulosten arviointi Tulosten arviointi voimmeko luottaa saamiimme tuloksiin? onko osa saaduista tuloksista sattumanvaraisia? mitkä OSAT puusta ovat luotettavimpia? 1

KONSENSUSDIAGRAMMI Useita yhtä pitkiä puita E B D C A F yhtä yksinkertaisia hypoteeseja eli täsmälleen sama määrä muutoksia ominaisuuksien ilmenemismuotojen välillä E B D C A F Konsensuspuu E B D C A F resoluution katoaminen konsensuspuussa on osoitus aineistossa ilmenevästä ristiriidasta 2

Tulosten arviointi tukiarvot (support) 3 yleisesti käytettyä menetelmää: Bremer (branch) support Bootstrap Parsimonia jackknifing 0 1 2 3 4 5 6 7 8 9 A 0 0 0 0 0 0 0 0 0 0 B 1 0 1 1 1 1 1 1 1 1 C 1 0 1 1 1 1 1 1 1 1 D 1 1 0 0 0 0 1 1 1 1 E 1 1 0 0 0 0 1 1 1 1 F 1 1 0 0 0 0 0 0 0 0 G 1 0 1 1 1 1 0 0 0 0 3

A D E F G B C alunperin hypoteesien luotettavuutta arvioitiin puhtaasti ominaisuuksien ilmenemismuotojen välisten muutosten MÄÄRÄN mukaan pituus 14 evolutiivista muutosta lyhin puu A D E F G B C 15 evolutiivista muutosta konsensus puista joiden pituus < 15 4

huolimatta SUURISTA eroista monofyleettisten ryhmien synapomorfioissa KAIKKI niistä katoavat konsensuspuussa joka perustuu puihin joiden pituus < 15 A D E F G B C Goodman, M. ym. 1982. New perspectives in the molecular biological analysis of mammalian phylogeny. Acta Zoologica Fennica 169: 19-35. Goodman- lahoindeksi (decay index) Bremer, K. 1988. The limits of amino acid sequence data in angiosperm phylogenetic reconstruction. Evolution 42: 795-803. 1. etsitään lyhin puu 2. konsensus tällöin katoaville ryhmille = 0 3. uusi haku jossa etsitään puita joiden pituus L < L+1 (L = edellä löydetyn lyhimmän puun pituus), konsensus näistä näille = 1 4. jatketaan kunnes konsensuksesta on kadonnut kaikki resoluutio (jäljellä pelkkä polytomia) 5

algoritmit yksinkertaisia, eivät palaa takaisinpäin ohjelmissa mahdollista antaa lisäkäsky niin, että välimuistiin tallentuu lyhimmmän puun lisäksi myös 1, 2, 3 jne. evolutiivista muutosta PIDEMMÄT puut mitä korkeampi on sitä todennäköisempää on, että osa ns. puuavaruudesta jää tarkastelun ulkopuolelle L+3 t TODELLISIA suurempia upper bound L+2 L+1 6

A B G D E C F 8 1 3 5 28 A B G D E C F 1 A B G D E C F 29 33 A B G D E C F A B G D E C F 31 36 A B G D E C F 8 5 3 1 1 18 koko puulle 7

voidaan laskea myös yksittäisille puun osille rajatun (constraint) haun avulla tämä tehdään etsimällä lyhintä puuta sellaista rajoitepuuta käyttäen joka sisältää vain ryhmän jonka tukiarvo halutaan laskea rajoitepuu on muuten vailla resoluutiota etsitään sellaista lyhintä puuta joka on RISTIRIIDASSA rajoitepuun kanssa ryhmän tukiarvo on aiemmin löydetyn lyhimmän puun ja rajoitetta käyttäen löydetyn lyhimmän puun pituuksien välinen erotus A B G D E C F 8

Relative Fit Difference RFD = Goloboff, P. & Farris, J.S. ym. 2001. Methods for quick consensus estimation. Cladistics 17: S26-S34. F - C F 0 < R < 1 F = tarkasteltavan ryhmän synapomorfiat C = em. ryhmän kanssa RISTIRIIDASSA olevien ryhmittelyjen synapomorfiat pystytään erottelemaan toisistaan ominaisuuksia, joilla sama Bremer-tukiarvo esim. F = 5, C = 0 vs. F= 100, C= 95 sama RFD arvot 1 & 0,053 Tulosten arviointi 3 yleisesti käytettyä menetelmää: Bootstrap Parsimonia jackknifing 9

Efron, B. 1979. Bootstrap methods: another look at the jackknife. Ann. Stat. 7: 1-26. Felsenstein, J. 1985. Confidence limits on phylogenies: an approach using the bootstrap. Evolution 39: 783-791. ominaisuudet! 0 1 2 3 4 5 6 7 8 9! takson. A 0 0 0 0 0 1 0 0 1 0! B 1 1 0 0 0 0 0 0 0 0! C 1 1 1 1 1 1 1 2 0 1! D 1 1 1 1 0 1 1 2 0 1! E 1 1 0 0 1 0 1 1 1 0! ominaisuudet! 7 8 3 7 4 5 3 0 1 9! takson. A 0 0 0 0 0 1 0 0 1 0! B 0 1 0 0 0 0 0 0 0 0! C 2 1 1 1 1 1 1 2 0 1! D 2 1 1 1 0 1 1 2 0 1! E 1 1 0 0 1 0 1 1 1 0! A B C D E tehdään uusi alkuperäisen kokoinen matriisi otanta takaisinpanolla (osa alkuperäisistä ominaisuuksista tulee mukaan useita kertoja, osa jää kokonaan ulkopuolelle!) A B C D E BOOTSTRAP A B C D E 97% 52% 87% Kitching, I.J. ym. 1998. Cladistics. 2. painos. 228 s. Oxford University Press toistetaan useita kertoja(100-10 000 x) tulokset yhdistetään enemmistökompromissipuuksi haittana: autapomorfiat, ominaisuudet joissa ei vaihtelua vaikuttavat lopputulokseen 10

Tulosten arviointi 3 yleisesti käytettyä menetelmää: Quenoille, Bootstrap M.H. 1949. Approximate tests of correlation in time-series. J. R. Statist. Soc. B 11: 68-84. Parsimonia jackknifing Farris, J.S. ym. 1996. Parsimony jackknifing outperforms neighbor-joining. Cladistics 12: 99-124. ominaisuudet! 0 1 2 3 4 5 6 7 8 9! takson. A 0 0 0 0 0 1 0 0 1 0! B 1 1 0 0 0 0 0 0 0 0! C 1 1 1 1 1 1 1 2 0 1! D 1 1 1 1 0 1 1 2 0 1! E 1 1 0 0 1 0 1 1 1 0! ominaisuudet! 0 1 3 4 7 8 9! takson. A 0 0 0 0 0 1 0! B 1 1 0 0 0 0 0! C 1 1 1 1 2 0 1! D 1 1 1 0 2 0 1! E 1 1 0 1 1 1 0! toistetaan useita kertoja(100-10 000 x) A B C D E tehdään uusi matriisi mutta niin, että otetaan mukaan vain OSA alkuperäisistä ominaisuuksista todennäköisyys sille, että ominaisuus jää otannan ulkopuolelle 1/e (~37%) A B C D E A B C D E PARSIMONY JACKKNIFING 97% 87% 52% tulokset yhdistetään enemmistökompromissipuuksi 11

Tulosten arviointi kuinka helposti optimaalinen puu muuttuu jos/kun lisäämme matriisiin uusia ominaisuuksia eli saamme lisää informaatiota? kaikki em. lukuarvot ovat EPÄSUORIA tapoja tämän arvioimiseksi emme voi tietää vastausta em. kysymykseen ETUKÄTEEN ko. ominaisuudet ovat MAHDOLLISESTI ristiriidassa toistaiseksi hyväksyttyjen hypoteesien kanssa KAIKKI tukiarvot antavat monissa tapauksissa samankaltaisen tuloksen, samat taksonien ryhmät tulevat esiin Tulosten arviointi GO AND GET MORE DATA vain aidosti UUSIEN ominaisuuksien avulla voimme selvittää muuttuvatko aiemmin esitetyt hypoteesit Grant, T. & Kluge, A.G. 2003. Data exploration in phylogenetic inference: scientific, heuristic, or neither. Cladistics 19: 379-418. 12

Tulosten arviointi 1 2 3 4 5 6 7 8 9 10 11 12 OG 0 0 0 0 0 0 0 0 0 0 1 0 A 1 0 0 0 1 1 0 0 0 1 1 0 B 1 0 0 1 0 0 0 0 0 1 2 1 C 0 0 0 0 0 0 0 0 1 1 1 2 D 0 1 1 0 0 0 1 1 0 1 0 1 E 0 1 1 1 0 0 0 1 0 1 0 1 uusi analyysi muuttuiko tulos? jos muuttui, miltä osin? YHTEENVETO 3 yleisesti käytettyä tapaa puiden luotettavuuden arviointiin KAIKKIA näistä käytetään yleisesti mutta niiden merkitys on edelleen kiistanalainen ainakin niiden avulla voidaan tuoda esiin ne osat hypoteesista jotka ovat HEIKOIMPIA eli mahdollisesti uuden tiedon myötä helpoimmin kumottavissa hyviä tarkemman tutkimuksen kohteita! 13