13.11. Tulosten arviointi. tulosten arviointi. voimmeko luottaa saamiimme tuloksiin?

13.11. tulosten arviointi Tulosten arviointi voimmeko luottaa saamiimme tuloksiin? onko osa saaduista tuloksista sattumanvaraisia? mitkä OSAT puusta ovat luotettavimpia? 1

KONSENSUSDIAGRAMMI Useita yhtä pitkiä puita E B D C A F yhtä yksinkertaisia hypoteeseja eli täsmälleen sama määrä muutoksia ominaisuuksien ilmenemismuotojen välillä E B D C A F Konsensuspuu E B D C A F resoluution katoaminen konsensuspuussa on osoitus aineistossa ilmenevästä ristiriidasta 2

Tulosten arviointi tukiarvot (support) 3 yleisesti käytettyä menetelmää: Bremer (branch) support Bootstrap Parsimonia jackknifing 0 1 2 3 4 5 6 7 8 9 A 0 0 0 0 0 0 0 0 0 0 B 1 0 1 1 1 1 1 1 1 1 C 1 0 1 1 1 1 1 1 1 1 D 1 1 0 0 0 0 1 1 1 1 E 1 1 0 0 0 0 1 1 1 1 F 1 1 0 0 0 0 0 0 0 0 G 1 0 1 1 1 1 0 0 0 0 3

A D E F G B C alunperin hypoteesien luotettavuutta arvioitiin puhtaasti ominaisuuksien ilmenemismuotojen välisten muutosten MÄÄRÄN mukaan pituus 14 evolutiivista muutosta lyhin puu A D E F G B C 15 evolutiivista muutosta konsensus puista joiden pituus < 15 4

huolimatta SUURISTA eroista monofyleettisten ryhmien synapomorfioissa KAIKKI niistä katoavat konsensuspuussa joka perustuu puihin joiden pituus < 15 A D E F G B C Goodman, M. ym. 1982. New perspectives in the molecular biological analysis of mammalian phylogeny. Acta Zoologica Fennica 169: 19-35. Goodman- lahoindeksi (decay index) Bremer, K. 1988. The limits of amino acid sequence data in angiosperm phylogenetic reconstruction. Evolution 42: 795-803. 1. etsitään lyhin puu 2. konsensus tällöin katoaville ryhmille = 0 3. uusi haku jossa etsitään puita joiden pituus L < L+1 (L = edellä löydetyn lyhimmän puun pituus), konsensus näistä näille = 1 4. jatketaan kunnes konsensuksesta on kadonnut kaikki resoluutio (jäljellä pelkkä polytomia) 5

algoritmit yksinkertaisia, eivät palaa takaisinpäin ohjelmissa mahdollista antaa lisäkäsky niin, että välimuistiin tallentuu lyhimmmän puun lisäksi myös 1, 2, 3 jne. evolutiivista muutosta PIDEMMÄT puut mitä korkeampi on sitä todennäköisempää on, että osa ns. puuavaruudesta jää tarkastelun ulkopuolelle L+3 t TODELLISIA suurempia upper bound L+2 L+1 6

A B G D E C F 8 1 3 5 28 A B G D E C F 1 A B G D E C F 29 33 A B G D E C F A B G D E C F 31 36 A B G D E C F 8 5 3 1 1 18 koko puulle 7

voidaan laskea myös yksittäisille puun osille rajatun (constraint) haun avulla tämä tehdään etsimällä lyhintä puuta sellaista rajoitepuuta käyttäen joka sisältää vain ryhmän jonka tukiarvo halutaan laskea rajoitepuu on muuten vailla resoluutiota etsitään sellaista lyhintä puuta joka on RISTIRIIDASSA rajoitepuun kanssa ryhmän tukiarvo on aiemmin löydetyn lyhimmän puun ja rajoitetta käyttäen löydetyn lyhimmän puun pituuksien välinen erotus A B G D E C F 8

Relative Fit Difference RFD = Goloboff, P. & Farris, J.S. ym. 2001. Methods for quick consensus estimation. Cladistics 17: S26-S34. F - C F 0 < R < 1 F = tarkasteltavan ryhmän synapomorfiat C = em. ryhmän kanssa RISTIRIIDASSA olevien ryhmittelyjen synapomorfiat pystytään erottelemaan toisistaan ominaisuuksia, joilla sama Bremer-tukiarvo esim. F = 5, C = 0 vs. F= 100, C= 95 sama RFD arvot 1 & 0,053 Tulosten arviointi 3 yleisesti käytettyä menetelmää: Bootstrap Parsimonia jackknifing 9

Efron, B. 1979. Bootstrap methods: another look at the jackknife. Ann. Stat. 7: 1-26. Felsenstein, J. 1985. Confidence limits on phylogenies: an approach using the bootstrap. Evolution 39: 783-791. ominaisuudet! 0 1 2 3 4 5 6 7 8 9! takson. A 0 0 0 0 0 1 0 0 1 0! B 1 1 0 0 0 0 0 0 0 0! C 1 1 1 1 1 1 1 2 0 1! D 1 1 1 1 0 1 1 2 0 1! E 1 1 0 0 1 0 1 1 1 0! ominaisuudet! 7 8 3 7 4 5 3 0 1 9! takson. A 0 0 0 0 0 1 0 0 1 0! B 0 1 0 0 0 0 0 0 0 0! C 2 1 1 1 1 1 1 2 0 1! D 2 1 1 1 0 1 1 2 0 1! E 1 1 0 0 1 0 1 1 1 0! A B C D E tehdään uusi alkuperäisen kokoinen matriisi otanta takaisinpanolla (osa alkuperäisistä ominaisuuksista tulee mukaan useita kertoja, osa jää kokonaan ulkopuolelle!) A B C D E BOOTSTRAP A B C D E 97% 52% 87% Kitching, I.J. ym. 1998. Cladistics. 2. painos. 228 s. Oxford University Press toistetaan useita kertoja(100-10 000 x) tulokset yhdistetään enemmistökompromissipuuksi haittana: autapomorfiat, ominaisuudet joissa ei vaihtelua vaikuttavat lopputulokseen 10

Tulosten arviointi 3 yleisesti käytettyä menetelmää: Quenoille, Bootstrap M.H. 1949. Approximate tests of correlation in time-series. J. R. Statist. Soc. B 11: 68-84. Parsimonia jackknifing Farris, J.S. ym. 1996. Parsimony jackknifing outperforms neighbor-joining. Cladistics 12: 99-124. ominaisuudet! 0 1 2 3 4 5 6 7 8 9! takson. A 0 0 0 0 0 1 0 0 1 0! B 1 1 0 0 0 0 0 0 0 0! C 1 1 1 1 1 1 1 2 0 1! D 1 1 1 1 0 1 1 2 0 1! E 1 1 0 0 1 0 1 1 1 0! ominaisuudet! 0 1 3 4 7 8 9! takson. A 0 0 0 0 0 1 0! B 1 1 0 0 0 0 0! C 1 1 1 1 2 0 1! D 1 1 1 0 2 0 1! E 1 1 0 1 1 1 0! toistetaan useita kertoja(100-10 000 x) A B C D E tehdään uusi matriisi mutta niin, että otetaan mukaan vain OSA alkuperäisistä ominaisuuksista todennäköisyys sille, että ominaisuus jää otannan ulkopuolelle 1/e (~37%) A B C D E A B C D E PARSIMONY JACKKNIFING 97% 87% 52% tulokset yhdistetään enemmistökompromissipuuksi 11

Tulosten arviointi kuinka helposti optimaalinen puu muuttuu jos/kun lisäämme matriisiin uusia ominaisuuksia eli saamme lisää informaatiota? kaikki em. lukuarvot ovat EPÄSUORIA tapoja tämän arvioimiseksi emme voi tietää vastausta em. kysymykseen ETUKÄTEEN ko. ominaisuudet ovat MAHDOLLISESTI ristiriidassa toistaiseksi hyväksyttyjen hypoteesien kanssa KAIKKI tukiarvot antavat monissa tapauksissa samankaltaisen tuloksen, samat taksonien ryhmät tulevat esiin Tulosten arviointi GO AND GET MORE DATA vain aidosti UUSIEN ominaisuuksien avulla voimme selvittää muuttuvatko aiemmin esitetyt hypoteesit Grant, T. & Kluge, A.G. 2003. Data exploration in phylogenetic inference: scientific, heuristic, or neither. Cladistics 19: 379-418. 12

Tulosten arviointi 1 2 3 4 5 6 7 8 9 10 11 12 OG 0 0 0 0 0 0 0 0 0 0 1 0 A 1 0 0 0 1 1 0 0 0 1 1 0 B 1 0 0 1 0 0 0 0 0 1 2 1 C 0 0 0 0 0 0 0 0 1 1 1 2 D 0 1 1 0 0 0 1 1 0 1 0 1 E 0 1 1 1 0 0 0 1 0 1 0 1 uusi analyysi muuttuiko tulos? jos muuttui, miltä osin? YHTEENVETO 3 yleisesti käytettyä tapaa puiden luotettavuuden arviointiin KAIKKIA näistä käytetään yleisesti mutta niiden merkitys on edelleen kiistanalainen ainakin niiden avulla voidaan tuoda esiin ne osat hypoteesista jotka ovat HEIKOIMPIA eli mahdollisesti uuden tiedon myötä helpoimmin kumottavissa hyviä tarkemman tutkimuksen kohteita! 13