Genetiikan perusteet 2009

Samankaltaiset tiedostot
Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 7: NCSS - Tilastollinen analyysi

HAVAITUT JA ODOTETUT FREKVENSSIT

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

11. laskuharjoituskierros, vko 15, ratkaisut

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Väliestimointi (jatkoa) Heliövaara 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisia peruskäsitteitä ja Monte Carlo

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

5.7 Uskottavuusfunktioon perustuvia testejä II

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Genetiikan perusteet. Tafel V Baur E. (1911) Einführung in die experimentelle Vererbungslehre. Verlag von Gebrüder Borntraeger, Berlin.

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

S Laskennallinen systeemibiologia

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

alleelipareja dominoiva dominoiva resessiivinen

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Symbioosi 2 VASTAUKSET

a. Mustan ja lyhytkarvaisen yksilön? b. Valkean ja pitkäkarvaisen yksilön? Perustele risteytyskaavion avulla.

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

10. laskuharjoituskierros, vko 14, ratkaisut

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Testejä suhdeasteikollisille muuttujille

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Testit järjestysasteikollisille muuttujille

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

2. TILASTOLLINEN TESTAAMINEN...

Perinnöllisyys. Enni Kaltiainen

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Lohkoasetelmat. Heliövaara 1

1. Tutkitaan tavallista kahden selittäjän regressiomallia

Testit laatueroasteikollisille muuttujille

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Otoskoko 107 kpl. a) 27 b) 2654

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Perinnöllisyystieteen perusteita III Perinnöllisyystieteen perusteita

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

031021P Tilastomatematiikka (5 op) viikko 5

SELVITTÄJÄN KOMPETENSSISTA

Lohkoasetelmat. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Transkriptio:

Genetiikan perusteet 2009

Malli selittää, mutta myös ennustaa ja ennusteen voi testata kokeella. Mendel testasi F 2 -mallinsa tuottamalla itsepölytyksellä F 3 -polven Seuraava sukupolvi tai toinen, riippumaton koe ovat voimakkaita testejä. Saman ilmiön havaitseminen muilla eliöillä ylentää hypoteesin teoriaksi

Malli ennustaa ja ennusteen voi testata kokeella. Yksikin koe voidaan testata tilastollisesti Muodostetaan nollahypoteesi mallin mukaan Tutkitaan, poikkeaako havaintojoukko nollahypoteesista epätavallisen paljon vai ei

Esimerkki testaamisesta: Tynkäsiipisiä punasilmäisiä kärpäsiä (vg; +/vg: +) on risteytetty normaalisiipisten ruskeasilmäisten kärpästen kanssa (+; se/+; se) ja F 1 -jälkeläiset ovat ristetyneet vapaasti keskenään. Eri työparit ovat sitten laskeneet F 2 -polven kärpäsensä niin hyvin kuin ovat osanneet. Testataan, noudattaako "yhteensä"-sarakkeen tulos mallia 9:3:3:1, joka sopii käytettäväksi, koska ensimmäisen polven heterotsygootit olivat molempien ominaisuuksien suhteen villityyppiä (siis + -alleeli dominoiva).

Fenotyyppien odotusarvot (e) yllä olevan taulukon "yhteensä" sarakkeessa ovat 9:3:3:1 mallin perusteella (9/16) x 1900 = 1068.75 (3/16) x 1900 = 356.25 (3/16) x 1900 = 356.25 (1/16) x 1900 = 118.75

Testinä käytetään χ²-testiä. Lasketaan testisuure X² = Σ[(o-e)²/e] tai G² = Σ[2 o ln(o/e)] Sitten katsotaan χ² -taulukosta raja-arvot. Luokkia on neljä, joten ns. vapausasteita on kolme. Saamamme X² testisuure 26.09 on paljon suurempi kuin rajaarvo 16.266, jota suuremman mallia noudattava jakautuma sattumalta saa harvemmin kuin kerran tuhannesta (P < 0.001).

riskitaso Ranta, Rita, Kouki: Biometria

Testi siis osoitti, että tulos poikkeaa erittäin merkitsevästi 9:3:3:1 mallin mukaisesta ennusteesta (nollahypoteesista) (P < 0.001) Tarkoittaako se sitä, että Mendel olisikin väärässä? No ei. Se voi tarkoittaa sitä, että mutanttien elinkyky on heikompi kuin heterotsygoottien ja villien homotsygoottien elinkyky

Jokaisen työparin tulos on testattu myös erikseen. Joillakin tulos poikkeaa odotetusta hyvin vähän (odotusarvoja ei ole esitetty), joillakin paljon. Pullot ovat erilaisia, saalis vaihtelee Jos kaikkien poikkeama olisi samansuuntainen, olisi testisuureiden summa (78.5) = summataulukon testisuure (X 2 on additiivinen)

Jos kaikkien poikkeama olisi samansuuntainen, olisi testisuureiden summa (78.5) = summataulukon testisuure (X 2 on additiivinen) Erotus 78.5-26.1 = 52.4 on suuri, ja käy homogeenisuustestistä: työparien tulokset eroavat merkitsevästi toisistaan Selitys: kärpäset liiskautuvat poropeukaloilla helpommin

χ²-jakautuman ja testin idea. Jos meillä on äärellinen näyte esimerkiksi kärpäsiä, jotka noudattavat uskollisesti 9:3:3:1 mallia, eivät todelliset luvut tietenkään ole ihan täsmälleen odotusarvojen mukaiset, vaan pelkkä satunnaisvaihtelu sysii niitä hiukan milloin mihinkin suuntaan. Pienet poikkeamat eivät vielä vakuuta ketään siitä että jotakin olisi pielessä, eli että malli (nollahypoteesi) ei pitäisi paikkaansa (ko. tapauksessa). Kuinka suuret poikkeamat sitten saavat meidät ajattelemaan, että pelkän 9:3:3:1 mallin lisäksi jokin tekijä vieroittaisi havaittua tulosta odotetusta? Tutkitaanpa asiaa simulaatiolla.

Simulaation periaate, esimerkkinä dihybridiristeytys 1) arvotaan satunnaisluku RND väliltä 0-1 2) tutkitaan sen sijoittuminen lukusuoralle: 0 1/16 4/16 7/16 16/16 1 3 3 9 3) "tehdään" virtuaalifenotyyppi : jos RND < 1/16 niin virtuaalifenotyyppi on ab jos 1/16 < RND < 4/16 niin se on Ab jos 4/16 < RND < 7/16 niin se on ab jos RND > 7/16 niin virtuaalifenotyyppi on AB 4) toistetaan, kunnes on saatu haluttu määrä yksilöitä

RANDOMIZE TIMER 10 FOR i = 1 TO 100 a = RND IF a < (1 / 16) THEN p1 = p1 + 1: GOTO 100 IF a < (4 / 16) THEN p2 = p2 + 1: GOTO 100 IF a < (7 / 16) THEN p3 = p3 + 1: GOTO 100 p4 = p4 + 1 100 NEXT i PRINT p1, p2, p3, p4 p1 = 0: p2 = 0: p3 = 0: p4 = 0 GOTO 10

ab Ab ab AB 6.25 18.75 18.75 56.25 odotettu/100 Lista: fenotyyppien lukumääriä (n= 100) erillisistä arpajaisista

Simulointiohjelma Dihybridisimulaatio arpoo dihybridiristeytystuloksia 9:3:3:1 -mallin mukaan mutta satunnaisesti ja laskee sitten testisuureen G² sekä vertaa sitäχ² -taulukon raja-arvoihin Menettelyä sanotaan (stokastiseksi) simulaatioksi

G² = Σ[2 o ln(o/e)] Dihybridisimulaatio Dihybridiristeytyksen testin testilomake

Tuhat virtuaalikoetta (ja vajaata sekuntia) myöhemmin: G-arvojen jakauma G² = Σ[2 o ln(o/e)] Perinteiset Khi-neliöjakauman raja-arvot Havaitut raja-arvojen ylitykset (/ 1000) Dihybridisimulaatio

Voit tutkia näytekoon vaikutusta testitulokseen. Juju onkin siinä, että testi standardoi erikokoiset kokeet samaan asteikkoon! Ajonappula pyyhkii myös taulun Dihybridisimulaatio

Dihybridisimulaatio