52746 Geneettinen analyysi

Samankaltaiset tiedostot
52746 Geneettinen analyysi

S Laskennallinen systeemibiologia

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

Todennäköisyys (englanniksi probability)

TODENNÄKÖISYYS JA TILASTOT MAA6 KERTAUS

Varma tapahtuma, Yhdiste, Yhdistetty tapahtuma, Yhteenlaskusääntö

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

30A02000 Tilastotieteen perusteet

1. Kuinka monella tavalla joukon kaikki alkiot voidaan järjestää jonoksi? Tähän antaa vastauksen: tuloperiaate ja permutaatio

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Mat Sovellettu todennäköisyyslasku A

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin Yliopisto Harjoitus 1, ratkaisuehdotukset

9 Yhteenlaskusääntö ja komplementtitapahtuma

031021P Tilastomatematiikka (5 op)

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslasku A

Tuloperiaate. Oletetaan, että eräs valintaprosessi voidaan jakaa peräkkäisiin vaiheisiin, joita on k kappaletta

(x, y) 2. heiton tulos y

dx=2&uilang=fi&lang=fi&lvv=2015

alleelipareja dominoiva dominoiva resessiivinen

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Peittyvä periytyminen. Potilasopas. Kuvat: Rebecca J Kent rebecca@rebeccajkent.com

ABHELSINKI UNIVERSITY OF TECHNOLOGY

&idx=2&uilang=fi&lang=fi&lvv=2015

Perinnöllisyyden perusteita

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

1. laskuharjoituskierros, vko 4, ratkaisut

Todennäköisyys. Antoine Gombaud, eli chevalier de Méré?.? Kirjailija ja matemaatikko

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Perinnöllisyyden perusteita

Osa 1: Todennäköisyys ja sen laskusäännöt. Kokonaistodennäköisyyden ja Bayesin kaavat

1. Matkalla todennäköisyyteen

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3.7 Todennäköisyysjakaumia

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

&idx=2&uilang=fi&lang=fi&lvv=2015

X-kromosominen periytyminen. Potilasopas. TYKS Perinnöllisyyspoliklinikka PL 52, Turku puh (02) faksi (02)

Symbioosi 2 VASTAUKSET

Miten geenit elelevät populaatioissa, vieläpä pitkiä aikoja?

JOHDATUS TEKOÄLYYN LUENTO 4.

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

a. Mustan ja lyhytkarvaisen yksilön? b. Valkean ja pitkäkarvaisen yksilön? Perustele risteytyskaavion avulla.

Matematiikan tukikurssi, kurssikerta 3

031021P Tilastomatematiikka (5 op)

2. laskuharjoituskierros, vko 5, ratkaisut

Approbatur 3, demo 1, ratkaisut A sanoo: Vähintään yksi meistä on retku. Tehtävänä on päätellä, mitä tyyppiä A ja B ovat.

7 Vapaus. 7.1 Vapauden määritelmä

b) Määritä myös seuraavat joukot ja anna kussakin tapauksessa lyhyt sanallinen perustelu.

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

1. Tässä tehtävässä päätellään kaksilapsisen perheen lapsiin liittyviä todennäköisyyksiä.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

6. laskuharjoitusten vastaukset (viikot 10 11)

Osa 1: Todennäköisyys ja sen laskusäännöt

Geneettinen analyysi. Tilastotieteen kertausta

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Todennäköisyyslaskenta 1/7 Sisältö ESITIEDOT: joukko-oppi, lukumäärän laskeminen, funktiokäsite Hakemisto

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus Mitkä todennäköisyystulkinnat sopivat seuraaviin väitteisiin?

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Joukot. Georg Cantor ( )

B. Siten A B, jos ja vain jos x A x

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

Vastauksia. Topologia Syksy 2010 Harjoitus 1

Jatkuvat satunnaismuuttujat

Johdatus todennäköisyyslaskentaan Todennäköisyyslaskenta ja puudiagrammit. TKK (c) Ilkka Mellin (2005) 1

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

Todennäköisyyslaskenta I

Otanta ilman takaisinpanoa

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Ilkka Mellin Todennäköisyyslaskenta Osa 1: Todennäköisyys ja sen laskusäännöt Verkot ja todennäköisyyslaskenta

Todennäköisyyslaskenta ja puudiagrammit. Todennäköisyyslaskenta ja puudiagrammit. Todennäköisyyslaskenta ja puudiagrammit: Esitiedot

Todennäköisyyden ominaisuuksia

Kymmenen kärjessä mitkä ovat suomalaisten yleisimmät perinnölliset sairaudet?

vkp 4*(1+0)/(32-3)-1= vkp 2*(1+0)/(32-3)=

1. Osoita, että joukon X osajoukoille A ja B on voimassa toinen ns. de Morganin laki (A B) = A B.

Liite 2: Verkot ja todennäköisyyslaskenta. Todennäköisyyslaskenta ja puudiagrammit

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy Tehtävissä 1, 2, ja 3 tarkastelemme seuraavaa tilannetta:

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Symbioosi 2 VASTAUKSET. b. Millaisia sukusoluja vanhemmat tuottavat (4 erilaista)? Vastaus: VL, vl, Vl, vl

III Perinnöllisyystieteen perusteita

Perinnöllisyys. Enni Kaltiainen

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

4. laskuharjoituskierros, vko 7, ratkaisut

Todennäköisyyslaskenta I. Ville Hyvönen

7 TODENNÄKÖISYYSLASKENTAA

811120P Diskreetit rakenteet

Kaikki kurssin laskuharjoitukset pidetään Exactumin salissa C123. Malliratkaisut tulevat nettiin kurssisivulle.

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden peruslaskusäännöt

Vallitseva periytyminen. Potilasopas. Kuvat: Rebecca J Kent rebecca@rebeccajkent.com

Transkriptio:

52746 Geneettinen analyysi Kaikille yhteiset luennot (3 kpl) Maanantai 3.2. Klo 10.15-12 Biokeskus 2 auditorio 1041 Todennäköisyyslaskennan kertaus, merkitys perinnöllisyystieteessä! Keskiviikko 5.2. Tilastotiede perinnöllisyystieteessä Perjantai 7.2. Tilastollinen testaaminen, Geneettisen analyysin moderneja sovelluksia

Kurssin kotisivut http://ekhidna.biocenter.helsinki.fi/users/petri/public/opetus_jutut/genet_ analyysi/genetanalyysi.html (mm. kaikki luentokalvot pyrkivät tulemaan tänne saataville ennen luentoa/harkkaa) WWW-sivu on nyt vielä vaiheessa Kurssi suoritetaan tenttimällä Tentti perustuu laskuharjoituksiin, siis laskuja! Arvostelu 1-5, 50% pisteistä ansaittava että saa arvosanan 1 Tentit: perjantaina 14.3. klo 14.00 ja 31.3. klo 14.00 (salit selvittämättä) Uusintamahdollisuus: Aika ja paikka sovittava

Ryhmä 1 Ryhmä 1 on liian täynnä. Voiko kukaan siirtyä (vapaaehtoisesti) ryhmään 2? 17.2. KLO 13-17 VIIKKI INFOKESKUS INFO SALI 4 18.2. KLO 13-17 VIIKKI BIOKESKUS 3 BIO3 LS 2402 19.2. KLO 13-17 VIIKKI BIOKESKUS 2 BIO2 LS 1015 20.2. KLO 13-17 VIIKKI BIOKESKUS 2 BIO2 LS 1015 21.2. KLO 13-17 VIIKKI INFOKESKUS INFO SALI 4 24.2. KLO 13-17 VIIKKI BIOKESKUS 2 BIO2 LS 2012 25.2. KLO 13-17 VIIKKI BIOKESKUS 3 BIO3 LS 2402

Ryhmä 2 3.3. KLO 13-17 VIIKKI BIOKESKUS 2 BIO2 LS 1015 4.3. KLO 13-17 VIIKKI BIOKESKUS 3 BIO3 LS 2402 5.3. KLO 13-17 VIIKKI BIOKESKUS 2 BIO2 LS 1015 6.3. KLO 13-17 VIIKKI BIOKESKUS 2 BIO2 LS 2012 7.3. KLO 13-17 VIIKKI BIOKESKUS 2 BIO2 LS 1015 10.3. KLO 13-17 VIIKKI BIOKESKUS 2 BIO2 LS 1015 11.3. KLO 13-17 VIIKKI BIOKESKUS 2 BIO2 LS 2012

Todennäköisyyslaskennan perusteet 1. luento Geneettinen analyysi 4.2.2013 Materiaali: Salla Ranta, Päivi Onkamo

1. Todennäköisyyslaskennan perusteet geneettisin esimerkein Todennäköisyyden käsite Todennäköisyyden periaatteita Riippumattomien tapahtumien kertolaskusääntö Ehdollinen todennäköisyys Permutaatiot ja kombinaatiot Binomitodennäköisyys Yhteistodennäköisyys (Kokonaistodennäköisyys) Bayesin teoreema

Todennäköisyyden käsite Subjektiivinen tulkinta Esimerkki 1: Ihmiset osaavat yleensä antaa mielekkään merkityksen väittämille Tänään sataa 70% todennäköisyydellä tai Tutkijat arvioivat sodan syttymistodennäköisyydeksi 15%. Edellistä väittämää kannattaa tulkita siten, että on parasta ottaa sateenvarjo mukaan. Jälkimmäisestä väitteestä voi päätellä, että sota onnistutaan ehkä välttämään. Todennäköisyyden ajatellaan tällöin kuvaavan henkilön varmuuden astetta tai uskomuksen voimakkuutta. Tämä todennäköisyystulkinta on ns. bayeslaisen koulukunnan ajatusten pohjana.

Frekventistinen tulkinta Koe toistetaan monta kertaa. Todennäköisyys kuvaa tällöin niiden tapahtumien suhteellista osuutta, joissa saavutetaan suotuisa lopputulos. Laskettavan suhteellisen osuuden ajatellaan vastaavan taustalla olevaa tarkkaa todennäköisyyttä sitä tarkemmin, mitä suurempi on toistojen lukumäärä. Tapahtuman A todennäköisyys p(a) voidaan esittää muodossa p( A) n A N missä n A on suotuisaan lopputulokseen johtaneiden toistokertojen ja N kaikkien toistokertojen lukumäärä.

Esimerkki 2: Tutkimuksessa genotyypataan 250 diploidia yksilöä (siis 500 kromosomia) erään bialleelisen lokuksen suhteen ja havaitaan, että alleeli A esiintyy 118 kromosomissa ja alleeli a 382 kromosomissa. Mikä on alleelin A esiintymistodennäköisyys sattumanvaraisesti poimitussa kromosomissa? Mikä on alleelin A absoluuttinen ja suhteellinen frekvenssi? P(A) = 118/500 = 0,236

Klassinen tulkinta Klassisessa todennäköisyystulkinnassa oletetaan, että voidaan määrittää kaikkien mahdollisten tapahtumien joukko, otosavaruus, joka koostuu keskenään yhtä todennäköisistä alkeistapauksista. Tällöin todennäköisyys kuvaa sitä, kuinka suuren osuuden tästä otosavaruudesta suotuisat tapahtumat kattavat. Tapahtuman A todennäköisyys p(a) voidaan nyt kirjoittaa p( A) n M missä n S on suotuisien alkeistapausten lukumäärä ja M kaikkien mahdollisten alkeistapausten lukumäärä. S

Esimerkki 3: Tarkastellaan silmän värin aiheuttavaa geeniä, jonka suhteen vanhemmat ovat heterotsygootteja siten, että kummallakin vanhemmalla on sekä sinisilmäisyyttä aiheuttava alleeli s että ruskeasilmäisyyttä aiheuttava alleeli R. Lisäksi tiedetään, että alleeli R dominoi. Halutaan laskea todennäköisyys sille, että pariskunnalle syntyvä lapsi on sinisilmäinen. A. Määritä alkeistapaukset. B. Mikä on suotuisien alkeistapauksien lukumäärä? C. Mikä on todennäköisyys, että lapsi on sinisilmäinen? A. Alkeistapaukset: RR, Rs, sr, ss B. Suotuisat alkeistapaukset: 1 kpl, ss C. 1/4

Todennäköisyyden periaatteita Klassisen todennäköisyyden pääperiaatteita: Tapahtuman A todennäköisyys merkitään P(A) Mille tahansa tapahtumalle A on 0 P(A) 1 (eli todennäköisyys on aina välillä 0, 1) Varman tapahtuman todennäköisyys on 1. Tapahtuman A komplementtitapahtuman A c todennäköisyys on P(A c )=1-P(A). (esim. jos punaisten hiusten todennäköisyys P(A)=0,2, niin todennäköisyys sille, että hiukset ovat muun väriset (eivät ole punaiset) on P(A c )=1-P(A)=1-0,2=0,8) komplementtia merkitään usein myös A

Toisensa poissulkevat tapahtumat Toisensa poissulkevilla tapahtumilla tarkoitetaan tapahtumia, jotka eivät voi olla samaan aikaan voimassa. Esim. Maija on sinisilmäinen ja Maija on ruskeasilmäinen Sen sijaan tapahtumat Maija on sinisilmäinen ja Maija on vasenkätinen eivät ole toisensa poissulkevia

Leikkaus Venn-diagrammein edellisestä esimerkistä: A B A B= * Symboli tarkoittaa joukkojen leikkausta Leikkauksen todennäköisyys kuvaa todennäköisyyttä sille, että molemmat tapahtumista A JA B tapahtuvat (tunnetaan myös nimellä yhteistodennäköisyys) * merkitsee tyhjää joukkoa. Toisensa poissulkevien tapahtumien leikkauksen todennäköisyys on luonnollisesti nolla. Venn-diagrammi: http://en.wikipedia.org/wiki/venn_diagram

Yhdiste Kahden tapahtuman yhdistettä merkitään A B. Yhdisteen todennäköisyys kuvaa todennäköisyyttä sille, että jompikumpi tapahtumista A TAI B tapahtuvat Todennäköisyys merkitään P(A B) Venn-diagrammeilla Yhdisteen todennäköisyys P( A B) P( A) P( B) P( A B)

Esimerkki 4: 32 prosenttia erästä perinnöllistä sairautta sairastavista kantaa mutaatiota A. Samaa tautia sairastavista ihmisistä 16 prosenttia kantaa toisessa kromosomissa sijaitsevaa mutaatiota B. Sairaista henkilöistä 10 prosenttia kantaa molempia mutaatioita. Millä todennäköisyydellä umpimähkäisesti valittu sairas henkilö kantaa vähintään jompaakumpaa mutaatiota? P(Z)=P(A B)= P(A)+P(B)-P(A B)=0,32+0,16-0,10=0,38

Komplementti Tapahtuman A komplementin (A ei tapahdu, A C ) todennäköisyydelle pätee: P( A C ) 1 P( A) Jatkoa esimerkkiin 4: Millä todennäköisyydellä umpimähkään valittu sairas henkilö ei kanna kumpaakaan mutaatiota? P(Z c )=1-P(A B)=1-0,38=0,62

Riippumattomien tapahtumien kertolaskusääntö Riippumattomuus: ensimmäisen tapahtuman tapahtuminen ei vaikuta toisen tapahtuman todennäköisyyteen (ja päinvastoin) P( A B) P( A) P( B) Riippuvuuden ei tarvitse olla kausaalista (syyseuraussuhteista). Esim. jäätelön kulutus ja hukkumisonnettomuudet näyttävät korreloivan tilastojen valossa mutta miksi? http://en.wikipedia.org/wiki/independence_%28probabili ty_theory%29

Riippumattomuus on tärkeä oletus monissa genetiikan ilmiöissä: Gameettien muodostuminen: Heterotsygootti Aa -yksilön tuottamissa gameeteissa esiintyvät alleeli A ja a yhtä suurilla todennäköisyyksillä (0,5) Gameettien yhdistyminen: hedelmöityksessä isän ja äidin gameetit yhdistyvät sattumanvaraisesti Geenien kytkeytyminen: Jos geenit sijaitsevat eri kromosomeissa tai tarpeeksi etäällä toisistaan samassa kromosomissa, niiden alleelit ajautuvat meioosissa gameetteihin toisistaan riippumatta ja siten yhdistyvät toisistaan riippumatta myös tsygoottiin. Hardy-Weinbergin tasapainossa oleva populaatio: HW-tasapainossa olevan populaation genotyyppien frekvenssi voidaan johtaa suoraan alleelifrekvensseistä. * Kytkentäepätasapaino samassa kromosomissa lähekkäin sijaitsevien lokusten välillä: alleelin B 1 esiintyminen lokuksessa B nostaa alleelin A X esiintymistodennäköisyyttä lokuksessa A. * Kytkentätasapaino: alleelin B 1 esiintyminen lokuksessa B ei vaikuta alleelin A X esiintymistodennäköisyyteen lokuksessa A. *

Riippumattomuus on tärkeä oletus monissa genetiikan ilmiöissä: Aineiston analyysi usein yksinkertaistuu riippumattomuuden ansiosta Analyysistä tulee usein todennäköisyyksien kertolaskua

Esimerkki 5: Heitetään kahta noppaa, molempia kerran. Todennäköisyys saada ensimmäisellä nopalla silmäluku, joka on alle 4 (tapahtuma A: silmäluku nopalla 1 on 1, 2 tai 3) on 0.5. Samoin todennäköisyys saada toisella nopalla silmäluku 1, 2 tai 3 (tapahtuma B) on 0.5. Todennäköisyys, että kummankin nopan silmäluku jää alle neljän on siis P(A ja B) = P(A)* P(B) = 0.5*0.5 = 0.25

Esimerkki 6: Tarkastellaan heterotsygootteja vanhempia, joilla on eräässä lokuksessa alleelit A ja a, sekä toisessa, eri kromosomissa sijaitsevassa lokuksessa alleelit B ja b. Määritä lapsen mahdollisten genotyyppien todennäköisyydet. Vast. Gameettien periytymiset eri vanhemmilta ovat toisistaan riippumattomia tapahtumia. Lapsen eri genotyyppien todennäköisyydet ovat: P(AA) = P(BB) = 1/4 P(Aa) = P(Bb) = 1/2 P(aa) = P(bb) = 1/4 Genotyyppien todennäköisyydet ovat: P(AABB) = 1/4 * 1/4 = 1/16 P(AaBB) = 1/2 * 1/4 = 1/8 P(aaBB) = 1/4 * 1/4 = 1/16 P(AABb) = 1/4 * 1/2 = 1/8 P(AaBb) = 1/2 * 1/2 = 1/4 P(aaBb) = 1/4 * 1/2 = 1/8 P(AAbb) = 1/4 * 1/4 = 1/16 P(Aabb) = 1/2 * 1/4 = 1/8 P(aabb) = 1/4 * 1/4 = 1/16

Ehdollinen todennäköisyys Todennäköisyys, että tapahtuma A tapahtuu, kun tiedetään, että jokin toinen tapahtuma B on jo esiintynyt. merkitään P(A B) P( A B) P( A B) P( B) Huomaa, että jos tapahtumat A ja B ovat toisistaan riippumattomia P(A B)=P(A). http://en.wikipedia.org/wiki/conditional_probab ility

Ehdollinen todennäköisyys(kin) on tärkeä genetiikassa: Genotyypin ja ilmiasun välinen yhteys Sukupuolikromosomeissa periytyvät taudit Ominaisuudet, joiden ilmiasun voimakkuus on sukupuoleen sitoutunut Geenien kytkentä Kytkentäepätasapaino (alleeliassosiaatio)

Esimerkki 7. Oletetaan, että erääseen syöpään on löydetty altistava geeni, jossa tavataan mutanttialleeli D ja useita normaaleja alleeleja, joita kaikkia merkitään yksinkertaisesti +:lla P(syöpä kehittyy jossain elämän vaiheessa DD) = 0,25. P(syöpä kehittyy jossain elämän vaiheessa D+) = 0,10 P(syöpä kehittyy jossain elämän vaiheessa ++) = 0,05 Tällöin suhteellinen riski on DD-genotyypille 0,25/0,05=5 verrattuna ++ genotyyppiin Riski voidaan suhteuttaa myös taudin esiintyvyyteen populaatiossa (eli prevalenssiin). Esimerkiksi, jos keskimääräinen riski saada tämä syöpä on populaatiossa 0,0625, DD-genotyypille pätee 0,25/0,0625=4,0, eli siis 4 kertaa suurempi riski saada kyseinen syöpä kuin populaatiosta satunnaisesti valitulla yksilöllä HUOM: + on nyt D:n komplementti

Esimerkki 8: tarkastellaan resessiivistä sairautta. Penetranssit eli kuhunkin genotyyppiin liittyvät sairastumistodennäköisyydet voidaan esittää taulukkona: G P(D G) Tällöin P(sairas aa)=1.0 P(sairas Aa)=0.0 P(sairas AA)=0.0 AA 0.0 Aa 0.0 aa 1.0 Penetranssit ovat siis yksinkertaisesti vain ehdollisia todennäköisyyksiä.

Esimerkki 9: Eräästä keuhkosairaudesta tiedetään, että 5% sairaista henkilöistä kantaa mutaatiota A, 80% mutaatiota B ja 1%:lla sairaista henkilöistä on molemmat mutaatiot. Merkitään: P(A)=0.05, P(B)=0.8 P(A B)=0.01 Laske seuraavat todennäköisyydet sairaille henkilöille: P(B A) (todnäk. että potilas kantaa B:tä, jos hänellä on A) P(A B) (todnäk. että potilas kantaa A:tä, jos hänellä on B) P(A B C ) (todnäk. että potilas kantaa A:ta muttei B:tä) P(A B C ) (todnäk. että potilas kantaa A:tä, jos hänellä ei ole B:tä) P(A B) (todnäk. että potilaalla on A tai B tai molemmat)

P(B A)=P(B A)/P(A)=0,01/0,05=0,2 P(A B)=P(A B)/P(B)=0,01/0,8=0,0125 P(A B C )=P(A)-P(A B)=0,05-0,01=0,04 Ymmärtämisen helpottamiseksi: Piirrä Venn-diagrammina! P(A B C )=P(A B C )/P(B C )=0,04/0,2=0,2 P(A B)=P(A)+P(B)-P(A B)=0,05+0,8-0,01=0,84

Permutaatiot ja kombinaatiot Permutaatio tarkoittaa jonoa, jossa alkiot on järjestetty määrättyyn järjestykseen. Esimerkki: 1, 2, 3, 6, 5, 4 Esimerkki, toinen järj: 6,5,4,3,2,1 Kun halutaan selvittää, kuinka monta erilaista jonoa eli permutaatiota voidaan tietystä joukosta muodostaa, jonon kunkin paikan vaihtoehtojen määrä kerrotaan keskenään. http://en.wikipedia.org/wiki/permutation

Kun halutaan selvittää n alkiota sisältävän joukon erilaiset permutaatiot, erilaisten järjestysten lukumäärä saadaan seuraavasti: n (n-1) (n-2) 1 = n! Tätä kutsutaan n:n kertomaksi. Huom! Määritelmän mukaan 1! =1 ja samoin 0! = 1 Esimerkki 10: Kuinka moneen erilaiseen järjestykseen voidaan asettaa neljä eri nukleotidia A, T, C ja G? Ensimmäisenä voidaan valita mikä tahansa neljästä. Jos valittiin vaikkapa C ensimmäiseksi, sen jälkeen voi tulla enää vain T, A tai G, eli kolme eri vaihtoehtoa, jne. Vastaus on siis 4 3 2 1 = 24 = 4!. Erilaisia järjestysvaihtoehtoja on siis yhteensä 24. http://en.wikipedia.org/wiki/factorial

Esimerkki 11: Päivähoidossa on kolme lasta: Onni, Amanda sekä Alexander. Kuinka monella tavalla lapset voidaan asettaa jonoon? Ensimmäinen lapsista voidaan valita kolmella tavalla, toinen lapsista kahdella tavalla, ja jäljelle jääneestä lapsesta tulee jonon viimeinen. Erilaisia permutaatioita on tässä tapauksessa 3! = 3 2 1 = 6 kappaletta

Kombinaatiot Kombinaatio on kokoelma alkioita, joiden järjestyksellä ei ole väliä. Jatkoa esimerkkiin 11: Monellako tavalla voit laittaa edellisen esimerkin lapset järjestykseen sukupuolen mukaan? Mahdollisia järjestyksiä on kolme: TPP, PTP, PPT Kahden vaihtoehtoisen tulostapahtuman vallitessa (esim. tyttö ja poika) sellaisten kombinaatioiden määrä, jossa on r kappaletta toista tulostapahtumaa ja n-r kappaletta toista, saadaan kaavasta n r n! r!( n r)!

Esimerkki 12: Seitsenlapsisessa perheessä on kaksi poikaa. Monessako eri järjestyksessä juuri 2 poikaa ja 5 tyttöä olisivat voineet syntyä? Valitaan ensin poikien paikat jonossa. Kahdelle pojalle voidaan valita paikat 7 2 7! 2!(7 2)! tavalla. Tytöt täyttävät jäljelle jääneet viisi paikkaa. Erilaisia järjestysmahdollisuuksia on siis 21. 21

Binomitodennäköisyys Kombinaatioiden käsite liittyy läheisesti binomijakaumaan. Kun toistokoe tehdään n kertaa, ja suotuisan lopputuloksen todennäköisyys on p, on todennäköisyys, että saadaan täsmälleen r kappaletta suotuisia lopputuloksia seuraavanlainen: P( r) n p r r n r (1 ) p Binomitodennäköisyyden kaava

Esimerkki 13: Laske todennäköisyys, että seitsemästä syntyvästä lapsesta juuri viisi on tyttöjä. Lasten hankkimista ajatellaan nyt seitsenkertaisena toistokokeena, jossa suotuisan tapahtuman (tyttö) todennäköisyys on puoli. Sijoittamalla luvut binomitodennäköisyyden kaavaan saadaan: P 7 (1/ 2) 5 5 ( 5 tyttöä) (1/ 2) 2 =21*(1/128)=0,164

Esimerkki 14: Vanhemmat ovat heterotsygootteja resessiivisen sairauden aiheuttavan alleelin suhteen. Laske todennäköisyys, että pariskunnalle syntyvistä kolmesta lapsesta: (a) kaikki ovat terveitä (b) kaksi on sairaita (c) vähintään kaksi on sairaita (a) P(3 tervettä lasta) 3 ( 1 ) 3 4 0 (3/ 4) 3 27 / 64 0,42 (b) P(2 sairasta lasta) 3 ( 1 ) 2 4 2 (3/ 4) 1 9 / 64 0,14 (c) P(vähintään 2 sairasta lasta) P(2 sairasta) P(3 sairasta) 3 0,14 ( 1 ) 3 4 3 (3/ 4) 0 0,15

Huom! Jos perheen kaikki 3 lasta olisivat sairaita, mikä on todennäköisyys, että seuraava, neljäskin lapsi olisi sairas? Jos P(lapsi on sairas)=0,25, on tällöin P(neljäs lapsi on sairas kaikki edelliset kolme lasta ovat sairaita) = 0,25, koska lasten genotyyppien muodostumiset ovat toisistaan riippumattomia tapahtumia. Uusi sairastapaus ei siis riipu edellisten tapausten määrästä (vaikka vähän intuitionvastaiselta kuulostaakin)! Huom! Tarkista, onko järjestyksellä väliä. Esim. todennäköisyys, että saa ensin kaksi sairasta lasta ja sitten terveen on eri kuin todennäköisyys sille, että kolmesta lapsesta kaksi on sairasta. Siis ensimmäisessä tapauksessa järjestyksellä on väliä ja toisessa sillä ei ole.

Yhteistodennäköisyys Tapahtumien A ja B yhteistodennäköisyyttä (leikkausta) käsiteltiin aikaisemmin tilanteelle, jossa tapahtumat olivat toisistaan riippumattomia. Yleisesti kaikille tapahtumille A ja B pätee seuraava kaava: Yhteistodennäköisyys P( A B) P( A) P( B A) Jos tapahtumia on enemmän kuin kaksi, yleistyy kaava muotoon P( A1... An ) P( A1 ) P( A2 A1 )... P( An A1... An 1 )

Esimerkki 15: Väestöstä 2,2% kantaa erästä alleelia A. Alleelin A kantajista 15 prosenttia sairastaa erästä perinnöllistä sairautta. Lasketaan todennäköisyys, että väestöstä satunnaisesti poimittu henkilö kantaa alleelia A ja sairastaa kyseistä perinnöllistä sairautta. Sovellamme yhteistodennäköisyyden kaavaa: P(A S) = P(A)P(S A) = 0,022 0,15 = 0,0033.

Kokonaistodennäköisyys jätetään laskuharjoitusten yhteyteen...

Kokonaistodennäköisyys Esimerkki 16: Erään sairauden penetranssi tietyn lokuksen suhteen voidaan esittää taulukkona seuraavasti: Tiedämme, että väestötason alleelifrekvenssit ovat P(a)=0.05 ja P(A)=0.95. Laske taudin prevalenssi (esiintyvyys) koko väestössä, kun oletamme, että populaatio on nk. Hardy-Weinberg -tasapainossa. AA 0,01 Aa 0,05 aa 0,50 Aloitetaan laskemalla genotyyppifrekvenssit: P(aa) = 0.05 2 = 0.0025 P(Aa) = 2 0.05 0.95 = 0.095 P(AA) = 0.95 2 = 0.9025 Tässä haetaan kokonaistodennäköisyyttä sille, että henkilö on sairas. Kunkin henkilön genotyyppi on jokin kolmesta toisensa poissulkevasta vaihtoehdosta, ja kuhunkin vaihtoehtoon liittyy oma sairastumistodennäköisyytensä. Tilanne voidaan kuvata puurakenteena, jonka haaroihin kiinnitämme todennäköisyydet.

Bayesin teoreema Bayesin teoreema perustuu todennäköisyyksien ratkaisussa järjestyksen vaihteluun. Siispä Tämä tarjoaa mahdollisuuden ratkaista mikä tahansa edellä olevista neljästä termistä kolmen muun avulla

Bayesin teoreema Bayesin teoreemaa voidaan käyttää ehdollisen todennäköisyyden P(A B) määrittämiseen tilanteissa, joissa ehdollisen todennäköisyyden kaavaa ei voida sellaisenaan soveltaa. Bayesin teoreeman avulla haetaan syyn todennäköisyyttä, kun seuraus tiedetään. Tutustutaan teoreemaan esimerkin kautta. Esimerkki 18: Tarkastellaan polymorfismia, joka on vahvasti assosioitunut vanhalla iällä ilmenevään perinnölliseen sairauteen. Tiedämme, että tautiin sairastuvia yksilöitä on 2 prosenttia väestöstä. Sairaista ihmisistä 90% kantaa mainitussa lokuksessa alleelia A, mutta terveistä vanhuksista ainoastaan 5% kantaa tuota alleelia. Periaatteessa olisi mahdollista testata nuoret ihmiset alleelin A kantajuuden suhteen ja aloittaa tarvittaessa ennaltaehkäisevä lääkehoito. Mikä on todennäköisyys, että positiivisen testituloksen antanut henkilö todella sairastuu tarkasteltavaan tautiin?

Merkitään: P(S)=0.02 P(A S) = 0.9 P(T)=0.98 P(A T) = 0.05 Haemme todennäköisyyttä P(S A). Ehdollisen todennäköisyyden kaavan nojalla voimme kirjoittaa: P ( S A ) P ( S A ) P ( A ) Osoittajan ja nimittäjän arvojen laskeminen ei ole suoraviivaista, mutta se kuitenkin onnistuu. Osoittajan tapauksessa käytämme yhteistodennäköisyyden kaavaa: P(S A) = P(S) P(A S) = 0.02 0.9 = 0.018. Nimittäjän voimme jakaa kahteen toisensa poissulkevaan tapaukseen, joista kumpaankin sovelletaan yhteistodennäköisyyden kaavaa. Näin saamme: P(A) = P(S A) + P(T A) = P(S) P(A S) + P(T) P(A T) = 0.02 0.9 + 0.98 0.05 = 0.067, ja lopulta P(S A) = 0.018/0.067 = 0.269.

Henkilö Fenotyyppi Tulee sairastumaan 0.02 Ei tule Sairastumaan 0.98 Posit. testituloksen (A) saaneiden todennäköisyydet ovat: (pos. ja sairas) = P(S A) = P(S) P(A S) = 0.02 0.9 = 0.018 ja (pos. ja terve) = P(T A) = P(T) P(A T) = 0.98 0.05 Geenitestin tulos (A=posit.) A: 0.90 Ei A : 0.10 A: 0.05 Ei A : 0.95

Sairaiden osuus kaikista positiivisista on siis P( pos Sairas) 0.90*0.02 P( Sairas pos) P( pos Sairas) P( pos terve) 0.90 *0.02 0.05*0.98 0.269

Ongelman ratkaisussa käytimme itse asiassa Bayesin teoreemaa, joka voidaan kirjoittaa seuraavasti: P( B r A) k P( B i 1 r ) P( A B P( B ) P( A B ) i r ) i Bayesin teoreeman avulla haetaan siis syyn todennäköisyyttä, kun seuraus tiedetään. Tilanteisiin, joissa havaintoja voidaan tehdä esim. seurauksesta, vaikkapa henkilön terveydentilasta. Lopullisena tavoitteena on laatia todennäköisyysarvioita mahdollisista sairauden syistä, olivatpa nämä luonteeltaan geneettisiä tai eivät.