Populaatiosimulaattori. Petteri Hintsanen HIIT perustutkimusyksikkö Helsingin yliopisto

Samankaltaiset tiedostot
Vaatimusmäärittely. Populous. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

alleelipareja dominoiva dominoiva resessiivinen

Perinnöllisyys. Enni Kaltiainen

Perinnöllisyyden perusteita

S Laskennallinen systeemibiologia

Projektisuunnitelma. Populous. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Perinnöllisyystieteen perusteita III Perinnöllisyystieteen perusteita

DNA testit sukututkimuksessa

Arkkitehtuurien tutkimus Outi Räihä. OHJ-3200 Ohjelmistoarkkitehtuurit. Darwin-projekti. Johdanto

Periytyvyys ja sen matematiikka

Perinnöllisyys 2. Enni Kaltiainen

VASTAUS 2a: Ruusukaijasten väri

Evoluutio. BI Elämä ja evoluutio Leena Kangas-Järviluoma

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Testausdokumentti. Populous. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

a. Mustan ja lyhytkarvaisen yksilön? b. Valkean ja pitkäkarvaisen yksilön? Perustele risteytyskaavion avulla.

Miten geenit elelevät populaatioissa, vieläpä pitkiä aikoja?

Symbioosi 2 VASTAUKSET. b. Millaisia sukusoluja vanhemmat tuottavat (4 erilaista)? Vastaus: VL, vl, Vl, vl

Epigeneettinen säätely ja genomin leimautuminen. Tiina Immonen Medicum, Biokemia ja kehitysbiologia

Perinnöllisyyden perusteita

DNA-testit. sukututkimuksessa Keravan kirjasto Paula Päivinen

måndag 10 februari 14 Jaana Ohtonen Kielikoulu/Språkskolan Haparanda

Symbioosi 2 VASTAUKSET

Perinnöllisyystieteen perusteita III Perinnöllisyystieteen perusteita. BI2 III Perinnöllisyystieteen perusteita 9. Solut lisääntyvät jakautumalla

DNA sukututkimuksen tukena

III Perinnöllisyystieteen perusteita

Toteutusdokumentti. Populous. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

III Perinnöllisyystieteen perusteita

Suunnitteludokumentti

AS Automaation signaalinkäsittelymenetelmät. Tehtävä 1. Käynnistä fuzzy-toolboxi matlabin komentoikkunasta käskyllä fuzzy.

Geenitekniikan perusmenetelmät

Geenikartoituksen käsitteet ja lähestymistavat

Epigeneettinen säätely ja genomin leimautuminen. Tiina Immonen BLL Biokemia ja kehitysbiologia

Sukukokous TERVETULOA! Järvisydän, Rantasalmi

Kromosomien välisten genotyyppiassosiaatioiden etsintä

Lisääntyminen. BI1 Elämä ja evoluutio Leena kangas-järviluoma

Sukusiitoksesta sukulaistumiseen - jalostustietojärjestelmä työkaluna. Rovaniemi Susanna Back, Suomen Hippos ry

Loppuraportti. Populous. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

811120P Diskreetit rakenteet

Testaussuunnitelma. Populous. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Euromit2014-konferenssin tausta-aineistoa Tuottaja Tampereen yliopiston viestintä

Naudan perinnöllisen monimuotoisuuden tutkimus

Geenitutkimusta: evoluutiosta kohti geenivarojen suojelua ja jalostusta

PERUSTIETOJA MEHILÄISTEN PERIMÄSTÄ

Laskennan teoria (kevät 2006) Harjoitus 3, ratkaisuja

Genomin ylläpito Tiina Immonen BLL Lääke8eteellinen biokemia ja kehitysbiologia

Hallikaisten varhaisvaiheet ja suvun DNA-tulokset Ari Kolehmainen Suku- ja historiapalvelu Menneen jäljet

Genetiikan perusteet 2009

Sovellettu todennäköisyyslaskenta B

SELVITYS SIITÄ MITEN ERÄÄT PERINNÖLLISET SAIRAUDET (KUTEN GPRA JA FUCOSIDOSIS) PERIYTYVÄT ENGLANNINSPRINGERSPANIELEISSA

Niskaset ja DNA-avusteinen sukututkimus sekä sukututkimuksen jatko Suku- ja historiapalvelu Menneen jäljet

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Rauduskoivun uudet siemenviljelykset täsmäjalosteita koivunviljelyyn

Genetiikan perusteet. Tafel V Baur E. (1911) Einführung in die experimentelle Vererbungslehre. Verlag von Gebrüder Borntraeger, Berlin.

Lineaarialgebra ja matriisilaskenta II Syksy 2009 Laskuharjoitus 1 ( ) Ratkaisuehdotuksia Vesa Ala-Mattila

Laboratorioanalyysit, vertailunäytteet ja tilastolliset menetelmät

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

a) dominoivaan: esiintyy joka sukupolvessa, sairaille vanhemmille voi syntyä terveitä lapsia

Muuttumaton genomi? Genomin ylläpito. Jakson luennot. Luennon sisältö DNA:N KAHDENTUMINEN ELI REPLIKAATIO

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

valitsin on useimmiten html-elementti, jolle tyyli halutaan luoda

Mat Sovellettu todennäköisyyslaskenta B

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

1 of :11

Harjoitus 2: Matlab - Statistical Toolbox

Tilastollinen päättely genominlaajuisissa assosiaatioanalyyseissä. Matti Pirinen

Geneettiset algoritmit

Harjoitus 7: NCSS - Tilastollinen analyysi

X-kromosominen periytyminen. Potilasopas. TYKS Perinnöllisyyspoliklinikka PL 52, Turku puh (02) faksi (02)

Prosessin reaalisaatioiden tuottaminen

Otanta ilman takaisinpanoa

SÄTEILYN GENEETTISET VAIKUTUKSET

Sukupuolijutut 2 Kärpänen ja ihminen

Satunnaislukujen generointi

Harjoitus 8: Monte-Carlo simulointi (Matlab)

Koodausteoria, Kesä 2014

Darwin nuorena. Darwinin syntymästä on 201 vuotta ja "Lajien synnystä" 151 vuotta.

Teoria. Prosessin realisaatioiden tuottaminen

Mustaruoste uhkaa romahduttaa maailman vehnäsadot jälleen

Bioteknologian perustyökaluja

TIMBERLOG OHJEET 1 (12) TimberLOG - Käyttöohje Versio 2.2

Median vaikutus tapahtumamarkkinointiin

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

S BAB ABA A aas bba B bbs c

GEENIKARTOITUSOPAS VESA OLLIKAINEN JA PEKKA UIMARI CSC

Sovellettu todennäköisyyslaskenta B

T Syksy 2002 Tietojenkäsittelyteorian perusteet Harjoitus 8 Demonstraatiotehtävien ratkaisut

Hahmon etsiminen syotteesta (johdatteleva esimerkki)

Täydentäviä muistiinpanoja Turingin koneiden vaihtoehdoista

Tutkimustiedonhallinnan peruskurssi

Suomenhevosten kasvuhäiriötutkimus Susanna Back

Istutukset muuttavat kuhakantojen perimää

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

Kvantitatiivinen genetiikka moniste s. 56

Evoluutiopuu. Aluksi. Avainsanat: biomatematiikka, päättely, kombinatoriikka, verkot. Luokkataso: luokka, lukio

Riekkisten suvun alkuvaiheet ja DNA-tulokset

Positional cloning. Pedigreessä etenevä ominaisuus kartoitetaan ensin karkeasti ja sitten tehdään yhä tarkempaa työtä molekyylimarkkereilla.

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

Osa 2: Otokset, otosjakaumat ja estimointi

Transkriptio:

Populaatiosimulaattori Petteri Hintsanen HIIT perustutkimusyksikkö Helsingin yliopisto

Kromosomit Ihmisen perimä (genomi) on jakaantunut 23 kromosomipariin Jokaisen parin toinen kromosomi on peritty isältä ja toinen äidiltä Viimeinen kromosomipari on ns. sukupuolikromosomi (XX tai XY pari) Kromosomit sisältävät DNA-emäspareja tiiviisti pakattuina rihmoina

Markkerit Perimässä on vain pieniä eroja yksilöiden välillä, ts. DNA-emäsparit ovat suurimmaksi osaksi lähes samoja kaikilla ihmisillä Sellaisia paikkoja kromosomeissa, joissa esiintyy vaihtelua yksilöiden väleillä, kutsutaan markkereiksi (marker) Markkereissa esiintyvät vaihtelut voidaan mitata laboratoriossa. Näitä variantteja kutsutaan alleeleiksi, jotka koodataan mittausvaiheessa tyypillisesti kokonaisluvuilla

Markkerit: esimerkki Usein tarkastellaan vain nk. SNP-markkereita, joilla on kaksi mahdollista arvoa (1 ja 2) Markkerista saadaan aina kaksi alleelia, joista toinen vastaa äidiltä perityn kromosomin alleelia ja toinen vastaavasti isältä perittyä:...a C C G T A G T T......A C C G C A G T T... Merkitsemällä T = 1 ja C = 2 saadaan alleelipari {1,2}

Genotyyppi Käytännössä lähes aina tarkastellaan useita markkereita, jolloin yksilöltä saadaan mitattua useita alleelipareja eli genotyyppi:...a C C G A G C T T T A A G T C T C A A C......A C T G G G C T A T A A G T C T A A A C... genotyyppi: {1,2}, {1,2}, {1,1}, {2,1}

Haplotyyppi Genotyyppi on jono järjestämättömiä alleelipareja. Siinä ei ole tietoa siitä, mikä alleeli on peritty isältä ja mikä äidiltä Haplotyyppi on jono järjestettyjä alleelipareja, joissa (esimerkiksi) ensimmäinen alleeli on isältä peritty ja toinen äidiltä Haplotyyppejä ei saada suoraan laboratoriosta. Ne voidaan johtaa yksilön genotyypistä joko vanhempien genotyyppien avulla tai tilastollisesti

Markkeridata: esimerkki M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 A 1 2 2 1 2 2 1 1 1 2 2 B 1 1 2 2 1 2 1 1 1 2 1 C 2 2 2 1 1 1 1 1 2 2 1 D 1 2 1 1 1 2 1 1 1 1 2 E 1 1 1 2 2 1 2 1 2 2 1 F 2 2 1 1 1 2 1 1 1 2 1 G 1 2 2 1 2 1 2 1 1 1 2 H 1 1 2 1 1 1 2 2 2 2 1 Siniset haplotyypit ovat peräisin isältä, punaiset äidiltä

Populaatio Populaatio on joukko yksilöitä, joiden perimää tutkitaan Isolaatti on erityinen populaation muoto, jossa kaikki populaation jäsenet ovat pienen perustajajoukon jälkeläisiä, so. populaatioon ei ole tullut (ainakaan merkittävästi) jäseniä ulkopuolelta missään vaiheessa Käytännössä isolaatteja löytyy esimerkiksi Savosta ja Kainuusta

Periytyminen Prosessia, jossa muodostuu sukusoluja, kutsutaan meioosiksi. Sukusolut sisältävät vain yhden kromosomin kustakin kromosomiparista Yksilön sukusolun sisältämä kromosomi voi olla yksilön äidiltä peritty kromosomi yksilön isältä peritty kromosomi edellämainittujen yhdistelmä eli rekombinantti, jolloin meioosissa on tapahtunut crossovereita (tälle ei ole hyvää suomennosta) Jälkeläinen saa molemmilta vanhemmiltaan yhden sukusolun sisältämät vastinkromosomit

Rekombinaatio: esimerkki Identtinen isältä peritty 1 crossover 2 crossoveria Yksilön kromosomipari: sininen isältä peritty, punainen äidiltä peritty vastinkromosomi 2 crossoveria Identtinen äidiltä peritty Mahdollisia sukusoluja

Crossovereiden määrä Crossovereiden lukumäärä meioosissa on verrannollinen kromosomin pituuteen L Morgan (M) on geneettinen mittayksikkö. 1M:n pituisessa kromosomissa tapahtuu keskimäärin 1 crossover / meioosi Simuloitaessa crossovereiden lukumäärä on satunnaismuuttuja X ~ Poisson(L). Crossoverien sijainti kromosomissa jakautuu tasaisesti Ihmisillä 1M 100 000 000 bp (basepair eli emäspari)

Periytyminen isolaatissa Isolaatissa perustajajäsenten perimät ovat siirtyneet ajan kuluessa sukupolvelta toiselle ja sekoittuneet rekombinaatioissa Populaation ( viimeisen sukupolven ) yksilöiden perimät ovat siis yhdistelmiä perustajajäsenten perimistä Käytännön malleissa tehdään yksinkertaistavia oletuksia parit muodostetaan satunnaisesti sukupolvet ovat diskreettejä

Periytyminen: esimerkki perustajat 1. sukupolvi 2. sukupolvi perimät ovat yhdistelmiä perustajayksilöiden perimistä

Simulaattori Populaatiosimulaattori simuloi populaation kasvua halutun ajan (sukupolvia) ja perustajajäsenten perimän jakautumista yksilöille Käytännössä tämä tapahtuu generoimalla sukupuu ja simuloimalla rekombinaatiot sukupuussa Tämän jälkeen simuloidaan markkerit (alleelit) perustajajäsenille Nyt kaikkien yksilöiden markkerit saadaan suoraan katsomalla, miltä perustajayksilöiltä he ovat perineet markkerinsa

Nykyinen simulaattoritoteutus Pohjautuu Vesa Ollikaisen Populus-simulaattoriin Koostuu neljästä osasta: genped generoi sukupuun chrom simuloi meioosit (rekombinaatiot) sukupuussa simco generoi markkerit perustajayksilöille markertool poimii populaatiosta otoksen ja luo lopullisen markkeridatan. Lisäksi mahdollisuus määritellä tautimalli Osien yhteensovitus työlästä, vaatii turhaa esiprosessointia Käytännössä ei kelvollista käyttöliittymää

Simulaatioprosessi esiprosessointia (preprocess_segm, preprocess_ped) simco genped chrom marker tool parametritiedosto markkeridata Koko prosessi tällä hetkellä scriptattu (hybridsim.sh)

Tarpeet Uusi genped ja chrom. Nämä voi yhdistää yhdeksi kokonaisuudeksi. Toivottavat ominaisuudet: alipopulaatiot tuloste sopivaksi markertoolille (päästään eroon esiprosessoinnista), myös muut kuin viimeinen sukupolvi (erityisesti vanhemmat) sukupuun tulostus vaihtoehtoisesti tuloste voisi kelvata myös syötteeksi Jonkinlainen käyttöliittymä koko prosessille, ts. korvataan hybridsim.sh ja sen parametritiedosto

Lisäominaisuuksia Mahdollisia harkitsemisen arvoisia lisäominaisuuksia, jos jää aikaa: Rinnakkaistaminen (tarpeen, jos simulaatiota toistetaan useita kertoja) Siirtolaiset Valmis asennuspaketti ym...

Loppu... Kysymyksiä?