Populaatiosimulaattori Petteri Hintsanen HIIT perustutkimusyksikkö Helsingin yliopisto
Kromosomit Ihmisen perimä (genomi) on jakaantunut 23 kromosomipariin Jokaisen parin toinen kromosomi on peritty isältä ja toinen äidiltä Viimeinen kromosomipari on ns. sukupuolikromosomi (XX tai XY pari) Kromosomit sisältävät DNA-emäspareja tiiviisti pakattuina rihmoina
Markkerit Perimässä on vain pieniä eroja yksilöiden välillä, ts. DNA-emäsparit ovat suurimmaksi osaksi lähes samoja kaikilla ihmisillä Sellaisia paikkoja kromosomeissa, joissa esiintyy vaihtelua yksilöiden väleillä, kutsutaan markkereiksi (marker) Markkereissa esiintyvät vaihtelut voidaan mitata laboratoriossa. Näitä variantteja kutsutaan alleeleiksi, jotka koodataan mittausvaiheessa tyypillisesti kokonaisluvuilla
Markkerit: esimerkki Usein tarkastellaan vain nk. SNP-markkereita, joilla on kaksi mahdollista arvoa (1 ja 2) Markkerista saadaan aina kaksi alleelia, joista toinen vastaa äidiltä perityn kromosomin alleelia ja toinen vastaavasti isältä perittyä:...a C C G T A G T T......A C C G C A G T T... Merkitsemällä T = 1 ja C = 2 saadaan alleelipari {1,2}
Genotyyppi Käytännössä lähes aina tarkastellaan useita markkereita, jolloin yksilöltä saadaan mitattua useita alleelipareja eli genotyyppi:...a C C G A G C T T T A A G T C T C A A C......A C T G G G C T A T A A G T C T A A A C... genotyyppi: {1,2}, {1,2}, {1,1}, {2,1}
Haplotyyppi Genotyyppi on jono järjestämättömiä alleelipareja. Siinä ei ole tietoa siitä, mikä alleeli on peritty isältä ja mikä äidiltä Haplotyyppi on jono järjestettyjä alleelipareja, joissa (esimerkiksi) ensimmäinen alleeli on isältä peritty ja toinen äidiltä Haplotyyppejä ei saada suoraan laboratoriosta. Ne voidaan johtaa yksilön genotyypistä joko vanhempien genotyyppien avulla tai tilastollisesti
Markkeridata: esimerkki M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 A 1 2 2 1 2 2 1 1 1 2 2 B 1 1 2 2 1 2 1 1 1 2 1 C 2 2 2 1 1 1 1 1 2 2 1 D 1 2 1 1 1 2 1 1 1 1 2 E 1 1 1 2 2 1 2 1 2 2 1 F 2 2 1 1 1 2 1 1 1 2 1 G 1 2 2 1 2 1 2 1 1 1 2 H 1 1 2 1 1 1 2 2 2 2 1 Siniset haplotyypit ovat peräisin isältä, punaiset äidiltä
Populaatio Populaatio on joukko yksilöitä, joiden perimää tutkitaan Isolaatti on erityinen populaation muoto, jossa kaikki populaation jäsenet ovat pienen perustajajoukon jälkeläisiä, so. populaatioon ei ole tullut (ainakaan merkittävästi) jäseniä ulkopuolelta missään vaiheessa Käytännössä isolaatteja löytyy esimerkiksi Savosta ja Kainuusta
Periytyminen Prosessia, jossa muodostuu sukusoluja, kutsutaan meioosiksi. Sukusolut sisältävät vain yhden kromosomin kustakin kromosomiparista Yksilön sukusolun sisältämä kromosomi voi olla yksilön äidiltä peritty kromosomi yksilön isältä peritty kromosomi edellämainittujen yhdistelmä eli rekombinantti, jolloin meioosissa on tapahtunut crossovereita (tälle ei ole hyvää suomennosta) Jälkeläinen saa molemmilta vanhemmiltaan yhden sukusolun sisältämät vastinkromosomit
Rekombinaatio: esimerkki Identtinen isältä peritty 1 crossover 2 crossoveria Yksilön kromosomipari: sininen isältä peritty, punainen äidiltä peritty vastinkromosomi 2 crossoveria Identtinen äidiltä peritty Mahdollisia sukusoluja
Crossovereiden määrä Crossovereiden lukumäärä meioosissa on verrannollinen kromosomin pituuteen L Morgan (M) on geneettinen mittayksikkö. 1M:n pituisessa kromosomissa tapahtuu keskimäärin 1 crossover / meioosi Simuloitaessa crossovereiden lukumäärä on satunnaismuuttuja X ~ Poisson(L). Crossoverien sijainti kromosomissa jakautuu tasaisesti Ihmisillä 1M 100 000 000 bp (basepair eli emäspari)
Periytyminen isolaatissa Isolaatissa perustajajäsenten perimät ovat siirtyneet ajan kuluessa sukupolvelta toiselle ja sekoittuneet rekombinaatioissa Populaation ( viimeisen sukupolven ) yksilöiden perimät ovat siis yhdistelmiä perustajajäsenten perimistä Käytännön malleissa tehdään yksinkertaistavia oletuksia parit muodostetaan satunnaisesti sukupolvet ovat diskreettejä
Periytyminen: esimerkki perustajat 1. sukupolvi 2. sukupolvi perimät ovat yhdistelmiä perustajayksilöiden perimistä
Simulaattori Populaatiosimulaattori simuloi populaation kasvua halutun ajan (sukupolvia) ja perustajajäsenten perimän jakautumista yksilöille Käytännössä tämä tapahtuu generoimalla sukupuu ja simuloimalla rekombinaatiot sukupuussa Tämän jälkeen simuloidaan markkerit (alleelit) perustajajäsenille Nyt kaikkien yksilöiden markkerit saadaan suoraan katsomalla, miltä perustajayksilöiltä he ovat perineet markkerinsa
Nykyinen simulaattoritoteutus Pohjautuu Vesa Ollikaisen Populus-simulaattoriin Koostuu neljästä osasta: genped generoi sukupuun chrom simuloi meioosit (rekombinaatiot) sukupuussa simco generoi markkerit perustajayksilöille markertool poimii populaatiosta otoksen ja luo lopullisen markkeridatan. Lisäksi mahdollisuus määritellä tautimalli Osien yhteensovitus työlästä, vaatii turhaa esiprosessointia Käytännössä ei kelvollista käyttöliittymää
Simulaatioprosessi esiprosessointia (preprocess_segm, preprocess_ped) simco genped chrom marker tool parametritiedosto markkeridata Koko prosessi tällä hetkellä scriptattu (hybridsim.sh)
Tarpeet Uusi genped ja chrom. Nämä voi yhdistää yhdeksi kokonaisuudeksi. Toivottavat ominaisuudet: alipopulaatiot tuloste sopivaksi markertoolille (päästään eroon esiprosessoinnista), myös muut kuin viimeinen sukupolvi (erityisesti vanhemmat) sukupuun tulostus vaihtoehtoisesti tuloste voisi kelvata myös syötteeksi Jonkinlainen käyttöliittymä koko prosessille, ts. korvataan hybridsim.sh ja sen parametritiedosto
Lisäominaisuuksia Mahdollisia harkitsemisen arvoisia lisäominaisuuksia, jos jää aikaa: Rinnakkaistaminen (tarpeen, jos simulaatiota toistetaan useita kertoja) Siirtolaiset Valmis asennuspaketti ym...
Loppu... Kysymyksiä?