Geenikartoituksen käsitteet ja lähestymistavat Luentomateriaalin pohjana Vesa Ollikainen, CSC Geenikartoituskurssin kalvot Geenikartoitus ongelmana Tavoitteena on löytää tilastollisia yhteyksiä yksilöillä olevien geneettisten muuttujien arvojen sekä yksilön ilmiasun välillä. Etsitään perimän kohtia, joilla on vaikutus ilmiasuun. Tilastollinen (ja tietojenkäsittelytieteellinen) ongelma. Kohteena usein ihmisen sairausgeenien kartoitus, mutta menetelmät sovellettavissa muihinkin organismeihin ja piirteihin (esim. kasvinjalostus). Yhden geenin monogeenisistä sairauksista monitekijäisisiin sairauksiin (perimä+ympäristö). Ihmisen sairausgeenien kartoitus Monogeeninen sairaus Ympäristötekijät Geenimutaatio Lähde: Morgan Genetics Tutorial. http://morgan.rutgers.edu/morganwebframes/level/page/karyotype.html Yksi geeni riittää selvittämään yksilön sairastumisen Kompleksinen sairaus Ympäristötekijät Kompleksinen sairaus RISKI Geenimutaatio N Geenimutaatio Mikään (geneettinen) tekijä ei yksin riitä selittämään sairauden syntymekanismia. Yleensä tuntemattomia tekijöitä Vaikuttavien geenien lukumäärä Geenien sijainti Yksittäisten geenien vaikutuksen voimakkuus Ympäristötekijöiden vaikutus Yhteisvaikutukset. Lähtökohta: etsitään yhtä geeniä kerrallaan.
Heterogenia Fenotyypit Lokusheterogenia samaan sairauteen vaikuttaa usea eri geeni. Alleeliheterogenia saman geenin eri variantit vaikuttavat sairauteen. Geneettinen heterogenia yhteisnimitys edellisille. Yksilön ilmiasu. Mitattava ominaisuus kvalitatiivinen: terve/sairas kvantitatiivinen: verenpaine, paino, kolesterolikonsentraatio. Fenotyyppimääritys kriittistä analyysin kannalta. taudin jaottelu alaryhmiin ääripäiden analyysi Tällä kurssilla keskitytään kvalitatiivisiin ominaisuuksiin. Sairausmallista Penetranssi kuvaa todennäköisyyden, että genotyypin kantaja on sairas Yksittäisen geneettisen tekijän vaikutus määritellään penetranssivektorina (riskialleelina a) 0.99 π(aa), homotsygootin sairastumistodennäköisyys Π = 0.8 0.00 π(aa), heterotsygootin sairastumistodennäköisyys π(aa), riskigeeniä ei-kantajan sairastumistodnäk. Lisäksi riskialleelin populaatiofrekvenssi p( a) = 0.00 Sairausmallista Yksinkertaisimmillaan geneettiset sairaudet ovat ) DOMINANTTEJA Π = π(aa), homotsygootin sairastumistodennäköisyys 0 π(aa), heterotsygootin sairastumistodennäköisyys π(aa), riskigeeniä ei-kantajan sairastumistodnäk. tai ) RESESSIIVISIÄ: Π = ( 0 0) T Sairausmallista Meioosi ja tekijäinvaihto PREVALENSSI kuvaa sairauden yleisyyttä väestössä voidaan laskea penetransseista ja tautialleelin frekvenssistä käytännössä vain prevalenssi tunnetaan mahdollisia sairausmalleja tällöin ääretön määrä -> geenikartoituksessa sairausmalli tuntematon Relatiivinen riski kuvaa alleelin kantajien riskiä olla sairas verrattuna (määritelmästä riippuen) ei-kantajiin tai koko väestöön. Sukusolut Copyright 99-00 by Access Excellence @ the National Health Museum. With permission to use for non-commercial educational purposes.
Havaintoja meioosista Lapsi perii toisen vastinkromosomin isältä, toisen äidiltä. Geneettinen materiaali periytyy segmentteinä. Variantit eri kohdissa periytyvät vastaavien segmenttien mukana. Jos kaksi lähekkäistä kohtaa on periytynyt samalta esivanhemmalta, on myös niiden välinen alue todennäköisesti periytynyt samalta esivanhemmalta Periytymisen päättelemiseksi otetaan näytteitä eri kohdista kromosomia. Markkerit Perimän kohtia, joissa esiintyy yksilöiden välistä geneettistä vaihtelua sijainti tunnetaan. Eri variantteja kutsutaan alleeleiksi. Yksilön alleelia voidaan määrittää DNA-näytteestä. Markkerit sijaitsevat tyypillisesti perimän ei-koodaavassa osassa ei kohdistu valintapaineita Markkerityypit SNP: yhden nukleotidin polymorfismi mikrosatelliitti eli STR: vaihtelevanmittainen sekvenssi. Kromosomi Yksilöt Alleeleista Markkeri Markkerikartta,,,,,,,,,,,,,5,,,5,,,,,,,, Alleeli Genotyyppi Alleelien uudelleenkoodaus analyysiä varten pienin kokonaisluvuin esim. 86, 88, 90 (toistojakson pituuden koodaus) tai A, T Alleelifrekvenssit Eri alleelien osuudet markkerikohdassa. Riippuvaisia tarkasteltavasta väestöstä. Usein arvioidaan tutkimusta varten kerätystä otoksesta. Markkerien informatiivisuus Markkerien periytyminen Kuvaa markkerin käyttökelpoisuutta geenikartoituksessa Hyvän markkerin alleelifrekvenssit jakautuvat tasaisesti. Polymorfismin informaatiosisältö (PIC) (0 <= PIC <= ) 0% PIC = n n n pi i= i= j= i+ p p i j Isä Äiti 0% 0% 70% 60% PIC=0.0 PIC=0.68 Lapsi
Sukupuut Rekombinaatiofraktio θ Perustajayksilöt Musta kuvaa esimerkiksi sairasta yksilöä M M Todennäköisyys, että kahden lokuksen välillä havaitaan rekombinaatio (pisteet lähtöisin vanhempien eri vastinkromosomeista) Rekombinaatio voidaan havaita, jos tekijäinvaihtokohtia on pariton määrä. Arvot vaihtelevat välillä 0 0.5 (0 kun lokukset päällekkäin, lähestyy 0.5:ttä kun lokukset etääntyvät) Eri kromosomeissa olevilla lokuksilla 0.5 koska kromosomit periytyvät toisistaan riippumatta Geneettinen etäisyys Additiivinen mitta lokusten välimatkalle / markkereiden etäisyydelle Odotusarvo tekijäinvaihtokohtien lukumäärälle kahden lokuksen välillä. Yksikkönä morgan (M) ja yleisemmin senttimorgan (cm). morganin eli 00 senttimorganin mittaiselle kromosomialueelle muodostuu odotusarvoisesti yksi tekijänvaihtokohta Geneettisen ja fysikaalinen etäisyyden vastaavuus usein epälineaarinen. Ihmisen kromosomin pituus: muutama kymmennen muutama sata senttimorgania. Tehdään usein oletus: tekijänvaihtokohtien lukumäärä ~ Poisson(n), missä n on kromosomin geneettinen pituus morganeina. Karttafunktiot Muunnos rekombinaatiofraktio θ geneettinen etäisyys m Haldanen funktio Kosambin funktio θ = ½ ( e m ) θ = m e m ( + e ) Rekombinaatiofraktio (θ) Kosambi Haldane Rekombinaatiofraktio (θ) Kosambi Haldane Geneettinen etäisyys (M) Geneettinen etäisyys (M)
Geenikartoituksen lähestymistavat Menetelmät perustuvat meioosin laskennalliseen mallintamiseen Kytkentäanalyysi sukupuuaineistoista seurataan sairauden ja alleelien periytymistä perheissä Assosiaatioanalyysi väestöaineistoista etsitään alleelien yliedustusta sairaissa ihmisissä Kytkentäanalyysi Sukupuissa joissa esiintyy perinnöllistä sairautta, sairaat yksilöt jakavat yhteisen sairausfenotyyppinsä lisäksi kohonneella todennäköisyydellä sen genomin kohdan, jossa sairausalleeli sijaitsee. Mitä kohtia sairaat yksilöt jakavat? Päätellään markkerilokusten genotyypeistä ja niiden periytymismahdollisuuksista sukupuussa. Minkälainen jakaminen on merkitsevää? Riippuu sukulaisuussuhteista (ja mahdollisesta sairausmallista) Perheaineistot Markkerikartat Kytkentäanalyysin tavoitteet Sukupuurakenteet Fenotyypit Kr. Kr. Kr. 5 5 7 Genotyypit Lupaavien alueiden etsiminen. Genominlaajuinen geenikartoitus Geenikartoituksen ensimmäinen vaihe Kytkennän osoittaminen. Kandidaattialueiden analyysi Kytkennän poissulkeminen. Kandidaattialueiden analyysi Ei välttämättä kumoa aiempia tuloksia. Lupaavien alueiden etsiminen Kytkentäanalyysimenetelmien luokittelua Fenotyyppien mukaan kvalitatiiviset ja kvantitatiiviset menetelmät Laskenta-algoritmin mukaan Elston-Stewart- ja Lander-Green -algoritmia käyttävät menetelmät Markkeri-informaation käytön mukaan Kaksipiste- ja monipistemenetelmät Sairausmallioletusten käytön mukaan Parametriset ja ei-parametriset menetelmät 5
Kytkentäanalyysiohjelmistoja Linkage Genehunter Merlin Simwalk Solar Akateemisia, ilmaisia Komentorivipohjaisia 6