RINTASYÖVÄN GENETIIKAN TUTKIMUS JA GENEETTISEN TUTKIMUKSEN TILASTOTIETEELLI- SEEN ANALYYSIIN KÄYTETYT OHJELMISTOT Breast cancer genetics research and
|
|
- Miina Salminen
- 9 vuotta sitten
- Katselukertoja:
Transkriptio
1 RINTASYÖVÄN GENETIIKAN TUTKIMUS JA GENEETTISEN TUTKIMUKSEN TILASTOTIETEELLI- SEEN ANALYYSIIN KÄYTETYT OHJELMISTOT Breast cancer genetics research and statistical analysis software used for genetic research Juuso Karvanen Opinnäytetyö Lääketieteen koulutusohjelma Itä-Suomen yliopisto Kliinisen lääketieteen yksikkö, patologia ja oikeuslääketiede Toukokuu 2012
2 ITÄ-SUOMEN YLIOPISTO Terveystieteiden tiedekunta Lääketieteen koulutusohjelma Karvanen, Juuso - Rintasyövän genetiikan tutkimus ja geneettisen tutkimuksen tilastotieteelliseen analyysiin käytetyt ohjelmistot (Breast cancer genetics research and statistical analysis software used for genetic research) Opinnäytetyö: 56 sivua ja 1 liite (14 sivua) Ohjaajat: dosentti, FT Arto Mannermaa ja professori Veli-Matti Kosma Avainsanat: rintasyöpä, genetiikan tutkimus, tilastotieteellinen analyysi Rintasyöpä on naisten yleisin syöpä Suomessa, sen esiintyvyys on myös kasvussa. Rintasyövän ennuste on jatkuvasti parantunut varhaisen diagnostiikan ja kehittyneempien hoitomenetelmien myötä. Korkea elintaso tuo mukanaan monia rintasyövän riskitekijöitä. Suurin riskitekijä on kuitenkin suvussa esiintyvä rintasyöpä. Esimerkiksi geenivirheet BRCA1 ja BRCA2 lisäävät merkittävästi yksilötasolla syövän riskiä. Nämä geenimuutokset selittävät populaatiotasolla kuitenkin vain pienen osan rintasyöpätapauksista. Rintasyövän genetiikan tutkimus on keskittynyt ns. pienen penetranssin geenimuutoksien tunnistukseen, jotka nostavat syöpäriskiä yksilötasolla vähemmän mutta ovat suuren penetranssin geenimuutoksia yleisempiä ja näin voivat populaatiotasolla olla suurempia riskitekijöitä kuin suuren penetranssin geenimuutokset. Esimerkiksi TMPRSS6-geenissä sijaitseva heterotsygootti polymorfismi on tunnistettu itäsuomalaisessa väestössä rintasyövän riskitekijäksi. Läpimurto ihmisen genomin selvityksessä sekä huima tietotekniikan kehitys on mahdollistanut sairauksien genetiikan huomattavasti aiempaa laajamittaisemman tutkimuksen. Tutkimusasetelmana on yleensä edelleen tapaus-verrokkipohjainen assosiaatiotestaus. Tutkimuskentän jatkuvan kehityksen seurauksena sekä ongelmien ja haasteiden selvittämiseksi tutkimusryhmät sekä yksityishenkilöt ovat kehittäneet genetiikan tutkimukseen suunnattuja tietokoneohjelmistoja. Suuri osa näistä ohjelmistoista ei ole kaupalliseen käyttöön kehitetty, näin ollen niiden toimintaperiaatteet, käyttötarkoitukset ja käytettävyys vaihtelevat laidasta laitaan. Aineistona toimii Kuopion rintasyöpäprojektin tapaus-verrokkitietokanta, joka on koottu Kuopion yliopistolliseen sairaalaan rintaoireen vuoksi tutkimukseen tulleista naisista huhtikuun 1990 ja joulukuun 1995 välisenä aikana. Tutkimusväestöltä on selvitetty genotyypit kymmenestä lokuksesta kromosomialueelta 22q12-q13 541:n kb:n alueelta. Tämä alue sisältää myös TMPRSS6-geenin. Käyttäen neljää eri geneettisen tutkimuksen tilastotieteelliseen analyysiin tarkoitettua ohjelmistoa sekä SPSSohjelmistoa tavoitteena oli selvittää, kuinka suuria eroja samasta aineistosta saadaan tilastollisen merkitsevyyden osalta käyttäen erilaisia biostatistiikan testejä, sekä tutkia, kuinka suuriksi erot kasvavat samoilla testauksilla eri ohjelmistojen välillä. Tavoitteena oli myös kartoittaa edelleen sporadisen rintasyövän matalan penetranssin geenimuutoksia kromosomialueelta 22q12-q13. Työ sisälsi myös erilaisten tilastotieteellisten ohjelmistojen käytön opettelun. Näiden ohjelmistojen käytöstä laadittiin myös ohje. Uusia todellisia assosiaatioita ei havaittu. Kuitenkin ohjelmistojen tulosten epätasaisuus, virheelliset assosiaatiot sekä todellisen assosiaation havaitsematta jättäminen yllättivät. Tutkielman perusteella voidaan todeta, että geneettistä assosiaatiotutkimusta tehtäessä on erittäin tärkeää perehtyä kunnolla eri ohjelmistojen toimintaperiaatteisiin ja käyttöaiheisiin ennen testausten suorittamista. On pohdittava, sopivatko tietyn ohjelmiston toiminnot omaan tutkimukseen, ovatko sen tarjoamat testausmallit riittävät ja onko ohjelmistossa erityisominaisuuksia, jotka voisivat vaarantaa tutkimuksen eheyden
3 SISÄLLYS KIRJALLISUUSKATSAUS 1. Rintasyöpä Esiintyvyys Rintasyövän luokittelu Rintasyövän hoito Rintasyövän ennusteeseen vaikuttavat tekijät Rintasyöpä ja perinnöllisyys Perinnöllinen rintasyöpä ja korkean penetranssin geenimuutokset Sporadinen rintasyöpä ja matalan penetranssin geenimuutokset Rintasyövän genetiikan tutkimus Geneettisen tutkimuksen haasteet ja mahdollisuudet Assosiaatiotutkimus apuvälineenä uusien riskigeenien löytämisessä Kytkentäepätasapaino ja haplotyypit Kandidaattigeenien valinta ja siihen liittyvät ongelmat Koko genomin kattava lähestymistapa Assosiaatiotutkimuksen ongelmat ja mahdollisuudet Tilastotieteellisiä analyysejä geneettisissä tutkimuksissa Tilastollinen merkitsevyys Ristiintaulukointi eli 2 -riippumattomuustesti ja Fisherin eksakti nelikenttätesti Regressioanalyysi ja logistinen regressio Cochran-Armitagen trenditesti Haplotyyppiryväkset ja haplotyyppiestimaatio Usean testauksen korjaus sekä merkitsevyystason ja tutkimusaineiston arviointi Tilastotieteellisen analyysiin suunnatut ohjelmistot SPSS Beagle 23
4 4.2.1 Haplotyyppiestimaatio ja virheiden arviointi Assosiaatiotestaus Beaglella Plink Tietokantojen ylläpito Yhteenveto tietokannasta Assosiaatiotestaus Genome-wide Association Study Software, SNPTEST Haploview 27 TYÖSELOSTUS 5. Työn tavoitteet Materiaalit ja menetelmät Aineisto Käytetyt ohjelmistot SPSS Ohjelmistot formaattimuutoksiin Beagle PLINK Haploview SNPTEST Beagle ja PLINK Tulokset SPSS Beagle PLINK PLINK Beaglen arvioimilla genotyyppitiedoilla SNPTEST Haploview Pohdintaa 46
5 8.1 Merkitsevät tulokset ja niiden virhelähteet SPSS Beagle PLINK SNPTEST Haploview Ohjelmistojen soveltuvuus työssäni tekemään geneettiseen assosiaatiotutkimukseen Geneettisen assosiaatiotutkimuksen luotettavuus 49 Kirjallisuus 50 Liite 1. Input-tiedostojen tekeminen
6 1. Rintasyöpä 1.1 Esiintyvyys ja ympäristöstä riippuvat riskitekijät Rintasyöpä on naisten yleisin syöpä Suomessa, sen esiintyvyys on myös kasvussa (ks. Kuva 1). Vuonna 2006 Suomessa todettiin 4079 uutta rintasyöpätapausta, vuonna 2008 todettiin tapausta ja vuonna 2009 uusia tapauksia todettiin (Suomen syöpärekisteri, 2010) Miehellä rintasyöpä on harvinainen; keskimäärin 18 uutta tapausta Suomessa vuosina Naisilla rintasyövän ikävakioitu ilmaantuvuus on 86,6 naista naista kohden. (Suomen Syöpärekisteri, 2010, Pukkala ym., 2006) Maailmanlaajuisesti rintasyöpään kuolee yli naista vuosittain. Tämä käsittää 7 % kaikista maailman syöpäkuolemista. (WHO, 2006) Vuonna 2008 rintasyöpään kuoli Suomessa 824 naista, kuolleisuus oli tällöin 13,5 naista naista kohden. Rintasyövän ennuste on siis hyvä (ks. Kuva 1). Vuosien syöpärekisteriaineistossa suhteellinen viisivuotiselossaololuku oli 89 %. (Suomen Syöpärekisteri, 2010) Kuva 1. A: Uusien Syöpätapausten todettu ( ) ja ennustettu (2015) tapausmäärä naisilla. B: Ikävakioitu kuolleisuus naisilla sekä ennustettu kuolleisuus (Kuva: Suomen Syöpärekisteri) 6
7 Rintasyöpä on korkean elintason maiden sairaus ja sen ilmaantuvuus on lisääntynyt yli 80 % luvulta lähtien. Korkea elintaso tuo mukanaan monia rintasyövän riskitekijöitä: varhainen kuukautisten alkamisikä parantuneen ravitsemuksen ansiosta, viivästynyt ensisynnytys, vähäinen määrä lapsia, lisääntyvä ylipaino, lisääntynyt alkoholin käyttö, runsasrasvainen ruokavalio ja hormonikorvaushoidot ovat riskitekijöitä. Rintasyövän suurin riskitekijä on korkea ikä. (Laurance, 2006) Myös säteily- ja esim. dikloori-difenyyli-trikloorietaani (DDT) -altistus varsinkin ennen puberteettiä voivat lisätä sporadisen rintasyövän riskiä. (Clapp ym., 2007) 1.2 Rintasyövän luokittelu Rinta koostuu rauhasliuskasta, lobuluksesta sekä niitä yhdistävistä rintatiehyistä, duktuksista. Rintasyövän päätyypit ovat duktaalinen eli rintatiehyistä peräisin oleva rintasyöpä sekä lobulaarinen eli rauhasliuskan soluista lähtevä rintasyöpä. Duktaalinen karsinooma alkaa maitotiehyitä reunustavasta epiteelisolukosta. Ensimmäinen muoto on carcinoma ductale in situ. Tämä muoto taudista ei voi vielä metastasoida, koska se ei ole läpäissyt tiehyen tyvikalvoa. Invasiivinen karsinooma kasvaa maitotiehyiden ulkopuolelle, tällöin metastasointi on mahdollista. Kaikista rintasyövistä noin 70 % on duktaalisia karsinoomia. Lobulaarinen karsinooma saa alkunsa duktusten päistä olevista asinuksista. Carcinoma lobulare in situ todetaan yleensä sattumalöydöksenä. Sitä ei pidetä varsinaisesti syövän esiasteena, vaan enemmänkin merkkinä vaarasta saada rintasyöpä. Infiltroiva lobulaarinen karsinooma on toisiksi yleisin rintasyövän tyyppi (10 20 %). Lobulaariseen karsinoomaan liittyy keskimääräistä suurempi bilateraalisen rintasyövän riski. Erikoistyyppisiksi rintasyöviksi kutsutaan karsinoomia, jotka eivät ole lobulaarisia tai duktaalisia rintasyöpiä. Näitä on Papillaarinen karsinooma, joka kasvattaa tiehyiden sisään papillaarisia rakenteita. Medullaarinen karsinooma esiintyy laajoina huonosti erilaistuneina solusaarekkeina, tämä rintasyöpä liittyy keskimääräistä useammin BRCA-geenimutaatioon. Musinoosissa karsinoomassa esiintyy paljon limaa solujen ulkopuolella. (Joensuu ym., 2006) 1.3 Rintasyövän hoito Paikallisen rintasyövän ensisijaishoito on leikkaus. Leikkauksen tavoitteena on poistaa kasvain sekä paikalliset imusolukemetastaasit. Samalla selviää ennusteeseen voimakkaasti vaikuttava kasvaimen koko sekä imusolmukemetastaasien lukumäärä. Kirurgisen hoidon tavoite on hyvä hoito- ja kosmeettinen tulos. Mastektomia eli rinnanpoisto tulee kysymykseen, jos säästävä leikkaus ei ole mahdollinen 7
8 tai jos potilas toivoo koko rinnan poistoa. Myös toinen, terve rinta voidaan poistaa ennaltaehkäisevänä toimenpiteenä, jos potilaalla on esim. rintasyövälle altistava geenivirhe. Mastektomian jälkeen rintarekonstruktio on mahdollinen. Sädehoito leikkauksen jälkihoitona tuhoaa leikkausalueelle tai paikallisiin imusolmukkeisiin mahdollisesti jääneet syöpäsolut. Solunsalpaajat lisäävät rintasyöpäpotilaan keskimääräistä elinikää noin 8 12 kuukautta. Niiden aiheuttamat haittavaikutukset kuitenkin tulee ottaa huomioon hoitoa suunniteltaessa. Hormonaalinen hoito on hidasvaikutteinen, mutta yleensä tehokas rintasyövissä, jotka on todettu hormonireseptoripositiivisiksi. Vasta-ainehoito tulee kyseeseen, kun rintasyövässä on osoitettu HER-2-geenin monistuma in situhybridisaatiolla. Perinteinen menetelmä tässä on ollut fluoresoivalla merkkiaineella leimattu koetin, jota tarkistellaan suoraan fluresenssimikroskoopin avulla (FISH-menetelmä). Toinen menetelmä on kromogeeninen in situ hybridisaatio (CISH), jolloin koetin leimataan esim. biotiinilla ja leimattu koetin on tunnistettavissa immunohistokemiallisesti. CISH-menetelmän etuna on kudoksen morfologian helpompi tarkastelu, koska menetelmässä käytetään valomikroskooppia FISH-menetelmän fluresenssimikroskoopin sijaan. Vuonna 2010 julkaistussa tutkimuksessa näiden menetelmien (FISH / dual-cish) kyky tunnistaa HER-2 -positiiviset rintasyövät todettiin miltei identtisiksi. (Kato ym., 2010) Trastutsumabi yhdistettynä solusalpaajahoitoon parantaa potilaiden elinaikaa ja on ensisijaishoito rintasyövissä, joissa HER-2-geeni on monistunut. Lisäksi kaikille potilaille voidaan antaa liitännäislääkehoitona solunsalpaajia, hormonaalisia hoitoja tai näiden yhdistelmää. Liitännäislääkehoidon tarkoitus on subkliinisten metastaasien tuhoaminen. Liitännäislääkehoidon arvellaan olevan merkittävin rintasyövän ennustetta parantanut yksittäinen tekijä viime vuosikymmeninä. (Joensuu ym., 2006) 1.4 Rintasyövän ennusteeseen vaikuttavat tekijät Rintasyövän tärkein ennusteeseen vaikuttava tekijä on metastaattisten imusolmukkeiden määrä yleensä kainalossa. (Joensuu ym., 2006) Syöpien leviämisastetta kuvaava (stage) yleisesti käytetty TNM-luokitus on myös rintasyövän ennusteen määrityksessä käyttökelpoinen. Tumor size on primäärituumorin kokoa kuvaava numeroarvo nollasta neljään, jossa T1 = tuumorin koko korkeintaan 2 cm ja T4 = tuumori yli 5 cm halkaisijaltaan ja se on kiinnittynyt ihoon ja/tai rintalihaksiin. Lymph Node kuvaa syövän levinneisyyttä imusolmukkeisiin: N0 = ei imusolmukemetastaaseja, N1 = syöpä levinnyt kainalon imusolmukkeisiin, N2 = syöpä levinnyt kainalon imusolmukkeisiin, jotka ovat tarttuneet toisiinsa ja muihin rakenteisiin, N3 =syöpä on levinnyt soliskuopan ylä- tai alapuolisiin sekä rintalastan alapuolisiin imusolmukkeisiin. Metastases eli etäpesäkeluokitus kuvaa, onko syöpä levinnyt muihin elimiin. Luoki- 8
9 tukset ovat M0, jolloin syöpä ei ole metastasoinut perifeerisiin elimiin, sekä M1, jolloin syöpä on metastasoinut. (Joensuu ym., 2006) Histologisella graduksella määritetään syövän erilaistumisastetta. Usein rintasyövän gradeerauksessa käytetään Bloom-Richardsonin Gradusta, jossa histologisen näytteen perusteella annetaan 1 3 pistettä kolmesta histologisesta ominaisuudesta: Tuumorin tubulusmuodostus; runsaasta tubulusmuodostuksesta 1 piste, vähäisestä 3. Mitoosien lukumäärä; korkeasta mitoottisesta aktiivisuudesta 3 pistettä, matalasta 1 piste. Kolmas arvosteluperiaate on tumien pleomorfismi, jossa tumien kokoa ja säännöllisyyttä arvostellaan. Pienistä ja säännöllisistä tumista 1 piste, suurista, epäsäännöllisistä 3 pistettä. Pisteet lasketaan yhteen ja niiden perusteella määritellään gradus. 3 5 pistettä = hyvin erilaistunut kasvain; 5 7 = kohtalaisesti erilaistunut kasvain ja 8 9 = huonosti erilaistunut kasvain (Tambasco ym., 2008). Kansainvälisen syöpäinstituution tutkimuksen mukaan rintasyövän histologisen graduksen sekä levinneisyysasteen (stage) vaikutus viisivuotiselossaololukuun on huomattava: Gradus I rintasyövän viisivuotiselossaololuku oli 0,93, gradus II 0,82, gradus III 0,65 ja gradus IV 0,64. Kuitenkin levinneisyysluokituksen vaikutus ennusteeseen on paljon merkittävämpi: stage I rintasyövän viisivuotiselossaololuku oli 0,96, stage II 0,82, stage III 0,53 ja stage IV 0,18. (Henson ym., 1991) Vuonna 2009 julkaistussa tutkimuksessa todettiin rintasyöpäpotilaiden kroonisesti koholla olevien CRP- ja SAA-arvojen olevan yhteydessä huonomman ennusteen tautiin. CRP ja SAA ovat lähinnä maksan syntetisoimia akuutin faasin proteiineja, joiden pitoisuus kohoaa epäspesifisti tulehdusreaktion aikana sytokiinien (mm. interleukiinit -1 ja -6 sekä TNF) vaikutuksesta. (Fred Hutchinson Cancer Research Center) Rintasyöpäkasvainsolukossa mahdollisesti esiintyvät estrogeeni- sekä erityisesti progestiinireseptorit (ER, PgR) ovat ennustetta parantavia tekijöitä käytetystä hoidosta riippumatta. (Bundred 2001) HER 2-reseptoripositiivisisissa rintasyövissä ennuste on huonompi. Suuri HER2- reseptoripositiivisuus korreloi myös 1993 tehdyssä tutkimuksessa syövän korkeamman stagen sekä kainaloimusolmukemetastasoinnin kanssa. Suuri HER2-reseptoripositiivisuus ennustaa myös kasvaimen vähäistä ER- sekä PgR-aktiivisuutta. (Seshadri ym. 1993) 1.5 Rintasyöpä ja perinnöllisyys Rintasyövän suurin riskitekijä on suvussa esiintyvä rintasyöpä. Jos kahdella lähisukulaisella on rintasyöpä, on yksilön riski sairastua rintasyöpään yli 25 % ennen 70 ikävuotta. Lähisukulaisilla esiintyvät bilateraaliset tai nuorella iällä ilmaantuvat rintasyövät kasvattavat tätä riskiä entisestään. Rintasyövän etiologian voidaan katsoa jakautuvan seuraavasti: Periytyvä alttius rintasyöpään, jolloin tauti esiintyy suvuittain. Tällöin rintasyöpätapauksia suvussa tai perheessä on useita, ja taustalta löytyy jokin tietty 9
10 geenimutaatio. Yleisimmät tällaiset geenimutaatiot (BRCA1, BRCA2) periytyvät autosomissa dominantisti. Sporadinen eli ei-periytyvä rintasyöpä ei esiinny suvuittain, eikä sairautta voida selittää yhdellä ainoalla tekijällä. (Rubin ym., 2007) Perinnöllinen alttius rintasyöpään ja korkean penetranssin geenimuutokset On arvioitu, että noin 5 % rintasyövistä selittyy täysin perinnöllisellä alttiudella. Perinnölliseen rintasyövän alttiuteen liittyy aina jokin tietty, vahvasti sairauteen assosioitunut geenimuutos. Näitä kutsutaan korkean penetranssin geenimuutoksiksi. Kromosomialueella 17q21 sijaitsee tuumorisupressorigeeni BRCA1. Sen tuottama proteiini BRCA1 on E3 ubiquitiini ligaasi, joka vaikuttaa mm. DNA- korjaukseen, transkription säätelyyn sekä sukupuolikromosomin inaktivaatioon meioosin aikana. BRCA2-geeni sijaitsee kromosomialueella 13q12.3. BRCA2-geenin tuottama proteiini toimii samankaltaisesti kuin BRCA1-proteiini, ja näiden toiminta on jossain määrin toisiinsa liittyvää. Myös BRCA2-proteiini korjaa DNA:ta, sen oletetaan myös osallistuvan homologiseen rekombinaatioon. Erityisesti BRCA2 toimii yhteistyössä monien muiden proteiinien kanssa. Merkittävä tällainen proteiini on DNA-vaurioita korjaava RAD51, jonka toimintaa ja aktiivisuutta BRCA2 sekä myös BRCA1 säätelevät (Boulton, 2006). Naisilla, joilla on BRCA-1 geenin pistemutaatio tai deleetio jo itulinjan soluissa, on elämänsä aikana %:n riski sairastua rintasyöpään. Näistä syöpätapauksista yli puolet todetaan alle 50 vuoden iässä. 30 %:lla naisista, joilla rintasyöpä on todettu alle 45-vuotiaana, on havaittu mutaatio BRCA1-geenissä. Nykyään arvioidaan, että 3 % kaikista rintasyöpätapauksista johtuu BRCA1-mutaatiosta. BRCA1- mutaatio kasvattaa myös munasarjasyövän riskiä. Naisilla, joilla BRCA2-geeni on mutatoitunut, on elämänsä aikana %:n riski sairastua rintasyöpään. Myös BRCA2-mutaatio kasvattaa munasarjasyövän riskiä (Rubin ym., 2007). Muita perinnölliseen rintasyöpään liittyviä geenimuutoksia on tuumorisupressorigeeni CHEK2 (cell cycle checkpoint kinase 2), tämä geenimuutos voi assosioitua sekä perinnölliseen että sporadiseen rintasyöpään. Usein rintasyövässä tuumorisuppressorigeeni p53 on mutatoitunut. Tämän geenin itulinjan solujen mutaatioon liittyy Li-Fraumenin syndrooma, joka altistaa rintasyövän lisäksi useille muille maligniteeteille (Royds ym., 2006). PALB2 (Partner and localizer of BRCA2) -geenin tuottama samanniminen proteiini toimii yhdessä BRCA2-proteiinin kanssa. Tämä interaktio mahdollistaa eräät BRCA2:n DNA-korjaus- sekä tuumorisuppressoritoiminnot. Tässä geenissä havaittu raaminsiirto (framshift) mutaatio c.1592delt on tunnistettu perinnöllisen rintasyövän riskitekijäksi suomalaisessa tutkimusväestössä. Tällä mutaatiolla on mahdollisesti myös assosiaatioita perinnölliseen eturauhassyöpään (Erkko ym., 2007). 10
11 1.5.2 Sporadinen rintasyöpä ja matalan penetranssin geenimuutokset Vaikka sporadisen rintasyövän ympäristö- sekä elintapariippuvaisia riskitekijöitä tunnetaan jo varsin hyvin, nämä eivät yksin selitä kaikkia sporadisia rintasyöpätapauksia. Geenimuutoksia, jotka nostavat rintasyövän riskiä yksilötasolla vain vähän, kutsutaan matalan penetranssin geenimuutoksiksi. Tällaisia matalan penetranssin geenimuutoksia on löydetty useita. Vaikka nämä geenimuutokset eivät yksilötasolla nosta rintasyövän riskiä yhtä merkitsevästi kuin BRCA1 ja BRCA2, ovat ne huomattavasti yleisempiä ja voivat populaatiotasolla nostaa rintasyövän riskiä korkean penetranssin geenimuutoksia enemmän. Yksilötasolla useampi matalan penetranssin geenimuutos yhdistettynä elämäntapa- ja ympäristötekijöihin voi nostaa rintasyövän riskin samalle tasolle korkean penetranssin geenimuutoksien kanssa (Bradbury ym., 2007). Esimerkki tällaisesta matalan penetranssin mutaatiosta on kromosomialueella 22q12-q13 sijaitseva TMPRSS6-geeni, joka koodaa tyypin II solukalvon seriiniproteaasia, matriptaasi-2:ta. Tämä solukalvoproteiini pystyy heikentämään soluvälitilan rakennekomponentteja sekä fysiologisissa että patologisissa tapahtumissa. Itäsuomalaisessa väestössä tässä geenissä sijaitsevan polymorfismin (SNP) rs heterotsygootti genotyyppi TC todettiin rintasyövän riskitekijäksi. (Hartikainen ym., 2006) 11
12 2. Rintasyövän genetiikan tutkimus 2.1 Geneettisen tutkimuksen haasteet ja mahdollisuudet Yhden geenin sairauksien genetiikkaa on opittu ymmärtämään, ja näiden sairauksien havaitseminen on helpottunut huomattavasti viime vuosikymmeninä. Näiden sairauksien genetiikan selvittämiseen suvuittain suoritettavat tutkimukset (linkage studies) ovat olleet erittäin toimivia ja tehokkaita. Tämän merkittävän tieteellisen edistysaskeleen on mahdollistanut tietotekniikan kehittyminen ja ihmisen genomin laajamuotoinen tutkiminen. Myös yleisesti noussut terveydenhuollon taso on edesauttanut tätä kehitystä. Kuitenkin populaatiotasolla nämä yhden geenin sairaudet ovat harvinaisia, joten kansanterveydelle näistä tieteellisistä läpimurroista ei ole ollut merkittävää etua. Yleisempää on, että yksilön fenotyyppi on usean geneettisen sekä ympäristötekijän summa. (Risch, 2000) Rintasyövän tunnetut korkean penetranssin geenimuutokset (BRCA1, BRCA2 ym.) selittävät vain noin % perinnöllisestä rintasyövästä % perinnöllisten rintasyöpätapausten genetiikasta on siis vielä ainakin osin selvittämättä. On epätodennäköistä, että populaatiotasolla yleisiä yksittäisiä suuren (vrt. BRCA1 ja BRCA2) penetranssin rintasyöpägeenejä on vielä löytämättä. Aiemman hypoteesin mukaan loput rintasyövälle altistavat geenimutaatiot olisivat mitä ilmeisimmin populaatiotasolla suhteellisen yleisten matalan penetranssin geenimuutokset, jotka yhdessä ympäristö- ja elintapatekijöiden kanssa nostaisivat alttiutta rintasyövälle (Easton, 1999). Hieman toisenlaisen näkökulman syöpäsairauksien genetiikan tutkimukseen tuo uudempi harvinaisten varianttien hypoteesi. Tämän hypoteesin mukaan huomattava osa monien sairauksien, myös rintasyövän, perinnöllisestä alttiudesta selittyy populaatiotasolla erittäin harvinaisten geneettisten varianttien kautta. Jotkin näistä variaatioyhdistelmistä voivat nostaa yksilötasolla sairastumisriskiä huomattavasti. Yleinen ajattelumalli on, että tällaiset variaatioyhdistelmät olisivat populaatiospesifisiä. Harvinaisten varianttien tunnistuksella voitaisiin paremmin arvioida yksilön sairastumisriskiä. Näiden harvinaisten korkean penetranssin varianttejen tunnistus olisi siis kliinisessä käytössä selkeästi matalan penetranssin geenimuutosten tunnistamista parempi väline. (Bodmer ym., 2010) 2.2 Assosiaatiotutkimus apuvälineenä uusien riskigeenien löytämisessä Käytetyin tapa monitekijäisen sairauden geneettisen taustan selvittämiseen on tapausverrokkipohjainen assosiaatiotutkimus. Tässä tutkimusmallissa geneettisen variaation yleisyyttä verra- 12
13 taan sairaiden yksilöiden (tapausten) ja terveiden yksilöiden (verrokkien) välillä. Mikäli tutkitun genotyyppien jakautumisen vaihtelu on tilastollisesti merkitsevää tapaus- ja verrokkiryhmien välillä, on assosiaatiota havaittu. (Risch, 2000) Kytkentäepätasapaino ja haplotyypit Yksi SNP (Single Nucleotide Polymorphism, yhden emäksen polymorfismi, joka esiintyy vähintään 1 %:lla väestöstä) genomissa voi itsestään toimia sairauden riskitekijänä, jos muutos on esim. DNAkorjausproteiinia koodaavassa geenissä. Koska todennäköisyys tällaisen toiminnallisen polymorfismin tunnistamiseen kandidaattigeeniä valitessa on pieni, voivat geneettisinä muuttujina toimia muut SNP:t, jotka ovat kytkentäepätasapainossa sen lokuksen kanssa, jonka tietty polymorfismi on riskitekijä. Kytkentäepätasapaino on ei-sattumanvaraista assosiaatiota eri lokusten alleelien välillä. Kytkentäepätasapainossa olevat alleelit esiintyvät siis odotettua useammin yhdessä (esim. tautialleeli ja markkerialleeli). Oletetaan, että DNA-korjausproteiinin geeni on mutatoitunut, jolloin se on muuttunut syövälle altistavaksi geeniksi sukupolvessa 1, tällöin mutaatiota fyysisesti lähellä olevat geneettiset alueet periytyvät todennäköisesti seuraaville sukupolville mutaation mukana. Näin ollen alkuperäistä mutaatiota lähellä oleva geneettinen lokus X, joka on mutaation kanssa kytkentäepätasapainossa, periytyy usein tämän sairaudelle altistavan mutaation kanssa. Tästä seuraa, että mikäli assosiaatiotutkimuksessa geneettisenä markkerina toimii lokus X, olisi se todennäköisesti assosiaatiossa lisääntyneeseen sairastumisen riskiin, vaikkei se toiminnallisesti lisäisi sairastumisen riskiä. Riittävän monen sukupolven jälkeen geneettinen rekombinaatio purkaa kytkentäepätasapainon lokus X:n ja syövälle altistavan mutaation välillä, eikä tästä sukupolvesta tehdyssä assosiaatiotutkimuksessa lokus X enää assosioidu lisääntyneen sairauden kanssa (ks. Kuva 2). Runsas kytkentäepätasapaino voi olla sekä hyödyllistä että haitallista assosiaatiotutkimuksissa: runsas kytkentäepätasapaino lisää todennäköisyyttä löytää alueet genomissa, joilla on assosiaatiota esim. rintasyöpään, toisaalta taas runsas kytkentäepätasapaino hankaloittaa varsinaisen toiminnallisen polymorfismin lokuksen paikannusta (Shifman ym., 2003). Kytkentäepätasapaino on mitattava suure. Yleisimmin käytetyt suureet ovat D' sekä r 2. Molempien numeeriset arvot ovat 0 1, jossa 0 = ei kytkentäepätasapainoa ja 1 = täysi kytkentäepätasapaino. r 2 ottaa huomioon rekombinaation ja alleelifrekvenssin, joten se on parempi kuvaaja assosiaatiotutkimuksen voimakkuudesta. Haplotyypiksi kutsutaan tietynlaista eri lokusten alleelien kombinaatiota kromosomissa, joka periytyy samanlaisena kokonaisuutena kytkentäepätasapainon seuraksena. Hap- 13
14 lotyyppi voi sisältää vain muutaman fyysisesti lähekkäin olevan alleelin tai lukuisan määrän alleeleja koko kromosomin alueelta. (Pharoah ym., 2004) Kuva 2: Malli kytkentäepätasapainon purkautumisesta sukupolvien (G) aikana geneettisen rekombinaation seurauksena. Geneettiset alueet, jotka ovat lähellä mutaatiota (musta täplä), ovat siihen assosioituneena useamman sukupolven kuin fyysisesti kauempana olevat markkerit. (Kuva: Hiltunen M., 2000) Kandidaattigeenien valinta ja siihen liittyvät ongelmat Geneettisessä assosiaatiotestauksessa geneettiset muuttujat ovat yhden tai useamman SNP:n genotyypit sekä tapauksilla että verrokeilla. Ihmisen genomiprojektin myötä on tunnistettu suuri määrä SNP:itä. Tämä yhdistettynä edullisten tutkimusmenetelmien kehittymiseen on lisännyt runsaasti assosiaatiotutkimusten määrää. Useimmissa syövän assosiaatiotutkimuksissa geneettiset muuttujat valitaan niiden funktion perusteella, esim. alueet, jotka koodaavat karsinogeneesiin liittyviä proteiineja. Tällaisia ovat mm. solusyklin säätelijät, tuumorisupressorigeenit ja DNA-korjausproteiinit. Näillä kandidaattigeeneillä oletetaan olevan assosiaatiota lisääntyneeseen sairausriskiin perustuen niiden tunnettuihin funktioihin (Pharoah ym., 2004). Kandidaattigeenien valinta perustuu siis etukäteen laadittuihin hypoteeseihin tai aiempiin tutkimustuloksiin. Kuitenkin, tähän hypoteettiseen lähestymistapaan liittyy kritiikkiä; useat kandidaattigeenivalintaan perustuvat tilastollisesti merkitsevät tutkimukset eivät ole niitä seuraavissa tutkimuksissa enää saaneet merkitseviä tuloksia. Ovatko kandidaattigeenin valintaan pohjautuvat tutkimukset siis epäluotettavia? Toinen kritiikki tällaista lähestymistapaa vastaan on niiden perustuminen oletuksiin, joita joidenkin kriitikoiden mukaan ei vielä nykyisellä tietotasolla pystytä luotettavasti tekemään. Kandidaattigeenit tulisikin valita tarkan harkinnan jälkeen: minkälaisia toiminnallisia eroavaisuuksia kandidaattigeenin eri variaatioilla on? Myös tutkittavan taudin biologia, etiologia ja patologia tulisi ottaa 14
15 huomioon kandidaattigeeniä valitessa. Tutkimukset, joissa selviää esim. syöpäsolukossa ilmaantuvat proteiinit, voivat antaa arvokasta tietoa kandidaattigeenin valintaan (Tabor ym., 2002). Kandidaattigeenin valinnassa analyysit tulisi rajoittaa geenin koodaaville jaksolle, erityisesti geenin ekspressiota säätelevät alueet ovat tutkimisen arvoisia; moniin sairauksiin liittyy epänormaali proteiiniekspressio. Pienestä kantajoukosta lähtöisin olevan populaation valitseminen tutkimukseen on myös hyödyllistä, sillä populaatio on geneettisesti homogeeninen ja yksi haplotyyppi saattaa olla assosiaatiossa sairauden kanssa (Pharoah ym., 2004) Koko genomin kattava lähestymistapa Kandidaattigeenin valintaan perustuvia rajoituksia on yritetty välttää koko genomin kattavalla lähestymistavalla. Tässä menetelmässä tunnistetaan ja analysoidaan koko genomista joukko SNP:tä, jotka riittävällä tarkkuudella merkitsevät muut tietyn frekvenssin SNP:t (Carlson ym., 2004). Tällaista tutkimusjärjestelyä varten pitää genomista ensin tunnistaa kaikki yleiset muunnelmat ja sen jälkeen valita sopiva joukko tagsnp:ja (merkki-snp eli SNP, joka on vahvasti kytkentäepätasapainossa sitä fyysisesti lähellä olevien muiden SNP:n kanssa), joiden genotyyppi tapaus- verrokki tutkimusväestöltä sitten selvitetään. Arviolta 200,00 500,00 SNP:tä tarvitaan, jos halutaan riittävällä tarkkuudella merkitä kaikki SNP:t, joiden harvinaisen alleelin frekvenssi on yli 5 %. (Krugylak, 1999) Tätä menetelmää on käytetty eräässä rintasyöpätutkimuksessa menestyksekkäästi: SNP:tä, joiden arveltiin kattavan 77 % eurooppalaisten yleisistä SNP:tä sisällytettiin tutkimukseen. Arveltiin, että sattuman ansiosta havaittaisiin 1343 merkitsevää (p<0,05) SNP:tä. Kuitenkin 1792 SNP:tä sai merkitsevän arvon. (Easton ym., 2007) Assosiaatiotutkimuksen ongelmat ja mahdollisuudet Tähän mennessä vain muutamia vakuuttavia syövälle altistavia alleeleja on tunnistettu käyttäen geneettistä assosiaatiotutkimusta. Merkittävä syy tähän on pienten tutkimusväestöjen käyttö, jolloin tutkimusten tilastollinen voimakkuus ei ole riittävä. Yleinen ilmiö on assosiaation havaitseminen tutkittavan geneettisen muuttujan ja taudin välillä ensimmäisessä tutkimuksessa. Myöhemmissä tutkimuksissa tätä samaa assosiaatioita ei enää havaita. Suurin osa assosiaation havainneista ensimmäisistä tutkimuksista, joilla on saavutettu vaatimaton tilastollinen merkitsevyys, ovat vääriä positiivisia (tyypin I virhe, ns. hyväksymisvirhe). Tämä johtuu siitä, että mahdollisten geneettisten polymorfismien määrä on hyvin suuri ja todennäköisyys, että yksittäinen polymorfismi on assosiaatiossa sairauden kanssa, 15
16 on hyvin pieni. Näiden väärien positiivisten tulosten määrää voidaan pienentää käyttämällä ankarampia tilastollisen merkitsevyyden tasoja sekä parantamalla kandidaattigeenien valintaa. Karsinogeneesin molekylaarisen perustan parempi ymmärrys, ja sen soveltaminen kandidaattigeenien valintaan sekä tutkimusväestöjen koon kasvatus auttanevat syövälle altistavien geenien löytämisessä (Pharoah ym., 2004). Assosiaatiotutkimusten yleisiä virheitä aiheuttavat tekijät ovat pienten tutkimusväestöjen käyttö, usean testauksen aiheuttamat virheet, satunnaiset virheet sekä huonosti valittu tutkimusväestö: esim. tapauksille valitut verrokit ovat peräisin eri alapopulaatiosta. Tutkimukset tulisi myös mahdollisuuksien mukaan yrittää toistaa: onko ensimmäisessä tutkimuksessa havaittu assosiaatio voimassa vielä jatkotutkimuksessa? Läheisten lokusten kytkentäepätasapainon huomiotta jättäminen voi myös johtaa virheellisiin tuloksiin. Mielivaltaisesti valitulta geneettiseltä alueelta tunnistetun assosiaation perusteella tunnistetut kandidaattigeenit ovat myös virheherkkiä, ja siksi kandidaattigeenien nimeäminen tältä pohjalta on todennäköisesti perusteetonta. Assosiaatiotutkimusten virheiden todennäköisyyttä voidaan pienentää seuraavasti: Tutkimusten toistamisen ottaminen yleiseksi käytännöksi pienentäisi hyväksymisvirheen todennäköisyyttä. Tämä olisi hyödyllistä erityisesti tapauksissa, joissa ensimmäisen tutkimuksen merkitsevyys on lähellä hyväksymisen raja-arvoja. Tutkimusväestön valintaan tulisi kiinnittää enemmän huomiota. Näin voidaan rajoittaa tutkimusväestön erilaisten alusrakenteiden vaikutusta tutkimuksesta saataviin tuloksiin. Tällä periaatteella myös tutkimusväestön etnisen taustan selvittäminen on perusteltavaa. Tutkimuksen voimakkuus riippuu monista tekijöistä mm. paikallisen kytkentäepätasapainon mallista, alleelien frekvenssistä sekä geneettisestä heterogeenisyydestä. Tutkimusväestön koko tulisi valita sillä oletuksella, että näiden tekijöiden arvot eivät välttämättä ole optimaalisia, esim. jos oletetaan, että tietyt alleelit ovat harvinaisia ja kytkentäepätasapaino ei ole täydellistä. Usean testauksen suorittaminen usealla muuttujalla tai itsenäisillä fenotyypeillä johtaa tyypin I virheeseen, kun käytetään nimellisiä merkitsevyystasoja. Kaikkien testauksien tulokset tulisi raportoida tutkimusten tulos -osioissa, olivatpa ne merkitseviä tai ei. (Cardon ja Bell, 2001) 16
17 3. Tilastotieteellisiä analyysejä geneettisissä tutkimuksissa 3.1 Tilastollinen merkitsevyys Tilastotieteessä ennen testien suorittamista laaditaan kaksi hypoteesia, Nollahypoteesia testataan aineiston pohjalta laskettavan testisuureen avulla. Nollahypoteeseille laaditaan vastahypoteesi, jolle pyritään saamaan tukea tilastollisen testauksen avulla. Jos testi on tilastollisesti merkitsevä, voidaan vastahypoteesi hyväksyä, jos ei, jää nollahypoteesi voimaan. Tilastotieteellisen testin tulosta pidetään tilastollisesti merkitsevänä, kun on epätodennäköistä, että tulos on saatu sattumalta. Ennen testaamista valitaan testille merkitsevyystaso,, joka on todennäköisyys hyväksymisvirheelle (hyväksytään vastahypoteesi, vaikka nollahypoteesi on tosi). Tilastotieteellisten testien tilastollista merkitsevyyttä mitataan useimmiten p-arvolla. P-arvo mittaa, kuinka vahvaa näyttö nollahypoteesia vastaan on. Tilastollisesti merkitsevinä pidetään testejä, joiden p-arvo on pienempi, kuin testille määritetty merkitsevyystaso, joka on yleensä 5 % eli 0,05. Tällöin, kun p-arvo on pienempi kuin 0,05 voidaan testiä pitää tilastollisesti merkitsevänä. Tämä arvo on keinotekoisesti valittu, eikä se perustu matemaattisiin tosiseikkoihin. (Sterne, 2001, McPherson, 1990) 3.2 Ristiintaulukointi eli 2 -riippumattomuustesti ja Fisherin eksakti nelikenttätesti Ristiintaulukointi on keino tutkita muuttujien välistä riippuvuutta. Testin perusoletus (nollahypoteesi) on, että perusjoukossa ei esiinny riippuvuutta. Geneettisessä testauksessa tämä tarkoittaisi että genotyyppien frekvenssien välillä ei olisi eroja tapausten ja verrokkien välillä. 2 -riippumattomuustestissä taulukoidaan havaitut frekvenssit. Varsinainen testi perustuu taulukossa olevien havaittujen arvojen vertaamista odotettuihin frekvensseihin. Testisuureen arvo on sitä suurempi, mitä enemmän odotetut ja todelliset havaitut frekvenssit poikkeavat toisistaan. Mitä suurempi tämä arvo on, sitä perustellumpaa on hylätä nollahypoteesi (X ja Y eivät ole riippuvia toisistaan) ja hyväksyä hypoteesi, jonka mukaan X:n ja Y:n arvot ovat riippuvia toisistaan. (McPherson, 1990) Kun testiväestön koko on pieni tai tutkitut genotyyppifrekvenssit ovat harvinaisia, ei 2 - riippumattomuustesti toimi kunnolla, jolloin Fisherin eksakti nelikenttätesti on käyttökelpoinen. Tässä testauksessa muuttujat sijoitetaan esim. 2x2-taulukkoon, jonka avulla tutkitaan muuttujien välisen as- 17
18 sosiaation merkitsevyyttä (ks. Kuva 3). Kuten muissakin testauksissa, testataan Fisherin eksaktissa testissä nollahypoteesin paikkansapitävyyttä. (Agresti,1990, Balding, 2006) Kuva 3: Nelikentästä (yläpuolella) saadaan tarvittavat arvot, jotta voidaan laskea hypergeometrinen jakauma jokaiselle muuttujalle erikseen (tässä x(11)) Fisherin eksaktin testin p-arvo on kaikkien muuttujien hypergeometristen jakaumien summa. 3.4 Regressioanalyysi ja logistinen regressio Regressioanalyysin avulla tutkitaan yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Regressioanalyysin etu on, että sen avulla voidaan tutkia yhtä aikaa monen selittävän muuttujan vaikutusta selitettävään muuttujaan. Regressioanalyysin rajoituksena on, että selitettävän muuttujan pitää olla vähintään välimatka-asteikollinen. Regressioanalyysia voidaan kuvata suoran avulla (ns. regressiosuora). Tämän suoran jyrkkyys kertoo muuttujien yhteyden välisestä voimakkuudesta ja noususuunta (nouseva vai laskeva) ilmoittaa, onko muuttujien välinen yhteys positiivinen vai negatiivinen. Regressiosuoran kulmakerroin on Y = a + bx, jossa a on vakiotekijä, joka kertoo selitettävän muuttujan arvon, kun selitettävän muuttujan X arvo on nolla. b on aineistosta estimoitu regressiokerroin. Y on selitettävän muuttujan arvo. (McPherson, 1990). Logistinen regressio on regressioanalyysin erityistyyppi. Tämä regressiomalli (binäärinen logistinen regressio) on käyttökelpoinen, kun selitettävä muuttuja voi saada vain kaksi arvoa (esim. assosiaatiotutkimuksessa selitettävän muuttujan arvot ovat tapaus ja verrokki ja selittävät muuttujat ovat genotyypin eri variaatioita). Multinominaalisessa logistisessa regressiossa selitettävä muuttuja voi saada enemmän kuin kaksi arvoa. Logistinen regressio ennustaa tapahtuman todennäköisyyttä: 18
19 Logistisessa regressiossa regressiosuora määritellään samoin kuin tavallisessa regressioanalyysissä. Erona on, että arvo Y, selitettävän muuttujan arvo on tutkittavan tapahtuman riskin logaritmi. P(Y=1) on selitettävän muuttujan todennäköisyys saada arvo 1. (Agresti, 1990, Blading, 2006) 3.5 Cochran-Armitagen trenditesti Cochran-Armitagen trenditesti perustuu hypoteesin testaukseen, jossa kolmen mahdollisen genotyypin (AA, Aa sekä aa) ollessa pisteinä x-akselilla ja y-akselin ollessa tapausten suhde koko tutkimusväestöön, suoran kulmakerroin on 0. Vastahypoteesissä suoran kulmakerroin on 0, jolloin genotyypin pisteet asettuvat y-akselilla eri korkeuksille (ks. Kuva 4). Tämä testi ei oleta Hardy-Weinbergin tasapainon voimassaoloa ja soveltuu käytettäväksi aineistossa, jossa harvinaisen alleelin frekvenssi on pieni. (Balding, 2006) Kuva 4: Malli Cochran-Armitagen trenditestin graafisesta esityksestä (Kuva: Balding, 2006) 3.6 Haplotyyppiryväkset ja haplotyyppiestimaatio Assosiaation testaaminen yhdestä markkerista kerrallaan ei ole ongelmatonta: toisiaan fyysisesti lähellä olevat markkerit ovat usein assosiaatiossa keskenään, jolloin korrelaation tunnistus perinteisillä assosiaatiotesteillä yhdestä markkerista kerrallaan on hankalaa. Ratkaisuna on käyttää geneettisinä 19
20 muuttujina SNP-tietojen sijaan haplotyyppejä ja tutkia näiden assosiaatiota sairauteen tapausverrokkiaineistosta. Haplotyypit eivät genotyyppidatasta suoraan näy, mutta ne voidaan kuitenkin päätellä sukupuusta. Kattavan mallin kokoaminen samankaltaisista haplotyypeistä on hankalaa, samoin kuin harvinaisten haplotyyppien riittävä sisällyttäminen analyysiin. Haplotyyppiryvästen estimaatioon on monia eri keinoja, mm. Markovin ketjuja hyödyntävä Monte Carlon metodi (Waldron ym., 2006) sekä paikallistettujen haplotyyppiryvästen malli. (Browning ja Browning, 2007) 3.7 Usean testauksen korjaus sekä merkitsevyystason ja tutkimusaineiston arviointi Mitä enemmän hypoteeseja testataan, sitä todennäköisemmäksi ainakin yksi tyypin I virheen tapahtuminen nousee, tätä tapahtumaa kutsutaan merkitsevyystason inflaatioksi. Yleinen keino tämän tilastollisen harhan välttämiseen on usean testin korjaus. Tässä menetelmässä jokaisen testin merkitsevyystaso valitaan siten, että tyypin I virheen todennäköisyys vähintään yhdessä testauksessa ei ylitä ennalta määrättyä merkitsevyystasoa (usein 0,05), (Moskvina ym., 2008) Yksi käytetty usean testauksen korjaus on Bonferronin korjaus, joka toimii siten, että testattaessa n määrä hypoteeseja, tulisi jokaisen testauksen merkitsevyystason olla 1/n kerrottuna sillä merkitsevyystasolla, jota käytettäisiin testattaessa vain yhtä hypoteesia (Abdi, 2007). Bonferronin korjaus voi olla joissakin testitilanteissa liian ankara ja hylätä vastahypoteesin, vaikka se pitäisi paikkaansa. Vaihtoehto tälle on permutaatio. Geneettisen tutkimuksen permutaatiossa genotyyppitiedot säilytetään, mutta fenotyyppimerkinnät satunnaistetaan yksilöiden välillä. Näin luodaan dataryhmiä, joissa on havaittu kytkentäepätasapainoa, mutta jotka eivät poikkea nollahypoteessista, koska fenotyypit ovat satunnaistetut. Analysoimalla useita tällaisia dataryhmiä voidaan väärien positiivisten testien määrä arvioida. Permutaatiotoimenpide on melko yksinkertainen, mutta tarkat arviot vaativat jopa kymmeniä tuhansia analyysejä. (Balding, 2006) Monte Carlon menetelmän avulla voidaan estimoida täsmällinen merkitsevyystaso testille. Monte Carlon menetelmässä toistetaan valitulla merkitsevyystasolla tutkittua koejärjestelyä käyttäen satunnaisia arvoja (ns. Monte Carlon simulaatio). Monte Carlon simulaatiossa voidaan käyttää useita eri algoritmeja. Monte Carlon menetelmässä testin toistojen määrä antaa kuvan siitä, mikä vaikutus sattumalla on koejärjestelyyn. (Hope, 1968, Abdi, 2007) Hardy-Weinbergin tasapainon mukaan genotyyppien frekvenssit pysyvät populaatiossa tasaisina sukupolvesta toiseen. Tämän ominaisuuden ansiosta Hardy-Weinbergin tasapainoa voidaan käyttää, kun tutkimusaineiston laatua arvioidaan. Hardy-Weinbergin tasapaino vallitsee siis ideaalipopulaatiossa, poikkeamia tähän tasapainoon voivat aiheuttaa evoluutiotekijät (esim. luonnovalinta, mutaatiot, 20
21 geneettinen ajautuminen) sekä pariutumiseen liittyvät satunnaispoikkeamat (esim. sisäsiitos, tutkittavan aineiston osapopulaatiorakenne) Myös muuttoliike voi aiheuttaa poikkeamaa HW:n tasapainoon. Nämä tekijät tulee populaatiogeneettisissä tutkimusasetelmissa ottaa huomioon tai seurauksena voi olla systemaattinen virhe. Tasapainon poikkeama voi olla myös merkki assosiaatiosta sairauteen mikäli poikkeama esiintyy tietyssä feontyyppiryhmässä. Hardy-Weinbergin tasapainon laskemiseen voidaan käyttää esimerkiksi Pearsonin yhteensopivuustestiä. Lokukset, joiden Hardy-Weinbergin tasapaino poikkeaa sovituilla merkitsevyystasoilla voidaan hylätä testauksesta. Tämä testaus on tehtävä erikseen sekä tapauksille että verrokeille. On kuitenkin huomioitava mahdollisuus, että poikkeama Hardy-Weinbergin tasapainossa voi johtua polymorfismista, joka sisältää deleetion, tai jonkin alueen monistumasta. Tällöin Hardy-Weinbergin tasapainossa olisi havaittavissa poikkeamaa, ja aineiston laatu voidaan virheellisesti arvioida heikoksi, vaikka tasapainon poikkeama olisi itse asiassa merkki näiden muutosten assosiaatiosta tutkittuun sairauteen. (Balding, 2006) 21
22 4. Tilastotieteellisen analyysiin suunnatut ohjelmistot 4.1 SPSS SPSS on tilastotieteelliseen analyysiin suunnattu kaupallinen tietokoneohjelmisto. Se on yksi käytetyimmistä tämän luokan ohjelmistoista. Se ei ole pelkästään geneettiseen tai lääketieteelliseen tutkimukseen suunnattu ohjelmisto, vaan sen käyttöaiheet ovat miltei rajattomat. SPSS sisältää runsaasti tilastotieteelliseen analyysiin suunnattuja työkaluja: ristiintaulukointia, regressioanalyysejä sekä useita eksaktitestejä sekä niiden merkitsevyyden estimointeja, esim. Monte Carlon simulaatio. SPSS kykenee myös eloonjäämisennusteisiin Kaplan-Meierin menetelmällä. SPSS:n tilastotieteellisen analyysin perustana on SPSS:n ohjelmoidut algoritmit jokaiselle testaukselle, jotka käyttäjä ensin valitsee ja syöttää sitten suoritettavien testien vaatimat parametrit graafisen käyttöjärjestelmän kautta. SPSS:n graafinen käyttöliittymä on taulukkolaskentaohjelmiston kaltainen, ja siinä on kaksi perusnäkymää, datanäkymä sekä muuttujanäkymä. Datanäkymässä perusasetuksella riveihin on listattu tutkimusväestön yksilöt ja sarakemuuttujat. Muuttujanäkymässä on listattu kaikki aineiston muuttujat riveihin ja pylväissä on muuttujien asetukset, mm. muuttujan mitta-asteikon laatu, muuttujan desimaalien lukumäärä sekä muuttujan puuttuvien arvojen määritelmät. Eräässä tutkimuksessa, jossa tutkittiin korrelaatiota lisääntyneen FOXM1-transkriptiofaktorin ja HER- 2-positiivisen rintasyövän välillä, käytettiin SPSS:n Mann-Whiteyn U-testausta, jonka avulla selvisi, että FOXM1-ekspressio HER-2-positiivisessa syöpäsolukossa on merkitsevästi (p=0,048) lisääntynyt terveen rintakudoksen soluihin verrattuna (ks. Kuva 5). Tässä tutkimuksessa hyödynnettiin myös SPSS:n eloonjäämisennuste-ominaisuutta Kaplan-Meierin menetelmällä. Tässä testauksessa selvisi, että FOXM1-positiivisten rintasyöpien ennuste on huonompi kuin FOXM1-negatiivisten. (Bektas ym., 2008) 22
23 Kuva 5: SPSS:n luoma graafinen Kaplan-Meierin esitys. Kumulatiivinen eloonjäämisennuste FOXM1 positiivisilla tapauksilla (IRS2-12) on heikompi kuin FOXM1-negatiivisilla (IRS 0-1) tapauksilla, p-arvo on 0,110. (Kuva: Bektas, 2008) 4.2 Beagle Beagle on Java-pohjainen ohjelmistopaketti, joka on suunnattu geneettisen assosiaatiotutkimuksen analyysiin. Beagle on uudehko ohjelmisto (ensimmäinen versio julkaistiin vuonna 2007), joten sen käyttöaste ei vielä ole kovin korkea. Ohjelmiston kehittäjät Brian ja Sharon Browning käyttivät Beagleohjelmistoa Wellcome Trust Case Control Consortium -tietokantaan (WTCCC), jossa on tapauksen (seitsemän sairautta: tuberkuloosi, sepelvaltimotauti, tyypin 1 diabetes, tyypin 2 diabetes, reumaattinen niveltulehdus, Crohnin tauti, kaksisuuntainen mielialahäiriö ja verenpainetauti) ja verrokin genotyyppitiedot. Tutkimuksessa käytettiin Beaglen paikallistettua haplotyyppiryväsmenetelmää, tällä menetelmällä löydettiin kolme uutta riskigeeniä. Tutkimuksen tarkoituksena oli tunnistaa sellaisia riskigeenejä, jotka eivät ole saaneet merkitseviä arvoja tavallisilla yhden markkerin testauksilla. Tutkimuksessa yhdistettiin kromosomialue 10p15.1 tyypin 1 diabetekseen (p = ), 12q15 tyypin 2 diabetekseen (p = ) sekä 15q26.2 verenpainetautiin (p = ). WTCCC:n käyttämä raja-arvo merkitsevyydelle on p = Nämä paikallistettua haplotyyppiryväsmenetelmän avulla tunnistetut riskigeenit eivät yhden markkerin testauksella olleet merkitseviä. (Browning ja Browning, 2008) 23
24 4.2.1 Haplotyyppiestimaatio ja virheiden arviointi Beagle hyväksikäyttää paikallistettua haplotyyppiryväsmenetelmää, joka perustuu empiirisesti rakennettuun malliin paikallisestä kytkentäepätasapainosta. Tämän mallin avulla Beagle estimoi tutkimusväestön haplotyypit. Oletuksena tässä menetelmässä on, että haplotyypit, jotka ovat markkerin t kohdalla samassa ryväksessä, ovat todennäköisesti, muttei välttämättä myös samassa ryväksessä markkerin t+1 kohdalla. Näin ollen todennäköisyys siihen, että haplotyypit ovat samassa ryväksessä markkerin t+x kohdalla, pienenee arvon x noustessa (Browning ja Browning, 2007 B). Nämä todennäköisyydet lasketaan vaihtelevanmittaisia Markovin ketjuja hyödyntävän algoritmin avulla (Browning, 2006). Näin Beagle myös pystyy päättelemään tutkimusväestössä esiintyvät puuttuvat geneettiset tiedot ja täydentää ne ulossyöttötiedostoon. Mikään haplotyyppejä päättelevä malli tai sitä laskeva algoritmi ei ole täysin virheetön. Haplotyyppiestimaation tarkkuutta voidaan arvostella kytkentävirheiden määrän perusteella. Kytkentävirheiden määrää arvioitaessa tutkitaan, kuinka suuren osan peräkkäisistä heterotsygoottien markkerien määrästä on väärin arvioitu. Toinen keino estimaation tehokkuuden testaukseen on tunnettujen genotyyppien piilottaminen ja testiajon jälkeinen vertailu todellisten ja estimoitujen genotyyppien välillä. Browningien suorittaman koejärjestelyn mukaan Beaglen käyttämä estimointimenetelmä arvioi haplotyypit parhaiten tiheästä genotyyppidatasta suurilla tutkimusväestöillä. (Browning ja Browning, 2007B) Assosiaatiotestaus Beaglella Beagle testaa assosiaatioita paikallistetun haplotyyppiryväsmenetelmän avulla. Beagle määrittelee jokaiselle ryväkselle oman kaksialleelisen epäaidon markkerin, joiden assosiaatiota tapaus-verrokkitutkimusväestössä Beagle vertaa. Epäaidon markkerin assosiaatio on täten sama, kuin haplotyypin, jota se edustaa. Beagle käyttää Fisherin eksaktia nelikenttätestiä epäaitojen markkereiden assosiaation tutkimiseen. Beagle käyttää permutaatiota useasta testauksesta johtuvan tyypin I virheen todennäköisyyden pienentämiseen. Beagle voi suorittaa assosiaatiotestauksen neljällä mahdollisella periaatteella: perustestauksessa (alleelinen testaus) Beagle vertaa harvinaisen ja yleisen alleelin assosiaatiota tapausverrokki aineistossa. Resessiivisessä testauksessa toinen ryhmä pitää sisällään yleisen alleelin homotsygootin muodon sekä heterotsygootin muodon. Dominantissa testauksessa toinen ryhmä sisältää harvinaisen alleelin homotsygootin muodon sekä heterotsygootin muodon. Ylidominantissa testauksessa heterotsygootti muoto on omana ryhmänään. (Browning ja Browning, 2007A) 24
25 4.3 PLINK PLINK on C/C++ -pohjainen, koko genomin kattaviin assosiaatiotutkimuksiin suunnattu ohjelmistopaketti. PLINK:llä on useita käyttötarkoituksia. PLINK on uudehko ohjelmistopaketti, joten sen käyttö ei vielä ole valtaisaa. Kuitenkin, koko genomin kattavien assosiaatiotutkimusten yleistyessä, on sen suosio nousussa. (Purcell ym., 2007) PLINK-ohjelmistoa on käytetty mm. koko genomin kattavassa tutkimuksessa, jossa tunnistettiin reumaattisen niveltulehduksen riskigeeni, KLF12 espanjalaisella tutkimusväestöllä. Tutkimusväestöltä (400 tapausta, 400 verrokkia) analysoitiin SNP:tä. Näistä otettiin mukaan tutkimukseen PLINK:llä suoritetun laaduntarkistuksen jälkeen. Merkitsevää assosiaatioita (p=0,01) havaittiin kromosomialueella 13q22, KLF12-geenissä, SNP:ssa rs (Julià ym., 2008) Tietokantojen ylläpito PLINK:n SNP-tietokannat kirjataan kompaktilla binääriformaatilla, joka voidaan tarpeen vaatiessa muuntaa standardiksi tekstiformaatiksi. PLINK tarjoaa työkalut valita genotyyppitietokannoista halutut muuttujat (esim. tietyt genotyypit, tietyllä etäisyydellä olevat markkerit), joilla testaukset suoritetaan. PLINK tarjoaa myös työkalut liittää useita genotyyppitietokantoja yhteen. (Purcell ym., 2007) Yhteenveto tietokannasta PLINK laskee genotyyppitietokannasta Hardy-Weinbergin tasapainon ja genotyyppien sekä alleelien frekvenssit. PLINK suorittaa myös SNP-kohtaisen testauksen, jolla pyritään havaitsemaan eisatunnaisia virheitä genotyypityksessä suhteessa fenotyyppistatukseen yksinkertaisella ristiintaulukoinnilla. (Purcell ym., 2007) Assosiaatiotestaus PLINK voi suorittaa assosiaatiotestauksen mm. ristiintaulukoinnilla, Fisherin eksaktilla nelikenttätestauksella sekä Cochran-Armitagen trenditestauksella. PLINK laskee assosiaation tapausverrokkitietokannasta neljän eri mallin mukaisesti (Kuva 6). Kuva 6: PLINK laskee assosiaation neljän eri mallin mukaisesti. D on harvinainen alleeli ja d yleinen alleeli. Malleissa assosiaato lasketaan suoraan yleistä ja harvinaista alleelia vertaamalla, dominantilla mallilla, resessiivisellä mallilla ja kaikilla varianteilla erikseen. 25
Miten geenitestin tulos muuttaa syövän hoitoa?
ChemBio Helsingin Messukeskus 27.-29.05.2009 Miten geenitestin tulos muuttaa syövän hoitoa? Kristiina Aittomäki, dos. ylilääkäri HYKS Perinnöllisyyslääketieteen yksikkö Genomin tutkiminen FISH Sekvensointi
Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto
Kytkentäanalyysin teoriaa Pyritään selvittämään tiettyyn ominaisuuteen vaikuttavien eenien paikka enomissa Perustavoite: löytää markkerilokus jonka alleelit ja tutkittava ominaisuus (esim. sairaus) periytyvät
Harjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi
Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien
Perinnöllisyyden perusteita
Perinnöllisyyden perusteita Eero Lukkari Tämä artikkeli kertoo perinnöllisyyden perusmekanismeista johdantona muille jalostus- ja terveysaiheisille artikkeleille. Koirien, kuten muidenkin eliöiden, perimä
HAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
Biopankit miksi ja millä ehdoilla?
Suomalaisen Tiedeakatemian 100 v-symposium, Helsinki 4.9.2008 Biopankit miksi ja millä ehdoilla? Juha Kere Karolinska Institutet, Stockholm, Sverige ja Helsingin yliopisto Tautien tutkimus Geeni/ valkuaisaine
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
S Laskennallinen systeemibiologia
S-114.2510 Laskennallinen systeemibiologia 3. Harjoitus 1. Koska tilanne on Hardy-Weinbergin tasapainossa luonnonvalintaa lukuunottamatta, saadaan alleeleista muodostuvien eri tsygoottien genotyyppifrekvenssit
r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
PYLL-seminaari 30.3.2011
PYLL-seminaari 30.3.2011 Sairaalajohtaja Jari Välimäki syöpätautien osuus ennenaikaisten elinvuosien menetysten aiheuttajina etenkin ESshp:n naisten keskuudessa kiinnittää huomiota ne ovat PYLL-tilastossa
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9
Rintasyövän perinnöllisyys
Lääketieteellisen genetiikan kurssi 17.9.2012 Rintasyövän perinnöllisyys Perinnöllinen syöpäalttius - esimerkkinä rintasyöpä Kristiina Aittomäki, dos. ylilääkäri Genetiikan vastuuyksikköryhmä/huslab/hus
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13
Tilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
ABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
Regressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
Väliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen
Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.
9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2
Parkinsonin tauti on monitekijäinen tauti, jonka synnyssä erilaisilla elämän aikana vaikuttavilla tekijöillä ja perimällä on oma osuutensa.
1 1/2011 Parkinsonin taudin perinnöllisyys Geenien ja ympäristötekijöiden vuorovaikutus sairastumisen taustalla Parkinsonin tauti on monitekijäinen tauti, jonka synnyssä erilaisilla elämän aikana vaikuttavilla
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen
Testejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
Genetiikan perusteet 2009
Genetiikan perusteet 2009 Malli selittää, mutta myös ennustaa ja ennusteen voi testata kokeella. Mendel testasi F 2 -mallinsa tuottamalla itsepölytyksellä F 3 -polven Seuraava sukupolvi tai toinen, riippumaton
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi
χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut
Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,
Kymmenen kärjessä mitkä ovat suomalaisten yleisimmät perinnölliset sairaudet?
Kymmenen kärjessä mitkä ovat suomalaisten yleisimmät perinnölliset sairaudet? Harvinaiset-seminaari TYKS 29.9.2011 Jaakko Ignatius TYKS, Perinnöllisyyspoliklinikka Miksi Harvinaiset-seminaarissa puhutaan
Syöpägeenit. prof. Anne Kallioniemi Lääketieteellisen bioteknologian yksikkö Tampereen yliopisto
Syöpägeenit prof. Anne Kallioniemi Lääketieteellisen bioteknologian yksikkö Tampereen yliopisto Mitä syöpä on? Ryhmä sairauksia, joille on ominaista: - solukasvun säätelyn häiriö - puutteet solujen erilaistumisessa
Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin
Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:
Testit järjestysasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten
Kemijoen Sihtuunan ja Rautuojan taimenten geneettinen analyysi Jarmo Koskiniemi, Helsingin yliopisto, maataloustieteiden osasto
21.12.2018 Kemijoen Sihtuunan ja Rautuojan taimenten geneettinen analyysi Jarmo Koskiniemi, Helsingin yliopisto, maataloustieteiden osasto Näytteet Jarmo Huhtala toimitti syksyllä 2018 Helsingin yliopiston
Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan
17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
Saara Oinonen Genominlaajuisen SNP-aineiston tutkimusmenetelmien vertailua syöpää aiheuttavien perimän muutosten löytämiseksi
PRO GRADU -TUTKIELMA Saara Oinonen Genominlaajuisen SNP-aineiston tutkimusmenetelmien vertailua syöpää aiheuttavien perimän muutosten löytämiseksi TAMPEREEN YLIOPISTO Informaatiotieteiden yksikkö Tilastotiede
rakko ja virtsatiet (C65 68, D09.0 1, D30.1 9, D41.1)
Syöpäpotilaiden eloonjäämisluvut alueittain Sivuilla 2 14 esitetään suhteelliset elossaololuvut yliopistollisten sairaaloiden vastuualueilla vuosina 2005 2012 todetuilla ja 2010 2012 seuratuilla potilailla
Vallitseva periytyminen. Potilasopas. Kuvat: Rebecca J Kent www.rebeccajkent.com rebecca@rebeccajkent.com
12 Vallitseva periytyminen Muokattu allamainittujen instanssien julkaisemista vihkosista, heidän laatustandardiensa mukaan: Guy's and St Thomas' Hospital, London, United Kingdom; and the London IDEAS Genetic
¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.
10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)
Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset
GYNEKOLOGINEN SYÖPÄ 10.5.2016
GYNEKOLOGINEN SYÖPÄ 10.5.2016 kohtusyöpä munasarjasyöpä kohdunkaulasyöpä ulkosynnyttimien syöpä gynekologisten syöpien hoito on HUS-alueella keskitetty NKL:lle KOHTUSYÖPÄ naisten 3. yleisin syöpä; 800-900
Geneettisen tutkimustiedon
Geneettisen tutkimustiedon omistaminen Tutkijan näkökulma Katriina Aalto-Setälä Professori, sisätautien ja kardiologian erikoislääkäri Tampereen Yliopisto ja TAYS Sydänsairaala Etiikan päivät 9.3.2016
Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi
Peittyvä periytyminen. Potilasopas. Kuvat: Rebecca J Kent www.rebeccajkent.com rebecca@rebeccajkent.com
12 Peittyvä periytyminen Muokattu allamainittujen instanssien julkaisemista vihkosista, heidän laatustandardiensa mukaan: Guy's and St Thomas' Hospital, London, United Kingdom; and the London IDEAS Genetic
PERINNÖLLISET TEKIJÄT JA NIIDEN MERKITYS RINTASYÖPÄSAIRASTUMISESSA. Robert Winqvist. SyöpägeneCikan ja tuumoribiologian professori Oulun yliopisto
PERINNÖLLISET TEKIJÄT JA NIIDEN MERKITYS RINTASYÖPÄSAIRASTUMISESSA Robert Winqvist SyöpägeneCikan ja tuumoribiologian professori Oulun yliopisto PROFESSORILIITON SYYSSEMINAARI TUTKIMUSTA KAIKKIEN HYÖDYKSI
Genomitiedon hyödyntäminen yksilötasolla ja tiedon omistajuus
Kuka omistaa genomitiedon - työpaja 12.09.2014 Genomitiedon hyödyntäminen yksilötasolla ja tiedon omistajuus Kristiina Aittomäki, prof., ylilääkäri HUSLAB, Helsingin yliopisto Genomistrategia työryhmä
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
Laboratorioanalyysit, vertailunäytteet ja tilastolliset menetelmät
Jarmo Koskiniemi Maataloustieteiden laitos Helsingin yliopisto 0504151624 jarmo.koskiniemi@helsinki.fi 03.12.2015 Kolkunjoen taimenten geneettinen analyysi Näytteet Mika Oraluoma (Vesi-Visio osk) toimitti
Uusia mahdollisuuksia FoundationOne
Uusia mahdollisuuksia FoundationOne FI/FMI/1703/0019 Maaliskuu 2017 FoundationOne -palvelu FoundationOne on kattava genomianalysointipalvelu, jossa tutkitaan 315 geenistä koko koodaava alue sekä 28 geenistä
Tilastollisia peruskäsitteitä ja Monte Carlo
Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
Aki Taanila YHDEN SELITTÄJÄN REGRESSIO
Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...
Monogeeniset sairaudet. Monogeeninen periytyminen. Perinnöllisten tautien prevalenssi. Monitekijäiset sairaudet. Dominantti vs.
Monogeeniset sairaudet Monogeeninen Pirkka-Pekka Laurila, LL Lääketieteellisen genetiikan osasto, HY Finnish Institute for Molecular Medicine, FIMM Mutaatio yhdessä geenissä riittävä aiheuttamaan sairauden
Autoimmuunitaudit: osa 1
Autoimmuunitaudit: osa 1 Autoimmuunitaute tunnetaan yli 80. Ne ovat kroonisia sairauksia, joiden syntymekanismia eli patogeneesiä ei useimmissa tapauksissa ymmärretä. Tautien esiintyvyys vaihtelee maanosien,
Tervekudosten huomiointi rinnan sädehoidossa
Tervekudosten huomiointi rinnan sädehoidossa Onkologiapäivät 30.8.2013 Sairaalafyysikko Sami Suilamo Tyks, Syöpäklinikka Esityksen sisältöä Tervekudoshaittojen todennäköisyyksiä Tervekudosten annostoleransseja
11. laskuharjoituskierros, vko 15, ratkaisut
11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4
Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...
BI4 IHMISEN BIOLOGIA
BI4 IHMISEN BIOLOGIA IHMINEN ON TOIMIVA KOKONAISUUS Ihmisessä on noin 60 000 miljardia solua Solujen perusrakenne on samanlainen, mutta ne ovat erilaistuneet hoitamaan omia tehtäviään Solujen on oltava
Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto
Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen
MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
TAPAUS-VERROKKITUTKIMUS
TAPAUS-VERROKKI TUTKIMUKSEN TYYPIT JA TULOSTEN ANALYYSI Simo Näyhä Jari Jokelainen Kansanterveystieteen ja yleislääketieteen laitoksen jatkokoulutusmeeting.3.4.2007 TAPAUS-VERROKKITUTKIMUS Idea Tutkimusryhmät
Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko
Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko 04.11.2013 Ohjaaja: Merja Oja Valvoja: Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta
Perinnöllisyys. Enni Kaltiainen
Perinnöllisyys Enni Kaltiainen Tällä tunnilla: - Lyhyt kertaus genetiikasta - Meioosi - Perinnöllisyyden perusteet - Risteytystehtävät h"p://files.ko-sivukone.com/refluksi.ko-sivukone.com/j0284919.jpg Kertausta
Psyykkisten rakenteiden kehitys
Psyykkisten rakenteiden kehitys Bio-psykososiaalinen näkemys: Ihmisen psyykkinen kasvu ja kehitys riippuu bioloogisista, psykoloogisista ja sosiaalisista tekijöistä Lapsen psyykkisen kehityksen kannalta
Avainsanat: BI5 III Biotekniikan sovelluksia 9. Perimä ja terveys.
Avainsanat: mutaatio Monitekijäinen sairaus Kromosomisairaus Sukupuu Suomalainen tautiperintö Geeniterapia Suora geeninsiirto Epäsuora geeninsiirto Kantasolut Totipotentti Pluripotentti Multipotentti Kudospankki
Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
Suomen Syöpärekisteri Syöpätautien tilastollinen ja epidemiologinen tutkimuslaitos. Syöpäpotilaiden eloonjäämisluvut alueittain
Syöpäpotilaiden eloonjäämisluvut alueittain Sivuilla 2 15 esitetään ikävakioidut suhteelliset elossaololuvut yliopistollisten sairaaloiden vastuualueilla vuosina 2007 2014 todetuilla ja 2012 2014 seuratuilla
Perinnöllisyyden perusteita
Perinnöllisyyden perusteita Perinnöllisyystieteen isä on augustinolaismunkki Gregor Johann Mendel (1822-1884). Mendel kasvatti herneitä Brnon (nykyisessä Tsekissä) luostarin pihalla. 1866 julkaisu tuloksista
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156
Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?
Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus
Aineistokoko ja voima-analyysi
TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla
Populaatiosimulaattori. Petteri Hintsanen HIIT perustutkimusyksikkö Helsingin yliopisto
Populaatiosimulaattori Petteri Hintsanen HIIT perustutkimusyksikkö Helsingin yliopisto Kromosomit Ihmisen perimä (genomi) on jakaantunut 23 kromosomipariin Jokaisen parin toinen kromosomi on peritty isältä
Rintasyöpä Suomessa. Mammografiapäivät Tampere 26.6.2009. Risto Sankila. Ylilääkäri, Suomen Syöpärekisteri, Helsinki
Rintasyöpä Suomessa Mammografiapäivät Tampere 26.6.2009 Risto Sankila Ylilääkäri, Suomen Syöpärekisteri, Helsinki Suomen Syöpärekisteri Syöpätautien tilastollinen ja epidemiologinen tutkimuslaitos... syöpärekisteri
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
Kliininen arviointi ja kliininen tieto mikä riittää?
Kliininen arviointi ja kliininen tieto mikä riittää? Riittävä tutkimuksen otoskoko ja tulos Timo Partonen LT, psykiatrian dosentti, Helsingin yliopisto Ylilääkäri, Terveyden ja hyvinvoinnin laitos Tutkimuksen
Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012
Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko
Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003
Nimi Opiskelijanumero Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Normaalisti jakautuneiden yhdistyksessä on useita tuhansia jäseniä. Yhdistyksen sääntöjen mukaan sääntöihin tehtävää muutosta
Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,
Jatkuvat satunnaismuuttujat
Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
Regressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
DNA sukututkimuksen tukena
Järvenpää 12,2,2019 Teuvo Ikonen teuvo.ikonen@welho.com DNA sukututkimuksen tukena DNA sukututkimuksessa (Peter Sjölund: Släktforska med DNA) tiesitkö, että olet kävelevä sukukirja? on kuin lukisit kirjaa
1. Tutkitaan tavallista kahden selittäjän regressiomallia
TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta?
Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta? Matti Uhari Lääkärin ammatin harjoittaminen Akateeminen ei pelkkä suorittaja Asiantuntija potilaalle lääketieteellisestä tiedosta Biologinen/luonnontieteellinen
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5
MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai
Tilastollinen päättely genominlaajuisissa assosiaatioanalyyseissä. Matti Pirinen
Tilastollinen päättely genominlaajuisissa assosiaatioanalyyseissä Matti Pirinen Suomen molekyylilääketieteen instituutti (FIMM) Helsingin Yliopisto 17.2.2015 Tilastollisen päättelyn kurssi Kumpula Sisältö
Rintasyöpä ja sen ehkäisy. Jaana Kolin
Rintasyöpä ja sen ehkäisy Jaana Kolin Syöpä sairautena Uusia syöpiä todetaan maassamme vuosittain noin 29.000 Miehillä ja naisilla syöpiä todetaan suurin piirtein yhtä paljon Vuoteen 2020 mennessä uusien
MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
Perinnöllisyys harvinaisten lihastautien aiheuttajana. Helena Kääriäinen Terveyden ja hyvinvoinnin laitos Tampere
Perinnöllisyys harvinaisten lihastautien aiheuttajana Helena Kääriäinen Terveyden ja hyvinvoinnin laitos Tampere 17.11.2011 Mistä lihastauti aiheutuu? Suurin osa on perinnöllisiä Osassa perimä altistaa
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle