Tilastollinen päättely genominlaajuisissa assosiaatioanalyyseissä. Matti Pirinen

Koko: px
Aloita esitys sivulta:

Download "Tilastollinen päättely genominlaajuisissa assosiaatioanalyyseissä. Matti Pirinen"

Transkriptio

1 Tilastollinen päättely genominlaajuisissa assosiaatioanalyyseissä Matti Pirinen Suomen molekyylilääketieteen instituutti (FIMM) Helsingin Yliopisto Tilastollisen päättelyn kurssi Kumpula

2 Sisältö 1. Motivaatio 2. Esimerkki MS-taudista 3. Tilastotiede 4. Tutkimuksen nykytila

3 1. Motivaatio Genomi ja SNP Mikä on geneettinen assosiaatio? Miksi tämä on tärkeää?

4 Ihmisgenomi... G C G T T T A C G... DNA-sekvenssi Ihmisgenomi on 3x109 kirjaimen lineaarinen sekvenssi aakkostosta {A, C, G, T}

5 Single Nucleotide Polymorphism (SNP) Keskimäärin 1:300 genomin kohdasta on vaihtelua populaation tasolla. Näitä kohtia kutsutaan snipeiksi (SNP)

6 Single Nucleotide Polymorphism (SNP) Keskimäärin 1:300 genomin kohdasta on vaihtelua populaation tasolla. Yksilöiden genotyypit populaatiossa Genomit populaatiossa... G C G T T... 96%... G C T T T... 4% 0: GG ~ 92.1% 1: GT ~ 7.7 % 2: TT ~ 0.2 % SNP, alleelit: G / T, minor allele frequency (MAF) = 4%

7 PCSK9-geeni Kromosomissa 1, kohdassa Mb Koodaa proteiinia 692 aminohappoa

8 SNP PCSK9:ssä Alleelit: G / T, MAF=4% (Suomessa) Paikka: Chr1, emäspari 55,505,647

9 SNP PCSK9:ssä Alleelit: G / T, MAF=4% (Suomessa) Paikka: Chr1, emäspari 55,505,647 Vaikutus: vaihtaa 46. AH:n Arginiinista Lysiiniin G Arginine T Leucine

10 SNP PCSK9:ssä Alleelit: G / T, MAF=4% (Suomessa) Paikka: Chr1, emäspari 55,505,647 Vaikutus: vaihtaa 46. AH:n Arginiinista Lysiiniin Katsotaan vaikuttaako tämä muutos (eli mutaatio) LDL-kolesterolitasoihin LDL-C on riskitekijä sydäntaudille

11 Mikä on geneettinen assosiaatio? Finn-Metabo-Seq project: 2099 suomalaista näytettä (08/2014) Boxploteissa (1) mediaani (paksu viiva), (2) interquartile range (laatikot) (3) 1.5 x interquartile range (pistejanat) (4) outliers (pisteet) Alleelin T kantajilla on pienempi LDL-C GG GT TT

12 Miksi geneettiset assosiaatiot ovat tärkeitä? Antaa vinkkejä sairauksiin ja ominaisuuksiin vaikuttavista biologisista mekanismeista Myöhemmin esimerkkejä MS-taudista ja skitsofreniasta Ideoita lääkkeiden kehitykseen PCSK9:n hiljentäminen alentaa LDL-C:tä? Raal et al. 2014, Lancet

13 Genominlaajuinen assosiaatiotutkimus (GWAS) Idea: Etsitään assosiaatioita käyttäen tiheää snippikarttaa (jopa 10 miljoonaa snippiä) Tuli mahdolliseksi ~2006 Teknologia (SNP-sirut, myöhemmin sekvenointi) Yhteistyö (genetiikka + lääketiede + laboratorio tekniikka + bioinformatiikka + tilastotiede)

14 Snippi-sirut (SNP arrays) Sisältää sekvenssin pätkiä miljoonille snipeille Hinta ~ euroa/näyte Steven M. Carr

15 1. Motivaatio 2. Esimerkki MS-taudista

16 MS-taudin assosiaatiotutkimus ~1x10⁴ Sairasta Yksilöt ~1.7x10⁴ Kontrollia Genotyypit ~5x105 Single nucleotide polymorphisms (SNPs) Kysymys Eroavatko sairaiden ja terveiden genotyyppijakaumat toisistaan joissakin kohdissa genomia?

17 Manhattan plot ~500,000 SNPs with MAF > 1% KIINNOSTAVAT SNIPIT KIINOSTAMATTOMAT SNIPIT

18 Nature Pystyakselilla snipin paikka genomissa Vaaka-akselilla assosiaation parvo (-log10) Yli 50 vakuuttavaa assosiaatiota MS-tautiin Immuunijärjestelmän geenit ovat yliedustettuina näiden assosiaatioiden joukossa; erityisesti T-helper cell differentiation pathway

19 1. Motivaatio 2. Esimerkki MS-taudista 3. Tilastotiedettä

20 Lineaarinen malli assosiaatiolle Sovitetaan suora 3 genotyypin kautta

21 Lineaarinen malli assosiaatiolle Sovitetaan suora 3 genotyypin kautta Suuri kulmakerroin = vahva assosiaatio (mitä ongelmia? ) Miksei Manhattan plotissa käytetä est(b) vaan p-arvoa?

22 Miksei kulmakerroin yksin riitä? Kaksi snipiä joilla kk ~1.0 (n=2000)

23 Miksei kulmakerroin yksin riitä? Epävarmuus kulmakertoimesta Vasen 1.0 ( ); Oikea 1.0 ( )

24 P-arvo Onko est(b) uskottava jos todellisuudessa b=0? P-arvo: Tn että nollahypoteesin vallitessa saadaan ainakin yhtä poikkeava estimaatti kuin on havaittu P=0.84: Ei näyttöä nollahypoteesin (H0) hylkäämiselle P=8e-5: Epätn H0:n vallitessa -> ehkä H0 ei vallitse

25 Karkea päättely tilastollisen merkitsevyyden perusteella NOLLASNIPIT VAIKUTTAVAT SNIPIT Valitaan P-arvo -raja eli merkitsevyystaso EI MERKITSEVÄ PALJON MERKITSEVÄ Hyvin vähän?? Kutsutaan snipiä tilastollisesti merkitseväksi jos p-arvo on tarpeeksi pieni Käytetään pientä merkitsevyystasoa jotta vääriä positiivisia ei tule juuri ollenkaan Toivotaan että löydetään joitain oikeita positiivisia

26 Genominlaajuinen merkitsevyystaso Genomissa noin ~106 riippumatonta aluetta Genomilla on blokkirakenne rekombinaatioprosessin vuoksi Tarvitaan erittäin pieni merkitsevyystaso suojaamaan vääriltä positiivisilta

27 Genominlaajuinen merkitsevyystaso Genomissa noin ~106 riippumatonta aluetta Genomilla on blokkirakenne rekombinaatioprosessin vuoksi Tarvitaan erittäin pieni merkitsevyystaso suojaamaan vääriltä positiivisilta Bonferronikorjatulla mt:lla = 0.05/106 = 5x10-8, keskimäärin, 1:20 GWASista raportoi ainakin yhden väärän positiivisen assosiaation (mutta muut 19 ei yhtään)

28 Genominlaajuinen merkitsevyystaso Entä jos dataa on vain yhdestä snipistä Voidaanko sille käyttää mt:a 0.05? Entä jos tiedetään että snipillä on selkeä efekti proteiinin rakenteeseen. Pitääkö edelleen käyttää samaa mt:a kuin snipille jolla ei epäillä olevan mitään funktionaalista seurausta?

29 Genominlaajuinen merkitsevyystaso Entä jos dataa on vain yhdestä snipistä Voidaanko sille käyttää mt:a 0.05? Entä jos tiedetään että snipillä on selkeä efekti proteiinin rakenteeseen. Pitääkö edelleen käyttää samaa mt:a kuin snipille jolla ei epäillä olevan mitään funktionaalista seurausta? Valintakorjaus testien lukumäärän mukaan EI ole yleispätevä sääntö konsistenttien mt:jen määrittämiseen Palataan tähän tilastollisen voiman jälkeen

30 Voima Voima = Tn että snip saavuttaa annetun merkitsevyystason Riippuu otoskoosta, alleelifrekvenssistä ja todellisen efektin suuruudesta

31 Voima Voima = Tn että snip saavuttaa annetun merkitsevyystason Riippuu otoskoosta, alleelifrekvenssistä ja todellisen efektin suuruudesta

32 Voima Voima = Tn että snip saavuttaa annetun merkitsevyystason Riippuu otoskoosta, alleelifrekvenssistä ja todellisen efektin suuruudesta

33 Voima Aiempi PCSK9:n mutaatio löytyy lähes varmasti meidän suomalaisesta datasta Voimalaskelmia tarvitaan tutkimuksen suunnitteluun Kertovat millaiset efektit olemme jo löytäneet ja millaisia emme ole voineet löytää

34 Voima Aiempi PCSK9:n mutaatio löytyy lähes varmasti meidän suomalaisesta datasta Mutta pysyisi lähes varmasti löytämättä keskieurooppalaisessa aineistossa jossa MAF=0.01 (vrt MAF=0.04 Suomessa)

35 Assosiaatiotestauksen voima Jatkuvalle vasteelle voima kasvaa monot. N f (1-f) b2 N = otoskoko f = harvinaismman alleelin suhteell. frekvenssi b = vaikutus ( kulmakerroin ) per 1 alleeli Case-control -asetelman voima kasvaa monot. N t (1-t) f (1-f) b 2 t = tapausten suhde otoksesta

36 Voiman ominaisuuksia Jos tietylle snipille pop1:ssä MAF=4% ja pop2:ssa MAF=1%, niin kuinka suuri otos pop2:sta tarvitaan saman voiman saamiseksi kuin mikä on otoksella n=2,000 pop1:stä? N f (1-f) b2

37 Voiman ominaisuuksia Jos tietylle snipille pop1:ssä MAF=4% ja pop2:ssa MAF=1%, niin kuinka suuri otos pop2:sta tarvitaan saman voiman saamiseksi kuin mikä on otoksella n=2,000 pop1:stä? N f (1-f) b2 N x 0.01 x (1-0.01) = 2000 x 0.04 x (1-0.04) N=7758

38 Merkitsevyydestä todellisen efektin todennäköisyyteen NOLLAEFEKTI TODELL. EFEKTI Merkitsevyystaso EIMERKIT. PALJON MERKIT. vähän?? T = todellinen efekti N = nollaefekti S = merkitsevä p-arvo

39 Merkitsevyydestä todellisen efektin todennäköisyyteen NOLLAEFEKTI TODELL. EFEKTI Merkitsevyystaso EIMERKIT. PALJON MERKIT. vähän?? T = todellinen efekti N = nollaefekti S = merkitsevä p-arvo

40 Merkitsevyydestä todellisen efektin todennäköisyyteen NOLLAEFEKTI TODELL. EFEKTI Merkitsevyystaso PALJON MERKIT. vähän?? Pieni mt tarvitaan siis koska assosiaation prioritn on pieni, EIKÄ sen vuoksi että tehdään paljon testejä EIMERKIT. T = todellinen efekti N = nollaefekti S = merkitsevä p-arvo Usein prioria ei ole helppo määrittää jolloin testien lkm voi toimia hyvin käytännössä, esim. replikaatio Merkitsevä tulos voimakkaasta tutkimuksesta on suuremmalla tn:llä todellinen efekti kuin vähemmän voimakkaasta tutkimuksesta!

41 P-arvo ei ole koko totuus Tarkastellaan kahta tutkimusta joiden otoskoot ovat n1=1,000 ja n2=10,000

42 P-arvo ei ole koko totuus Tarkastellaan kahta tutkimusta joiden otoskoot ovat n1=1,000 ja n2=10,000 Oletetaan että kolesteroliin vaikuttaa 100 snipiä jotka kaikki selittävät <1% kolesterolitasojen vaihtelusta

43 P-arvo ei ole koko totuus Tarkastellaan kahta tutkimusta joiden otoskoot ovat n1=1,000 ja n2=10,000 Oletetaan että kolesteroliin vaikuttaa 100 snipiä jotka kaikki selittävät <1% kolesterolitasojen vaihtelusta n E(väärät +) E(aidot +) P(aito +)

44 Asymptoottiset testit 1. Uskottavuusosamäärän testi (eli LR test) 2. Waldin testi 3. Raon testi (eli score test)

45 Score test vs LR test Vaikka Raon testi ja uskottavuusosamäärän testi ovat samat asymptoottisesti, ne eivät aina ole lainkaan samat käytännön tilanteissa! Asymptotiikka ei päde harvinaisille varianteille 1200 migreenikkoa vs 2700 kontrollia Saksasta Kuva: Priit Palta

46 1. Motivaatio 2. Esimerkki MS-taudista 3. Tilastotiede 4. Tutkimuksen nykytila

47 Skitsofrenia (esimerkkinä GWAS-kehityksestä ) Mielen sairaus johon liittyy poikkeavaa käyttäytmistä ja ongelmia tunnistaa todellisuutta Puhkeaa nuorille aikuisille, 0.5%-1% populaatiosta Korkea periytyvyys, estimaatit jopa 80% Perheissä tehdyt kytkentäanalyysit eivät olleet menestyksellisiä 80- ja 90-luvuilla Tuskin olemassa vain muutamia Sf-geenejä jotka selittäisivät periytyvyyden

48 Int'l SZ Consortium, 2009, Nature 3,332 SZ-tapausta ja 3,587 kontrollia, 1M SNPs Tukea erittäin monitekijäiselle geneettiselle arkkitehtuurille Mutta ei yhtään SF-geeniä GWAS on tuomittu epäonnistumaan? From Mark Daly

49 PGC ,394 cases and 12,462 controls From Mark Daly

50 PGC 2014, Nature 34,000 SF-tapausta ja 45,600 kontrollia, 9.5M snipiä 108 erillistä aluetta p < 5e-8

51 Published Genome-Wide Associations through 12/2013 at p 5e-8 for 17 trait categories NHGRI GWA Catalog

52 Picture emerging from GWAS A lot of common variants with small effects Some are tagging rare variants

53 Picture emerging from GWAS A lot of common variants with small effects How many tagging rare variants? Many shared effects across traits Need joint analyses & phenotype refinement Psoriasis and Ankylosing spondylitis around IL23R

54 Picture emerging from GWAS A lot of common variants with small effects Many shared effects across traits How many tagging rare variants? Need joint analyses & phenotype refinement Much to do on the biological side Pathways From association to function

55 We also develop methods

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien

Lisätiedot

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto Kytkentäanalyysin teoriaa Pyritään selvittämään tiettyyn ominaisuuteen vaikuttavien eenien paikka enomissa Perustavoite: löytää markkerilokus jonka alleelit ja tutkittava ominaisuus (esim. sairaus) periytyvät

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Yleisten tautien ja ominaisuuksien genetiikka kansantautien perimä ja sen merkitys

Yleisten tautien ja ominaisuuksien genetiikka kansantautien perimä ja sen merkitys Yleisten tautien ja ominaisuuksien genetiikka kansantautien perimä ja sen merkitys Markus Perola, LT, geneettisen epidemiologian tutkimusprofessori THL, KATO, GETY markus.perola@thl.fi Määritelmiä L3/28.8.2013

Lisätiedot

S Laskennallinen systeemibiologia

S Laskennallinen systeemibiologia S-114.2510 Laskennallinen systeemibiologia 3. Harjoitus 1. Koska tilanne on Hardy-Weinbergin tasapainossa luonnonvalintaa lukuunottamatta, saadaan alleeleista muodostuvien eri tsygoottien genotyyppifrekvenssit

Lisätiedot

Yleisten tautien ja ominaisuuksien genetiikka kansantautien perimä ja sen merkitys

Yleisten tautien ja ominaisuuksien genetiikka kansantautien perimä ja sen merkitys Yleisten tautien ja ominaisuuksien genetiikka kansantautien perimä ja sen merkitys Markus Perola, LT, geneettisen epidemiologian tutkimusprofessori THL, KATO, GETY markus.perola@thl.fi Määritelmiä L3/13.9.2012

Lisätiedot

Kemijoen Sihtuunan ja Rautuojan taimenten geneettinen analyysi Jarmo Koskiniemi, Helsingin yliopisto, maataloustieteiden osasto

Kemijoen Sihtuunan ja Rautuojan taimenten geneettinen analyysi Jarmo Koskiniemi, Helsingin yliopisto, maataloustieteiden osasto 21.12.2018 Kemijoen Sihtuunan ja Rautuojan taimenten geneettinen analyysi Jarmo Koskiniemi, Helsingin yliopisto, maataloustieteiden osasto Näytteet Jarmo Huhtala toimitti syksyllä 2018 Helsingin yliopiston

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Suomalainen genomitieto ja yksilöllistetty terveydenhuolto Olli Kallioniemi October 9, 2013

Suomalainen genomitieto ja yksilöllistetty terveydenhuolto Olli Kallioniemi October 9, 2013 Suomalainen genomitieto ja yksilöllistetty terveydenhuolto Olli Kallioniemi October 9, 2013 FIMM - Institiute for Molecular Medicine Finland Terveyden ylläpito vauvasta vanhuuteen Elintavat Taudit Terve

Lisätiedot

5.7 Uskottavuusfunktioon perustuvia testejä II

5.7 Uskottavuusfunktioon perustuvia testejä II 5.7 Uskottavuusfunktioon perustuvia testejä II Tässä pykälässä pohditaan edellä tarkasteltujen kolmen testisuureen yleistystä malleihin, joiden parametri on useampiulotteinen, ja testausasetelmiin, joissa

Lisätiedot

Voidaanko geenitiedolla lisätä kansanterveyttä?

Voidaanko geenitiedolla lisätä kansanterveyttä? Voidaanko geenitiedolla lisätä kansanterveyttä? Duodecimin vuosipäivä 14.11.2014 Veikko Salomaa, LKT, tutkimusprofessori 21.11.2014 Esityksen nimi / Tekijä 1 Sidonnaisuudet Ei ole 21.11.2014 Esityksen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Kliininen arviointi ja kliininen tieto mikä riittää?

Kliininen arviointi ja kliininen tieto mikä riittää? Kliininen arviointi ja kliininen tieto mikä riittää? Riittävä tutkimuksen otoskoko ja tulos Timo Partonen LT, psykiatrian dosentti, Helsingin yliopisto Ylilääkäri, Terveyden ja hyvinvoinnin laitos Tutkimuksen

Lisätiedot

GEENIT JA KORONAARITAUDIN RISKI

GEENIT JA KORONAARITAUDIN RISKI GEENIT JA KORONAARITAUDIN RISKI LT Kirsi Auro 17/10/2013 1 Aiheet Sydän- ja verisuonitautien preventiosta Suomessa Geneettiset riskilaskut Loppupäätelmät Sydän- ja verisuonitautien riskitekijöitä Sukupuoli

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Geeneistä genomiin, mikä muuttuu? Juha Kere Karolinska Institutet, Stockholm

Geeneistä genomiin, mikä muuttuu? Juha Kere Karolinska Institutet, Stockholm Geeneistä genomiin, mikä muuttuu? Juha Kere Karolinska Institutet, Stockholm 5 ATCACACACACACAGTCCTGACGTGC 3! 3 TAGTGTGTGTGTGTCAGGACTGCACG 5! Informaatioteknologian mullistus 1978 2013 2048? Molekyylibiologian

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Epigeneettinen säätely ja genomin leimautuminen. Tiina Immonen BLL Biokemia ja kehitysbiologia

Epigeneettinen säätely ja genomin leimautuminen. Tiina Immonen BLL Biokemia ja kehitysbiologia Epigeneettinen säätely ja genomin leimautuminen Tiina Immonen BLL Biokemia ja kehitysbiologia 21.1.2014 Epigeneettinen säätely Epigenetic: may be used for anything to do with development, but nowadays

Lisätiedot

Kipu. Oleg Kambur. Geneettisillä tekijöillä suuri merkitys Yksittäisiä geenejä on löydetty vain vähän COMT 23.6.2015

Kipu. Oleg Kambur. Geneettisillä tekijöillä suuri merkitys Yksittäisiä geenejä on löydetty vain vähän COMT 23.6.2015 Katekoli-O-metyylitransferaasi ja kipu Oleg Kambur Kipu Geneettisillä tekijöillä suuri merkitys Yksittäisiä geenejä on löydetty vain vähän COMT 1 Katekoli-O-metyylitransferaasi (COMT) proteiini tuotetaan

Lisätiedot

Biopankit miksi ja millä ehdoilla?

Biopankit miksi ja millä ehdoilla? Suomalaisen Tiedeakatemian 100 v-symposium, Helsinki 4.9.2008 Biopankit miksi ja millä ehdoilla? Juha Kere Karolinska Institutet, Stockholm, Sverige ja Helsingin yliopisto Tautien tutkimus Geeni/ valkuaisaine

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Biopankit ja Big Data terveydenhuollossa: onko open science magic bullet?

Biopankit ja Big Data terveydenhuollossa: onko open science magic bullet? Biopankit ja Big Data terveydenhuollossa: onko open science magic bullet?, LT, tutkimusprofessori Terveyden ja hyvinvoinnin laitos Terveys - osasto Genomiikka ja biomarkkerit - yksikkö markus.perola@thl.fi

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Miten väestötutkimuksista ja biopankeista saadaan tietoa yksilöllisestä sairausriskistä?

Miten väestötutkimuksista ja biopankeista saadaan tietoa yksilöllisestä sairausriskistä? Miten väestötutkimuksista ja biopankeista saadaan tietoa yksilöllisestä sairausriskistä? Markus Perola, LT, dosentti THL, KATO, Kansantautien geenien tutkimusyksikkö, kvantitatiivisen genetiikan ryhmä

Lisätiedot

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Molekyylipopulaatiogenetiikka

Molekyylipopulaatiogenetiikka Molekyylipopulaatiogenetiikka Hedrick 2005, kappale 8, pp. 452-462, 428-449 Demografian ja valinnan vaikutukset koalesenssipuihin Valinnan havaitseminen TajimanD Divergenssin ja polymorfismin vertailu

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja

Lisätiedot

Epigeneettinen säätely ja genomin leimautuminen. Tiina Immonen Medicum, Biokemia ja kehitysbiologia

Epigeneettinen säätely ja genomin leimautuminen. Tiina Immonen Medicum, Biokemia ja kehitysbiologia Epigeneettinen säätely ja genomin leimautuminen Tiina Immonen Medicum, Biokemia ja kehitysbiologia 12.12.2017 Epigenetic inheritance: A heritable alteration in a cell s or organism s phenotype that does

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Ihmisten erilaisuuden geneettinen perusta

Ihmisten erilaisuuden geneettinen perusta hmisten erilaisuuden geneettinen perusta etter ortin hmisen genomin tutkimus on astunut uuteen vaiheeseen kun on alettu tutkia ihmisen geneettisen monimuotoisuuden määrää ja laatua. seita tätä tutkimushanketta

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

KEESHONDIEN MONIMUOTOISUUSKARTOITUS

KEESHONDIEN MONIMUOTOISUUSKARTOITUS KEESHONDIEN MONIMUOTOISUUSKARTOITUS 2 3. 0 1. 2 0 1 1 K A A R I N A Marjut Ritala DNA-diagnostiikkapalveluja kotieläimille ja lemmikeille Polveutumismääritykset Geenitestit Serologiset testit Kissat, koirat,

Lisätiedot

Laboratorioanalyysit, vertailunäytteet ja tilastolliset menetelmät

Laboratorioanalyysit, vertailunäytteet ja tilastolliset menetelmät Jarmo Koskiniemi Maataloustieteiden laitos Helsingin yliopisto 0504151624 jarmo.koskiniemi@helsinki.fi 03.12.2015 Kolkunjoen taimenten geneettinen analyysi Näytteet Mika Oraluoma (Vesi-Visio osk) toimitti

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Psyykkisten rakenteiden kehitys

Psyykkisten rakenteiden kehitys Psyykkisten rakenteiden kehitys Bio-psykososiaalinen näkemys: Ihmisen psyykkinen kasvu ja kehitys riippuu bioloogisista, psykoloogisista ja sosiaalisista tekijöistä Lapsen psyykkisen kehityksen kannalta

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Populaatiosimulaattori. Petteri Hintsanen HIIT perustutkimusyksikkö Helsingin yliopisto

Populaatiosimulaattori. Petteri Hintsanen HIIT perustutkimusyksikkö Helsingin yliopisto Populaatiosimulaattori Petteri Hintsanen HIIT perustutkimusyksikkö Helsingin yliopisto Kromosomit Ihmisen perimä (genomi) on jakaantunut 23 kromosomipariin Jokaisen parin toinen kromosomi on peritty isältä

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

11. laskuharjoituskierros, vko 15, ratkaisut

11. laskuharjoituskierros, vko 15, ratkaisut 11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Logistinen regressioanalyysi Vastemuuttuja Y on luokiteltu muuttuja Pyritään mallittamaan havaintoyksikön todennäköisyyttä kuulua

Lisätiedot

Biopankit ja Big Data terveydenhuollossa: onko open science magic bullet?

Biopankit ja Big Data terveydenhuollossa: onko open science magic bullet? Biopankit ja Big Data terveydenhuollossa: onko open science magic bullet?, LT, tutkimusprofessori Terveyden ja hyvinvoinnin laitos Terveys - osasto Genomiikka ja biomarkkerit - yksikkö markus.perola@thl.fi

Lisätiedot

GEENIT SKITSOFRENIAN AIHEUTTAJANA. Tiina Paunio Dosentti Psykiatrian erikoislääkäri Skitsofreniaverkoston symposium Kuopio 11.9.

GEENIT SKITSOFRENIAN AIHEUTTAJANA. Tiina Paunio Dosentti Psykiatrian erikoislääkäri Skitsofreniaverkoston symposium Kuopio 11.9. GEENIT SKITSOFRENIAN AIHEUTTAJANA Tiina Paunio Dosentti Psykiatrian erikoislääkäri Skitsofreniaverkoston symposium Kuopio 11.9.2009 SKITSOFRENIAN ETIOLOGIAA Hermoston kehityksen häiriö Poikkeava neurotransmissio

Lisätiedot

Perinnöllisyyden perusteita

Perinnöllisyyden perusteita Perinnöllisyyden perusteita Eero Lukkari Tämä artikkeli kertoo perinnöllisyyden perusmekanismeista johdantona muille jalostus- ja terveysaiheisille artikkeleille. Koirien, kuten muidenkin eliöiden, perimä

Lisätiedot

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1 T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

T Luonnollisten kielten tilastollinen käsittely

T Luonnollisten kielten tilastollinen käsittely T-61.281 Luonnollisten kielten tilastollinen käsittely Vastaukset 3, ti 11.2.2003, 16:15-18:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

SEM1, työpaja 2 (12.10.2011)

SEM1, työpaja 2 (12.10.2011) SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):

Lisätiedot

Nuorten ylipainon syitä jäljittämässä

Nuorten ylipainon syitä jäljittämässä SALVE Päätösseminaari 21.11.2012 Nuorten ylipainon syitä jäljittämässä Väestötutkimuksia lihavuuden vaara- ja suojatekijöistä Pohjois-Suomen syntymäkohortissa 1986 Anne Jääskeläinen, TtM Nuorten ylipainon

Lisätiedot

Epävarmuuden hallinta bootstrap-menetelmillä

Epävarmuuden hallinta bootstrap-menetelmillä 1/17 Epävarmuuden hallinta bootstrap-menetelmillä Esimerkkinä taloudellinen arviointi Jaakko Nevalainen Tampereen yliopisto Metodifestivaalit 2015 2/17 Sisältö 1 Johdanto 2 Tavanomainen bootstrap Bootstrap-menettelyn

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Todennäköisyyslaskennan kertaus Satunnaismuuttujat ja tn-jakaumat Tunnusluvut χ 2 -, F- ja t-jakauma Riippumattomuus Tilastotieteen

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Aineistokoko ja voima-analyysi

Aineistokoko ja voima-analyysi TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla

Lisätiedot

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 8B Ratkaisuehdotuksia.

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 8B Ratkaisuehdotuksia. HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 8B Ratkaisuehdotuksia Tehtäväsarja I 1. Jatkoa Harjoitus 8A tehtävään 3. Muodosta odotusarvolle µ approksimatiivinen

Lisätiedot

DNA sukututkimuksen tukena

DNA sukututkimuksen tukena Järvenpää 12,2,2019 Teuvo Ikonen teuvo.ikonen@welho.com DNA sukututkimuksen tukena DNA sukututkimuksessa (Peter Sjölund: Släktforska med DNA) tiesitkö, että olet kävelevä sukukirja? on kuin lukisit kirjaa

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

Kvantitatiivisen aineiston analyysi

Kvantitatiivisen aineiston analyysi Kvantitatiivisen aineiston analyysi Liiketalouden tutkimusmenetelmät SL 2014 Kvantitatiivinen vs. kvalitatiivinen? tutkimuksen lähtökohtana ovat joko tiedostetut tai tiedostamattomat taustaoletukset (tieteenfilosofiset

Lisätiedot

Pia Soronen (FM, LK, väitellyt) 21.3.2013

Pia Soronen (FM, LK, väitellyt) 21.3.2013 Pia Soronen (FM, LK, väitellyt) 21.3.2013 Yleistä periytyvyydestä ja genetiikasta Miten perinnöllisyyttä tutkitaan Kytkentäanalyyseistä nykypäivään Tärkeimmät löydökset Ehdokasgeeni esimerkkejä Uudet GWAS

Lisätiedot

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin

Lisätiedot

TAPAUS-VERROKKITUTKIMUS

TAPAUS-VERROKKITUTKIMUS TAPAUS-VERROKKI TUTKIMUKSEN TYYPIT JA TULOSTEN ANALYYSI Simo Näyhä Jari Jokelainen Kansanterveystieteen ja yleislääketieteen laitoksen jatkokoulutusmeeting.3.4.2007 TAPAUS-VERROKKITUTKIMUS Idea Tutkimusryhmät

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto Metodifestivaali 28.5.2009 1 1 Mitä ihmettä on bootstrap? Webster: 1. a loop of leather or cloth sewn at the top rear, or sometimes on each side of a boot

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Yleistä tietoa kokeesta

Yleistä tietoa kokeesta Yleistä tietoa kokeesta Kurssikoe järjestetään maanantai 7.5. klo 12-15 jossakin Exactumin auditorioista. Korvaava kurssikoe keskiviikkona (yleisenä tenttipäivänä) 11.4. klo 16-19 jossakin Exactumin auditorioista.

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Otannasta ja mittaamisesta

Otannasta ja mittaamisesta Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,

Lisätiedot

Genetiikan perusteet 2009

Genetiikan perusteet 2009 Genetiikan perusteet 2009 Malli selittää, mutta myös ennustaa ja ennusteen voi testata kokeella. Mendel testasi F 2 -mallinsa tuottamalla itsepölytyksellä F 3 -polven Seuraava sukupolvi tai toinen, riippumaton

Lisätiedot

SELVITTÄJÄN KOMPETENSSISTA

SELVITTÄJÄN KOMPETENSSISTA OTM, KTM, Mikko Hakola, Vaasan yliopisto, Laskentatoimen ja rahoituksen laitos Helsinki 20.11.200, Helsingin kauppakorkeakoulu Projekti: Yrityksen maksukyky ja strateginen johtaminen SELVITTÄJÄN KOMPETENSSISTA

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Geenitutkimusta: evoluutiosta kohti geenivarojen suojelua ja jalostusta

Geenitutkimusta: evoluutiosta kohti geenivarojen suojelua ja jalostusta Geenitutkimusta: evoluutiosta kohti geenivarojen suojelua ja jalostusta 19.10.2016 Metsätieteen päivä Outi Savolainen, Oulun yliopisto, Genetiikan ja fysiologian tutkimusyksikkö Käyttölisenssi: CC BY 4.0

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)

Lisätiedot

Evoluutio. BI Elämä ja evoluutio Leena Kangas-Järviluoma

Evoluutio. BI Elämä ja evoluutio Leena Kangas-Järviluoma Evoluutio BI Elämä ja evoluutio Leena Kangas-Järviluoma 1 Evoluutio lajinkehitystä, jossa eliölajit muuttuvat ja niistä voi kehittyä uusia lajeja on jatkunut elämän synnystä saakka, sillä ei ole päämäärää

Lisätiedot