Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Koko: px
Aloita esitys sivulta:

Download "Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi"

Transkriptio

1 Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi

2 Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien tai käsitysten, hypoteesien, paikkansapitävyyttä. Esim. ovatko jonkin muuttujan keskiarvot kahdessa eri joukossa yhtä suuret? Vastaavatko genotyyppien lukusuhteet risteytysasetelman teoreettisia lukusuhteita? Tätä varten hankitaan otos: ensimmäisessä poimitaan otos kahdesta populaatiosta yksilöitä jälkimmäisessä esimerkissä tehdään risteytyskoe Tilastollisella testillä pyritään selvittämään, vastaako otos perusjoukon suhteen tehtyä hypoteesia. Toisaalta on myös mahdollista verrata kahta otosta toisiinsa. Testin tulos kertoo todennäköisyyden, jolla hypoteesi pitää paikkansa.

3 Tilastollisen testaamisen hypoteesit Testaukseen tarvitaan vertailtavia hypoteeseja. Hypoteesit kuvaavat vaihtoehtoisia päätelmiä, mitä me voimme tehdä aineistosta Kun verrataan esimerkissä muuttujan arvoa kahdessa joukossa hypoteesimme voisivat olla: H0: Muuttujan keskiarvot ovat samat kummassakin joukossa H1: Muuttujan keskiarvossa on (selvä) ero Hypoteesi H0 tavallaan kuvaa testistä riippuen tilanteita jossa Aineistossa ei ole signaalia. Ei ole mitään merkittävää poikkeamaa tavallisesta. Taustakohina (satunnaisvaihtelu) selittää saadut havainnot Hypoteesia H0 kutsutaan nollahypoteesiksi Hypoteesi H1 kuvaa tilanteita jossa: Aineistossa on signaali Aineistossa on merkittävä poikkeama tavallisesta Taustakohina tai satunnainen vaihtelu ei riitä selittämään tuloksia Hypoteesia H1 kutsutaan vastahypoteesiksi

4 Tilastollisen testaamisen hypoteesit Nollahypoteesi (merkitään H 0 ) kuvaa vakiintunutta käsitystä tai väittämää, josta ollaan valmiita luopumaan vasta, kun sitä vastaan saadaan kyllin vahvoja todisteita Esim. halutaan verrata, onko jollakin lääkeaineella vaikutusta. Tällöin verrataan keskenään koe- ja kontrolliryhmiä, ja nollahypoteesina on se, että eroa ei ole vastahypoteesi, H 1, kuvaa tilannetta jossa vakiintunut käsitys ei päde Edellisessä esimerkissä H 1 olisi: ryhmien välillä on eroa.

5 Tilastollisen testaamisen periaatteet Testaus voidaan tehdä vertailemalla kuinka hyvin H0 ja H1 selittävät havaitun aineiston Määritellään kumpikin malli Testataan kuinka hyvin ne selittävät havainnot Verrataan malleja toisiinsa Uskottavuusosamäärä (Likelihood ratio test) Bayesilainen testaus (Bayesian hypothesis testing) Testaus voidaan tehdä käyttäen vain nollahypoteesia H0 Määritellään vain H0 Testataan kuinka hyvin se selittää nähdyt havainnot Testaus p-arvolla Keskitymme jälkimmäiseen

6 Tilastollisen testaamisen periaatteet Jälkimmäisessä testauksessa tutkitaan, kuinka hyvin otos on sopusoinnussa nollahypoteesin kanssa. Tätä sopusointua mitataan testisuureen eli sopivan otoksesta lasketun tunnusluvun avulla. Tunnusluku voisi olla kahden ryhmän (sairaat ja kontrolliryhmä) mittauksen keskiarvojen erotus jaettuna ryhmien sisällä olevalla varianssilla Testisuureen arvoa verrataan testisuureen teoreettiseen (tai odotettuun) jakaumaan (nollahypoteesin vallitessa) Tämä jakauma kertoo siis testisuureen arvojen todennäköisyyden, mikäli nollahypoteesi on totta. Testaus voi perustua myös suoraan johonkin teoreettiseen jakaumaan Esimerkiksi binomijakauman avulla voitaisiin tutkia todennäköisyyttä että tutkitussa otoksessa on satunnaisesti 5 sairasta ja 10 tervettä kun taudin frekvenssi tiedetään

7 Varovaisuusperiaatteen mukaisesti vasta, jos testisuureen arvo poikkeaa teoreettisesta niin paljon, että sellaisia esiintyy vain harvoin pelkän satunnaisvaihtelun vaikutuksesta, uskalletaan nollahypoteesi hylätä. Tällöin siis otoksessa havaitut poikkeamat nollahypoteesista ovat niin suuria, että niitä ei voi pitää enää satunnaisuudesta johtuvina

8 Tilastollinen merkitsevyys Testisuureen nollahypoteesin mukaisen jakauman perusteella voidaan määrittää niin kutsuttu p-arvo. p-arvo kertoo sen osuuden nollahypoteesijakauman käyrän rajaamasta pinta-alasta, joka jää havaitusta testisuureen arvosta vielä äärevämmälle puolelle. p-arvo ilmaisee tuloksen tilastollisen merkitsevyyden tason, eli sen todennäköisyyden, että yhtä äärevä tai vielä äärevämpi tulos saataisiin, vaikka otos olisikin itse asiassa peräisin nollahypoteesin mukaisesta perusjoukosta.

9 Huom! Tilastollisella testillä ei voida koskaan aukottomasti osoittaa jonkin hypoteesin paikkansapitävyyttä, ainoastaan millä varmuudella se voidaan hylätä Huom! Tilastollinen merkitsevyys ja arkipäiväinen merkitsevyys eivät välttämättä ole synonyymisiä ilmaisuja Yleensä tilastollisesti merkitsevänä pidetään p- arvoa 0,05 eli tämän suuruiset tai sitä pienemmät p-arvot johtavat nollahypoteesin hylkäämiseen kyseessä on kuitenkin jossain määrin mielivaltainen arvo, joissakin tapauksissa voi olla syytä pitää vasta vielä pienempiä p-arvoja tilastollisesti merkitsevinä Usein suositellaan pienempää rajaa eli 0,01 Tilastollisesti ennalta merkitseväksi valittua p- arvon tasoa kutsutaan merkitsevyystasoksi.

10 Tilastollisessa testaamisessa voidaan tehdä kahden tyyppisiä virheitä: I-tyypin virhe = hylkäämisvirhe: hylätään H 0 vaikka H 0 on tosi. II-tyypin virhe = hyväksymisvirhe: hyväksytään H 0 vaikka H 1 on tosi. H 0 hyväksytty hylätty Tosi % I-tyypin virhe väärä II-tyypin virhe %

11 Jos nollahypoteesin mukaisesta perusjoukosta poimittaisiin toistuvasti riippumattomia otoksia ja niistä laskettaisiin testisuureen arvot, hylättäisiin nollahypoteesi keskimäärin merkitsevyystason antamassa osuudessa

12 Tilastollisia testejä Tilastollisia testejä on paljon kullakin on oma käyttötarkoituksensa Ei siis ole mitään yleispätevää testiä kaikkeen! Sopivan testin valinta riippuu havaintoaineiston ominaisuuksista, esim. Mitta-asteikosta (jatkuva vai diskreetti muuttuja?) Muuttujan jakaumasta Otosten riippuvuus vs. riippumattomuus Havainnot toisistaan riippumattomia?

13 2 -yhteensopivuustesti Biotieteissä testataan usein luokkien jakaumaa ja tutkitaan eroavatko luokkien jäsenten lukumäärät oletetusta (H0) Luokka voi olla esim. silmien väri Tällä kurssilla käytämme diskreettien jakaumien testaamiseen 2 -testejä A1A1 A1A2 A2A2 Havaittu Huomaa että odotetut arvot eivät ole kokonaislukuja. Tämä selittyy myöhemmin. Odotettu 23,56 103,89 114,55

14 2 -yhteensopivuustesti Esimerkki 23: Populaatiosta on kerätty otos josta määritetään yksilöiden genotyypit. Halutaan selvittää, onko genotyyppijakauma ns. Hardy-Weinbergin tasapainossa. A1A1 A1A2 A2A2 summa Havaittu Taustatietona: Hardy-Weinbergin-tasapainossa genotyyppifrekvenssien jakauma on p 2, 2pq, q 2, jossa p ja q ovat alleelien (A1 ja A2) frekvenssit.

15 Miltä genotyyppijakauman tulisi näyttää, mikäli aineisto on HW-tasapainossa? Otetaan tämä nollahypoteesiksi. Tarvitaan estimaatit alleelifrekvensseille: Voimme laskea alleelifrekvenssit aineiston avulla (eli estimoimme ne genotyyppiaineistostamme). Alleelin A1 frekvenssi: p ,312 Alleelin A2 frekvenssi on siten: q=1-p=1-0,312=0,688

16 HW-tasapainossa aineistossa tulisi siten olla seuraavat määrät kutakin genotyyppiä: A1A1: p 2 N = 0, = 23,56 A1A2: 2pq N = 2 0,312 0, = 103,89 A2A2: q 2 N = 0, = 114,55 Verrataan havaintojamme odotettuihin frekvensseihin: A1A1 A1A2 A2A2 summa Havaittu Odotettu 23,56 103,89 114,55 242,00

17 Kuinka hyvin otoksemme siis on sopusoinnussa nollahypoteesin kanssa? Sopusointua mitataan testisuureen avulla Tutkittaessa yksinkertaisten diskreettien jakaumien yhteensopivuutta on kätevää käyttää 2 - yhteensopivuustestiä Perusajatuksena on verrata luokittain havaittuja frekvenssejä (hav) odotettuihin frekvensseihin (od). Sen testisuure lasketaan seuraavasti: 2 k ( hav i od i 1 odi i ) 2

18 missä k on luokkien lukumäärä. Testisuureen arvoksi saadaan nyt siis 2 ( havi od i 1 odi ) 3 2 i (31 23,56) 23,56 2 (89 103,89) 103,89 2 ( ,55) 114,55 2 4,97 Mitä tämä luku tarkoittaa?

19 Me tarvitsemme jakauman testisuureelle silloin aineistossa ei ole signaalia (nollahypoteesi) 2 -testisuureelle tällainen jakauma on 2 -jakauma 2 -jakaumaa varten meidän täytyy määrittää vapausaste Mikä on vapausaste?

20 Vapausasteet kuvaavat sitä kuinka monta vapaata muuttujaa monimutkikkaammassa mallissa on. Mitä muuttujia arvioidaan kun oletetaan signaali? Mitä muuttujia arvioidaan kun oletetaan nollahypoteesi? Periaatteessa yhteensopivuustestissä vapausasteita on yksi vähemmän kuin luokkien määrä, mutta mikäli joitakin parametreja joudutaan estimoimaan, ne vähennetään vapausasteiden määrästä.

21 Siis vapausasteet ovat luokkien lkm odotettujen frekvenssien määräämiseksi estimoitujen parametrien lkm. Esimerkissämme df=3-1-1=1, eli luokkia on yhtä monta kuin genotyyppejä. Alleelifrekvenssi jouduttiin estimoimaan testattavana olevasta aineistosta jotta odotettu genotyyppijakauma saataisiin tietää, joten sen vuoksi vähennetään vielä 1. (Vain yksi parametri tuli estimoitua, koska toinen alleelifrekvenssi seuraa suoraan ensimmäisestä: q=1-p!) Jos kaikki testaamiseen tarvittava tieto saadaan suoraan hypoteesista (kuten esim. mendelismiesimerkissä), mitään parametreja ei tarvitse estimoida ja vapausasteiden määrä on sama kuin luokkien määrä miinus 1)

22 Taulukko antaa 2 -jakauman pinta-aloja eli todennäköisyyksiä pisteestä 2 p (kriittinen arvo) oikealle, merkitsevyystason p eri arvoilla ja eri vapausasteilla. Esim. jos df=1 niin pisteestä 3,841 oikealle jää todennäköisyys 0,05 eli P( 2 1>3,841)=0,05 Esimerkissämme testisuureen arvoksi tuli 4,97: todennäköisyys nollahypoteesin ollessa totta saada näin suuri tai vielä suurempi testisuureen arvo on siis pienempi kuin viisi prosenttia. Mikäli saatu testisuureen arvo ylittää valitun merkitsevyystason kriittisen arvon 2 p, on poikkeama nollahypoteesista tilastollisesti merkitsevä. Tällöin nollahypoteesi hylätään merkitsevyystasolla p. Esimerkin tapauksessa nollahypoteesi voidaan siis hylätä merkitsevyystasolla 0,05, eli esimerkin genotyypit eivät ole H-Wtasapainossa.

23 2 -jakauman kriittisiä arvoja joillakin merkitsevyystasoilla p ja vapausasteiden df arvoilla df 0,995 0,9500 0,100 0,050 0,025 0,010 0, ,000 0,004 2,706 3,842 5,024 6,635 7, ,010 0,103 4,605 5,992 7,378 9,210 10, ,072 0,352 6,251 7,815 9,348 11,345 12, ,207 0,711 7,779 9,488 11,143 13,277 14, ,412 1,146 9,236 11,071 12,833 15,086 16, ,676 1,635 10,645 12,592 14,449 16,812 18, ,989 2,167 12,017 14,067 16,013 18,475 20, ,344 2,733 13,362 15,507 17,535 20,090 21, ,735 3,325 14,684 16,919 19,023 21,666 23, ,156 3,940 15,987 18,307 20,483 23,209 25, ,603 4,575 17,275 19,675 21,920 24,725 26, ,074 5,226 18,549 21,026 23,337 26,217 28, ,565 5,892 19,812 22,362 24,736 27,688 29, ,075 6,571 21,064 23,685 26,119 29,141 31, ,601 7,261 22,307 24,996 27,488 30,578 32,801

24 2 -riippumattomuustesti Riippumattomuustestillä selvitetään, riippuvatko tarkasteltavat muuttujat toisistaan. Testisuure on sama kuin edellä, mutta käyttötarkoitus ja tarkasteltavat hypoteesit erilaisia. Geneettisen aineiston tapauksessa kyseeseen tulee vaikkapa populaatioiden alleelifrekvenssien vertailu: muodostetaan kaksiulotteinen empiirinen jakauma eli kontingenssitaulu muuttujien alleelityyppi ja populaatio välille: Esimerkki 24: Populaatio 1 Populaatio 2 Populaatio 3 alleeli A alleeli A

25 H 0 : Muuttujat eivät riipu toisistaan (eli alleelin esiintymistodennäköisyys ei riipu populaatiosta vaan alleelifrekvenssi on sama kaikissa populaatioissa). Odotetut frekvenssit lasketaan nollahypoteesin mukaisesti: Kolmen populaation yhteinen alleelifrekvenssi alleelille A1 on 531/940 Silloin odotettu lukumäärä esim. populaatiossa 1 on alleelifr. populaation alleelien lkm = 531/ ,0. Näin saadaan nyrkkisääntö kunkin solun odotetulle määrälle: i : s. rivisumma j : s. sarakesumma od ij kokonaissumma

26 Odotetut frekvenssit: Populaatio 1 Populaatio 2 Populaatio 3 alleeli A1 78,0 288,1 164,9 alleeli A2 60,0 221,9 127,1 Havaittuja solufrekvenssejä hav ij (rivi i, sarake j) verrataan vastaaviin odotettuihin solufrekvensseihin od ij kuten 2 -yhteensopivuustestissä. Luokkina ovat nyt taulukon solut.

27 2 ( hav ) ij odij (76 78,0) ( ,1) ( ,9) (62 60,0) ( ,9) ( ,1) i, j od 78,0 288,1 164,9 60,0 221,9 127,1 ij 0,834 Mikäli havaituissa ja odotetuissa frekvensseissä on suuria poikkeamia, nämä eivät johdu sattumasta vaan muuttujien välisen riippumattomuushypoteesin virheellisyydestä. Vapausasteet voi laskea suoraan kaavasta df=(r-1)(s-1)***, missä r on rivien lkm ja s sarakkeiden lkm. Esimerkissä df=(2-1)(3-1)=2 Tässä tapauksessa p>0,10, joten H 0 jää voimaan

28 ***Mistä sääntö tulee? Vapausasteiden laskemisessa voidaan käyttää yleistä periaatetta: df = vaihtoehtoisen hypoteesin vaatimien parametrien määrä nollahypoteesin vaatimien parametrien määrä. Nyt vaihtoehtoinen hypoteesi olettaa tekijöiden olevan toisistaan riippuvia, jolloin joudutaan estimoimaan kaikkien solujen lukumäärät erikseen eli tarvitaan s*r 1 parametria (koskapa viimeisen solun lukumäärä saadaan: N muut) Vastaavasti nollahypoteesissä oletetaan, että tekijät ovat toisistaan riippumattomia eli estimoidaan erikseen alleelija populaatiofrekvenssit, jolloin parametrien lukumäärä on (s-1) + (r-1). Näiden erotus on s*r 1 (s 1 + r 1) = s*r s r + 1 = (r-1)(s-1)

29 2 -testien käyttörajat: korkeintaan 20 % odotetuista frekvensseistä <5 jokainen odotettu frekvenssi >1 Mikäli nämä vaatimukset eivät voimassa, poikkeaa testisuureen jakauma liikaa asymptoottisesta 2 - jakaumasta. Tällöin testi aliarvioi havaittua merkitsevyystasoa eli johtaa liian herkkään toden nollahypoteesin hylkäämiseen (I-tyypin virhe). Tämä haitta voidaan usein kiertää yhdistelemällä luokkia sopivasti. (Yhdistely luonnollisesti vaikuttaa vapausasteiden määrään) Huom! 2 -testit aina absoluuttisilla lukumäärillä, ei suhteellisilla osuuksilla! Jos kummallakin tekijällä on vain kaksi luokkaa ja luokkien koot ovat pieniä, 2 -testi ei ole paras mahdollinen (asymptoottisuus-oletus). Tällöin voidaan käyttää Fisherin tarkkaa nelikenttätestiä.

30 Muutama käsite vielä: Testien sensitiivisyys ja spesifisyys Hyvien seulontatestien tulee olla paitsi halpoja myös tehokkaita löytämään juuri ne henkilöt, joilla on esim. riskigenotyyppi tai tauti. Testeissä on seuraavat tulosvaihtoehdot: Sairas Positiivinen tulos A B Negatiivinen tulos C D Normaali Testin sensitiivisyys: A/(A+C) on todennäköisyys, jolla sairas henkilö saa testissä positiivisen tuloksen eli hänet löydetään. Testin spesifisyys: D/(B+D) on todennäköisyys, jolla normaali (terve) henkilö saa negatiivisen tuloksen eli normaalia ei erheellisesti väitetä sairaaksi. Väärien positiivisten osuus: B/(A+B) on se osuus kaikista positiivisista testituloksista, joissa testattava henkilö onkin normaali ERITTÄIN TÄRKEÄÄ MM. GEENITESTEISSÄ!

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

11. laskuharjoituskierros, vko 15, ratkaisut

11. laskuharjoituskierros, vko 15, ratkaisut 11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A Mat-2.090 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Estimointi, Havaittu frekvenssi, Heterogeenisuus,

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

S Laskennallinen systeemibiologia

S Laskennallinen systeemibiologia S-114.2510 Laskennallinen systeemibiologia 3. Harjoitus 1. Koska tilanne on Hardy-Weinbergin tasapainossa luonnonvalintaa lukuunottamatta, saadaan alleeleista muodostuvien eri tsygoottien genotyyppifrekvenssit

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. 9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta 22.1.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 22.1.2019 Luku 3 2 -yhteensopivuus- ja riippumattomuustestit 3.1 2 -yhteensopivuustesti H0: otos peräisin tietystä jakaumasta H1: otos ei peräisin

Lisätiedot

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1 Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (2004) 1 Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen Jakaumaoletuksien

Lisätiedot

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti Sosiaalitieteiden laitos Tilastotieteen jatkokurssi, kevät 20 7. laskuharjoitusten ratkaisuehdotukset. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Lisätiedot

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen Tilastollisen analyysin perusteet Luento 5: Sisältö Tilastotieteessä tehdään usein oletuksia havaintojen jakaumasta. Useat tilastolliset menetelmät toimivat tehottomasti tai jopa virheellisesti, jos jakaumaoletukset

Lisätiedot

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastolliset testit TKK (c) Ilkka Mellin (2005) 1 Tilastolliset testit Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 5

031021P Tilastomatematiikka (5 op) viikko 5 031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen

Lisätiedot

2. TILASTOLLINEN TESTAAMINEN...

2. TILASTOLLINEN TESTAAMINEN... !" # 1. 1. JOHDANTO... 3 2. 2. TILASTOLLINEN TESTAAMINEN... 4 2.1. T-TESTI... 4 2.2. RANDOMISAATIOTESTI... 5 3. SIMULOINTI... 6 3.1. OTOSTEN POIMINTA... 6 3.2. TESTAUS... 7 3.3. TESTIEN TULOSTEN VERTAILU...

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5 TKK (c) Ilkka Mellin (4) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (4) : Mitä opimme? 1/5 Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitä

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto Kytkentäanalyysin teoriaa Pyritään selvittämään tiettyyn ominaisuuteen vaikuttavien eenien paikka enomissa Perustavoite: löytää markkerilokus jonka alleelit ja tutkittava ominaisuus (esim. sairaus) periytyvät

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (2007) 1 Yhteensopivuuden, homogeenisuuden ja riippumattomuuden

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET 19.5.2016 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 1.1 Tiekartta... 4 2 VIRHEMARGINAALI JA LUOTTAMUSVÄLI... 5 2.1 Keskiarvon virhemarginaali ja

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003

Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Nimi Opiskelijanumero Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Normaalisti jakautuneiden yhdistyksessä on useita tuhansia jäseniä. Yhdistyksen sääntöjen mukaan sääntöihin tehtävää muutosta

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

6. laskuharjoitusten vastaukset (viikot 10 11)

6. laskuharjoitusten vastaukset (viikot 10 11) 6. laskuharjoitusten vastaukset (viikot 10 11) 1. a) Sivun 102 hypergeometrisen jakauman määritelmästä saadaan µ µ 13 39 13! 13 12 11 10 9 µ 0! 8! 1! 2 2! 2 1 0 49 48! 47!! 14440 120 31187200 120 1287

Lisätiedot

Teema 9: Tilastollinen merkitsevyystestaus

Teema 9: Tilastollinen merkitsevyystestaus Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

Genetiikan perusteet 2009

Genetiikan perusteet 2009 Genetiikan perusteet 2009 Malli selittää, mutta myös ennustaa ja ennusteen voi testata kokeella. Mendel testasi F 2 -mallinsa tuottamalla itsepölytyksellä F 3 -polven Seuraava sukupolvi tai toinen, riippumaton

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

52746 Geneettinen analyysi

52746 Geneettinen analyysi 52746 Geneettinen analyysi Päivi Onkamo Sampo Sammalisto Jack Leo Pekka Uimari Perinnöllisyystieteen oppiaine, Biotieteiden laitos, Helsingin yliopisto 2011 Sisällysluettelo Johdanto... 3 Luennot... 4

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET 21.5.2014 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 1.1 Tiekartta... 4 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 5 2.1 Keskiarvon luottamusväli... 5 2.2

Lisätiedot