Datan käsittely R-ohjelmistolla

Koko: px
Aloita esitys sivulta:

Download "Datan käsittely R-ohjelmistolla"

Transkriptio

1 Tilastollinen tietojenkäsittely Jarkko Isotalo - TILTA4 R-ohjelmiston alkeet syksy 2011 Datan käsittely R-ohjelmistolla Tehtävä 1. Tarkastellaan seuraavaa dataa: Miehet: Naiset: pituus paino pituus paino (a) Muodosta datasta muuttujat pituus,paino ja sukupuoli. (b) Muodosta uusi muuttuja painoindeksi=paino/(pituus/100)*(pituus/100). (c) Laske painoindeksi muuttujan keskiarvo ja muodosta muuttujasta histogrammi.

2 syksy 2011 R-ohjelmiston alkeet TILTA4 - Jarkko Isotalo 2 Tehtävä 2. (a) Muodosta mitat niminen data.frame objekti edellisen tehtävän muuttujista. (b) Käytä cbind() käskyä yhdistämään edellisen tehtävän muuttujat. (c) Laske otoskeskihajonta mitat datan painoindeksi muuttujasta? Tehtävä 3. (a) Poimi mitat datasta kolmas ja viides havaintorivi. (b) Muodosta mitat datasta osadata, mikä koostuu naisista. (c) Järjestä muuttuja mitat$paino laskevaan järjestykseen. (d) Järjestä mitat data muuttujan paino suhteen laskevaan järjestykseen. (e) Tallenna mitat data kovalevylle tekstimuodossa nimellä mitat.txt. (f) Tallenna mitat data kovalevylle R:n tiedostomuodossa mitat.rdata ja koko työtila kovalevylle muodossa kaikki.rdata.

3 syksy 2011 R-ohjelmiston alkeet TILTA4 - Jarkko Isotalo 3 Tehtävä 4. (a) Lue data maailma.txt R:än. (b) Piirrä pisteparvi datan muuttujista vaentiheys ja elinaika ja laske muuttujien välinen korrelaatiokerroin. Listat ja funktiot Tehtävä 5. (a) Muodosta lista niminen list objekti siten, että lista sisältää argumentit weight=paino ja height=pituus. (b) Muodosta lause niminen list objekti, mikä sisältää lauseen "R on tilastollinen ohjelmointiympäristö" ja kyseisen lauseen sanojen lukumäärän.

4 syksy 2011 R-ohjelmiston alkeet TILTA4 - Jarkko Isotalo 4 Tehtävä 6. (a) Muodosta funktio joka laskee annetusta vektorista lukujen minimiarvon, 1. kvantiilin, mediaaniarvon, 3. kvantiilin ja maksimiarvon ja palauttaa nämä lista muodossa. Testaa funktion toimivuutta painoindeksi muuttujan avulla. (b) Muodosta R-funktio, joka laskee funktion { x/y, jos y 0 f(x, y) = x, jos y = 0 arvon.

5 Tilastollinen tietojenkäsittely Jarkko Isotalo - TILTA4 Tilastotieteen perusteita syksy 2011 Todennäköisyyslaskentaa Tehtävä 1. Olkoon X satunnaismuuttuja, joka noudattaa normaalijakaumaa X N(8, 2), missä siis odotusarvo µ = 8 ja varianssi σ 2 = 2. (a) Laske käyttäen sopivaa R:n funktiota todennäköisyys P (7 X 10). (b) Mikä on se ˆx:n arvo, jolle on voimassa todennäköisyys P (X ˆx) = (c) Piirrä satunnaismuuttujan X tiheysfunktion f(x) kuvaaja. Tehtävä 2. Olkoon X satunnaismuuttuja, joka noudattaa binomijakaumaa X Bin(10, 0.3), missä siis toistokokeiden lukumäärä n = 10 ja yhdessä kokeessa onnistumisen todennäköisyys p = 0.3. (a) Laske käyttäen sopivaa R:n funktiota todennäköisyys P (X = 5). (b) Laske lisäksi todennäköisyydet P (X 2) ja P (4 X 9). (c) Piirrä satunnaismuuttujan X pistetodennäköisyyden f(x) kuvaaja.

6 syksy 2011 Tilastotieteen perusteita TILTA4 - Jarkko Isotalo 2 Analyysit yhdelle muuttujalle Tehtävä 3. (a) Laske mitat datasta muuttujalle painoindeksi otoskeskiarvo, otosmediaani ja otoshajonta. (b) Laske mitat datasta otostunnuslukuja summary() käskyllä. (c) Laske muuttujasta painoindeksi otoskvantiilit ja empiirisen kertymäfunktion arvot. Tehtävä 4. (a) Piirrä painoindeksi muuttujasta histogrammi. (b) Piirrä paino ja pituus muuttujista boxplotit. (c) Piirrä paino muuttujasta Q-Q-plotti. (d) Piirrä sukupuoli muuttujasta pylväsdiagrammi ja piirakkakuvio.

7 syksy 2011 Tilastotieteen perusteita TILTA4 - Jarkko Isotalo 3 Tehtävä 5. (a) Testaa t-testillä, onko painoindeksi muuttujan odotusarvolle µ voimassa hypoteesi H 0 : µ = 26. (b) Testaa Wilcoxonin testillä, onko painoindeksi muuttujan odotusarvolle µ voimassa hypoteesi H 0 : µ = 26. Ehdolliset analyysit Tehtävä 6. (a) Laske mitat datasta muuttujalle painoindeksi ehdolliset otoskeskiarvot sukupuolen suhteen. (b) Laske paino ja pituus muuttujille ehdolliset otoskeskiarvot sukupuolen suhteen aggregate() käskyllä. (c) Laske paino ja pituus muuttujille ehdollisia otostunnuslukuja sukupuolen suhteen by() käskyllä.

8 syksy 2011 Tilastotieteen perusteita TILTA4 - Jarkko Isotalo 4 Tehtävä 7. (a) Piirrä painoindeksi muuttujasta ehdolliset histogrammit sukupuolen suhteen. (b) Piirrä paino muuttujasta ehdolliset boxplotit miehille ja naisille. (c) Piirrä pituus muuttujasta stripchart() sukupuolen suhteen. Tehtävä 8. (a) Testaa t-testillä onko painoindeksi muuttujan odotusarvot yhtäsuuret miehillä ja naisilla: H 0 : µ M = µ N. (b) Testaa Wilcoxonin testillä onko painoindeksi muuttujan odotusarvot yhtäsuuret miehillä ja naisilla: H 0 : µ M = µ N. (c) Testaa onko painoindeksi muuttujan varianssit yhtäsuuret miehillä ja naisilla: H 0 : σ 2 M = σ 2 N.

9 syksy 2011 Tilastotieteen perusteita TILTA4 - Jarkko Isotalo 5 Kolmen otoksen testit Tehtävä 9. (a) Luokittele pituus muuttuja kolmeen luokkaan. (b) Testaa varianssianalyysin avulla onko painoindeksi muuttujan odotusarvot yhtäsuuret luokitellun pituus muuttujan tasoilla. (c) Testaa Kruskal-Wallis testin avulla onko painoindeksi muuttujan odotusarvot yhtäsuuret luokitellun pituus muuttujan tasoilla. (d) Tee parittaiset t-testit edellisen kohdan testaustilanteessa ja testaa varianssien homogeenisyyttä Bartlettin testillä. Riippuvuuskuvaajat ja regressioanalyysi Tehtävä 10. (a) Piirrä paino ja pituus muuttujien välinen pisteparvi niin, että sukupuolet erottautuvat kuvassa. (b) Piirrä paino ja pituus muuttujien välinen bagplot() kirjaston aplpack avulla. (c) Piirrä paino ja pituus muuttujien väliset Chernoffin kasvot.

10 syksy 2011 Tilastotieteen perusteita TILTA4 - Jarkko Isotalo 6 Tehtävä 11. (a) Muodosta lineaarinen regressiomalli missä selitettävänä muuttujana on paino ja selittävänä muuttujana pituus. (b) Muodosta lineaarinen regressiomalli missä selitettävänä muuttujana on paino ja selittävinä muuttujina pituus ja sukupuoli. (c) Laske erilaisia korrelaatiokertoimia paino ja pituus muuttujien väliltä. Taulukot ja riippumattomuuden testaus Tehtävä 12. (a) Muodosta paino ja pituus muuttujista kolmiluokkaiset l.paino ja l.pituus muuttujat ja tee uusista muuttujista ristiintaulukko. (b) Tee xtabs() ja ftable() käskyillä kolme ulotteiset ristiintaulukot muuttujista l.paino, l.pituus ja sukupuoli. (c) Laske suhteelliset frekvenssit l.paino ja l.pituus muuttujien ristiintaulukosta. (d) Muodosta data.frame() objekti l.paino ja l.pituus muuttujien ristiintaulukosta.

11 syksy 2011 Tilastotieteen perusteita TILTA4 - Jarkko Isotalo 7 Tehtävä 13. (a) Piirrä l.paino ja l.pituus muuttujien ristiintaulukosta ja suhteellisten frekvenssien ristiintaulukosta pylväsdiagrammit. (b) Piirrä l.paino ja l.pituus muuttujien ristiintaulukosta ja suhteellisten frekvenssien ristiintaulukosta dotchart() kuva. (c) Piirrä l.paino ja l.pituus muuttujien ristiintaulukosta piirakkakuvio. Tehtävä 14. (a) Luokittele pituus kahteen luokkaan. Testaa Fisherin ja χ 2 -testillä, ovatko luokiteltu pituus ja sukupuoli riippumattomia toisistaan. (b) Testaa χ 2 -testillä, ovatko l.paino ja l.pituus muuttujat riippumattomia toisistaan.

12 Tilastollinen tietojenkäsittely Jarkko Isotalo - TILTA4 Satunnaislukujen generoiminen syksy 2011 Johdanto Laskennallisessa tilastotieteessä tutkitaan usein tarkasteltavaa satunnaisilmiötä simuloinnin avulla. Jotta tarkasteltavan satunnaisilmiön todellisuutta pystyttäisiin jäljittelemään, tarvitaan menetelmiä kuinka tuottaa havaittuja toteutuneita arvoja tarkasteltavasta satunnaisilmiöstä. Satunnaislukujen generoimiselle tarkoitetaan sellaista toimintaa, missä keinotekoisesti tuotetaan n kappaletta toteutuneita arvoja x 1, x 2,..., x n tarkasteltavasta satunnaismuuttujasta X. Satunnaismuuttuja X noudattaa aina jotakin todennäköisyysjakaumaa. Merkitään X:n kertymäfunktiota P (X x) = F X (x):llä ja tiheysfunktiota (pistetodennäköisyysfunktiota) f X (x):llä. Satunnaismuuttuja X noudattaa kertymäfunktion F X määrittelemää jakaumaa: X F X (x) = x f X (t) dt. Satunnaislukujen generoinnin kannalta kaikista tärkein todennäköisyysjakauma on [0, 1] välillä määritelty jatkuva tasajakauma. Jos satunnaismuuttuja U noudattaa tasajakaumaa U T as(0, 1), niin silloin sen tiheys- ja kertymäfunktio ovat muotoa f U (u) = 1 ja F U (u) = u, u [0, 1]. Tasajakauman merkitys satunnaislukujen generoimisessa johtuu seuraavasta tuloksesta. Lause 1. Olkoon satunnaismuuttujalla X kertymäfunktio F X (x) ja määritellään kertymäfunktion F X yleistetty käänteisfunktio F X seuraavasti: F X (u) = inf{x : F X(x) u, u [0, 1]}. Jos satunnaismuuttuja U noudattaa jatkuvaa tasajakaumaa U T as(0, 1), niin silloin satunnaismuuttuja F X (U) noudattaa kertymäfunktion F X määrittelemää jakaumaa. Todistus. Kaikille u [0, 1] ja x F X ([0, 1]) on voimassa F X (F X(x)) x, u F X (F X (u)). Täten joukoille on voimassa {(u, x) : F X (u) x} = {(u, x) : u F X(x)}, ja siten P (F X (U) x) = P (U F X(x)) = F U (F X (x)) = F X (x).

13 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 2 Edellä esitetyn tuloksen perusteella saadaan yleinen menetelmä, kuinka tuottaa n kappaletta arvoja x = (x 1, x 2,..., x n ) satunnaismuuttujan X jakaumasta F X. Ensiksi siis tuotetaan n kappaletta toteutuneita arvoja u = (u 1, u 2,..., u n ) tasajakaumasta U T as(0, 1) ja sitten tehdään muutos x = F X (u) eli x 1 F X x 2 (u 1). = F X (u 2).. F X (u n) x n Käytännössä yleistetyn käänteisfunktion F X muodostaminen voi olla hyvin vaikeaa ja siten käytännössä satunnaislukujen generointi kannattaa perustuu muihin menetelmiin kuin yleistetyn käänteisfunktion käyttöön. Edellä oleva esitys kuitenkin antaa käsityksen siitä, että tasajakaumalla on satunnaismuuttujien tuottamisessa erityinen rooli. Satunnaislukujen generoiminen R-ohjelmistolla R-ohjelmistossa on yleisimmille todennäköisyysjakaumille valmiit funktiot kuinka generoida kyseisestä jakaumasta arvoja. Alla olevassa taulukossa on listattu käytetyimpien jakaumien kertymäfunktiot ja generointifunktiot. Jakauma F x Generaattiori Parametrit Tasajakauma punif runif min, max Normaalijakauma pnorm rnorm mean, sd Studentin t-jakauma pt rt df F-jakauma pf rf df1,df2 χ 2 -jakauma pchisq rchisq df Beta-jakauma pbeta rbeta shape1, shape2 Gamma-jakauma pgamma rgamma shape, rate tai scale Binomijakauma pbinom rbinom size, prob Negatiivinen binomijakauma pnbinom rnbinom size, prob Poissonin jakauma ppois rpois lambda Tehtävä 1. Generoi satunnaismuuttujasta Y 100 alkion satunnaisotos kun oletetaan, että Y muodostuu lineaarisesta funktiosta Y = β 0 + β 1 X + σε, missä β 0, β 1, X, σ ja ε ovat kaikki toisistaan riippumattomia satunnaismuuttujia ja noudattavat jakaumia β 0 N(2, 1/2), β 1 Beta(2, 2), X N(3, 1), σ Gamma(2, 1), ε N(0, 2).

14 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 3 Käänteistransformaatiomenetelmä Edellä ei käsitelty, kuinka R-ohjelmisto käytännössä tuottaa eri todennäköisyysjakaumien tilanteessa satunnaislukuja. Riippuen jakaumasta menetelmä vaihtelee ja usein menetelmä on myös hyvin monimutkainen, jotta satunnaislukuja saataisiin generoitua mahdollisimman tehokkaasti. Seuraavaksi katsotaan yksinkertaisia käytännön menetelmiä, joiden avulla satunnaislukuja voidaan generoida. Ensimmäisenä tarkastellaan käänteistransformaatiomenetelmää. Käänteistransformaatiomenetelmä perustuu lauseeseen 1. tilanteessa, missä satunnaismuuttujan X kertymäfunktiolla F X on olemassa käänteisfunktio F 1 X : F 1 X (F X(x)) = x, F X (F 1 X (u)) = u, u [0, 1]. Käänteistransformaatiomenetelmän algoritmi on täten seuraava: Algoritmi Johdetaan kertymäfunktion F X käänteisfunktion F 1 X (u) kaava. 2. Generoidaan luku u jakaumasta U T as(0, 1). 3. Lasketaan x = F 1 X (u). Tehtävä 2. Olkoon satunnaismuuttuja X:n tiheysfunktio muotoa f X (x) = 2x, 0 < x < 1. Generoi 100 havainnon satunnaisotos X:n jakaumasta.

15 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 4 Tehtävä 3. Olkoon satunnaismuuttuja X:n kertymäfunktio muotoa F X (x) = 1 e x. Generoi 100 havainnon satunnaisotos X:n jakaumasta.

16 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 5 Käänteistransformaatiomenetelmä, diskreetti jakauma Diskreetin jakauman tilanteessa satunnaislukuja voidaan generoida seuraavan algoritmin mukaan. Käänteistransformaatiomenetelmää kutsutaan diskreetin jakauman tilanteessa myös taulukkomenetelmäksi. Algoritmi Järjestetään satunnaismuuttujan X tulosvaihtoehdot nousevaan järjestykseen x (1), x (2),..., x (i),..., x (p) niin, että on voimassa F X (x (i 1) ) F X (x (i) ). 2. Generoidaan luku u jakaumasta U T as(0, 1). 3. Valitaan x (i), jolle voimassa F X (x (i 1) ) < u F X (x (i) ). Tehtävä 4. Olkoon satunnaismuuttuja X:n pistetodennäköisyysfunktio muotoa x f X (x) Generoi 100 havainnon satunnaisotos X:n jakaumasta.

17 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 6 Hyväksymis-hylkäysmenetelmä Mikäli satunnaismuuttujan X kertymäfunktion F X käänteisfunktiota F 1 X tai yleistettyä käänteisfunktiota F X on mahdotonta muodostaa, niin silloin hyväksymis-hylkäysmenetelmän avulla voidaan kuitenkin tuottaa satunnaislukuja X:n jakaumasta. Hyväksymishylkäysmenetelmässä pyritään ensiksi löytämään jokin sellainen satunnaismuuttuja Y, jonka jakaumasta osataan muilla menetelmillä generoida satunnaislukuja. Merkitään satunnaismuuttujan Y tiheysfunktiota f Y (y):llä. Mikäli on olemassa jokin sellainen vakio c, että f X (y) cf Y (y), niin silloin voidaan käyttää satunnaismuuttujan Y jakaumaa hyväksi, jotta saadaan generoitua satunnaislukuja X:n jakaumasta. Hyväksymishylkäysmenetelmän algoritmi on seuraavanlainen. Algoritmi 3a. Olkoon c sellainen realiluku, jolle on voimassa f X (y) cf Y (y), y. 1. Generoidaan y jakaumasta, jonka tiheysfunktio on f Y (y). 2. Generoidaan u jakaumasta U T as(0, cf Y (y)). 3. Jos u f X (y), niin asetetaan x = y, muuten palataan kohtaan 1. Algoritmia 3a. vastaa myös seuraava algoritmi: Algoritmi 3b. 1. Generoidaan y jakaumasta, jonka tiheysfunktio on f Y (y). 2. Generoidaan u jakaumasta U T as(0, 1). 3. Jos u f X(y) cf Y, niin asetetaan x = y, muuten palataan kohtaan 1. (y) Hyväksymis-hylkäysmenetelmä toimii, koska hyväksytyn satunnaismuuttujan Y U f X(Y ) cf Y (Y ) jakauma on sama kuin X:n jakauma: ( ) ( P Y x U f ) X(Y ) P Y x, U f X(Y ) cf Y (Y ) = ( ) cf Y (Y ) P U f X(Y ) cf Y (Y ) x fx (y)/cf Y (y) duf 0 Y (y)dy = fx (y)/cf Y (y) duf 0 Y (y)dy = x f X (y) cf Y (y) f Y (y)dy f X (y) f cf Y (y) Y (y)dy x = f x X(y)dy f X(y)dy = f X(y)dy = P (X x). 1

18 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 7 Tehtävä 5. Noudattakoon satunnaismuuttuja X beta-jakaumaa X Beta(2, 2). Generoi 100 havainnon satunnaisotos X:n jakaumasta hyväksymis-hylkäysmenetelmällä. Tehtävä 6. Generoi 100 havainnon satunnaisotos normaalijakaumasta N(0, 1) hyväksymishylkäysmenetelmällä käyttäen Cauchyn jakaumaa instrumenttijakaumana.

19 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 8 Muunnokset Useita tunnettuja satunnaismuuttujia saadaan muodostettua muunnoksena toisista satunnaismuuttujista. Saman muunnoksen avulla voidaan sitten generoida havaintoja tarkasteltavasta satunnaismuuttujasta. Alla on listattu joitakin yleisesti käytettyjä ja tunnettuja muunnoksia. Box-Muller muunnos: Olkoon U 1 ja U 2 riippumattomia satunnaismuuttujia, jotka noudattavat tasajakaumaa U 1 T as(0, 1) ja U 2 T as(0, 1). Tällöin satunnaismuuttujat X 1 = 2 log(u 1 ) cos(2πu 2 ), X 2 = 2 log(u 2 ) sin(2πu 1 ) ovat toisistaan riippumattomia ja noudattavat standardoitua normaalijakaumaa: X 1 N(0, 1) ja X 2 N(0, 1). Normaalijakauman lineaarinen muunnos. Noudattakoon satunnaismuuttuja Z standardoitua normaalijakaumaa Z N(0, 1). Tällöin satunnaismuuttuja X = µ + σz noudattaa normaalijakaumaa X N(µ, σ 2 ). Normaalijakauman neliömuunnos. Noudattakoon riippumattomat satunnaismuuttujat Z 1, Z 2,..., Z p standardoitua normaalijakaumaa Z i N(0, 1). Tällöin satunnaismuuttuja X = Z Z Z 2 p noudattaa χ 2 -jakaumaa X χ 2 (p) vapausastein df = p. Normaali- ja χ 2 -jakauman suhde. Jos Z N(0, 1) ja X χ 2 (p) ovat riippumattomia, niin silloin suhde T = Z X/p noudattaa Studentin t-jakaumaa T t(p) vapausastein df = p. χ 2 -jakaumien suhde. Jos Y χ 2 (q) ja X χ 2 (p) ovat riippumattomia, niin silloin suhde W = Y/q X/p noudattaa F -jakaumaa W F (q, p) vapausastein df 1 = q ja df 2 = p. Gammajakaumien suhde: Jos Y Gamma(a, 1) ja X Gamma(b, 1) ovat riippumattomia, niin silloin suhde W = Y X + Y noudattaa betajakaumaa W Beta(a, b).

20 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 9 Tehtävä 7. Noudattakoon satunnaismuuttuja X beta-jakaumaa X Beta(2, 2). Generoi 100 havainnon satunnaisotos X:n jakaumasta gammajakaumien suhteen avulla. Tehtävä 8. Generoi 100 havainnon satunnaisotos χ 2 (7):n jakaumasta normaalijakauman neliömuunnoksen avulla.

21 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 10 Jakaumien sekoitukset Satunnaismuuttuja Y noudattaa diskreettiä sekoitusjakaumaa, jos Y :n kertymäfunktio F Y on muotoa k F Y (y) = θ i F Xi (x i ), i=1 missä F X1, F X2,..., F Xk ovat satunnaismuuttujien X 1, X 2,..., X k kertymäfunktioita, ja vakiolle θ i > 0 on voimassa k i=1 θ i = 1. Vakioita θ i kutsutaan sekoitustodennäköisyyksiksi. Satunnaismuuttuja Y noudattaa jatkuvaa sekoitusjakaumaa, jos Y :n kertymäfunktio on muotoa F Y Tehtävä 9. Oletetaan, että F Y (y) = F Y X=x (y)f X (x) dx. X 1 N(0, 1), X 2 N(6, 1), X 3 N(12, 1). Generoi 100 havainnon satunnaisotos sekoitusjakaumasta F Y = θ 1 F X1 + θ 2 F X2 + θ 3 F X3, missä sekoitustodennäköisyydet ovat P (θ = θ 1 ) = 0.25, P (θ = θ 2 ) = 0.5, P (θ = θ 3 ) = 0.25.

22 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 11 Moniulotteinen normaalijakauma Satunnaisvektori x = (X 1, X 2,..., X d ) noudattaa d-ulotteista normaalijakaumaa, jos satunnaisvektorin x yhteistiheysfunktio on muotoa ( 1 f x (x) = exp 1 ) (2π) d/2 Σ 1/2 2 (x µ) Σ 1 (x µ), x R d. Satunnaisvektorin x noudattaessa moniulotteista normaalijakaumaa käytetään merkintää x N(µ, Σ), missä µ 1 σ1 2 σ σ 1d µ 2 µ =., Σ = σ21 2 σ σ 2d. µ d σd1 2 σ d2... σd 2 ovat jakauman määrittävät odotusarvovektori ja kovarianssimatriisi. Kovarianssimatriisin Σ diagonaalilla on satunnaismuuttujien X i varianssit V ar(x i ) = σ 2 i ja off-diagonaalilla satunnaismuuttujien X i ja X j väliset kovarianssit Cov(X i, X j ) = σ ij. Seuraavassa on listattu joitakin moniulotteisen normaalijakauman ominaisuuksia. Lineaarinen muunnos: Jos x N(µ, Σ), niin y = Ax + b noudattaa jakaumaa y N(Aµ + b, AΣA ). Yksittäisen satunnaismuuttujan jakauma: Jos x N(µ, Σ), niin X i N(µ i, σ 2 i ). Standardoitujen satunnaismuuttujien jakauma: Jos Z 1, Z 2,..., Z d ovat riippumattomia satunnaismuuttujia, joista jokainen noudattaa standardoitua normaalijakaumaa Z i N(0, 1), niin silloin satunnaisvektori z = (Z 1, Z 2,..., Z d ) noudattaa moniulotteista normaalijakaumaa z N(0, I), missä I = Generointimuunnos: Olkoon z N(0, I) ja olkoon kovarianssimatriisilla Σ matriisihajotelma Σ = CC. Silloin x = µ + Cz noudattaa jakaumaa x N(µ, Σ). Ehdollinen jakauma: Tarkastellaan ositettua satunnaisvektoria x = (x 1, x 2). Jos x N(µ, Σ), eli ( ) (( ) ( )) x1 µ1 Σ11 Σ N, 12, x 2 µ 2 Σ 21 Σ 22 niin silloin ehdollinen satunnaisvektori x 2 x 1 noudattaa moniulotteista normaalijakaumaa x 2 x 1 N(µ 2 + Σ 21 Σ 1 11 (x 1 µ 1 ), Σ 22 Σ 21 Σ 1 11 Σ 12 )

23 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 12 Tehtävä 10. Noudattakoon satunnaismuuttujat X 1 ja X 2 kaksiulotteista normaalijakaumaa ( ) (( ) ( )) X N, X 2 Merkitään W :llä X 2 :n ehdollista jakaumaa kun X 1 on saanut arvon X = 12, eli W = X 2 X 1 = Mitä jakaumaa W noudattaa? 2. Laske todennäköisyydet P (W < 5) ja P (2 < W < 3). Satunnaislukujen generoiminen d-ulotteisen normaalijakauman x N(µ, Σ) tilanteessa perustuu seuraavaan algoritmiin. Algoritmi Generoidaan d kappaletta satunnaislukuja z i standardoidusta normaalijakaumasta N(0, 1) ja muodostetaan luvuista vektori z = (z 1, z 2,... z d ). 2. Muodostetaan kovarianssimatriisille matriisihajotelma Σ = CC esimerkiksi ominaisarvohajotelman tai Choleskin hajotelman avulla. 3. Tehdään muunnos x = µ + Cz. Kovarianssimatriisin Σ ominaisarvohajoitelma saadaan tehtyä R-ohjelmistossa eigen() funktiolla. Funktio palauttaa ominaisarvovektorit T = (t 1 : t 2 : : t d ) ja ominaisarvot λ = (λ 1, λ 2,..., λ d ). Matriisihajotelmassa Σ = CC tarvittava matriisi C saadaan nyt ominaisarvohajotelman tilanteessa muodostettua joko kaavalla C = T diag(λ) 1/2 tai kaavalla C = T diag(λ) 1/2 T. Cholenskin hajotelma saadaan tehtyä R:ssä puolestaan funktiolla chol(), mikä palauttaa ylädiagonaalimatriisin niin että C = chol(σ).

24 syksy 2011 Satunnaislukujen generoiminen TILTA4 - Jarkko Isotalo 13 Tehtävä 11. Generoi 200 alkion satunnaisotos kolme ulotteisesta normaalijakaumasta x N(µ, Σ), missä µ = (0, 1, 2) Σ =

25 Tilastollinen tietojenkäsittely Jarkko Isotalo - TILTA4 Monte Carlo menetelmät syksy 2011 Monte Carlo integrointi Monte Carlo menetelmiksi voidaan kutsua kaikkia sellaisia menetelmiä, joissa simulointia käytetään hyväksi ratkaistaessa tilastollisen päättelyn ja numeerisin analyysin ongelmia. Ensimmäiseksi tarkastellaan Monte Carlo integrointia. Olkoon ongelmana laskea integraalin θ = b a g(x)dx arvo. Jos ajatellaankin, että integraalissa x on satunnaismuuttuja, joka noudattaa tasajakaumaa x T as(a, b) eli f x (x) = 1 b a, niin yllä oleva integraali on yhtä kuin θ = b a g(x)dx = 1 f x (x) b a b g(x)f x (x)dx 1 = (b a) g(x) a b a dx = (b a) E(g(x)). Odotusarvoa E(g(x)) voidaan nyt numeerisesti estimoida generoimalla ensiksi n kappaleen satunnaisotos x 1, x 2,..., x n tasajakaumasta T as(a, b) ja laske sitten satunnaisotoksen avulla otoskeskiarvo n E(g(x)) i=1 = g(x) = g(x i). n Täten integraalin θ = b g(x)dx numeeriseksi estimaatiksi saadaan a ˆθ = (b a)g(x). Algoritmi 1. Monte Carlo estimaattori integraalille θ = b g(x)dx lasketaan seuraavasti: a 1. Generoidaan x 1, x 2,..., x n tasajakaumasta x T as(a, b). 2. Lasketaan g(x) = 1 n n i=1 g(x i). 3. Lasketaan ˆθ = (b a)g(x).

26 syksy 2011 Monte Carlo menetelmät TILTA4 - Jarkko Isotalo 2 Tehtävä 1. Laske Monte Carlo estimaatti integraalille θ = 4 2 e x dx. Tehtävä 2. Käytä Monte Carlo menetelmää standardoidun normaalijakauman kertymäfunktion arvon laskemiseen: F X (x) = x 1 2π e t2 /2 dt.

27 syksy 2011 Monte Carlo menetelmät TILTA4 - Jarkko Isotalo 3 Bootstrap estimoinnista Bootstrap on epäparametrinen Monte Carlo simulointimenetelmä, missä havaitusta otoksesta x = (x 1, x 2,..., x n ) poimitaan palauttamalla (resampling) uusia otoksia x = (x 1, x 2,..., x n). Bootstrapin avulla voidaan tutkia jonkin otosfunktion W = W (x) jakaumaa. Bootstrapissä alkuperäisestä otoksesta x muodostetaan uusia otoksia b = 1, 2,..., B kertaa ja jokaisen bootstrap otoksen tilanteessa x (b) = (x (b) 1, x (b) 2,..., x (b) n ) lasketaan otosfunktion W (b) = W (b) (x (b) ) arvo. Saatujen otosfunktioiden arvojen W (b) avulla voidaan estimoida otosfunktion W jakaumaa. Olkoon x = (x 1, x 2,..., x n ) satunnaisotos satunnaismuuttujan X F X jakaumasta. Olkoon lisäksi θ jokin tuntematon parametri ja olkoon ˆθ = ˆθ(x) otoksesta x laskettu tuntemattoman parametrin estimaatti. Nyt siis W = ˆθ. Bootstrap menetelmällä voidaan estimoida estimaattorin ˆθ jakaumaa Fˆθ. Bootstrap menetelmää käytetään erityisesti erilaisten luottamusväliestimaattien muodostamiseen tuntemattomalle parametrille θ. Algoritmi Jokaisella bootstrap estimointikerralla b = 1, 2,..., B (a) Generoidaan otos x (b) = (x 1, x 2,..., x n) poimimalla n:n alkion otos havaitusta otoksesta x = (x 1, x 2,..., x n ) palauttamalla. (b) Lasketaan bootstrap estimaatti ˆθ (b) = ˆθ (b) (x (b) ) bootstrap otoksesta x (b). 2. Bootstrap estimaatti estimaattorin ˆθ = ˆθ(x) jakaumalle Fˆθ on estimaattien ˆθ (1),..., ˆθ (B) empiirinen jakauma. Tehtävä 3. Estimoi maailma.txt aineiston vaentiheys muuttujan odotusarvon µ estimaattorin ˆµ = x jakaumaa Fˆµ bootstrap menetelmän avulla. Näyttäisikö siltä, että estimaattorin ˆµ = x jakauma olisi normaalisti jakautunut?

28 syksy 2011 Monte Carlo menetelmät TILTA4 - Jarkko Isotalo 4 Bootstrap menetelmän avulla voidaan estimoida estimaattorin ˆθ hajontaa (keskivirhettä) se(ˆθ) = σˆθ käyttämällä kaavaa missä ˆθ (b) = 1 B B b=1 ˆθ (b). Myös estimaattorin ˆθ harhan ŝe(ˆθ) = ˆσˆθ = 1 B (ˆθ (b) B 1 ˆθ ) 2, (b) b=1 bias(ˆθ) = E(ˆθ θ) suuruutta voidaan estimoida bootstrap estimaattoreiden avulla: bias(ˆθ) = ˆθ (b) ˆθ. Tehtävä 4. Laske maailma.txt aineiston logaritmoitujen muuttujien log(vaentiheys) ja log(elinaika) välisen korrelaatiokertoimen harhalle (bias) ja keskivirheelle (standard error) bootstrap estimaatit.

29 syksy 2011 Monte Carlo menetelmät TILTA4 - Jarkko Isotalo 5 Bootstrap menetelmän avulla voidaan muodostaa luottamusväliestimaatteja tuntemattomalle parametrille θ tilanteessa, missä estimaattorin ˆθ jakauma Fˆθ on tuntematon. Tuntemattoman parametrin θ 100(1 α)% luottamusväli saadaan muodostettua kaavalla (ˆθ ˆt 1 α/2ˆσˆθ, ˆθ ˆt α/2ˆσˆθ), missä ˆσˆθ, ˆt 1 α/2 ja ˆt α/2 on muodostettu bootstrap menetelmän avulla. Algoritmi Muodostetaan estimaatti ˆθ. 2. Jokaisella bootstrap estimointikerralla b = 1, 2,..., B: (a) Generoidaan otos x (b) = (x 1, x 2,..., x n) poimimalla n:n alkion otos havaitusta otoksesta x = (x 1, x 2,..., x n ) palauttamalla. (b) Lasketaan bootstrap estimaatti ˆθ b = ˆθ (b) (x (b) ) bootstrap otoksesta x (b). (c) Generoidaan C kappaletta bootstrap otoksia x (c) otoksia bootstrap otoksesta x (b). (d) Lasketaan bootstrap estimaatti ŝeˆθ (b) (e) Lasketaan bootstrap estimaatti ˆt b = ˆθ (b) ˆθ ŝeˆθ (b) poimimalla n:n alkion bootstrap otoksien x (c) avulla. bootstrap otoksesta x (b). 3. Etsitään otoskvantiilit ˆt 1 α/2 ja ˆt α/2 arvojen ˆt 1,..., ˆt B perusteella. 4. Lasketaan estimaatti ˆσˆθ bootstrap estimaattien ˆθ b avulla. 5. Muodostetaan luottamusväli (ˆθ ˆt 1 α/2ˆσˆθ, ˆθ ˆt α/2ˆσˆθ). Tehtävä 5. Laske maailma.txt aineiston elinaika muuttujan odotusarvolle µ 95% luottamusväliestimaatti bootstrap menetelmällä.

30 syksy 2011 Monte Carlo menetelmät TILTA4 - Jarkko Isotalo 6 Jackknife estimoinnista Jackknife menetelmässä havaitusta otoksesta x = (x 1, x 2,..., x n ) muodostetaan uusia otoksia x (i) = (x 1, x 2,..., x i 1, x i+1,..., x n ) jättämällä vuoron perään i:nes havainto pois alkuperäisestä otoksesta. Jackknife menetelmän avulla voidaan estimoida jonkin tuntemattoman parametrin θ estimaattorin ˆθ hajontaa (keskivirhettä) se(ˆθ) = σˆθ ja harhaa bias(ˆθ) = E(ˆθ θ). Algoritmi Jokaisella jackknife estimointikerralla i = 1, 2,..., n: (a) Muodostetaan jackknife otos x (i) = (x 1,..., x i 1, x i+1,..., x n ) havaitusta otoksesta x 1, x 2,..., x n jättämällä i:nes havainto pois havaitusta otoksesta. (b) Lasketaan jackknife estimaatti ˆθ (i) jackknife otoksesta x (i). 2. Estimoidaan jackknife estimaattien ˆθ (1),..., ˆθ (n) avulla esim. estimaattorin ˆθ hajontaa σˆθ tai harhaa bias(ˆθ). Hajonnan σˆθ tai harhan bias(ˆθ) estimaatit saadaan muodostettua jackknifen tilanteessa käyttäen kaavoja ŝe(ˆθ) = ˆσˆθ = n 1 n (ˆθ(i) n ˆθ ) 2, ( ) ja missä ˆθ ( ) = 1 n n i=1 ˆθ (i). i=1 bias(ˆθ) = (n 1)(ˆθ ( ) ˆθ), Tehtävä 6. Laske maailma.txt aineiston logaritmoitujen muuttujien log(vaentiheys) ja log(elinaika) välisen korrelaatiokertoimen harhalle (bias) ja keskivirheelle (standard error) estimaatit jackknife menetelmällä.

31 syksy 2011 Monte Carlo menetelmät TILTA4 - Jarkko Isotalo 7 Permutaatiotestaus kahden muuttujan tilanteessa Tarkastellaan ensiksi permutaatiotestauksen perusteita esimerkkien kautta. Tarkastellaan permutaatiotestausta kahden otoksen tilanteessa. Olkoon x = (x 1, x 2,..., x n ) ja y = (y 1, y 2,..., y m ) satunnaisotoksia jakaumista X F X ja Y F Y, ja olkoon z = (x, y) yhdistetty (järjestetty) otos. Permutaatiotestausta käytetään usein epäparametrisissa päättelytilanteissa, missä ongelmana on testata jakaumien samankaltaisuutta hypoteeseillä H 0 : F X = F Y H a : F X F Y. Olkoon otosfunktio g = g(x, y) = g(z) valittu siksi testisuureksi, jonka saamien arvojen perusteella hypoteesin testauksen päättely tehdään. Tällöin permutaatiotestaus muodostetaan seuraavan algoritmin perusteella: Algoritmi Lasketaan testisuureen g = g(x, y ) = g(z ) arvo havaitusta aineistosta z = (x, y ). 2. Jokaisella permutaatio-otos kerralla b = 1, 2,..., B: (a) Generoidaan permutaatio-otos z b = (x b, y b ) sekoittamalla havaitun otoksen alkioiden järjestys. (b) Lasketaan permutaatio-otoksesta z b otossuureen arvo g b = g(x b, y b ) = g(z b ). 3. Lasketaan empiirinen p-arvo: (a) Yksisuuntaisen (suurempi kuin) testisuureen empiirinen p-arvo ˆp lasketaan kaavalla ˆp = 1 + #{g b g } = 1 + B b=1 I(g b g ). B + 1 B + 1 (b) Kaksisuuntaisen testisuureen empiirinen p-arvo ˆp lasketaan kaavalla ô == 1 + #{g b g } B + 1 = 1 + B b=1 I(g b g ), B + 1 ja jos ô < 0.5, niin ˆp = 2ô, ja jos ô > 0.5, niin ˆp = 2(1 ô). 4. Hylätään H 0 jos valitulla merkitsevyystasolla α on voimassa ˆp α.

32 syksy 2011 Monte Carlo menetelmät TILTA4 - Jarkko Isotalo 8 Tehtävä 7. Tarkastellaan maailma.txt aineistoa. 1. Muodosta tal.koko muuttujasta uusi 2-luokkainen muuttuja ftal.koko niin, että alkuperäiset arvot (2.18,4.83] kuuluvat yhteen luokkaan ja arvot (4.83,7.48] toiseen luokkaan. 2. Testaa onko alle15v muuttujan jakaumat samat ftal.koko muuttujan luokkien suhteen. Permutaatiotestausta voidaan käyttää epäparametriseen kahden otoksen riippumattomuuden testaamiseen: H 0 : F XY = F X F Y H a : F XY F X F Y. Tehtävä 8. Testaa ovatko maailma.txt aineiston logaritmoidut muuttujat log(vaentiheys) ja log(elinaika) keskenään riippumattomia.

33 syksy 2011 Monte Carlo menetelmät TILTA4 - Jarkko Isotalo 9 Tehtävä 9. Luokittele vaentiheys ja elinaika muuttujat 3-luokkaisiksi luokittelumuuttujiksi ja testaa ovatko luokitellut muuttujat riippumattomia toisistaan.

Tilastollisen tietojenkäsittelyn jatkokurssi TILTA23 Satunnaislukujen generoiminen Jarkko Isotalo

Tilastollisen tietojenkäsittelyn jatkokurssi TILTA23 Satunnaislukujen generoiminen Jarkko Isotalo Tilastollisen tietojenkäsittelyn jatkokurssi TILTA23 Satunnaislukujen generoiminen Jarkko Isotalo - 2011 Johdanto Laskennallisessa tilastotieteessä tutkitaan usein tarkasteltavaa satunnaisilmiötä simuloinnin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1 Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Generointi yksinkertaisista diskreeteistä jakaumista

Generointi yksinkertaisista diskreeteistä jakaumista S-38.148 Tietoverkkojen simulointi / Satunnaismuuttujien generointi 1(18) Generointi yksinkertaisista diskreeteistä jakaumista Seuraavassa U, U 1,..., U n tarkoittavat riippumattomia U(0,1)-jakautuneita

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Aiheet: Satunnaisvektorit ja moniulotteiset jakaumat Tilastollinen riippuvuus ja lineaarinen korrelaatio Satunnaisvektorit ja moniulotteiset

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

9. laskuharjoituskierros, vko 12-13, ratkaisut

9. laskuharjoituskierros, vko 12-13, ratkaisut 9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 017 Harjoitus 5 Ratkaisuehdotuksia Tehtäväsarja I 1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Satunnaismuuttujien muunnokset ja niiden jakaumat

Satunnaismuuttujien muunnokset ja niiden jakaumat Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Satunnaismuuttujien muunnokset ja niiden jakaumat TKK (c) Ilkka Mellin (2007) 1 Satunnaismuuttujien muunnokset ja

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 4

031021P Tilastomatematiikka (5 op) viikko 4 031021P Tilastomatematiikka (5 op) viikko 4 Jukka Kemppainen Mathematics Division Tilastollinen aineisto Tilastolliset menetelmät ovat eräs keino tutkia numeerista havaintoaineistoa todennäköisyyslaskentaa

Lisätiedot

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme? TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Satunnaislukujen generointi

Satunnaislukujen generointi Satunnaislukujen generointi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Satunnaislukujen generointi 1/27 Kevät 2003 Lähteet Knuth, D., The Art of Computer Programming,

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia KE (2014) 1 Hypergeometrinen jakauma Hypergeometrinen jakauma

Lisätiedot

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1 Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat TKK (c) Ilkka Mellin (2004) 1 Satunnaismuuttujien muunnokset ja niiden jakaumat Satunnaismuuttujien muunnosten jakaumat

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4 Tilastollisen aineiston kuvaileminen, mallintaminen ja estimointi Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025 26.3.2019/1 MTTTP1, luento 26.3.2019 7.4 Normaalijakauma (kertausta ja täydennystä) Z ~ N(0, 1), tiheysfunktion kuvaaja 0,5 0,4 0,3 0,2 0,1 Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96)

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 2 Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

Todennäköisyyslaskun kertaus. Heliövaara 1

Todennäköisyyslaskun kertaus. Heliövaara 1 Todennäköisyyslaskun kertaus Heliövaara 1 Satunnaismuuttujat ja todennäköisyysjakaumat Heliövaara 2 Stunnaismuuttujat ja todennäköisyysjakaumat Jos satunnaisilmiötä halutaan mallintaa matemaattisesti,

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1, Todennäköisyyslaskenta, 2. kurssikoe 7.2.22 Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu.. Satunnaismuuttujien X ja Y yhteistiheysfunktio on

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014 1 MTTTP3 Tilastollisen päättelyn perusteet 2 Luennot 8.1.2015 ja 13.1.2015 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7, HY / Matematiikan ja tilastotieteen laitos Todennäköisyyslaskenta II, syksy 07 Harjoitus Ratkaisuehdotuksia Tehtäväsarja I. Mitkä seuraavista funktioista F, F, F ja F 4 ovat kertymäfunktioita? Mitkä niistä

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2

Lisätiedot

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (5) 1 Momenttiemäfunktio ja karakteristinen funktio Momenttiemäfunktio Diskreettien jakaumien momenttiemäfunktioita

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia. HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 8 Harjoitus Ratkaisuehdotuksia Tehtäväsarja I. Mitkä seuraavista funktioista F, F, F ja F 4 ovat kertymäfunktioita? Mitkä

Lisätiedot

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1 Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet

Lisätiedot

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B Tilastollinen päättömyys, kevät 7 Harjoitus 6B Heikki Korpela 8. helmikuuta 7 Tehtävä. Monisteen teht. 6... Olkoot Y,..., Y 5 Nµ, σ, ja merkitään S 5 i Y i Y /4. Näytä, että S/σ on saranasuure eli sen

Lisätiedot

Normaalijakaumasta johdettuja jakaumia

Normaalijakaumasta johdettuja jakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2007) 1 Normaalijakaumasta johdettuja jakaumia >> Johdanto χ 2 -jakauma F-jakauma

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

2. Keskiarvojen vartailua

2. Keskiarvojen vartailua 2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4 Tilastollisen datan kuvaileminen, mallintaminen ja estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II G. Gripenberg Aalto-yliopisto 11. helmikuuta 2015 G. Gripenberg (Aalto-yliopisto) MS-A0502 Todennäköisyyslaskennan ja tilastotieteen

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Todennäköisyysjakaumia

Todennäköisyysjakaumia 8.9.26 Kimmo Vattulainen Todennäköisyysjakaumia Seuraavassa esitellään kurssilla MAT-25 Todennäköisyyslaskenta esille tulleita diskreettejä todennäköisyysjakaumia Diskreetti tasajakauma Bernoullijakauma

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Kertymäfunktio TKK (c) Ilkka Mellin (2005) 1 Kertymäfunktio Kertymäfunktio: Määritelmä Diskreettien jakaumien kertymäfunktiot Jatkuvien jakaumien kertymäfunktiot TKK (c)

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat TKK (c) Ilkka Mellin (2005) 1 Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat Kaksiulotteiset todennäköisyysjakaumat

Lisätiedot

8.1 Ehdolliset jakaumat

8.1 Ehdolliset jakaumat 8 Ehdollinen jakauma Tämän kappaleen tärkeitä käsitteitä: Ehdollinen jakauma; ehdollinen ptnf/tf. Kertolaskusääntö eli ketjusääntö yhteisjakauman esittämiseksi. Ehdollinen odotusarvo ja ehdollinen varianssi.

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa? 21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 5

031021P Tilastomatematiikka (5 op) viikko 5 031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen

Lisätiedot

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 018 Harjoitus B Ratkaisuehdotuksia Tehtäväsarja I 1 (Monisteen tehtävä 14) Olkoon f Y (y; θ) tilastollinen malli, jonka

Lisätiedot

Tilastomatematiikka Kevät 2008

Tilastomatematiikka Kevät 2008 Tilastomatematiikka Kevät 2008 Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastomatematiikka p.1/19 4.3 Varianssi Satunnaismuuttuja on neliöintegroituva, jos odotusarvo

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2

Lisätiedot

10 Moniulotteinen normaalijakauma

10 Moniulotteinen normaalijakauma 10 Moniulotteinen normaalijakauma Tässä luvussa tarkastellaan normaalijakauman moniulotteista yleistystä eli moniulotteista (eli monimuuttujaista) normaalijakaumaa (engl. multivariate normal distribution).

Lisätiedot