Sovellettu todennäköisyyslaskenta B

Samankaltaiset tiedostot
Estimointi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Väliestimointi (jatkoa) Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Tilastollinen aineisto Luottamusväli

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Maximum likelihood-estimointi Alkeet

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Harjoitus 2: Matlab - Statistical Toolbox

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Teema 8: Parametrien estimointi ja luottamusvälit

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Sovellettu todennäköisyyslaskenta B

,ܾ jaü on annettu niin voidaan hakea funktion

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

031021P Tilastomatematiikka (5 op) viikko 4

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden ominaisuuksia

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Sovellettu todennäköisyyslaskenta B

3.6 Su-estimaattorien asymptotiikka

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Sovellettu todennäköisyyslaskenta B

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Satunnaismuuttujien muunnokset ja niiden jakaumat

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

805306A Johdatus monimuuttujamenetelmiin, 5 op

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testejä suhdeasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Mat Sovellettu todennäköisyyslasku A

5.7 Uskottavuusfunktioon perustuvia testejä II

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

ABHELSINKI UNIVERSITY OF TECHNOLOGY

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

10. laskuharjoituskierros, vko 14, ratkaisut

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

7. laskuharjoituskierros, vko 10, ratkaisut

pisteet Frekvenssi frekvenssi Yhteensä

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

Uskottavuuden ominaisuuksia

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

3. laskuharjoituskierros, vko 6, ratkaisut

2. Uskottavuus ja informaatio

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

dx=5&uilang=fi&lang=fi&lvv=2014

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Transkriptio:

Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18

1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3 Otoskoon määrääminen 4 Estimaattorin valinta 5 Momenttimenetelmä 6 Suurimman uskottavuuden menetelmä Diskreetti tapaus Jatkuva tapaus Antti Rasila () TodB 3. marraskuuta 2007 2 / 18

Esimerkki (Laininen) 1/2 Palkin paksuudeksi (n = 10) mitattiin (tuumaa): 2.11 2.02 2.20 1.98 2.14 1.99 2.09 2.19 2.23 2.10 Oletetaan, että palkin paksuus X N(µ, σ). Otoksesta voidaan laskea x = 2.105 ja s = 0.08786. Vapausasteparametri ν = 10 1 = 9. Taulukosta saadaan t 0.025 = 2.262, joten voidaan laskea µ = 2.105 ± 2.262 0.08786 10. Siis 95% luottamusväli on [2.04,2.17] tuumaa. Antti Rasila () TodB 3. marraskuuta 2007 3 / 18

Esimerkki (Laininen) 2/2 Varianssin luottamusväli muodostetaan 9-vapausasteisen χ 2 -jakauman avulla. Taulukosta (tai tietokoneella) saadaan χ 2 0.975 = 2.70 ja χ2 0.025 = 19.0. Sijoitus kaavaan antaa 95% luottamusväliksi eli [0.0037,0.0258]. 9 19.0 0.08792 σ 2 9 2.70 0.08792, Antti Rasila () TodB 3. marraskuuta 2007 4 / 18

Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli Suhteellinen frekvenssi X Bernoulli(p). ˆp = f n on Bernoulli-jakauman odotusarvoparametrin p harhaton estimaattori. Olkoon n = havaintojen lukumäärä z α/2 = häntätodennäköisyyttä α/2 vastaava piste standardoidusta normaalijakaumasta N(0, 1). Antti Rasila () TodB 3. marraskuuta 2007 5 / 18

Bernoulli-jakauman odotusarvon luottamusväli 2/2 Suhteellisen frekvenssin ˆp odotusarvo ja varianssi ovat: E(ˆp) = p Var(ˆp) = pq n Suhteellinen frekvenssi ˆp noudattaa suurissa otoksissa approksimatiivisesti normaalijakaumaa. Bernoulli-jakauman odotusarvoparametrin p approksimatiivinen luottamusväli luottamustasolla (1 α) on ( ) ˆp(1 ˆp) ˆp(1 ˆp) ˆp z α/2, ˆp + z n α/2. n Antti Rasila () TodB 3. marraskuuta 2007 6 / 18

Otoskoon määrääminen 1/2 Ennakkotiedon mukaan Bernoulli-jakauman odotusarvoparametrin arvoksi oletetaan p. Kuinka suuri otos on otettava, jotta p:lle voidaan muodostaa (1 α)-luottamusväli, jonka pituus on 2A? Parametrin p luottamusväli luottamustasolla (1 α) on ( ) ˆp(1 ˆp) ˆp(1 ˆp) ˆp z α/2, ˆp + z n α/2. n Ennakkotiedon perusteella oletetaan ˆp = p. Antti Rasila () TodB 3. marraskuuta 2007 7 / 18

Otoskoon määrääminen 2/2 Jotta luottamusvälin pituus olisi 2A, on oltava z α/2 p(1 p) n = A. josta voidaan ratkaista tarvittava otoskoko n: ( ) zα/2 p(1 p) 2 n =. A Huomaa, että otoskoko saavuttaa maksiminsa n = kun p = 1/2. ( zα/2 2A ) 2, Antti Rasila () TodB 3. marraskuuta 2007 8 / 18

Estimaattorin valinta Oletetaan, että aineistona on yksinkertainen satunnaisotos X 1,..., X n jakaumasta f X (x; θ 1,..., θ r ). Satunnasmuuttujan X siis oletetaan noudattavan jakaumaa f X (x; θ 1,..., θ r ) parametreilla θ 1,..., θ r, mutta parametrien arvoja ei tunneta. Tehtävänä on muodostaa parametreille θ 1,..., θ r estimaattorit ˆθ 1,..., ˆθ r. Estimaattorien muodostamiseen on useita eri menetelmiä. Tällä kurssilla käsitellään momenttimenetelmä ja suurimman uskottavuuden menetelmä. Antti Rasila () TodB 3. marraskuuta 2007 9 / 18

Momenttimenetelmä Useasta jakaumasta f X (x; θ 1,..., θ r ) voidaan määrittää teoreettisia momentteja m k = E[X k ], jotka ovat parametrien θ 1,..., θ r funktioita. Näiden teoreettisten momenttien estimaattorit ˆm k voidaan määrittää havaintoarvoista kaavalla ˆm k = 1 n n xi k. i=1 Kun teoreettiset momentit asetetaan yhtäsuuriksi estimaattorien kanssa, saadaan yhtälöryhmä, josta voidaan ratkaista parametrien θ 1,..., θ r estimaattorit. Jos halutaan määrittää estimaattorit r:lle parametrille, tarvitaan r yhtälöä. Tätä varten tulee määrittää r ensimmäistä teoreettista momenttia. Antti Rasila () TodB 3. marraskuuta 2007 10 / 18

Esimerkki (Laininen) 1/2 Huollon kestoajan X tiheysfunktio on { θ1 e f X (x; θ 1, θ 2 ) = θ 1(x θ 2 ), kun x θ 2, 0, kun x < θ 2, missä θ 1, θ 2 > 0. Olkoot x 1,..., x n havaittuja huollon kestoaikoja. Parametrien estimoimiseksi momenttimenetelmällä lasketaan integroimalla ensimmäinen ja toinen momentti: m 1 = θ 2 xθ 1 e θ 1(x θ 2 ) dx = 1 θ 1 + θ 2, m 2 = θ 2 x 2 θ 1 e θ 1(x θ 2 ) dx = θ 2 2 + 2 θ 2 1 + 2θ 2 θ 1. Antti Rasila () TodB 3. marraskuuta 2007 11 / 18

Esimerkki (Laininen) 2/2 Estimaatit θ 1, θ 2 ratkaistaan yhtälöistä ˆm 1 = 1ˆθ 1 + ˆθ 2, ˆm 2 = θ 2 2 + 2 θ 2 1 + 2θ 2 θ 1, missä ˆm 1 = 1 n n x i, i=1 ˆm 2 = 1 n n xi 2. i=1 Ratkaisuksi saadaan ˆθ 1 = 1, ˆθ 2 = ˆm 1 ˆm 2 ˆm 1 2. ˆm 2 ˆm 1 2 Antti Rasila () TodB 3. marraskuuta 2007 12 / 18

Suurimman uskottavuuden menetelmä Suurimman uskottavuuden menetelmän ajatuksena on, että malli f X (x; θ 1,..., θ r ) on paras, jos se tuottaa havaitun otoksen suurimmalla todennäköisyydellä. Menetelmässä muodostetaan likelihood-funktio L(θ 1,..., θ r ), joka kuvaa saadun otoksen todennäköisyyttä parametrien θ 1,..., θ r funktiona. Kun likelihood-funktiota maksimoidaan parametrien θ 1,..., θ r suhteen, ovat saadut satunnaismuuttujat ˆθ 1,..., ˆθ r parametrien θ 1,..., θ r suurimman uskottavuuden estimaattorit. Antti Rasila () TodB 3. marraskuuta 2007 13 / 18

Diskreetti tapaus 1/2 Olkoon X 1,..., X n yksinkertainen satunnaisotos diskreetistä jakaumasta, jonka pistetodennäköisyysfunktio on f X (x i ; θ 1,..., θ r ). Todennäköisyys otokselle x 1,..., x n on L(θ 1,..., θ r ) = f X (x 1 ; θ 1,..., θ r ) f X (x n ; θ 1,..., θ r ). Parametreille θ 1,..., θ r tulee löytää sellaiset arvot, että L maksimoituu. Antti Rasila () TodB 3. marraskuuta 2007 14 / 18

Diskreetti tapaus 2/2 L:n maksimi löytyy pisteestä, jossa kaikki osittaisderivaatat ovat nollia, eli L = 0, i θ i Funktion L logaritmimuunnos ln(l) saa maksiminsa samassa pisteessä kuin L. Usein tarkastellaankin funktiota ln(l), koska logaritmimuunnos muuntaa tulomuotoisen likelkihood-funktion summaksi, jota on helpompi derivoida. Antti Rasila () TodB 3. marraskuuta 2007 15 / 18

Esimerkki Tiedonsiirtojärjestelmä siirtää merkkejä 0 ja 1. Merkki 1 voi vaihtua merkiksi 0 todennäköisyydellä p. Todennäköisyyden arvioimiseksi lähetetään 10000 kertaa merkki 1, jolloin todetaan, että merkki on vaihtunut 90 kertaa. Koska 10000 merkin siirrossa merkki on välittynyt oikein 9910 kertaa ja vaihtunut 90 kertaa, saadaan L(p) = (1 p) 9910 p 90. Etsitään se parametrin p arvo, jolla L(p) saa maksiminsa: Ratkaistaan p L(p) = 9910(1 p)9909 p 90 + 90(1 p) 9910 p 89 = 0. ˆp = 90 10000 = 0.009. Antti Rasila () TodB 3. marraskuuta 2007 16 / 18

Jatkuva tapaus Olkoon X 1,..., X n yksinkertainen satunnaisotos jatkuvasta jakaumasta, jonka tiheysfunktio on f X (x; θ 1,..., θ r ). Koska jatkuvassa tapauksessa kaikkien yksittäisten havaintosarjojen x 1,..., x n todennäköisyys on nolla, likelihood-funktio L(θ 1,..., θ r ) = f X (x 1 ; θ 1,..., θ r ) f X (x n ; θ 1,..., θ r ) ei kuvaa havaintosarjan todennäköisyyttä. Tiheysfunktion arvojen tulona sitä voidaan kuitenkin perustellusti käyttää kuten diskreetissä tapauksessa. Antti Rasila () TodB 3. marraskuuta 2007 17 / 18

Esimerkki Oletetaan, että X on tasaisesti jakautunut välille [0, θ], missä parametri θ > 0 ja X :n tiheysfunktio on { 1/θ, kun x [0, θ], f X (x) = 0, muuten. Likelihood-funktio on { 1/θ L(θ) = n, kun θ max{x 1,..., x n }, 0 muuten. Nyt maksimi ei löydy derivoimalla, mutta voidaan päätellä tutkimalla funktiota L(θ). Suurin arvo saadaan selvästi, kun ˆθ = max{x 1,..., x n }. Antti Rasila () TodB 3. marraskuuta 2007 18 / 18