Sovellettu todennäköisyyslaskenta B

Samankaltaiset tiedostot
Estimointi. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Osa 2: Otokset, otosjakaumat ja estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Väliestimointi (jatkoa) Heliövaara 1

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Sovellettu todennäköisyyslaskenta B

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Teema 8: Parametrien estimointi ja luottamusvälit

9. laskuharjoituskierros, vko 12-13, ratkaisut

Harjoitus 2: Matlab - Statistical Toolbox

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Testejä suhdeasteikollisille muuttujille

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Todennäköisyyden ominaisuuksia

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

031021P Tilastomatematiikka (5 op) viikko 4

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Luottamusvälit. Normaalijakauma johnkin kohtaan

Parametrin estimointi ja bootstrap-otanta

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Sovellettu todennäköisyyslaskenta B

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Maximum likelihood-estimointi Alkeet

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

3.6 Su-estimaattorien asymptotiikka

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

805306A Johdatus monimuuttujamenetelmiin, 5 op

Satunnaismuuttujien mittausasteikot 93

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Sovellettu todennäköisyyslaskenta B

Tilastollisia peruskäsitteitä ja Monte Carlo

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

11 Raja-arvolauseita ja approksimaatioita

Normaalijakaumasta johdettuja jakaumia

dx=5&uilang=fi&lang=fi&lvv=2014

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Tutkimustiedonhallinnan peruskurssi

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

6. laskuharjoitusten vastaukset (viikot 10 11)

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Osa 2: Otokset, otosjakaumat ja estimointi

2. Keskiarvojen vartailua

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

riippumattomia ja noudattavat samaa jakaumaa.

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Mat Tilastollisen analyysin perusteet, kevät 2007

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

Tilastollisen päättelyn perusteet

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Mat Tilastollisen analyysin perusteet, kevät 2007

Uskottavuuden ominaisuuksia

Sovellettu todennäköisyyslaskenta B

Transkriptio:

Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23

1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo ja varianssi Suhteellisen frekvenssin normaaliapproksimaatio 2 Estimointi Estimaatti ja estimaattori Hyvä estimaattori Estimaattorin keskineliövirhe ja tarkkuus Piste-estimointi ja väliestimointi 3 Luottamusvälin määritys Normaalijakautuneen estimaattorin määräämä luottamusväli, kun varianssi tunnetaan Normaalijakautuneen satunnaismuuttujan odotusarvon luottamusväli, kun varianssi tunnetaan Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Antti Rasila () TodB 30. lokakuuta 2007 2 / 23

Frekvenssi ja suhteellinen frekvenssi Olkoon A jokin otosavaruuden S alkioiden ominaisuus (eli S:n osajoukko). Poimitaan otosavaruudesta yksinkertainen satunnaisotos, jonka koko on n. Ominaisuuden A omaavien alkioden lukumäärää otoksessa merkitään f :llä kutsutaan ominaisuuden A frekvenssiksi. Ominaisuuden A suhteellinen frekvenssi ˆp määritellään: ˆp = f n Antti Rasila () TodB 30. lokakuuta 2007 3 / 23

Frekvenssien odotusarvo ja varianssi Frekvenssi f noudattaa eksaktisti binomijakaumaa parametrein n ja Pr(A) = p: f Bin(n, p) Frekvenssin f odotusarvo ja varianssi ovat siis: missä q = 1 p. E(f ) = np Var(f ) = npq, Vastaavasti suhteellisen frekvenssin ˆp odotusarvo ja varianssi ovat: E(ˆp) = p Var(ˆp) = pq n Antti Rasila () TodB 30. lokakuuta 2007 4 / 23

Suhteellisen frekvenssin normaaliapproksimaatio Suhteellinen frekvenssi ˆp noudattaa suurissa otoksissa approksimatiivisesti normaalijakaumaa: ( ˆp a N p, pq ) n Vastaavasti, standardoitu satunnaismuuttuja Z = ˆp p pq/n, noudattaa suurissa otoksissa standardoitua normaalijakumaa: Z a N(0, 1) Antti Rasila () TodB 30. lokakuuta 2007 5 / 23

Estimaatti ja estimaattori (1/2) Tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida tutkimuksen kohteena olevaa ilmiötä. Ilmiötä koskevat havainnot generoineen prosessin mallina käytettävän todennäköisyysjakauman tuntemattomat parametrit päätellään ilmiötä koskevien havaintojen perusteella. Havaintojen funktiota, joka tuottaa estimaatteja parametrin todelliselle arvolle, kutsutaan parametrin estimaattoriksi. Antti Rasila () TodB 30. lokakuuta 2007 6 / 23

Estimaatti ja estimaattori (1/2) Oletetaan, että satunnaismuuttuja X noudattaa todennäköisyysjakaumaa, jonka pistetodennäköisyys- tai tiheysfunktio f (x; θ) riippuu parametrista θ. Parametrin θ estimoimiseen käytetään havaintojen X 1, X 2,..., X n funktiota, eli tunnuslukua T = g(x 1, X 2,..., X n ) = ˆθ Funktiota T kutsutaan parametrin θ estimaattoriksi. Havaintoarvoista x 1, x 2,..., x n laskettua arvoa t = g(x 1, x 2,..., x n ) kutsutaan parametrin θ estimaatiksi. Antti Rasila () TodB 30. lokakuuta 2007 7 / 23

Hyvä estimaattori Todennäköisyysjakauman parametreille on tavallisesti tarjolla useita vaihtoehtoisia estimaattoreita. Seuraavat kriteerit täyttävä estimaattori tuottaa järkeviä arvoja estimoitavalle parametrille: Harhattomuus Tyhjentävyys Tehokkuus Tarkentuvuus Antti Rasila () TodB 30. lokakuuta 2007 8 / 23

Harhattomuus ja harha Olkoon ˆθ parametrin θ estimaattori. Estimaattori ˆθ on harhaton parametrille θ, jos sen odotusarvo yhtyy parametrin arvoon, eli E(ˆθ) = θ. Estimaattorin ˆθ harha on erotus Bias( θ) = θ E(ˆθ). Toisin sanoen, jos esitimaattori ˆθ on harhaton parametrille θ, niin Bias(ˆθ) = 0. Antti Rasila () TodB 30. lokakuuta 2007 9 / 23

Tyhjentävyys Parametrin θ estimaattori ˆθ on tyhjentävä, jos se käyttää kaiken otoksessa olevan informaation. Tämä tarkoittaa sitä, että jos ˆθ 1 on mikä tahansa parametrin θ estimaattori, niin sen jakauma ei riipu θ:sta, jos ˆθ on tunnettu. Antti Rasila () TodB 30. lokakuuta 2007 10 / 23

Tehokkuus Oletetaan, että ˆθ 1 ja ˆθ 2 ovat parametrin θ estimaattoreja. Estimaattori ˆθ 1 on tehokkaampi kuin estimaattori ˆθ 2, jos D 2 (ˆθ 1 ) < D 2 (ˆθ 2 ). Parametrin θ estimaattori ˆθ on täystehokas, jos sen varianssi on pienempi kuin minkä tahansa muun saman parametrin estimaattorin. Antti Rasila () TodB 30. lokakuuta 2007 11 / 23

Tarkentuvuus Estimaattori ˆθ on tarkentuva parametrille θ, jos se konvergoi melkein varmasti kohti parametrin oikeaa arvoa, kun otoskoko kasvaa rajatta. Tämä tarkoittaa sitä, että Pr(T n 0) = 1, kun n. Antti Rasila () TodB 30. lokakuuta 2007 12 / 23

Estimaattorin keskineliövirhe ja tarkkuus Olkoon ˆθ parametrin θ estimaattori. Tällöin ˆθ:n keskineliövirhe on MSE(ˆθ) = E [ (ˆθ θ) 2] = D 2 (ˆθ) + [ Bias(ˆθ) ] 2. Jos ˆθ on parametrin θ harhaton estimaattori, eli niin Bias(ˆθ) = θ E(ˆθ) = 0, MSE(ˆθ) = D 2 (ˆθ) = 0. Estimaattoria sanotaan tarkaksi, jos se on harhaton ja sen varianssi on pieni. Antti Rasila () TodB 30. lokakuuta 2007 13 / 23

Piste-estimointi ja väliestimointi Todennäköisyysjakauman parametrin arvon estimointia kutsutaan piste-estimoinniksi. Parametrin estimaattiin on aina syytä liittää luottamusväliksi kutsuttu väli. Parametrin todellinen arvo sijoittuu luottamusvälille soveltajan valittavissa olevalla todennäköisyydellä. Täsmällisemmpin väli [a, b] on parametrin θ luottamusväli luottamustasolla 1 α, jos Pr(a θ b) 1 α. Tavallisimmat luottamusvälit ovat 95%, 99% ja 99.9%. Näitä vastaavat α:n arvot ovat 0.05, 0.01 ja 0.001. Luottamusvälin määräämistä kutsutaan väliestimoinniksi. Antti Rasila () TodB 30. lokakuuta 2007 14 / 23

Luottamusvälin määritys 1/2 Tehdään seuraavat oletukset: Satunnaismuuttuja X noudattaa jakaumaa f (x; θ). X 1, X 2,..., X n on yksinkertainen satunnaisotos jakaumasta f (x; θ). ˆθ = ˆθ(X 1, X 2,..., X n ) on θ:n estimaattori. Valitaan luottamustaso 1 α ja määrätään satunnaismuuttujat siten että A = A(X 1, X 2,..., X n ) Y = Y (X 1, X 2,..., X n ) Pr(ˆθ A θ) = α 2 Pr(ˆθ + Y θ) = α 2 Antti Rasila () TodB 30. lokakuuta 2007 15 / 23

Luottamusvälin määritys 2/2 Nyt todennäköisyys Pr(ˆθ A θ ˆθ + Y ) = 1 α ja väli (ˆθ A, ˆθ + Y ) on θ:n luottamusväli luottamustasolla (1 α). Jos ˆθ:n jakauma on symmetrinen, pätee A = Y luottamusväli on muotoa (ˆθ A, ˆθ + A). Antti Rasila () TodB 30. lokakuuta 2007 16 / 23

Normaalijakautuneen estimaattorin määräämä luottamusväli, kun varianssi tunnetaan Oletetaan, että satunnaismuuttuja ˆθ N(µ, σ 2 ) on parametrin θ estimaattori. Tällöin standardoitu satunnaismuuttuja Z = ˆθ µ σ N(0, 1). Tällöin Pr( z α/2 ˆθ µ z σ α/2 ) = 1 α. Parametrille θ saadaan siis (1 α)-luottamusväliksi ˆθ z α/2 σ θ ˆθ + z α/2 σ. (1) Antti Rasila () TodB 30. lokakuuta 2007 17 / 23

Normaalijakautuneen satunnaismuuttujan odotusarvon luottamusväli, kun varianssi tunnetaan Olkoon X 1,..., X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ). Oletetaan, että σ tunnetaan, mutta µ on tuntematon. Tällöin havaintojen aritmeettinen keskiarvo X noudattaa eksaktisti normaalijakaumaa: ) X N (µ, σ2 n Kaavasta (1) odotusarvon µ (1 α)-luottamusväliksi saadaan X z α/2 σ n µ X + z α/2 σ n. (2) Antti Rasila () TodB 30. lokakuuta 2007 18 / 23

Normaalijakauman odotusarvon luottamusväli Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) ja olkoon X = havaintojen aritmeettinen keskiarvo s 2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä t α/2 = t-jakauman arvo merkitsevyystasolla α/2 ja vapausasteilla (n 1). Normaalijakauman odotusarvoparametrin µ luottamusväli luottamustasolla (1 α) on muotoa ( ) s s X t α/2, X + t n α/2 n (3) Antti Rasila () TodB 30. lokakuuta 2007 19 / 23

Normaalijakauman varianssin luottamusväli Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) ja olkoon s 2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä χ 2 1 α/2 ja χ2 α/2 = χ 2 -jakauman arvot merkitsevyystasoilla 1 α/2 ja α/2 ja vapausasteilla (n 1). Normaalijakauman varianssiparametrin σ 2 luottamusväli luottamustasolla (1 α) on muotoa ( (n 1)s 2, χ 2 α/2 ) (n 1)s2 χ 2 1 α/2 Antti Rasila () TodB 30. lokakuuta 2007 20 / 23

Esimerkki (Niemi) 1/3 Paperilaadun neliöpainon määrittämiseksi punnitaan 16 arkkia paperia ja muunnetaan saadut painot neliöpainoiksi (g/m 2 ): 78.90 80.39 78.55 81.81 78.05 79.84 81.85 80.83 79.43 81.31 78.44 79.52 80.14 81.37 82.80 79.54 Oletetaan neliöpaino normaalijakautuneeksi. Muodostetaan odotusarvolle µ luottamusvälit luottamustasoilla 0.95 ja 0.99, kun (a) tiedetään, että keskihajonta σ = 1.3 g/m 2, ja (b) keskihajonta on tuntematon. Otoskeskiarvo on x = 80.11 g/m 2. Antti Rasila () TodB 30. lokakuuta 2007 21 / 23

Esimerkki (Niemi) 2/3 Tapaus (a): Normaalijakauman kriittiset arvot ovat z 0.025 = 1.96 ja z 0.005 = 2.58. Luottamustasolla 0.95 luottamusväliksi saadaan kaavasta (2) [ 80.11 1.96 1.3 16, 80.11 + 1.96 1.3 16 ] = [79.47, 80.75]. Vastaavasti, luottamustasolla 0.99 luottamusväliksi saadaan [ 80.11 2.58 1.3 16, 80.11 + 2.58 1.3 16 ] = [79.27, 80.95]. Antti Rasila () TodB 30. lokakuuta 2007 22 / 23

Esimerkki (Niemi) 3/3 Tapaus (b): Koska keskihajonta on tuntematon, estimoidaan se myös otoksesta: s = 1.33 g/m 2. Otoksen koko on 16, joten luottamusvälin laskemisessa käytetään t-jakaumaa vapausasteilla 15. Taulukosta tai tietokoneella t-jakauman kriittisiksi arvoiksi saadaan t 0.025 = 2.131 ja t 0.005 = 2.947. Luottamustasolla 0.95 luottamusväliksi saadaan kaavasta (3) [ 80.11 2.131 1.33, 80.11 + 2.131 1.33 ] = [79.40, 80.82], 16 16 ja luottamustasolla 0.99 [ 80.11 2.947 1.33, 80.11 + 2.947 1.33 ] = [79.13, 81.01]. 16 16 Huomaa, että t-jakauman kriittiset arvot ovat kauempana origosta kuin standardinormaalijakauman vastaavat arvot. Tämä on luonnollista, koska epävarmuustekijöitä on enemmän. Antti Rasila () TodB 30. lokakuuta 2007 23 / 23