Osa 2: Otokset, otosjakaumat ja estimointi

Samankaltaiset tiedostot
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

tilastotieteen kertaus

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Estimointi. Vilkkumaa / Kuusinen 1

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Sovellettu todennäköisyyslaskenta B

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Testejä suhdeasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

Väliestimointi (jatkoa) Heliövaara 1

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Normaalijakaumasta johdettuja jakaumia

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Testit järjestysasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

3.6 Su-estimaattorien asymptotiikka

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Teema 8: Parametrien estimointi ja luottamusvälit

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Regressioanalyysi. Kuusinen/Heliövaara 1

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Sovellettu todennäköisyyslaskenta B

Tilastollisen päättelyn perusteet

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Parametrin estimointi ja bootstrap-otanta

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Moniulotteisia todennäköisyysjakaumia

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Tilastollisia peruskäsitteitä ja Monte Carlo

031021P Tilastomatematiikka (5 op) viikko 4

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Ilkka Mellin Aikasarja-analyysi Suurimman uskottavuuden menetelmä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Regressioanalyysi. Vilkkumaa / Kuusinen 1

riippumattomia ja noudattavat samaa jakaumaa.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

805306A Johdatus monimuuttujamenetelmiin, 5 op

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Maximum likelihood-estimointi Alkeet

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Tutkimustiedonhallinnan peruskurssi

Todennäköisyyden ominaisuuksia

Sovellettu todennäköisyyslaskenta B

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

dx=5&uilang=fi&lang=fi&lvv=2014

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet, kevät 2007

OPETUSSUUNNITELMALOMAKE

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

,ܾ jaü on annettu niin voidaan hakea funktion

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Transkriptio:

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1

Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2007) 2

Todennäköisyysjakaumien parametrit ja niiden estimointi Todennäköisyysjakaumat tilastollisten aineistojen kuvaajina Tilastollinen aineisto koostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista. Tilastollisissa tutkimusasetelmissa havaintoarvoihin liittyy aina epävarmuutta ja satunnaisuutta. Tilastollisissa tutkimusasetelmissa tutkimuksen kohteita kuvaavat muuttujat tulkitaan satunnaismuuttujiksi, jotka generoivat muuttujien havaitut arvot. Havaintoarvot generoineiden satunnaismuuttujien todennäköisyysjakauma muodostaa tilastollisen mallin sille satunnaisilmiölle, jota havainnot koskevat. TKK (c) Ilkka Mellin (2007) 3

Todennäköisyysjakaumien parametrit ja niiden estimointi Todennäköisyysjakaumien parametrit 1/2 Tarkastellaan jotakin tutkimuksen kaikkien mahdollisten kohteiden muodostaman perusjoukon S alkioiden ominaisuutta kuvaavaa satunnaismuuttujaa X. Oletetaan, että satunnaismuuttuja X noudattaa todennäköisyysjakaumaa, jonka pistetodennäköisyys-tai tiheysfunktio f(x ; θ) riippuu parametrista θ. Merkintä: X ~ f( x; θ ) TKK (c) Ilkka Mellin (2007) 4

Todennäköisyysjakaumien parametrit ja niiden estimointi Todennäköisyysjakaumien parametrit 2/2 Satunnaismuuttujan X pistetodennäköisyys- tai tiheysfunktio f(x ; θ) kuvaa satunnaismuuttujan X todennäköisyysjakaumaa ja parametri θ kuvaa jotakin jakauman karakteristista ominaisuutta. Koska parametrin θ arvoa ei yleensä tunneta, tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida parametrin θ tuntematon arvo jakaumasta f(x ; θ) poimitun otoksen perusteella. TKK (c) Ilkka Mellin (2007) 5

Todennäköisyysjakaumien parametrit ja niiden estimointi Yksinkertainen satunnaisotos Olkoon X 1, X 2,, X n (yksinkertainen) satunnaisotos jakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio f(x ; θ) riippuu parametrista θ. Tällöin havainnot X 1, X 2,, X n ovat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys- tai tiheysfunktio f(x ; θ): X1, X2,, Xn X ~ f( x; θ ), i = 1,2,, n i TKK (c) Ilkka Mellin (2007) 6

Todennäköisyysjakaumien parametrit ja niiden estimointi Havainnot ja havaintoarvot Oletetaan, että satunnaismuuttujat (havainnot) X 1, X 2,, X n saavat poimitussa otoksessa havaituiksi arvoikseen luvut x 1, x 2,, x n Havaintoarvot x 1, x 2,, x n vaihtelevat satunnaisesti otoksesta toiseen jakaumasta f(x ; θ) saatavin todennäköisyyksin. TKK (c) Ilkka Mellin (2007) 7

Todennäköisyysjakaumien parametrit ja niiden estimointi Estimaattorit ja estimaatit 1/2 Oletetaan, että todennäköisyysjakauman f(x ; θ) parametrin θ estimoimiseen käytetään satunnaismuuttujien X 1, X 2,, X n funktiota eli tunnuslukua T = g(x 1, X 2,, X n ) Tällöin funktiota T = g(x 1, X 2,, X n ) kutsutaan parametrin θ estimaattoriksi ja funktion g havaintoarvoista x 1, x 2,, x n laskettua arvoa t = g(x 1, x 2,, x n ) kutsutaan parametrin θ estimaatiksi. TKK (c) Ilkka Mellin (2007) 8

Todennäköisyysjakaumien parametrit ja niiden estimointi Estimaattorit ja estimaatit 2/2 Olkoon T = g(x 1, X 2,, X n ) jakauman f(x ; θ) parametrin θ estimaattori. Tällöin estimaattorin T havaintoarvoista x 1, x 2,, x n laskettu arvo eli estimaatti t = g(x 1, x 2,, x n ) on satunnaismuuttujan T arvon realisaatio otoksessa. TKK (c) Ilkka Mellin (2007) 9

Todennäköisyysjakaumien parametrit ja niiden estimointi Estimaattorit ja estimaatit: Kommentti Todennäköisyysjakauman f(x ; θ) parametrin θ estimaattorilla T = g(x 1, X 2,, X n ) tarkoitetaan siis sellaista jakaumaa f(x ; θ) noudattavien satunnaismuuttujien X 1, X 2,, X n funktiota, joka generoi muuttujien X 1, X 2,, X n havaittuihin arvoihin x 1, x 2,, x n sovellettuna estimaatteja eli arvioita t = g(x 1, x 2,, x n ) parametrille θ. TKK (c) Ilkka Mellin (2007) 10

Todennäköisyysjakaumien parametrit ja niiden estimointi Estimaattorin otosjakauma Estimaattorin T = g(x 1, X 2,, X n ) havaintoarvoista x 1, x 2,, x n lasketut arvot eli estimaatit t = g(x 1, x 2,, x n ) vaihtelevat satunnaisesti otoksesta toiseen. Estimaattorin T arvojen satunnaista vaihtelua otoksesta toiseen voidaan kuvata estimaattorin T otosjakaumalla. TKK (c) Ilkka Mellin (2007) 11

Todennäköisyysjakaumien parametrit ja niiden estimointi Estimaattoreiden johtaminen Hyvien estimaattoreiden johtaminen todennäköisyysjakaumien tuntemattomille parametreille on teoreettisen tilastotieteen keskeisiä ongelmia. Tärkeimmät estimaattoreiden johtamiseen käytettävät menetelmät: Suurimman uskottavuuden menetelmä Momenttimenetelmä Ks. lukua Estimointimenetelmät. TKK (c) Ilkka Mellin (2007) 12

Todennäköisyysjakaumien parametrit ja niiden estimointi Piste-estimointi ja väliestimointi Todennäköisyysjakauman parametrin arvon estimointia kutsutaan usein piste-estimoinniksi. Parametrin estimaattiin on aina syytä liittää luottamusväliksi kutsuttu väli, joka sisältää estimoidun parametrin todellisen, mutta tuntemattoman arvon tietyllä, soveltajan valittavissa olevalla todennäköisyydellä. Luottamusvälin määräämistä kutsutaan väliestimoinniksi. Ks. lukua Väliestimointi. TKK (c) Ilkka Mellin (2007) 13

Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi >> Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2007) 14

Hyvän estimaattorin ominaisuudet Hyvä estimaattori Todennäköisyysjakauman parametreille on tavallisesti tarjolla useita vaihtoehtoisia estimaattoreita. Estimaattorin valintaa ohjaavat hyvyyskriteerit, joilla pyritään takamaan se, että valittu estimaattori tuottaa järkeviä arvoja estimoitavalle parametrille. Estimaattoreiden hyvyyskriteereitä: Tyhjentävyys Harhattomuus Tehokkuus Tarkentuvuus TKK (c) Ilkka Mellin (2007) 15

Hyvän estimaattorin ominaisuudet Tyhjentävyys Olkoon θˆ parametrin θ estimaattori Estimaattori θˆ on tyhjentävä parametrille, jos se käyttää parametrin arvon estimoimiseen kaiken otoksessa olevan informaation parametrista θ. TKK (c) Ilkka Mellin (2007) 16

Hyvän estimaattorin ominaisuudet Harhattomuus ja harha Olkoon θˆ parametrin θ estimaattori. Estimaattori θˆ on harhaton parametrille θ, jos sen odotusarvo yhtyy parametrin θ arvoon: E( ˆ θ) = θ Harhaton estimaattori tuottaa keskimäärin oikean kokoisia arvoja parametrille. Estimaattorin θˆ harha on Bias( ˆ θ) = θ E( ˆ θ) Jos estimaattoriθˆ on harhaton parametrille θ, niin Bias( ˆ θ ) = 0 TKK (c) Ilkka Mellin (2007) 17

Hyvän estimaattorin ominaisuudet Estimaattorin keskineliövirhe ja tarkkuus Parametrin θ estimaattorin θˆ keskineliövirhe on 2 MSE( ˆ θ) = E ( ˆ θ θ) 2 = Var( ˆ θ) + Bias( ˆ θ) Jos θˆ on harhaton parametrille θ eli Bias( ˆ θ) = θ E( ˆ θ) = 0 niin MSE( ˆ θ) = Var( ˆ θ) Estimaattoria sanotaan tarkaksi, jos se on harhaton ja sen varianssi on pieni. TKK (c) Ilkka Mellin (2007) 18

Hyvän estimaattorin ominaisuudet Tehokkuus Olkoot ˆ θ1 ja θˆ 2 kaksi parametrin θ estimaattoria. Estimaattori ˆ θ1 on tehokkaampi kuin estimaattori θˆ 2, jos Var( ˆ θ1) < Var( ˆ θ2) Parametrin θ estimaattori θˆ täystehokas, jos sen varianssi on pienempi kuin minkä tahansa muun parametrin θ estimaattorin. TKK (c) Ilkka Mellin (2007) 19

Hyvän estimaattorin ominaisuudet Harhattomuus ja tehokkuus: Esimerkki 1/2 Olkoon X 1, X 2,, X n satunnaisotos normaalijakaumasta N(µ, σ 2 ). Tällöin sekä havaintoarvojen aritmeettinen keskiarvo X 1 n X i n i = 1 = että havaintoarvojen mediaani Me ovat harhattomia normaalijakauman odotusarvolle µ : E( X) = E( Me ) = µ TKK (c) Ilkka Mellin (2007) 20

Hyvän estimaattorin ominaisuudet Harhattomuus ja tehokkuus: Esimerkki 2/2 Sen sijaan 2 2 σ π σ Var( X ) = < = Var( Me) n 2 n joten normaalijakautuneiden havaintojen aritmeettisen keskiarvon X varianssi on pienempi kuin niiden mediaanin Me varianssi. Siten havaintoarvojen aritmeettinen keskiarvo Xon normaalijakauman odotusarvon µ estimaattorina tehokkaampi kuin havaintoarvojen mediaani Me. Voidaan osoittaa, että havaintoarvojen aritmeettinen keskiarvo X on normaalijakauman odotusarvoparametrin µ estimaattorina täystehokas. TKK (c) Ilkka Mellin (2007) 21

Hyvän estimaattorin ominaisuudet Tarkentuvuus Olkoon θˆ parametrin θ estimaattori. Estimaattori θˆ on θ tarkentuva parametrille θ, jos se konvergoi melkein varmasti kohti parametrin oikeata arvoa, kun otoskoon n annetaan kasvaa rajatta: Pr(T n θ) = 1, kun n + Ks. monisteen Todennäköisyyslaskenta lukua Stokastiikan konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2007) 22

Hyvän estimaattorin ominaisuudet Tarkentuvuus: Esimerkki Olkoon X 1, X 2,, X n satunnaisotos normaalijakaumasta N(µ, σ 2 ). Tällöin havaintoarvojen aritmeettinen keskiarvo X 1 n X i n i = 1 = on normaalijakauman odotusarvoparametrin µ tarkentuva estimaattori: Pr( X µ ) = 1, kun n TKK (c) Ilkka Mellin (2007) 23