Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Samankaltaiset tiedostot
MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Luottamusväli, määritelmä

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

riippumattomia ja noudattavat samaa jakaumaa.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

dx=5&uilang=fi&lang=fi&lvv=2014

&idx=2&uilang=fi&lang=fi&lvv=2015

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

x=2&uilang=fi&lang=fi&lvv=2016

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

dx=2&uilang=fi&lang=fi&lvv=2015

Estimointi. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

g=fi&lvv=2018&uilang=fi#parents

&idx=2&uilang=fi&lang=fi&lvv=2015

Tilastollinen aineisto Luottamusväli

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

x=2&uilang=fi&lang=fi&lvv=2017

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

tilastotieteen kertaus

9. laskuharjoituskierros, vko 12-13, ratkaisut

Tilastollisen päättelyn perusteet, MTTTP5. Luentorunko, lukuvuosi

Luottamusvälit. Normaalijakauma johnkin kohtaan

Sovellettu todennäköisyyslaskenta B

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Parametrin estimointi ja bootstrap-otanta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

031021P Tilastomatematiikka (5 op) viikko 4

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Teema 8: Parametrien estimointi ja luottamusvälit

&idx=2&uilang=fi&lang=fi&lvv=2015

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

2. Keskiarvojen vartailua

Väliestimointi (jatkoa) Heliövaara 1

Tutkimustiedonhallinnan peruskurssi

Tilastollisia peruskäsitteitä ja Monte Carlo

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) viikko 5

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

&idx=2&uilang=fi&lang=fi&lvv=2015

MTTTP1, luento KERTAUSTA

pisteet Frekvenssi frekvenssi Yhteensä

Sovellettu todennäköisyyslaskenta B

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

MTTTP1, luento KERTAUSTA

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

Tutkimustiedonhallinnan peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

dx=2&uilang=fi&lang=fi&lvv=2015

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien mittausasteikot 93

Testejä suhdeasteikollisille muuttujille

Harjoitus 2: Matlab - Statistical Toolbox

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3.6 Su-estimaattorien asymptotiikka

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

4.0.2 Kuinka hyvä ennuste on?

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Todennäköisyyden ominaisuuksia

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

6.1.2 Luottamusjoukon määritelmä

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

805306A Johdatus monimuuttujamenetelmiin, 5 op

Harha mallin arvioinnissa

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Transkriptio:

17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

17.11.2015/2 Otosjakauma otossuureen todennäköisyysjakauma Estimaattori otossuure, jolla estimoidaan populaation tuntematonta parametria Estimaattorin keskivirhe estimaattorin keskihajonta Estimaatti estimaattorin arvo (tehdyn otoksen perusteella laskettu)

17.11.2015/3 Miten estimaattori valitaan? Mitä estimaattorista on tiedettävä? Mikä on hyvä estimaattori? Miksi X on hyvä µ:n estimaattori? Miksi p on hyvä π:n estimaattori?

17.11.2015/4 Esim. Jos populaatiossa viallisia π %, niin viallisten prosenttiosuus otoksessa p ~N (π, π(100 π) ), likimain. n Siis E(p) = π eli estimaattorin odotusarvo on estimoitava parametri. Tätä ominaisuutta kutsutaan harhattomuudeksi, p on π:n harhaton estimaattori. Estimaattorin p:n hajonta eli keskivirhe on π(100 π). n

Esim. 5.1.2 E(X ) = µ, joten X on µ:n harhaton estimaattori, X :n keskivirhe on σ. n 17.11.2015/5 Estimaattorilta vaadittavia ominaisuuksia harhattomuus mahdollisimman pieni varianssi (tehokkain estimaattori) tarkentuvuus eli otoskoon kasvaessa rajatta estimaattorin varianssi lähenee nollaa

17.11.2015/6 Esim. 5.1.2 Voidaan osoittaa, että normaalijakauman tapauksessa X on tehokkain µ:n estimaattori eli X :lla on pienin varianssi harhattomien estimaattoreiden joukossa. Esim. 5.1.3 E(S 2 ) = σ 2

17.11.2015/7 5.2 Luottamusvälejä Parametria väliestimoidaan nk. luottamusvälin avulla. Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z z ) =. Vastaavalla tavalla z /2 siten, että P(Z z /2 ) = /2.

17.11.2015/8 Esim. z 0,05 = 1,64, koska Φ(1,64) = 0,95 z 0,025 = 1,96, koska Φ(1,96) = 0,975 z 0,005 = 2,58, koska Φ(2,58) = 0,9951 Ks. http://www.sis.uta.fi/tilasto/mtttp3/kevat2015/zalpha.pdf

17.11.2015/9 5.2.1 Populaation odotusarvon luottamusväli Olkoon X 1, X 2,..., X n on satunnaisotos N(µ, σ 2 ):sta, missä σ 2 tunnettu. Tällöin X ~N (μ, σ2 n ) ja Z = X µ σ/ n ~N(0, 1),

17.11.2015/10 joten P ( z α 2 X µ σ n z α 2 ) = 1 α. Tästä saadaan σ P (X z α 2 n µ X σ + z α 2 n ) = 1 α σ Satunnaisväli (X z α 2, X σ + z n α 2 ) sisältää µ:n n todennäköisyydellä 1-. Tätä väliä kutsutaan populaation odotusarvon µ 100(1 - α )%:n luottamusväliksi (kaava 4.1). Varmuus eli luottamustaso on 1 - α.

17.11.2015/11 Esim. 5.2.2 Sokerin pussituskone tuottaa pusseja, joiden paino vaihtelee normaalijakauman mukaisesti keskihajontana 2,5 g. Koneeseen tehdään säätöjä ja punnitaan 20 pussia. Näiden keskipainoksi saadaan 1002 g. Voidaanko päätellä, että kone tuottaa keskimäärin kilon pusseja?

17.11.2015/12 95 %:n luottamusväli µ:lle, kun σ tunnettu, X ± z 0,05/2 σ n. Saadaan 1002 ±1,96 2,5/ 20 1002 ± 1,1 eli (1000,9, 1003,1) Luottamusväli ei sisällä kiloa. Päätellään, että kone ei tuota keskimäärin kilon pusseja.

17.11.2015/13 Sama päättely 99 %:n luottamusvälin 1002 ±2,58 2,5/ 20 (1000,6, 1003,4) perusteella.

17.11.2015/14 Olkoon X 1, X 2,..., X n on satunnaisotos N(µ, σ 2 ):sta, missä σ 2 tuntematon. Tällöin t = X µ s/ n ~t n 1. Olkoon t df Studentin t-jakaumaa noudattava satunnaismuuttuja. Määritellään t,df siten, että P(t df t,df ) = ja t 2,df siten, että P(t df t 2,df ) = 2

17.11.2015/15 Esim. 5.2.4 t 0,05, 10 = 1,812, t 0,05, 30 = 1,697 t 0,01, 10 = 2,764, t 0,01, 30 = 2,457 Satunnaismuuttujan t = X µ s/ n ~t n 1 perusteella voidaan johtaa (kuten kaava 4.1) populaation odotusarvon µ 100(1 - α ) %:n luottamusväli, kun σ 2 tuntematon. Saadaan X ± t α/2,n 1 s n. kaava (4.2)

17.11.2015/16 Esim. 5.2.5 Poikien keskimääräinen syntymäpituus (SAIDIT-aineisto) x = 50,95, s = 1,97, n = 65, t 0,05/2,64 2,000. Nyt 95 %:n luottamusväli on 50,95 ± t 0,05 2 ;65 1 1,97 65 50,95 ± 2 1,97 65. Poikien keskipituuden arvellaan olevan välillä (50,46, 51,44).

17.11.2015/17 Esim. Cooperin testin tulos (CTESTI-aineisto), 15- vuotiaat, x = 2534, s = 255, n = 28, t 0,05/2,27 = 2,052, 95 %:n luottamusväli odotusarvolle 2534 ± 1,96 255 28 eli väli (2435, 2633).

SPSS-tulos 17.11.2015/18

17.11.2015/19 Esim. 5.2.6 Keskimääräiset neliövuokrat Tampereen Hervannassa (2011) x = 12,32, s = 2,25, n = 26, 95 %:n luottamusväli odotusarvolle (11,41, 13,23)

SPSS-tulos 17.11.2015/20

17.11.2015/21 Esim. Eräs yritys tarjoaa valmennuskurssia yliopistoon pyrkijöille. Yritys haluaa tutkia kurssinsa tehokkuutta. Tutkitaan pareja, joilla on samanlaiset lähtötiedot. Toinen osallistuu valmennuskurssille, toinen ei. Saadaan aineisto, jossa pyrkijöiden valintakoepisteet. Osallistui Ei osallistunut Erotus Pari 1 82 75 7 Pari 2 73 71 2 Pari 3 59 52 7 Pari 4 48 46 2 Pari 5 69 70-1 Pari 6 93 83 10

17.11.2015/22 http://vassarstats.net/-> t-tests & Procedures VassarStats Printable Report 0.95 and 0.99 Confidence Intervals for the Estimated Mean of a Population Thu Jan 15 2015 16:07:22 GMT+0200 (FLE Standard Time) Values entered: X = {7,2,7,2,-1,10} Summary Values: N = 6 - X = 27 - X 2 = 207 mean = 4.5 variance = 17.1 std. dev. = 4.1352 std. error = 1.6882 df = 5 t crit(.05) = 2.57 t crit(.01) = 4.03 Confidence Intervals for Estimated Mean of Population For.95 CI: 4.5±4.3387 For.99 CI: 4.5±6.8034

SPSS-tulosteet 17.11.2015/23

17.11.2015/24