MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Samankaltaiset tiedostot
Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

riippumattomia ja noudattavat samaa jakaumaa.

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

dx=5&uilang=fi&lang=fi&lvv=2014

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MTTTP5, luento Luottamusväli, määritelmä

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

Osa 2: Otokset, otosjakaumat ja estimointi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

g=fi&lvv=2018&uilang=fi#parents

x=2&uilang=fi&lang=fi&lvv=2017

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Vilkkumaa / Kuusinen 1

x=2&uilang=fi&lang=fi&lvv=2016

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen aineisto Luottamusväli

dx=2&uilang=fi&lang=fi&lvv=2015

&idx=2&uilang=fi&lang=fi&lvv=2015

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Luottamusvälit. Normaalijakauma johnkin kohtaan

9. laskuharjoituskierros, vko 12-13, ratkaisut

&idx=2&uilang=fi&lang=fi&lvv=2015

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

&idx=2&uilang=fi&lang=fi&lvv=2015

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

&idx=2&uilang=fi&lang=fi&lvv=2015

Parametrin estimointi ja bootstrap-otanta

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

MTTTP1, luento KERTAUSTA

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen päättelyn perusteet, MTTTP5. Luentorunko, lukuvuosi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Teema 8: Parametrien estimointi ja luottamusvälit

Testejä suhdeasteikollisille muuttujille

Tutkimustiedonhallinnan peruskurssi

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MTTTP1, luento KERTAUSTA

dx=2&uilang=fi&lang=fi&lvv=2015

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 5

031021P Tilastomatematiikka (5 op) viikko 4

Väliestimointi (jatkoa) Heliövaara 1

Testit laatueroasteikollisille muuttujille

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Harjoitus 2: Matlab - Statistical Toolbox

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Otoskoko 107 kpl. a) 27 b) 2654

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisia peruskäsitteitä ja Monte Carlo

805306A Johdatus monimuuttujamenetelmiin, 5 op

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Sovellettu todennäköisyyslasku A

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

,ܾ jaü on annettu niin voidaan hakea funktion

10. laskuharjoituskierros, vko 14, ratkaisut

Tutkimustiedonhallinnan peruskurssi

Satunnaismuuttujien mittausasteikot 93

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Transkriptio:

21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia. Tällöin ~, +

21.11.2017/2 Esim. Tarkastellaan lapsen syntymäpainoa grammoina. Oletetaan, että tytöillä syntymäpaino X ~ N(3450, 520 2 ) ja pojilla syntymäpaino Y ~ N(3640, 440 2 ). Tarkastellaan tyttöpopulaatiosta 100 alkion ja poikapopulaatiosta 200 alkion satunnaisotoksia. Määritä otoskeskiarvojen jakaumat sekä otoskeskiarvojen erotuksen jakauma. Laske todennäköisyys sille, että tyttöjen otoskeskiarvo on suurempi kuin poikien.

21.11.2017/3 ~ 3450, 520 100 ~ 3640, 440 200 ~ 3450 3640, 520 100 + 440 200 ~ 190, 3672 190 > 0 = 1 = 1 3,14 60,6 = 0,0008

21.11.2017/4 Esim. 4.2.4 Koneiden A ja B pitäisi valmistaa keskimäärin samanmittaisia tankoja. Molempien koneiden tuottamien tankojen pituuksissa X ja Y (cm) on jonkin verran vaihtelua, jota voidaan luonnehtia normaalijakaumalla, jonka varianssi on 0,20 cm 2. Laadunvalvonnassa seurataan koneiden toimintaa ja valitaan satunnaisesti koneen A tuotannosta 20 ja koneen B tuotannosta 10 tankoa. Koneen A tuotannosta valittujen tankojen keskipituus on 40,0 cm ja koneelta B valittujen 39,5 cm. Tuottavatko koneet keskimäärin samanmittaisia tankoja?

Jos tuottaisivat keskimäärin samanmittaisia tankoja, niin 21.11.2017/5 ~,,, ja ~,, joten ~ 0,,. +,,

21.11.2017/6 Tällöin ( > 0,5)= 0,5 0,5 0,5 0 = 1 0,5 0 0,03 0,03 = 1 2,89 2,89 =2 2 2,89 = 0,0038 Eivät tuota keskimäärin samanmittaisia tankoja. Jos tuottaisivat, niin olisi harvinaista saada otokset, joiden keskiarvojen erotuksen itseisarvo olisi suurempi kuin 0,5 cm.

21.11.2017/7 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

21.11.2017/8 Otosjakauma otossuureen todennäköisyysjakauma Estimaattori otossuure, jolla estimoidaan populaation tuntematonta parametria Estimaattorin keskivirhe estimaattorin keskihajonta Estimaatti estimaattorin arvo (tehdyn otoksen perusteella laskettu)

21.11.2017/9 Miten estimaattori valitaan? Mitä estimaattorista on tiedettävä? Mikä on hyvä estimaattori? Miksi on hyvä µ:n estimaattori? Miksi p on hyvä :n estimaattori?

21.11.2017/10 Esim. Jos populaatiossa viallisia %, niin viallisten prosenttiosuus otoksessa p ~,,. Siis E(p) = eli estimaattorin odotusarvo on estimoitava parametri. Tätä ominaisuutta kutsutaan harhattomuudeksi, p on :n harhaton estimaattori. Estimaattorin p:n hajonta eli keskivirhe on ( ).

Esim. 5.1.2 E( ) = µ, joten on µ:n harhaton estimaattori, :n keskivirhe on. 21.11.2017/11 Estimaattorilta vaadittavia ominaisuuksia harhattomuus mahdollisimman pieni varianssi (tehokkain estimaattori) tarkentuvuus eli otoskoon kasvaessa rajatta estimaattorin varianssi lähenee nollaa

21.11.2017/12 Esim. 5.1.2 Voidaan osoittaa, että normaalijakauman tapauksessa on tehokkain µ:n estimaattori eli :lla on pienin varianssi harhattomien estimaattoreiden joukossa. Esim. 5.1.3 E(S 2 ) = 2

21.11.2017/13 5.2 Luottamusvälejä Parametria väliestimoidaan nk. luottamusvälin avulla. Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z z ) =. Vastaavalla tavalla z /2 siten, että P(Z z /2 ) = /2.

Esim. z 0,05 = 1,64, koska (1,64) = 0,9495 z 0,025 = 1,96, koska (1,96) = 0,9750 z 0,005 = 2,58, koska (2,58) = 0,9951 21.11.2017/14 Ks. http://www.sis.uta.fi/tilasto/mtttp3/kevat2015/zalpha.pdf

21.11.2017/15 5.2.1 Populaation odotusarvon luottamusväli Olkoon X 1, X 2,..., X n on satunnaisotos N(µ, 2 ):sta, missä 2 tunnettu. Tällöin ~, ja = ~ 0,1,

21.11.2017/16 joten = 1. Tästä saadaan Satunnaisväli +, + = 1 sisältää µ:n todennäköisyydellä 1-. Tätä väliä kutsutaan populaation odotusarvon µ 100(1 - ) %:n luottamusväliksi (kaava 4.1). Varmuus eli luottamustaso on 1 -.

21.11.2017/17 Esim. 5.2.2 Sokerin pussituskone tuottaa pusseja, joiden paino vaihtelee normaalijakauman mukaisesti keskihajontana 2,5 g. Koneeseen tehdään säätöjä ja punnitaan 20 pussia. Näiden keskipainoksi saadaan 1002 g. Voidaanko päätellä, että kone tuottaa keskimäärin kilon pusseja?

21.11.2017/18 95 %:n luottamusväli µ:lle, kun tunnettu, ±, /. Saadaan 1002 ±1,96 2,5/ 20 1002 ± 1,1 eli (1000,9, 1003,1) Luottamusväli ei sisällä kiloa. Päätellään, että kone ei tuota keskimäärin kilon pusseja.

21.11.2017/19 Sama päättely 99 %:n luottamusvälin 1002 ±2,58 2,5/ 20 (1000,6, 1003,4) perusteella.

21.11.2017/20 *Sivut 20-26 seuraavalle luennolle Olkoon X 1, X 2,..., X n on satunnaisotos N(µ, 2 ):sta, missä 2 tuntematon. Tällöin = ~. Olkoon t df Studentin t-jakaumaa noudattava satunnaismuuttuja. Määritellään t,df siten, että P(t df t,df ) = ja t 2,df siten, että P(t df t 2,df ) = 2

21.11.2017/21 Esim. 5.2.4 t 0,05, 10 = 1,812, t 0,05, 30 = 1,697 t 0,01, 10 = 2,764, t 0,01, 30 = 2,457 Satunnaismuuttujan = ~ perusteella voidaan johtaa (kuten kaava 4.1) populaation odotusarvon µ 100(1 - ) %:n luottamusväli, kun 2 tuntematon. Saadaan ± /,. kaava (4.2)

21.11.2017/22 Esim. 5.2.5 Poikien keskimääräinen syntymäpituus (SAIDIT-aineisto) = 50,95, = 1,97, = 65, t 0,05/2,64 2,000. Nyt 95 %:n luottamusväli on 50,95 ±, ; 1,97 65 50,95 ± 2,. Poikien keskipituuden arvellaan olevan välillä (50,46, 51,44).

21.11.2017/23 Esim. Cooperin testin tulos (CTESTI-aineisto), 15- vuotiaat, = 2534, s = 255, n = 28, t 0,05/2,27 = 2,052, 95 %:n luottamusväli odotusarvolle 2534 ± 2,052 eli väli (2435, 2633).

SPSS-tulos 21.11.2017/24

21.11.2017/25 Esim. 5.2.6 Keskimääräiset neliövuokrat Tampereen Hervannassa (2011) = 12,32, s = 2,25, n = 26, 95 %:n luottamusväli odotusarvolle (11,41, 13,23)

SPSS-tulos 21.11.2017/26