/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Samankaltaiset tiedostot
/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

dx=5&uilang=fi&lang=fi&lvv=2014

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

riippumattomia ja noudattavat samaa jakaumaa.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

MTTTP5, luento Luottamusväli, määritelmä

Estimointi. Vilkkumaa / Kuusinen 1

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Sovellettu todennäköisyyslaskenta B

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Luottamusvälit. Normaalijakauma johnkin kohtaan

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Tilastollinen aineisto Luottamusväli

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

Teema 8: Parametrien estimointi ja luottamusvälit

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luento JOHDANTO

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

tilastotieteen kertaus

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

MTTTP1, luento KERTAUSTA

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTP1, luento KERTAUSTA

&idx=2&uilang=fi&lang=fi&lvv=2015

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

031021P Tilastomatematiikka (5 op) viikko 4

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

&idx=2&uilang=fi&lang=fi&lvv=2015

g=fi&lvv=2018&uilang=fi#parents

A-OSA. Kyseessä on binomitodennäköisyys. 30 P(Tasan 10 sadepäivää ja muut 20 poutapäiviä) 0,35 (1 0,35) ,35 0, ,

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

x=2&uilang=fi&lang=fi&lvv=2017

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

dx=2&uilang=fi&lang=fi&lvv=2015

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

x=2&uilang=fi&lang=fi&lvv=2016

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tutkimustiedonhallinnan peruskurssi

dx=2&uilang=fi&lang=fi&lvv=2015

805306A Johdatus monimuuttujamenetelmiin, 5 op

Tilastollisen päättelyn perusteet, MTTTP5. Luentorunko, lukuvuosi

Sovellettu todennäköisyyslaskenta B

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Parametrin estimointi ja bootstrap-otanta

&idx=1&uilang=fi&lang=fi&lvv=2017

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Harjoitus 2: Matlab - Statistical Toolbox

10. laskuharjoituskierros, vko 14, ratkaisut

&idx=2&uilang=fi&lang=fi&lvv=2015

&idx=2&uilang=fi&lang=fi&lvv=2015

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 5

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Väliestimointi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

1. Tilastollinen malli??

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Jatkuvat satunnaismuuttujat

Mat Sovellettu todennäköisyyslasku A

,ܾ jaü on annettu niin voidaan hakea funktion

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

5 Lisa materiaali. 5.1 Ristiintaulukointi

Normaalijakaumasta johdettuja jakaumia

Matemaatikot ja tilastotieteilijät

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

30A02000 Tilastotieteen perusteet

Transkriptio:

2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2 Esim. z 0,05 = 1,6449 z 0,01 = 2,3264 z 0,05/2 = z 0,025 = 1,96

Standardoitu normaalijakauman symmetrinen nollan suhteen 2.10.2018/3

2.10.2018/4 Esim. 7.4.4. Olkoon Z ~ N(0, 1). P(Z 2,3264) = 0,01, P(Z -2,3264) = 0,01 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025 P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05

2.10.2018/5 7.5 Satunnaisotos, otossuure ja otantajakauma Päätelmät populaatiosta otoksen perusteella puolueen kannatus kynttilöiden keskimääräinen palamisaika asuntojen keskimääräiset neliöhinnat keskustassa ja lähiössä Miten päättely tehdään? Miten tulosten luotettavuutta voidaan arvioida?

2.10.2018/6 Päättely tehdään satunnaisotoksen perusteella. Satunnaismuuttujajono X 1, X 2,, X n on satunnaisotos, jos Xi:t ovat riippumattomia ja noudattavat samaa jakaumaa. Esim. Satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, 2 ). Tällöin jokainen X i noudattaa normaalijakaumaa parametrien µ, 2 ja X i :t ovat toisistaan riippumattomia. Otossuure on satunnaisotoksen perusteella määritelty funktio.

2.10.2018/7 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, 2 ), tällöin ~ N(µ, 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden http://onlinestatbook.com/stat_sim/sampling_dist/index.html

2.10.2018/8 Olkoon populaatiossa % tietyn tyyppisiä alkioita ja p = tietyn tyyppisten alkioiden % -osuus otoksessa. Tällöin p ~ N(, (100- )/n), likimain, kaava (7). Viallisten prosenttiosuus otoksessa (p) on otossuure, jonka jakauma on likimain normaalijakauma. Otossuureiden jakaumia käytetään päättelyyn liittyvien tulosten luotettavuuden arvioinnissa.

2.10.2018/9 7.6 Piste-estimointi ja luottamusvälejä Esim. Vuonna 2007 suomalaisen miesten keskipituuden arvioitiin olevan 179,6 cm, naisten 165,9, http://fi.wikipedia.org/wiki/ihmisen_pituus#ihmisten_kes kipituus_eri_maissa

2.10.2018/10 Esim. Jalkapalloilijat 2006, jalkapalloilijoiden keskipituuden arviointi. Arvioidaan keskipituuden olevan 182,15 cm.

2.10.2018/11 Esim. Puolueen kannatusarviot, https://yle.fi/uutiset/3-10387592 (6.9.2018) Arvioidaan SDP:n kannatuksen olevan 20,3 %.

2.10.2018/12 Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla (piste-estimointi) Estimaattori otossuure, jolla estimoidaan tuntematonta parametria Estimaatti estimaattorin arvo (tehdyn otoksen perusteella laskettu) Estimaattorin keskivirhe estimaattorin hajonta

Estimoitava Esti- Estimaattorin Estimoitu parametri maattori keskivirhe keskivirhe 2.10.2018/13 µ / s/ p (100 )/ (100 )/ s Esim. Puolueen kannatuksen arviointi p = 20,3 %, n = 1460 (kantansa ilmoittaneet). Kannatuksen estimoitu keskivirhe 20,3(100 20,3)/1460 = 1,05.

2.10.2018/14 Esim. 7.6.1. Kerrostalohuoneistojen keskimääräisen neliöhinnan estimointi, = 2398, s = 408, joten estimoitu keskivirhe on 408/ 103 = 40,2.

Esim. Jalkapalloilijoiden keskipituuden estimoitu keskivirhe 5,879/ 154 = 0,474. 2.10.2018/15 Myös nk. luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria, tällöin kyse väliestimoinnista. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä, nk. luottamustasolla. Luottamusväli on satunnaisväli, joka sisältää estimoitavan parametrin todennäköisyydellä 1 -. Valitaan esim. 0,05 tai 0,01. Tällöin kyse 95 %:n tai 99 %:n luottamusvälistä.

2.10.2018/16 7.6.1 Prosenttiosuuden luottamusväli Kaava (8), 100(1 - ) %:n luottamusväli prosenttiosuudelle / 2 p z p(100 p)/n 95 %:n luottamusväli, = 0,05, z 0,05/2 = z 0,025 = 1,96 99 %:n luottamusväli, = 0,01, z 0,01/2 = z 0,005 = 2,5758

2.10.2018/17 Esim. 7.6.4. Satunnaisesti valituista 100 henkilöstä puoluetta kannatti 18 %. Puolueen kannatuksen 95 %:n luottamusväli 18 ± 1,96 18(100-18)/100 18 ± 7,5 Arvioidaan kannatuksen olevan välillä 10,5 25,5. Virhemarginaali ±7,5 %-yksikköä. Esim. Puolueen kannatusarviot ja virhemarginaali, Puolueen kannatusarviot, Puolueen kannatusarviot, https://yle.fi/uutiset/3-10387592 (6.9.2018)

2.10.2018/18 Esim. Kahvin myyjä väittää, että 15 % kahvin juojista valitsee kahvimerkin hinnan perusteella. Tutkitaan myyjän väitettä. Tehdään tutkimus, jossa 250 kahvin juojalta kysytään kahvimerkin valintaan vaikuttavia tekijöitä. Vastanneista 25 valitsi kahvinsa hinnan perusteella. Uskotko myyjän väitteen? Nyt n = 250, p = 100 25/250 = 10 95 %:n luottamusväli hinnan perusteella valintansa tekevien prosenttiosuudelle 10 1,96 10(100 10)/250 10 ± 3,7

2.10.2018/19 Koska 15 ei kuulu luottamusvälille, ei uskota väitettä. 99 %:n luottamusväli 10 2,5758 10(100 10)/250 10 ± 4,9, sama päättely. Sivut 20-24 seuraavalle luennolle

7.6.2 Populaation odotusarvon luottamusväli 2.10.2018/20 Esim. 7.6.6. Arvioidaan poikien keskimääräistä syntymäpituutta, siis poikapopulaation keskiarvoa. Otoksessa 65 pojan syntymäpituuden keskiarvo 50,95 cm ja keskihajonta 1,97 cm. Arvio populaation odotusarvon luottamusvälin avulla, määrittämisessä käytetään otoskeskiarvoa ja otoshajontaa. Poikien keskipituuden arvellaan olevan välillä 50,5 cm 51,4 cm. SPSS-tulos:

2.10.2018/21 Kaava (9), 100(1 - ) %:n luottamusväli odotusarvolle X t n s / / 2; 1 n

Studentin t-jakauman taulukkoarvot t,df ja t /2,df 2.10.2018/22

2.10.2018/23

2.10.2018/24 Esim. 7.6.9. Tiedetään, että eräs kirjailija käyttää tuotannossaan virkkeitä, joiden keskipituus on 32 sanaa. Tutkija lukee erään tekstin, jossa on 30 virkettä. Näiden 30 virkkeen keskipituus on 35,5 sanaa ja keskihajonta 6,8 sanaa. Voisiko teksti olla peräisin kyseisen kirjailijan tuotannosta? Muodostetaan odotusarvon 95 %:n luottamusväli. Nyt t 0,05/2;30 1 =2,045 ja luottamusväli 35,0 2,045 6,8/ 30. Saadaan väliksi 32,5 37,5, jolle 32 ei kuulu. Päätellään, että teksti ei ole kyseisen kirjailijan tuotantoa.