Luottamusvälit. Normaalijakauma johnkin kohtaan

Samankaltaiset tiedostot
MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Tilastollinen aineisto Luottamusväli

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Sovellettu todennäköisyyslaskenta B

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tutkimustiedonhallinnan peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Parametrin estimointi ja bootstrap-otanta

Estimointi. Vilkkumaa / Kuusinen 1

Teema 8: Parametrien estimointi ja luottamusvälit

dx=5&uilang=fi&lang=fi&lvv=2014

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tilastollisia peruskäsitteitä ja Monte Carlo

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Osa 2: Otokset, otosjakaumat ja estimointi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Otoskoko 107 kpl. a) 27 b) 2654

riippumattomia ja noudattavat samaa jakaumaa.

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Väliestimointi (jatkoa) Heliövaara 1

Tutkimustiedonhallinnan peruskurssi

&idx=2&uilang=fi&lang=fi&lvv=2015

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

9. laskuharjoituskierros, vko 12-13, ratkaisut

dx=2&uilang=fi&lang=fi&lvv=2015

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen perusteet 2016, Juha Heikkilä. Jos tutkitaan koko perusjoukko, tehdään kokonaistutkimus.

&idx=2&uilang=fi&lang=fi&lvv=2015

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

031021P Tilastomatematiikka (5 op) viikko 4

Otantajakauman käyttö päättelyssä

Sovellettu todennäköisyyslaskenta B

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Matemaatikot ja tilastotieteilijät

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

5 Lisa materiaali. 5.1 Ristiintaulukointi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Harjoitus 2: Matlab - Statistical Toolbox

ABHELSINKI UNIVERSITY OF TECHNOLOGY

A-OSA. Kyseessä on binomitodennäköisyys. 30 P(Tasan 10 sadepäivää ja muut 20 poutapäiviä) 0,35 (1 0,35) ,35 0, ,

6. laskuharjoitusten vastaukset (viikot 10 11)

MTTTP5, luento Luottamusväli, määritelmä

12 TODENNÄKÖISYYSJAKAUMIA

b) Jos Ville kaataisikin karkit samaan pussiin ja valitsisi sieltä sattumanvaraisen karkin, niin millä todennäköisyydellä hän saisi merkkarin?

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Testit laatueroasteikollisille muuttujille

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

pisteet Frekvenssi frekvenssi Yhteensä

Harjoitus 7: NCSS - Tilastollinen analyysi

Estimointi. Otantajakauma

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

MTTTP1, luento KERTAUSTA

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Todennäköisyyden ominaisuuksia

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Mat Sovellettu todennäköisyyslasku A

10. laskuharjoituskierros, vko 14, ratkaisut

031021P Tilastomatematiikka (5 op) viikko 5

Huippu 8 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty b) Otos oli 100 liukuhihnalta otettua juureslastupussia.

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Transkriptio:

Luottamusvälit Normaalijakauma johnkin kohtaan

Perusjoukko ja otanta Jos halutaan tutkia esimerkiksi Suomessa elävien naarashirvien painoa, se voidaan (periaatteessa) tehdä kahdella tavalla: 1. tutkimalla jokainen Suomessa elävä naarashirvi, eli tutkimalla koko populaatio eli perusjoukko 2. valitsemalla perusjoukosta otanta, esimerkiksi 1000 hirveä, jotka tutkimalla luodaan arvio koko populaation painojakaumalle Koska koko perusjoukon tutkiminen on usein mahdotonta, tutkitaan monia asioita otannan avulla.

Otoskeskiarvo ja odotusarvo, mitä eroa? Otoskeskiarvo xx tarkoittaa otoksesta laskettua keskiarvoa. Perusjoukon odotusarvo μμ tarkoittaa koko populaation todellista keskiarvoa. Perusjoukon odotusarvo on usein mahdottoman työlästä selvittää ja täten tuntematon, siksi käytetään arviota, eli otoskeskiarvoa. Kun otos on tarpeeksi suuri, otoskeskiarvo on hyvä estimaatti perusjoukon odotusarvolle.

Perusjoukon tunnusluvun arvioiminen otannan avulla Otannasta voidaan laskea joku tilastollinen tunnusluku, esimerkiksi painon keskiarvo. Otannasta laskettu keskiarvo on estimaatti koko populaation keskiarvolle, eli perusjoukon odotusarvolle. Otannasta laskettu tunnusluku ei kuitenkaan varmasti ole pilkulleen oikea, eli tasan tarkkaan sama kuin vastaava perusjoukon tunnusluku. Tuhannen hirvinaaraan otannasta laskettu painon keskiarvo ei varmasti ole tasan yhtä suuri kuin kaikkien Suomessa elävien hirvinaaraiden keskipaino.

Luottamusväli Otannasta lasketun otoskeskiarvon xx lisäksi voidaan ilmoittaa joku otoskeskiarvon lähiympäristö, jossa todellinen arvo (perusjoukon odotusarvo) todennäköisesti on. Mitä suurempi väli, sitä suuremmalla todennäköisyydellä odotusarvo osuu kyseiselle välille. Ja toisaalta mitä suuremmalla todennäköisyydellä haluamme odotusarvon osuvan välille, sitä suuremman välin tarvitsemme.

Perusjoukon odotusarvon μμ luottamusväli 95 %:n luottamustasolla on väli xx 1,96 ss ; nn xx + 1,96 ss nn 99 %:n luottamustasolla on väli xx 2,58 ss ; nn xx + 2,58 ss nn 99,9 %:n luottamustasolla on väli xx 3,29 ss ; nn xx + 3,29 ss nn Kaavoissa s on satunnaismuuttujan keskihajonta, xx satunnaismuuttujan otoksesta laskettu otoskeskiarvo ja n otoksen koko. (Satunnaismuuttuja, esimerkiksi hirvinaaraan massa.)

Tärkeä tarkennus Tarkalleen ottaen Maolissa lukee: Kaavoissa s on satunnaismuuttujan keskihajonta, xx satunnaismuuttujan otoksesta laskettu otoskeskiarvo ja n otoksen koko. Kun hajonta estimoidaan otoksesta, korvataan kertoimet 1,96; 2,58 ja 3,29 tt-jakauman arvoilla tt pp, kun pp = 0,05; pp = 0,01 ja pp = 0,001 sekä vapausasteluku nn 1. Keskihajonta tarkoittaa koko populaatiosta laskettua hajontaa. (Populaatio ja hajonta tarkasti tunnettu.) Kun hajonta estimoidaan otoksesta, tarkan koko populaation keskihajonnan tilalla on epätarkempi otoskeskihajonta. Tällöin myös luottamusvälien pitäisi olla leveämpiä ja kertoimien suurempia.

Siis keskihajonta vai otoskeskihajonta? Käytännössä otoskeskihajonta vastaa hyvin perusjoukon keskihajontaa, kun otos on yli 30. Oletamme siis, että otoskeskihajonta on tarpeeksi lähellä keskihajontaa ja käytämme kertoimia 1,96; 2,58 ja 3,29. Yo-kokeessa voisi olla hyvä kirjata jotain tämän tyylisesti Käytetään otoskeskihajontaa keskihajonnan estimaattina, vaikka ovatkin eri asia.

Esimerkki 1 Hirvinaaraiden otoksesta (n = 100) laskettu keskipaino oli 265 kg. Määritä keskipainon 95 %:n luottamusväli, jos keskihajonta s = 42 kg. 95 %:n luottamustasolla on väli xx 1,96 ss ; nn xx + 1,96 ss nn alaraja = 265 1,96 yläraja = 265 + 1,96 42 100 42 100 = 256,768 257 (kg) = 273,232 273 (kg) Keskipainon 95 %:n luottamusväli on siis 257, 273

Esimerkki 2 Kauppias väitti asiakkaalle, että kaupattavien kananmunien keskipaino on 50 g. Asiakas poimi 36 munan otoksen ja sai keskiarvon 45 g hajonnan ollessa 6 g. Tuntuuko kauppiaan väite uskottavalta? Ratkaisu: Väite on uskottava, jos 50 g osuu 95 %:n luottamusvälille. alaraja = 45 1,96 yläraja = 45 + 1,96 6 36 6 36 = 43,04 43 (kg) = 46,96 47 (kg) 50 g ei kuulu välille 43, 47, joten kauppiaan väite ei ole uskottava.

Suhteellinen osuus p Voimme myös tutkia populaation tietyn tyyppisten alkioiden prosenttiosuutta p. Esimerkiksi kuinka monta prosenttia 50 kappaleen otoksessa on viallisia kahvinkeittimiä. Kuinka monta prosenttia 3000 ihmisen otoksessa kannattaa demareita. Kuinka monta prosenttia tuhannen hirven otoksessa on ruskeasilmäisiä.

Suhteellisen osuuden p luottamusväli 95 %:n luottamustasolla on väli 99 %:n luottamustasolla on väli 99,9 %:n luottamustasolla on väli pp 1,96ss ; pp 2,58ss ; pp 3,29ss ; pp + 1,96ss pp + 2,58ss pp + 3,29ss Kaavoissa pp ja ss ovat satunnaismuuttujan laskettavia tunnuslukuja: pp = otoksesta laskettu suhteellinen osuus (siis suhteellinen frekvenssi!), nn = otoksen koko, ss = pp(1 pp) nn = suhteellisen osuuden otosjakauman keskihajonta. HUOM! pp kaavaan lukuna välillä 0, 1, ei prosenttilukuna.

Esimerkki 3 Taloustutkimuksen viimeisimmän puolueiden kannatusmittauksen mukaan SDP on suosituin puolue 21,0 % kannatuksella. Määritä SDP:n kannatuksen 95 %:n luottamusväli, kun otos nn = 3000. Ratkaisu: pp 1,96ss ; pp + 1,96ss ja ss = pp(1 pp) nn Alaraja = 0,21 1,96 0,21 1 0,21 3000 = 0,1954 19,5 % Yläraja = 0,21 + 1,96 0,21 1 0,21 3000 = 0,2245 22,5 % SDP:n kannatuksen 95 %:n luottamusväli on 19,5; 22,5.