Osa 2: Otokset, otosjakaumat ja estimointi



Samankaltaiset tiedostot
Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Testejä suhdeasteikollisille muuttujille

tilastotieteen kertaus

Estimointi. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollinen aineisto Luottamusväli

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Normaalijakaumasta johdettuja jakaumia

Väliestimointi (jatkoa) Heliövaara 1

Hypoteesin testaus Alkeet

Testit järjestysasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Teema 8: Parametrien estimointi ja luottamusvälit

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Harjoitus 2: Matlab - Statistical Toolbox

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Sovellettu todennäköisyyslasku 5. harjoitukset/ratkaisut. Jatkuvat jakaumat

Otoskoko 107 kpl. a) 27 b) 2654

805306A Johdatus monimuuttujamenetelmiin, 5 op

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Tilastollisten aineistojen kuvaaminen

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Regressioanalyysi. Kuusinen/Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Luottamusvälit. Normaalijakauma johnkin kohtaan

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

7. laskuharjoituskierros, vko 10, ratkaisut

Tilastolliset menetelmät: Tilastolliset testit

Moniulotteisia todennäköisyysjakaumia

Mat Tilastollisen analyysin perusteet, kevät 2007

riippumattomia ja noudattavat samaa jakaumaa.

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

TILASTOLLINEN LAADUNVALVONTA

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Sovellettu todennäköisyyslaskenta B

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

031021P Tilastomatematiikka (5 op) viikko 4

,ܾ jaü on annettu niin voidaan hakea funktion

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

TILASTOMATEMATIIKKA. Keijo Ruohonen

Sovellettu todennäköisyyslaskenta B

10. laskuharjoituskierros, vko 14, ratkaisut

Sovellettu todennäköisyyslaskenta B

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Jatkuvat satunnaismuuttujat

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Tutkimustiedonhallinnan peruskurssi

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Transkriptio:

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Väliestimointi TKK (c) Ilkka Mellin (2007) 1

Väliestimointi >> Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2007) 2

Todennäköisyysjakaumien parametrien estimointi Todennäköisyysjakaumat tilastollisten aineistojen kuvaajina Tilastollinen aineisto koostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista. Tilastollisissa tutkimusasetelmissa havaintoihin liittyy aina epävarmuutta ja satunnaisuutta. Tilastollisissa tutkimusasetelmissa tutkimuksen kohteita kuvaavat muuttujat tulkitaan satunnaismuuttujiksi, jotka generoivat muuttujien havaitut arvot. Havaintoarvot generoineiden satunnaismuuttujien todennäköisyysjakauma muodostaa tilastollisen mallin sille satunnaisilmiölle, jota havainnot koskevat. TKK (c) Ilkka Mellin (2007) 3

Todennäköisyysjakaumien parametrien estimointi Todennäköisyysjakaumien parametrit 1/2 Tarkastellaan jotakin tutkimuksen kaikkien mahdollisten kohteiden muodostaman perusjoukon S alkioiden ominaisuutta kuvaavaa satunnaismuuttujaa X. Oletetaan, että satunnaismuuttuja X noudattaa todennäköisyysjakaumaa, jonka pistetodennäköisyys-tai tiheysfunktio f(x ; θ) riippuu parametrista θ. Merkintä: X ~ f( x; θ ) TKK (c) Ilkka Mellin (2007) 4

Todennäköisyysjakaumien parametrien estimointi Todennäköisyysjakaumien parametrit 2/2 Satunnaismuuttujan X pistetodennäköisyys- tai tiheysfunktio f(x ; θ) kuvaa satunnaismuuttujan X todennäköisyysjakaumaa ja parametri θ kuvaa jotakin jakauman karakteristista ominaisuutta. Koska parametrin θ arvoa ei sovellustilanteessa yleensä tunneta, tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida tuntemattomalle parametrille θ sopiva arvo jakaumasta f(x ; θ) poimitun otoksen perusteella. TKK (c) Ilkka Mellin (2007) 5

Todennäköisyysjakaumien parametrien estimointi Yksinkertainen satunnaisotos Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos jakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio f(x ; θ) riippuu parametrista θ. Tällöin havainnot X 1, X 2,, X n ovat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys- tai tiheysfunktio f(x ; θ): X1, X2,, Xn X ~ f( x; θ ), i = 1,2,, n i TKK (c) Ilkka Mellin (2007) 6

Todennäköisyysjakaumien parametrien estimointi Havainnot ja havaintoarvot Oletetaan, että satunnaismuuttujat (havainnot) X 1, X 2,, X n saavat poimitussa otoksessa havaituiksi arvoikseen luvut x 1, x 2,, x n Havaintoarvot x 1, x 2,, x n vaihtelevat satunnaisesti otoksesta toiseen jakaumasta f(x ; θ) saatavin todennäköisyyksin. TKK (c) Ilkka Mellin (2007) 7

Todennäköisyysjakaumien parametrien estimointi Estimaattorit ja estimaatit 1/2 Oletetaan, että todennäköisyysjakauman f(x ; θ) parametrin θ estimoimiseen käytetään satunnaismuuttujien X 1, X 2,, X n funktiota eli tunnuslukua T = g(x 1, X 2,, X n ) Tällöin funktiota T = g(x 1, X 2,, X n ) kutsutaan parametrin θ estimaattoriksi ja havaintoarvoista x 1, x 2,, x n laskettua funktion g arvoa t = g(x 1, x 2,, x n ) kutsutaan parametrin θ estimaatiksi. TKK (c) Ilkka Mellin (2007) 8

Todennäköisyysjakaumien parametrien estimointi Estimaattorit ja estimaatit 2/2 Olkoon T = g(x 1, X 2,, X n ) jakauman f(x ; θ) parametrin θ estimaattori. Tällöin estimaattorin T havaintoarvoista x 1, x 2,, x n laskettu arvo eli estimaatti t = g(x 1, x 2,, x n ) on satunnaismuuttujan T arvon realisaatio otoksessa. TKK (c) Ilkka Mellin (2007) 9

Todennäköisyysjakaumien parametrien estimointi Estimaattoreiden johtaminen Hyvien estimaattoreiden johtaminen todennäköisyysjakaumien tuntemattomille parametreille on teoreettisen tilastotieteen keskeisiä ongelmia. Tärkeimmät estimaattoreiden johtamiseen käytettävät menetelmät: Suurimman uskottavuuden menetelmä Momenttimenetelmä Ks. lukua Estimointimenetelmät. TKK (c) Ilkka Mellin (2007) 10

Todennäköisyysjakaumien parametrien estimointi Piste-estimointi ja väliestimointi Todennäköisyysjakauman parametrin arvon estimointia kutsutaan usein piste-estimoinniksi. Parametrin estimaattiin on aina syytä liittää luottamusväliksi kutsuttu väli, joka sisältää estimoidun parametrin todellisen, mutta tuntemattoman arvon tietyllä, soveltajan valitsemalla todennäköisyydellä. Luottamusvälin määräämistä kutsutaan väliestimoinniksi. TKK (c) Ilkka Mellin (2007) 11

Väliestimointi Todennäköisyysjakaumien parametrien estimointi >> Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2007) 12

Luottamusväli Luottamusväli ja luottamustaso Väliestimoinnissa todennäköisyysjakauman f(x ; θ) tuntemattomalle parametrille θ pyritään määräämään havainnoista riippuva väli, joka tietyllä, soveltajan valitsemalla todennäköisyydellä, peittää parametrin todellisen arvon. Konstruoitua väliä kutsutaan luottamusväliksi ja valittua todennäköisyyttä kutsutaan luottamustasoksi. Huomautus: Luottamusvälille ja -tasolle voidaan antaa tulkinnat todennäköisyyden frekvenssitulkinnan avulla. TKK (c) Ilkka Mellin (2007) 13

Luottamusväli Luottamusvälin määrääminen 1/2 Oletukset: (i) Olkoon f(x ; θ) todennäköisyysjakauma, jonka määrää tuntematon parametri θ. (ii) Olkoon X 1, X 2,, X n satunnaisotos jakaumasta f(x ; θ). TKK (c) Ilkka Mellin (2007) 14

Luottamusväli Luottamusvälin määrääminen 2/2 Valitaan luottamustaso (1 α) siten, että 0 < 1 α < 1 Määrätään satunnaismuuttujat L= L( X1, X2,, Xn) U = U( X1, X2,, Xn) siten, että Pr( θ ( LU, )) = 1 α Tällöin sanomme, että väli (L, U) on parametrin θ luottamusväli luottamustasolla (1 α). TKK (c) Ilkka Mellin (2007) 15

Luottamusväli Luottamusvälin määrääminen: Kommentti Luottamusvälin (L, U) päätepisteet L ja U riippuvat yleensä sekä havainnoista X 1, X 2,, X n että valitusta luottamustasosta (1 α) TKK (c) Ilkka Mellin (2007) 16

Luottamusväli Luottamustason ja -välin frekvenssitulkinta Oletetaan, että luottamustasoksi on valittu (1 α). Luottamustasolle ja siihen liittyvälle luottamusvälille voidaan antaa seuraava frekvenssitulkinta: (i) Jos otantaa jakaumasta f(x ; θ) toistetaan, keskimäärin 100 (1 α) % otoksista konstruoiduista luottamusväleistä peittää parametrin θ todellisen arvon. (ii) Jos otantaa jakaumasta f(x ; θ) toistetaan, keskimäärin 100 α % otoksista konstruoiduista luottamusväleistä ei peitä parametrin θ todellista arvoa. TKK (c) Ilkka Mellin (2007) 17

Luottamusväli Johtopäätökset luottamisväleistä Tehdään johtopäätös, että konstruoitu luottamusväli peittää parametrin θ tuntemattoman todellisen arvon. (i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea 100 (1 α) %:ssa tapauksia. (ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä 100 α %:ssa tapauksia. Huomautus: Virheellisen johtopäätöksen mahdollisuutta ei saada häviämään, ellei luottamusväliä tehdä äärettömän leveäksi, jolloin väli ei enää sisällä informaatiota parametrin θ oikeasta arvosta. TKK (c) Ilkka Mellin (2007) 18

Luottamusväli Luottamusvälit: Esimerkkejä Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos jakaumasta f(x ; θ). Tarkastellaan seuraavien jakaumien parametrien luottamusvälejä (ks. monisteen Todennäköisyyslaskenta lukuja Diskreettejä jakaumia ja Jatkuvia jakaumia): Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvoparametrin luottamusväli TKK (c) Ilkka Mellin (2007) 19

Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli >> Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2007) 20

Normaalijakauman odotusarvon luottamusväli Esimerkki 1/4 Kone tekee ruuveja, joiden pituudet vaihtelevat satunnaisesti noudattaen normaalijakaumaa; ks. esimerkkiä luvussa Tilastollisten aineistojen kuvaaminen. Ruuvien joukosta poimitaan yksinkertainen satunnaisotos, jonka koko n = 30 ja otokseen poimittujen ruuvien pituudet mitataan. Taulukko oikealla esittää pituuksien luokiteltua frekvenssijakaumaa. Luokkavälit Luokkafrekvenssit (9.85,9.90] 1 (9.90,9.95] 2 (9.95,10.00] 6 (10.00,10.05] 3 (10.05,10.10] 5 (10.10,10.15] 4 (10.15,10.20] 5 (10.20,10.25] 3 (10.25,10.30] 1 TKK (c) Ilkka Mellin (2007) 21

Normaalijakauman odotusarvon luottamusväli Esimerkki 2/4 Kuva oikealla esittää otokseen poimittujen ruuvien pituuksien luokiteltua frekvenssijakaumaa vastaavaa histogrammia. 7 6 Ruuvien pituuksien luokiteltu frekvenssijakauma Luokkavälit määräävät histogrammin suorakaiteiden kannat. Suorakaiteiden korkeudet on valittu niin, että suorakaiteiden pinta-alat suhtautuvat toisiinsa kuten vastaavat luokkafrekvenssit. Frekvenssi 5 4 3 2 1 0 9.8 9.9 10.0 10.1 10.2 10.3 10.4 Pituus (cm) TKK (c) Ilkka Mellin (2007) 22

Normaalijakauman odotusarvon luottamusväli Esimerkki 3/4 Yhteenveto otostiedoista: Pituuksien aritmeettinen keskiarvo: 7 Ruuvien pituuksien luokiteltu frekvenssijakauma X =10.09 cm 6 Pituuksien keskihajonta: s = 0.1038 cm Huomautus: Jos otantaa toistetaan, kaikki otosta koskevat tiedot (sekä havaintoarvot että niistä lasketut otossuureet) vaihtelevat satunnaisesti otoksesta toiseen. Frekvenssi 5 4 3 2 1 0 9.8 9.9 10.0 10.1 10.2 10.3 10.4 Pituus (cm) TKK (c) Ilkka Mellin (2007) 23

Normaalijakauman odotusarvon luottamusväli Esimerkki 4/4 Ongelma: Mitä koneen tekemien ruuvien todellisesta keskipituudesta voidaan tietää yhdestä otoksesta saatujen tietojen perusteella? Ratkaisu: Konstruoidaan väli, joka valitulla todennäköisyydellä sisältää ruuvien todellisen keskipituuden. Frekvenssi 7 6 5 4 3 2 1 0 Ruuvien pituuksien luokiteltu frekvenssijakauma 9.8 9.9 10.0 10.1 10.2 10.3 10.4 Pituus (cm) TKK (c) Ilkka Mellin (2007) 24

Normaalijakauman odotusarvon luottamusväli Normaalijakauma ja sen parametrointi Satunnaismuuttuja X noudattaa normaalijakaumaa N(µ, σ 2 ), jos sen tiheysfunktio on 2 2 1 1 x µ f( x; µσ, ) = exp σ 2π 2 σ < µ < +, σ > 0 Normaalijakauman parametreina ovat jakauman odotusarvo E( X ) = µ ja varianssi Var( X ) 2 = σ TKK (c) Ilkka Mellin (2007) 25

Normaalijakauman odotusarvon luottamusväli Otos normaalijakaumasta Olkoon X 1, X 2,, X n (yksinkertainen) satunnaisotos normaalijakaumasta N(µ, σ 2 ) Tällöin satunnaismuuttujat X 1, X 2,, X n ovat riippumattomia ja noudattavat samaa normaalijakaumaa N(µ, σ 2 ) TKK (c) Ilkka Mellin (2007) 26

Normaalijakauman odotusarvon luottamusväli Normaalijakauman parametrien estimointi Estimoidaan normaalijakauman N(µ, σ 2 ) parametrit µ ja σ 2 niiden harhattomilla estimaattoreilla: (i) Odotusarvoparametrin µ harhaton estimaattori: X 1 n Xi n i = 1 = (ii) Varianssiparametrin σ 2 harhaton estimaattori: n 2 1 2 s = ( Xi X) 1 n i= 1 TKK (c) Ilkka Mellin (2007) 27

Normaalijakauman odotusarvon luottamusväli Luottamustaso Määrätään luottamusväli normaalijakauman odotusarvoparametrille µ. Valitaan luottamustasoksi 1 α Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää normaalijakauman odotusarvon µ todellisen arvon. TKK (c) Ilkka Mellin (2007) 28

Normaalijakauman odotusarvon luottamusväli Luottamuskertoimet Olkoon valittu luottamustaso (1 α). Määrätään luottamuskertoimet t α/2 ja +t α/2 siten, että α Pr( t tα /2) = 2 α Pr( t + tα /2) = 2 jossa satunnaismuuttuja t noudattaa Studentin t-jakaumaa vapausastein (n 1): t t( n 1) Luottamuskertoimet t α/2 ja +t α/2 toteuttavat ehdon Pr( t t + t ) = 1 α /2 α /2 α TKK (c) Ilkka Mellin (2007) 29

Normaalijakauman odotusarvon luottamusväli Luottamuskertoimien määrääminen: Havainnollistus Luottamuskertoimet t α/2 ja +t α/2 jakavat t-jakauman tiheysfunktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeen osaan: (1) Pisteen t α/2 vasemmalle puolelle jää α/2 % massasta. (2) Pisteen +t α/2 oikealle puolelle jää α/2 % massasta. (3) Pisteiden t α/2 ja +t α/2 väliin jää (1 α) % massasta. Huomaa, että α/2 + α/2 + (1 α) = 1 t-jakauman tiheysfunktio α/2 1 α α/2 t α/2 0 +t α/2 TKK (c) Ilkka Mellin (2007) 30

Normaalijakauman odotusarvon luottamusväli Luottamusväli normaalijakauman odotusarvolle Normaalijakauman odotusarvoparametrin µ luottamusväli luottamustasolla (1 α) on muotoa s s X tα/2, X + tα/2 n n jossa X = havaintojen aritmeettinen keskiarvo s 2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä t α/2, +t α/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet t-jakaumasta vapausastein (n 1) TKK (c) Ilkka Mellin (2007) 31

Normaalijakauman odotusarvon luottamusväli Luottamusväli ja sen pituus 1/2 Normaalijakauman odotusarvon µ luottamusväli luottamustasolla (1 α) esitetään usein muodossa s X ± tα /2 n koska väli on symmetrinen keskipisteensä X suhteen. Normaalijakauman odotusarvon µ luottamusvälin pituus on 2 t α /2 s n TKK (c) Ilkka Mellin (2007) 32

Normaalijakauman odotusarvon luottamusväli Luottamusväli ja sen pituus 2/2 Normaalijakauman odotusarvon µ luottamusväli luottamustasolla (1 α): X t α /2 s n t α /2 s n TKK (c) Ilkka Mellin (2007) 33

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 1/8 Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) Olkoon X 1 n X i n i = 1 = havaintojen X 1, X 2,, X n aritmeettinen keskiarvo ja n 2 1 2 s = ( Xi X) n 1 i= 1 havaintojen X 1, X 2,, X n (harhaton) otosvarianssi. TKK (c) Ilkka Mellin (2007) 34

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 2/8 Määritellään satunnaismuuttuja X µ t = s n Satunnaismuuttuja t voidaan kirjoittaa muotoon X µ X µ X µ σ σ n t = = = 2 2 2 s n σ n s ( n 1) s σ n 1 Määrätään satunnaismuuttujan t jakauma tarkastelemalla erikseen satunnaismuuttujan t osoittajaa ja nimittäjää. TKK (c) Ilkka Mellin (2007) 35

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 3/8 Satunnaismuuttujan t osoittaja määrittelee satunnaismuuttujan X µ Z = σ n Satunnaismuuttuja Z noudattaa normaalijakautuneen otoksen aritmeettisen keskiarvon otosjakaumaa koskevan tuloksen perusteella standardoitua normaalijakaumaa N(0,1): Z N(0,1) Todistus: ks. lukua Otokset ja otosjakaumat. TKK (c) Ilkka Mellin (2007) 36

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 4/8 Satunnaismuuttuja t nimittäjä määrittelee satunnaismuuttujan 2 V = ( n 1) s 2 σ Satunnaismuuttuja V noudattaa normaalijakautuneen otoksen varianssin otosjakaumaa koskevan tuloksen perusteella χ 2 -jakaumaa vapausastein (n 1): V χ 2 ( n 1) Todistus: ks. lukua Otokset ja otosjakaumat. TKK (c) Ilkka Mellin (2007) 37

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 5/8 Edellä on todettu, että Z N(0,1) 2 V χ ( n 1) Lisäksi voidaan osoittaa, että satunnaismuuttujat Z ja V ovat riippumattomia; todistus: ks. lukua Otokset ja otosjakaumat. Siten satunnaismuuttuja X µ Z t = = s n V n 1 noudattaa Studentin t-jakaumaa vapausastein (n 1) suoraan jakauman määritelmän mukaan: t t( n 1) TKK (c) Ilkka Mellin (2007) 38

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 6/8 Määrätään t-jakaumasta vapausastein (n 1) piste +t α/2 siten, että α Pr( t + t α /2) = 2 jolloin (t-jakauman symmetrian perusteella) α Pr( t t α /2) = 2 ja edelleen Pr( t t + t ) = 1 α/2 α/2 α TKK (c) Ilkka Mellin (2007) 39

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 7/8 Tarkastellaan epäyhtälöketjua tα/2 t + tα/2 Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan t lauseke, saadaan epäyhtälöketju X µ tα/2 + tα/2 s n Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitävä epäyhtälöketju s X t µ X + t n α/2 α/2 s n TKK (c) Ilkka Mellin (2007) 40

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 8/8 Yhdistämällä saatu epäyhtälö siihen, että Pr( t t + t ) = 1 saadaan vihdoin α/2 α/2 α s s Pr X tα/2 µ X + tα/2 = 1 α n n TKK (c) Ilkka Mellin (2007) 41

Normaalijakauman odotusarvon luottamusväli Luottamusvälin frekvenssitulkinta 1/2 Normaalijakauman odotusarvon µ luottamusvälin s X tα, X + tα n konstruktiosta seuraa, että /2 /2 s n Pr s s X tα/2 µ X + tα/2 = 1 α n n Siten konstruoitu luottamusväli peittää parametrin µ todellisen arvon todennäköisyydellä (1 α) ja se ei peitä parametrin µ todellista arvoa todennäköisyydellä α. TKK (c) Ilkka Mellin (2007) 42

Normaalijakauman odotusarvon luottamusväli Luottamusvälin frekvenssitulkinta 2/2 Normaalijakauman odotusarvon µ luottamusvälille voidaan antaa seuraava frekvenssitulkinta: (i) Jos otantaa jakaumasta N(µ, σ 2 ) toistetaan, keskimäärin 100 (1 α) % otoksista konstruoiduista luottamusväleistä peittää parametrin µ todellisen arvon. (ii) Jos otantaa jakaumasta N(µ, σ 2 ) toistetaan, keskimäärin 100 α % otoksista konstruoiduista luottamusväleistä ei peitä parametrin µ todellista arvoa. TKK (c) Ilkka Mellin (2007) 43

Normaalijakauman odotusarvon luottamusväli Luottamusvälin ominaisuudet 1/2 Normaalijakauman odotusarvon µ luottamusvälin keskipiste X vaihtelee otoksesta toiseen. Luottamusvälin pituus s 2 tα /2 n vaihtelee otoksesta toiseen. Luottamusvälin pituus riippuu valitusta luottamustasosta (1 α), havaintojen lukumäärästä n ja otosvarianssista s 2. TKK (c) Ilkka Mellin (2007) 44

Normaalijakauman odotusarvon luottamusväli Luottamusvälin ominaisuudet 2/2 Luottamusväli lyhenee (pitenee), jos luottamustasoa (1 α) pienennetään (kasvatetaan). Luottamusväli lyhenee (pitenee), jos havaintojen lukumäärää n kasvatetaan (pienennetään). Luottamusväli lyhenee (pitenee), jos otosvarianssi s 2 pienenee (kasvaa). TKK (c) Ilkka Mellin (2007) 45

Normaalijakauman odotusarvon luottamusväli Vaatimukset luottamusvälille Olisi toivottavaa pystyä konstruoimaan odotusarvolle µ mahdollisimman lyhyt luottamusväli, johon liittyvä luottamustaso olisi mahdollisimman korkea. Vaatimusten samanaikainen täyttäminen ei ole kuitenkaan mahdollista, jos otoskoko pidetään kiinteänä: (i) Luottamustason kasvattaminen pidentää luottamusväliä, jolloin tieto parametrin µ todellisen arvon sijainnista tulee epätarkemmaksi. (ii) Luottamusvälin lyhentäminen pienentää luottamustasoa, jolloin tieto parametrin µ todellisen arvon sijainnista tulee epävarmemmaksi. TKK (c) Ilkka Mellin (2007) 46

Normaalijakauman odotusarvon luottamusväli Johtopäätökset luottamusvälistä Tehdään johtopäätös, että konstruoitu luottamusväli peittää odotusarvoparametrin µ todellisen arvon. (i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea 100 (1 α) %:ssa tapauksia. (ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä 100 α %:ssa tapauksia. Huomautus: Virheellisen johtopäätöksen mahdollisuutta ei saada häviämään, ellei luottamusväliä tehdä äärettömän leveäksi, jolloin väli ei enää sisällä informaatiota odotusarvoparametrin µ todellisesta arvosta. TKK (c) Ilkka Mellin (2007) 47

Normaalijakauman odotusarvon luottamusväli Esimerkki (jatkuu) 1/4 Erään koneen tekemien ruuvien joukosta poimittiin yksinkertainen satunnaisotos ja ruuvien pituudet mitattiin. Otoskoko: n = 30 Pituuksien aritmeettinen keskiarvo: X =10.09 cm Pituuksien otoskeskihajonta: s = 0.1038 cm Konstruoidaan ruuvien todelliselle keskipituudelle µ luottamusväli luottamustasolla 0.95. Valitaan luottamuskertoimet t 0.025 ja +t 0.025 siten, että Pr( t t0.025) = Pr( t + t0.025) = 0.025 jossa satunnaismuuttuja t noudattaa Studentin t-jakaumaa vapausastein n 1 = 29. Luottamuskertoimet t 0.025 ja +t 0.025 toteuttavat ehdon Pr( t t + t ) = 0.95 0.025 0.025 TKK (c) Ilkka Mellin (2007) 48

Normaalijakauman odotusarvon luottamusväli Esimerkki (jatkuu) 2/4 t-jakauman taulukoista nähdään, että Pr(t +2.045) = 0.025 Pr(t 2.045) = 0.025 kun vapausasteiden lukumäärä n 1 = 29 Siten luottamuskertoimet ovat: +t 0.025 = +2.045 t 0.025 = 2.045 Kuvio oikealla havainnollistaa luottamuskertoimien valintaa. 0.5 0.4 0.3 0.2 0.1 0 t(29)-jakauman tiheysfunktio 0.025 0.95 0.025 2.045 0 +2.045 TKK (c) Ilkka Mellin (2007) 49

Normaalijakauman odotusarvon luottamusväli Esimerkki (jatkuu) 3/4 Luottamusväliksi saadaan: s 0.1038 X ± tα /2 = 10.09 ± 2.045 n 30 = 10.09 ± 0.04 = (10.05,10.13) Siten tiedämme, että ruuvien todellinen keskipituus on todennäköisyydellä 0.95 välillä (10.05, 10.13) TKK (c) Ilkka Mellin (2007) 50

Normaalijakauman odotusarvon luottamusväli Esimerkki (jatkuu) 4/4 Luottamustason 0.95 tulkinta: Oletetaan, että poimimme koneen tekemien ruuvien joukosta toistuvasti yksinkertaisia satunnaisotoksia, joiden koko on 30 ja konstruoimme jokaisesta otoksesta 95 %:n luottamusvälin edellä esitetyllä menetelmällä. Tällöin: (i) Konstruoidusta väleistä keskimäärin 95 % peittää ruuvien todellisen, mutta tuntemattoman keskipituuden. (ii) Konstruoidusta väleistä keskimäärin 5 % ei peitä ruuvien todellista, mutta tuntematonta keskipituutta. TKK (c) Ilkka Mellin (2007) 51

Normaalijakauman odotusarvon luottamusväli Otoskoon määrääminen 1/4 Monissa tutkimustilanteissa toivotaan, että parametrille voitaisiin muodostaa mahdollisimman lyhyt luottamusväli. Normaalijakauman odotusarvon µ luottamusvälin pituus riippuu otoskoosta siten, että väli lyhenee, jos havaintojen lukumäärää n kasvatetaan. Tämä normaalijakauman odotusarvon µ luottamusvälin ominaisuus mahdollistaa (tietyin ehdoin) otoskoon valitsemisen sellaisella tavalla, että luottamusväliksi saadaan (suunnilleen) halutun mittainen väli. Oletetaan siis, että normaalijakauman odotusarvoparametrille µ halutaan konstruoida luottamusväli, jonka toivottu pituus on 2A. TKK (c) Ilkka Mellin (2007) 52

Normaalijakauman odotusarvon luottamusväli Otoskoon määrääminen 2/4 Jos normaalijakauman varianssi σ 2 tunnetaan, normaalijakauman odotusarvoparametrin µ luottamusväliksi luottamustasolla (1 α) saadaan σ X ± zα /2 n jossa X = havaintojen aritmeettinen keskiarvo σ 2 = havaintojen oletettu varianssi n = otoskoko z α/2, +z α/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet normaalijakaumasta N(0,1) TKK (c) Ilkka Mellin (2007) 53

Normaalijakauman odotusarvon luottamusväli Otoskoon määrääminen 3/4 Jos siis käytettävissä on ennakkotietoa perusjoukon varianssista σ 2, voidaan otoskoko n ratkaista yhtälöstä: σ zα /2 = A n jossa z α/2 = luottamustasoon (1 α) liittyvä luottamuskerroin normaalijakaumasta N(0,1) σ 2 = havaintojen oletettu varianssi n = otoskoko 2A = toivottu pituus luottamusvälille TKK (c) Ilkka Mellin (2007) 54

Normaalijakauman odotusarvon luottamusväli Otoskoon määrääminen 4/4 Siten tarvittava otoskoko on 2 zα /2σ n = A Huomautus: Tarvittavan otoskoon kaavasta nähdään, että mitä lyhyempää luottamusväliä toivotaan, sitä suurempi otos on poimittava: Esimerkiksi, jos luottamusvälin pituus halutaan puolittaa, pitää havaintoja kerätä 4 kertaa enemmän. TKK (c) Ilkka Mellin (2007) 55

Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli >> Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2007) 56

Normaalijakauman varianssin luottamusväli Normaalijakauma ja sen parametrointi Satunnaismuuttuja X noudattaa normaalijakaumaa N(µ, σ 2 ), jos sen tiheysfunktio on 2 2 1 1 x µ f( x; µσ, ) = exp σ 2π 2 σ < µ < +, σ > 0 Normaalijakauman parametreina ovat jakauman odotusarvo E( X ) = µ ja varianssi Var( X ) 2 = σ TKK (c) Ilkka Mellin (2007) 57

Normaalijakauman varianssin luottamusväli Otos normaalijakaumasta Olkoon X 1, X 2,, X n (yksinkertainen) satunnaisotos normaalijakaumasta N(µ, σ 2 ) Tällöin satunnaismuuttujat X 1, X 2,, X n ovat riippumattomia ja noudattavat samaa normaalijakaumaa N(µ, σ 2 ) TKK (c) Ilkka Mellin (2007) 58

Normaalijakauman varianssin luottamusväli Normaalijakauman parametrien estimointi Estimoidaan normaalijakauman N(µ, σ 2 ) parametrit µ ja σ 2 niiden harhattomilla estimaattoreilla: (i) Odotusarvoparametrin µ harhaton estimaattori: X 1 n Xi n i = 1 = (ii) Varianssiparametrin σ 2 harhaton estimaattori: n 2 1 2 s = ( Xi X) 1 n i= 1 TKK (c) Ilkka Mellin (2007) 59

Normaalijakauman varianssin luottamusväli Luottamustaso Määrätään luottamusväli normaalijakauman varianssiparametrille σ 2. Valitaan luottamustasoksi 1 α Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää normaalijakauman varianssin σ 2 todellisen arvon. TKK (c) Ilkka Mellin (2007) 60

Normaalijakauman varianssin luottamusväli Luottamuskertoimet Olkoon valittu luottamustaso (1 α). 2 2 Määrätään luottamuskertoimet χ1 α /2 ja χ α /2 siten, että 2 2 α Pr( χ χ1 α /2) = 2 2 2 α Pr( χ χα /2) = 2 jossa satunnaismuuttuja χ 2 noudattaa χ 2 -jakaumaa vapausastein (n 1): 2 χ χ 2 ( n 1) 2 2 Luottamuskertoimet χ1 α /2 ja χ α /2 toteuttavat ehdon 2 2 2 Pr( χ χ χ ) = 1 α 1 α/2 α/2 TKK (c) Ilkka Mellin (2007) 61

Normaalijakauman varianssin luottamusväli Luottamuskertoimien määrääminen: Havainnollistus 2 Luottamuskertoimet χ ja jakavat χ 2 1 α /2 2 χ α /2 -jakauman tiheysfunktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeen osaan: 2 (1) Pisteen χ1 α /2vasemmalle puolelle jää α/2 % massasta. 2 (2) Pisteen χ α /2 oikealle puolelle jää α/2 % massasta. 2 2 (3) Pisteiden χ ja 1 α /2 χ α /2 väliin jää (1 α) % massasta. Huomaa, että α/2 + α/2 + (1 α) = 1 α/2 2 χ1 α /2 χ 2 -jakauman tiheysfunktio 1 α α/2 2 χ α /2 TKK (c) Ilkka Mellin (2007) 62

Normaalijakauman varianssin luottamusväli Luottamusväli normaalijakauman varianssille Normaalijakauman varianssiparametrin σ 2 luottamusväli luottamustasolla (1 α) on muotoa 2 2 ( n 1) s ( n 1) s, 2 2 χα/2 χ 1 α/2 jossa s 2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä 2 2 χ1 α/2, χα/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet χ 2 -jakaumasta vapausastein (n 1) TKK (c) Ilkka Mellin (2007) 63

Normaalijakauman varianssin luottamusväli Luottamusväli ja sen pituus Normaalijakauman varianssin σ 2 luottamusvälin pituus on 2 1 1 ( n 1) s 2 2 χ1 α/2 χ α/2 TKK (c) Ilkka Mellin (2007) 64

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 1/5 Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) Olkoon X 1 n X i n i = 1 = havaintojen X 1, X 2,, X n aritmeettinen keskiarvo ja n 2 1 2 s = ( Xi X) n 1 i= 1 havaintojen X 1, X 2,, X n (harhaton) otosvarianssi. TKK (c) Ilkka Mellin (2007) 65

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 2/5 Määritellään satunnaismuuttuja 2 2 ( n 1) s χ = 2 σ Satunnaismuuttuja χ 2 noudattaa normaalijakautuneen otoksen varianssin otosjakaumaa koskevan tuloksen perusteella χ 2 -jakaumaa vapausastein (n 1): 2 χ χ 2 ( n 1) Todistus: ks. lukua Otokset ja otosjakaumat. TKK (c) Ilkka Mellin (2007) 66

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 3/5 Määrätään χ 2 2 -jakaumasta vapausastein (n 1) piste χ1 α /2siten, että 2 2 α Pr( χ χ1 α /2) = 2 2 ja piste χ α /2 siten, että 2 2 α Pr( χ χα /2) = 2 jolloin 2 2 2 Pr( χ1 α/2 χ χα/2) = 1 α TKK (c) Ilkka Mellin (2007) 67

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 4/5 Tarkastellaan epäyhtälöketjua 2 2 2 χ1 α/2 χ χα/2 Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan χ 2 lauseke, saadaan epäyhtälöketju χ ( n 1) s σ 2 2 2 1 α/2 χ 2 α/2 Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitävä epäyhtälöketju 2 2 ( n 1) s 2 ( n 1) s σ 2 2 χ α/2 χ1 α/2 TKK (c) Ilkka Mellin (2007) 68

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 5/5 Yhdistämällä saatu epäyhtälö siihen, että 2 2 2 Pr( χ1 α/2 χ χα/2) = 1 α saadaan vihdoin 2 2 ( n 1) s 2 ( n 1) s Pr σ = 1 α 2 2 χα/2 χ1 α/2 TKK (c) Ilkka Mellin (2007) 69

Normaalijakauman varianssin luottamusväli Luottamusvälin frekvenssitulkinta 1/2 Normaalijakauman varianssin σ 2 luottamusvälin 2 2 ( n 1) s ( n 1) s, 2 2 χα/2 χ 1 α/2 konstruktiosta seuraa, että 2 2 ( 1) 2 ( 1) Pr n s n s σ 1 α 2 2 χα/2 χ = 1 α/2 Siten konstruoitu luottamusväli peittää parametrin σ 2 todellisen arvon todennäköisyydellä (1 α) ja se ei peitä parametrin σ 2 todellista arvoa todennäköisyydellä α. TKK (c) Ilkka Mellin (2007) 70

Normaalijakauman varianssin luottamusväli Luottamusvälin frekvenssitulkinta 2/2 Normaalijakauman odotusarvon σ 2 luottamusvälille voidaan antaa seuraava frekvenssitulkinta: (i) Jos otantaa jakaumasta N(µ, σ 2 ) toistetaan, keskimäärin 100 (1 α) % otoksista konstruoiduista luottamusväleistä peittää parametrin σ 2 todellisen arvon. (ii) Jos otantaa jakaumasta N(µ, σ 2 ) toistetaan, keskimäärin 100 α % otoksista konstruoiduista luottamusväleistä ei peitä parametrin σ 2 todellista arvoa. TKK (c) Ilkka Mellin (2007) 71

Normaalijakauman varianssin luottamusväli Luottamusvälin ominaisuudet 1/2 Normaalijakauman varianssin σ 2 luottamusvälin pituus 2 1 1 ( n 1) s 2 2 χ1 α/2 χ α/2 vaihtelee otoksesta toiseen. Luottamusvälin pituus riippuu valitusta luottamustasosta (1 α) ja otosvarianssista s 2 sekä (jonkin verran) havaintojen lukumäärästä n. TKK (c) Ilkka Mellin (2007) 72

Normaalijakauman varianssin luottamusväli Luottamusvälin ominaisuudet 2/2 Luottamusväli lyhenee (pitenee), jos luottamustasoa (1 α) pienennetään (kasvatetaan). Luottamusväli lyhenee (pitenee), jos otosvarianssi s 2 pienenee (kasvaa). Luottamusvälin pituus pysyy suunnilleen samana, jos havaintojen lukumäärää n muuttuu. TKK (c) Ilkka Mellin (2007) 73

Normaalijakauman varianssin luottamusväli Vaatimukset luottamusvälille Olisi toivottavaa pystyä konstruoimaan varianssiparametrille σ 2 mahdollisimman lyhyt luottamusväli, johon liittyvä luottamustaso olisi samanaikaisesti mahdollisimman korkea. Vaatimusten samanaikainen täyttäminen ei ole kuitenkaan mahdollista: (i) Luottamustason kasvattaminen pidentää luottamusväliä, jolloin tieto parametrin σ 2 todellisen arvon sijainnista tulee epätarkemmaksi. (ii) Luottamusvälin lyhentäminen pienentää luottamustasoa, jolloin tieto parametrin σ 2 todellisen arvon sijainnista tulee epävarmemmaksi. TKK (c) Ilkka Mellin (2007) 74

Normaalijakauman varianssin luottamusväli Johtopäätökset luottamusvälistä Tehdään johtopäätös, että konstruoitu luottamusväli peittää varianssiparametrin σ 2 todellisen arvon. (i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea 100 (1 α) %:ssa tapauksia. (ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä 100 α %:ssa tapauksia. Huomautus: Virheellisen johtopäätöksen mahdollisuutta ei saada häviämään, ellei luottamusväliä tehdä äärettömän leveäksi, jolloin väli ei enää sisällä informaatiota varianssiparametrin σ 2 todellisesta arvosta. TKK (c) Ilkka Mellin (2007) 75

Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli >> Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2007) 76

Bernoulli-jakauman odotusarvon luottamusväli Bernoulli-jakauma ja sen parametrointi 1/2 Olkoon A on kiinnostuksen kohteena oleva tapahtuma ja Pr(A) = p Pr(A c ) = 1 p = q Määritellään satunnaismuuttuja 1, jos A tapahtuu X = 0, jos A ei tapahdu Tällöin X noudattaa Bernoulli-jakaumaa parametrinaan p = Pr(A) = E(X) Merkitään: X Ber( p) TKK (c) Ilkka Mellin (2007) 77

Bernoulli-jakauman odotusarvon luottamusväli Bernoulli-jakauma ja sen parametrointi 2/2 Bernoulli-jakauman Ber(p) pistetodennäköisyysfunktio on f x p p q x x 1 x ( ; ) =, = 0,1 0< p < 1 q = 1 p TKK (c) Ilkka Mellin (2007) 78

Bernoulli-jakauman odotusarvon luottamusväli Otos Bernoulli-jakaumasta Olkoon X 1, X 2,, X n (yksinkertainen) satunnaisotos Bernoulli-jakaumasta Ber(p) Tällöin satunnaismuuttujat X 1, X 2,, X n ovat riippumattomia ja noudattavat samaa Bernoulli-jakaumaa Ber(p) TKK (c) Ilkka Mellin (2007) 79

Bernoulli-jakauman odotusarvon luottamusväli Bernoulli-jakauman odotusarvoparametrin estimointi 1/2 Estimoidaan Bernoulli-jakauman Ber(p) odotusarvoparametri p sen harhattomalla estimaattorilla: n 1 pˆ = X i n i = 1 TKK (c) Ilkka Mellin (2007) 80

Bernoulli-jakauman odotusarvon luottamusväli Bernoulli-jakauman odotusarvoparametrin estimointi 2/2 Koska niin X n i i= 1 1, jos A tapahtuu = 0, jos A ei tapahdu X i = f jossa f on tapahtuman A frekvenssi otoksessa. Siten Bernoulli-jakauman parametrin p estimaattori n 1 f pˆ = Xi = n i= 1 n on tapahtuman A suhteellinen frekvenssi otoksessa. TKK (c) Ilkka Mellin (2007) 81

Bernoulli-jakauman odotusarvon luottamusväli Luottamustaso Määrätään luottamusväli Bernoulli-jakauman odotusarvoparametrille p. Valitaan luottamustasoksi 1 α Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää Bernoulli-jakauman parametrin p todellisen arvon. TKK (c) Ilkka Mellin (2007) 82

Bernoulli-jakauman odotusarvon luottamusväli Luottamuskertoimet Olkoon valittu luottamustaso (1 α). Määrätään luottamuskertoimet z α/2 ja +z α/2 siten, että α Pr( z zα /2) = 2 α Pr( z + zα /2) = 2 jossa satunnaismuuttuja z noudattaa standardoitua normaalijakaumaa: z N(0,1) Luottamuskertoimet z α/2 ja +z α/2 toteuttavat ehdon Pr( z z + z ) = 1 α/2 α/2 α TKK (c) Ilkka Mellin (2007) 83

Bernoulli-jakauman odotusarvon luottamusväli Luottamuskertoimien määrääminen: Havainnollistus Luottamuskertoimet z α/2 ja +z α/2 jakavat normaalijakauman tiheysfunktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeen osaan: (1) Pisteen z α/2 vasemmalle puolelle jää α/2 % massasta. (2) Pisteen +z α/2 oikealle puolelle jää α/2 % massasta. (3) Pisteiden z α/2 ja +z α/2 väliin jää (1 α) % massasta. Huomaa, että α/2 + α/2 + (1 α) = 1 0.5 0.4 0.3 0.2 0.1 0 N(0,1)-jakauman tiheysfunktio α/2 1 α α/2 z α/2 0 +z α/2 TKK (c) Ilkka Mellin (2007) 84

Bernoulli-jakauman odotusarvon luottamusväli Luottamusväli Bernoulli-jakauman odotusarvolle Bernoulli-jakauman odotusarvoparametrin p approksimatiivinen luottamusväli luottamustasolla (1 α) on muotoa ˆ (1 ˆ ) ˆ (1 ˆ ) ˆ p p /2, ˆ p p p zα p+ zα/2 n n jossa ˆp = parametrin p harhaton estimaattori n = havaintojen lukumäärä z α/2, +z α/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet normaalijakaumasta N(0,1) TKK (c) Ilkka Mellin (2007) 85

Bernoulli-jakauman odotusarvon luottamusväli Luottamusväli ja sen pituus 1/2 Bernoulli-jakauman odotusarvoparametrin p approksimatiivinen luottamusväli luottamustasolla (1 α) esitetään usein muodossa pˆ(1 pˆ) pˆ ± zα /2 n koska väli on symmetrinen keskipisteensä ˆp suhteen. Bernoulli-jakauman parametrin p approksimatiivisen luottamusvälin pituus on 2 z α /2 pˆ(1 pˆ) n TKK (c) Ilkka Mellin (2007) 86

Bernoulli-jakauman odotusarvon luottamusväli Luottamusväli ja sen pituus 2/2 Bernoulli-jakauman odotusarvoparametrin p approksimatiivinen luottamusväli luottamustasolla (1 α): ˆp z α /2 pˆ(1 pˆ) n z α /2 pˆ(1 pˆ) n TKK (c) Ilkka Mellin (2007) 87

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 1/5 Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos Bernoulli-jakaumasta Ber(p) Olkoon n 1 pˆ = Xi n i = 1 harhaton estimaattori parametrille p. Huomaa, että ˆp on havaintojen X 1, X 2,, X n aritmeettinen keskiarvo. TKK (c) Ilkka Mellin (2007) 88

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 2/5 Määritellään satunnaismuuttuja pˆ p z = pˆ(1 pˆ) n Satunnaismuuttuja z noudattaa Bernoulli-jakautuneen otoksen suhteellisen osuuden otosjakaumaa koskevan tuloksen perusteella suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0,1) : z a N(0,1) Ks. monisteen Todennäköisyyslaskenta lukua Stokastiikan konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2007) 89

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 3/5 Määrätään normaalijakaumasta N(0,1) piste +z α/2 siten, että α Pr( z + z α /2) = 2 jolloin (normaalijakauman symmetrian perusteella) α Pr( z z α /2) = 2 ja edelleen Pr( z z + z ) = 1 α/2 α/2 α TKK (c) Ilkka Mellin (2007) 90

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 4/5 Tarkastellaan epäyhtälöketjua zα/2 z + zα/2 Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan z lauseke, saadaan epäyhtälöketju pˆ p zα/2 + zα/2 pˆ(1 pˆ) n Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitävä epäyhtälöketju pˆ(1 pˆ) pˆ(1 pˆ) pˆ z ˆ α/2 p p+ zα/2 n n TKK (c) Ilkka Mellin (2007) 91

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 5/5 Yhdistämällä saatu epäyhtälö siihen, että Pr( z z + z ) = 1 α/2 α/2 a α saadaan vihdoin pˆ(1 pˆ) pˆ(1 pˆ) Pr pˆ z ˆ /2 p p+ z /2 = a 1 n n α α α TKK (c) Ilkka Mellin (2007) 92

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin frekvenssitulkinta 1/2 Bernoulli-jakauman parametrin p luottamusvälin ˆ (1 ˆ ) ˆ (1 ˆ ) ˆ p p /2, ˆ p p p zα p+ zα/2 n n konstruktiosta seuraa, että p ˆ (1 p ˆ ) p ˆ (1 p ˆ ) Pr pˆ z /2 p pˆ + z /2 = a 1 n n Siten konstruoitu luottamusväli peittää parametrin p todellisen arvon approksimatiivisesti todennäköisyydellä (1 α) ja se ei peitä parametrin p todellista arvoa approksimatiivisesti todennäköisyydellä α. α α α TKK (c) Ilkka Mellin (2007) 93

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin frekvenssitulkinta 2/2 Bernoulli-jakauman parametrin p approksimatiiviselle luottamusvälille voidaan antaa seuraava frekvenssitulkinta: (i) Jos otantaa jakaumasta Ber(p) toistetaan, keskimäärin 100 (1 α) % otoksista konstruoiduista luottamusväleistä peittää parametrin p todellisen arvon. (ii) Jos otantaa jakaumasta Ber(p) toistetaan, keskimäärin 100 α % otoksista konstruoiduista luottamusväleistä ei peitä parametrin p todellista arvoa. TKK (c) Ilkka Mellin (2007) 94

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin ominaisuudet 1/2 Bernoulli-jakauman parametrin p luottamusvälin keskipiste ˆp vaihtelee otoksesta toiseen. Luottamusvälin pituus pˆ(1 pˆ) 2 zα /2 n vaihtelee otoksesta toiseen. Luottamusvälin pituus riippuu valitusta luottamustasosta (1 α), havaintojen lukumäärästä n ja estimaattorista ˆp. TKK (c) Ilkka Mellin (2007) 95

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin ominaisuudet 2/2 Luottamusväli lyhenee (pitenee), jos luottamustasoa (1 α) pienennetään (kasvatetaan). Luottamusväli lyhenee (pitenee), jos havaintojen lukumäärää n kasvatetaan (pienennetään). Luottamusväli on lyhimmillään, kun pˆ 0 tai pˆ 1 Luottamusväli on pisimmillään, kun 1 p ˆ = 2 TKK (c) Ilkka Mellin (2007) 96

Bernoulli-jakauman odotusarvon luottamusväli Vaatimukset luottamusvälille Olisi toivottavaa pystyä konstruoimaan parametrille p mahdollisimman lyhyt luottamusväli, johon liittyvä luottamustaso olisi samanaikaisesti mahdollisimman korkea. Vaatimusten samanaikainen täyttäminen ei ole kuitenkaan mahdollista, jos otoskoko pidetään kiinteänä: (i) Luottamustason kasvattaminen pidentää luottamusväliä, jolloin tieto parametrin p todellisen arvon sijainnista tulee epätarkemmaksi. (ii) Luottamusvälin lyhentäminen pienentää luottamustasoa, jolloin tieto parametrin p todellisen arvon sijainnista tulee epävarmemmaksi. TKK (c) Ilkka Mellin (2007) 97

Bernoulli-jakauman odotusarvon luottamusväli Johtopäätökset luottamusvälistä Tehdään johtopäätös, että konstruoitu luottamusväli peittää odotusarvoparametrin p todellisen arvon: (i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea 100 (1 α) %:ssa tapauksia. (ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä 100 α %:ssa tapauksia. Huomautus: Virheellisen johtopäätöksen mahdollisuutta ei saada häviämään, ellei luottamusväliä tehdä äärettömän leveäksi, jolloin väli ei enää sisällä informaatiota odotusarvoparametrin p todellisesta arvosta. TKK (c) Ilkka Mellin (2007) 98

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 1/5 Monissa tutkimustilanteissa toivotaan, että parametrille voitaisiin muodostaa mahdollisimman lyhyt luottamusväli. Bernoulli-jakauman odotusarvoparametrin p luottamusvälin pituus riippuu otoskoosta siten, että väli lyhenee, jos havaintojen havaintojen lukumäärää n kasvatetaan. Tämä odotusarvoparametrin p luottamusvälin ominaisuus mahdollistaa tietyin ehdoin otoskoon valinnan niin, että luottamusvälistä tulee (suurin piirtein) toivotun mittainen. Oletetaan siis, että Bernoulli-jakauman odotusarvoparametrille p halutaan konstruoida luottamusväli, jonka toivottu pituus on 2A TKK (c) Ilkka Mellin (2007) 99

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 2/5 Bernoulli-jakauma odotusarvoparametrin p luottamusväli luottamustasolla (1 α) on muotoa pˆ(1 pˆ) pˆ ± zα /2 n jossa ˆp = parametrin p harhaton estimaattori n = havaintojen lukumäärä z α/2, +z α/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet normaalijakaumasta N(0,1) TKK (c) Ilkka Mellin (2007) 100

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 3/5 Jos siis käytettävissä on ennakkotietoa parametrista p, voidaan otoskoko n ratkaista yhtälöstä: z α /2 p(1 p) = n A jossa z α/2 = luottamustasoon (1 α) liittyvä luottamuskerroin normaalijakaumasta N(0,1) p = odotusarvon oletettu arvo n = otoskoko 2A = toivottu pituus luottamusvälille TKK (c) Ilkka Mellin (2007) 101

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 4/5 Siten tarvittava otoskoko on zα /2 p(1 p) n = A Huomaa, että tarvittava otoskoko saavuttaa maksiminsa n kun 2 zα /2 = 2A p =1 2 2 TKK (c) Ilkka Mellin (2007) 102

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 5/5 Huomautus: Tarvittavan otoskoon kaavasta nähdään, että mitä lyhyempää luottamusväliä toivotaan, sitä suurempi otos on poimittava: Jos esimerkiksi luottamusvälin pituus halutaan puolittaa, pitää havaintoja kerätä 4 kertaa enemmän. TKK (c) Ilkka Mellin (2007) 103