Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Samankaltaiset tiedostot
Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Osa 2: Otokset, otosjakaumat ja estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Estimointi. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Väliestimointi (jatkoa) Heliövaara 1

Testit laatueroasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

9. laskuharjoituskierros, vko 12-13, ratkaisut

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Sovellettu todennäköisyyslaskenta B

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Testejä suhdeasteikollisille muuttujille

Tilastollinen aineisto Luottamusväli

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Harjoitus 2: Matlab - Statistical Toolbox

Normaalijakaumasta johdettuja jakaumia

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Teema 8: Parametrien estimointi ja luottamusvälit

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Sovellettu todennäköisyyslaskenta B

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Moniulotteisia todennäköisyysjakaumia

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Sovellettu todennäköisyyslaskenta B

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testit järjestysasteikollisille muuttujille

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

805306A Johdatus monimuuttujamenetelmiin, 5 op

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Mat Tilastollisen analyysin perusteet, kevät 2007

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisten aineistojen kuvaaminen

riippumattomia ja noudattavat samaa jakaumaa.

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

dx=5&uilang=fi&lang=fi&lvv=2014

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Harjoitus 7: NCSS - Tilastollinen analyysi

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Luottamusvälit. Normaalijakauma johnkin kohtaan

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

031021P Tilastomatematiikka (5 op) viikko 4

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Regressioanalyysi. Kuusinen/Heliövaara 1

Parametrin estimointi ja bootstrap-otanta

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Todennäköisyyden ominaisuuksia

3.6 Su-estimaattorien asymptotiikka

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Transkriptio:

Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1

Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2005) 2

Väliestimointi: Mitä opimme? 1/3 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista tai mekanismeista, jotka generoivat reaalimaailman ilmiöitä koskevia havaintoja. Tavoitteeseen pyritään rakentamalla havainnot generoineille prosesseille tai mekanismeille tilastollisia malleja. Koska tilastollisten tutkimusasetelmien havaintoihin liittyy aina satunnaisuutta tai epävarmuutta, tilastollisina malleina käytetään todennäköisyysmalleja. Tilastollinen malli havainnot generoineelle prosessille tai mekanismille on täysin määrätty, jos havaintojen todennäköisyysjakauma tunnetaan. TKK (c) Ilkka Mellin (2005) 3

Väliestimointi: Mitä opimme? 2/3 Tilastollisena mallina käytettävän todennäköisyysjakauman parametreja ei sovellustilanteessa yleensä tunneta. Jakauman parametreille on löydettävä estimaatit eli arviot, jotta jakaumaa voisi hyödyntää mallina. Tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida mallina käytettävän todennäköisyysjakauman tuntemattomat parametrit ilmiötä koskevista havainnoista. Havaintojen funktiota, joka tuottaa ilmiötä koskeviin havaintoihin sovellettuna estimaatteja eli arvioita todennäköisyysjakauman tuntemattomalle parametrille, kutsutaan parametrin estimaattoriksi. TKK (c) Ilkka Mellin (2005) 4

Väliestimointi: Mitä opimme? 3/3 Tilastotieteen tärkeimpiä osatehtäviä on johtaa estimaattoreita todennäköisyysjakauman parametreille. Estimaattoreiden johtamiseen käytetään tavallisesti joko suurimman uskottavuuden menetelmää tai momenttimenetelmää. Ks. lukua Estimointimenetelmät. Todennäköisyysjakauman tuntemattomien parametrien arvojen määräämistä kutsutaan usein piste-estimoinniksi erotukseksi väliestimoinnista, jossa parametreihin liitetään luottamusväleiksi kutsutut välit, joka sisältävät parametrien todelliset arvot soveltajan valittavissa olevilla todennäköisyyksillä. TKK (c) Ilkka Mellin (2005) 5

Väliestimointi: Esitiedot Esitiedot: ks. seuraavia lukuja: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Otos ja otosjakaumat Estimointi Estimointimenetelmät Tarvitset esitietoja myös seuraavista kalvokokoelman Johdatus todennäköisyyslaskentaan luvuista: Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut Diskreettejä jakaumia Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 6

Väliestimointi: Lisätiedot Todennäköisyysjakaumien parametreja koskevien tilastollisten hypoteesien testaamista käsitellään luvuissa Tilastolliset testit Testit suhdeasteikollisille muuttujille Jakaumaoletuksien testaamista käsitellään luvussa Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (2005) 7

Väliestimointi >> Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2005) 8

Parametrien estimointi Avainsanat Estimaatti Estimaattori Estimointi Havainto Havaintoarvo Parametri Otos Otosjakauma Parametri Piste-estimointi Tilastollinen aineisto Tilastollinen malli Todennäköisyysjakauma Väliestimointi TKK (c) Ilkka Mellin (2005) 9

Todennäköisyysjakaumien parametrien estimointi Todennäköisyysjakaumat tilastollisten aineistojen kuvaajina Tilastollinen aineisto koostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista. Tilastollisissa tutkimusasetelmissa havaintoihin liittyy aina epävarmuutta ja satunnaisuutta. Tilastollisissa tutkimusasetelmissa tutkimuksen kohteita kuvaavat muuttujat tulkitaan satunnaismuuttujiksi, jotka generoivat muuttujien havaitut arvot. Tilastollisella mallilla tarkoitetaan havaintoarvot generoineiden satunnaismuuttujien todennäköisyysjakaumaa. TKK (c) Ilkka Mellin (2005) 10

Todennäköisyysjakaumien parametrien estimointi Todennäköisyysjakaumien parametrit 1/2 Tarkastellaan jotakin tutkimuksen kaikkien mahdollisten kohteiden muodostaman perusjoukon S alkioiden ominaisuutta kuvaavaa satunnaismuuttujaa X. Oletetaan, että satunnaismuuttuja X noudattaa todennäköisyysjakaumaa, jonka pistetodennäköisyys-tai tiheysfunktio f(x ; θ) riippuu parametrista θ. Merkintä: X ~ f( x; θ ) TKK (c) Ilkka Mellin (2005) 11

Todennäköisyysjakaumien parametrien estimointi Todennäköisyysjakaumien parametrit 2/2 Satunnaismuuttujan X pistetodennäköisyys- tai tiheysfunktio f(x ; θ) kuvaa satunnaismuuttujan X todennäköisyysjakaumaa ja parametri θ kuvaa jotakin jakauman karakteristista ominaisuutta. Koska parametrin θ arvoa ei sovellustilanteessa yleensä tunneta, tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida tuntemattomalle parametrille θ sopiva arvo jakaumasta f(x ; θ) poimitun otoksen perusteella. TKK (c) Ilkka Mellin (2005) 12

Todennäköisyysjakaumien parametrien estimointi Yksinkertainen satunnaisotos Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos jakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio f(x ; θ) riippuu parametrista θ. Tällöin havainnot X 1, X 2,, X n ovat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys- tai tiheysfunktio f(x ; θ): X1, X2,, Xn X ~ f( x; θ ), i = 1,2,, n i TKK (c) Ilkka Mellin (2005) 13

Todennäköisyysjakaumien parametrien estimointi Havainnot ja havaintoarvot Oletetaan, että satunnaismuuttujat (havainnot) X 1, X 2,, X n saavat poimitussa otoksessa havaituiksi arvoikseen luvut x 1, x 2,, x n Havaintoarvot x 1, x 2,, x n vaihtelevat satunnaisesti otoksesta toiseen jakaumasta f(x ; θ) saatavin todennäköisyyksin. TKK (c) Ilkka Mellin (2005) 14

Todennäköisyysjakaumien parametrien estimointi Estimaattorit ja estimaatit 1/2 Oletetaan, että todennäköisyysjakauman f(x ; θ) parametrin θ estimoimiseen käytetään satunnaismuuttujien X 1, X 2,, X n funktiota eli tunnuslukua T = g(x 1, X 2,, X n ) Tällöin funktiota T = g(x 1, X 2,, X n ) kutsutaan parametrin θ estimaattoriksi ja havaintoarvoista x 1, x 2,, x n laskettua funktion g arvoa t = g(x 1, x 2,, x n ) kutsutaan parametrin θ estimaatiksi. TKK (c) Ilkka Mellin (2005) 15

Todennäköisyysjakaumien parametrien estimointi Estimaattorit ja estimaatit 2/2 Olkoon T = g(x 1, X 2,, X n ) jakauman f(x ; θ) parametrin θ estimaattori. Tällöin estimaattorin T havaintoarvoista x 1, x 2,, x n laskettu arvo eli estimaatti t = g(x 1, x 2,, x n ) on satunnaismuuttujan T arvon realisaatio otoksessa. TKK (c) Ilkka Mellin (2005) 16

Todennäköisyysjakaumien parametrien estimointi Estimaattoreiden johtaminen Hyvien estimaattoreiden johtaminen todennäköisyysjakaumien tuntemattomille parametreille on teoreettisen tilastotieteen keskeisiä ongelmia. Tärkeimmät estimaattoreiden johtamiseen käytettävät menetelmät: Momenttimenetelmä Suurimman uskottavuuden menetelmä Ks. lukua Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 17

Todennäköisyysjakaumien parametrien estimointi Piste-estimointi ja väliestimointi Todennäköisyysjakauman parametrin arvon estimointia kutsutaan usein piste-estimoinniksi. Parametrin estimaattiin on aina syytä liittää luottamusväliksi kutsuttu väli, joka sisältää estimoidun parametrin todellisen, mutta tuntemattoman arvon tietyllä, soveltajan valittavissa olevalla todennäköisyydellä. Luottamusvälin määräämistä kutsutaan väliestimoinniksi. TKK (c) Ilkka Mellin (2005) 18

Väliestimointi Todennäköisyysjakaumien parametrien estimointi >> Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2005) 19

Luottamusväli Avainsanat Estimaattori Estimointi Frekvenssitulkinta Luottamuskerroin Luottamustaso Luottamusväli TKK (c) Ilkka Mellin (2005) 20

Luottamusväli Luottamusväli ja luottamustaso Väliestimoinnissa todennäköisyysjakauman f(x ; θ) tuntemattomalle parametrille θ pyritään määräämään havainnoista riippuva väli, joka tietyllä, tutkijan valittavissa olevalla todennäköisyydellä, peittää parametrin todellisen arvon. Konstruoitua väliä kutsutaan luottamusväliksi ja valittua todennäköisyyttä kutsutaan luottamustasoksi. Huomautus: Luottamustasolle voidaan antaa tulkinta todennäköisyyden frekvenssitulkinnan avulla. TKK (c) Ilkka Mellin (2005) 21

Luottamusväli Luottamusvälin määrääminen 1/3 Oletukset: (i) Olkoon f(x ; θ) satunnaismuuttujan X todennäköisyysjakauma, jonka määrää tuntematon parametri θ. (ii) Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos jakaumasta f(x ; θ). (iii) Olkoon θˆ= θˆ( X1, X2,, X n) parametrin θ estimaattori. TKK (c) Ilkka Mellin (2005) 22

Luottamusväli Luottamusvälin määrääminen 2/3 Valitaan luottamustaso 1 α ja määrätään sen jälkeen satunnaismuuttujat L= L( X1, X2,, Xn ) U = U( X1, X2,, Xn) siten, että Pr( θˆ L θ) = α/ 2 Pr( θˆ + U θ) = α/ 2 Huomautus: Satunnaismuuttujat L ja U riippuvat sekä havainnoista X 1, X 2,, X n että valitusta luottamustasosta (1 α). TKK (c) Ilkka Mellin (2005) 23

Luottamusväli Luottamusvälin määrääminen 3/3 Tällöin väli ( θˆ L, θˆ+ U) on parametrin θ luottamusväli luottamustasolla (1 α). Luottamusvälin konstruktiosta seuraa, että väli ( θˆ L, θˆ+ U) peittää tuntemattoman parametrin θ todellisen arvon todennäköisyydellä (1 α): Pr( θˆ L θ θˆ+ U) = 1 α TKK (c) Ilkka Mellin (2005) 24

Luottamusväli Luottamusvälin määrääminen: Erikoistapaus Jos estimaattorin θˆ jakauma on symmetrinen, parametrin θ luottamusväli luottamustasolla (1 α) on muotoa θ ˆ ± A jossa satunnaismuuttuja A= A( X1, X2,, X n ) valitaan siten, että Pr( θˆ A θ θˆ+ A) = 1 α Huomautus: Satunnaismuuttuja A riippuu sekä havainnoista X 1, X 2,, X n että valitusta luottamustasosta (1 α). TKK (c) Ilkka Mellin (2005) 25

Luottamusväli Luottamustason ja -välin frekvenssitulkinta Oletetaan, että luottamustasoksi on valittu (1 α). Luottamustasolle ja siihen liittyvälle luottamusvälille voidaan antaa seuraava frekvenssitulkinta: (i) Jos otantaa jakaumasta f(x ; θ) toistetaan, keskimäärin 100 (1 α) % otoksista konstruoiduista luottamusväleistä peittää parametrin θ todellisen arvon. (ii) Jos otantaa jakaumasta f(x ; θ) toistetaan, keskimäärin 100 α % otoksista konstruoiduista luottamusväleistä ei peitä parametrin θ todellista arvoa. TKK (c) Ilkka Mellin (2005) 26

Luottamusväli Johtopäätökset luottamisväleistä Oletetaan, että olemme tehneet johtopäätöksen, että konstruoitu luottamusväli peittää parametrin θ tuntemattoman todellisen arvon: (i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea 100 (1 α) %:ssa tapauksia. (ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä 100 α %:ssa tapauksia. Huomautus: Virheellisen johtopäätöksen mahdollisuutta ei saada häviämään, ellei luottamusväliä tehdä äärettömän leveäksi, jolloin väli ei enää sisällä informaatiota parametrin θ oikeasta arvosta. TKK (c) Ilkka Mellin (2005) 27

Luottamusväli Luottamusvälit: Esimerkkejä Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos jakaumasta f(x ; θ). Tarkastellaan seuraavien jakaumien parametrien luottamusvälejä (ks. kalvokokoelman Johdatus todennäköisyyslaskentaan lukuja Diskreettejä jakaumia ja Jatkuvia jakaumia): Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvoparametrin luottamusväli TKK (c) Ilkka Mellin (2005) 28

Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli >> Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2005) 29

Normaalijakauman odotusarvon luottamusväli Avainsanat Frekvenssitulkinta Luottamuskerroin Luottamustaso Luottamusväli Normaalijakauma Odotusarvo TKK (c) Ilkka Mellin (2005) 30

Normaalijakauman odotusarvon luottamusväli Esimerkki 1/4 Kone tekee ruuveja, joiden pituudet vaihtelevat satunnaisesti noudattaen normaalijakaumaa; ks. esimerkkiä luvussa Tilastollisten aineistojen kuvaaminen. Ruuvien joukosta poimitaan yksinkertainen satunnaisotos, jonka koko n = 30 ja otokseen poimittujen ruuvien pituudet mitataan. Taulukko oikealla esittää pituuksien luokiteltua frekvenssijakaumaa. Luokkavälit Luokkafrekvenssit (9.85,9.90] 1 (9.90,9.95] 2 (9.95,10.00] 6 (10.00,10.05] 3 (10.05,10.10] 5 (10.10,10.15] 4 (10.15,10.20] 5 (10.20,10.25] 3 (10.25,10.30] 1 TKK (c) Ilkka Mellin (2005) 31

Normaalijakauman odotusarvon luottamusväli Esimerkki 2/4 Kuva oikealla esittää otokseen poimittujen ruuvien pituuksien luokiteltua frekvenssijakaumaa vastaavaa histogrammia. 7 6 Ruuvien pituuksien luokiteltu frekvenssijakauma Luokkavälit määräävät histogrammin suorakaiteiden kannat. Suorakaiteiden korkeudet on valittu niin, että suorakaiteiden pinta-alat suhtautuvat toisiinsa kuten vastaavat luokkafrekvenssit. Frekvenssi 5 4 3 2 1 0 9.8 9.9 10.0 10.1 10.2 10.3 10.4 Pituus (cm) TKK (c) Ilkka Mellin (2005) 32

Normaalijakauman odotusarvon luottamusväli Esimerkki 3/4 Yhteenveto otostiedoista: Pituuksien aritmeettinen keskiarvo: 7 Ruuvien pituuksien luokiteltu frekvenssijakauma X =10.09 cm 6 Pituuksien keskihajonta: s = 0.1038 cm Huomautus: Jos otantaa toistetaan, kaikki otosta koskevat tiedot (sekä havaintoarvot että niistä lasketut otossuureet) vaihtelevat satunnaisesti otoksesta toiseen. Frekvenssi 5 4 3 2 1 0 9.8 9.9 10.0 10.1 10.2 10.3 10.4 Pituus (cm) TKK (c) Ilkka Mellin (2005) 33

Normaalijakauman odotusarvon luottamusväli Esimerkki 4/4 Ongelma: Mitä koneen tekemien ruuvien todellisesta keskipituudesta voidaan tietää yhdestä otoksesta saatujen tietojen perusteella? Ratkaisu: Konstruoidaan väli, joka valitulla todennäköisyydellä sisältää ruuvien todellisen keskipituuden. Frekvenssi 7 6 5 4 3 2 1 0 Ruuvien pituuksien luokiteltu frekvenssijakauma 9.8 9.9 10.0 10.1 10.2 10.3 10.4 Pituus (cm) TKK (c) Ilkka Mellin (2005) 34

Normaalijakauman odotusarvon luottamusväli Normaalijakauma ja sen parametrointi Satunnaismuuttuja X noudattaa normaalijakaumaa N(µ, σ 2 ), jos sen tiheysfunktio on 2 2 1 1 x µ f( x; µσ, ) = exp σ 2π 2 σ < µ < +, σ > 0 Normaalijakauman parametreina ovat jakauman odotusarvo E( X ) = µ ja varianssi 2 Var( X ) = σ TKK (c) Ilkka Mellin (2005) 35

Normaalijakauman odotusarvon luottamusväli Otos normaalijakaumasta Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) Tällöin satunnaismuuttujat X 1, X 2,, X n ovat riippumattomia ja noudattavat samaa normaalijakaumaa N(µ, σ 2 ) TKK (c) Ilkka Mellin (2005) 36

Normaalijakauman odotusarvon luottamusväli Normaalijakauman parametrien estimointi Estimoidaan normaalijakauman N(µ, σ 2 ) parametrit µ ja σ 2 niiden harhattomilla estimaattoreilla: (i) Odotusarvoparametrin µ harhaton estimaattori: X 1 n X i n i = 1 = (ii) Varianssiparametrin σ 2 harhaton estimaattori: n 2 1 2 s = ( Xi X) 1 n i= 1 TKK (c) Ilkka Mellin (2005) 37

Normaalijakauman odotusarvon luottamusväli Luottamustaso Määrätään luottamusväli normaalijakauman odotusarvoparametrille µ. Valitaan luottamustasoksi 1 α Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää normaalijakauman odotusarvon µ todellisen arvon. TKK (c) Ilkka Mellin (2005) 38

Normaalijakauman odotusarvon luottamusväli Luottamuskertoimet Olkoon valittu luottamustaso (1 α). Määrätään luottamuskertoimet t α/2 ja +t α/2 siten, että α Pr( t tα /2) = 2 α Pr( t + tα /2) = 2 jossa satunnaismuuttuja t noudattaa Studentin t-jakaumaa vapausastein (n 1): t t( n 1) Luottamuskertoimet t α/2 ja +t α/2 toteuttavat ehdon Pr( t t + t ) = 1 α/2 α/2 α TKK (c) Ilkka Mellin (2005) 39

Normaalijakauman odotusarvon luottamusväli Luottamuskertoimien määrääminen: Havainnollistus Luottamuskertoimet t α/2 ja +t α/2 jakavat t-jakauman tiheysfunktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeen osaan: (1) Pisteen t α/2 vasemmalle puolelle jää α/2 % massasta. (2) Pisteen +t α/2 oikealle puolelle jää α/2 % massasta. (3) Pisteiden t α/2 ja +t α/2 väliin jää (1 α) % massasta. Huomaa, että α/2 + α/2 + (1 α) = 1 t-jakauman tiheysfunktio α/2 1 α α/2 t α/2 0 +t α/2 TKK (c) Ilkka Mellin (2005) 40

Normaalijakauman odotusarvon luottamusväli Luottamusväli normaalijakauman odotusarvolle Normaalijakauman odotusarvoparametrin µ luottamusväli luottamustasolla (1 α) on muotoa s s X tα/2, X + tα/2 n n jossa X = havaintojen aritmeettinen keskiarvo s 2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä t α/2, +t α/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet t-jakaumasta vapausastein (n 1) TKK (c) Ilkka Mellin (2005) 41

Normaalijakauman odotusarvon luottamusväli Luottamusväli ja sen pituus 1/2 Normaalijakauman odotusarvon µ luottamusväli luottamustasolla (1 α) esitetään usein muodossa s X ± tα /2 n koska väli on symmetrinen keskipisteensä X suhteen. Normaalijakauman odotusarvon µ luottamusvälin pituus on 2 t α /2 s n TKK (c) Ilkka Mellin (2005) 42

Normaalijakauman odotusarvon luottamusväli Luottamusväli ja sen pituus 2/2 Normaalijakauman odotusarvon µ luottamusväli luottamustasolla (1 α): X t α /2 s n t α /2 s n TKK (c) Ilkka Mellin (2005) 43

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 1/8 Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) Olkoon X 1 n X i n i = 1 = havaintojen X 1, X 2,, X n aritmeettinen keskiarvo ja n 2 1 2 s = ( Xi X) n 1 i= 1 havaintojen X 1, X 2,, X n (harhaton) otosvarianssi. TKK (c) Ilkka Mellin (2005) 44

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 2/8 Määritellään satunnaismuuttuja X µ t = s n Satunnaismuuttuja t voidaan kirjoittaa muotoon X µ X µ X µ σ σ n t = = = 2 2 2 s n σ n s ( n 1) s σ n 1 Määrätään satunnaismuuttujan t jakauma tarkastelemalla erikseen satunnaismuuttujan t osoittajaa ja nimittäjää. TKK (c) Ilkka Mellin (2005) 45

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 3/8 Satunnaismuuttujan t osoittaja määrittelee satunnaismuuttujan X µ Z = σ n Satunnaismuuttuja Z noudattaa normaalijakautuneen otoksen aritmeettisen keskiarvon otosjakaumaa koskevan tuloksen perusteella standardoitua normaalijakaumaa N(0,1): Z N(0,1) Todistus: ks. lukua Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 46

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 4/8 Satunnaismuuttuja t nimittäjä määrittelee satunnaismuuttujan 2 V = ( n 1) s 2 σ Satunnaismuuttuja V noudattaa normaalijakautuneen otoksen varianssin otosjakaumaa koskevan tuloksen perusteella χ 2 -jakaumaa vapausastein (n 1): V χ 2 ( n 1) Todistus: ks. lukua Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 47

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 5/8 Edellä on todettu, että Z N(0,1) 2 V χ ( n 1) Lisäksi voidaan osoittaa, että satunnaismuuttujat Z ja V ovat riippumattomia; todistus: ks. lukua Otos ja otosjakaumat. Siten satunnaismuuttuja X µ Z t = = s n V n 1 noudattaa Studentin t-jakaumaa vapausastein (n 1) suoraan jakauman määritelmän mukaan: t t( n 1) TKK (c) Ilkka Mellin (2005) 48

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 6/8 Määrätään t-jakaumasta vapausastein (n 1) piste +t α/2 siten, että α Pr( t + t α /2) = 2 jolloin (t-jakauman symmetrian perusteella) α Pr( t t α /2) = 2 ja edelleen Pr( t t + t ) = 1 α/2 α/2 α TKK (c) Ilkka Mellin (2005) 49

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 7/8 Tarkastellaan epäyhtälöketjua tα/2 t + tα/2 Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan t lauseke, saadaan epäyhtälöketju X µ tα/2 + tα/2 s n Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitävä epäyhtälöketju s X t µ X + t n α/2 α/2 s n TKK (c) Ilkka Mellin (2005) 50

Normaalijakauman odotusarvon luottamusväli Luottamusvälin johto 8/8 Yhdistämällä saatu epäyhtälö siihen, että Pr( t /2 t + t /2) = 1 saadaan vihdoin α α α s s Pr X tα/2 µ X + tα/2 = 1 α n n TKK (c) Ilkka Mellin (2005) 51

Normaalijakauman odotusarvon luottamusväli Luottamusvälin frekvenssitulkinta 1/2 Normaalijakauman odotusarvon µ luottamusvälin s X tα, X + tα n konstruktiosta seuraa, että /2 /2 s n Pr s s X tα/2 µ X + tα/2 = 1 α n n Siten konstruoitu luottamusväli peittää parametrin µ todellisen arvon todennäköisyydellä (1 α) ja se ei peitä parametrin µ todellista arvoa todennäköisyydellä α. TKK (c) Ilkka Mellin (2005) 52

Normaalijakauman odotusarvon luottamusväli Luottamusvälin frekvenssitulkinta 2/2 Normaalijakauman odotusarvon µ luottamusvälille voidaan antaa seuraava frekvenssitulkinta: (i) Jos otantaa jakaumasta N(µ, σ 2 ) toistetaan, keskimäärin 100 (1 α) % otoksista konstruoiduista luottamusväleistä peittää parametrin µ todellisen arvon. (ii) Jos otantaa jakaumasta N(µ, σ 2 ) toistetaan, keskimäärin 100 α % otoksista konstruoiduista luottamusväleistä ei peitä parametrin µ todellista arvoa. TKK (c) Ilkka Mellin (2005) 53

Normaalijakauman odotusarvon luottamusväli Luottamusvälin ominaisuudet 1/2 Normaalijakauman odotusarvon µ luottamusvälin keskipiste X vaihtelee otoksesta toiseen. Luottamusvälin pituus s 2 tα /2 n vaihtelee otoksesta toiseen. Luottamusvälin pituus riippuu valitusta luottamustasosta (1 α), havaintojen lukumäärästä n ja otosvarianssista s 2. TKK (c) Ilkka Mellin (2005) 54

Normaalijakauman odotusarvon luottamusväli Luottamusvälin ominaisuudet 2/2 Luottamusväli lyhenee (pitenee), jos luottamustasoa (1 α) pienennetään (kasvatetaan). Luottamusväli lyhenee (pitenee), jos havaintojen lukumäärää n kasvatetaan (pienennetään). Luottamusväli lyhenee (pitenee), jos otosvarianssi s 2 pienenee (kasvaa). TKK (c) Ilkka Mellin (2005) 55

Normaalijakauman odotusarvon luottamusväli Vaatimukset luottamusvälille Olisi toivottavaa pystyä konstruoimaan odotusarvolle µ mahdollisimman lyhyt luottamusväli, johon liittyvä luottamustaso olisi mahdollisimman korkea. Vaatimusten samanaikainen täyttäminen ei ole kuitenkaan mahdollista, jos otoskoko pidetään kiinteänä: (i) Luottamustason kasvattaminen pidentää luottamusväliä, jolloin tieto parametrin µ todellisen arvon sijainnista tulee epätarkemmaksi. (ii) Luottamusvälin lyhentäminen pienentää luottamustasoa, jolloin tieto parametrin µ todellisen arvon sijainnista tulee epävarmemmaksi. TKK (c) Ilkka Mellin (2005) 56

Normaalijakauman odotusarvon luottamusväli Johtopäätökset luottamusvälistä Oletetaan, että olemme tehneet johtopäätöksen, että konstruoitu luottamusväli peittää odotusarvoparametrin µ todellisen arvon: (i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea 100 (1 α) %:ssa tapauksia. (ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä 100 α %:ssa tapauksia. Huomautus: Virheellisen johtopäätöksen mahdollisuutta ei saada häviämään, ellei luottamusväliä tehdä äärettömän leveäksi, jolloin väli ei enää sisällä informaatiota odotusarvoparametrin µ todellisesta arvosta. TKK (c) Ilkka Mellin (2005) 57

Normaalijakauman odotusarvon luottamusväli Esimerkki (jatkuu) 1/4 Erään koneen tekemien ruuvien joukosta poimittiin yksinkertainen satunnaisotos ja ruuvien pituudet mitattiin. Otoskoko: n = 30 Pituuksien aritmeettinen keskiarvo: X =10.09 cm Pituuksien otoskeskihajonta: s = 0.1038 cm Konstruoidaan ruuvien todelliselle keskipituudelle µ luottamusväli luottamustasolla 0.95. Valitaan luottamuskertoimet t 0.025 ja +t 0.025 siten, että Pr( t t0.025) = Pr( t + t0.025) = 0.025 jossa satunnaismuuttuja t noudattaa Studentin t-jakaumaa vapausastein n 1 = 29. Luottamuskertoimet t 0.025 ja +t 0.025 toteuttavat ehdon Pr( t t + t ) = 0.95 0.025 0.025 TKK (c) Ilkka Mellin (2005) 58

Normaalijakauman odotusarvon luottamusväli Esimerkki (jatkuu) 2/4 t-jakauman taulukoista nähdään, että Pr(t +2.045) = 0.025 Pr(t 2.045) = 0.025 kun vapausasteiden lukumäärä n 1 = 29 Siten luottamuskertoimet ovat: +t 0.025 = +2.045 t 0.025 = 2.045 Kuvio oikealla havainnollistaa luottamuskertoimien valintaa. 0.5 0.4 0.3 0.2 0.1 0 t(29)-jakauman tiheysfunktio 0.025 0.95 0.025 2.045 0 +2.045 TKK (c) Ilkka Mellin (2005) 59

Normaalijakauman odotusarvon luottamusväli Esimerkki (jatkuu) 3/4 Luottamusväliksi saadaan: s 0.1038 X ± tα /2 = 10.09 ± 2.045 n 30 = 10.09 ± 0.04 = (10.05,10.13) Siten tiedämme, että ruuvien todellinen keskipituus on todennäköisyydellä 0.95 välillä (10.05, 10.13) TKK (c) Ilkka Mellin (2005) 60

Normaalijakauman odotusarvon luottamusväli Esimerkki (jatkuu) 4/4 Luottamustason 0.95 tulkinta: Oletetaan, että poimimme koneen tekemien ruuvien joukosta toistuvasti yksinkertaisia satunnaisotoksia, joiden koko on 30 ja konstruoimme jokaisesta otoksesta 95 %:n luottamusvälin edellä esitetyllä menetelmällä. Tällöin: (i) Konstruoidusta väleistä keskimäärin 95 % peittää ruuvien todellisen, mutta tuntemattoman keskipituuden. (ii) Konstruoidusta väleistä keskimäärin 5 % ei peitä ruuvien todellista, mutta tuntematonta keskipituutta. TKK (c) Ilkka Mellin (2005) 61

Normaalijakauman odotusarvon luottamusväli Otoskoon määrääminen 1/4 Monissa tutkimustilanteissa toivotaan, että parametrille voitaisiin muodostaa mahdollisimman lyhyt luottamusväli. Normaalijakauman odotusarvon µ luottamusvälin pituus riippuu otoskoosta siten, että väli lyhenee, jos havaintojen lukumäärää n kasvatetaan. Tämä normaalijakauman odotusarvon µ luottamusvälin ominaisuus mahdollistaa tietyin ehdoin otoskoon valitsemisen sellaisella tavalla, että luottamusväliksi saadaan (suunnilleen) halutun mittainen väli. Oletetaan siis, että normaalijakauman odotusarvoparametrille µ halutaan konstruoida luottamusväli, jonka toivottu pituus on 2A. TKK (c) Ilkka Mellin (2005) 62

Normaalijakauman odotusarvon luottamusväli Otoskoon määrääminen 2/4 Jos normaalijakauman varianssi σ 2 tunnetaan, normaalijakauman odotusarvoparametrin µ luottamusväliksi luottamustasolla (1 α) saadaan σ X ± zα /2 n jossa X = havaintojen aritmeettinen keskiarvo σ 2 = havaintojen oletettu varianssi n = otoskoko z α/2, +z α/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet normaalijakaumasta N(0,1) TKK (c) Ilkka Mellin (2005) 63

Normaalijakauman odotusarvon luottamusväli Otoskoon määrääminen 3/4 Jos siis käytettävissä on ennakkotietoa perusjoukon varianssista σ 2, voidaan otoskoko n ratkaista yhtälöstä: σ zα /2 = A n jossa z α/2 = luottamustasoon (1 α) liittyvä luottamuskerroin normaalijakaumasta N(0,1) σ 2 = havaintojen oletettu varianssi n = otoskoko 2A = toivottu pituus luottamusvälille TKK (c) Ilkka Mellin (2005) 64

Normaalijakauman odotusarvon luottamusväli Otoskoon määrääminen 4/4 Siten tarvittava otoskoko on 2 zα /2σ n = A Huomautus: Tarvittavan otoskoon kaavasta nähdään, että mitä lyhyempää luottamusväliä toivotaan, sitä suurempi otos on poimittava: Esimerkiksi, jos luottamusvälin pituus halutaan puolittaa, pitää havaintoja kerätä 4 kertaa enemmän. TKK (c) Ilkka Mellin (2005) 65

Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli >> Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2005) 66

Normaalijakauman varianssin luottamusväli Avainsanat Estimointi Frekvenssitulkinta Luottamuskerroin Luottamustaso Luottamusväli Normaalijakauma Odotusarvo Varianssi TKK (c) Ilkka Mellin (2005) 67

Normaalijakauman varianssin luottamusväli Normaalijakauma ja sen parametrointi Satunnaismuuttuja X noudattaa normaalijakaumaa N(µ, σ 2 ), jos sen tiheysfunktio on 2 2 1 1 x µ f( x; µσ, ) = exp σ 2π 2 σ < µ < +, σ > 0 Normaalijakauman parametreina ovat jakauman odotusarvo E( X ) = µ ja varianssi Var( X ) = σ 2 TKK (c) Ilkka Mellin (2005) 68

Normaalijakauman varianssin luottamusväli Otos normaalijakaumasta Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) Tällöin satunnaismuuttujat X 1, X 2,, X n ovat riippumattomia ja noudattavat samaa normaalijakaumaa N(µ, σ 2 ) TKK (c) Ilkka Mellin (2005) 69

Normaalijakauman varianssin luottamusväli Normaalijakauman parametrien estimointi Estimoidaan normaalijakauman N(µ, σ 2 ) parametrit µ ja σ 2 niiden harhattomilla estimaattoreilla: (i) Odotusarvoparametrin µ harhaton estimaattori: X 1 n X i n i = 1 = (ii) Varianssiparametrin σ 2 harhaton estimaattori: n 2 1 2 s = ( Xi X) 1 n i= 1 TKK (c) Ilkka Mellin (2005) 70

Normaalijakauman varianssin luottamusväli Luottamustaso Määrätään luottamusväli normaalijakauman varianssiparametrille σ 2. Valitaan luottamustasoksi 1 α Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää normaalijakauman varianssin σ 2 todellisen arvon. TKK (c) Ilkka Mellin (2005) 71

Normaalijakauman varianssin luottamusväli Luottamuskertoimet Olkoon valittu luottamustaso (1 α). 2 2 Määrätään luottamuskertoimet χ1 α /2 ja χ α /2 siten, että 2 2 α Pr( χ χ1 α /2) = 2 2 2 α Pr( χ χα /2) = 2 jossa satunnaismuuttuja χ 2 noudattaa χ 2 -jakaumaa vapausastein (n 1): 2 χ χ 2 ( n 1) 2 2 Luottamuskertoimet χ1 α /2 ja χ α /2 toteuttavat ehdon 2 2 2 Pr( χ1 α /2 χ χα/2) = 1 α TKK (c) Ilkka Mellin (2005) 72

Normaalijakauman varianssin luottamusväli Luottamuskertoimien määrääminen: Havainnollistus 2 Luottamuskertoimet χ ja jakavat χ 2 1 α /2 2 χ α /2 -jakauman tiheysfunktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeen osaan: 2 (1) Pisteen χ1 α /2vasemmalle puolelle jää α/2 % massasta. 2 (2) Pisteen χ α /2 oikealle puolelle jää α/2 % massasta. 2 2 (3) Pisteiden χ ja 1 α /2 χ α /2 väliin jää (1 α) % massasta. Huomaa, että α/2 + α/2 + (1 α)= 1 α/2 2 χ1 α /2 χ 2 -jakauman tiheysfunktio 1 α α/2 2 χ α /2 TKK (c) Ilkka Mellin (2005) 73

Normaalijakauman varianssin luottamusväli Luottamusväli normaalijakauman varianssille Normaalijakauman varianssiparametrin σ 2 luottamusväli luottamustasolla (1 α) on muotoa 2 2 ( n 1) s ( n 1) s, 2 2 χα/2 χ 1 α/2 jossa s 2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä 2 2 χ1 α/2, χα/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet χ 2 -jakaumasta vapausastein (n 1) TKK (c) Ilkka Mellin (2005) 74

Normaalijakauman varianssin luottamusväli Luottamusväli ja sen pituus Normaalijakauman varianssin σ 2 luottamusvälin pituus on 2 1 1 ( n 1) s 2 2 χ1 α/2 χ α/2 TKK (c) Ilkka Mellin (2005) 75

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 1/5 Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) Olkoon X 1 n X i n i = 1 = havaintojen X 1, X 2,, X n aritmeettinen keskiarvo ja n 2 1 2 s = ( Xi X) n 1 i= 1 havaintojen X 1, X 2,, X n (harhaton) otosvarianssi. TKK (c) Ilkka Mellin (2005) 76

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 2/5 Määritellään satunnaismuuttuja 2 2 ( n 1) s χ = 2 σ Satunnaismuuttuja χ 2 noudattaa normaalijakautuneen otoksen varianssin otosjakaumaa koskevan tuloksen perusteella χ 2 -jakaumaa vapausastein (n 1): 2 χ χ 2 ( n 1) Todistus: ks. lukua Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 77

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 3/5 Määrätään χ 2 2 -jakaumasta vapausastein (n 1) piste χ1 α /2siten, että 2 2 α Pr( χ χ1 α /2) = 2 2 ja piste χ α /2 siten, että 2 2 α Pr( χ χα /2) = 2 jolloin Pr( χ χ χ ) = 1 α 2 2 2 1 α/2 α/2 TKK (c) Ilkka Mellin (2005) 78

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 4/5 Tarkastellaan epäyhtälöketjua 2 2 2 χ1 α/2 χ χα/2 Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan χ 2 lauseke, saadaan epäyhtälöketju χ ( n 1) s σ 2 2 2 1 α/2 χ 2 α/2 Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitävä epäyhtälöketju 2 2 ( n 1) s 2 ( n 1) s σ 2 2 χ α/2 χ1 α/2 TKK (c) Ilkka Mellin (2005) 79

Normaalijakauman varianssin luottamusväli Luottamusvälin johto 5/5 Yhdistämällä saatu epäyhtälö siihen, että 2 2 2 Pr( χ1 α/2 χ χα/2) = 1 α saadaan vihdoin 2 2 ( 1) 2 ( 1) Pr n s σ n s = 1 α 2 2 χα/2 χ1 α/2 TKK (c) Ilkka Mellin (2005) 80

Normaalijakauman varianssin luottamusväli Luottamusvälin frekvenssitulkinta 1/2 Normaalijakauman varianssin σ 2 luottamusvälin 2 2 ( n 1) s ( n 1) s, 2 2 χα/2 χ 1 α/2 konstruktiosta seuraa, että 2 2 ( n 1) s 2 ( n 1) s Pr σ 1 α 2 2 χα/2 χ = 1 α/2 Siten konstruoitu luottamusväli peittää parametrin σ 2 todellisen arvon todennäköisyydellä (1 α) ja se ei peitä parametrin σ 2 todellista arvoa todennäköisyydellä α. TKK (c) Ilkka Mellin (2005) 81

Normaalijakauman varianssin luottamusväli Luottamusvälin frekvenssitulkinta 2/2 Normaalijakauman odotusarvon σ 2 luottamusvälille voidaan antaa seuraava frekvenssitulkinta: (i) Jos otantaa jakaumasta N(µ, σ 2 ) toistetaan, keskimäärin 100 (1 α) % otoksista konstruoiduista luottamusväleistä peittää parametrin σ 2 todellisen arvon. (ii) Jos otantaa jakaumasta N(µ, σ 2 ) toistetaan, keskimäärin 100 α % otoksista konstruoiduista luottamusväleistä ei peitä parametrin σ 2 todellista arvoa. TKK (c) Ilkka Mellin (2005) 82

Normaalijakauman varianssin luottamusväli Luottamusvälin ominaisuudet 1/2 Normaalijakauman varianssin σ 2 luottamusvälin pituus 2 1 1 ( n 1) s 2 2 χ1 α/2 χ α/2 vaihtelee otoksesta toiseen. Luottamusvälin pituus riippuu valitusta luottamustasosta (1 α) ja otosvarianssista s 2 sekä (jonkin verran) havaintojen lukumäärästä n. TKK (c) Ilkka Mellin (2005) 83

Normaalijakauman varianssin luottamusväli Luottamusvälin ominaisuudet 2/2 Luottamusväli lyhenee (pitenee), jos luottamustasoa (1 α) pienennetään (kasvatetaan). Luottamusväli lyhenee (pitenee), jos otosvarianssi s 2 pienenee (kasvaa). Luottamusvälin pituus pysyy suunnilleen samana, jos havaintojen lukumäärää n muuttuu. TKK (c) Ilkka Mellin (2005) 84

Normaalijakauman varianssin luottamusväli Vaatimukset luottamusvälille Olisi toivottavaa pystyä konstruoimaan varianssiparametrille σ 2 mahdollisimman lyhyt luottamusväli, johon liittyvä luottamustaso olisi samanaikaisesti mahdollisimman korkea. Vaatimusten samanaikainen täyttäminen ei ole kuitenkaan mahdollista: (i) Luottamustason kasvattaminen pidentää luottamusväliä, jolloin tieto parametrin σ 2 todellisen arvon sijainnista tulee epätarkemmaksi. (ii) Luottamusvälin lyhentäminen pienentää luottamustasoa, jolloin tieto parametrin σ 2 todellisen arvon sijainnista tulee epävarmemmaksi. TKK (c) Ilkka Mellin (2005) 85

Normaalijakauman varianssin luottamusväli Johtopäätökset luottamusvälistä Oletetaan, että olemme tehneet johtopäätöksen, että konstruoitu luottamusväli peittää varianssiparametrin σ 2 todellisen arvon: (i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea 100 (1 α) %:ssa tapauksia. (ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä 100 α %:ssa tapauksia. Huomautus: Virheellisen johtopäätöksen mahdollisuutta ei saada häviämään, ellei luottamusväliä tehdä äärettömän leveäksi, jolloin väli ei enää sisällä informaatiota varianssiparametrin σ 2 todellisesta arvosta. TKK (c) Ilkka Mellin (2005) 86

Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli >> Bernoulli-jakauman odotusarvon luottamusväli TKK (c) Ilkka Mellin (2005) 87

Bernoulli-jakauman odotusarvon luottamusväli Avainsanat Bernoulli-jakauma Estimointi Frekvenssitulkinta Keskeinen raja-arvolause Luottamuskerroin Luottamustaso Luottamusväli Normaalijakauma Odotusarvo Todennäköisyysparametri TKK (c) Ilkka Mellin (2005) 88

Bernoulli-jakauman odotusarvon luottamusväli Bernoulli-jakauma ja sen parametrointi 1/2 Olkoon A on kiinnostuksen kohteena oleva tapahtuma ja Pr(A) = p Pr(A c ) = 1 p = q Määritellään satunnaismuuttuja 1, jos A tapahtuu X = 0, jos A ei tapahdu Tällöin X noudattaa Bernoulli-jakaumaa parametrinaan p = Pr(A) = E(X) Merkitään: X Ber( p) TKK (c) Ilkka Mellin (2005) 89

Bernoulli-jakauman odotusarvon luottamusväli Bernoulli-jakauma ja sen parametrointi 2/2 Bernoulli-jakauman Ber(p) pistetodennäköisyysfunktio on f x p p q x x 1 x ( ; ) =, = 0,1 0< p < 1 q = 1 p TKK (c) Ilkka Mellin (2005) 90

Bernoulli-jakauman odotusarvon luottamusväli Otos Bernoulli-jakaumasta Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos Bernoulli-jakaumasta Ber(p) Tällöin satunnaismuuttujat X 1, X 2,, X n ovat riippumattomia ja noudattavat samaa Bernoulli-jakaumaa Ber(p) TKK (c) Ilkka Mellin (2005) 91

Bernoulli-jakauman odotusarvon luottamusväli Bernoulli-jakauman odotusarvoparametrin estimointi 1/2 Estimoidaan Bernoulli-jakauman Ber(p) odotusarvoparametri p sen harhattomalla estimaattorilla: n 1 pˆ = X i n i = 1 TKK (c) Ilkka Mellin (2005) 92

Bernoulli-jakauman odotusarvon luottamusväli Bernoulli-jakauman odotusarvoparametrin estimointi 2/2 Koska niin X n i i= 1 1, jos A tapahtuu = 0, jos A ei tapahdu X i = f jossa f on tapahtuman A frekvenssi otoksessa. Siten Bernoulli-jakauman parametrin p estimaattori n 1 f pˆ = Xi = n i= 1 n on tapahtuman A suhteellinen frekvenssi otoksessa. TKK (c) Ilkka Mellin (2005) 93

Bernoulli-jakauman odotusarvon luottamusväli Luottamustaso Määrätään luottamusväli Bernoulli-jakauman odotusarvoparametrille p. Valitaan luottamustasoksi 1 α Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää Bernoulli-jakauman parametrin p todellisen arvon. TKK (c) Ilkka Mellin (2005) 94

Bernoulli-jakauman odotusarvon luottamusväli Luottamuskertoimet Olkoon valittu luottamustaso (1 α). Määrätään luottamuskertoimet z α/2 ja +z α/2 siten, että α Pr( z zα /2) = 2 α Pr( z + zα /2) = 2 jossa satunnaismuuttuja z noudattaa standardoitua normaalijakaumaa: z N(0,1) Luottamuskertoimet z α/2 ja +z α/2 toteuttavat ehdon Pr( z z + z ) = 1 α/2 α/2 α TKK (c) Ilkka Mellin (2005) 95

Bernoulli-jakauman odotusarvon luottamusväli Luottamuskertoimien määrääminen: Havainnollistus Luottamuskertoimet z α/2 ja +z α/2 jakavat normaalijakauman tiheysfunktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeen osaan: (1) Pisteen z α/2 vasemmalle puolelle jää α/2 % massasta. (2) Pisteen +z α/2 oikealle puolelle jää α/2 % massasta. (3) Pisteiden z α/2 ja +z α/2 väliin jää (1 α) % massasta. Huomaa, että α/2 + α/2 + (1 α) = 1 0.5 0.4 0.3 0.2 0.1 0 N(0,1)-jakauman tiheysfunktio α/2 1 α α/2 z α/2 0 +z α/2 TKK (c) Ilkka Mellin (2005) 96

Bernoulli-jakauman odotusarvon luottamusväli Luottamusväli Bernoulli-jakauman odotusarvolle Bernoulli-jakauman odotusarvoparametrin p approksimatiivinen luottamusväli luottamustasolla (1 α) on muotoa ˆ (1 ˆ ) ˆ (1 ˆ ) ˆ p p /2, ˆ p p p zα p+ zα/2 n n jossa ˆp = parametrin p harhaton estimaattori n = havaintojen lukumäärä z α/2, +z α/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet normaalijakaumasta N(0,1) TKK (c) Ilkka Mellin (2005) 97

Bernoulli-jakauman odotusarvon luottamusväli Luottamusväli ja sen pituus 1/2 Bernoulli-jakauman odotusarvoparametrin p approksimatiivinen luottamusväli luottamustasolla (1 α) esitetään usein muodossa pˆ(1 pˆ) pˆ ± zα /2 n koska väli on symmetrinen keskipisteensä ˆp suhteen. Bernoulli-jakauman parametrin p approksimatiivisen luottamusvälin pituus on 2 z α /2 pˆ(1 pˆ) n TKK (c) Ilkka Mellin (2005) 98

Bernoulli-jakauman odotusarvon luottamusväli Luottamusväli ja sen pituus 2/2 Bernoulli-jakauman odotusarvoparametrin p approksimatiivinen luottamusväli luottamustasolla (1 α): ˆp z α /2 pˆ(1 pˆ) n z α /2 pˆ(1 pˆ) n TKK (c) Ilkka Mellin (2005) 99

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 1/5 Olkoon X 1, X 2,, X n yksinkertainen satunnaisotos Bernoulli-jakaumasta Ber(p) Olkoon pˆ n 1 = X n i = 1 i harhaton estimaattori parametrille p. Huomaa, että ˆp on havaintojen X 1, X 2,, X n aritmeettinen keskiarvo. TKK (c) Ilkka Mellin (2005) 100

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 2/5 Määritellään satunnaismuuttuja pˆ p z = pˆ(1 pˆ) n Satunnaismuuttuja z noudattaa Bernoulli-jakautuneen otoksen suhteellisen osuuden otosjakaumaa koskevan tuloksen perusteella suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0,1) : z a N(0,1) Ks. kalvokokoelman Johdatus todennäköisyyslaskentaan lukua Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2005) 101

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 3/5 Määrätään normaalijakaumasta N(0,1) piste +z α/2 siten, että α Pr( z + z α /2) = 2 jolloin (normaalijakauman symmetrian perusteella) α Pr( z z α /2) = 2 ja edelleen Pr( z z + z ) = 1 α/2 α/2 α TKK (c) Ilkka Mellin (2005) 102

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 4/5 Tarkastellaan epäyhtälöketjua zα/2 z + zα/2 Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan z lauseke, saadaan epäyhtälöketju pˆ p zα/2 + zα/2 pˆ(1 pˆ) n Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitävä epäyhtälöketju pˆ(1 pˆ) pˆ(1 pˆ) pˆ z ˆ α/2 p p+ zα/2 n n TKK (c) Ilkka Mellin (2005) 103

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin johto 5/5 Yhdistämällä saatu epäyhtälö siihen, että Pr( z z + z ) = 1 α/2 α/2 a α saadaan vihdoin pˆ(1 pˆ) pˆ(1 pˆ) Pr pˆ z ˆ /2 p p+ z /2 = a 1 n n α α α TKK (c) Ilkka Mellin (2005) 104

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin frekvenssitulkinta 1/2 Bernoulli-jakauman parametrin p luottamusvälin ˆ (1 ˆ ) ˆ (1 ˆ ) ˆ p p /2, ˆ p p p zα p+ zα/2 n n konstruktiosta seuraa, että p ˆ (1 p ˆ ) p ˆ (1 p ˆ ) Pr pˆ z /2 p pˆ + z /2 = a 1 n n Siten konstruoitu luottamusväli peittää parametrin p todellisen arvon approksimatiivisesti todennäköisyydellä (1 α) ja se ei peitä parametrin p todellista arvoa approksimatiivisesti todennäköisyydellä α. α α α TKK (c) Ilkka Mellin (2005) 105

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin frekvenssitulkinta 2/2 Bernoulli-jakauman parametrin p approksimatiiviselle luottamusvälille voidaan antaa seuraava frekvenssitulkinta: (i) Jos otantaa jakaumasta Ber(p) toistetaan, keskimäärin 100 (1 α) % otoksista konstruoiduista luottamusväleistä peittää parametrin p todellisen arvon. (ii) Jos otantaa jakaumasta Ber(p) toistetaan, keskimäärin 100 α % otoksista konstruoiduista luottamusväleistä ei peitä parametrin p todellista arvoa. TKK (c) Ilkka Mellin (2005) 106

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin ominaisuudet 1/2 Bernoulli-jakauman parametrin p luottamusvälin keskipiste ˆp vaihtelee otoksesta toiseen. Luottamusvälin pituus pˆ(1 pˆ) 2 zα /2 n vaihtelee otoksesta toiseen. Luottamusvälin pituus riippuu valitusta luottamustasosta (1 α), havaintojen lukumäärästä n ja estimaattorista ˆp. TKK (c) Ilkka Mellin (2005) 107

Bernoulli-jakauman odotusarvon luottamusväli Luottamusvälin ominaisuudet 2/2 Luottamusväli lyhenee (pitenee), jos luottamustasoa (1 α) pienennetään (kasvatetaan). Luottamusväli lyhenee (pitenee), jos havaintojen lukumäärää n kasvatetaan (pienennetään). Luottamusväli on lyhimmillään, kun pˆ 0 tai pˆ 1 Luottamusväli on pisimmillään, kun 1 p ˆ = 2 TKK (c) Ilkka Mellin (2005) 108

Bernoulli-jakauman odotusarvon luottamusväli Vaatimukset luottamusvälille Olisi toivottavaa pystyä konstruoimaan parametrille p mahdollisimman lyhyt luottamusväli, johon liittyvä luottamustaso olisi samanaikaisesti mahdollisimman korkea. Vaatimusten samanaikainen täyttäminen ei ole kuitenkaan mahdollista, jos otoskoko pidetään kiinteänä: (i) Luottamustason kasvattaminen pidentää luottamusväliä, jolloin tieto parametrin p todellisen arvon sijainnista tulee epätarkemmaksi. (ii) Luottamusvälin lyhentäminen pienentää luottamustasoa, jolloin tieto parametrin p todellisen arvon sijainnista tulee epävarmemmaksi. TKK (c) Ilkka Mellin (2005) 109

Bernoulli-jakauman odotusarvon luottamusväli Johtopäätökset luottamusvälistä Oletetaan, että olemme tehneet johtopäätöksen, että konstruoitu luottamusväli peittää odotusarvoparametrin p todellisen arvon: (i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea 100 (1 α) %:ssa tapauksia. (ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä 100 α %:ssa tapauksia. Huomautus: Virheellisen johtopäätöksen mahdollisuutta ei saada häviämään, ellei luottamusväliä tehdä äärettömän leveäksi, jolloin väli ei enää sisällä informaatiota odotusarvoparametrin p todellisesta arvosta. TKK (c) Ilkka Mellin (2005) 110

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 1/5 Monissa tutkimustilanteissa toivotaan, että parametrin luottamusväli saataisiin mahdollisimman lyhyeksi. Bernoulli-jakauman odotusarvoparametrin p luottamusvälin pituus riippuu otoskoosta siten, että väli lyhenee, jos havaintojen havaintojen lukumäärää n kasvatetaan. Tämä odotusarvoparametrin p luottamusvälin ominaisuus mahdollistaa tietyin ehdoin otoskoon valinnan niin, että luottamusvälistä tulee (suurin piirtein) toivotun mittainen. Oletetaan siis, että Bernoulli-jakauman odotusarvoparametrille p halutaan konstruoida luottamusväli, jonka toivottu pituus on 2A TKK (c) Ilkka Mellin (2005) 111

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 2/5 Bernoulli-jakauma odotusarvoparametrin p luottamusväli luottamustasolla (1 α) on muotoa pˆ(1 pˆ) pˆ ± zα /2 n jossa ˆp = parametrin p harhaton estimaattori n = havaintojen lukumäärä z α/2, +z α/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet normaalijakaumasta N(0,1) TKK (c) Ilkka Mellin (2005) 112

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 3/5 Jos siis käytettävissä on ennakkotietoa parametrista p, voidaan otoskoko n ratkaista yhtälöstä: z α /2 p(1 p) = n A jossa z α/2 = luottamustasoon (1 α) liittyvä luottamuskerroin normaalijakaumasta N(0,1) p = odotusarvon oletettu arvo n = otoskoko 2A = toivottu pituus luottamusvälille TKK (c) Ilkka Mellin (2005) 113

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 4/5 Siten tarvittava otoskoko on zα /2 p(1 p) n = A Huomaa, että tarvittava otoskoko saavuttaa maksiminsa n kun 2 zα /2 = 2A p =1 2 2 TKK (c) Ilkka Mellin (2005) 114

Bernoulli-jakauman odotusarvon luottamusväli Otoskoon määrääminen 5/5 Huomautus: Tarvittavan otoskoon kaavasta nähdään, että mitä lyhyempää luottamusväliä toivotaan, sitä suurempi otos on poimittava: Jos esimerkiksi luottamusvälin pituus halutaan puolittaa, pitää havaintoja kerätä 4 kertaa enemmän. TKK (c) Ilkka Mellin (2005) 115