Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Samankaltaiset tiedostot
tilastotieteen kertaus

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastollinen aineisto Luottamusväli

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Väliestimointi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Teema 8: Parametrien estimointi ja luottamusvälit

Tilastollisten aineistojen kuvaaminen

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Testejä suhdeasteikollisille muuttujille

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

031021P Tilastomatematiikka (5 op) viikko 4

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Maximum likelihood-estimointi Alkeet

Mat Tilastollisen analyysin perusteet, kevät 2007

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Sovellettu todennäköisyyslaskenta B

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Todennäköisyyden ominaisuuksia

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

pisteet Frekvenssi frekvenssi Yhteensä

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Mat Tilastollisen analyysin perusteet, kevät 2007

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Testit järjestysasteikollisille muuttujille

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

7. laskuharjoituskierros, vko 10, ratkaisut

Normaalijakaumasta johdettuja jakaumia

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

805306A Johdatus monimuuttujamenetelmiin, 5 op

Regressioanalyysi. Kuusinen/Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Parametrin estimointi ja bootstrap-otanta

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

Tilastollisen päättelyn perusteet

Tutkimustiedonhallinnan peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Tilastollisia peruskäsitteitä ja Monte Carlo

Luottamusvälit. Normaalijakauma johnkin kohtaan

Sovellettu todennäköisyyslaskenta B

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

3.6 Su-estimaattorien asymptotiikka

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Transkriptio:

Tilastotieteen kertaus Kuusinen/Heliövaara 1

Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa ilmiöitä koskeviin tietoihin liittyy epävarmuutta ja satunnaisuutta. Kuusinen/Heliövaara 2

Kuvailun ja päättelyn menetelmiä Kuvailun menetelmiä: - Tilastografiikka - Tilastolliset tunnusluvut - Tilastolliset mallit Päättelyn menetelmiä: - Tilastolliset mallit - Tilastollinen testaus Kuusinen/Heliövaara 3

Aineiston kerääminen Kohdistuuko tutkimus koko perusjoukkoon vai vain johonkin sen osaan? - Tutkimusta kutsutaan kokonaistutkimukseksi, jos perusjoukon kaikki alkiot tutkitaan. - Tutkimusta kutsutaan otantatutkimukseksi, jos perusjoukon alkioista vain osa tutkitaan (otoksen valitsemiseen on useita erilaisia tapoja). Muutetaanko tutkimuksessa aktiivisesti tutkimuksen kohteiden olosuhteita? - Tutkimus on koe, jos tutkitaan olosuhteiden muuttamisen vaikutusta tutkimuksen kohteisiin. - Jos olosuhteita ei muuteta aktiiivisesti, sanomme, että tutkimus perustuu suoriin havaintoihin. Kuusinen/Heliövaara 4

Kontrolloidut kokeet Kokeesta ei voida tehdä luotettavia johtopäätöksiä, ellei koe ole kontrolloitu: - Kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia. - Käsittelyjen kohdistamisessa on käytettävä satunnaistusta. - Kokeessa on tehtävä riittävästi koetoistoja. Kuusinen/Heliövaara 5

Aineistojen kuvaaminen Kuusinen/Heliövaara 6

Frekvenssit ja havaintoarvojen jakauma Jos muuttuja on diskreetti, havaittujen arvojen jakaumaa kuvataan frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä, joka on pylväsdiagrammi. Jos muuttuja on jatkuva, havaittujen arvojen jakaumaa kuvataan luokitellulla frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä, joka on histogrammi. Histogrammissa frekvenssiä vastaa pinta-ala ja pylväsdiagrammissa korkeus. Muuttujan x mahdolliset arvot y 1, y 2,..., y m yhdessä niiden havaittujen frekvenssien f 1, f 2,..., f m kanssa muodostavat muuttujan x havaittujen arvojen x 1, x 2,... x n frekvenssijakauman. Siinä missä todennäköisyyksien summa on aina yksi, niin f i = n. Kuusinen/Heliövaara 7

Havaintoaineiston tunnuslukuja 1/2 Aritmeettinen keskiarvo: n x = 1 n i=1 x i Otosvarianssi: s 2 = 1 n 1 n i=1 (x i x) 2 = 1 n 1 ( n i=1 x 2 i n x 2 ) Otoskeskihajonta: s = s 2 Kuusinen/Heliövaara 8

Havaintoaineiston tunnuslukuja 2/2 Origomomentit: n a k = 1 n i=1 x k i Keskusmomentit: m k = 1 n n (x i x) k i=1 Kuusinen/Heliövaara 9

Standardointi ja tilastollinen etäisyys Standardoitujen havaintoarvojen z i = x i x s x aritmeettinen keskiarvo ja otosvarianssi ovat, i = 1, 2,..., n z = 1 n n i=1 z i = 0 s 2 z = 1 n 1 n (z i z) 2 = 1 i=1 Havaintoarvojen x k ja x l tilastollinen etäisyys d kl on d kl = x k x l s x Kuusinen/Heliövaara 10

Tunnuslukuja järjestysasteikollisille aineistolle Järjestystunnusluvut: Suuruusjärjestyksessä k. havaintoarvoa z k kutsutaan k. järjestystunnusluvuksi. Minimi ja maksimi eli pienin ja suurin arvo. Vaihteluväli ja sen pituus. Prosenttipisteet z p : p. prosenttipiste jakaa aineiston kahteen osaan: p% havainnoista on prosenttipistettä pienempiä ja loput (100 p)% suurempia. Mediaani eli Me = z 50 jakaa aineiston kahteen yhtä suureen osaan. Kvartiilit: Q 1 = z 25, Q 2 = z 50 = Me ja Q 3 = z 75. Kvartiilipoikkeama: (Q 3 Q 1 )/2 Kuusinen/Heliövaara 11

Tunnuslukuja laatueroasteikollisille aineistoille Suhteelliset frekvenssit f i /n. Moodi eli tyyppiarvo eli yleisin havaintoarvo. Kuusinen/Heliövaara 12

Vinous Olkoot m 2 = 1 n n (x i x) 2 m 3 = 1 n i=1 havaintoarvojen 2. ja 3. keskusmomentti. n (x i x) 3 i=1 Tunnuslukua c 1 = m 3 m 3/2 2 käytetään kuvaamaan havaintoarvojen jakauman vinoutta. - Jos c 1 0, on havaintoarvojen jakauma symmetrinen painopisteensä suhteen. - Jos c 1 > 0, on havaintoarvojen jakauma positiivisesti vino. - Jos c 1 < 0, on havaintoarvojen jakauma negatiivisesti vino. Kuusinen/Heliövaara 13

Huipukkuus Olkoot m 2 = 1 n n (x i x) 2 m 4 = 1 n i=1 havaintoarvojen 2. ja 4. keskusmomentti. n (x i x) 4 i=1 Tunnuslukua c 2 = m 4 m 2 2 3 käytetään kuvaamaan havaintoarvojen jakauman huipukkuutta. - Normaalijakautuneella havaintoaineistolla c 2 0. - Jos c 2 > 0, on havaintoarvojen jakauma huipukas (Normaalijakautuneeseen havaintoaineistoon verrattuna). - Jos c 2 < 0, on havaintoarvojen jakauma laakea (Normaalijakautuneeseen havaintoaineistoon verrattuna). Kuusinen/Heliövaara 14

Otos ja otosjakaumat Kuusinen/Heliövaara 15

Tilastollinen aineisto Tilastollinen aineisto koostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista. Tilastollisissa tutkimusasetelmissa havaintoarvoihin liittyy aina epävarmuutta ja satunnaisuutta. Kuusinen/Heliövaara 16

Tilastollinen malli Tilastollisella mallilla tarkoitetaan tutkimuksen kohteita kuvaavien satunnaismuuttujien todennäköisyysjakaumaa, jonka ajatellaan generoineen ko. satunnaismuuttujien havaitut arvot. Nämä todennäköisyysjakaumat riippuvat tavallisesti parametreista, joiden arvoja ei yleensä tunneta. Tilastollista mallia sovellettaessa kohdataan tavallisesti seuraavat parametreja koskevat ongelmat: - Parametrien arvoja ei tunneta ja ne on estimoitava eli arvioitava havaintoaineistosta. - Parametrien arvoista on olemassa oletuksia, joita halutaan testata havaintoaineiston antaman informaation avulla. Kuusinen/Heliövaara 17

Yksinkertainen satunnaisotos Olkoot X 1, X 2,..., X n riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys- tai tiheysfunktio f(x). Tällöin satunnaismuuttujat X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen jakaumasta f(x). Kuusinen/Heliövaara 18

Havainnot ja havaintoarvot Olkoon X 1, X 2,..., X n yksinkertainen satunnaisotos jakaumasta f(x). Satunnaismuuttujia X 1, X 2,..., X n kutsutaan havainnoiksi. Kun otos on poimittu, satunnaismuuttujat X 1, X 2,..., X n saavat havaituiksi arvoikseen havaintoarvot jotka eivät ole satunnaisia. x 1, x 2,..., x n, Kuusinen/Heliövaara 19

Otostunnusluvut ja otosjakaumat Olkoon T = g(x 1, X 2,..., X n ) jokin satunnaismmuuttujien X 1, X 2,..., X n (mitallinen) funktio. Satunnaismuuttujaa T kutsutaan otostunnusluvuksi. Tunnusluvun T jakaumaa kutsutaan T :n otosjakaumaksi. Kuusinen/Heliövaara 20

Aritmeettisen keskiarvon odotusarvo ja varianssi Oletetaan, että havainnot X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen satunnaismuuttujan X jakaumasta, jonka odotusarvo ja varianssi ovat E(X) = µ ja V ar(x) = σ 2. Havaintojen aritmeettisen keskiarvon X odotusarvo ja varianssi ovat E( X) = µ V ar( X) = σ2 n Aritmeettisen keskiarvon standardipoikkeamaa D( X) = σ/ n kutsutaan keskiarvon keskivirheeksi. Kuusinen/Heliövaara 21

Aritmeettisen keskiarvon otosjakauma, kun otos on normaalijakautunut Oletetaan, että havainnot X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen normaalijakaumasta N(µ, σ 2 ). Tällöin havaintojen aritmeettinen keskiarvo X noudattaa eksaktisti normaalijakaumaa: ) X N (µ, σ2 n Standardoitu satunnaismuuttuja Z = X µ σ/ n noudattaa eksaktisti standardoitua normaalijakaumaa: Z N(0, 1) Kuusinen/Heliövaara 22

Otosvarianssin odotusarvo ja varianssi Oletetaan, että havainnot X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen satunnaismuuttujan X jakaumasta, jonka odotusarvo ja varianssi ovat E(X) = µ ja V ar(x) = σ 2. Havaintojen otosvarianssin s 2 odotusarvo ja varianssi ovat E(s 2 ) = σ 2 V ar(s 2 ) = 2σ4 n 1 Kuusinen/Heliövaara 23

Otosvarianssin otosjakauma, kun otos on normaalijakautunut Oletetaan, että havainnot X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen normaalijakaumasta N(µ, σ 2 ). Tällöin satunnaismuuttuja V = (n 1)s2 σ 2 = n i=1 ( Xi X σ ) 2 noudattaa eksaktisti χ 2 -jakaumaa vapausastein (n 1): V χ 2 (n 1) Kuusinen/Heliövaara 24

Frekvenssi ja suhteellinen frekvenssi Olkoon A jokin otosavaruuden S alkioiden ominaisuus. Poimitaan otosavaruudesta yksinkertainen satunnaisotos, jonka koko on n. Ominaisuuden A omaavien alkioiden lukumäärä satunnaisotoksessa, jonka koko on n, vastaa ominaisuuden A omaavien alkioiden frekvenssiä ja sitä merkitään f :llä. Ominaisuuden A suhteellinen frekvenssi ˆp määritellään: ˆp = f n Kuusinen/Heliövaara 25

Frekvenssien odotusarvo ja varianssi Frekvenssi f noudattaa eksaktisti binomijakaumaa parametrein n ja P r(a) = p: f Bin(n, p) Frekvenssin f odotusarvo ja varianssi ovat siis: jossa q = 1 p. E(f) = np V ar(f) = npq, Suhteellisen frekvenssin ˆp odotusarvo ja varianssi ovat: E(ˆp) = p V ar(ˆp) = pq n Kuusinen/Heliövaara 26

Suhteellisen frekvenssin normaaliapproksimaatio Suhteellinen frekvenssi ˆp noudattaa suurissa otoksissa approksimatiivisesti normaalijakaumaa: Standardoitu satunnaismuuttuja ˆp a N ( p, pq ) n Z = ˆp p pq/n noudattaa siten suurissa otoksissa approksimatiivisesti standardoitua normaalijakumaa: Z a N(0, 1) Kuusinen/Heliövaara 27

Estimointi Kuusinen/Heliövaara 28

Estimointi Tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida tutkimuksen kohteena olevaa ilmiötä koskevat havainnot generoineen prosessin mallina käytettävän todennäköisyysjakauman tuntemattomat parametrit ilmiötä koskevien havaintojen perusteella. Havaintojen funktiota, joka tuottaa estimaatteja parametrin todelliselle arvolle, kutsutaan parametrin estimaattoriksi. Kuusinen/Heliövaara 29

Estimaatti ja estimaattori Oletetaan, että satunnaismuuttuja X noudattaa todennäköisyysjakaumaa, jonka pistetodennäköisyys- tai tiheysfunktio f(x; θ) riippuu parametrista θ. Parametrin θ estimoimiseen käytetään havaintojen X 1, X 2,..., X n funktiota, eli tunnuslukua (eng. statistic) T = g(x 1, X 2,..., X n ) = ˆθ Funktiota T kutsutaan parametrin θ estimaattoriksi. Havaintoarvoista x 1, x 2,..., x n laskettua arvoa t = g(x 1, x 2,..., x n ) kutsutaan parametrin θ estimaatiksi. Kuusinen/Heliövaara 30

Hyvä estimaattori Todennäköisyysjakauman parametreille on tavallisesti tarjolla useita vaihtoehtoisia estimaattoreita. Seuraavat hyvyyskriteerit täyttävä estimaattori tuottaa järkeviä arvoja estimoitavalle parametrille: - Harhattomuus - Tyhjentävyys - Tehokkuus - Tarkentuvuus Kuusinen/Heliövaara 31

Piste-estimointi ja väliestimointi Todennäköisyysjakauman parametrin arvon estimointia kutsutaan piste-estimoinniksi. Parametrin estimaattiin on aina syytä liittää luottamusväliksi kutsuttu väli, joka sisältää estimoidun parametrin todellisen, mutta tuntemattoman arvon tietyllä valittavissa olevalla todennäköisyydellä. Luottamusvälin määräämistä kutsutaan väliestimoinniksi. Kuusinen/Heliövaara 32

Luottamusvälin määritys 1/2 Oletukset: - Satunnaismuuttuja X noudattaa jakaumaa f(x; θ). - X 1, X 2,..., X n on yksinkertainen satunnaisotos jakaumasta f(x; θ). - ˆθ = ˆθ(X 1, X 2,..., X n ) on θ:n estimaattori. Valitaan luottamustaso 1 α ja määrätään satunnaismuuttujat A = A(X 1, X 2,..., X n ) Y = Y (X 1, X 2,..., X n ) siten, että P r(θ ˆθ A) = α 2 P r(θ ˆθ + Y ) = α 2 Kuusinen/Heliövaara 33

Luottamusvälin määritys 2/2 Tällöin väli (ˆθ A, ˆθ + Y ) on parametrin θ luottamusväli luottamustasolla (1 α). Luottamusvälin konstruktiosta seuraa, että väli (ˆθ A, ˆθ + Y ) peittää tuntemattoman parametrin θ todellisen arvon todennäköisyydellä (1 α): P r(ˆθ A θ ˆθ + Y ) = 1 α Jos ˆθ:n jakauma on symmetrinen, pätee A = Y ja luottamusväli on muotoa (ˆθ A, ˆθ + A). Kuusinen/Heliövaara 34

Normaalijakautuneen estimaattorin määräämä luottamusväli, kun varianssi σ 2 tunnetaan Olkoon satunnaismuuttuja ˆθ N(θ, σ 2 ) parametrin θ harhaton estimaattori. Tällöin satunnaismuuttuja Z = ˆθ θ σ N(0, 1). Nyt pätee P r( z α/2 ˆθ θ σ z α/2 ) = 1 α. Tästä saadaan parametrin θ (1 α)-luottamusväliksi ˆθ z α/2 σ θ ˆθ + z α/2 σ. Kuusinen/Heliövaara 35

Normaalijakautuneen satunnaismuuttujan odotusarvon luottamusväli, kun varianssi σ 2 tunnetaan Olkoon X 1,..., X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ). Oletetaan että σ 2 tunnetaan, mutta µ on tuntematon. Tällöin havaintojen aritmeettinen keskiarvo X noudattaa eksaktisti normaalijakaumaa: ) X N (µ, σ2 n Edellisen kalvon kaavasta odotusarvon µ (1 α) -luottamusväliksi saadaan X z α/2 σ n µ X + z α/2 σ n. Kuusinen/Heliövaara 36

Normaalijakauman odotusarvon luottamusväli Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) ja olkoon X = havaintojen aritmeettinen keskiarvo s 2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä t α/2 = t-jakauman arvo merkitsevyystasolla α/2 ja vapausasteilla (n 1). Normaalijakauman odotusarvon µ luottamusväli luottamustasolla (1 α) on muotoa ( X t α/2 ) s s, X + tα/2 n n Kuusinen/Heliövaara 37

Otoskoon määrääminen Oletetaan, että normaalijakauman varianssi σ 2 tunnetaan. Kuinka suuri otos on otettava, jotta odotusarvolle voidaan muodostaa (1 α)-luottamusväli, jonka pituus on 2A? Odotusarvon luottamusväli luottamustasolla (1 α) on σ X ± z α/2 n. Jotta luottamusvälin pituus olisi 2A, on oltava z α/2 σ n = A, josta voidaan ratkaista tarvittava otoskoko n n = ( ) zα/2 σ 2. A Kuusinen/Heliövaara 38

Normaalijakauman varianssin luottamusväli Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos normaalijakaumasta N(µ, σ 2 ) ja olkoon s 2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä χ 2 1 α/2 ja χ2 α/2 = χ 2 -jakauman arvot merkitsevyystasoilla 1 α/2 ja α/2 ja vapausasteilla (n 1). Normaalijakauman varianssin σ 2 luottamusväli luottamustasolla (1 α) on muotoa ( (n 1)s 2, χ 2 α/2 (n 1)s2 χ 2 1 α/2 ) Kuusinen/Heliövaara 39