tilastotieteen kertaus

Samankaltaiset tiedostot
Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Estimointi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastollinen aineisto Luottamusväli

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Väliestimointi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Harjoitus 2: Matlab - Statistical Toolbox

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Teema 8: Parametrien estimointi ja luottamusvälit

Tilastollisten aineistojen kuvaaminen

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Testejä suhdeasteikollisille muuttujille

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

031021P Tilastomatematiikka (5 op) viikko 4

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Mat Tilastollisen analyysin perusteet, kevät 2007

Maximum likelihood-estimointi Alkeet

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Mat Tilastollisen analyysin perusteet, kevät 2007

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Normaalijakaumasta johdettuja jakaumia

ABHELSINKI UNIVERSITY OF TECHNOLOGY

pisteet Frekvenssi frekvenssi Yhteensä

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

7. laskuharjoituskierros, vko 10, ratkaisut

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Todennäköisyyden ominaisuuksia

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Harjoitus 7: NCSS - Tilastollinen analyysi

Sovellettu todennäköisyyslaskenta B

Testit järjestysasteikollisille muuttujille

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Tilastollisen päättelyn perusteet

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Todennäköisyyslaskun kertaus. Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Parametrin estimointi ja bootstrap-otanta

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

805306A Johdatus monimuuttujamenetelmiin, 5 op

Sovellettu todennäköisyyslaskenta B

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

Tilastollisia peruskäsitteitä ja Monte Carlo

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Tutkimustiedonhallinnan peruskurssi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamusvälit. Normaalijakauma johnkin kohtaan

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Osa 2: Otokset, otosjakaumat ja estimointi

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Transkriptio:

tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1

Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa ilmiöitä koskeviin tietoihin liittyy epävarmuutta ja satunnaisuutta. Heliövaara 2

Kuvailun ja päättelyn menetelmiä Kuvailun menetelmiä: - Tilastografiikka - Tilastolliset tunnusluvut - Tilastolliset mallit Päättelyn menetelmiä: - Tilastolliset mallit - Tilastollinen testaus Heliövaara 3

Aineiston kerääminen Kohdistuuko tutkimus koko perusjoukkoon vai vain johonkin sen osaan? - Tutkimusta kutsutaan kokonaistutkimukseksi, jos perusjoukon kaikki alkiot tutkitaan. - Tutkimusta kutsutaan otantatutkimukseksi, jos perusjoukon alkioista vain osa tutkitaan. (Otoksen valitsemiseen on useita erilaisia tapoja.) Muutetaanko tutkimuksessa aktiivisesti tutkimuksen kohteiden olosuhteita? - Tutkimus on koe, jos tutkitaan olosuhteiden muuttamisen vaikutusta tutkimuksen kohteisiin. - Jos olosuhteita ei muuteta aktiiivisesti, sanomme, että tutkimus perustuu suoriin havaintoihin Heliövaara 4

Kontrolloidut kokeet Kokeesta ei voida tehdä luotettavia johtopäätöksiä, ellei koe ole kontrolloitu: - Kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia. - Käsittelyjen kohdistamisessa on käytettävä satunnaistusta. - Kokeessa on tehtävä riittävästi koetoistoja. Heliövaara 5

Aineistojen kuvaaminen Heliövaara 6

Frekvenssit ja havaintoarvojen jakauma Jos muuttuja on diskreetti, havaittujen arvojen jakaumaa kuvataan frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä, joka on pylväsdiagrammi. Jos muuttuja on jatkuva, havaittujen arvojen jakaumaa kuvataan luokitellulla frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä, joka on histogrammi. Histogrammissa pinta-ala vastaa frekvenssiä ja pylväsdiagrammissa korkeus. Muuttujan x mahdolliset arvot y 1,y 2,...,y m yhdessä niiden havaittujen frekvenssien f 1,f 2,...,f m kanssa muodostavat muuttujan x havaittujen arvojen x 1,x 2,...x n frekvenssijakauman. Siinä missä todennäköisyyksien summa on aina yksi, on nyt f i = n. Heliövaara 7

Havaintoaineiston tunnuslukuja 1/2 Aritmeettinen keskiarvo: n x = 1 n i=1 x i Otosvarianssi: s 2 = 1 n 1 n (x i x) 2 = 1 ( n n 1 i=1 i=1 x 2 i n x 2 ) Otoskeskihajonta: s = s 2 Heliövaara 8

Havaintoaineiston tunnuslukuja 2/2 Origomomentit: n a k = 1 n i=1 x k i Keskusmomentit: m k = 1 n n (x i x) k i=1 Heliövaara 9

Standardointi ja tilastollinen etäisyys Standardoitujen havaintoarvojen z i = x i x s x,i = 1, 2,...,n aritmeettinen keskiarvo ja otosvarianssi ovat z = 1 n n i=1 z i = 0 s 2 z = 1 n 1 n (z i z) 2 = 1 i=1 Havaintoarvojen x k ja x l tilastollinen etäisyys d kl on d kl = x k x l s x Heliövaara 10

Tunnuslukuja järjestysasteikollisille aineistolle Järjestystunnusluvut: Suuruusjärjestyksessä k. havaintoarvoa z k kutsutaan k. järjestystunnusluvuksi. Minimi ja maksimi eli pienin ja suurin arvo. Vaihteluväli ja sen pituus. Prosenttipisteet z p : p. prosenttipiste jakaa aineiston kahteen osaan: p% havainnoista on prosenttipistettä pienempiä ja loput (100 p)% suurempia. Mediaani eli Me = z 50 jakaa aineiston kahteen yhtä suureen osaan. Kvartiilit: Q 1 = z 25, Q 2 = z 50 = Me ja Q 3 = z 75. Kvartiilipoikkeama: (Q 3 Q 1 )/2 Heliövaara 11

Tunnuslukuja laatueroasteikollisille aineistoille Suhteelliset frekvenssit f i /n. Moodi eli tyyppiarvo eli yleisin havaintoarvo. Heliövaara 12

Vinous Olkoot m 2 = 1 n n (x i x) 2 m 3 = 1 n i=1 havaintoarvojen 2. ja 3. keskusmomentti. n (x i x) 3 i=1 Tunnuslukua c 1 = m 3 m 3/2 2 käytetään kuvaamaan havaintoarvojen jakauman vinoiutta. - Jos c 1 0, on havaintoarvojen jakauma symmetrinen painopisteensä suhteen. - Jos c 1 > 0, on havaintoarvojen jakauma positiivisesti vino. - Jos c 1 < 0, on havaintoarvojen jakauma negatiivisesti vino. Heliövaara 13

Huipukkuus Olkoot m 2 = 1 n n (x i x) 2 m 4 = 1 n i=1 havaintoarvojen 2. ja 4. keskusmomentti. n (x i x) 4 i=1 Tunnuslukua c 2 = m 4 m 2 2 3 käytetään kuvaamaan havaintoarvojen jakauman huipukkuutta. - Normaalijakautuneella havaintoaineistolla c 2 0. - Jos c 2 > 0, on havaintoarvojen jakauma huipukas (Normaalijakautuneeseen havaintoaineistoon verrattuna). - Jos c 2 < 0, on havaintoarvojen jakauma laakea (Normaalijakautuneeseen havaintoaineistoon verrattuna). Heliövaara 14

Otos ja otosjakaumat Heliövaara 15

Tilastollinen aineisto Tilastollinen aineisto koostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista. Tilastollisissa tutkimusasetelmissa havaintoarvoihin liittyy aina epävarmuutta ja satunnaisuutta. Heliövaara 16

Tilastollinen malli Tilastollisella mallilla tarkoitetaan tutkimuksen kohteita kuvaavien satunnaismuuttujien todennäköisyysjakaumaa, jonka ajatellaan generoineen ko. satunnaismuuttujien havaitut arvot. Nämä todennäköisyysjakaumat riippuvat tavallisesti parametreista, joiden arvoja ei yleensä tunneta. Tilastollista mallia sovellettaessa kohdataan tavallisesti seuraavat parametreja koskevat ongelmat: - Parametrien arvoja ei tunneta ja ne on estimoitava eli arvioitava havaintoaineistosta. - Parametrien arvoista on olemassa oletuksia, joita halutaan testata havaintoaineiston antaman informaation avulla. Heliövaara 17

Yksinkertainen satunnaisotos Olkoot X 1,X 2,...,X n riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys- tai tiheysfunktio f(x). Tällöin satunnaismuuttujat X 1,X 2,...,X n muodostavat yksinkertaisen satunnaisotoksen jakaumasta f(x). Heliövaara 18

Havainnot ja havaintoarvot Olkoon X 1,X 2,...,X n yksinkertainen satunnaisotos jakaumasta f(x). Stunnaismuuttujia X 1,X 2,...,X n kutsutaan havainnoiksi. Kun otos on poimittu, satunnaismuuttujat X 1,X 2,...,X n saavat havaituiksi arvoikseen havaintoarvot x 1,x 2,...,x n. Heliövaara 19

Otostunnusluvut ja otosjakaumat Olkoon T = g(x 1,X 2,...,X n ) jokin satunnaismmuuttujien X 1,X 2,...,X n (mitallinen) funktio. Satunnaismuuttujaa T kutsutaan otostunnusluvuksi. Tunnusluvun T jakaumaa kutsutaan T :n otosjakaumaksi. Heliövaara 20

Aritmeettisen keskiarvon odotusarvo ja varianssi Oletetaan, että havainnot X 1,X 2,...,X n muodostavat yksinkertaisen satunnaisotoksen satunnaismuuttujan X jakaumasta, jonka odotusarvo ja varianssi ovat E(X) = µ ja V ar(x) = σ 2. Havaintojen aritmeettisen keskiarvon X odotusarvo ja varianssi ovat E( X) = µ V ar( X) = σ2 n Aritmeettisen keskiarvon standardipoikkeamaa D( X) = σ/ n kutsutaan keskiarvon keskivirheeksi. Heliövaara 21

Aritmeettisen keskiarvon otosjakauma, kun otos on normaalijakautunut Oletetaan, että havainnot X 1,X 2,...,X n muodostavat yksinkertaisen satunnaisotoksen normaalijakaumasta N(µ,σ 2 ). Tällöin havaintojen aritmeettinen keskiarvo X noudattaa eksaktisti normaalijakaumaa: ) X N (µ, σ2 n Standardoitu satunnaismuuttuja Z = X µ σ/ n noudattaa eksaktisti standardoitua normaalijakaumaa: Z N(0, 1) Heliövaara 22

Otosvarianssin odotusarvo ja varianssi Oletetaan, että havainnot X 1,X 2,...,X n muodostavat yksinkertaisen satunnaisotoksen satunnaismuuttujan X jakaumasta, jonka odotusarvo ja varianssi ovat E(X) = µ ja V ar(x) = σ 2. Havaintojen otosvarianssin s 2 odotusarvo ja varianssi ovat E(s 2 ) = σ 2 V ar(s 2 ) = 2σ4 n 1 Heliövaara 23

Otosvarianssin otosjakauma, kun otos on normaalijakautunut Oletetaan, että havainnot X 1,X 2,...,X n muodostavat yksinkertaisen satunnaisotoksen normaalijakaumasta N(µ,σ 2 ). Tällöin satunnaismuuttuja V = (n 1)s2 σ 2 = n i=1 ( Xi X σ ) 2 noudattaa eksaktisti χ 2 -jakaumaa vapausastein (n 1): V χ 2 (n 1) Heliövaara 24

Frekvenssi ja suhteellinen frekvenssi Olkoon A jokin otosavaruuden S alkioiden ominaisuus. Poimitaan otosavaruudesta yksinkertainen satunnaisotos, jonka koko on n. Ominaisuuden A omaavien alkioden lukumäärää otoksessa merkitään f :llä kutsutaan ominaisuuden A frekvenssiksi. Ominaisuuden A suhteellinen frekvenssi ˆp määritellään: ˆp = f n Heliövaara 25

Frekvenssien odotusarvo ja varianssi Frekvenssi f noudattaa eksaktisti binomijakaumaa parametrein n ja Pr(A) = p: f Bin(n,p) Frekvenssin f odotusarvo ja varianssi ovat siis: jossa q = 1 p. E(f) = np V ar(f) = npq, Suhteellisen frekvenssin ˆp odotusarvo ja varianssi ovat: E(ˆp) = p V ar(ˆp) = pq n Heliövaara 26

Suhteellisen frekvenssin normaaliapproksimaatio Suhteellinen frekvenssi ˆp noudattaa suurissa otoksissa approksimatiivisesti normaalijakaumaa: Standardoitu satunnaismuuttuja ˆp a N ( p, pq ) n Z = ˆp p pq/n noudattaa siten suurissa otoksissa standardoitua normaalijakumaa: Z a N(0, 1) Heliövaara 27

Estimointi Heliövaara 28

Estimointi Tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida tutkimuksen kohteena olevaa ilmiötä koskevat havainnot generoineen prosessin mallina käytettävän todennäköisyysjakauman tuntemattomat parametrit ilmiötä koskevien havaintojen perusteella. Havaintojen funktiota, joka tuottaa estimaatteja parametrin todelliselle arvolle, kutsutaan parametrin estimaattoriksi. Heliövaara 29

Estimaatti ja estimaattori Oletetaan, että satunnaismuuttuja X noudattaa todennäköisyysjakaumaa, jonka pistetodennäköisyys- tai tiheysfunktio f(x; θ) riippuu parametrista θ. Parametrin θ estimoimiseen käytetään havaintojen X 1,X 2,...,X n funktiota, eli tunnuslukua T = g(x 1,X 2,...,X n ) = ˆθ Funktiota T kutsutaan parametrin θ estimaattoriksi. Havaintoarvoista x 1,x 2,...,x n laskettua arvoa t = g(x 1,x 2,...,x n ) kutsutaan parametrin θ estimaatiksi. Heliövaara 30

Hyvä estimaattori Todennäköisyysjakauman parametreille on tavallisesti tarjolla useita vaihtoehtoisia estimaattoreita. Seuraavat hyvyyskriteerit täyttävä estimaattori tuottaa järkeviä arvoja estimoitavalle parametrille: - Harhattomuus - Tyhjentävyys - Tehokkuus - Tarkentuvuus Heliövaara 31

Piste-estimointi ja väliestimointi Todennäköisyysjakauman parametrin arvon estimointia kutsutaan piste-estimoinniksi. Parametrin estimaattiin on aina syytä liittää luottamusväliksi kutsuttu väli, joka sisältää estimoidun parametrin todellisen, mutta tuntemattoman arvon tietyllä, soveltajan valittavissa olevalla todennäköisyydellä. Luottamusvälin määräämistä kutsutaan väliestimoinniksi. Heliövaara 32

Luottamusvälin määritys 1/2 Oletukset: - Satunnaismuuttuja X noudattaa jakaumaa f(x; θ). - X 1,X 2,...,X n on yksinkertainen satunnaisotos jakaumasta f(x;θ). - ˆθ = ˆθ(X 1,X 2,...,X n ) on θ:n estimaattori. Valitaan luottamustaso 1 α ja määrätään satunnaismuuttujat A = A(X 1,X 2,...,X n ) Y = Y (X 1,X 2,...,X n ) siten että Pr(ˆθ A θ) = α 2 Pr(ˆθ + Y θ) = α 2 Heliövaara 33

Luottamusvälin määritys 2/2 Nyt todennäköisyys Pr(ˆθ A θ ˆθ + Y ) = 1 α ja väli (ˆθ A, ˆθ + Y ) on θ:n luottamusväli luottamustasolla (1 α). Jos ˆθ:n jakauma on symmetrinen, pätee A = Y luottamusväli on muotoa (ˆθ A, ˆθ + A). Heliövaara 34

Normaalijakautuneen estimaattorin määräämä luottamusväli, kun varianssi σ 2 tunnetaan Olkoon satunnaismuuttuja ˆθ N(µ,σ 2 ) parametrin θ estimaattori. Tällöin satunnaismuuttuja Nyt pätee Z = ˆθ µ σ Pr( z α/2 ˆθ µ σ N(0, 1). z α/2 ) = 1 α. Tästä saadaan parametrin θ (1 α) -luottamusväliksi ˆθ z α/2 σ θ ˆθ + z α/2 σ. Heliövaara 35

Normaalijakautuneen satunnaismuuttujan odotusarvon luottamusväli, kun varianssi σ 2 tunnetaan Olkoon X 1,...,X n yksinkertainen satunnaisotos normaalijakaumasta N(µ,σ 2 ). Oletetaan että σ 2 tunnetaan, mutta µ on tuntematon. Tällöin havaintojen aritmeettinen keskiarvo X noudattaa eksaktisti normaalijakaumaa: ) X N (µ, σ2 n Edellisen kalvon kaavasta odotusarvon µ (1 α) -luottamusväliksi saadaan X z α/2 σ n µ X + z α/2 σ n. Heliövaara 36

Normaalijakauman odotusarvon luottamusväli Olkoon havainnot X 1,...,X n yksinkertainen satunnaisotos normaalijakaumasta N(µ,σ 2 ) ja olkoon X = havaintojen aritmeettinen keskiarvo s 2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä t α/2 = t-jakauman arvo merkitsevyystasolla α/2 ja vapausasteilla (n 1). Normaalijakauman odotusarvoparametrin µ luottamusväli luottamustasolla (1 α) on muotoa ( ) s s X t α/2, X + tα/2 n n Heliövaara 37

Otoskoon määrääminen Oletetaan, että normaalijakauman varianssi σ 2 tunnetaan. Kuinka suuri otos on otettava, jotta odotusarvolle voidaan muodostaa (1 α)-luottamusväli, jonka pituus on 2A? Odotusarvon luottamusväli luottamustasolla (1 α) on σ X ± z α/2 n. Jotta luottamusvälin pituus olisi 2A, on oltava z α/2 σ n = A, josta voidaan ratkaista tarvittava otoskoko n n = ( ) zα/2 σ 2. A Heliövaara 38