Väliestimointi (jatkoa) Heliövaara 1

Samankaltaiset tiedostot
ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Estimointi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Testit laatueroasteikollisille muuttujille

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Testejä suhdeasteikollisille muuttujille

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

tilastotieteen kertaus

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Testit järjestysasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Mat Sovellettu todennäköisyyslasku A

Sovellettu todennäköisyyslaskenta B

10. laskuharjoituskierros, vko 14, ratkaisut

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

031021P Tilastomatematiikka (5 op) viikko 5

Todennäköisyyden ominaisuuksia

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

9. laskuharjoituskierros, vko 12-13, ratkaisut

Tilastollinen aineisto Luottamusväli

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

11. laskuharjoituskierros, vko 15, ratkaisut

Mat Tilastollisen analyysin perusteet, kevät 2007

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Mat Tilastollisen analyysin perusteet, kevät 2007

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

5.7 Uskottavuusfunktioon perustuvia testejä II

2. Keskiarvojen vartailua

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

3.6 Su-estimaattorien asymptotiikka

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Estimointi. Otantajakauma

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Teema 8: Parametrien estimointi ja luottamusvälit

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Tilastollisia peruskäsitteitä ja Monte Carlo

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

2. TILASTOLLINEN TESTAAMINEN...

Transkriptio:

Väliestimointi (jatkoa) Heliövaara 1

Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p). Suhteellinen frekvenssi ˆp = f n on Bernoulli-jakauman odotusarvoparametrin p harhaton estimaattori. Olkoon n = havaintojen lukumäärä z α/2 = häntätodennäköisyyttä α/2 vastaava piste standardoidusta normaalijakaumasta N(0, 1). Heliövaara 2

Bernoulli-jakauman odotusarvon luottamusväli 2/2 Suhteellisen frekvenssin ˆp odotusarvo ja varianssi ovat: E(ˆp) = p V ar(ˆp) = pq n Suhteellinen ferkvenssi ˆp noudattaa suurissa otoksissa approksimatiivisesti normaalijakaumaa. Bernoulli-jakauman odotusarvoparametrin p approksimatiivinen luottamusväli luottamustasolla (1 α) on ( ) ˆp(1 ˆp) ˆp(1 ˆp) ˆp z α/2, ˆp + z α/2. n n Heliövaara 3

Otoskoon määrääminen 1/2 Ennakkotiedon mukaan Bernoulli-jakauman odotusarvoparametrin arvoksi oletetaan p. Kuinka suuri otos on otettava, jotta p:lle voidaan muodostaa (1 α)-luottamusväli, jonka pituus on 2A? Parametrin p luottamusväli luottamustasolla (1 α) on ( ) ˆp(1 ˆp) ˆp(1 ˆp) ˆp z α/2, ˆp + z α/2. n n Ennakkotiedon perusteella oletetaan ˆp = p. Heliövaara 4

Otoskoon määrääminen 2/2 Jotta luottamusvälin pituus olisi 2A, on oltava z α/2 p(1 p) n = A. josta voidaan ratkaista tarvittava otoskoko n: n = ( ) zα/2 p(1 p) 2. A Huomaa, että otoskoko saavuttaa maksiminsa n = ( zα/2 2A ) 2, kun p = 1/2. Heliövaara 5

Tilastollinen testaus Heliövaara 6

Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai väitteet tulee pukea tutkimuskohteiden tutkittavaa ominaisuutta kuvaavaa jakaumaa tai sen parametreja koskeviksi hypoteeseiksi. Heliövaara 7

Testausasetelman hypoteesit Testausasetelma kiinnitetään tekemällä seuraavat kolme oletusta: (i) Testausasetelmaa koskevia yleisiä oletuksia kutsutaan testin yleiseksi hypoteesiksi. (ii) Testattavaa väitettä tai oletusta kutsutaan testin nollahypoteesiksi. (iii) Jos nollahypoteesi hylätään testissä, astuu voimaan vaihtoehtoinen hypoteesi. Heliövaara 8

Yleinen hypoteesi Yleinen hypoteesi H sisältää oletukset - perusjoukosta - käytetystä otantamenetelmästä - perusjoukon jakaumasta Yleisen hypoteesin oletuksista pidetään kiinni koko testauksen ajan. Yleisen hypoteesin sisältämiä jakaumaoletuksia voidaan ja on yleensä syytä testata erikseen. Heliövaara 9

Nollahypoteesi Sitä perusjoukon jakauman parametreja koskevaa väitettä tai oletusta, jota halutaan testata kutsutaan nollahypoteesiksi, ja merkitään H 0. Nollahypoteesista H 0 pidetään kiinni, elleivät havaintojen sisältämät todisteet nollahypoteesia vastaan ole kyllin voimakkaita. Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa H 0 : θ = θ 0 Heliövaara 10

Vaihtoehtoinen hypoteesi Vaihtoehtoinen hypoteesi H 1 on oletus, joka astuu voimaan, jos nollahypoteesi H 0 hylätään. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0 tai muotoa H 1 : θ < θ 0 vaihtoehtoista hypoteesia kutsutaan yksisuuntaiseksi. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0 vaihtoehtoista hypoteesia kutsutaan kaksisuuntaiseksi. Heliövaara 11

Testisuure Tilastollinen testi perustuu testisuureeseen, joka mittaa havaintojen ja nollahypoteesin H 0 yhteensopivuutta. Testisuure on satunnaismuuttuja, jonka arvo riippuu havainnoista ja nollahypoteesista H 0. Havaintojen ja nollahypoteesin H 0 yhteensopivuuden mittaaminen tarkoittaa sitä, että tutkitaan kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on saatu, ehdolla että H 0 pätee. Yhteensopivuuden mittaaminen vaatii siis testisuureen jakauman tuntemista. Heliövaara 12

Testisuureen normaaliarvo Testisuureen odotusarvoa nollahypoteesin H 0 pätiessä kutsutaan testisuureen normaaliarvoksi. Jos testisuureen havaittu arvo on lähellä normaaliarvoa, havainnot ovat sopusoinnussa nollahypoteesin H 0 kanssa. Jos testisuureen havaittu arvo poikkeaa merkitsevästi normaaliarvosta, havainnot sisältävät todisteita nollahypoteesia H 0 vastaan. Heliövaara 13

Virheet testauksessa Jos nollahypoteesi H 0 hylätään silloin kun se on tosi, tehdään hylkäysvirhe. Hylkäysvirheen todennäköisyys α on muotoa P r(h 0 hylätään H 0 on tosi) = α Jos nollahypoteesi H 0 jätetään voimaan silloin kun se ei ole tosi, tehdään hyväksymisvirhe. Hyväksymisvirheen todennäköisyys β on muotoa P r(h 0 jätetään voimaan H 0 ei ole tosi) = β Heliövaara 14

Hylkäys- ja hyväksymisalueet Tilastollisessa testauksessa testisuureen mahdollisten arvojen joukko jaetaan kahteen osaan (i) Jos testisuureen havainnoista laskettu arvo joutuu hylkäysalueelle, nollahypoteesi H 0 hylätään. (i) Jos testisuureen havainnoista laskettu arvo joutuu hyväksymisalueelle, nollahypoteesi H 0 jätetään voimaan. Heliövaara 15

Merkitsevyystaso Testin merkitsevyystaso α on todennäköisyys sille, että testisuureen havainnoista laskettu arvo joutuu hylkäysalueelle, jos nollahypoteesi H 0 pätee. Merkitsevyystaso α on siis hylkäysvirheen todennäköisyys. Ns. tavanomaiset merkitsevyystasot ovat α = 0.05 α = 0.01 α = 0.001 Heliövaara 16

Hylkäysalueen määrääminen yksisuuntaisessa testissä Olkoon parametria θ koskeva nollahypoteesi muotoa H 0 : θ = θ 0. olkoon testisuureena satunnaismuuttuja Z, jonka mahdolliset arvot ovat välillä (a, b). Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0, on hylkäysalue (yleensä) väli (u, b), jossa kriittinen raja u määrätään siten, että P r(z u H 0 ) = α Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ < θ 0, on hylkäysalue (yleensä) väli (a, l), jossa kriittinen raja l määrätään siten, että P r(z l H 0 ) = α Heliövaara 17

Hylkäysalueen määrääminen kaksisuuntaisessa testissä Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0, on hylkäysalue (yleensä) joukko (a, l) (u, b), jossa kriittiset rajat l ja u määrätään siten, että P r(z u H 0 ) = P r(z l H 0 ) = α/2 Huom. Jos testisuureen Z jakauma on symmetrinen origon suhteen, pätee kriittisille rajoille l = u Heliövaara 18

Tilastollisen testin suorittamisen vaiheet Tilastollisen testin suorittaminen sisältää seuraavat vaiheet: (1) Asetetaan testin hypoteesit. (2) Valitaan testisuure. (3) Valitaan merkitsevyystaso α ja muodostetaan sitä vastaava hylkäysalue. (4) Poimitaan otos niin, että yleisen hypoteesin oletukset pitävät. (5) Lasketaan testisuureen arvo havainnoista. (6) Tehdään päätös nollahypoteesin hylkäämisestä. Heliövaara 19

Tilastollisia testejä Heliövaara 20

Testi perujoukon odotusarvolle, kun otos on normaalijakaumasta Yleinen hypoteesi H : (1) X i N(µ, σ 2 ), i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : µ = µ 0 Vaihtoehtoiset hypoteesit H 1 : µ > µ 0, H 1 : µ < µ 0, H 1 : µ µ 0 Testisuure T = X µ 0 s/ n Testisuureen jakauma Jos nollahypoteesi pätee, T t(n 1). Heliövaara 21

Keskeinen raja-arvolause Olkoon X i, i = 1, 2, 3,..., n riippumattomia, samoin jakautuneita satunnaismuuttujia, joiden odotusarvo ja varianssi ovat E(X i ) = µ ja D 2 (X i ) = σ 2. Tällöin satunnaismuuttujien X i, i = 1, 2, 3,..., n summan Y n = n i=1 X i odotusarvo ja varianssi ovat E(Y n ) = nµ ja D 2 (Y n ) = nσ 2. Keskeisen raja-arvolauseen mukaan n:n suurille, mutta äärellisille arvoille pätee: X n = 1 n n i=1 ) X i a N (µ, σ2 n Heliövaara 22

Testi perujoukon odotusarvolle, kun otos ei ole normaalijakaumasta Yleinen hypoteesi H : (1) E(X i ) = µ, Var(X i ) = σ 2, i = 1,..., n (2) Satunnaismuuttujat X 1,..., X n ovat riippumattomia Nollahypoteesi H 0 : µ = µ 0 Vaihtoehtoiset hypoteesit H 1 : µ > µ 0, H 1 : µ < µ 0, H 1 : µ µ 0 Testisuure T = X µ 0 s/ n Testisuureen jakauma Jos nollahypoteesi pätee, T a t(n 1). Heliövaara 23

Kahden perusjoukon odotusarvojen vertailutesti, kun otokset ovat riippumattomia ja normaalijakautuneita 1/2 Yleinen hypoteesi H : (1) X i1 N(µ 1, σ 2 1), i = 1,..., n 1 (2) X i2 N(µ 2, σ 2 2), i = 1,..., n 2 (3) Satunnaismuuttujat X i1 ja X i2 ovat riippumattomia kaikilla i Nollahypoteesi H 0 : µ 1 = µ 2 Vaihtoehtoiset hypoteesit H 1 : µ 1 > µ 2, H 1 : µ 1 < µ 2, H 1 : µ 1 µ 2 Testisuure T = X 1 X 2 s 2 1 + s2 2 n 1 n 2 Testisuureen jakauma Jos H 0 pätee, T a t(min[(n 1 1), (n 2 1)]). Heliövaara 24

Kahden perusjoukon odotusarvojen vertailutesti, kun otokset ovat riippumattomia ja normaalijakautuneita 2/2 t-jakauman vapausasteiden lukumäärälle saadaan parempi approksimaatio Satterthwaiten kaavalla df = ( 1 s 2 1 n 1 1 n 1 ( s 2 1 + s2 2 n 1 n 2 ) 2 ) 2 + 1 n 2 1 ( s 2 2 n 2 ) 2 Suurissa otoksissa testisuureelle T pätee T a N(0, 1) Heliövaara 25

Testin voimakkuus Olkoon parametria θ koskeva nollahypoteesi muotoa H 0 : θ = θ 0 Testin voimakkuus parametrin arvolla θ on ehdollinen todennäköisyys γ(θ ) = P r(h 0 hylätään θ = θ ) Voidaan myös kirjoittaa γ(θ ) = 1 P r(h 0 hyväksytään θ = θ ) Heliövaara 26

Ilkka Mellinin kaavakokoelmasta Sovellettu todennäköisyyslasku: Kaavat ja taulukot Löytyy hyvät esitykset monista parametreja koskevista testeistä. Heliövaara 27