Mat Tilastollisen analyysin perusteet, kevät 2007

Samankaltaiset tiedostot
ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Testejä suhdeasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Testit järjestysasteikollisille muuttujille

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Mat Sovellettu todennäköisyyslasku A

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Mat Tilastollisen analyysin perusteet, kevät 2007

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

11. laskuharjoituskierros, vko 15, ratkaisut

Kaksisuuntainen varianssianalyysi. Heliövaara 1

10. laskuharjoituskierros, vko 14, ratkaisut

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

031021P Tilastomatematiikka (5 op) viikko 5

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Todennäköisyyden ominaisuuksia

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisia peruskäsitteitä ja Monte Carlo

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Teema 9: Tilastollinen merkitsevyystestaus

5.7 Uskottavuusfunktioon perustuvia testejä II

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

2. TILASTOLLINEN TESTAAMINEN...

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Estimointi. Vilkkumaa / Kuusinen 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

tilastotieteen kertaus

5 Hypoteesien testaaminen

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen aineisto Luottamusväli

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Mat Tilastollisen analyysin perusteet, kevät 2007

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Estimointi. Otantajakauma

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Mat Tilastollisen analyysin perusteet, kevät 2007

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

2. Keskiarvojen vartailua

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

1. Tilastollinen malli??

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastolliset menetelmät: Tilastolliset testit

Kertausluento. Vilkkumaa / Kuusinen 1

Transkriptio:

Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1

Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita halutaan testata Tilastollinen testaus: perusjoukosta esitettyjä väitteitä/oletuksia verrataan havainnoista saatavaa informaatioon Väitteet/oletukset puetaan perusjoukon ominaisuutta kuvaavaa todennäköisyysjakaumaa tai sen parametreja koskeviksi hypoteeseiksi Kai Virtanen 2

Testausasetelman hypoteesit Testausasetelma kiinnitetään tekemällä kolme oletusta: (i) Testausasetelmaa koskevat perusoletukset, joista pidetään kiinni testauksen aikana muodostavat testin yleisen hypoteesin (ii) Testattavaa väitettä/oletusta kutsutaan nollahypoteesiksi (iii) Jos nollahypoteesi hylätään testissä, astuu voimaan vaihtoehtoinen hypoteesi Kai Virtanen 3

Yleinen hypoteesi Yleinen hypoteesi H sisältää oletukset perusjoukosta käytetystä otantamenetelmästä perusjoukon jakaumasta Yleisen hypoteesin H oletuksista pidetään kiinni koko testauksen ajan Yleisen hypoteesin sisältämiä jakaumaoletuksia voidaan ja on yleensä syytä testata erikseen Kai Virtanen 4

Nollahypoteesi Sitä perusjoukon jakauman parametreja koskevaa väitettä tai oletusta, jota halutaan testata kutsutaan nollahypoteesiksi H 0 Nollahypoteesista H 0 pidetään kiinni, elleivät havaintojen sisältämät todisteet nollahypoteesia vastaan ole kyllin voimakkaita Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa H 0 : θ = θ 0, missäθ testattava parametri ja θ 0 kiinnitetty arvo Nollahypoteesi on muotoa on sama tai ei ole eroa Kai Virtanen 5

Vaihtoehtoinen hypoteesi Vaihtoehtoinen hypoteesi H 1 on oletus, joka astuu voimaan, jos nollahypoteesi H 0 hylätään Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0 tai muotoa H 1 : θ < θ 0 sitä kutsutaan yksisuuntaiseksi Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0 sitä kutsutaan kaksisuuntaiseksi Vaihtoehtoinen hypoteesi on muotoa ei ole sama tai on eroa Kai Virtanen 6

Testisuure Tilastollinen testi perustuu testisuureeseen, joka mittaa havaintojen ja nollahypoteesin H 0 yhteensopivuutta Testisuure on satunnaismuuttuja (vrt. estimaattori), jonka arvo (vrt. estimaatti) riippuu havainnoista ja nollahypoteesista H 0 Havaintojen ja nollahypoteesin H 0 yhteensopivuuden mittaaminen tarkoittaa sitä, että tutkitaan kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on saatu, ehdolla että H 0 pätee Yhteensopivuuden mittaaminen vaatii testisuureen jakauman tuntemista Kai Virtanen 7

Testisuureen normaaliarvo Testisuureen odotusarvoa nollahypoteesin H 0 pätiessä kutsutaan testisuureen normaaliarvoksi Jos testisuureen havaittu arvo on lähellä testisuureen normaaliarvoa, havainnot ovat sopusoinnussa nollahypoteesin H 0 kanssa Jos testisuureen otoksesta määrätty arvo poikkeaa merkitsevästi testisuureen normaaliarvosta, havainnot sisältävät todisteita nollahypoteesia H 0 vastaan Kai Virtanen 8

Testin p-arvo Nollahypoteesin H 0 hylkäys tai hyväksyminen perustuu testin p-arvoon Testinp-arvo = havaintojen todennäköisyys ehdolla, että nollahypoteesih 0 pätee Testien p-arvot saadaan tilastollisista ohjelmistoista Muinaishistoriassa käytettiin etukäteen valittuja merkitsevyystasoja ja niitä vastaavia hylkäysalueita Kai Virtanen 9

p-arvon määrääminen Testin p-arvo määrätään seuraavalla tavalla: (i) Lasketaan valitun testisuureen arvo havainnoista (ii) Määrätään testisuureen jakaumaan perustuen olettaen, että nollahypoteesi H 0 pätee todennäköisyys sille, että testisuure saa (normaaliarvoonsa verrattuna) niin poikkeuksellisen arvon kuin se on saanut tai vielä poikkeuksellisempia arvoja Nollahypoteesi voidaan hylätä, jos testin p-arvo on kyllin pieni Mitä pienempi on testin p-arvo, sitä vahvempia todisteita havainnot sisältävät nollahypoteesia H 0 vastaan Kai Virtanen 10

Vielä kerran... Tilastollinen testi, joka kertoo jokaisessa yksittäisessä tilanteessa eli jokaiselle otokselle, onko nollahypoteesi H 0 hylättävä vai ei, voidaan perustaa seuraavalla tavalla testin p-arvoon: (i) Valitaan pieni todennäköisyys p 0 (ii) Määrätään testin p-arvo Jos p < p 0, hylätään nollahypoteesi H 0 ja hyväksytään vaihtoehtoinen hypoteesi H 1 Jos p p 0, jätetään nollahypoteesi H 0 voimaan Kai Virtanen 11

Testin merkitsevyystaso Jos nollahypoteesi H 0 hylätään silloin, kun se on tosi, tehdään hylkäysvirhe: Pr(H 0 hylätään H 0 on tosi) = α Koska testeissä halutaan ensisijaisesti suojautua hylkäysvirhettä vastaan, testin merkitsevyystasoksi (parvoon liittyvä raja p 0 )αon tapana valita pieniä lukuja Tavanomaiset merkitsevyystasot ovat α = 0.05 α = 0.01 α = 0.001 Esim. Testin p-arvo < 0.05 => nollahypoteesi hylätään Kai Virtanen 12

p-arvon määrääminen, H 1 : θ > θ 0 Olkoon testisuureen Z havainnoista määrätty arvo z Jos vaihtoehtoisena hypoteesina on yksisuuntainen vaihtoehto H 1 : θ > θ 0 niin testin p-arvo on p = Pr(Z z H 0 ) Testisuureen tiheysfunktio p 1 p 0 z Kai Virtanen 13

p-arvon määrääminen, H 1 : θ < θ 0 Olkoon testisuureen Z havainnoista määrätty arvo z Jos vaihtoehtoisena hypoteesina on yksisuuntainen vaihtoehto H 1 : θ < θ 0 niin testin p-arvo on p = Pr(Z z H 0 ) Testisuureen tiheysfunktio p 1 p z 0 Kai Virtanen 14

p-arvon määrääminen, H 1 : θ θ 0 Olkoon testisuureen Z havainnoista määrätty arvo z Jos vaihtoehtoisena hypoteesina on kaksisuuntainen vaihtoehto H 1 : θ θ 0 niin testin p-arvo on p = 2 X Pr(Z z H 0 ) Testisuureen tiheysfunktio p/2 p/2 1 p z 0 + z Kai Virtanen 15

Tilastollisen testin suorittamisen vaiheet 1. Asetetaan testin hypoteesit 2. Valitaan testisuure 3. Poimitaan otos niin, että yleisen hypoteesin oletukset pätevät 4. Määrätään testisuureen arvo havainnoista 5. Määrätään testisuureen havaittua arvoa vastaava p-arvo 6. Tehdään päätös nollahypoteesin hylkäämisestä Kai Virtanen 16