Testejä suhdeasteikollisille muuttujille

Samankaltaiset tiedostot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit järjestysasteikollisille muuttujille

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Väliestimointi (jatkoa) Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastolliset menetelmät: Tilastolliset testit

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Normaalijakaumasta johdettuja jakaumia

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

10. laskuharjoituskierros, vko 14, ratkaisut

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Mat Sovellettu todennäköisyyslasku A

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Mat Tilastollisen analyysin perusteet, kevät 2007

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Sovellettu todennäköisyyslaskenta B

tilastotieteen kertaus

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Hypoteesin testaus Alkeet

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Osa 2: Otokset, otosjakaumat ja estimointi

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

9. laskuharjoituskierros, vko 12-13, ratkaisut

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Otoskoko 107 kpl. a) 27 b) 2654

3.6 Su-estimaattorien asymptotiikka

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) viikko 5

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Mat Tilastollisen analyysin perusteet, kevät 2007

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

2. Keskiarvojen vartailua

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Parametrin estimointi ja bootstrap-otanta

Todennäköisyyden ominaisuuksia

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

riippumattomia ja noudattavat samaa jakaumaa.

2. TILASTOLLINEN TESTAAMINEN...

Transkriptio:

Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1

Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus t-testi parivertailuille Yhden otoksen testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (007)

Testit normaalijakauman parametreille Normaalijakauman parametrien tilastolliset testit 1/ Normaalijakauma on tilastotieteen tärkein jakauma. Oletetaan, että satunnaismuuttuja X noudattaa normaalijakaumaa parametrein µ ja σ : X N( µ, σ ) Tällöin E(X) = µ on normaalijakauman odotusarvo ja Var(X) = σ on normaalijakauman varianssi. Parametrit µ ja σ määräävät täysin normaalijakauman. TKK (c) Ilkka Mellin (007) 3

Testit normaalijakauman parametreille Normaalijakauman parametrien tilastolliset testit / Normaalijakauman parametreja koskevat testit voidaan jakaa kahteen ryhmään: Yhden otoksen testit Kahden otoksen testit eli vertailutestit Yhden otoksen testeissä testataan yksinkertaisia nollahypoteeseja, jotka koskevat normaalijakauman odotusarvo- tai varianssiparametria. Kahden otoksen testit ovat vertailutestejä, joilla verrataan kahden normaalijakauman odotusarvo- tai varianssiparametreja toisiinsa. TKK (c) Ilkka Mellin (007) 4

Testit normaalijakauman parametreille Normaalijakauman parametreille tarkoitettujen testien yleinen soveltuvuus 1/ Testejä normaalijakauman odotusarvolle sovelletaan usein myös sellaisissa tilanteissa, joissa havainnot eivät noudata normaalijakaumaa. Tämä perustuu seuraaviin seikkoihin: (i) Esitettävät testit odotusarvolle perustuvat havaintojen aritmeettisiin keskiarvoihin. (ii) Keskeisen raja-arvolauseen mukaan myös einormaalisten havaintojen aritmeettiset keskiarvot noudattavat tietyin ehdoin suurissa otoksissa approksimatiivisesti normaalijakaumaa. TKK (c) Ilkka Mellin (007) 5

Testit normaalijakauman parametreille Normaalijakauman parametreille tarkoitettujen testien yleinen soveltuvuus / Sen sijaan testit normaalijakauman varianssille eivät yleensä ole käyttökelpoisia ei-normaalisille havainnoille ja tilanne ei välttämättä parane suurillakaan havaintojen lukumäärillä. TKK (c) Ilkka Mellin (007) 6

Testit normaalijakauman parametreille Tavanomaiset testit normaalijakauman parametreille Tarkastelemme seuraavia testejä normaalijakauman parametreille: Yhden otoksen t-testi odotusarvolle Kahden riippumattoman otoksen t-testi A odotusarvoille: Yleinen tapaus Kahden riippumattoman otoksen t-testi B: odotusarvoille: Yhtä suurten varianssien tapaus t-testi parivertailuille Yhden otoksen χ -testi varianssille Kahden riippumattoman otoksen F-testi variansseille eli varianssien vertailutesti TKK (c) Ilkka Mellin (007) 7

Testejä suhdeasteikollisille muuttujille Testit normaalijakauman parametreille >> Yhden otoksen t-testi Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus t-testi parivertailuille Yhden otoksen testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (007) 8

Yhden otoksen t-testi Testausasetelma 1/ Olkoon X 1, X,, X n yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (007) 9

Yhden otoksen t-testi Testausasetelma / Asetetaan normaalijakauman N( µ, σ ) odotusarvo- eli paikkaparametrille µ nollahypoteesi H 0 :µ = µ 0 Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on yhden otoksen t-testi. TKK (c) Ilkka Mellin (007) 10

Yhden otoksen t-testi Hypoteesit Yleinen hypoteesi H : (i) Havainnot Xi N( µ, σ ), i= 1,,, n (ii) Havainnot X 1, X,, X n ovat riippumattomia Nollahypoteesi H 0 : H 0 :µ = µ 0 Vaihtoehtoinen hypoteesi H 1 : H: 1 µ > µ 0 1-suuntaiset vaihtoehtoiset hypoteesit H: 1 µ < µ 0 H : µ µ -suuntainen vaihtoehtoinen hypoteesi 1 0 TKK (c) Ilkka Mellin (007) 11

Yhden otoksen t-testi Parametrien estimointi Olkoot X ja 1 n Xi n i = 1 = 1 s X X n = ( i ) n 1 i= 1 tavanomaiset harhattomat estimaattorit parametreille E(X i ) = µ, i = 1,,, n ja Var(X i ) = σ, i = 1,,, n TKK (c) Ilkka Mellin (007) 1

Yhden otoksen t-testi Testisuure ja sen jakauma Määritellään t-testisuure X µ 0 t = s/ n Jos nollahypoteesi H 0 :µ = µ 0 pätee, niin testisuure t noudattaa Studentin t-jakaumaa vapausastein (n 1): t t( n 1) TKK (c) Ilkka Mellin (007) 13

Yhden otoksen t-testi Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/ Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X 1, X,, X n X i N( µ 0, σ ), i = 1,,, n Koska tällöin (ks. lukua Otokset ja otosjakaumat) niin X 1 σ n = Xi N µ 0, n i= 1 n X µ 0 z = N(0,1) σ / n Koska standardipoikkeama σ on tuntematon, satunnaismuuttujan z lauseke on testisuureena epäoperationaalinen. TKK (c) Ilkka Mellin (007) 14

Yhden otoksen t-testi Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu / Jos standardipoikkeama σ korvataan satunnaismuuttujan z lausekkeessa vastaavalla otossuureella n 1 s = ( Xi X) n 1 i= 1 niin saadaan t-testisuure X µ 0 t = s / n joka nollahypoteesin H 0 pätiessä noudattaa t-jakaumaa vapausastein (n 1): t t(n 1) Todistus: ks. lukua Otokset ja otosjakaumat. TKK (c) Ilkka Mellin (007) 15

Yhden otoksen t-testi t-testisuure mittaa tilastollista etäisyyttä Testisuure X µ 0 t = s/ n mittaa havaintoarvojen aritmeettisen keskiarvon ja nollahypoteesin H 0 :µ = µ 0 kiinnittämän odotusarvoparametrin µ arvon µ 0 tilastollista etäisyyttä. Mittayksikkönä on erotuksen X µ 0 standardipoikkeaman σ / n estimaattori, jota määrättäessä on oletettu, että nollahypoteesi H 0 pätee. TKK (c) Ilkka Mellin (007) 16

Yhden otoksen t-testi Testi Testisuureen X µ 0 t = s/ n normaaliarvo = 0, koska nollahypoteesin pätiessä E(t) = 0 H 0 :µ = µ 0 Siten itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (007) 17

Yhden otoksen t-testi Testin hylkäysalueen määrääminen 1/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ > µ 0 niin kriittinen arvo +t α saadaan ehdosta Pr(t +t α ) = α jossa t t(n 1) Testin hylkäysalue on tällöin muotoa (+t α, + ) TKK (c) Ilkka Mellin (007) 18

Yhden otoksen t-testi Testin hylkäysalueen määrääminen /4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ < µ 0 niin kriittinen arvo t α saadaan ehdosta Pr(t t α ) = α jossa t t(n 1) Testin hylkäysalue on tällöin muotoa (, t α ) TKK (c) Ilkka Mellin (007) 19

Yhden otoksen t-testi Testin hylkäysalueen määrääminen 3/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ µ 0 niin kriittiset arvot t α/ ja +t α/ saadaan ehdoista Pr(t t α/ ) = α/ Pr(t +t α/ ) = α/ jossa t t(n 1) Testin hylkäysalue on tällöin muotoa (, t α ) (+t α, + ) TKK (c) Ilkka Mellin (007) 0

Yhden otoksen t-testi Testin hylkäysalueen määrääminen 4/4 Oletetaan, että testin merkitsevyystasoksi on valittu α. Testin hylkäysalueen määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:µ 1 µ 0 H:µ µ > H:µ 1 < µ 0 1 0 tn ( 1) tn ( 1) tn ( 1) 1 α α α 1 α 1 α 1 α 1 α + t α t α t α / +t α / Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue TKK (c) Ilkka Mellin (007) 1

Yhden otoksen t-testi Testin p-arvo Olkoon t-testisuureen havaittu arvo t 0. Testin p-arvon määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:µ 1 µ 0 H:µ µ > H:µ 1 < µ 0 1 0 tn ( 1) tn ( 1) tn ( 1) p p p p 1 p 1 p 1 p t + t t0 t0 0 0 Testin p-arvo = p Testin p-arvo = p Testin p-arvo = p TKK (c) Ilkka Mellin (007)

Yhden otoksen t-testi Normaalisuusoletuksen merkitys 1/ Yhden otoksen t-testin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita. t-testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos havaintojen lukumäärä n on kyllin suuri. TKK (c) Ilkka Mellin (007) 3

Yhden otoksen t-testi Normaalisuusoletuksen merkitys / Testiä on melko turvallista käyttää, kun havaintojen lukumäärä n > 15 ellei havaintojen jakauma ole kovin vino ja havaintojen joukossa ole poikkeavia havaintoja. Jos havaintojen lukumäärä n > 40 testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille. TKK (c) Ilkka Mellin (007) 4

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 1/6 Tarkastellaan t-testin hyväksymisvirheen todennäköisyyttä ja voimakkuutta tilanteessa, jossa normaalijakauman N( µ, σ ) varianssi σ oletetaan tunnetuksi. Olkoon nollahypoteesi muotoa H 0 :µ = µ 0 ja vaihtoehtoinen hypoteesi muotoa H:µ 1 < µ 0 Huomautus: Jos normaalijakauman varianssia σ ei oleteta tunnetuksi, vaatii t-testin voimakkuuden määrääminen ns. epäkeskisen t-jakauman määrittelemistä. Tämän yleisen tapauksen käsittely sivuutetaan tässä esityksessä. TKK (c) Ilkka Mellin (007) 5

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus /6 t-testisuure X µ 0 t = σ / n noudattaa nollahypoteesin H 0 :µ = µ 0 pätiessä standardoitua normaalijakaumaa (ks. lukua Otokset ja otosjakaumat): t N(0, 1) TKK (c) Ilkka Mellin (007) 6

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 3/6 Vaihtoehtoisen hypoteesin H:µ 1 < µ 0 tapauksessa t-testin päätössääntö on muotoa: Hylkää nollahypoteesi H 0 :µ = µ 0 jos X µ 0 t = < zα σ / n Kriittinen arvo z α saadaan ehdosta Pr(z z α ) = α jossa z N(0, 1). TKK (c) Ilkka Mellin (007) 7

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 4/6 Vaihtoehtoisen hypoteesin H:µ 1 < µ 0 tapauksessa t-testin päätössääntö voidaan kirjoittaa myös seuraavaan muotoon: Hylkää nollahypoteesi H 0 :µ = µ 0 jos X < µ 0 zασ / n = Xc Kriittinen arvo z α saadaan ehdosta Pr(z z α ) = α jossa z N(0, 1). TKK (c) Ilkka Mellin (007) 8

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 5/6 Vaihtoehtoisen hypoteesin H:µ 1 < µ 0 tapauksessa t-testin hyväksymisvirheen todennäköisyys β on ehdollinen todennäköisyys jossa β = Pr(H0 jätetään voimaan H0ei ole tosi) = Pr( X X µ = µ ) = Pr z µ µ 0 c X c µ σ / n TKK (c) Ilkka Mellin (007) 9

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 6/6 Vaihtoehtoisen hypoteesin H:µ 1 < µ 0 tapauksessa t-testin voimakkuus 1 β on ehdollinen todennäköisyys 1 β = Pr(H0hylätään H0ei ole tosi) = Pr( X < X µ = µ ) jossa µ µ 0 = Pr z < c X c µ σ / n TKK (c) Ilkka Mellin (007) 30

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 1/3 Kuvio oikealla havainnollistaa t- testin hyväksymisvirheen todennäköisyyttä β ja voimakkuutta 1 β. Yleinen hypoteesi H : X 1, X,, X n X i ~ N(µ, σ ), i = 1,,, n Nollahypoteesi H 0 : µ = µ 0 Vaihtoehtoinen hypoteesi H 1 : µ < µ 0 N(µ,σ /n ) N(µ 0,σ /n) α β µ µ 0 X c TKK (c) Ilkka Mellin (007) 31

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus /3 Valitaan merkitsevyystasoksi α. Kriittinen raja z α : Pr(z z α ) = α z N(0, 1) Kriittinen raja X c : X c = µ 0 zασ / n Päätössääntö: Hylkää nollahypoteesi H 0, jos X < X c N(µ,σ /n ) α N(µ 0,σ /n) β µ µ 0 X c TKK (c) Ilkka Mellin (007) 3

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 3/3 Hyväksymisvirheen todennäköisyys β : β = Pr( X X c µ = µ ) Voimakkuus 1 β : 1 β = Pr( X < X c µ = µ ) N(µ,σ /n ) N(µ 0,σ /n) α β µ µ 0 X c TKK (c) Ilkka Mellin (007) 33

Testejä suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi >> Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus t-testi parivertailuille Yhden otoksen testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (007) 34

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testausasetelma 1/4 Olkoon X11, X1,, Xn 11 yksinkertainen satunnaisotos perusjoukosta S 1, joka noudattaa normaalijakaumaa N( µ 1, σ1) Jakauma riippuu seuraavista parametreista: µ 1 = jakauman odotusarvo σ 1 = jakauman varianssi TKK (c) Ilkka Mellin (007) 35

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testausasetelma /4 Olkoon X1, X,, Xn yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (007) 36

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testausasetelma 3/4 Oletetaan lisäksi, että perusjoukosta S 1 poimittu otos X11, X1,, Xn 11 ja perusjoukosta S poimittu otos X1, X,, Xn ovat toisistaan riippumattomia. Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S 1 ei vaikuta siihen mikä alkioista poimitaan perusjoukosta S ja kääntäen. TKK (c) Ilkka Mellin (007) 37

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testausasetelma 4/4 Asetetaan normaalijakaumien N( µ 1, σ1) ja N( µ, σ ) odotusarvo-eli paikkaparametreille µ 1 ja µ nollahypoteesi H 0:µ 1 = µ = µ Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on kahden riippumattoman otoksen t-testi A. Huomautus: Jos voidaan olettaa, että σ1 = σ, testauksessa kannattaa käyttää kahden riippumattoman otoksen t-testiä B. TKK (c) Ilkka Mellin (007) 38

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Yleinen hypoteesi Yleinen hypoteesi H : (1) Havainnot Xi1 N( µ 1, σ 1), i= 1,,, n1 () Havainnot X j N( µ, σ ), j = 1,,, n (3) Havainnot X i1 ja X j ovat riippumattomia kaikille i ja j. Huomautuksia: Oletus (3) sisältää kolme riippumattomuusoletusta: Havainnot ovat riippumattomia otoksien 1 ja sisällä. Havainnot ovat riippumattomia otoksien 1 ja välillä. Jakaumien varianssit saavat (mutta ei tarvitse) erota toisistaan; vrt. kahden otoksen t-testi B. TKK (c) Ilkka Mellin (007) 39

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Nollahypoteesi ja vaihtoehtoiset hypoteesit Nollahypoteesi H 0 : H 0:µ 1 = µ = µ Vaihtoehtoinen hypoteesi H 1 : H: 1 µ 1 > µ 1-suuntaiset vaihtoehtoiset hypoteesit H: 1 µ 1 < µ H : µ µ -suuntainen vaihtoehtoinen hypoteesi 1 1 TKK (c) Ilkka Mellin (007) 40

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Parametrien estimointi Olkoot ja n 1 k Xk = Xik, k = 1, n k i = 1 n 1 k s = ( X X ), k = 1, k ik k n k 1 i= 1 tavanomaiset harhattomat estimaattorit parametreille E(X ik ) = µ k, i = 1,,, n k, k = 1, ja Var(X ik ) = σ k, i = 1,,, n k, k = 1, TKK (c) Ilkka Mellin (007) 41

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testisuure ja sen asymptoottinen jakauma Määritellään t-testisuure X1 X t = s1 s + n1 n Jos nollahypoteesi H 0:µ 1 = µ = µ pätee, niin testisuure t noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0,1): t a N(0,1) TKK (c) Ilkka Mellin (007) 4

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/3 Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X, X,, X, X, X,, X 11 1 n 1 1 n 1 X N( µσ, ), i = 1,,, n i1 1 1 X j N( µσ, ), j = 1,,, n Tällöin (ks. lukua Otos ja otosjakaumat) n1 1 σ 1 X1 = Xi1 N µ, n1 i= 1 n1 n 1 σ X = X j N µ, n j= 1 n Koska X1 X, niin σ1 σ X1 X N 0, + n1 n TKK (c) Ilkka Mellin (007) 43

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu /3 Edellä esitetystä seuraa, että X1 X z = N(0,1) σ1 σ + n1 n Koska varianssit σ ovat tuntemattomia, satunnaismuuttujan z 1 ja σ lauseke on testisuureena epäoperationaalinen. TKK (c) Ilkka Mellin (007) 44

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 3/3 Jos satunnaismuuttujan z lausekkeessa varianssit σ1 ja σ korvataan vastaavilla otossuureilla n 1 k sk = ( Xik Xk), k = 1, n k 1 i= 1 niin saadaan t-testisuure X1 X t = s1 s + n n 1 joka nollahypoteesin H 0 pätiessä noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0, 1): t a N(0, 1) Todistus sivuutetaan. TKK (c) Ilkka Mellin (007) 45

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testisuureen jakauman approksimointi 1/ Pienissä otoksissa saadaan testisuureen t jakaumalle parempi approksimaatio käyttämällä approksimaationa Studentin t-jakaumaa vapausastein (ns. Satterthwaiten approksimaatio) ν = s n s + n 1 1 1 s 1 s 1 + n1 1 n 1 n 1 n TKK (c) Ilkka Mellin (007) 46

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testisuureen jakauman approksimointi / Joskus testisuureen t jakaumaa approksimoidaan myös Studentin t-jakaumalla vapausastein v= min{ n1 1, n 1} Tämä approksimaatio ei kuitenkaan ole yhtä hyvä kuin Satterthwaiten approksimaatio. TKK (c) Ilkka Mellin (007) 47

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus t-testisuure mittaa tilastollista etäisyyttä Testisuure X X t = s s + n n 1 1 1 mittaa otoksien 1 ja aritmeettisten keskiarvojen tilastollista etäisyyttä. Mittayksikkönä on erotuksen X1 Xstandardipoikkeaman σ1 σ + n1 n estimaattori, jota määrättäessä on oletettu, että nollahypoteesi H 0 pätee. TKK (c) Ilkka Mellin (007) 48

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testi Testisuureen X X t = s s + n n 1 1 1 normaaliarvo = 0, koska nollahypoteesin pätiessä E(t) = 0 H 0:µ 1 = µ = µ Siten itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (007) 49

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testin hylkäysalueen määrääminen 1/5 Käsittelemme seuraavassa kahden otoksen t-testin A hylkäysalueen valintaa, jos testisuureen approksimoidaan standardoidulla normaalijakaumalla N(0, 1). Jos kahden otoksen t-testin A testisuuretta approksimoidaan t-jakaumalla, jossa vapausasteiden lukumäärä ν lasketaan Satterthwaiten kaavan mukaan, testin hylkäysalue määrätään samalla tavalla kuin yhden otoksen t-testin tapauksessa. TKK (c) Ilkka Mellin (007) 50

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testin hylkäysalueen määrääminen /5 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ > µ 0 niin kriittinen arvo +t α saadaan ehdosta Pr(t +t α ) = α jossa t a N(0, 1) Testin hylkäysalue on tällöin muotoa (+t α, + ) TKK (c) Ilkka Mellin (007) 51

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testin hylkäysalueen määrääminen 3/5 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ < µ 0 niin kriittinen arvo t α saadaan ehdosta Pr(t t α ) = α jossa t a N(0, 1) Testin hylkäysalue on tällöin muotoa (, t α ) TKK (c) Ilkka Mellin (007) 5

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testin hylkäysalueen määrääminen 4/5 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ µ 0 niin kriittiset arvot t α/ ja +t α/ saadaan ehdoista Pr(t t α/ ) = α/ Pr(t +t α/ ) = α/ jossa t a N(0,1) Testin hylkäysalue on tällöin muotoa (, t α ) (+t α, + ) TKK (c) Ilkka Mellin (007) 53

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testin hylkäysalueen määrääminen 5/5 Oletetaan, että testin merkitsevyystasoksi on valittu α. Testin hylkäysalueen määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:µ 1 1 µ > H:µ 1 1 < µ H:µ 1 1 µ N(0,1) N(0,1) N(0,1) 1 α α α 1 α 1 α 1 α 1 α + t α t α t α / +t α / Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue TKK (c) Ilkka Mellin (007) 54

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Testin p-arvo Olkoon t-testisuureen havaittu arvo t 0. Testin p-arvon määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:µ 1 1 µ > H:µ 1 1 < µ H:µ 1 1 µ N(0,1) N(0,1) N(0,1) p p p p 1 p 1 p 1 p t + t t0 t0 0 0 Testin p-arvo = p Testin p-arvo = p Testin p-arvo = p TKK (c) Ilkka Mellin (007) 55

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Normaalisuusoletuksen merkitys 1/ Kahden otoksen t-testin A yleisen hypoteesin mukaan havainnot ovat molemmissa otoksissa normaalijakautuneita. Testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos molempien otosten otoskoot ovat kyllin suuria. TKK (c) Ilkka Mellin (007) 56

Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Normaalisuusoletuksen merkitys / Testiä on melko turvallista käyttää, kun n 1 > 15 ja n > 15 ja n 1 ja n eivät eroa toisistaan kovin paljon, elleivät havaintojen jakaumat ole kovin vinoja ja ellei havaintojen joukossa ole poikkeavia havaintoja. Jos n 1 > 40 ja n > 40 testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille. TKK (c) Ilkka Mellin (007) 57

Testejä suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden riippumattoman otoksen t-testi A: Yleinen tapaus >> Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus t-testi parivertailuille Yhden otoksen testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (007) 58

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testausasetelma 1/4 Olkoon X11, X1,, Xn 11 yksinkertainen satunnaisotos perusjoukosta S 1, joka noudattaa normaalijakaumaa N( µ 1, σ ) Jakauma riippuu seuraavista parametreista: µ 1 = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (007) 59

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testausasetelma /4 Olkoon X1, X,, Xn yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (007) 60

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testausasetelma 3/4 Oletetaan lisäksi, että perusjoukosta S 1 poimittu otos X11, X1,, Xn 11 ja perusjoukosta S poimittu otos X1, X,, Xn ovat toisistaan riippumattomia. Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S 1 ei vaikuta siihen mikä alkioista poimitaan perusjoukosta S ja kääntäen. TKK (c) Ilkka Mellin (007) 61

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testausasetelma 4/4 Asetetaan normaalijakaumien N( µ 1, σ ) ja N( µ, σ ) odotusarvo-eli paikkaparametreille µ 1 ja µ nollahypoteesi H 0:µ 1 = µ = µ Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on kahden riippumattoman otoksen t-testi yhtä suurten varianssien tapauksessa. Huomautus: Jos jakaumien varianssit eivät ole yhtä suuret, testauksessa pitää käyttää kahden riippumattoman otoksen t-testiä A. TKK (c) Ilkka Mellin (007) 6

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Yleinen hypoteesi Yleinen hypoteesi H : (1) Xi1 N( µ 1, σ ), i= 1,,, n1 () X j N( µ, σ ), j = 1,,, n (3) Havainnot X i1 ja X j ovat riippumattomia kaikille i ja j Huomautuksia: Oletus (3) sisältää kolme riippumattomuusoletusta: Havainnot ovat riippumattomia otoksien 1 ja sisällä. Havainnot ovat riippumattomia otoksien 1 ja välillä. Jakaumien varianssit on tässä oletettu yhtä suuriksi; vrt. kahden otoksen t-testi A. TKK (c) Ilkka Mellin (007) 63

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Nollahypoteesi ja vaihtoehtoiset hypoteesit Nollahypoteesi H 0 : H 0:µ 1 = µ = µ Vaihtoehtoinen hypoteesi H 1 : H: 1 µ 1 > µ 1-suuntaiset vaihtoehtoiset hypoteesit H: 1 µ 1 < µ H : µ µ -suuntainen vaihtoehtoinen hypoteesi 1 1 TKK (c) Ilkka Mellin (007) 64

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Parametrien estimointi Olkoot ja n 1 k Xk = Xik, k = 1, n k i = 1 n 1 k s = ( X X ), k = 1, k ik k n k 1 i= 1 tavanomaiset harhattomat estimaattorit parametreille E(X ik ) = µ k, i = 1,,, n k, k = 1, ja Var(X ik ) = σ, i = 1,,, n k, k = 1, TKK (c) Ilkka Mellin (007) 65

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Yhdistetty varianssiestimaattori Määritellään ns. yhdistetty varianssiestimaattori s Yhdistetty varianssiestimaattori s P on harhaton estimaattori varianssiparametrille σ, jos nollahypoteesi H :µ = µ = µ pätee. Huomautus: ( n 1) s + ( n 1) s 1 1 P = n1+ n 0 1 Yhdistetty varianssiestimaattori s P ei ole sama kuin yhdistetyn otoksen varianssi, koska otoskeskiarvot X1 ja X eivät (yleensä) ole yhtä suuria. TKK (c) Ilkka Mellin (007) 66

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testisuure ja sen jakauma Määritellään t-testisuure X1 X t = 1 1 sp + n1 n Jos nollahypoteesi H 0:µ 1 = µ = µ pätee, niin testisuure t noudattaa Studentin t-jakaumaa vapausastein (n 1 + n ): t t( n + n ) 1 TKK (c) Ilkka Mellin (007) 67

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/3 Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X, X,, X, X, X,, X Tällöin (ks. lukua Otos ja otosjakaumat) X 11 1 n 1 1 n X N 0, σ 1 X N( µσ, ), i = 1,,, n i1 1 j N( µσ, ), = 1,,, X j n n1 1 σ X1 = Xi1 N µ, n1 i= 1 n1 n 1 σ X = X j N µ, n j= 1 n Koska X X, niin 1 1 1 1 + n1 n TKK (c) Ilkka Mellin (007) 68

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu /3 Edellä esitetystä seuraa, että X1 X z = N(0,1) 1 1 σ + n n 1 Koska standardipoikkeama σ on tuntematon, satunnaismuuttujan z lauseke on testisuureena epäoperationaalinen. Määritellään otosvarianssit n 1 k sk = ( Xik Xk), k = 1, 1 n k i= 1 TKK (c) Ilkka Mellin (007) 69

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 3/3 Jos satunnaismuuttujan z lausekkeessa standardipoikkeama σ korvataan otossuureella ( n1 1) s1 + ( n 1) s sp = n + n niin saadaan t-testisuure X1 X t = 1 1 sp + n n 1 1 joka nollahypoteesin H 0 pätiessä noudattaa t-jakaumaa vapausastein (n 1 + n ): t t(n 1 + n ) Todistus sivuutetaan; ks. kuitenkin vastaavaa todistusta yhden otoksen t-testin tapauksessa ja siellä esitettyjä viittauksia. TKK (c) Ilkka Mellin (007) 70

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus t-testisuure mittaa tilastollista etäisyyttä Testisuure X t = s P 1 1 1 + n n mittaa otoksien 1 ja aritmeettisten keskiarvojen tilastollista etäisyyttä. Mittayksikkönä on erotuksen X1 Xstandardipoikkeaman 1 1 σ + n n 1 X 1 estimaattori, jota määrättäessä on oletettu, että nollahypoteesi H 0 pätee. TKK (c) Ilkka Mellin (007) 71

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testi Testisuureen X1 X t = 1 1 sp + n n 1 normaaliarvo = 0, koska nollahypoteesin pätiessä E(t) = 0 H 0:µ 1 = µ = µ Siten itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (007) 7

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Testin hylkäysalueen määrääminen ja testin p-arvo Kahden otoksen t-testin B hylkäysalueen valinta tapahtuu samalla tavalla kuin yhden otoksen t-testin tapauksessa paitsi, että t-testi-suure noudattaa tässä t-jakaumaa vapausastein (n 1 + n ). Kahden otoksen t-testin B testisuureen arvoa vastaavan p- arvon määrääminen tapahtuu kuten yhden otoksen t-testin tapauksessa paitsi, että t-testisuure noudattaa tässä t- jakaumaa vapausastein (n 1 + n ). TKK (c) Ilkka Mellin (007) 73

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Normaalisuusoletuksen merkitys 1/ Kahden otoksen t-testin B yleisen hypoteesin mukaan havainnot ovat molemmissa otoksissa normaalijakautuneita. Testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos molempien otosten otoskoot ovat kyllin suuria. TKK (c) Ilkka Mellin (007) 74

Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus Normaalisuusoletuksen merkitys / Testiä on melko turvallista käyttää, kun n 1 > 15 ja n > 15 ja n 1 ja n eivät eroa toisistaan kovin paljon, elleivät havaintojen jakaumat ole kovin vinoja ja ellei havaintojen joukossa ole poikkeavia havaintoja. Jos n 1 > 40 ja n > 40 testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille. TKK (c) Ilkka Mellin (007) 75

Testejä suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus >> t-testi parivertailuille Yhden otoksen testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (007) 76

t-testi parivertailuille Parivertailuasetelma Parivertailuasetelma syntyy tilastollisessa tutkimuksessa esimerkiksi seuraavissa tilanteissa: (i) Päämääränä on verrata kahta mittaria mittaamalla molemmilla mittareilla samat kohteet samoissa olosuhteissa. (ii) Päämääränä on tutkia jonkin käsittelyn vaikutusta mittaamalla samat kohteet ennen käsittelyä ja käsittelyn jälkeen. (iii) Päämääränä on vertailla kahta perusjoukkoa mittaamalla saman muuttujan arvot perusjoukkojen alkioiden sovitetuissa pareissa. TKK (c) Ilkka Mellin (007) 77

t-testi parivertailuille Testausasetelma 1/ Oletetaan, että havainnot muodostuvat muuttujaa X koskevista mittaustuloksien pareista (X i1, X i ), i = 1,,, n jotka ovat riippumattomia. Päämääränä on verrata mittauksia toisiinsa: Antavatko mittaukset keskimäärin saman tuloksen? Tällaisissa parivertailuasetelmissa ei saa käyttää riippumattomien otoksien t-testiä A tai B, koska mittaustulokset X i1 ja X i eivät yleensä ole riippumattomia. TKK (c) Ilkka Mellin (007) 78

t-testi parivertailuille Testausasetelma / Muodostetaan mittaustuloksien X i1 ja X i erotukset D, 1,,, i = Xi1 Xi i = n Mittaukset 1 ja antavat keskimäärin saman tuloksen, jos erotukset D i saavat keskimäärin arvon nolla. Parivertailuasetelman testausongelman ratkaisuna on tavanomainen yhden otoksen t-testi mittaustuloksien X i1 ja X i erotuksien D i odotusarvolle. TKK (c) Ilkka Mellin (007) 79

t-testi parivertailuille Hypoteesit Yleinen hypoteesi H : (1) Erotukset () Erotukset D 1, D,, D n ovat riippumattomia Nollahypoteesi H 0 : H : µ = 0 0 D i N( µ D, σ D), = 1,,, D i n Vaihtoehtoinen hypoteesi H 1 : H: 1 µ D 0 1-suuntaiset vaihtoehtoiset hypoteesit > H: 1 µ D < 0 H : µ 0 -suuntainen vaihtoehtoinen hypoteesi 1 D TKK (c) Ilkka Mellin (007) 80

t-testi parivertailuille Parametrien estimointi Olkoot 1 n Di n i = 1 D= ja 1 s D D n D = ( i ) n 1 i= 1 tavanomaiset harhattomat estimaattorit parametreille E(D i ) = µ D, i = 1,,, n ja Var(D i ) = σ D, i = 1,,, n TKK (c) Ilkka Mellin (007) 81

t-testi parivertailuille Testisuure ja sen jakauma Määritellään t-testisuure D t = sd / n Jos nollahypoteesi H 0 : µ D = 0 pätee, niin testisuure t noudattaa Studentin t-jakaumaa vapausastein (n 1): t t( n 1) TKK (c) Ilkka Mellin (007) 8

t-testi parivertailuille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/ Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: D 1, D,, D n Di N(0, σ D), i = 1,,, n Koska tällöin (ks. lukua Otokset ja otosjakaumat) n 1 σ D D= Di N 0, n i= 1 n niin D z = N(0,1) σ D / n Koska standardipoikkeama σ D on tuntematon, satunnaismuuttujan z lauseke on testisuureena epäoperationaalinen. TKK (c) Ilkka Mellin (007) 83

t-testi parivertailuille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu / Jos satunnaismuuttujan z lausekkeessa standardipoikkeama σ D korvataan vastaavalla otossuureella n 1 sd = ( Di D) n 1 i= 1 niin saadaan t-testisuure D t = sd / n joka nollahypoteesin H 0 pätiessä noudattaa t-jakaumaa vapausastein (n 1): t t(n 1) Todistus: ks. kappaletta Yhden otoksen t-testi. TKK (c) Ilkka Mellin (007) 84

t-testi parivertailuille t-testisuure mittaa tilastollista etäisyyttä Testisuure D t = s / D n mittaa havaintoarvojen erotuksien aritmeettisen keskiarvon tilastollista etäisyyttä nollasta. Mittayksikkönä on erotuksien D i aritmeettisen keskiarvon D standardipoikkeaman σ D n estimaattori, jota määrättäessä on oletettu, että nollahypoteesi H 0 pätee. TKK (c) Ilkka Mellin (007) 85

t-testi parivertailuille Testi Testisuureen D t = s / D n normaaliarvo = 0, koska nollahypoteesin H 0 : µ D = 0 pätiessä E(t) = 0 Siten itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (007) 86

t-testi parivertailuille Testin hylkäysalueen määrääminen ja testin p-arvo Parivertailutestin hylkäysalueen valinta tapahtuu kuten yhden otoksen t-testin tapauksessa. Parivertailutestin testisuureen arvoa vastaavan p-arvon määrääminen tapahtuu kuten yhden otoksen t-testin tapauksessa. TKK (c) Ilkka Mellin (007) 87

t-testi parivertailuille Normaalisuusoletuksen merkitys 1/ Parivertailuasetelman t-testin yleisessä hypoteesissa oletetaan, että havaintoarvojen erotukset ovat normaalijakautuneita. Testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos havaintojen lukumäärä n on kyllin suuri. TKK (c) Ilkka Mellin (007) 88

t-testi parivertailuille Normaalisuusoletuksen merkitys / Testiä on melko turvallista käyttää, kun n > 15 ellei erotusten jakauma ole kovin vino ja erotuksien joukossa ole poikkeavia erotuksia. Jos havaintojen lukumäärä n > 40 testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille erotuksien jakaumille. TKK (c) Ilkka Mellin (007) 89

Testejä suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus t-testi parivertailuille >> Yhden otoksen testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (007) 90

Yhden otoksen testi varianssille Testausasetelma 1/ Olkoon X 1, X,, X n yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (007) 91

Yhden otoksen testi varianssille Testausasetelma / Asetetaan normaalijakauman N( µ, σ ) varianssiparametrille σ nollahypoteesi H 0 :σ = σ0 Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on yhden otoksen χ -testi varianssille. TKK (c) Ilkka Mellin (007) 9

Yhden otoksen testi varianssille Hypoteesit Yleinen hypoteesi H : (1) Havainnot () Havainnot X 1, X,, X n ovat riippumattomia. Nollahypoteesi H 0 : H :σ = σ 0 0 Vaihtoehtoinen hypoteesi H 1 : H: σ 1 0 H: σ 1 0 H : σ 1 0 i > σ < σ σ N( µ, σ ), = 1,,, X i n 1-suuntaiset vaihtoehtoiset hypoteesit -suuntainen vaihtoehtoinen hypoteesi TKK (c) Ilkka Mellin (007) 93

Yhden otoksen testi varianssille Parametrien estimointi Olkoot X ja 1 n Xi n i = 1 = 1 s X X n = ( i ) n 1 i= 1 tavanomaiset harhattomat estimaattorit parametreille E(X i ) = µ, i = 1,,, n ja Var(X i ) = σ, i = 1,,, n TKK (c) Ilkka Mellin (007) 94

Yhden otoksen testi varianssille Testisuure ja sen jakauma Määritellään χ -testisuure ( n 1) s χ = σ 0 Jos nollahypoteesi H 0 :σ = σ0 pätee, niin testisuure χ noudattaa χ -jakaumaa vapausastein (n 1): χ χ ( n 1) TKK (c) Ilkka Mellin (007) 95

Yhden otoksen testi varianssille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/3 Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X 1, X,, X n X i N( µ, σ 0 ), i = 1,,, n Tällöin (ks. lukua Otokset ja otosjakaumat) n X i µ Y = χ ( n) i 1 σ = 0 Koska odotusarvo µ on tuntematon, satunnaismuuttujan Y lauseke on testisuureena epäoperationaalinen. TKK (c) Ilkka Mellin (007) 96

Yhden otoksen testi varianssille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu /3 Jos satunnaismuuttujan z lausekkeessa odotusarvo µ korvataan vastaavalla otossuureella X 1 n X i n i = 1 = niin saadaan χ -testisuure n Xi X ( n 1) s χ = i= 1 σ = 0 σ0 jossa n 1 s = ( Xi X) 1 n i= 1 TKK (c) Ilkka Mellin (007) 97

Yhden otoksen testi varianssille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 3/3 Jos nollahypoteesi H 0 pätee, testisuure χ noudattaa χ -jakaumaa vapausastein (n 1): χ χ (n 1) Todistus: ks. lukua Otokset ja otosjakaumat. TKK (c) Ilkka Mellin (007) 98

Yhden otoksen testi varianssille Testi Testisuureen ( n 1) s χ = σ 0 normaaliarvo = (n 1), koska nollahypoteesin H pätiessä E(s 0 :σ = σ0 ) = σ 0, jolloin E(χ ) = n 1 Siten sekä pienet että suuret testisuureen χ arvot sen normaaliarvoon (n 1) nähden viittaavat siihen, että nollahypoteesi ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (007) 99

Yhden otoksen testi varianssille Testin hylkäysalueen määrääminen 1/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H:σ 1 > σ0 niin kriittinen raja χ α saadaan ehdosta Pr(χ χ α ) = α jossa χ χ (n 1) Testin hylkäysalue on tällöin muotoa (, + ) χ α TKK (c) Ilkka Mellin (007) 100

Yhden otoksen testi varianssille Testin hylkäysalueen määrääminen /4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H:σ 1 < σ0 niin kriittinen raja χ1 α saadaan ehdosta Pr(χ χ1 α ) = α jossa χ χ (n 1) Testin hylkäysalue on tällöin muotoa (0, ) χ1 α TKK (c) Ilkka Mellin (007) 101

Yhden otoksen testi varianssille Testin hylkäysalueen määrääminen 3/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H:σ σ 1 0 χ1 α niin kriittiset rajat ja χ α saadaan ehdoista Pr(χ χ ) = α/ 1 α Pr(χ χ α ) = α/ jossa χ χ (n 1) Testin hylkäysalue on tällöin muotoa (0, ) (, + ) χ1 α χ α TKK (c) Ilkka Mellin (007) 10

Yhden otoksen testi varianssille Testin hylkäysalueen määrääminen 4/4 Oletetaan, että testin merkitsevyystasoksi on valittu α. Testin hylkäysalueen määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:σ > σ 1 0 H:σ < σ 1 0 H:σ σ 1 0 χ ( n 1) χ ( n 1) χ ( n 1) 1 α α α 1 α 1 1 α 1 α χα χ1 χ α χ1 α α α Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue TKK (c) Ilkka Mellin (007) 103

Yhden otoksen testi varianssille Testin p-arvo 1/ Olkoon χ -testisuureen havaittu arvo. Jos vaihtoehtoinen hypoteesi on 1-suuntainen, testin p- arvon määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:σ > σ 1 0 H:σ < σ 1 0 χ 0 χ ( n 1) χ ( n 1) p 1 p 1 p Testin p-arvo = p χ0 χ 0 p Testin p-arvo = p TKK (c) Ilkka Mellin (007) 104

Yhden otoksen testi varianssille Testin p-arvo / Olkoon vaihtoehtoinen hypoteesi -suuntainen: H:σ σ 1 0 Tällöin testin p-arvo on { } p = min Pr( χ χ0),pr( χ χ0) jossa χ χ ( n 1) TKK (c) Ilkka Mellin (007) 105

Yhden otoksen testi varianssille Normaalisuusoletuksen merkitys Tässä esitetyn varianssitestin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita. Testi on herkkä poikkeamille normaalisuudesta ja testi ei toimi kovinkaan hyvin, jos havaintojen jakauma on vino tai havaintojen joukossa on poikkeavia havaintoja. Suuretkaan havaintojen lukumäärät eivät yleensä paranna tilannetta. TKK (c) Ilkka Mellin (007) 106

Testejä suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden riippumattoman otoksen t-testi A: Yleinen tapaus Kahden riippumattoman otoksen t-testi B: Yhtä suurten varianssien tapaus t-testi parivertailuille Yhden otoksen testi varianssille >> Varianssien vertailutesti TKK (c) Ilkka Mellin (007) 107

Varianssien vertailutesti Testausasetelma 1/4 Olkoon X11, X1,, Xn 11 yksinkertainen satunnaisotos perusjoukosta S 1, joka noudattaa normaalijakaumaa N( µ 1, σ1) Jakauma riippuu seuraavista parametreista: µ 1 = jakauman odotusarvo σ 1 = jakauman varianssi TKK (c) Ilkka Mellin (007) 108

Varianssien vertailutesti Testausasetelma /4 Olkoon X1, X,, Xn yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (007) 109

Varianssien vertailutesti Testausasetelma 3/4 Oletetaan lisäksi, että perusjoukosta S 1 poimittu otos X11, X1,, Xn 11 ja perusjoukosta S poimittu otos X1, X,, Xn ovat toisistaan riippumattomia. Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S 1 ei vaikuta siihen mikä alkioista poimitaan perusjoukosta S ja kääntäen. TKK (c) Ilkka Mellin (007) 110

Varianssien vertailutesti Testausasetelma 4/4 Asetetaan normaalijakaumien N( µ 1, σ1) ja N( µ, σ ) varianssiparametreille σ 1 ja σ nollahypoteesi H 0 :σ1 = σ = σ Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on kahden riippumattoman otoksen F-testi variansseille eli varianssien vertailutesti. TKK (c) Ilkka Mellin (007) 111

Varianssien vertailutesti Yleinen hypoteesi Yleinen hypoteesi H : (1) Havainnot Xi1 N( µ 1, σ 1), i= 1,,, n1 () Havainnot X j N( µ, σ ), j = 1,,, n (3) Havainnot X i1 ja X j ovat riippumattomia kaikille i ja j Huomautus: Oletus (3) sisältää kolme riippumattomuusoletusta: Havainnot ovat riippumattomia otoksien 1 ja sisällä. Havainnot ovat riippumattomia otoksien 1 ja välillä. TKK (c) Ilkka Mellin (007) 11

Varianssien vertailutesti Nollahypoteesi ja vaihtoehtoiset hypoteesit Nollahypoteesi H 0 : H :σ = σ = σ 0 1 Vaihtoehtoinen hypoteesi H 1 : H: σ 1 1 H: σ 1 1 H : σ > σ < σ σ 1 1 1-suuntaiset vaihtoehtoiset hypoteesit -suuntainen vaihtoehtoinen hypoteesi TKK (c) Ilkka Mellin (007) 113

Varianssien vertailutesti Parametrien estimointi Olkoot ja n 1 k Xk = Xik, k = 1, n k i = 1 n 1 k s = ( X X ), k = 1, k ik k n k 1 i= 1 tavanomaiset harhattomat estimaattorit parametreille E(X ik ) = µ k, i = 1,,, n k, k = 1, ja Var(X ik ) = σ k, i = 1,,, n k, k = 1, TKK (c) Ilkka Mellin (007) 114

Varianssien vertailutesti Testisuure ja sen jakauma Määritellään F-testisuure s1 F = s Jos nollahypoteesi H 0 :σ1 = σ = σ pätee, niin testisuure F noudattaa Fisherin F-jakaumaa vapausastein (n 1 1) ja (n 1): F F( n 1, n 1) 1 TKK (c) Ilkka Mellin (007) 115

Varianssien vertailutesti Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/4 Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X, X,, X, X, X,, X 11 1 n 1 1 n Tällöin (ks. lukua Otokset ja otosjakaumat) n 1 X i1 µ 1 Y1 = χ ( n1) i= 1 σ n X j µ Y = χ ( n) j 1 σ = Koska Y 1 Y, niin Y1/ n1 Y = F( n1, n) Y / n 1 X N( µ, σ ), i = 1,,, n i1 1 1 j N( µ, σ ), = 1,,, X j n TKK (c) Ilkka Mellin (007) 116

Varianssien vertailutesti Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu /4 Koska odotusarvot µ 1 ja µ ovat tuntemattomia, satunnaismuuttujan Y1/ n1 Y = Y/ n lauseke on testisuureena epäoperationaalinen. Korvataan satunnaismuuttujien Y 1 ja Y lausekkeissa odotusarvot µ 1 ja µ vastaavilla otossuureilla n 1 k X = X, k = 1, k n k i = 1 ik TKK (c) Ilkka Mellin (007) 117

Varianssien vertailutesti Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 3/4 Saamme satunnaismuuttujat (ks. lukua Otokset ja otosjakaumat) n 1 ( n1 1) s1 Xi 1 X1 V1 = = χ ( n1 1) σ i= 1 σ n ( n 1) s X j X V = = χ ( n 1) σ j 1 σ = jossa n 1 k sk = ( Xik Xk), k = 1, n k 1 i= 1 Lisäksi satunnaismuuttujat V 1 ja V ovat riippumattomia: V V 1 TKK (c) Ilkka Mellin (007) 118

Varianssien vertailutesti Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 4/4 Määritellään F-testisuure F V1/( n1 1) s1 = = V /( n 1) s Jos nollahypoteesi H 0 pätee, testisuure F noudattaa F-jakaumaa vapausastein (n 1 1) ja (n 1): F F( n 1, n 1) 1 TKK (c) Ilkka Mellin (007) 119

Varianssien vertailutesti Testi Testisuureen s1 F = s normaaliarvo 1, koska nollahypoteesin H 0 :σ1 = σ = σ pätiessä (ja jos n on kyllin suuri) n 1 E( F) = 1 n 3 Siten sekä pienet että suuret testisuureen F arvot sen normaaliarvoon 1 nähden viittaavat siihen, että nollahypoteesi ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (007) 10

Varianssien vertailutesti Testin hylkäysalueen määrääminen 1/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 0:σ1 > σ niin kriittinen raja F α saadaan ehdosta Pr(F F α ) = α jossa F F(n 1 1,n 1) Testin hylkäysalue on tällöin muotoa (F α, + ) TKK (c) Ilkka Mellin (007) 11

Varianssien vertailutesti Testin hylkäysalueen määrääminen /4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 0:σ1 < σ niin kriittinen raja F 1 α saadaan ehdosta Pr(F F 1 α ) = α jossa F F(n 1 1,n 1) Testin hylkäysalue on tällöin muotoa (0, F 1 α ) TKK (c) Ilkka Mellin (007) 1

Varianssien vertailutesti Testin hylkäysalueen määrääminen 3/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 0:σ1 σ niin kriittiset rajat F 1 α/ ja F α/ saadaan ehdoista Pr(F F 1 α/ ) = α/ Pr(F F α/ ) = α/ jossa F F(n 1 1,n 1) Testin hylkäysalue on tällöin muotoa (0, F 1 α/ ) (F α/, + ) TKK (c) Ilkka Mellin (007) 13

Varianssien vertailutesti Testin hylkäysalueen määrääminen 4/4 Oletetaan, että testin merkitsevyystasoksi on valittu α. Testin hylkäysalueen määräämistä voidaan havainnollistaa olevilla kuvioilla. H:σ > σ 1 1 H:σ < σ 1 1 H:σ σ 1 1 F( n 1, n 1) 1 F( n1 1, n 1) F( n1 1, n 1) α α 1 α 1 α 1 α 1 α 1 α F α F 1 α F 1 α F α Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue TKK (c) Ilkka Mellin (007) 14

Varianssien vertailutesti Testin p-arvo 1/ Olkoon F-testisuureen havaittu arvo F 0. Jos vaihtoehtoinen hypoteesi on 1-suuntainen, testin p- arvon määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:σ > σ 1 1 H:σ < σ 1 1 F( n 1, n 1) 1 F( n 1, n 1) 1 p p 1 p 1 p F 0 Testin p-arvo = p F 0 Testin p-arvo = p TKK (c) Ilkka Mellin (007) 15

Varianssien vertailutesti Testin p-arvo / Olkoon vaihtoehtoinen hypoteesi -suuntainen: Tällöin testin p-arvo on p = min Pr( F F ),Pr( F F ) jossa H:σ σ 1 1 F F(n 1 1,n 1) { } 0 0 TKK (c) Ilkka Mellin (007) 16

Varianssien vertailutesti Normaalisuusoletuksen merkitys Tässä esitetyn varianssien vertailutestin yleisessä hypoteesissa oletetaan, että havainnot ovat molemmissa otoksissa normaalijakautuneita. Testi on herkkä poikkeamille normaalisuudesta ja testi ei toimi kovinkaan hyvin, jos havaintojen jakauma on vino tai havaintojen joukossa on poikkeavia havaintoja. Suuretkaan havaintojen lukumäärät eivät yleensä paranna tilannetta. TKK (c) Ilkka Mellin (007) 17