Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Samankaltaiset tiedostot
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Testit laatueroasteikollisille muuttujille

Väliestimointi (jatkoa) Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Sovellettu todennäköisyyslaskenta B

Harjoitus 7: NCSS - Tilastollinen analyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Testit järjestysasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Mat Sovellettu todennäköisyyslasku A

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

10. laskuharjoituskierros, vko 14, ratkaisut

Estimointi. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Normaalijakaumasta johdettuja jakaumia

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

031021P Tilastomatematiikka (5 op) viikko 5

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollisia peruskäsitteitä ja Monte Carlo

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Regressioanalyysi. Vilkkumaa / Kuusinen 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Tilastolliset menetelmät: Tilastolliset testit

11. laskuharjoituskierros, vko 15, ratkaisut

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Sovellettu todennäköisyyslaskenta B

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

riippumattomia ja noudattavat samaa jakaumaa.

2. TILASTOLLINEN TESTAAMINEN...

2. Keskiarvojen vartailua

2-suuntainen vaihtoehtoinen hypoteesi

Harjoitus 2: Matlab - Statistical Toolbox

5.7 Uskottavuusfunktioon perustuvia testejä II

Todennäköisyyden ominaisuuksia

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastolliset menetelmät: Tilastolliset testit

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Parametrin estimointi ja bootstrap-otanta

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3.6 Su-estimaattorien asymptotiikka

Transkriptio:

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1

Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (004)

Testit suhdeasteikollisille muuttujille: Mitä opimme? Tarkastelemme tässä luvussa normaalijakauman parametreja koskevia tilastollisia testejä. Yhden otoksen testit: t-testi normaalijakauman odotusarvolle χ -testi normaalijakauman varianssille Kahden otoksen testit: t-testi A normaalijakaumien odotusarvojen vertailuun erisuurten varianssien tapauksessa t-testi B normaalijakaumien odotusarvojen vertailuun yhtä suurten varianssien tapauksessa t-testi normaalijakaumien odotusarvojen vertailuun parivertailutilanteessa F-testi normaalijakauman varianssien vertailuun TKK (c) Ilkka Mellin (004) 3

Testit suhdeasteikollisille muuttujille: Esitiedot Esitiedot: ks. seuraavia lukuja: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Otos ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi Tilastolliset testit Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (004) 4

Testit suhdeasteikollisille muuttujille: Lisätiedot Testejäjärjestysasteikollisille muuttujille käsitellään luvussa Testit järjestysasteikollisille muuttujille Testejälaatueroasteikollisille muuttujille käsitellään luvussa Testit laatueroasteikollisille muuttujille Jakaumaoletuksien testaamista käsitellään luvussa Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (004) 5

Testit suhdeasteikollisille muuttujille >> Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (004) 6

Testit normaalijakauman parametreille Avainsanat Kahden otoksen testit Normaalijakauma Odotusarvo Otos Parametri Riippumattomat otokset Varianssi Vertailutesti Yhden otoksen testit TKK (c) Ilkka Mellin (004) 7

Testit normaalijakauman parametreille Normaalijakauman parametrien tilastolliset testit 1/ Normaalijakauma on tilastotieteen tärkein jakauma. Oletetaan, että satunnaismuuttuja X noudattaa normaalijakaumaa parametrein µ ja σ : X N( µ, σ ) Tällöin E(X) = µ on normaalijakauman odotusarvo ja Var(X) = σ on normaalijakauman varianssi. Parametrit µ ja σ määräävät täysin normaalijakauman. TKK (c) Ilkka Mellin (004) 8

Testit normaalijakauman parametreille Normaalijakauman parametrien tilastolliset testit / Normaalijakauman parametreja koskevat testit voidaan jakaa kahteen ryhmään: Yhden otoksen testit Kahden otoksen testit eli vertailutestit Yhden otoksen testeissä testataan yksinkertaisia nollahypoteeseja, jotka koskevat normaalijakauman odotusarvo- tai varianssiparametria. Kahden otoksen testit ovat vertailutestejä, joilla verrataan kahden normaalijakauman odotusarvo- tai varianssiparametreja toisiinsa. TKK (c) Ilkka Mellin (004) 9

Testit normaalijakauman parametreille Normaalijakauman parametreille tarkoitettujen testien yleinen soveltuvuus 1/ Testejä normaalijakauman odotusarvolle sovelletaan usein myös sellaisissa tilanteissa, joissa havainnot eivät noudata normaalijakaumaa. Tämä perustuu seuraaviin seikkoihin: (i) Esitettävät testit odotusarvolle perustuvat havaintojen aritmeettisiin keskiarvoihin. (ii) Keskeisen raja-arvolauseen mukaan myös einormaalisten havaintojen aritmeettiset keskiarvot ovat tietyin ehdoin suurissa otoksissa approksimatiivisesti normaalijakautuneita. TKK (c) Ilkka Mellin (004) 10

Testit normaalijakauman parametreille Normaalijakauman parametreille tarkoitettujen testien yleinen soveltuvuus / Sen sijaan testit normaalijakauman varianssille eivät yleensä ole käyttökelpoisia ei-normaalisille havainnoille ja tilanne ei välttämättä parane suurillakaan havaintojen lukumäärillä. TKK (c) Ilkka Mellin (004) 11

Testit normaalijakauman parametreille Tavanomaiset testit normaalijakauman parametreille Tarkastelemme seuraavia testejä normaalijakauman parametreille: Yhden otoksen t-testi odotusarvolle Kahden riippumattoman otoksen t-testi A odotusarvoille erisuurten varianssien tapauksessa Kahden riippumattoman otoksen t-testi B odotusarvoille yhtä suurten varianssien tapauksessa t-testi parivertailuille Yhden otoksen χ -testi varianssille Kahden riippumattoman otoksen F-testi variansseille TKK (c) Ilkka Mellin (004) 1

Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille >> Yhden otoksen t-testi Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (004) 13

Yhden otoksen t-testi Avainsanat Aritmeettinen keskiarvo Nollahypoteesi Normaalijakauma Odotusarvo Otos Otosvarianssi Parametri Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma Varianssi Voimakkuus Yhden otoksen testit Yleinen hypoteesi TKK (c) Ilkka Mellin (004) 14

Yhden otoksen t-testi Testausasetelma 1/ Olkoon X 1, X,, X n yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (004) 15

Yhden otoksen t-testi Testausasetelma / Asetetaan normaalijakauman N( µ, σ ) odotusarvo- eli paikkaparametrille µ nollahypoteesi H 0 :µ = µ 0 Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on yhden otoksen t-testi. TKK (c) Ilkka Mellin (004) 16

Yhden otoksen t-testi Hypoteesit Yleinen hypoteesi H : (i) Havainnot Xi N( µ, σ ), i= 1,,, n (ii) Havainnot X 1, X,, X n ovat riippumattomia Nollahypoteesi H 0 : H 0 :µ = µ 0 Vaihtoehtoinen hypoteesi H 1 : H: 1 µ > µ 0 H: 1 µ < µ 0 H : µ µ 1 0 1-suuntaiset vaihtoehtoiset hypoteesit -suuntainen vaihtoehtoinen hypoteesi TKK (c) Ilkka Mellin (004) 17

Yhden otoksen t-testi Parametrien estimointi Olkoot X ja 1 n Xi n i = 1 = 1 s X X n = ( i ) n 1 i= 1 tavanomaiset harhattomat estimaattorit parametreille E(X i ) = µ, i = 1,,, n ja Var(X i ) = σ, i = 1,,, n TKK (c) Ilkka Mellin (004) 18

Yhden otoksen t-testi Testisuure ja sen jakauma Määritellään t-testisuure X µ 0 t = s/ n Jos nollahypoteesi H 0 :µ = µ 0 pätee, niin testisuure t noudattaa Studentin t-jakaumaa vapausastein (n 1): t t( n 1) TKK (c) Ilkka Mellin (004) 19

Yhden otoksen t-testi Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/ Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X 1, X,, X n X N( µ, σ ), i = 1,,, n Koska tällöin (ks. lukua Otos ja otosjakaumat) niin X i 1 0 σ n = Xi N µ 0, n i= 1 n X µ 0 z = N(0,1) σ / n Koska standardipoikkeama σ on tuntematon, satunnaismuuttujan z lauseke on epäoperationaalinen. TKK (c) Ilkka Mellin (004) 0

Yhden otoksen t-testi Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu / Jos satunnaismuuttujan z lausekkeessa standardipoikkeama σ korvataan vastaavalla otossuureella n 1 s = ( Xi X) n 1 i= 1 saadaan t-testisuure X µ 0 t = s / n joka nollahypoteesin H 0 pätiessä noudattaa Studentin t-jakaumaa vapausastein (n 1): t t(n 1) Todistus sivuutetaan; ks. kuitenkin lukua Väliestimointi. TKK (c) Ilkka Mellin (004) 1

Yhden otoksen t-testi t-testisuure mittaa tilastollista etäisyyttä Testisuure X µ 0 t = s/ n mittaa havaintoarvojen aritmeettisen keskiarvon ja nollahypoteesin H 0 :µ = µ 0 kiinnittämän odotusarvoparametrin µ arvon µ 0 tilastollista etäisyyttä. Mittayksikkönä on erotuksen X µ 0 standardipoikkeaman σ / n estimaattori, jota määrättäessä on oletettu, että nollahypoteesi H 0 pätee. TKK (c) Ilkka Mellin (004)

Yhden otoksen t-testi Testi Testisuureen X µ 0 t = s/ n normaaliarvo = 0, koska nollahypoteesin pätiessä E(t) = 0 H 0 :µ = µ 0 Siten itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (004) 3

Yhden otoksen t-testi Testin hylkäysalueen valinta 1/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ > µ 0 niin kriittinen raja +t α saadaan ehdosta Pr(t +t α ) = α jossa t t(n 1) Testin hylkäysalue on tällöin muotoa (+t α, + ) TKK (c) Ilkka Mellin (004) 4

Yhden otoksen t-testi Testin hylkäysalueen valinta /4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ < µ 0 niin kriittinen raja t α saadaan ehdosta Pr(t t α ) = α jossa t t(n 1) Testin hylkäysalue on tällöin muotoa (, t α ) TKK (c) Ilkka Mellin (004) 5

Yhden otoksen t-testi Testin hylkäysalueen valinta 3/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ µ 0 niin kriittiset rajat t α/ ja +t α/ saadaan ehdoista Pr(t t α/ ) = α/ Pr(t +t α/ ) = α/ jossa t t(n 1) Testin hylkäysalue on tällöin muotoa (, t α ) (+t α, + ) TKK (c) Ilkka Mellin (004) 6

Yhden otoksen t-testi Testin hylkäysalueen valinta 4/4 Oletetaan, että testin merkitsevyystasoksi on valittu α. Testin hylkäysalueen määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:µ 1 > µ 0 tn ( 1) H:µ 1 < µ 0 tn ( 1) H:µ 1 µ 0 tn ( 1) α α 1 α 1 α 1 α 1 α 1 α +t α t α t α / +t α / Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue TKK (c) Ilkka Mellin (004) 7

Yhden otoksen t-testi Testin p-arvo Olkoon t-testisuureen havaittu arvo t 0. Testin p-arvon määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:µ 1 > µ 0 tn ( 1) H:µ 1 < µ 0 tn ( 1) H:µ 1 µ 0 tn ( 1) p p p p 1 p t 0 t 0 1 p 1 p t + t 0 0 TKK (c) Ilkka Mellin (004) 8

Yhden otoksen t-testi Normaalisuusoletuksen merkitys 1/ Yhden otoksen t-testin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita. t-testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos havaintojen lukumäärä n on kyllin suuri. TKK (c) Ilkka Mellin (004) 9

Yhden otoksen t-testi Normaalisuusoletuksen merkitys / Testiä on melko turvallista käyttää, kun havaintojen lukumäärä n > 15 ellei havaintojen jakauma ole kovin vino ja havaintojen joukossa ole poikkeavia havaintoja. Jos havaintojen lukumäärä n > 40 testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille. TKK (c) Ilkka Mellin (004) 30

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 1/6 Tarkastellaan t-testin hyväksymisvirheen todennäköisyyttä ja voimakkuutta tilanteessa, jossa normaalijakauman N( µ, σ ) varianssi σ oletetaan tunnetuksi. Olkoon nollahypoteesi muotoa H 0 :µ = µ 0 ja vaihtoehtoinen hypoteesi muotoa H:µ 1 < µ 0 TKK (c) Ilkka Mellin (004) 31

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus /6 t-testisuure X µ 0 t = σ / n noudattaa nollahypoteesin H 0 :µ = µ 0 pätiessä standardoitua normaalijakaumaa (ks. lukua Otos ja otosjakaumat): t N(0, 1) TKK (c) Ilkka Mellin (004) 3

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 3/6 Vaihtoehtoisen hypoteesin H:µ 1 < µ 0 tapauksessa t-testin päätössääntö on muotoa: Hylkää nollahypoteesi H 0 :µ = µ 0 jos X µ 0 t = < zα σ / n Kriittinen raja z α saadaan ehdosta Pr(z z α ) = α jossa z N(0, 1). TKK (c) Ilkka Mellin (004) 33

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 4/6 Vaihtoehtoisen hypoteesin H:µ 1 < µ 0 tapauksessa t-testin päätössääntö voidaan kirjoittaa myös seuraavaan muotoon: Hylkää nollahypoteesi jos H 0 :µ = µ 0 X < µ z σ n = X Kriittinen raja z α saadaan ehdosta Pr(z z α ) = α jossa z N(0, 1). 0 α / c TKK (c) Ilkka Mellin (004) 34

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 5/6 Vaihtoehtoisen hypoteesin H:µ 1 < µ 0 tapauksessa t-testin hyväksymisvirheen todennäköisyys β on ehdollinen todennäköisyys jossa β = µ µ 0 Pr(H0 jätetään voimaan H0ei ole tosi) = Pr( X X µ = µ ) = Pr z c X c µ σ / n TKK (c) Ilkka Mellin (004) 35

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus 6/6 Vaihtoehtoisen hypoteesin H:µ 1 < µ 0 tapauksessa t-testin voimakkuus 1 β on ehdollinen todennäköisyys jossa 1 β = Pr(H hylätään H ei ole tosi) µ µ 0 0 0 = Pr( X < X µ = µ ) = Pr z < c X c µ σ / n TKK (c) Ilkka Mellin (004) 36

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 1/3 Kuvio oikealla havainnollistaa t- testin hyväksymisvirheen todennäköisyyttä β ja voimakkuutta 1 β. Yleinen hypoteesi H : X 1, X,, X n X i ~ N(µ, σ ), i = 1,,, n Nollahypoteesi H 0 : µ = µ 0 Vaihtoehtoinen hypoteesi H 1 : µ < µ 0 N(µ,σ /n ) N(µ 0,σ /n) α β µ µ 0 X c TKK (c) Ilkka Mellin (004) 37

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus /3 Valitaan merkitsevyystasoksi α. Kriittinen raja z α : Pr(z z α ) = α z N(0, 1) Kriittinen raja X c : X = µ z σ n c Päätössääntö: 0 α / Hylkää nollahypoteesi H 0, jos X < X c N(µ,σ /n ) α N(µ 0,σ /n) β µ µ 0 X c TKK (c) Ilkka Mellin (004) 38

Yhden otoksen t-testi Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 3/3 Hyväksymisvirheen todennäköisyys β : β = Pr( X X c µ = µ ) Voimakkuus 1 β : 1 β = Pr( X < X c µ = µ ) N(µ,σ /n ) N(µ 0,σ /n) α β µ µ 0 X c TKK (c) Ilkka Mellin (004) 39

Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi >> Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (004) 40

Kahden otoksen t-testi A Avainsanat Aritmeettinen keskiarvo Kahden otoksen testit Nollahypoteesi Normaalijakauma Odotusarvo Otosvarianssi Parametri Riippumattomat otokset Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma Varianssi Vertailutesti Yleinen hypoteesi TKK (c) Ilkka Mellin (004) 41

Kahden otoksen t-testi A Testausasetelma 1/4 Olkoon X11, X1,, Xn 11 yksinkertainen satunnaisotos perusjoukosta S 1, joka noudattaa normaalijakaumaa N( µ, σ ) 1 1 Jakauma riippuu seuraavista parametreista: µ 1 = jakauman odotusarvo σ 1 = jakauman varianssi TKK (c) Ilkka Mellin (004) 4

Kahden otoksen t-testi A Testausasetelma /4 Olkoon X1, X,, Xn yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (004) 43

Kahden otoksen t-testi A Testausasetelma 3/4 Oletetaan lisäksi, että perusjoukosta S 1 poimittu otos X11, X1,, Xn 11 ja perusjoukosta S poimittu otos X1, X,, Xn ovat toisistaan riippumattomia. Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S 1 ei vaikuta siihen mikä alkioista poimitaan perusjoukosta S ja kääntäen. TKK (c) Ilkka Mellin (004) 44

Kahden otoksen t-testi A Testausasetelma 4/4 Asetetaan normaalijakaumien N( µ 1, σ1) ja N( µ, σ ) odotusarvo-eli paikkaparametreille µ 1 ja µ nollahypoteesi H 0:µ 1 = µ = µ Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on kahden riippumattoman otoksen t-testi erisuurten varianssien tapauksessa. Huomautus: Jos voidaan olettaa, että σ1 = σ, testauksessa kannattaa käyttää kahden riippumattoman otoksen t-testiä B. TKK (c) Ilkka Mellin (004) 45

Kahden otoksen t-testi A Yleinen hypoteesi Yleinen hypoteesi H : (1) Havainnot () Havainnot (3) Havainnot X i1 ja X j ovat riippumattomia kaikille i ja j. Huomautuksia: X N( µ, σ ), i= 1,,, n i1 1 1 1 j N( µ, σ ), = 1,,, X j n Oletus (3) sisältää kolme riippumattomuusoletusta: Havainnot ovat riippumattomia otoksien 1 ja sisällä. Havainnot ovat riippumattomia otoksien 1 ja välillä. Jakaumien variansseja ja ei ole oletettu yhtä suuriksi; vrt. kahden otoksen t-testi B. TKK (c) Ilkka Mellin (004) 46

Kahden otoksen t-testi A Nollahypoteesi ja vaihtoehtoiset hypoteesit Nollahypoteesi H 0 : H 0:µ 1 = µ = µ Vaihtoehtoinen hypoteesi H 1 : H: 1 µ 1 > µ 1-suuntaiset vaihtoehtoiset hypoteesit H: 1 µ 1 < µ H : µ µ -suuntainen vaihtoehtoinen hypoteesi 1 1 TKK (c) Ilkka Mellin (004) 47

Kahden otoksen t-testi A Parametrien estimointi Olkoot ja tavanomaiset harhattomat estimaattorit parametreille ja n 1 k Xk = Xik, k = 1, n k i = 1 n 1 k s = ( X X ), k = 1, k ik k n k 1 i= 1 E(X ik ) = µ k, i = 1,,, n k, k = 1, Var(X ik ) = σ k, i = 1,,, n k, k = 1, TKK (c) Ilkka Mellin (004) 48

Kahden otoksen t-testi A Testisuure ja sen asymptoottinen jakauma Määritellään t-testisuure X1 X t = s1 s + n n 1 Jos nollahypoteesi H 0:µ 1 = µ = µ pätee, niin testisuure t noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0,1): t a N(0,1) TKK (c) Ilkka Mellin (004) 49

Kahden otoksen t-testi A Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/3 Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X, X,, X, X, X,, X Tällöin (ks. lukua Otos ja otosjakaumat) X 11 1 n 1 1 n σ σ X N 0, + n1 n 1 1 X N( µσ, ), i = 1,,, n i1 1 1 X N( µσ, ), j = 1,,, n X j 1 σ = n1 1 1 Xi1 N µ, n1 i= 1 n1 n 1 σ X = X j N µ, n j= 1 n Koska X X, niin 1 1 TKK (c) Ilkka Mellin (004) 50

Kahden otoksen t-testi A Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu /3 Edellä esitetystä seuraa, että X1 X z = N(0,1) σ1 σ + n n 1 Koska varianssit σ ovat tuntemattomia, satunnaismuuttujan z 1 ja σ lauseke on epäoperationaalinen. TKK (c) Ilkka Mellin (004) 51

Kahden otoksen t-testi A Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 3/3 Jos satunnaismuuttujan z lausekkeessa varianssit σ1 ja σ korvataan vastaavilla otossuureilla n 1 k sk = ( Xik Xk), k = 1, n k 1 i= 1 saadaan t-testisuure X1 X t = s1 s + n n 1 joka nollahypoteesin H 0 pätiessä noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0, 1): t a N(0, 1) Todistus sivuutetaan. TKK (c) Ilkka Mellin (004) 5

Kahden otoksen t-testi A Testisuureen jakauman approksimointi Pienissä otoksissa saadaan testisuureen t jakaumalle parempi approksimaatio käyttämällä approksimaationa Studentin t-jakaumaa vapausastein (ns. Satterthwaiten approksimaatio) ν = s n s + n 1 1 1 s 1 s 1 + n1 1 n 1 n 1 n TKK (c) Ilkka Mellin (004) 53

Kahden otoksen t-testi A t-testisuure mittaa tilastollista etäisyyttä Testisuure X X t = s s + n n 1 1 1 mittaa otoksien 1 ja aritmeettisten keskiarvojen tilastollista etäisyyttä. Mittayksikkönä on erotuksen X X standardipoikkeaman 1 σ1 σ + n1 n estimaattori, jota määrättäessä on oletettu, että nollahypoteesi H 0 pätee. TKK (c) Ilkka Mellin (004) 54

Kahden otoksen t-testi A Testi Testisuureen X X t = s s + n n normaaliarvo = 0, koska nollahypoteesin pätiessä E(t) = 0 1 1 1 H 0:µ 1 = µ = µ Siten itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (004) 55

Kahden otoksen t-testi A Testin hylkäysalueen valinta 1/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ > µ 0 niin kriittinen raja +t α saadaan ehdosta Pr(t +t α ) = α jossa t a N(0, 1) Testin hylkäysalue on tällöin muotoa (+t α, + ) TKK (c) Ilkka Mellin (004) 56

Kahden otoksen t-testi A Testin hylkäysalueen valinta /4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ < µ 0 niin kriittinen raja t α saadaan ehdosta Pr(t t α ) = α jossa t a N(0, 1) Testin hylkäysalue on tällöin muotoa (, t α ) TKK (c) Ilkka Mellin (004) 57

Kahden otoksen t-testi A Testin hylkäysalueen valinta 3/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : µ µ 0 niin kriittiset rajat t α/ ja +t α/ saadaan ehdoista Pr(t t α/ ) = α/ Pr(t +t α/ ) = α/ jossa t a N(0,1) Testin hylkäysalue on tällöin muotoa (, t α ) (+t α, + ) TKK (c) Ilkka Mellin (004) 58

Kahden otoksen t-testi A Testin hylkäysalueen valinta 4/4 Oletetaan, että testin merkitsevyystasoksi on valittu α. Testin hylkäysalueen määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:µ 1 > µ 0 N(0,1) H:µ 1 < µ 0 N(0,1) H:µ 1 µ 0 N(0,1) α α 1 α 1 α 1 α 1 α 1 α +t α t α t α / +t α / Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue TKK (c) Ilkka Mellin (004) 59

Kahden otoksen t-testi A Testin p-arvo Olkoon t-testisuureen havaittu arvo t 0. Testin p-arvon määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:µ 1 > µ 0 N(0,1) H:µ 1 < µ 0 N(0,1) H:µ 1 µ 0 N(0,1) p p p p 1 p t 0 t 0 1 p 1 p t + t 0 0 TKK (c) Ilkka Mellin (004) 60

Kahden otoksen t-testi A Normaalisuusoletuksen merkitys 1/ Kahden otoksen t-testin A yleisen hypoteesin mukaan havainnot ovat molemmissa otoksissa normaalijakautuneita. Testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos molempien otosten otoskoot ovat kyllin suuria. TKK (c) Ilkka Mellin (004) 61

Kahden otoksen t-testi A Normaalisuusoletuksen merkitys / Testiä on melko turvallista käyttää, kun n 1 > 15 ja n > 15 ja n 1 ja n eivät eroa toisistaan kovin paljon, elleivät havaintojen jakaumat ole kovin vinoja ja ellei havaintojen joukossa ole poikkeavia havaintoja. Jos n 1 > 40 ja n > 40 testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille. TKK (c) Ilkka Mellin (004) 6

Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden otoksen t-testi A >> Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (004) 63

Kahden otoksen t-testi B Avainsanat Aritmeettinen keskiarvo Kahden otoksen testit Nollahypoteesi Normaalijakauma Odotusarvo Otosvarianssi Parametri Riippumattomat otokset Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma Varianssi Vertailutesti Yleinen hypoteesi TKK (c) Ilkka Mellin (004) 64

Kahden otoksen t-testi B Testausasetelma 1/4 Olkoon X11, X1,, Xn 11 yksinkertainen satunnaisotos perusjoukosta S 1, joka noudattaa normaalijakaumaa N( µ 1, σ ) Jakauma riippuu seuraavista parametreista: µ 1 = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (004) 65

Kahden otoksen t-testi B Testausasetelma /4 Olkoon X1, X,, Xn yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (004) 66

Kahden otoksen t-testi B Testausasetelma 3/4 Oletetaan lisäksi, että perusjoukosta S 1 poimittu otos X11, X1,, Xn 11 ja perusjoukosta S poimittu otos X1, X,, Xn ovat toisistaan riippumattomia. Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S 1 ei vaikuta siihen mikä alkioista poimitaan perusjoukosta S ja kääntäen. TKK (c) Ilkka Mellin (004) 67

Kahden otoksen t-testi B Testausasetelma 4/4 Asetetaan normaalijakaumien N( µ 1, σ ) ja N( µ, σ ) odotusarvo-eli paikkaparametreille µ 1 ja µ nollahypoteesi H 0:µ 1 = µ = µ Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on kahden riippumattoman otoksen t-testi yhtä suurten varianssien tapauksessa. Huomautus: Jos jakaumien varianssit eivät ole yhtä suuret, testauksessa on käytettävä kahden riippumattoman otoksen t-testiä A. TKK (c) Ilkka Mellin (004) 68

Kahden otoksen t-testi B Yleinen hypoteesi Yleinen hypoteesi H : (1) () X N( µ, σ ), i= 1,,, n (3) Havainnot X i1 ja X j ovat riippumattomia kaikille i ja j Huomautuksia: i1 1 1 j N( µ, σ ), = 1,,, X j n Oletus (3) sisältää kolme riippumattomuusoletusta: Havainnot ovat riippumattomia otoksien 1 ja sisällä. Havainnot ovat riippumattomia otoksien 1 ja välillä. Jakaumien varianssit on tässä oletettu yhtä suuriksi; vrt. kahden otoksen t-testi A. TKK (c) Ilkka Mellin (004) 69

Kahden otoksen t-testi B Nollahypoteesi ja vaihtoehtoiset hypoteesit Nollahypoteesi H 0 : H 0:µ 1 = µ = µ Vaihtoehtoinen hypoteesi H 1 : H: 1 µ 1 > µ 1-suuntaiset vaihtoehtoiset hypoteesit H: 1 µ 1 < µ H : µ µ -suuntainen vaihtoehtoinen hypoteesi 1 1 TKK (c) Ilkka Mellin (004) 70

Kahden otoksen t-testi B Parametrien estimointi Olkoot ja tavanomaiset harhattomat estimaattorit parametreille ja n 1 k Xk = Xik, k = 1, n k i = 1 n 1 k s = ( X X ), k = 1, k ik k n k 1 i= 1 E(X ik ) = µ k, i = 1,,, n k, k = 1, Var(X ik ) = σ, i = 1,,, n k, k = 1, TKK (c) Ilkka Mellin (004) 71

Kahden otoksen t-testi B Yhdistetty varianssiestimaattori Määritellään ns. yhdistetty varianssiestimaattori s Yhdistetty varianssiestimaattori s P on harhaton estimaattori varianssiparametrille σ, jos nollahypoteesi H :µ = µ = µ pätee. Huomautus: ( n 1) s + ( n 1) s 1 1 P = n1+ n 0 1 Yhdistetty varianssiestimaattori s P ei ole sama kuin yhdistetyn otoksen varianssi, koska otoskeskiarvot X1 ja X eivät (yleensä) ole yhtä suuria. TKK (c) Ilkka Mellin (004) 7

Kahden otoksen t-testi B Testisuure ja sen jakauma Määritellään t-testisuure X1 X t = 1 1 sp + n n 1 Jos nollahypoteesi H 0:µ 1 = µ = µ pätee, niin testisuure t noudattaa Studentin t-jakaumaa vapausastein (n 1 + n ): t t( n + n ) 1 TKK (c) Ilkka Mellin (004) 73

Kahden otoksen t-testi B Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/3 Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X, X,, X, X, X,, X Tällöin (ks. lukua Otos ja otosjakaumat) X 11 1 n 1 1 n σ 1 1 1 X N 0, + n1 n 1 X N( µσ, ), i = 1,,, n i1 1 X N( µσ, ), j = 1,,, n X j n1 1 σ = X N µ, 1 i1 n1 i= 1 n1 n 1 σ X = X j N µ, n j= 1 n Koska X X, niin 1 TKK (c) Ilkka Mellin (004) 74

Kahden otoksen t-testi B Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu /3 Edellä esitetystä seuraa, että X1 X z = N(0,1) 1 1 σ + n n 1 Koska standardipoikkeama σ on tuntematon, satunnaismuuttujan z lauseke on epäoperationaalinen. Määritellään otosvarianssit n 1 k s = ( X X ), k = 1, k ik k n k 1 i= 1 TKK (c) Ilkka Mellin (004) 75

Kahden otoksen t-testi B Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 3/3 Jos satunnaismuuttujan z lausekkeessa standardipoikkeama σ korvataan otossuureella s P = saadaan t-testisuure X1 X t = 1 1 sp + n n ( n 1) s + ( n 1) s n + n 1 joka nollahypoteesin H 0 pätiessä noudattaa Studentin t-jakaumaa vapausastein (n 1 + n ): t t(n 1 + n ) Todistus sivuutetaan. 1 1 1 TKK (c) Ilkka Mellin (004) 76

Kahden otoksen t-testi B t-testisuure mittaa tilastollista etäisyyttä Testisuure X t = s P 1 mittaa otoksien 1 ja aritmeettisten keskiarvojen tilastollista etäisyyttä. Mittayksikkönä on erotuksen X X standardipoikkeaman 1 1 σ + n n 1 1 + n n 1 X 1 1 estimaattori, jota määrättäessä on oletettu, että nollahypoteesi H 0 pätee. TKK (c) Ilkka Mellin (004) 77

Kahden otoksen t-testi B Testi Testisuureen X1 X t = 1 1 sp + n n normaaliarvo = 0, koska nollahypoteesin pätiessä E(t) = 0 1 H : µ = µ = µ 0 1 Siten itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (004) 78

Kahden otoksen t-testi B Testin hylkäysalueen valinta sekä testin p-arvo Kahden otoksen t-testin B hylkäysalueen valinta tapahtuu kuten yhden otoksen t-testin tapauksessa paitsi, että t-testisuure noudattaa tässä Studentin t-jakaumaa vapausastein (n 1 + n ). Kahden otoksen t-testin B testisuureen arvoa vastaavan p- arvon määrääminen tapahtuu kuten yhden otoksen t-testin tapauksessa paitsi, että t-testisuure noudattaa tässä Studentin t-jakaumaa vapausastein (n 1 + n ). TKK (c) Ilkka Mellin (004) 79

Kahden otoksen t-testi B Normaalisuusoletuksen merkitys 1/ Kahden otoksen t-testin B yleisen hypoteesin mukaan havainnot ovat molemmissa otoksissa normaalijakautuneita. Testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos molempien otosten otoskoot ovat kyllin suuria. TKK (c) Ilkka Mellin (004) 80

Kahden otoksen t-testi B Normaalisuusoletuksen merkitys / Testiä on melko turvallista käyttää, kun n 1 > 15 ja n > 15 ja n 1 ja n eivät eroa toisistaan kovin paljon, elleivät havaintojen jakaumat ole kovin vinoja ja ellei havaintojen joukossa ole poikkeavia havaintoja. Jos n 1 > 40 ja n > 40 testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille. TKK (c) Ilkka Mellin (004) 81

Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden otoksen t-testi A Kahden otoksen t-testi B >> t-testi parivertailuille Testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (004) 8

t-testi parivertailuille Avainsanat Aritmeettinen keskiarvo Nollahypoteesi Normaalijakauma Odotusarvo Otos Otosvarianssi Parametri Parivertailu Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma Varianssi Yhden otoksen testit Yleinen hypoteesi TKK (c) Ilkka Mellin (004) 83

t-testi parivertailuille Parivertailuasetelma Parivertailuasetelma syntyy tilastollisessa tutkimuksessa esimerkiksi seuraavissa tilanteissa: (i) Päämääränä on verrata kahta mittaria mittaamalla molemmilla mittareilla samoja kohteita samoissa olosuhteissa. (ii) Päämääränä on tutkia jonkin käsittelyn vaikutusta mittaamalla samoja kohteita ennen käsittelyä ja käsittelyn jälkeen. (iii) Päämääränä on vertailla kahta perusjoukkoa mittaamalla saman muuttujan arvoja perusjoukkojen alkioiden sovitetuissa pareissa. TKK (c) Ilkka Mellin (004) 84

t-testi parivertailuille Testausasetelma 1/ Oletetaan, että havainnot muodostuvat muuttujaa X koskevista mittaustuloksien pareista (X i1, X i ), i = 1,,, n jotka ovat toisistaan riippumattomia. Päämääränä on verrata mittauksia toisiinsa: Antavatko mittaukset keskimäärin saman tuloksen? Tällaisissa parivertailuasetelmissa ei saa käyttää riippumattomien otoksien t-testejä A tai B, koska parivertailuasetelmissa mittaustuloksia X i1 ja X i ei voida pitää riippumattomina. TKK (c) Ilkka Mellin (004) 85

t-testi parivertailuille Testausasetelma / Muodostetaan mittaustuloksien X i1 ja X i erotukset D, 1,,, i = Xi1 Xi i = n Mittaukset 1 ja antavat keskimäärin saman tuloksen, jos erotukset D i saavat keskimäärin arvon nolla. Testausongelman ratkaisuna on tavanomainen yhden otoksen t-testi mittaustuloksien X i1 ja X i erotuksille D i. TKK (c) Ilkka Mellin (004) 86

t-testi parivertailuille Hypoteesit Yleinen hypoteesi H : (1) Erotukset () Erotukset D 1, D,, D n ovat riippumattomia Nollahypoteesi H 0 : H : µ = 0 0 D i N( µ D, σ D), = 1,,, D i n Vaihtoehtoinen hypoteesi H 1 : H: 1 µ D 0 1-suuntaiset vaihtoehtoiset hypoteesit > H: 1 µ D < 0 H : µ 0 -suuntainen vaihtoehtoinen hypoteesi 1 D TKK (c) Ilkka Mellin (004) 87

t-testi parivertailuille Parametrien estimointi Olkoot 1 n Di n i = 1 D= ja 1 s D D n D = ( i ) n 1 i= 1 tavanomaiset harhattomat estimaattorit parametreille E(D i ) = µ D, i = 1,,, n ja Var(D i ) = σ D, i = 1,,, n TKK (c) Ilkka Mellin (004) 88

t-testi parivertailuille Testisuure ja sen jakauma Määritellään t-testisuure D t = s / n Jos nollahypoteesi D H : µ = 0 pätee, niin testisuure t noudattaa Studentin t-jakaumaa vapausastein (n 1): t 0 D t( n 1) TKK (c) Ilkka Mellin (004) 89

t-testi parivertailuille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/ Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: D 1, D,, D n D N(0, σ ), i = 1,,, n Koska tällöin (ks. lukua Otos ja otosjakaumat) niin i D n 1 σ D D= Di N 0, n i= 1 n D z = N(0,1) σ D / n Koska standardipoikkeama σ D on tuntematon, satunnaismuuttujan z lauseke on epäoperationaalinen. TKK (c) Ilkka Mellin (004) 90

t-testi parivertailuille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu / Jos satunnaismuuttujan z lausekkeessa standardipoikkeama σ D korvataan vastaavalla otossuureella n 1 sd = ( Di D) n 1 i= 1 saadaan t-testisuure D t = sd / n joka nollahypoteesin H 0 pätiessä noudattaa Studentin t-jakaumaa vapausastein (n 1): t t(n 1) Todistus sivuutetaan; ks. kuitenkin lukua Väliestimointi. TKK (c) Ilkka Mellin (004) 91

t-testi parivertailuille t-testisuure mittaa tilastollista etäisyyttä Testisuure D t = s / mittaa havaintoarvojen erotuksien aritmeettisen keskiarvon tilastollista etäisyyttä nollasta. Mittayksikkönä on erotuksien D i aritmeettisen keskiarvon D standardipoikkeaman σ D n D n estimaattori, jota määrättäessä on oletettu, että nollahypoteesi H 0 pätee. TKK (c) Ilkka Mellin (004) 9

t-testi parivertailuille Testi Testisuureen D t = s / D normaaliarvo = 0, koska nollahypoteesin pätiessä E(t) = 0 n H : µ = 0 Siten itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. 0 D TKK (c) Ilkka Mellin (004) 93

t-testi parivertailuille Testin hylkäysalueen valinta sekä testin p-arvo Parivertailutestin hylkäysalueen valinta tapahtuu kuten yhden otoksen t-testin tapauksessa. Parivertailutestin testisuureen arvoa vastaavan p-arvon määrääminen tapahtuu kuten yhden otoksen t-testin tapauksessa. TKK (c) Ilkka Mellin (004) 94

t-testi parivertailuille Normaalisuusoletuksen merkitys 1/ Parivertailuasetelman t-testin yleisessä hypoteesissa oletetaan, että havaintoarvojen erotukset ovat normaalijakautuneita. Testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos havaintojen lukumäärä n on kyllin suuri. TKK (c) Ilkka Mellin (004) 95

t-testi parivertailuille Normaalisuusoletuksen merkitys / Testiä on melko turvallista käyttää, kun n > 15 ellei erotusten jakauma ole kovin vino ja erotuksien joukossa ole poikkeavia erotuksia. Jos havaintojen lukumäärä n > 40 testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille erotuksien jakaumille. TKK (c) Ilkka Mellin (004) 96

Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille >> Testi varianssille Varianssien vertailutesti TKK (c) Ilkka Mellin (004) 97

Testi varianssille Avainsanat Aritmeettinen keskiarvo χ -jakauma Nollahypoteesi Normaalijakauma Odotusarvo Otos Otosvarianssi Parametri Testisuure Testisuureen jakauma Testisuureen normaaliarvo Varianssi Yhden otoksen testit Yleinen hypoteesi TKK (c) Ilkka Mellin (004) 98

Testi varianssille Testausasetelma 1/ Olkoon X 1, X,, X n yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (004) 99

Testi varianssille Testausasetelma / Asetetaan normaalijakauman N( µ, σ ) varianssiparametrille σ nollahypoteesi H :σ = σ 0 0 Testausongelma: Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on yhden otoksen χ -testi varianssille. TKK (c) Ilkka Mellin (004) 100

Testi varianssille Hypoteesit Yleinen hypoteesi H : (1) Havainnot () Havainnot X 1, X,, X n ovat riippumattomia. Nollahypoteesi H 0 : H :σ = σ 0 0 Vaihtoehtoinen hypoteesi H 1 : H: σ 1 0 H: σ 1 0 H : σ 1 0 i > σ < σ σ N( µ, σ ), = 1,,, X i n 1-suuntaiset vaihtoehtoiset hypoteesit -suuntainen vaihtoehtoinen hypoteesi TKK (c) Ilkka Mellin (004) 101

Testi varianssille Parametrien estimointi Olkoot X ja 1 n Xi n i = 1 = 1 s X X n = ( i ) n 1 i= 1 tavanomaiset harhattomat estimaattorit parametreille E(X i ) = µ, i = 1,,, n ja Var(X i ) = σ, i = 1,,, n TKK (c) Ilkka Mellin (004) 10

Testi varianssille Testisuure ja sen jakauma Määritellään χ -testisuure ( n 1) s χ = σ 0 Jos nollahypoteesi H :σ = σ 0 0 pätee, niin testisuure χ noudattaa χ -jakaumaa vapausastein (n 1): χ χ ( n 1) TKK (c) Ilkka Mellin (004) 103

Testi varianssille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/3 Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X 1, X,, X n X N( µ, σ ), i = 1,,, n i 0 Tällöin (ks. lukua Otos ja otosjakaumat) n X i µ Y = χ ( n) i 1 σ = 0 Koska odotusarvo µ on tuntematon, satunnaismuuttujan Y lauseke on epäoperationaalinen. TKK (c) Ilkka Mellin (004) 104

Testi varianssille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu /3 Jos satunnaismuuttujan z lausekkeessa odotusarvo µ korvataan vastaavalla otossuureella saadaan χ -testisuure jossa X χ 1 n X i n i = 1 = n i i= 1 σ 0 σ0 X X ( n 1) s = = 1 s X X n = ( i ) n 1 i= 1 TKK (c) Ilkka Mellin (004) 105

Testi varianssille Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 3/3 Jos nollahypoteesi H 0 pätee, testisuure χ noudattaa χ -jakaumaa vapausastein (n 1): χ χ (n 1) Todistus sivuutetaan; ks. kuitenkin lukua Otos ja otosjakaumat. TKK (c) Ilkka Mellin (004) 106

Testi varianssille Testi Testisuureen ( n 1) s χ = σ 0 normaaliarvo = (n 1), koska nollahypoteesin H pätiessä E(s 0 :σ = σ 0 ) = σ 0, jolloin E(χ ) = n 1 Siten sekä pienet että suuret testisuureen χ arvot sen normaaliarvoon (n 1) nähden viittaavat siihen, että nollahypoteesi ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (004) 107

Testi varianssille Testin hylkäysalueen valinta 1/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H:σ 1 > σ 0 niin kriittinen raja jossa Pr(χ χ α ) = α saadaan ehdosta χ χ (n 1) Testin hylkäysalue on tällöin muotoa (, + ) χ α χ α TKK (c) Ilkka Mellin (004) 108

Testi varianssille Testin hylkäysalueen valinta /4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H:σ 1 < σ 0 niin kriittinen raja jossa Pr(χ ) = α saadaan ehdosta χ χ (n 1) Testin hylkäysalue on tällöin muotoa (0, ) χ1 α χ1 α χ1 α TKK (c) Ilkka Mellin (004) 109

Testi varianssille Testin hylkäysalueen valinta 3/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H:σ 1 σ 0 niin kriittiset rajat jossa χ1 α Pr(χ ) = α/ χ1 α χ α Pr(χ ) = α/ ja saadaan ehdoista χ χ (n 1) Testin hylkäysalue on tällöin muotoa (0, ) (, + ) χ1 α χ α χ α TKK (c) Ilkka Mellin (004) 110

Testi varianssille Testin hylkäysalueen valinta 4/4 Oletetaan, että testin merkitsevyystasoksi on valittu α. Testin hylkäysalueen määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:σ > σ 1 0 H:σ < σ 1 0 H:σ σ 1 0 χ ( n 1) χ ( n 1) χ ( n 1) α α 1 α 1 α 1 α χ α χ1 α 1 α χ1 α 1 α χ α Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue TKK (c) Ilkka Mellin (004) 111

Testi varianssille Testin p-arvo Olkoon χ -testisuureen havaittu arvo. Jos vaihtoehtoinen hypoteesi on 1-suuntainen, p-arvon määräämistä voidaan havainnollistaa alla olevilla kuvioilla. χ 0 H:σ > σ 1 0 H:σ < σ 1 0 χ ( n 1) χ ( n 1) p p 1 p χ 0 χ 0 1 p TKK (c) Ilkka Mellin (004) 11

Testi varianssille Normaalisuusoletuksen merkitys Tässä esitetyn varianssitestin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita. Testi on herkkä poikkeamille normaalisuudesta ja testi ei toimi kovin hyvin, jos havaintojen jakauma on vino tai havaintojen joukossa on poikkeavia havaintoja. Tällöin suuretkaan havaintojen lukumäärät eivät yleensä paranna tilannetta. TKK (c) Ilkka Mellin (004) 113

Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille >> Varianssien vertailutesti TKK (c) Ilkka Mellin (004) 114

Varianssien vertailutesti Avainsanat Aritmeettinen keskiarvo F-jakauma Kahden otoksen testit Nollahypoteesi Normaalijakauma Odotusarvo Otos Otosvarianssi Parametri Testisuure Testisuureen jakauma Testisuureen normaaliarvo Varianssi Vertailutesti Yleinen hypoteesi TKK (c) Ilkka Mellin (004) 115

Varianssien vertailutesti Testausasetelma 1/4 Olkoon X11, X1,, Xn 11 yksinkertainen satunnaisotos perusjoukosta S 1, joka noudattaa normaalijakaumaa N( µ, σ ) 1 1 Jakauma riippuu seuraavista parametreista: µ 1 = jakauman odotusarvo σ 1 = jakauman varianssi TKK (c) Ilkka Mellin (004) 116

Varianssien vertailutesti Testausasetelma /4 Olkoon X1, X,, Xn yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa N( µ, σ ) Jakauma riippuu seuraavista parametreista: µ = jakauman odotusarvo σ = jakauman varianssi TKK (c) Ilkka Mellin (004) 117

Varianssien vertailutesti Testausasetelma 3/4 Oletetaan lisäksi, että perusjoukosta S 1 poimittu otos X11, X1,, Xn 11 ja perusjoukosta S poimittu otos X1, X,, Xn ovat toisistaan riippumattomia. Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S 1 ei vaikuta siihen mikä alkioista poimitaan perusjoukosta S ja kääntäen. TKK (c) Ilkka Mellin (004) 118

Varianssien vertailutesti Testausasetelma 4/4 Asetetaan normaalijakaumien N( µ 1, σ1) ja N( µ, σ ) varianssiparametreille ja nollahypoteesi H :σ = σ = σ 0 1 Testausongelma: σ 1 Ovatko havainnot sopusoinnussa nollahypoteesin H 0 kanssa? Ongelman ratkaisuna on kahden riippumattoman otoksen F-testi variansseille. σ TKK (c) Ilkka Mellin (004) 119

Varianssien vertailutesti Yleinen hypoteesi Yleinen hypoteesi H : (1) Havainnot () Havainnot (3) Havainnot X i1 ja X j ovat riippumattomia kaikille i ja j Huomautus: X N( µ, σ ), i= 1,,, n i1 1 1 1 j N( µ, σ ), = 1,,, X j n Oletus (3) sisältää kolme riippumattomuusoletusta: Havainnot ovat riippumattomia otoksien 1 ja sisällä. Havainnot ovat riippumattomia otoksien 1 ja välillä. TKK (c) Ilkka Mellin (004) 10

Varianssien vertailutesti Nollahypoteesi ja vaihtoehtoiset hypoteesit Nollahypoteesi H 0 : H :σ = σ = σ 0 1 Vaihtoehtoinen hypoteesi H 1 : H: σ 1 1 H: σ 1 1 H : σ > σ < σ σ 1 1 1-suuntaiset vaihtoehtoiset hypoteesit -suuntainen vaihtoehtoinen hypoteesi TKK (c) Ilkka Mellin (004) 11

Varianssien vertailutesti Parametrien estimointi Olkoot ja tavanomaiset harhattomat estimaattorit parametreille ja n 1 k Xk = Xik, k = 1, n k i = 1 n 1 k s = ( X X ), k = 1, k ik k n k 1 i= 1 E(X ik ) = µ k, i = 1,,, n k, k = 1, Var(X ik ) = σ k, i = 1,,, n k, k = 1, TKK (c) Ilkka Mellin (004) 1

Varianssien vertailutesti Testisuure ja sen jakauma Määritellään F-testisuure s1 F = s Jos nollahypoteesi H :σ = σ = σ 0 1 pätee, niin testisuure F noudattaa Fisherin F-jakaumaa vapausastein (n 1 1) ja (n 1): F F( n 1, n 1) 1 TKK (c) Ilkka Mellin (004) 13

Varianssien vertailutesti Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 1/3 Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H 0 pätevät: X, X,, X, X, X,, X 11 1 n 1 1 n Tällöin (ks. lukua Otos ja otosjakaumat) n X j µ Y = j 1 σ = Koska Y 1 Y, niin 1 X N( µ, σ ), i = 1,,, n i1 1 1 X N( µ, σ ), j = 1,,, n Y j n 1 X i µ 1 1 = χ n1 i= 1 σ Y /( n 1) = ( 1, 1) 1 1 Y F n1 n Y/( n 1) ( ) χ ( n ) TKK (c) Ilkka Mellin (004) 14

Varianssien vertailutesti Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu /3 Koska odotusarvot µ 1 ja µ ovat tuntemattomia, satunnaismuuttujan Y lauseke on epäoperationaalinen. Jos satunnaismuuttujan Y lausekkeessa odotusarvot µ 1 ja µ korvataan vastaavilla otossuureilla saadaan F-testisuure jossa n 1 k X = X, k = 1, F k s = s n k i = 1 1 k ik k n k 1 i= 1 ik n 1 k s = ( X X ), k = 1, TKK (c) Ilkka Mellin (004) 15

Varianssien vertailutesti Testisuureen jakauma nollahypoteesin H 0 pätiessä: Perustelu 3/3 Jos nollahypoteesi H 0 pätee, testisuure F noudattaa Fisherin F- jakaumaa vapausastein (n 1 1) ja (n 1): F F( n 1, n 1) 1 Todistus sivuutetaan. TKK (c) Ilkka Mellin (004) 16

Varianssien vertailutesti Testi Testisuureen s1 F = s normaaliarvo 1, koska nollahypoteesin H 0 :σ1 = σ = σ pätiessä (ja jos n on kyllin suuri) n 1 E( F) = 1 n 3 Siten sekä pienet että suuret testisuureen F arvot sen normaaliarvoon 1 nähden viittaavat siihen, että nollahypoteesi ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (004) 17

Varianssien vertailutesti Testin hylkäysalueen valinta 1/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H :σ > σ 0 1 niin kriittinen raja F α saadaan ehdosta Pr(F F α ) = α jossa F F(n 1 1,n 1) Testin hylkäysalue on tällöin muotoa (F α, + ) TKK (c) Ilkka Mellin (004) 18

Varianssien vertailutesti Testin hylkäysalueen valinta /4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H :σ < σ 0 1 niin kriittinen raja F 1 α saadaan ehdosta Pr(F F 1 α ) = α jossa F F(n 1 1,n 1) Testin hylkäysalue on tällöin muotoa (0, F 1 α ) TKK (c) Ilkka Mellin (004) 19

Varianssien vertailutesti Testin hylkäysalueen valinta 3/4 Valitaan testin merkitsevyystasoksi α. Jos vaihtoehtoinen hypoteesi on muotoa H :σ σ 0 1 niin kriittiset rajat F 1 α/ ja F α/ saadaan ehdoista Pr(F F 1 α/ ) = α/ Pr(F F α/ ) = α/ jossa F F(n 1 1,n 1) Testin hylkäysalue on tällöin muotoa (0, F 1 α/ ) (F α/, + ) TKK (c) Ilkka Mellin (004) 130

Varianssien vertailutesti Testin hylkäysalueen valinta 4/4 Oletetaan, että testin merkitsevyystasoksi on valittu α. Testin hylkäysalueen määräämistä voidaan havainnollistaa olevilla kuvioilla. H:σ > σ 1 1 H:σ < σ 1 1 H:σ σ 1 1 F( n 1, n 1) 1 F( n 1, n 1) 1 F( n 1, n 1) 1 α α 1 α 1 α 1 α 1 α 1 α F α F1 α F 1 α F α Hylkäysalue Hylkäysalue Hylkäysalue Hylkäysalue TKK (c) Ilkka Mellin (004) 131

Varianssien vertailutesti Testin p-arvo Olkoon F-testisuureen havaittu arvo F 0. Jos vaihtoehtoinen hypoteesi on 1-suuntainen, p-arvon määräämistä voidaan havainnollistaa alla olevilla kuvioilla. H:σ > σ 1 1 H:σ < σ 1 1 F( n 1, n 1) 1 F( n 1, n 1) 1 1 p p p 1 p F 0 F 0 TKK (c) Ilkka Mellin (004) 13

Varianssien vertailutesti Normaalisuusoletuksen merkitys Tässä esitetyn varianssien vertailutestin yleisessä hypoteesissa oletetaan, että havainnot ovat molemmissa otoksissa normaalijakautuneita. Testi on herkkä poikkeamille normaalisuudesta ja testi ei toimi kovin hyvin, jos havaintojen jakauma on vino tai havaintojen joukossa on poikkeavia havaintoja. Tällöin suuretkaan havaintojen lukumäärät eivät yleensä paranna tilannetta. TKK (c) Ilkka Mellin (004) 133