Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Samankaltaiset tiedostot
Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Testit laatueroasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Estimointi. Vilkkumaa / Kuusinen 1

Testit järjestysasteikollisille muuttujille

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Mat Sovellettu todennäköisyyslasku A

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastolliset menetelmät: Tilastolliset testit

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

10. laskuharjoituskierros, vko 14, ratkaisut

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Sovellettu todennäköisyyslaskenta B

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Tilastollinen aineisto Luottamusväli

Mat Tilastollisen analyysin perusteet, kevät 2007

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

9. laskuharjoituskierros, vko 12-13, ratkaisut

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Mat Tilastollisen analyysin perusteet, kevät 2007

Normaalijakaumasta johdettuja jakaumia

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Harjoitus 2: Matlab - Statistical Toolbox

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

11. laskuharjoituskierros, vko 15, ratkaisut

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

031021P Tilastomatematiikka (5 op) viikko 5

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Tilastolliset menetelmät: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisten aineistojen kuvaaminen

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Todennäköisyyden ominaisuuksia

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

riippumattomia ja noudattavat samaa jakaumaa.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

2. TILASTOLLINEN TESTAAMINEN...

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Transkriptio:

TKK (c) Ilkka Mellin (4) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (4) : Mitä opimme? 1/5 Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitä tai oletuksia, joiden pätevyyttä halutaan testata. tarkoittaa perusjoukosta esitettyjen väitteiden tai oletuksien asettamista koetteelle havainnoista saatavaa informaatiota vastaan. Tilastollisessa testauksessa testattavat väitteet tai oletukset on puettava tutkimuksen kohteena olevan perusjoukon ominaisuuden vaihtelua perusjoukossa kuvaavaa todennäköisyysjakaumaa tai sen parametreja koskeviksi hypoteeseiksi. : Mitä opimme? /5 Testausasetelma kiinnitetään tekemällä seuraavat kolme oletusta: (i) Testausasetelmaa koskevia yleisiä oletuksia kutsutaan testin yleiseksi hypoteesiksi. (ii) Testattavaa väitettä tai oletusta kutsutaan testin nollahypoteesiksi. (iii) Jos nollahypoteesi hylätään testissä, astuu voimaan vaihtoehtoinen hypoteesi. Tilastollinen testi on päätössääntö, joka kertoo jokaisessa yksittäisessä testaustilanteessa (jokaiselle otokselle), onko nollahypoteesi hylättävä vai ei. TKK (c) Ilkka Mellin (4) 3 TKK (c) Ilkka Mellin (4) 4 : Mitä opimme? 3/5 Tilastollisen testin suoritus perustuu testisuureeseen, joka mittaa nollahypoteesin ja havaintojen yhteensopivuutta. Testisuureen normaaliarvo on sen odotusarvo nollahypoteesin pätiessä. Jos testisuureen arvo on lähellä normaaliarvoaan, katsotaan, että nollahypoteesi ja havainnot ovat sopusoinnussa ja nollahypoteesi jätetään voimaan. Jos testisuureen arvo on kaukana normaaliarvostaan, katsotaan, että nollahypoteesi ja havainnot eivät ole sopusoinnussa ja nollahypoteesi hylätään. Testi jakaa testisuureen mahdollisten arvojen alueen hylkäysalueeseen ja hyväksymisalueeseen. : Mitä opimme? 4/5 Jos nollahypoteesi hylätään virheellisesti, tehdään 1. lajin virhe eli hylkäysvirhe. Jos nollahypoteesi jätetään voimaan virheellisesti, tehdään. lajin virhe eli hyväksymisvirhe. Koska hylkäysvirheen todennäköisyys halutaan tehdä mahdollisimman pieneksi, havainnoilta vaaditaan vahvoja todisteita nollahypoteesia vastaan ennen sen hylkäämistä. Testin merkitsevyystaso on todennäköisyys, että testisuure saa nollahypoteesin pätiessä arvoja testin hylkäysalueelta. Testin hylkäysalue voidaan määrätä kiinnittämällä testin merkitsevyystaso etukäteen, ennen testin tekemistä. TKK (c) Ilkka Mellin (4) 5 TKK (c) Ilkka Mellin (4) 6

TKK (c) Ilkka Mellin (4) 7 : Mitä opimme? 5/5 on pienin merkitsevyystaso, jolla nollahypoteesi voidaan hylätä, kun testisuure on saanut sen arvon, jonka se on havainnoista laskettuna saanut. on todennäköisyys sille, että testisuure saa sen arvon, jonka se on havainnoista on saanut tai testisuureen normaaliarvoon verrattuna vielä poikkeuksellisempia arvoja, kun nollahypoteesi pätee. Testit voidaan jakaa ryhmiin tarkasteltavan muuttujan mittaasteikollisten ominaisuuksien mukaan: Testit suhde- (tai välimatka-) asteikollisille muuttujille Testit järjestysasteikollisille muuttujille Testit laatueroasteikollisille muuttujille : Esitiedot Esitiedot: ks. seuraavia lukuja: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Otos ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (4) 8 : Lisätiedot Suhdeasteikollisten muuttujien testejä käsitellään luvussa Testit suhdeasteikollisille muuttujille Järjestysasteikollisten muuttujien testejä käsitellään luvussa Testit järjestysasteikollisille muuttujille Laatueroasteikollisten muuttujien testejä käsitellään luvussa Testit laatueroasteikollisille muuttujille Jakaumaoletuksien testaamista käsitellään luvussa Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen >> TKK (c) Ilkka Mellin (4) 9 TKK (c) Ilkka Mellin (4) 1 Tilastollisten hypoteesien testaaminen 1/5 Avainsanat Havainnot Hypoteesi Otos Parametri Perusjoukko Testi Testisuure Tilastollisten hypoteesien testaus Todennäköisyysjakauma Yksinkertainen satunnaisotos TKK (c) Ilkka Mellin (4) 11 Lähtökohta: Tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai oletus. Kysymys: Miten esitettyä väitettä tai oletusta voidaan testata? Vastaus: Väitettä tai oletusta voidaan testata tilastollisesti, jos väite tai oletus voidaan pukea tutkimuksen kohteena olevan perusjoukon ominaisuuden vaihtelua perusjoukossa kuvaavaa todennäköisyysjakaumaa tai sen parametreja koskevaksi oletukseksi eli hypoteesiksi. TKK (c) Ilkka Mellin (4) 1

TKK (c) Ilkka Mellin (4) 13 Tilastollisten hypoteesien testaaminen /5 Tilastollisten hypoteesien testaaminen 3/5 Olkoon X tutkimuksen kohteena olevan perusjoukon jonkin ominaisuuden vaihtelua perusjoukossa kuvaava satunnaismuuttuja. Olkoon satunnaismuuttujan X todennäköisyysjakauman pistetodennäköisyys- tai tiheysfunktio f(x ; θ) jossa θ on funktion f muodon määräävä tuntematon parametri. Yksinkertaisissa testausasetelmissa kiinnostuksen kohteena on hypoteesi, jonka mukaan parametrilla θ on arvo θ. Miten todennäköisyysjakauman f(x ; θ) parametria θ koskevaa hypoteesia θ = θ voidaan testata tilastollisesti? Tilastollisessa testauksessa hypoteesi θ = θ asetetaan koetteelle havaintojen todennäköisyysjakaumasta f(x ; θ) sisältämää informaatiota vastaan. TKK (c) Ilkka Mellin (4) 14 Tilastollisten hypoteesien testaaminen 4/5 Tilastollisten hypoteesien testaaminen 5/5 Oletamme jatkossa, että havainnot X 1, X,, X n muodostavat yksinkertaisen satunnaisotoksen jakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio on f(x ; θ) Tällöin X 1, X,, X n ovat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys- tai tiheysfunktio f(x ; θ): X1, X,, Xn X f( x; θ ), i= 1,,, n i Testin suorittamista varten valitaan testisuure, joka mittaa satunnaismuuttujien X 1, X,, X n havaittujen arvojen x 1, x,, x n ja hypoteesin θ = θ yhteensopivuutta. Hyvä yhteensopivuus merkitsee sitä, että havainnot ovat sopusoinnussa oletuksen θ = θ kanssa. Huono yhteensopivuus merkitsee sitä, että havainnot ja oletus θ = θ ovat ristiriidassa keskenään. TKK (c) Ilkka Mellin (4) 15 TKK (c) Ilkka Mellin (4) 16 >> Avainsanat Havainnot Hypoteesi Otantamenetelmä Parametri Perusjoukko Testausasetelma Testi Vaihtoehtoinen hypoteesi Yleinen hypoteesi Todennäköisyysjakauma TKK (c) Ilkka Mellin (4) 17 TKK (c) Ilkka Mellin (4) 18

TKK (c) Ilkka Mellin (4) 19 Testausasetelmaa koskevat hypoteesit Yleinen hypoteesi 1/ Kun todennäköisyysjakauman parametreja koskevia väitteitä tai oletuksia testataan tilastollisesti, testausasetelmasta on tehtävä asetelman kiinnittämiseksi seuraavat kolme oletusta: (i) Testausasetelmaa koskevat perusoletukset, joista pidetään kiinni testauksen aikana muodostavat testin yleisen hypoteesin. (ii) Testattavaa oletusta kutsutaan nollahypoteesiksi. (iii) Vaihtoehtoinen hypoteesi on oletus, joka astuu voimaan, jos nollahypoteesi hylätään testissä. Yleiset testausasetelmaa koskevat oletukset muodostavat testin yleisen hypoteesin H. Yleinen hypoteesi H sisältää oletukset perusjoukosta käytetystä otantamenetelmästä perusjoukon jakaumasta Yleisen hypoteesin H oletuksista pidetään kiinni koko testauksen ajan, mikä merkitsee sitä, että testi tehdään aina ehdollisesti yleisen hypoteesin H oletusten suhteen. TKK (c) Ilkka Mellin (4) Yleinen hypoteesi / Huomaa, että yleisen hypoteesin sisältämiä jakaumaoletuksia voidaan ja on tavallisesti myös syytä testata erikseen; ks. esimerkiksi lukua Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. Sitä perusjoukon jakauman parametreja koskevaa väitettä tai oletusta, jota halutaan testata kutsutaan nollahypoteesiksi. lle käytetään tavallisesti merkintää H. Testissä nollahypoteesi H asetetaan koetteelle havaintojen perusjoukon jakaumasta sisältämää informaatiota vastaan. sta H pidetään kiinni, elleivät havaintojen sisältämät todisteet nollahypoteesia vastaan ole kyllin voimakkaita. TKK (c) Ilkka Mellin (4) 1 TKK (c) Ilkka Mellin (4) n muoto yksinkertaisissa testausasetelmissa Olkoon f(x ; θ) tutkimuksen kohteena olevaa perusjoukon ominaisuutta kuvaavan todennäköisyysjakauman pistetodennäköisyystai tiheysfunktio. Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa H : θ = θ Huomautus: t ovat yksinkertaisissa testausasetelmissa muotoa on sama tai muotoa ei ole eroa. Vaihtoehtoinen hypoteesi Vaihtoehtoinen hypoteesi H 1 on oletus, joka astuu voimaan, jos nollahypoteesi H hylätään. Vaihtoehtoinen hypoteesi voidaan tavallisesti muotoilla usealla eri tavalla. Huomautuksia: Jos nollahypoteesi on muotoa on sama tai ei ole eroa, vaihtoehtoinen hypoteesi on tavallisesti muotoa ei ole sama tai on eroa. Tilastollista testiä tehtäessä toivotaan usein, että nollahypoteesi voidaan hylätä ja vaihtoehtoinen hypoteesi hyväksyä. Vaihtoehtoisen hypoteesin hyväksyminen merkitsee yleensä informaation lisääntymistä. TKK (c) Ilkka Mellin (4) 3 TKK (c) Ilkka Mellin (4) 4

TKK (c) Ilkka Mellin (4) 5 Vaihtoehtoisen hypoteesin muoto yksinkertaisissa testausasetelmissa 1/ Jos nollahypoteesi on yksinkertaista muotoa H : θ = θ vaihtoehtoinen hypoteesi voidaan muotoilla kolmella eri tavalla. Huomautus: Vaihtoehtoisen hypoteesin muoto vaikuttaa tavallisesti siihen tapaan, jolla testi suoritetaan. Vaihtoehtoisen hypoteesin muoto yksinkertaisissa testausasetelmissa / Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ tai muotoa H 1 : θ < θ vaihtoehtoista hypoteesia kutsutaan yksisuuntaiseksi. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ vaihtoehtoista hypoteesia kutsutaan kaksisuuntaiseksi. TKK (c) Ilkka Mellin (4) 6 >> Avainsanat Havainnot Hypoteesi Otos Päätössääntö Testi Testisuure Testisuureen normaaliarvo TKK (c) Ilkka Mellin (4) 7 TKK (c) Ilkka Mellin (4) 8 Tilastollinen testi päätössääntönä Testisuure Tilastollinen testi on päätössääntö, joka kertoo jokaisessa yksittäisessä testaustilanteessa eli jokaiselle otokselle, onko nollahypoteesi H hylättävä vai ei. Tilastollinen testi perustetaan testisuureeseen, joka mittaa havaintojen ja nollahypoteesin H yhteensopivuutta. Testisuure on satunnaismuuttuja, jonka arvo riippuu havainnoista ja nollahypoteesista H. Havaintojen ja nollahypoteesin H yhteensopivuuden mittaaminen tarkoittaa sitä, että tutkitaan kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on saatu. Siten yhteensopivuuden mittaaminen vaatii testisuureen jakauman tuntemista. TKK (c) Ilkka Mellin (4) 9 TKK (c) Ilkka Mellin (4) 3

TKK (c) Ilkka Mellin (4) 31 Testisuure ja testi päätössääntönä Testisuureen normaaliarvo Jos havaintojen ja nollahypoteesin H yhteensopivuus on testisuureella mitattuna hyvä, nollahypoteesi H jätetään voimaan. Jos havaintojen ja nollahypoteesin H yhteensopivuus on testisuureella mitattuna huono, nollahypoteesi H hylätään ja vaihtoehtoinen hypoteesi H 1 hyväksytään. Testisuureen odotusarvoa nollahypoteesin H pätiessä kutsutaan testisuureen normaaliarvoksi. Jos testisuureen havaittu arvo on lähellä testisuureen normaaliarvoa, havainnot ovat sopusoinnussa nollahypoteesin H kanssa. Jos testisuureen otoksesta määrätty arvo poikkeaa merkitsevästi testisuureen normaaliarvosta, havainnot sisältävät todisteita nollahypoteesia H vastaan. TKK (c) Ilkka Mellin (4) 3 >> TKK (c) Ilkka Mellin (4) 33 Avainsanat Ensimmäisen lajin virhe Havainnot Hylkäysvirhe Hypoteesi Hyväksymisalue Hyväksymisvirhe Maailman tila Parametri Testi Testin tulos Testisuure Toisen lajin virhe Voimakkuus TKK (c) Ilkka Mellin (4) 34 Hylkäysvirhe ja sen todennäköisyys 1/ Hylkäysvirhe ja sen todennäköisyys / Jos nollahypoteesi H hylätään silloin, kun se on tosi, tehdään hylkäysvirhe. Hylkäysvirheen todennäköisyys α on ehdollinen todennäköisyys Pr(H hylätään H on tosi) = α Hylkäysvirheen todennäköisyyden α komplementtitodennäköisyys Pr(H hyväksytään H on tosi) = 1 α on todennäköisyys hyväksyä nollahypoteesi silloin, kun se on tosi. Tilastollisessa tutkimuksessa noudatetaan tieteen yleistä varovaisuusperiaatetta: Hypoteeseja ei pidä hylätä ilman riittäviä syitä. Siksi nollahypoteesin H virheellisen hylkäyksen todennäköisyys halutaan tehdä tilastollisessa testauksessa mahdollisimman pieneksi. Jotta hylkäysvirheen todennäköisyys saataisiin mahdollisimman pieneksi, havainnoilta vaaditaan vahvoja todisteita nollahypoteesia H vastaan ennen kuin se suostutaan hylkäämään. TKK (c) Ilkka Mellin (4) 35 TKK (c) Ilkka Mellin (4) 36

TKK (c) Ilkka Mellin (4) 37 Hyväksymisvirhe ja sen todennäköisyys Testin voimakkuus Jos nollahypoteesi H jätetään voimaan silloin, kun se ei ole tosi, tehdään hyväksymisvirhe. Hyväksymisvirheen todennäköisyys β on ehdollinen todennäköisyys Pr(H jätetään voimaan H ei ole tosi) = β Huomautus: Hylkäysvirheen todennäköisyys α ja hyväksymisvirheen todennäköisyys β eivät ole toistensa komplementtitodennäköisyyksiä. Hyväksymisvirheen todennäköisyyden β komplementtitodennäköisyyttä Pr(H hylätään H ei ole tosi) = 1 β kutsutaan testin voimakkuudeksi. Hyvä testi on voimakas, koska voimakkaalla testillä on pieni hyväksymisvirheen todennäköisyys β. Testin voimakkuus (1 β) riippuu tavallisesti mm. testattavan parametrin todellisesta arvosta. Testin voimakkuutta testattavan parametrin arvojen funktiona kutsutaan voimakkuusfunktioksi; esimerkki: ks. kappaletta Yhden otoksen t-testi luvussa Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (4) 38 Ensimmäisen ja toisen lajin virheet Maailman tila ja testin tulos Koska testiä tehtäessä pyritään ensisijaisesti varomaan sitä, että nollahypoteesi H hylätään silloin, kun se on tosi, hylkäysvirhettä kutsutaan usein ensimmäisen lajin virheeksi. Tällöin hyväksymisvirhettä eli sitä, että nollahypoteesi H hyväksytään silloin, kun se ei ole tosi, kutsutaan toisen lajin virheeksi. Maailman tilat ja testin tulokset voidaan luokitella seuraavaksi nelikentäksi: Testin tulos jää voimaan hylätään pätee Oikea johtopäätös Hylkäysvirhe Maailman tila ei päde Hyväksymisvirhe Oikea johtopäätös TKK (c) Ilkka Mellin (4) 39 TKK (c) Ilkka Mellin (4) 4 Testin hylkäys- ja hyväksymisalueet ja testi päätössääntönä Kun testi formuloidaan päätössääntönä, testiä varten konstruoidun testisuureen mahdollisten arvojen joukko jaetaan kahteen osaan, hylkäysalueeseen ja hyväksymisalueeseen: (i) Jos testisuureen havainnoista määrätty arvo joutuu hylkäysalueelle, nollahypoteesi H hylätään. (ii) Jos testisuureen havainnoista määrätty arvo joutuu hyväksymisalueelle, nollahypoteesi H jätetään voimaan. Huomautus: Jako hylkäys- ja hyväksymisalueisiin ei saa riippua havainnoista. >> TKK (c) Ilkka Mellin (4) 41 TKK (c) Ilkka Mellin (4) 4

TKK (c) Ilkka Mellin (4) 43 Merkitsevyystaso Avainsanat Frekvenssitulkinta Hylkäysvirhe Hypoteesi Kaksisuuntainen vaihtoehto Merkitsevyys Merkitsevyystaso Otos Perusjoukko Testi Testisuure Vaihtoehtoinen hypoteesi Yksisuuntainen vaihtoehto Testin merkitsevyystaso α on todennäköisyys sille, että testisuureen havainnoista määrätty arvo joutuu hylkäysalueelle, jos nollahypoteesi H pätee. Jos testisuureen havainnoista määrätty arvo joutuu nollahypoteesin H pätiessä hylkäysalueelle, nollahypoteesi H hylätään virheellisesti ja seurauksena on hylkäysvirhe, jonka todennäköisyys on α. Testin hylkäysalue voidaan määrätä kiinnittämällä testissä käytettävä merkitsevyystaso α etukäteen (ennen havaintojen keräämistä). TKK (c) Ilkka Mellin (4) 44 Merkitsevyystason frekvenssitulkinta Oletetaan, että nollahypoteesi H pätee testausasetelmassa. Valitaan testin merkitsevyystasoksi α. Toistetaan otantaa ja sovelletaan jokaiseen otokseen samaa testiä. Tällöin joudumme virheellisesti hylkäämään nollahypoteesin H keskimäärin α %:ssa otoksia, vaikka nollahypoteesi H pätee. Merkitsevyystason valinta: Tavanomaiset merkitsevyystasot 1/ Koska testeissä halutaan ensisijaisesti suojautua hylkäysvirhettä vastaan, testin merkitsevyystasoksi α on tapana valita pieniä lukuja. Ns. tavanomaiset merkitsevyystasot ovat α =.5 α =.1 α =.1 Testin merkitsevyystasoa α valittaessa on aina syytä ottaa huomioon väärän päätöksen seuraukset. TKK (c) Ilkka Mellin (4) 45 TKK (c) Ilkka Mellin (4) 46 Merkitsevyystason valinta: Tavanomaiset merkitsevyystasot / Jos nollahypoteesi H voidaan hylätä merkitsevyystasolla α =.5, sanotaan: Testin tulos on melkein merkitsevä. Jos nollahypoteesi H voidaan hylätä merkitsevyystasolla α =.1, sanotaan: Testin tulos on merkitsevä. Jos nollahypoteesi H voidaan hylätä merkitsevyystasolla α =.1, sanotaan: Testin tulos on erittäin merkitsevä. Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa 1/5 Testin hylkäysalue riippuu yksinkertaisissa testausasetelmissa paitsi valitusta merkitsevyystasosta α myös vaihtoehtoisen hypoteesin muodosta. Olkoon parametria θ koskeva nollahypoteesi yksinkertaista muotoa H : θ = θ Olkoon testisuureena (jatkuva) satunnaismuuttuja Z ja oletetaan, että sen mahdolliset arvot kuuluvat väliin (a, b), jossa voi olla a = tai b = +. Valitaan testin merkitsevyystasoksi α. TKK (c) Ilkka Mellin (4) 47 TKK (c) Ilkka Mellin (4) 48

TKK (c) Ilkka Mellin (4) 49 Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa /5 Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa 3/5 Jos vaihtoehtoisena hypoteesina on yksisuuntainen vaihtoehto H 1 : θ > θ hylkäysalueeksi voidaan tavallisesti valita väli (u, b) jossa kriittinen raja u määrätään siten, että Pr(Z u H ) = α Testisuureen tiheysfunktio α 1 α u Hyväksymisalue Jos vaihtoehtoisena hypoteesina on yksisuuntainen vaihtoehto H 1 : θ < θ hylkäysalueeksi voidaan tavallisesti valita väli (a, l) jossa kriittinen raja l määrätään siten, että Pr(Z l H ) = α Testisuureen tiheysfunktio α 1 α l Hyväksymisalue TKK (c) Ilkka Mellin (4) 5 Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa 4/5 Jos vaihtoehtoisena hypoteesina on kaksisuuntainen vaihtoehto H 1 : θ θ hylkäysalueeksi voidaan tavallisesti valita joukko (a, l) (u, b) jossa kriittiset rajat l ja u määrätään siten, että Pr(Z u H ) = Pr(Z l H ) = α/ α/ α/ 1 α Testisuureen tiheysfunktio Hyväksymisalue TKK (c) Ilkka Mellin (4) 51 l u Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa 5/5 Oletetaan, että testisuureen Z jakauma on symmetrinen origon suhteen. Tällöin kalvoilla /5-4/5 esitetyille kriittisille rajoille pätee tavallisesti: l = u Huomautus: Kalvojen /5-4/5 todennäköisyydet ovat ehdollisia todennäköisyyksiä, joissa ehtotapahtumana on se, että nollahypoteesi H pätee. Siten todennäköisyydet määrätään testisuureen Z jakaumasta, kun jakaumaa määrättäessä on oletettu, että nollahypoteesi H pätee. TKK (c) Ilkka Mellin (4) 5 >> Avainsanat Frekvenssitulkinta Hypoteesi Kaksisuuntainen vaihtoehto Merkitsevyystaso Otos p-arvo Perusjoukko Testi Testisuure Testisuureen normaaliarvo Vaihtoehtoinen hypoteesi Yksisuuntainen vaihtoehto TKK (c) Ilkka Mellin (4) 53 TKK (c) Ilkka Mellin (4) 54

TKK (c) Ilkka Mellin (4) 55 p-arvo ja merkitsevyystasot p-arvo 1/ n hylkääminen voidaan perustaa etukäteen valitun merkitsevyystason ja sitä vastaavan hylkäysalueen määräämisen sijasta testin p-arvoon. on pienin merkitsevyystaso, jolla nollahypoteesi H voidaan hylätä. Tilastolliset ohjelmistot tulostavat nykyään lähes aina sovellettavien testien p-arvot ja siksi p-arvojen käyttö on lähes kokonaan syrjäyttänyt etukäteen valittujen kiinteiden merkitsevyystasojen käytön. määrätään seuraavalla tavalla: (i) Lasketaan valitun testisuureen arvo havainnoista. (ii) Määrätään olettaen, että nollahypoteesi H pätee todennäköisyys sille, että testisuure saa (normaaliarvoonsa verrattuna) niin poikkeuksellisen arvon kuin se on saanut tai vielä poikkeuksellisempia arvoja. TKK (c) Ilkka Mellin (4) 56 p-arvo / p-arvon frekvenssitulkinta Jos testin p-arvoksi saadaan pieni luku, testisuure on saanut arvon, joka kuuluu jos nollahypoteesi H pätee epätodennäköisten testisuureen arvojen joukkoon. Siten nollahypoteesi voidaan hylätä, jos testin p-arvo on kyllin pieni. Mitä pienempi on testin p-arvo, sitä vahvempia todisteita havainnot sisältävät nollahypoteesia H vastaan. Huomautus: määrätään testisuureen Z jakaumasta, kun jakauma on määrätty olettaen, että nollahypoteesi H pätee. Oletetaan, että testausasetelma on sellainen, että yleisen hypoteesin H lisäksi myös nollahypoteesi H pätee. Toistetaan otantaa ja sovelletaan jokaiseen otokseen samaa testiä. Tällöin havaitsemme keskimäärin p %:ssa poimittuja otoksia havaittua testisuureen arvoa poikkeavamman testisuureen arvon. TKK (c) Ilkka Mellin (4) 57 TKK (c) Ilkka Mellin (4) 58 p-arvo ja testi päätössääntönä Tilastollinen testi eli päätössääntö, joka kertoo jokaisessa yksittäisessä tilanteessa eli jokaiselle otokselle, onko nollahypoteesi H hylättävä vai ei, voidaan perustaa seuraavalla tavalla testin p-arvoon: (i) Valitaan pieni todennäköisyys p. (ii) Määrätään testin p-arvo. Jos p < p, hylätään nollahypoteesi H ja hyväksytään vaihtoehtoinen hypoteesi H 1. Jos p p, jätetään nollahypoteesi H voimaan. Todennäköisyyttä p valittaessa on syytä ottaa huomioon väärän päätöksen seuraukset. p-arvon määrääminen yksinkertaisissa testausasetelmissa 1/5 riippuu yksinkertaisissa testausasetelmissa vaihtoehtoisen hypoteesin muodosta. Olkoon parametria θ koskeva nollahypoteesi yksinkertaista muotoa H : θ = θ Oletetaan yksinkertaisuuden vuoksi, että testisuureen jakauma on symmetrinen origon suhteen. Olkoon testisuureen Z havainnoista määrätty arvo z. TKK (c) Ilkka Mellin (4) 59 TKK (c) Ilkka Mellin (4) 6

TKK (c) Ilkka Mellin (4) 61 p-arvon määrääminen yksinkertaisissa testausasetelmissa /5 p-arvon määrääminen yksinkertaisissa testausasetelmissa 3/5 Olkoon testisuureen Z havainnoista määrätty arvo z. Jos vaihtoehtoisena hypoteesina on yksisuuntainen vaihtoehto H 1 : θ > θ niin testin p-arvo on p = Pr(Z z H ) Testisuureen tiheysfunktio p 1 p z Olkoon testisuureen Z havainnoista määrätty arvo z. Jos vaihtoehtoisena hypoteesina on yksisuuntainen vaihtoehto H 1 : θ < θ niin testin p-arvo on p = Pr(Z z H ) Testisuureen tiheysfunktio p 1 p z TKK (c) Ilkka Mellin (4) 6 p-arvon määrääminen yksinkertaisissa testausasetelmissa 4/5 p-arvon määrääminen yksinkertaisissa testausasetelmissa 5/5 Olkoon testisuureen Z havainnoista määrätty arvo z. Jos vaihtoehtoisena hypoteesina on kaksisuuntainen vaihtoehto H 1 : θ θ niin testin p-arvo on p = Pr(Z z H ) Testisuureen tiheysfunktio p p 1 p z + z Huomautus: Kalvojen /5-4/5 todennäköisyydet ovat ehdollisia todennäköisyyksiä, joissa ehtotapahtumana on se, että nollahypoteesi H pätee. Siten todennäköisyydet määrätään testisuureen Z jakaumasta, kun jakaumaa määrättäessä on oletettu, että nollahypoteesi H pätee. TKK (c) Ilkka Mellin (4) 63 TKK (c) Ilkka Mellin (4) 64 >> Avainsanat Hypoteesi Hyväksymisalue Merkitsevyystaso Otos p-arvo Testi Testisuure Vaihtoehtoinen hypoteesi Yleinen hypoteesi TKK (c) Ilkka Mellin (4) 65 TKK (c) Ilkka Mellin (4) 66

TKK (c) Ilkka Mellin (4) 67 merkitsevyystason valintaan perustuvassa testausmenettelyssä 1/3 Jos testi perustetaan merkitsevyystason valintaan, testin suorittamisessa on seuraavat vaiheet: (1) Asetetaan testin hypoteesit: Yleinen hypoteesi H Testauksen kohteena oleva nollahypoteesi H Vaihtoehtoinen hypoteesi H 1 () Valitaan testiä varten testisuure. Testisuureen tehtävänä on mitata havaintojen ja nollahypoteesin H yhteensopivuutta. merkitsevyystason valintaan perustuvassa testausmenettelyssä /3 (3) Valitaan merkitsevyystaso α ja konstruoidaan sitä vastaava hylkäysalue testille. (4) Poimitaan otos niin, että yleisen hypoteesin H oletukset pätevät. Jos havaintojen sisältämät todisteet nollahypoteesia H vastaan ovat testisuureella mitattuna kyllin vahvoja, nollahypoteesi H hylätään ja vaihtoehtoinen hypoteesi H 1 hyväksytään. (5) Määrätään valitun testisuureen arvo havainnoista. TKK (c) Ilkka Mellin (4) 68 merkitsevyystason valintaan perustuvassa testausmenettelyssä 3/3 (6) Tehdään päätös nollahypoteesin hylkäämisestä. Jos testisuureen arvo joutuu hylkäysalueelle, hylätään nollahypoteesi H ja hyväksytään vaihtoehtoinen hypoteesi H 1. Jos testisuureen arvo ei joudu hylkäysalueelle, jätetään nollahypoteesi H voimaan. p-arvon määräämiseen perustuvassa testausmenettelyssä 1/3 Jos testi perustetaan testisuureen arvoa vastaaviin p- arvoihin, testin suorittamisessa on seuraavat vaiheet: (1) Asetetaan testin hypoteesit: Yleinen hypoteesi H Testauksen kohteena oleva nollahypoteesi H Vaihtoehtoinen hypoteesi H 1 () Valitaan testiä varten testisuure. Testisuureen tehtävänä on mitata havaintojen ja nollahypoteesin H yhteensopivuutta. TKK (c) Ilkka Mellin (4) 69 TKK (c) Ilkka Mellin (4) 7 p-arvon määräämiseen perustuvassa testausmenettelyssä /3 (3) Poimitaan otos niin, että yleisen hypoteesin H oletukset pätevät. Jos havaintojen sisältämät todisteet nollahypoteesia H vastaan ovat testisuureella mitattuna kyllin vahvoja, nollahypoteesi H hylätään ja vaihtoehtoinen hypoteesi H 1 hyväksytään. (4) Määrätään valitun testisuureen arvo havainnoista. (5) Määrätään testisuureen havaittua arvoa vastaava p-arvo. p-arvon määräämiseen perustuvassa testausmenettelyssä 3/3 (6) Tehdään päätös nollahypoteesin hylkäämisestä. Jos testin p-arvo on kyllin pieni, hylätään nollahypoteesi H ja hyväksytään vaihtoehtoinen hypoteesi H 1. Jos testin p-arvo ei ole kyllin pieni, jätetään nollahypoteesi H voimaan. TKK (c) Ilkka Mellin (4) 71 TKK (c) Ilkka Mellin (4) 7

TKK (c) Ilkka Mellin (4) 73 Esimerkki: Normaalijakauman parametrien testaaminen >> Avainsanat Hypoteesi Hyväksymisalue χ -jakauma Kriittiset rajat Merkitsevyystaso Normaalijakauma Odotusarvo Otos p-arvo Testi Testisuure Testisuureen normaaliarvo t-jakauma Vaihtoehtoinen hypoteesi Varianssi Yleinen hypoteesi TKK (c) Ilkka Mellin (4) 74 Testausasetelma 1/6 Testausasetelma /6 Kone tekee ruuveja, joiden tavoitepituus on 1 cm. Oletetaan, että ruuvien pituus vaihtelee satunnaisesti noudattaen normaalijakaumaa. Valmistuserää pidetään myyntikelpoisena, jos erän ruuvien pituudet eivät vaihtele liian paljon ja ruuvit ovat keskimäärin oikean mittaisia: Ruuvien pituuksien varianssi ei saa ylittää tilastollisesti merkitsevästi arvoa.1 cm ja ruuvien keskipituus ei saa poiketa tilastollisesti merkitsevästi pituuden tavoitearvosta 1 cm. Ruuvien pituutta valvotaan seuraavalla tavalla: (i) Jokaisesta valmistuserästä ruuveja poimitaan yksinkertainen satunnaisotos. (ii) Otokseen poimittujen ruuvien pituudet mitataan. (iii) Otokseen poimittujen ruuvien pituuksien otosvarianssia verrataan arvoon.1 cm ja pituuksien aritmeettista keskiarvoa verrataan ruuvien tavoitepituuteen 1 cm. (v) Jos otokseen poimittujen ruuvien pituuksien varianssi on liian suuri tai pituuksien aritmeettinen keskiarvo poikkeaa pituuden tavoitearvosta liian paljon, niin valmistuserä hylätään. Seuraavassa näytetään, miten ruuvien pituuden valvonnassa käytetään hyväksi tilastollista testausta. TKK (c) Ilkka Mellin (4) 75 TKK (c) Ilkka Mellin (4) 76 Testausasetelma 3/6 Testausasetelma 4/6 Oletetaan, että valmistuserän ruuvien joukosta on poimittu yksinkertainen satunnaisotos, jonka koko n = 3 ja otokseen poimittujen ruuvien pituudet on mitattu. Taulukko oikealla esittää otokseen poimittujen ruuvien pituuksien luokiteltua frekvenssijakaumaa. Huomautus: Aineistoa on käsitelty myös luvuissa Tilastollisten aineistojen kuvaaminen ja Väliestimointi. Luokkavälit Luokkafrekvenssit (9.85,9.9] 1 (9.9,9.95] (9.95,1.] 6 (1.,1.5] 3 (1.5,1.1] 5 (1.1,1.15] 4 (1.15,1.] 5 (1.,1.5] 3 (1.5,1.3] 1 Kuva oikealla esittää otokseen poimittujen ruuvien pituuksien luokiteltua frekvenssijakaumaa vastaavaa histogrammia. Luokkavälit määräävät histogrammin suorakaiteiden kannat. Suorakaiteiden korkeudet on valittu niin, että suorakaiteiden pinta-alat suhtautuvat toisiinsa kuten vastaavat luokkafrekvenssit. Frekvenssi 7 6 5 4 3 1 Ruuvien pituuksien luokiteltu frekvenssijakauma 9.8 9.9 1. 1.1 1. 1.3 1.4 Pituus (cm) TKK (c) Ilkka Mellin (4) 77 TKK (c) Ilkka Mellin (4) 78

TKK (c) Ilkka Mellin (4) 79 Testausasetelma 5/6 Testausasetelma 6/6 Yhteenveto otostiedoista: Pituuksien aritmeettinen keskiarvo: X = 1.9 cm Pituuksien otoskeskihajonta: s =.138 cm Huomautus: Jos otantaa toistetaan, kaikki otoksia koskevat tiedot (sekä havaintoarvot että havaintoarvoista lasketut otostunnusluvut) vaihtelevat satunnaisesti otoksesta toiseen. Frekvenssi 7 6 5 4 3 1 Ruuvien pituuksien luokiteltu frekvenssijakauma 9.8 9.9 1. 1.1 1. 1.3 1.4 Pituus (cm) Kysymys: Onko otosinformaatio sopusoinnussa ruuvien pituuden varianssille ja odotusarvolle asetettujen tavoitearvojen kanssa? Vastataan kysymykseen konstruoimalla tarkoitukseen sopivat tilastolliset testit. Frekvenssi 7 6 5 4 3 1 Ruuvien pituuksien luokiteltu frekvenssijakauma 9.8 9.9 1. 1.1 1. 1.3 1.4 Pituus (cm) TKK (c) Ilkka Mellin (4) 8 Testausasetelmaa koskevat hypoteesit 1/ Testausasetelmaa koskevat hypoteesit / Määritellään satunnaismuuttuja X: X = ruuvin pituus Yleinen hypoteesi H : Otokseen poimittujen ruuvien pituudet eivät riipu toisistaan ja ruuvien pituudet vaihtelevat satunnaisesti noudattaen normaalijakaumaa: H : X 1, X,, X n X i ~ N(µ, σ ), i = 1,,, n Pidämme koko testauksen ajan kiinni yleisestä hypoteesista H. TKK (c) Ilkka Mellin (4) 81 H 1 : Ruuvien pituuksien varianssi on korkeintaan.1 cm : H 1 : σ = σ.1 cm Vaihtoehtoinen hypoteesi H 11 : Ruuvien pituuksien varianssi on suurempi kuin.1 cm : H 11 : σ = σ >.1 cm H : Ruuvien pituuksien odotusarvo yhtyy pituuden tavoitearvoon 1 cm: H : µ = µ = 1 cm Vaihtoehtoinen hypoteesi H 1 : Ruuvien pituuksien odotusarvo poikkeaa pituuden tavoitearvosta 1 cm: H 1 : µ µ = 1 cm TKK (c) Ilkka Mellin (4) 8 Testit χ -testi varianssille Ruuvien pituuksien varianssia koskevaa nollahypoteesia H 1 : σ = σ.1 cm voidaan testata ns. χ -testillä. Ruuvien pituuksien odotusarvoa koskevaa nollahypoteesia H : µ = µ = 1 cm voidaan testata ns. t-testillä. Yleinen hypoteesi H : Otokseen poimittujen ruuvien pituudet eivät riipu toisistaan ja ruuvien pituudet vaihtelevat satunnaisesti noudattaen normaalijakaumaa: H : X 1, X,, X n X i ~ N(µ, σ ), i = 1,,, n H 1 : Ruuvien pituuksien varianssi on korkeintaan.1 cm : H 1 : σ = σ.1 cm Vaihtoehtoinen hypoteesi H 11 : Ruuvien pituuksien varianssi on suurempi kuin.1 cm : H 11 : σ = σ >.1 cm TKK (c) Ilkka Mellin (4) 83 TKK (c) Ilkka Mellin (4) 84

TKK (c) Ilkka Mellin (4) 85 Esimerkki: χ -testi varianssille Testisuure ja sen jakauma 1/3 Esimerkki: χ -testi varianssille Testisuure ja sen jakauma /3 Käytetään testisuureena χ -testisuuretta ( n 1) s χ = σ jossa n 1 s = ( Xi X) n 1 i= 1 havaintojen (harhaton) otosvarianssi ja σ nollahypoteesin H 1 kiinnittämä parametrin σ arvo. Voidaan osoittaa, että χ -testisuure ( n 1) s χ = σ noudattaa χ -jakaumaa vapaustein (n 1), jos yleinen hypoteesi H ja oletus σ = σ =.1 cm pätevät (ks. lukuja Otos ja otosjakaumat ja Väliestimointi): χ χ ( n 1) TKK (c) Ilkka Mellin (4) 86 Esimerkki: χ -testi varianssille Testisuure ja sen jakauma 3/3 Esimerkki: χ -testi varianssille Testisuureen normaaliarvo Esimerkin tapauksessa otokseen poimittujen ruuvien pituuksien aritmeettinen keskiarvo on X = 1.9 cm otokseen poimittujen ruuvien pituuksien otoskeskihajonta on s =.138 cm ja nollahypoteesin H 1 kiinnittämä parametrin σ arvo on σ =.1 cm Siten χ -testisuureen arvoksi saadaan ( n 1) s (3 1).138 χ = = = 31.46 σ.1 Voidaan osoittaa, että χ -testisuureen ( n 1) s χ = σ normaaliarvo eli χ -testisuureen odotusarvo oletuksen σ = σ =.1 cm pätiessä on E(χ σ = σ ) = n 1 Siten χ -testisuureen normaaliarvoonsa (n 1) verrattuna suuret ja pienet arvot viittaavat siihen, että nollahypoteesi H 1 ei päde. TKK (c) Ilkka Mellin (4) 87 TKK (c) Ilkka Mellin (4) 88 Esimerkki: χ -testi varianssille Testin hylkäysalueen määrääminen 1/5 Esimerkki: χ -testi varianssille Testin hylkäysalueen määrääminen /5 Valitaan merkitsevyystasoksi α =.5 Koska vaihtoehtoinen hypoteesi H 11 : σ = σ >.1 cm on yksisuuntainen, hylkäysalueen määräämistä varten valitaan kriittinen raja χ α siten, että Pr( χ χ α ) =.5 jossa satunnaismuuttuja χ noudattaa χ -jakaumaa vapausastein n 1 = 9. Kriittinen raja χ α toteuttaa ehdon Pr( χ χ ) = 1 α =.95 α χ -jakauman taulukoista nähdään, että Pr(χ 4.557) =.5 kun vapausasteiden lukumäärä n 1 = 9 Siten kriittinen raja on: χ.5 = 4.557 Kuvio oikealla havainnollistaa kriittisen rajan määräämistä. χ (9)-jakauman tiheysfunktio.7.6.5.4.3..95.5.1 4.557 TKK (c) Ilkka Mellin (4) 89 TKK (c) Ilkka Mellin (4) 9

TKK (c) Ilkka Mellin (4) 91 Esimerkki: χ -testi varianssille Testin hylkäysalueen määrääminen 3/5 Esimerkki: χ -testi varianssille Testin hylkäysalueen määrääminen 4/5 Valitaanχ -testin hylkäysalueeksi ( χ α, + ) Jos χ -testisuureen arvo joutuu hylkäysalueelle, nollahypoteesi H 1 : σ = σ.1 cm hylätään merkitsevyystasolla α. Todennäköisyys, että χ -testisuureen arvo joutuu ehdon σ = σ pätiessä hylkäysalueelle on α. χ -testin hyväksymisalue on muotoa [, χ α ] Jos χ -testisuureen arvo joutuu hyväksymisalueelle, nollahypoteesi H 1 : σ = σ.1 cm jätetään voimaan merkitsevyystasolla α. χ -testin hylkäys- ja hyväksymisalueita voidaan kuvata yksisuuntaisen vaihtoehtoisen hypoteesin tapauksessa alla olevalla kuviolla: Hyväksymisalue χ α Kriittinen raja χ α määrätään niin, että Pr( χ χα ) = α jolloin Pr( χ χ ) = 1 α α TKK (c) Ilkka Mellin (4) 9 Esimerkki: χ -testi varianssille Testin hylkäysalueen määrääminen 5/5 Esimerkki: χ -testi varianssille Testin tulos Esimerkin tapauksessa χ -testin hylkäys- ja hyväksymisalueet saavat seuraavan muodon: Hyväksymisalue 4.557 Kriittinen raja 4.557 on määrätty niin, että Pr( χ 4.557) =.5 jolloin Pr( χ 4.557) =.95 Esimerkin tapauksessa otoksesta määrätty χ -testisuureen arvo on pienempi kuin kriittinen arvo χ α : χ = 31.46 < 4.557 = χ α Koska testisuureen arvo on joutunut hyväksymisalueelle, voimme jättää nollahypoteesin H 1 : σ = σ.1 cm voimaan merkitsevyystasolla α =.5 Johtopäätös: Ruuvien pituuden varianssi ei ole tilastollisesti merkitsevästi arvoa.1 cm suurempi. TKK (c) Ilkka Mellin (4) 93 TKK (c) Ilkka Mellin (4) 94 Esimerkki: χ -testi varianssille Merkitsevyystason frekvenssitulkinta Esimerkki: χ -testi varianssille Oletetaan, että kone tekee jatkuvasti ruuveja, joiden pituuden varianssi on hyväksyttävän suuruista. Tällöin siis nollahypoteesi H 1 : σ = σ.1 cm pätee koko ajan. Oletetaan, että poimimme koneen tekemien ruuvien joukosta toistuvasti uusia, samankokoisia otoksia ja testaamme nollahypoteesia H 1 jokaisen otoksen perusteella käyttämällä merkitsevyystasona lukua α =.5 Tällöin joudumme hylkäämään nollahypoteesin H 1 keskimäärin 5 kertaa 1:sta, vaikka nollahypoteesi H 1 pätee koko ajan. Esimerkin tapauksessa otoksesta määrätty χ -testisuureen arvoa 31.7 vastaava p-arvo on χ -jakauman taulukoiden mukaan p = Pr(χ > 31.7) >.1 mikä merkitsee sitä, että χ -testisuure saa normaaliarvoonsa nähden arvoa 31.7 poikkeuksellisempia arvoja todennäköisyydellä, joka on suurempi kuin.1, jos nollahypoteesi H 1 : σ = σ.1 cm pätee. Siten emme voi hylätä nollahypoteesia H 1 millään tavanomaisella merkitsevyystasolla. TKK (c) Ilkka Mellin (4) 95 TKK (c) Ilkka Mellin (4) 96

TKK (c) Ilkka Mellin (4) 97 t-testi odotusarvolle Testisuure ja sen jakauma 1/3 Yleinen hypoteesi H : Otokseen poimittujen ruuvien pituudet eivät riipu toisistaan ja ruuvien pituudet vaihtelevat satunnaisesti noudattaen normaalijakaumaa: H : X 1, X,, X n X i ~ N(µ, σ ), i = 1,,, n H : Ruuvien pituuksien odotusarvo yhtyy pituuden tavoitearvoon 1 cm: H : µ = µ = 1 cm Vaihtoehtoinen hypoteesi H 1 : Ruuvien pituuksien odotusarvo poikkeaa pituuden tavoitearvosta 1 cm: H 1 : µ µ = 1 cm Käytetään testisuureena Studentin t-testisuuretta X µ t = s / n jossa X = 1 n X i n i = 1 on havaintojen aritmeettinen keskiarvo n 1 s = ( Xi X) n 1 i= 1 havaintojen (harhaton) otosvarianssi ja µ nollahypoteesin H kiinnittämä parametrin µ arvo. TKK (c) Ilkka Mellin (4) 98 Testisuure ja sen jakauma /3 Testisuure ja sen jakauma 3/3 Voidaan osoittaa, että t-testisuure X µ t = s / n noudattaa Studentin t-jakaumaa vapaustein (n 1), jos yleinen hypoteesi H ja nollahypoteesi H : µ = µ pätevät (ks. lukuja Otos ja otosjakaumat ja Väliestimointi): t t( n 1) t-testisuure mittaa havaintojen aritmeettisen keskiarvon X ja nollahypoteesin H kiinnittämän parametrin µ arvon µ tilastollista etäisyyttä, jossa mittayksikkönä on aritmeettisen keskiarvon X keskivirheen σ / n estimaattori s / n. Esimerkin tapauksessa otokseen poimittujen ruuvien pituuksien aritmeettinen keskiarvo on X = 1.9 cm otokseen poimittujen ruuvien pituuksien otoskeskihajonta on s =.138 cm ja nollahypoteesin H kiinnittämä parametrin µ arvo on µ = 1 cm Siten t-testisuureen arvoksi saadaan X µ 1.9 1 t = = = 4.749 s/ n.138/ 3 TKK (c) Ilkka Mellin (4) 99 TKK (c) Ilkka Mellin (4) 1 Testisuureen normaaliarvo Testin hylkäysalueen määrääminen 1/5 Voidaan osoittaa, että t-testisuureen X µ t = s / n normaaliarvo eli t-testisuureen odotusarvo nollahypoteesin H : µ = µ pätiessä on E(t H ) = Siten t-testisuureen itseisarvoltaan suuret arvot viittaavat siihen, että nollahypoteesi H ei päde. Huomautus: t-testisuureen jakauma on symmetrinen origon suhteen. TKK (c) Ilkka Mellin (4) 11 Valitaan merkitsevyystasoksi α =.5 Koska vaihtoehtoinen hypoteesi H 1 : µ µ = 1 cm on kaksisuuntainen, hylkäysalueen määräämistä varten valitaan kriittiset rajat t α/ ja +t α/ siten, että Pr( t tα/ ) = Pr( t + tα/) =.5 jossa satunnaismuuttuja t noudattaa Studentin t-jakaumaa vapausastein n 1 = 9. Kriittiset rajat t α/ ja +t α/ toteuttavat ehdon Pr( tα/ t + tα/) = 1 α =.95 Huomaa, että merkitsevyystasoon α liittyvät kriittiset rajat ovat tässä (kaksisuuntaisen vaihtoehtoisen hypoteesin) tapauksessa täsmälleen samat kuin luottamustasoon (1 α) liittyvät luottamuskertoimet; ks. lukua Väliestimointi. TKK (c) Ilkka Mellin (4) 1

TKK (c) Ilkka Mellin (4) 13 Testin hylkäysalueen määrääminen /5 Testin hylkäysalueen määrääminen 3/5 t-jakauman taulukoista nähdään, että Pr(t +.45) =.5 Pr(t.45) =.5 kun vapausasteiden lukumäärä n 1 = 9 Siten kriittiset rajat ovat: +t.5 = +.45 t.5 =.45 Kuvio oikealla havainnollistaa kriittisten rajojen määräämistä..5.4.3..1 t(9)-jakauman tiheysfunktio.5.95.5.45 +.45 Valitaan t-testin hylkäysalueeksi (, tα/ ) ( + tα/, + ) Jos t-testisuureen arvo joutuu hylkäysalueelle, nollahypoteesi H : µ = µ hylätään merkitsevyystasolla α. Todennäköisyys, että t-testisuureen arvo joutuu nollahypoteesin H pätiessä hylkäysalueelle on α. t-testin hyväksymisalue on muotoa [ tα/, + tα/] Jos t-testisuureen arvo joutuu hyväksymisalueelle, nollahypoteesi H : µ = µ jätetään voimaan merkitsevyystasolla α. TKK (c) Ilkka Mellin (4) 14 Testin hylkäysalueen määrääminen 4/5 Testin hylkäysalueen määrääminen 5/5 t-testin hylkäys- ja hyväksymisalueita voidaan kuvata kaksisuuntaisen vaihtoehtoisen hypoteesin tapauksessa alla olevalla kaaviolla: Esimerkin tapauksessa t-testin hylkäys- ja hyväksymisalueet saavat seuraavan muodon: t α / +t α /.45 +.45 Hyväksymisalue Hyväksymisalue Kriittiset rajat t α/ ja +t α/ määrätään niin, että Pr( t tα/ ) = Pr( t + tα/) = α / jolloin Pr( t t + t ) = 1 α/ α/ α Kriittiset rajat.45 ja +.45 on määrätty niin, että Pr( t.45) = Pr( t +.45) =.5 jolloin Pr(.45 t +.45) =.95 TKK (c) Ilkka Mellin (4) 15 TKK (c) Ilkka Mellin (4) 16 Testin tulos Merkitsevyystason frekvenssitulkinta Esimerkin tapauksessa otoksesta määrätty t-testisuureen arvo on suurempi kuin kriittinen arvo +t α/ : t = 4.749 >.45 = +t.5 Koska testisuureen arvo on joutunut hylkäysalueelle, voimme hylätä nollahypoteesin H : µ = µ = 1 cm ja hyväksyä vaihtoehtoisen hypoteesin H : µ µ = 1 cm merkitsevyystasolla α =.5 Johtopäätös: Ruuvien keskimääräinen pituus poikkeaa tilastollisesti merkitsevästi tavoitearvostaan 1 cm. Saattaa olla syytä pysäyttää ruuveja valmistava kone tarkistusta varten. Oletetaan, että kone tekee jatkuvasti keskimäärin oikean mittaisia ruuveja. Tällöin siis nollahypoteesi H : µ = µ = 1 cm pätee koko ajan. Oletetaan, että poimimme koneen tekemien ruuvien joukosta toistuvasti uusia, samankokoisia otoksia ja testaamme nollahypoteesia H jokaisen otoksen perusteella käyttämällä merkitsevyystasona lukua α =.5 Tällöin joudumme hylkäämään nollahypoteesin H keskimäärin 5 kertaa 1:sta, vaikka nollahypoteesi H pätee koko ajan. TKK (c) Ilkka Mellin (4) 17 TKK (c) Ilkka Mellin (4) 18

TKK (c) Ilkka Mellin (4) 19 Esimerkin tapauksessa otoksesta määrätty t-testisuureen arvoa 4.749 vastaava p-arvo on t-jakauman taulukoiden mukaan p = Pr(t > 4.749 ) <.5 =.1 mikä merkitsee sitä, että t-testisuure saa normaaliarvoonsa nähden arvoa 4.749 poikkeuksellisempia arvoja todennäköisyydellä, joka on pienempi kuin.1, jos nollahypoteesi H : µ = µ = 1 cm pätee. Siten voimme hylätä nollahypoteesin H kaikilla tavanomaisilla merkitsevyystasoilla. >> TKK (c) Ilkka Mellin (4) 11 Mitta-asteikot ja tilastolliset testit Avainsanat Mitta-asteikot Järjestysasteikko Laatueroasteikko Suhdeasteikko Testi Havaintojen mitta-asteikolliset ominaisuudet ohjaavat testin valintaa. Mitta-asteikot: ks. lukua Tilastollisten aineistojen kerääminen ja mittaaminen. voidaan ryhmitellä havaintojen mittaasteikollisten ominaisuuksien suhteen seuraavalla tavalla: Suhde- (ja välimatka-) asteikollisten muuttujien testit Järjestysasteikollisten muuttujien testit Laatueroasteikollisten muuttujien testit TKK (c) Ilkka Mellin (4) 111 TKK (c) Ilkka Mellin (4) 11 Testejä suhdeasteikollisille muuttujille Testejä järjestysasteikollisille muuttujille Suhde- (ja välimatka-) asteikollisten muuttujien testejä: Yhden otoksen t-testi odotusarvolle Kahden riippumattoman otoksen t-testi A odotusarvoille erisuurten varianssien tapauksessa Kahden riippumattoman otoksen t-testi B odotusarvoille yhtä suurten varianssien tapauksessa t-testi parivertailuille Yhden otoksen testi varianssille Kahden riippumattoman otoksen varianssien vertailutesti Ks. lukua Testit suhdeasteikollisille muuttujille. Järjestysasteikollisten muuttujien testejä: Merkkitesti Wilcoxonin rankitesti Mannin ja Whitneyn testi eli Wilcoxonin rankisummatesti Ks. lukua Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (4) 113 TKK (c) Ilkka Mellin (4) 114

TKK (c) Ilkka Mellin (4) 115 Testejä laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testejä: Testi suhteelliselle osuudelle Suhteellisten osuuksien vertailutesti Ks. lukua Testit laatueroasteikollisille muuttujille.