Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Samankaltaiset tiedostot
Mat Tilastollisen analyysin perusteet, kevät 2007

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Testejä suhdeasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Sovellettu todennäköisyyslasku A

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

10. laskuharjoituskierros, vko 14, ratkaisut

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Testit järjestysasteikollisille muuttujille

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

031021P Tilastomatematiikka (5 op) viikko 5

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

2. TILASTOLLINEN TESTAAMINEN...

Mat Tilastollisen analyysin perusteet, kevät 2007

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Sovellettu todennäköisyyslaskenta B

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollinen aineisto Luottamusväli

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Todennäköisyyden ominaisuuksia

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

riippumattomia ja noudattavat samaa jakaumaa.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Tilastollisia peruskäsitteitä ja Monte Carlo

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Osa 2: Otokset, otosjakaumat ja estimointi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

tilastotieteen kertaus

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Sovellettu todennäköisyyslaskenta B

5.7 Uskottavuusfunktioon perustuvia testejä II

Estimointi. Otantajakauma

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Vilkkumaa / Kuusinen 1

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

2. Keskiarvojen vartailua

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

11. laskuharjoituskierros, vko 15, ratkaisut

Teema 9: Tilastollinen merkitsevyystestaus

Transkriptio:

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Sisältö

Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja naisten pituuksissa eroa tai alentaako lääke L verenpainetta tai kestääkö ruuviliitos R 1 ruuviliitosta R 2 paremmin.

Tilastolliseen tutkimukseen kuuluu hypoteesien tekeminen ja testaus. Tilastollinen hypoteesi on populaatiota koskeva väite, jonka todenperäisyyttä arvioidaan todennäköisyyksien avulla. Tilastollisen testin lähtökohtana on muodostaa nollahypoteesi H 0 ja vastahypoteesi H 1.

Testausasetelman hypoteesit Testausasetelma kiinnitetään tekemällä kolme oletusta: Testausasetelmaa koskevat perusoletukset, joista pidetään kiinni testauksen aikana, muodostavat testin (tai jakauman/mallin) yleisen hypoteesin H. Testattavaa väitettä/oletusta kutsutaan nollahypoteesiksi H 0. Jos nollahypoteesi hylätään testissä, astuu voimaan vaihtoehtoinen hypoteesi H 1.

Yleinen hypoteesi Yleinen hypoteesi H sisältää oletukset perusjoukosta, käytetystä otantamenetelmästä ja perusjoukon jakaumasta. Yleisen hypoteesin H oletuksista pidetään kiinni koko testauksen ajan. Yleisen hypoteesin sisältämiä jakaumaoletuksia voidaan, ja on yleensä syytäkin, testata erikseen.

Nollahypoteesi Sitä perusjoukon jakauman parametreja koskevaa väitettä tai oletusta, jota halutaan testata kutsutaan nollahypoteesiksi H 0. Nollahypoteesista H 0 pidetaan kiinni, elleivät havaintojen sisältämät todisteet nollahypoteesia vastaan ole kyllin voimakkaita. Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa H 0 : θ = θ 0, missä θ on testattava parametri ja θ 0 on parametrin kiinnitetty arvo. Nollahypoteesi on muotoa on sama tai ei ole eroa.

Vaihtoehtoinen hypoteesi Vaihtoehtoinen hypoteesi H 1 on oletus, joka astuu voimaan, jos nollahypoteesi H 0 hylätään. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0 tai muotoa H 1 : θ < θ 0, sitä kutsutaan yksisuuntaiseksi. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0, sitä kutsutaan kaksisuuntaiseksi. Vaihtoehtoinen hypoteesi on muotoa ei ole sama tai on eroa. Vaihtoehtoisen hypoteesin valinta saattaa olla vaikea tehtävä, sillä aina ei ole varmuutta siitä, eroavatko parametrit nollahypoteesin arvosta tiettyyn suuntaan vai molempiin, eli pitäisikö vastahypoteesin olla yksi- vai kaksisuuntainen. Huomioi, että yksisuuntaisen vastahypoteesin valitseminen suotuisan testituloksen kalastamiseksi ei ole sallittua!

Testisuure Tilastollinen testi perustuu testisuureeseen, joka mittaa havaintojen ja nollahypoteesin H 0 yhteensopivuutta. Testisuure on satunnaismuuttuja, jonka arvo riippuu havainnoista ja nollahypoteesista H 0. Havaintojen ja nollahypoteesin H 0 yhteensopivuuden mittaaminen tarkoittaa sitä, että tutkitaan kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on saatu, ehdolla että H 0 pätee. Yhteensopivuuden mittaaminen vaatii testisuureen jakauman tuntemista.

Testisuureen normaaliarvo Testisuureen odotusarvoa nollahypoteesin H 0 pätiessä kutsutaan testisuureen normaaliarvoksi. Jos testisuureen havaittu arvo on lähellä testisuureen normaaliarvoa, havainnot ovat sopusoinnussa nollahypoteesin H 0 kanssa. Jos testisuureen otoksesta määrätty arvo poikkeaa merkitsevästi testisuureen normaaliarvosta, havainnot sisältävät todisteita nollahypoteesia H 0 vastaan.

Testin p arvo Tilastollisen testin p arvo on testin havaitun arvon tai vielä sitäkin poikkeuksellisemman arvon (normaaliarvoon verrattuna) todennäköisyys olettaen, että nollahypoteesi H 0 pätee. Nollahypoteesin H 0 hylkäys tai hyväksyminen perustuu testin p arvoon. Testien p arvot saadaan tilastollisista ohjelmistoista. Myös etukäteen valittuja merkitsevyystasoja ja niitä vastaavia hylkäysalueita voidaan käyttää.

Testin p arvo Testin p arvo määritetään seuraavalla tavalla: 1. Lasketaan valitun testisuureen arvo havainnoista. 2. Määritetään testisuureen jakaumaan perustuen olettaen, että nollahypoteesi H 0 pätee todennäköisyys sille, että testisuure saa (normaaliarvoonsa verrattuna) niin poikkeuksellisen arvon tai vielä poikkeuksellisempia arvoja kuin se on saanut. Nollahypoteesi voidaan hylätä, jos testin p arvo on kyllin pieni. Mitä pienempi on testin p arvo, sitä vahvempia todisteita havainnot sisältävät nollahypoteesia H 0 vastaan.

Nollahypoteesin hylkäykseen voi liittyä kahdenlaisia virheitä. Tyypin 1 virhe: Tosi nollahypoteesi hylätään. (Sattumalta saatu hyvin epätodennäköinen otos.) Tyypin 2 virhe: Väärä nollahypoteesi jää hylkäämättä. Koska testeissa halutaan ensisijaisesti suojautua tyypin 1 virheitä vastaan, testin merkitsevyystasoksi α (p arvoon liittyva raja p 0 ) on tapana valita pienia lukuja. Tavanomaisimpia merkitsevyystasoja ovat α = 0.05, α = 0.01 ja α = 0.001. Tällöin esim. jos testin p arvo < 0.05, niin nollahypoteesi hylätään.

Testin p arvo, H 1 : θ > θ 0 Olkoon testisuureen Z havainnoista laskettu arvo z. Jos vaihtoehtoisena hypoteesina on yksisuuntainen vaihtoehto H 1 : θ > θ 0 niin testin p arvo on p = P(Z z H 0 ).

Testin p arvo, H 1 : θ < θ 0 Olkoon testisuureen Z havainnoista laskettu arvo z. Jos vaihtoehtoisena hypoteesina on yksisuuntainen vaihtoehto H 1 : θ < θ 0 niin testin p arvo on p = P(Z z H 0 ).

Testin p arvo, H 1 : θ θ 0 Olkoon testisuureen Z havainnoista laskettu arvo z. Jos vaihtoehtoisena hypoteesina on kaksisuuntainen vaihtoehto H 1 : θ θ 0 niin testin p arvo on p = 2 min{p(z z H 0 ), P(Z z H 0 )}.

Tilastollisen testin suorittamisen vaiheet 1. Asetetaan testin hypoteesit. 2. Valitaan testisuure. 3. Poimitaan otos niin, että yleisen hypoteesin oletukset pätevät. 4. Määritetään testisuureen arvo havainnoista. 5. Määritetään testisuureen havaittua arvoa vastaava p arvo. 6. Tehdään päätös nollahypoteesin hylkäämisestä/hylkäämättä jättämisestä.

Yhden otoksen t testi Yhden otoksen t testi vertaa odotusarvoa annettuun vakioon.

Yhden otoksen t testi, oletukset Olkoot x 1, x 2,..., x n satunnaismuuttujan x havaitut arvot. Oletetaan, että havaintopisteet ovat riippumattomia, samoin jakautuneita ja tulevat normaalijakaumasta N(µ, σ 2 ). Nollahypoteesi H 0 : µ = µ 0. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : µ > µ 0 (yksisuuntainen), H 1 : µ < µ 0 (yksisuuntainen) tai H 1 : µ µ 0 (kaksisuuntainen).

Yhden otoksen t testi, p arvo t testisuure t = x µ 0 s/ n. Jos nollahypoteesi pätee, niin testisuure noudattaa Studentin t jakaumaa vapausastein n 1. Testisuureen normaaliarvo on 0, koska nollahypoteesin pätiessä E[t] = 0. Itseisarvoltaan suuret testisuureen arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni.

Yhden otoksen t testi, normaalisuusoletuksen merkitys Yhden otoksen t testin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita. t testi ei kuitenkaan ole kovin herkkä poikkeamille normaalisuudesta, jos havaintojen lukumäärä n on suuri. Testiä on melko turvallista käyttää, kun havaintojen lukumäärä n > 25 ellei havaintojen jakauma ole kovin vino. Jos havaintojen lukumäärä n > 40, niin testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille.

Numeerinen esimerkki yhden otoksen t-testille Kallen supersuklaisissa herkkukekseissä on paketin mukaan jokaisessa keksissä 12 suklaapalaa. Tutkimuksessa laskettiin kymmenen herkkukeksin sulkaapalojen määrä ja saatiin seuraavat tulokset: 12,11,10,13,14,12,11,12,12,12. Halutaan selvittää voidaanko 5% merkitsevyystasolla sanoa, että keksien suklaapitoisuus ei vastaa pakettia.

Keksien suklaapitoisuuksien keskiarvo on 11.9 suklaapalaa. Otoskeskihajonnaksi saadaan 1.1005 suklaapalaa. Testin arvoksi saadaan t = x µ 0 s/ n = 11.9 12 1.1005/ 10 = 0.287. Nollahypoteesin ollessa tosi, testisuure noudattaa Studentin t-jakaumaa vapausastein 9. 5% merkitsevyystasolla ja vapausasteella 9, testisuureen kriittiseksi arvoksi saadaan 2.262. Koska testisuureen arvo 0.287 > 2.262 ja 0.287 < 2.262, nollahypoteesi jätetään voimaan. Usein testauksessa tarkastellaan suoraan p-arvoa. Todennäköisyyksiksi P(T t H 0 ) ja P(T t H 0 ) saadaan 0.6098 ja 0.3902. Näin ollen p-arvo on p = 2 min{p(z z H 0 ), P(Z z H 0 )} = 2 0.3902 = 0.7804 P-arvo on suuri, joten nollahypoteesi jätetään voimaan.

Mikä meni pieleen edellisessä esimerkissä?

Kahden otoksen t testi Kahden otoksen t testi vertaa kahden riippumattoman otoksen odotusarvoja kun otosten variansseja ei oleteta yhtäsuuriksi.

Kahden otoksen t testi, oletukset Olkoot x 1, x 2,..., x n satunnaismuuttujan x havaitut arvot ja olkoot y 1, y 2,..., y m satunnaismuuttujan y havaitut arvot. Oletetaan, että havaintopisteet x 1, x 2,..., x n ovat riippumattomia, samoin jakautuneita, ja tulevat normaalijakaumasta N(µ x, σ 2 x ) ja oletetaan, että havaintopisteet y 1, y 2,..., y m ovat riippumattomia, samoin jakautuneita, ja tulevat normaalijakaumasta N(µ y, σ 2 y ). Oletetaan vielä, että x i ja y j ovat riippumattomia kaikilla i, j. Nollahypoteesi H 0 : µ x = µ y. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : µ x > µ y (yksisuuntainen), H 1 : µ x < µ y (yksisuuntainen) tai H 1 : µ x µ y (kaksisuuntainen).

Kahden otoksen t testi, p arvo t testisuure t = x ȳ. sx/n 2 + sy/m 2 Jos nollahypoteesi pätee, niin testisuure noudattaa Studentin t jakaumaa vapausastein v, missä v = (s 2 x/n + s 2 y/m) 2 ((s 2 x/n) 2 /(n 1)) + ((s 2 y/m) 2 /(m 1)). Testisuureen normaaliarvo on 0, koska nollahypoteesin pätiessä E[t] = 0. Itseisarvoltaan suuret testisuureen arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni.

Kahden otoksen t testi, normaalisuusoletuksen merkitys Kahden otoksen t testin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita. Kahden otoksen t testi ei kuitenkaan ole kovin herkkä poikkeamille normaalisuudesta, jos havaintojen lukumäärät n ja m ovat suuria. Testiä on melko turvallista käyttää, kun n > 25, m > 25, ja kun n ja m eivät eroa toisistaan kovin paljon, elleivät havaintojen jakaumat ole kovin vinoja. Jos n > 40 ja m > 40, niin testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille.

Kahden otoksen t testi, yhtäsuuret varianssit Kahden otoksen t testi yksinkertaistuu hieman kun otosten varianssit oletetaan yhtäsuuriksi.

Kahden otoksen t testi, yhtäsuuret varianssit Oletukset (H, H 0 ja H 1 ) ovat kuten yleisessä kahden otoksen t testissä, mutta jakaumien varianssit oletetaan yhtä suuriksi. t testisuure missä t = x ȳ s p 1/n + 1/m, sp 2 = (n 1)s2 x + (m 1)sy 2. n + m 2 Jos nollahypoteesi pätee, niin testisuure noudattaa Studentin t jakaumaa vapausastein n + m 2. Testisuureen normaaliarvo on 0, koska nollahypoteesin pätiessä E[t] = 0. Itseisarvoltaan suuret testisuureen arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. Normaalisuusoletuksen merkitys kuten yleisessä kahden otoksen t testissä.

t testi parivertailuille Kahden otoksen t testit toimivat riippumattomien otoksien tapauksessa. Parivertailuasetelma syntyy tilastollisessa tutkimuksessa esimerkiksi silloin kun päämääränä on verrata kahta mittaria mittaamalla molemmilla mittareilla samoja kohteita samoissa olosuhteissa. (Eroavatko kahden rasvaprosenttimittarin tuottamat tulokset toisistaan?) Parivertailuasetelma syntyy myös kun päämääränä on tutkia jonkin käsittelyn vaikutusta mittaamalla samoja kohteita ennen käsittelyä ja käsittelyn jälkeen. (Vaikuttaako juopottelu reaktioaikaan?) Päämääränä voi myös olla esimerkiksi vertailla kahta perusjoukkoa mittaamalla saman muuttujan arvoja perusjoukkojen alkioiden sovitetuissa pareissa. (Eroavatko naimisissa olevien pariskuntien palkat toisistaan?)

t testi parivertailuille, testausasetelma Parivertailuilun testausasetelma Havainnot muodostuvat muuttujaa x koskevista mittaustuloksien pareista (x i1, x i2 ), i = 1, 2,..., n jotka ovat toisistaan riippumattomia. Yhden mittausparin arvoja ei kuitenkaan oleteta riippumattomiksi! Antavatko mittaukset keskimäärin saman tuloksen? Parivertailuasetelmissa ei tule käyttää riippumattomien otoksien t testejä! Muodostetaan mittaustuloksien x i1 ja x i2 erotukset d i = x i1 x i2, i = 1, 2,..., n. Mittaukset 1 ja 2 saavat keskimäärin saman tuloksen, jos erotukset d i saavat keskimäärin arvon nolla. Nyt voidaan käyttää tavanomaista yhden otoksen t testiä mittaustuloksien erotuksille d i.

t testi parivertailuille, p arvo Yleinen hypoteesi H: erotukset d i ovat riippumattomia, samoin jakautuneita, ja tulevat normaalijakaumasta. Nollahypoteesi H 0 : µ d = 0. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : µ d > 0 (yksisuuntainen), H 1 : µ d < 0 (yksisuuntainen) tai H 1 : µ d 0 (kaksisuuntainen). t testisuure t = d s d / n. Jos nollahypoteesi pätee, niin testisuure noudattaa Studentin t jakaumaa vapausastein n 1. Testisuureen normaaliarvo on 0. Itseisarvoltaan suuret testisuureen arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. Normaalisuusoletuksen merkitys kuten yhden otoksen t testissä.

Testi varianssille, oletukset Olkoot x 1, x 2,..., x n satunnaismuuttujan x havaitut arvot. Oletetaan, että havaintopisteet ovat riippumattomia, samoin jakautuneita, ja tulevat normaalijakaumasta N(µ, σ 2 ). Nollahypoteesi H 0 : σ 2 = σ 2 0. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : σ 2 > σ 2 0 (yksisuuntainen), H 1 : σ 2 < σ 2 0 (yksisuuntainen) tai H 1 : σ 2 σ 2 0 (kaksisuuntainen).

Testi varianssille, p arvo χ 2 testisuure χ 2 = (n 1)s2 σ0 2. Jos nollahypoteesi pätee, niin testisuure noudattaa χ 2 jakaumaa vapausastein n 1. Testisuureen normaaliarvo on n 1. Suuret ja pienet testisuureen arvot (verrattuna normaaliarvoon n 1) viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. Testi on herkkä poikkeamille normaalisuudesta. Testi ei toimi hyvin suurillakaan havaintomäärillä, jos havaintojen jakauma on vino.

Varianssien vertailutesti, oletukset Olkoot x 1, x 2,..., x n satunnaismuuttujan x havaitut arvot ja olkoot y 1, y 2,..., y m satunnaismuuttujan y havaitut arvot. Oletetaan, että havaintopisteet x 1, x 2,..., x n ovat riippumattomia, samoin jakautuneita, ja tulevat normaalijakaumasta N(µ x, σ 2 x ) ja oletetaan, että havaintopisteet y 1, y 2,..., y m ovat riippumattomia, samoin jakautuneita, ja tulevat normaalijakaumasta N(µ y, σ 2 y ). Oletetaan vielä, että x i ja y j ovat riippumattomia kaikilla i, j. Nollahypoteesi H 0 : σ 2 x = σ 2 y. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : σ 2 x > σ 2 y (yksisuuntainen), H 1 : σ 2 x < σ 2 y (yksisuuntainen) tai H 1 : σ 2 x σ 2 y (kaksisuuntainen).

Varianssien vertailutesti, p arvo F testisuure F = s2 x sy 2. Jos nollahypoteesi pätee, niin testisuure noudattaa F jakaumaa vapausastein n 1 ja m 1. Testisuureen normaaliarvo on noin 1. Suuret ja pienet testisuureen arvot (verrattuna normaaliarvoon 1) viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. Tämäkin testi on herkkä poikkeamille normaalisuudesta eikä testi toimi hyvin suurillakaan havaintomäärillä, jos havaintojen jakauma on vino.

F -jakauma Juttua F -jakaumasta Wolfram MathWorldissä

J. S. Milton, J. C. Arnold: Introduction to Probability and Statistics, McGraw-Hill Inc 1995. J. Crawshaw, J. Chambers: A Concise Course in Advanced Level Statistics, Nelson Thornes Ltd 2013. R. V. Hogg, J. W. McKean, A. T. Craig: Introduction to Mathematical Statistics, Pearson Education 2005. Pertti Laininen: Todennäköisyys ja sen tilastollinen soveltaminen, Otatieto 1998, numero 586. Ilkka Mellin: Tilastolliset menetelmät, http://math.aalto.fi/opetus/sovtoda/materiaali.html.