Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit



Samankaltaiset tiedostot
Testit järjestysasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testejä suhdeasteikollisille muuttujille

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Mat Tilastollisen analyysin perusteet, kevät 2007

Väliestimointi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

10. laskuharjoituskierros, vko 14, ratkaisut

Mat Sovellettu todennäköisyyslasku A

Sovellettu todennäköisyyslaskenta B

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Osa 2: Otokset, otosjakaumat ja estimointi

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Hypoteesin testaus Alkeet

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Sovellettu todennäköisyyslaskenta B

2. TILASTOLLINEN TESTAAMINEN...

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Mat Tilastollisen analyysin perusteet, kevät 2007

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Tilastollinen aineisto Luottamusväli

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Mat Tilastollisen analyysin perusteet, kevät 2007

Kaksisuuntainen varianssianalyysi. Heliövaara 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

pisteet Frekvenssi frekvenssi Yhteensä

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Sovellettu todennäköisyyslaskenta B

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

11. laskuharjoituskierros, vko 15, ratkaisut

6. laskuharjoitusten vastaukset (viikot 10 11)

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

031021P Tilastomatematiikka (5 op) viikko 5

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

HAVAITUT JA ODOTETUT FREKVENSSIT

Estimointi. Otantajakauma

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Aineistokoko ja voima-analyysi

MTTTP5, luento Luottamusväli, määritelmä

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Transkriptio:

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden

Sisältö t ja t t ja t kahden kahden

t ja t kahden

t ja t Tällä luennolla käsitellään epäparametrisia eli jakaumasta riippumattomia tilastollisia testejä. kahden

t ja t t ja t kahden

t ja t t ja t t ja t sopivat järjestysasteikollisille (esim. kouluarvosanat) muuttujille. Niitä voidaan kuitenkin käyttää myös jatkuville kvantitatiivisille muuttujille. en ja en etuna on, että niiden käyttö ei edellytä vahvoja jakaumaoletuksia. kahden

t ja t kahden

Yhden merkkitesti Yhden merkkitesti vastaa yhden t testiä ilman oletuksia perusjoukon jakauman tyypistä. Olkoot x 1, x 2,..., x n jatkuvan satunnaismuuttujan x havaitut arvot. Oletetaan, että havaintopisteet ovat riippumattomia ja tulevat (tuntemattomasta) jakaumasta, jonka mediaani m. Nollahypoteesi mediaanille H 0 : m = m 0. t ja t kahden Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m > m 0 (yksisuuntainen), H 1 : m < m 0 (yksisuuntainen) tai H 1 : m m 0 (kaksisuuntainen).

Yhden merkkitesti Muodostetaan erotukset d i = x i m 0, i = 1, 2,..., n. Testisuure S on niiden tapausten lukumäärä, joilla d i > 0. (Vaihtoehtoisesti voidaan tarkastella niiden tapausten lukumäärä, joilla d i < 0. ) Jos nollahypoteesi pätee, niin testisuure noudattaa binomijakaumaa parametrein n ja 1/2. Testisuureen normaaliarvo on 1 2 n, ja sen varianssi on 1 4 n. Suuret ja pienet testisuureen arvot (verrattuna normaaliarvoon 1 2n) viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. t ja t kahden

Yhden merkkitesti, p arvot Testisuureen S jakauma on taulukoitu ja monet tietokoneohjelmat laskevat testin p arvoja. n p arvot määritetään seuraavilla kaavoilla, joissa s on testisuureen S havaittu arvo: Jos vaihtoehtoinen hypoteesi H 1 : m > m 0, niin testin p arvo on p = P(S s). Jos vaihtoehtoinen hypoteesi H 1 : m < m 0, niin testin p arvo on p = P(S s). Jos vaihtoehtoinen hypoteesi H 1 : m m 0, niin testin p arvo on p = 2 min{p(s s), P(S s)}. Edellä P(S s) ja P(S s) lasketaan luonnollisestikin nollahypoteesin vallitessa. t ja t kahden

Yhden asymptoottinen merkkitesti t ja t Kun otoskoko on suuri, testisuure Z = S n/2 noudattaa n/4 nollahypoteesin vallitessa likimain standardinormaalijakaumaa. Approksimaatio on tavallisesti riittävän hyvä, jos n > 20. Pienissä otoksissa nojataan testisuureen S tarkkaan jakaumaan. kahden

Yhden merkkitesti Oletimme edellä, että otos on jatkuvasta jakaumasta. ä voidaan käyttää myös silloin kun otos on diskreetistä jakaumasta, mutta tällöin on mahdollista, että osalle otospisteistä d i = x i m 0 = 0. Jos nollien lukumäärä on pieni otoskokoon nähden, niin nämä tapaukset voidaan jättää huomioimatta ja otoskokoa voidaan pienentää vastaavasti. Muussa tapauksessa nollat tulee määrittää siten, että ne vaikeuttavat nollahypoteesin hylkäystä. Esim. kaksisuuntaisen vaihtoehtoisen hypoteesin tapauksessa tulos 3 negatiivista merkkiä, 15 positiivista merkkiä ja 6 nollaa, tulisi testissä käsitellä kuten 9 negatiivista merkkiä ja 15 positiivista merkkiä. t ja t kahden

parivertailuille, testausasetelma t ja t Parivertailuilun testausasetelma Havainnot muodostuvat muuttujaa x koskevista mittaustuloksien pareista (x i1, x i2 ), i = 1, 2,..., n jotka ovat toisistaan riippumattomia. Yhden mittausparin arvoja ei kuitenkaan oleteta riippumattomiksi! Muodostetaan mittaustuloksien x i1 ja x i2 nollasta eroavat erotukset d i = x i1 x i2, i = 1, 2,..., k. kahden

parivertailuille t ja t Yleinen hypoteesi H: erotukset d i ovat riippumattomia, samoin jakautuneita ja tulevat jakaumasta jonka mediaani on m. Nollahypoteesi mediaanille H 0 : m = 0. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m > 0 (yksisuuntainen), H 1 : m < 0 (yksisuuntainen) tai H 1 : m 0 (kaksisuuntainen). Nyt voidaan käyttää tavanomaista yhden merkkitestiä mittaustuloksien erotuksille d i. kahden

Numeerinen esimerkki t ja t Eräässä kuvitteellisessa hoitokokeessa tutkitaan, kuinka lääke a alentaa plasman galliapitoisuutta. Plasman korkea galliapitoisuus on yhteydessä moniin sairauksiin. Kokeen alussa mitattiin galliapitoisuus ensimmäisen kerran ja toisen kerran 8 viikon lääkehoidon jälkeen. Haluat tutkia onko lääkkeellä ollut haluttua vaikutusta 5% luottamustasolla. kahden

Mittaustulokset Taulukko: Galliapitoisuudet (µg/1000ml) ennen ja hoidon jälkeen. Potilas Pitoisuus Erotus Ennen Jälkeen 1 1384 1332-52 2 1640 1564-76 3 1122 1100-22 4 1272 1260-12 5 1380 1360-20 6 624 1624 1000 7 360 1821 1461 8 456 450-6 9 1726 1712-14 10 332 821 489 11 1342 1338-4 12 1630 1626-4 13 1170 1160-10 t ja t kahden

t testi t ja t One Sample t-test data: Erotus t = 1.5646, df = 12, p-value = 0.9282 alternative hypothesis: true mean is less than 0 sample estimates: mean of x = 210 kahden

t ja t One-sample Sign-Test data: Erotus s = 3, p-value = 0.04614 alternative hypothesis: true median is less than 0 sample estimates: median of x = -10 kahden

t ja t Vertaile testien antamia tuloksia. Kumpikaan testeistä ei yksinään anna hyvää kuvaa lääkityksen a vaikutuksesta? Miksi? Miten lääke näyttäisi tämän aineiston perusteella vaikuttavan? kahden

t ja t kahden

Yhden Yhden merkillinen vastaa yhden t testiä vähemmillä jakaumaoletuksilla. Olkoot x 1, x 2,..., x n jatkuvan symmetrisen satunnaismuuttujan x havaitut arvot. Oletetaan, että havaintopisteet ovat riippumattomia ja tulevat (tuntemattomasta) symmetrisestä jakaumasta, jonka mediaani m. t ja t kahden Nollahypoteesi mediaanille H 0 : m = m 0. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m > m 0 (yksisuuntainen), H 1 : m < m 0 (yksisuuntainen) tai H 1 : m m 0 (kaksisuuntainen).

Yhden Muodostetaan erotusten itseisarvot d i = x i m 0, i = 1, 2,..., n. Laitetaan nämä erotusten itseisarvot järjestykseen pienimmästä suurimpaan. Määritetään merkilliset järjestysluvut (signed ranks) R (x i ) s.e. R (x i ) on itseisarvon d i = x i m 0 järjestysluku kerrottuna erotuksen (x i m 0 ) merkillä. Testisuure W = R (x i )>0 R (x i ) on positiivisten järjestyslukujen summa. (Vaihtoehtoisesti voidaan tarkastella negatiivisten järjestyslukujen summaa.) Testisuureen normaaliarvo on n(n+1) 4, ja sen varianssi on n(n+1)(2n+1) 24. Suuret ja pienet testisuureen arvot (verrattuna normaaliarvoon n(n+1) 4 ) viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. t ja t kahden

Yhden, p arvot Testisuureen W jakauma on taulukoitu ja monet tietokoneohjelmat laskevat testin p arvoja. n p arvot määritetään seuraavilla kaavoilla, joissa w on testisuureen W havaittu arvo: Jos vaihtoehtoinen hypoteesi H 1 : m > m 0, niin testin p arvo on p = P(W w ). Jos vaihtoehtoinen hypoteesi H 1 : m < m 0, niin testin p arvo on p = P(W w ). Jos vaihtoehtoinen hypoteesi H 1 : m m 0, niin testin p arvo on p = 2 min{p(w w ), P(W w )}. Edellä P(W w ) ja P(W w ) lasketaan nollahypoteesin vallitessa. t ja t kahden

Yhden asymptoottinen t ja t Kun otoskoko on suuri, testisuure Z = W E(W ), missä var(w ) E(W ) = n(n+1) 4 ja var(w ) = n(n+1)(2n+1) 24, noudattaa nollahypoteesin vallitessa likimain standardinormaalijakaumaa. kahden Approksimaatio on tavallisesti riittävän hyvä, jos n > 20. Pienissä otoksissa nojataan testisuureen W tarkkaan jakaumaan.

Yhden Oletimme edellä, että otos on jatkuvasta jakaumasta. ä voidaan käyttää myös silloin kun otos on diskreetistä jakaumasta, mutta tällöin on mahdollista, että osalla otospisteistä itseisarvojen x i m 0 järjestysluku on sama. Tällöin kaikille näille otospisteille valitaan järjestysluvuksi keskimmäinen. Esim. jos kahdella otospisteellä x i m 0 on sama, vastaten järjestyslukuja 7 ja 8, niin molemmille pisteille asetetaan järjestysluvuksi 7.5. Jos kolmella otospisteellä x i m 0 on sama, vastaten järjestyslukuja 3, 4 ja 5, niin järjestysluvuksi valitaan kaikille kolmelle 4. t ja t kahden

parivertailuille, testausasetelma t ja t Parivertailuilun testausasetelma Havainnot muodostuvat muuttujaa x koskevista mittaustuloksien pareista (x i1, x i2 ), i = 1, 2,..., n jotka ovat toisistaan riippumattomia. Yhden mittausparin arvoja ei kuitenkaan oleteta riippumattomiksi! Muodostetaan mittaustuloksien x i1 ja x i2 nollasta eroavat erotukset d i = x i1 x i2, i = 1, 2,..., k. Erotusten oletetaan noudattavan symmetristä jakaumaa!! kahden

parivertailuille Yleinen hypoteesi H: erotukset d i ovat riippumattomia, samoin jakautuneita ja tulevat symmetrisestä jakaumasta jonka mediaani on m. Nollahypoteesi mediaanille H 0 : m = 0. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m > 0 (yksisuuntainen), H 1 : m < 0 (yksisuuntainen) tai H 1 : m 0 (kaksisuuntainen). Nyt voidaan käyttää tavanomaista yhden ä mittaustuloksien erotuksille d i. t ja t kahden

Numeerinen esimerkki, merkillinen parivertailulle Kallen superkeksien pahin kilpailija keksimarkkinoilla on Panun pahanmakuiset prinsessakeksit. Näiden keksipakettien eri kauppojen myyntihintoja haluttiin vertailla, mutta keksien hintojen jakaumasta ei ole tietoa, joskin voidaan olettaa, että hintojen erotuksien jakauma on symmetrinen. Tutkimukseen valittiin satunnaisesti 10 eri kauppaa. Keksien hinnat on kirjattu alla olevaan taulukkoon. Kallen 4.56 4.67 4.28 4.57 478 4.54 4.56 Panun 4.52 4.48 4.51 4.30 4.59 4.67 4.53 Erotus 0.04 0.19-0,23 0.27 0.19-0.13 0.03 4.48 4.47 4.50 4.54 4.71 4.49-0.06-0.24 0.01 t ja t kahden Taulukko: Taulukossa näkyvät Kallen superkeksien ja Panun pahanmakuisten prinsessakeksien hinnat eri kaupoissa.

Numeerinen esimerkki, merkillinen parivertailulle t ja t Erotusten oletetaan noudattavan symmetristä jakaumaa. Nollahypoteesina on, että Kallen superkeksien ja Panun pahanmakuisten prinsessakeksien hintojen teoreettisissa mediaaneissa ei ole eroa eli että erotusten teoreettinen mediaani on nolla. Seuraavaan sivulla olevaan taulukkoon on kirjattu erotusten itseisarvot suuruusjärjestyksessä sekä lisäksi erotusten merkilliset järjestysluvut. kahden

Numeerinen esimerkki, merkillinen parivertailulle t ja t Erotus 0.01 0.03 0.04 0.06 0.13 0.19 0.19 Merk.järj. 1 2 3-4 -5 6.5 6.5 0.23 0.24 0.27-8 -9 10 Taulukko: Erotusten itseisarvot järjetettyinä suurimmasta pienimpään ja erotusten merkilliset järjestysluvut. kahden Testisuure W = R (d i )>0 R (x i ) = 1 + 2 + 3 + 6.5 + 6.5 + 10 = 29. Testin p-arvoksi saadaan laskentaohjelmistolla 0.9219. Nollahypoteesi jätetään voimaan.

vs. Testit soveltuvat saman tyyppisiin ongelmiin: yksi otos, mediaanin vertaaminen vakioon - kaksi toisistaan riippuvaa otosta, mediaanien vertaaminen. Testit ovat yhden t testin ei-parametrisiä vastineita. Testisuureiden arvot eivät riipu havaintoarvoista, vaan ainoastaan niiden keskinäisestä järjestyksestä. ssä ei tehdä oletuksia perusjoukon jakauman tyypistä. vaatii symmetria-oletuksen. käyttää merkkitestiä enemmän informaatiota havaintojen järjestyksestä. Jos jakauma voidaan olettaa symmetriseksi, kannattaa turvautua Wilcoxoniin, muussa tapauksessa merkkitesti on ainoa tie. t ja t kahden

t ja t kahden kahden

kahden kahden vastaa kahden riippumattoman t testiä vähemmillä jakaumaoletuksilla. kahden on käytännössä täsmälleen sama testi kuin ns. Mannin ja Whitneyn testi. Olkoot x 1, x 2,..., x n satunnaismuuttujan x havaitut arvot ja olkoot y 1, y 2,..., y m satunnaismuuttujan y havaitut arvot. Oletetaan, että havaintopisteet x 1, x 2,..., x n ovat riippumattomia ja samoin jakautuneita, ja oletetaan, että havaintopisteet y 1, y 2,..., y m ovat riippumattomia ja samoin jakautuneita. Oletetaan vielä, että x i ja y j ovat riippumattomia kaikilla i, j ja että muuttujat x i ja muuttujat y j noudattavat muuten samaa jakaumaa, mutta niiden mediaanit saattavat erota toisistaan. t ja t kahden Nollahypoteesi mediaanille H 0 : m x = m y. Mahdolliset vaihtoehtoiset hypoteesit: H 1 : m x > m y (yksisuuntainen), H 1 : m x < m y (yksisuuntainen) tai H 1 : m x m y (kaksisuuntainen).

kahden Tarkastelaan otoksia x 1, x 2,..., x n ja y 1, y 2,..., y m. Oletetaan (yleisyyden kärsimättä), että n m. kahden perustuu kaikkien havaintojen keskinäisen suuruusjärjestyksen tarkasteluun. Yhdistetään otokset x 1, x 2,..., x n ja y 1, y 2,..., y m yhdeksi otokseksi z 1, z 2,..., z n+m. Järjestetään yhdistetyn havainnot suuruusjärjestykseen pienimmästä suurimpaan. Olkoon R(z i ) havainnon z i järjestysluku yhdistetyssä otoksessa z 1, z 2,..., z n+m. Testisuure W = n i=1 R(x i) on pienemmän järjestyslukujen summa. Testisuureen normaaliarvo on n(n + m + 1)/2, ja sen varianssi on nm(n + m + 1)/12. Suuret ja pienet testisuureen arvot (verrattuna normaaliarvoon n(n + m + 1)/2) viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos p arvo on kyllin pieni. t ja t kahden

kahden, p arvot Testisuureen W jakauma on taulukoitu ja monet tietokoneohjelmat laskevat testin p arvoja. kahden p arvot määritetään seuraavilla kaavoilla, joissa w on testisuureen W havaittu arvo: Jos vaihtoehtoinen hypoteesi H 1 : m x > m y, niin testin p arvo on p = P(W w). Jos vaihtoehtoinen hypoteesi H 1 : m x < m y, niin testin p arvo on p = P(W w). Jos vaihtoehtoinen hypoteesi H 1 : m x m y, niin testin p arvo on p = 2 min{p(w w), P(W w)}. Edellä P(W w) ja P(W w) lasketaan nollahypoteesin vallitessa. t ja t kahden

Kahden asymptoottinen t ja t Kun otoskoko on suuri, testisuure Z = W E(W ), missä var(w ) E(W ) = n(n + m + 1)/2 ja var(w ) = nm(n + m + 1)/12, noudattaa nollahypoteesin vallitessa likimain standardinormaalijakaumaa. kahden Approksimaatio on tavallisesti riittävän hyvä, jos n, m > 10. Pienissä otoksissa nojataan testisuureen W tarkkaan jakaumaan

kahden t ja t ä voidaan käyttää myös silloin kun otos on diskreetistä jakaumasta, mutta tällöin on mahdollista, että osalla otospisteistä on sama järjestysluku. Tällöin kaikille näille otospisteille valitaan järjestysluvuksi keskimmäinen. Esim. jos kahden havainnon järjestysluku on sama, vastaten järjestyslukuja 7 ja 8, niin molemmille havainnoille asetetaan järjestysluvuksi 7.5. Jos kolmen havainnon järjestysluku on sama, vastaten järjestyslukuja 3, 4 ja 5, niin järjestysluvuksi valitaan kaikille kolmelle 4. kahden

kahden t ja t Huomaa, että ä voidaan käyttää myös silloin, kun muuttujia ei voida mitata, mutta ne voidaan asettaa järjestykseen. (Esim. soittotaito, asunnon kunto,...) kahden

kahden t ja t kahden on kahden riippumattoman t testin ei-parametrinen vastine. Testisuureiden arvo ei riipu muuttujien x i ja y j arvoista, vaan ainoastaan niiden keskinäisestä järjestyksestä. Testi on varteenotettava vaihtoehto kahden riippumattoman t testille, jos perusjoukot eivät ole normaalijakautuneita. kahden

Numeerinen esimerkki kahden lle. t ja t Opiskelijoiden pituuksia mitattiin matematiikan laitoksen käytävällä. Kymmenen satunnaisesti valittua opiskelijaa laitettiin seisomaan pituusjärjestykseen. Opiskelijoiden joukossa oli sekä miehiä että naisia. Haluttiin selvittää, onko mies- ja naisopiskelijoin pituuksien jakaumissa eroa. kahden

Pituusjärjestyksestä saatiin seuraavan taulukon mukainen. Taulukkoon on kirjattu kunkin opiskelijan sukupuoli sekä järjestysluku. Opiskelija N N M M M N M M N M Järjestysluku 1 2 3 4 5 6 7 8 9 10 Taulukko: Pituusjärjestykseen järjestetyt mies- ja naisopiskelijat järjestyslukuineen. t ja t kahden Testisuure on pienemmän, tässä naisten, järjestyslukujen summa W = 4 i=1 R(x i) = 1 + 2 + 6 + 9 = 18. Koska otoskoot ovat pieniä luetaan taulukosta testisuureen kriittinen arvo. Kriittinen arvo 12.32 < 18, joten nollahypoteesia pituuksien jakaumien samuudesta ei voida hylätä.

t ja t J. S. Milton, J. C. Arnold: Introduction to Probability and Statistics, McGraw-Hill Inc 1995. R. V. Hogg, J. W. McKean, A. T. Craig: Introduction to Mathematical Statistics, Pearson Education 2005. Pertti Laininen: Todennäköisyys ja sen tilastollinen soveltaminen, Otatieto 1998, numero 586. Ilkka Mellin: Tilastolliset menetelmät, http://math.aalto.fi/opetus/sovtoda/materiaali.html. kahden