Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1
Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että ainakin kaksi odotusarvoista μ i, i = 1, 2,..., k, eroaa tilastollisesti merkitsevästi toisistaan. Mutta mitkä? Kysymykseen voidaan vastata vertailemalla ryhmäkohtaisia odotusarvoja pareittain Vertailu voidaan suorittaa käyttämällä luottamusvälejä tai testejä. Vilkkumaa / Kuusinen 2
Odotusarvoparien vertailu - luottamusvälin käyttö 1/2 Oletetaan, että haluamme verrata odotusarvoja μ k ja μ l. Vertailu voidaan suorittaa siten, että konstruoidaan odotusarvojen μ k ja μ l erotukselle μ k μ l luottamusväli luottamustasolla (1 α) ja tutkitaan kuuluuko nolla väliin vai ei. Vilkkumaa / Kuusinen 3
Odotusarvoparien vertailu - luottamusvälin käyttö 2/2 Käytetään odotusarvojen μ k ja μ l erotuksen luottamusvälinä luottamustasolla (1 α) väliä (ȳ k ȳ l ) ± t α/2 s P 1 n k + 1 n l, missä s 2 P = 1 N k (n i 1)s 2 i = 1 N k on ns. yhdistetty varianssi, jossa s 2 i = 1 n i 1 i havaintojen otosvarianssi. SSE = MSE ni j=1 (y ji ȳ i ) 2 on ryhmän Vilkkumaa / Kuusinen 4
Odotusarvoparien vertailu - testauksen käyttö 1/2 Oletetaan, että haluamme verrata odotusarvoja μ k ja μ l. Vertailu tapahtuu testaamalla nollahypoteesia merkitsevyystasolla α. Vaihtoehtoisen hypoteesina on H 0 : μ k = μ l H 1 : μ k μ l Vilkkumaa / Kuusinen 5
Odotusarvoparien vertailu - testauksen käyttö 2/2 Käytetään t-testisuuretta t = ȳ k ȳ l s P 1 n k + 1 n l. Nollahypoteesin pätiessä t t(n k). Itseisarvoltaan suuret testisuureen t arvot johtavat nollahypoteesin hylkäämiseen. Vilkkumaa / Kuusinen 6
Simultaaniset testit Jos ryhmiä on k kpl, on mahdollisia parivertailuja ( ) k k(k 1) m = = 2 2 kappaletta Simultaanisessa testauksessa tarkastellaan todennäköisyyttä α, että vähintään yhden testin nollahypoteesi hylätään virheellisesti. Vilkkumaa / Kuusinen 7
Simultaaniset testit Määritellään tapahtuma A i = Nollahypoteesia ei hylätä virheellisesti testissä i, i = 1, 2,..., m. Jos kaikissa vertailutesteissä käytetään merkitsevyystasoa α, niin P (A i ) = 1 α, i = 1, 2,..., m, ja P (A c i) = α, i = 1, 2,..., m. Vilkkumaa / Kuusinen 8
Simultaaniset testit - Bonferronin epäyhtälö Olkoot tapahtumia. Tällöin pätee Bonferronin epäyhtälö A 1, A 2,..., A m P (A 1 A 2 A m ) 1 [P (A c 1) + P (A c 2) + + P (A c m)]. Vilkkumaa / Kuusinen 9
Bonferronin menetelmä simultaanisissa testeissä Bonferronin epäyhtälöstä seuraa, että α = P ( Vähintään yksi virheellinen hylkäys ) = 1 P ( Ei yhtään virheellistä hylkäystä ) = 1 P (A 1 A 2 A m ) mα, missä m on testien lukumäärä. Kun valitaan taataan, että α = β m, α β. Vilkkumaa / Kuusinen 10
Klikkeri-kysely Testataan kahdeksaa hypoteesia samanaikaisesti. Mikä merkitsevyystaso α testeissä on valittava, jotta todennäköisyys vähintään yhdelle virheelliselle hylkäykselle on alle 0.1? 1. 0.1 2. 0.05 3. 0.0125 Vilkkumaa / Kuusinen 11
Yhteenveto: parivertailut Jos yksisuuntaisen varianssianalyysin nollahypoteesi hylätään, tiedetään, että ainakin kahden ryhmän odotusarvot poikkeavat toisistaan Ryhmäkohtaisia odotusarvoja voidaan tällöin vertailla pareittain t-testillä Simultaanisia parivertailutestejä tehtäessä voidaan tarkastella todennäköisyyttä sille, että vähintään yhden testin nollahypoteesi hylätään virheellisesti Jos tämän todennäköisyyden halutaan olevan enintään β ja testejä on m kpl, tulee kunkin testin merkitsevyystasoksi valita β/m Vilkkumaa / Kuusinen 12
Kontrastit Vilkkumaa / Kuusinen 13
Motivointi Ryhmiin jaetun aineiston odotusarvoille μ i, i = 1, 2,..., k on tähän mennessä esitetty kahdenlaisia hypoteeseja: - H 0 : μ 1 = μ 2 =... = μ k = μ (varianssianalyysi) - H 0 : μ k = μ l (parivertailu) Entä jos halutaan tarkastella monimutkaisempia hypoteeseja, kuten H 0 : μ k + μ k+1 = μ l + μ l+1 tai H 0 : μ k = 1 2 (μ l + μ l+1 )? Tällaisia hypoteeseja voidaan testata käyttämällä kontrasteja. Vilkkumaa / Kuusinen 14
Kontrastin määritelmä Olkoon y ji = μ i + ε ji, j = 1, 2,..., n i, i = 1, 2,..., k yksisuuntaisen varianssianalyysin malli, jossa jäännöstermit ε ji ovat riippumattomia ja normaalijakautuneita: ε ji N(0, σ 2 ), j, i Parametrien μ 1, μ 2,..., μ k lineaarikombinaatio Γ = c i μ i on kontrasti, jos c i = 0. Vilkkumaa / Kuusinen 15
Kontrasteja koskevat hypoteesit Asetetaan kontrastille Γ nollahypoteesi ja vaihtoehtoinen hypoteesi H 0 : Γ = H 1 : Γ = c i μ i = 0 c i μ i 0 Vilkkumaa / Kuusinen 16
Kontrastien estimointi Olkoon kontrastin estimaattori. C = Γ = c i ȳ i c i μ i Estimaattori C on normaalijakautunut: C N(μ C, σc 2 ), missä μ C = E(C) = c i μ i = Γ σ 2 C = D 2 (C) = σ 2 c 2 i n i Vilkkumaa / Kuusinen 17
F -testi kontrasteille 1/3 Olkoon Q 1 = C2 D 2 (C). Jos nollahypoteesi H 0 : Γ = 0 pätee, niin Q 1 χ 2 (1). Olkoon jossa SSE = k Voidaan osoittaa, että jossa N = n 1 + n 2 + + n k. Q 2 = SSE σ, 2 ni j=1 (y ji ȳ i ) 2 = k (n i 1)s 2 i. Q 2 χ 2 (N k), Vilkkumaa / Kuusinen 18
F -testi kontrasteille 2/3 Määritellään F -testisuure F = Q 1 /1 Q 2 /(N k) = (N k)q 1 Q 2. Voidaan osoittaa, että neliösummat Q 1 ja Q 2 ovat riippumattomia. Näin ollen, jos nollahypoteesi H 0 : Γ = 0 pätee, niin F F (1, N k). Vilkkumaa / Kuusinen 19
F -testi kontrasteille 3/3 Testisuure F voidaan kirjoittaa myös muodossa F = ( ) 2 k c iȳ i ( ), k c 2 i MSE n i jossa MSE = SSE/(N k) ja SS C = ( c i ȳ i ) 2 / c 2 i n i on kontrastin C neliösumma. Vilkkumaa / Kuusinen 20
t-testi kontrasteille Edellä esitetty F -testi ja testi, jossa käytetään t-testisuuretta t = MSE k c iȳ i ( k c 2 i n i ) ovat ekvivalentteja. Jos nollahypoteesi H 0 : Γ = 0 pätee, niin t t(n k). Vilkkumaa / Kuusinen 21
Ortogonaaliset kontrastit Kontrastit ja ovat ortogonaalisia, jos Γ = Δ = c i μ i d i μ i c i d i n i = 0. Vilkkumaa / Kuusinen 22
Ortogonaaliset kontrastit ja SSG Toisistaan riippumattomien ortogonaalisien kontrastien lukumäärä on k 1, jossa k on ryhmien lukumäärä. Ortogonaaliset kontrastit dekomponoivat ryhmien välistä vaihtelua kuvaavan SSG-neliösumman (k 1) komponenttiin, joista jokaisen aste on 1. Siten ortogonaalisiin kontrasteihin liittyvät testit ovat riippumattomia. Vilkkumaa / Kuusinen 23
Klikkeri-kysely Minkä tulkinnan antaisit nollahypoteesille H 0 : μ 1 + μ 2 = μ 3 + μ 4? 1. Ryhmien 1 ja 2 odotusarvot voidaan olettaa samoiksi, kuten myös ryhmien 3 ja 4. 2. Ryhmien 1 ja 2 yhdistetty odotusarvo ei poikkea ryhmien 3 ja 4 yhdistetystä odotusarvosta. 3. Kunkin neljän ryhmän odotusarvot voi olettaa samoiksi. Vilkkumaa / Kuusinen 24
Yhteenveto: kontrastit Kontrasteilla voidaan testata parivertailuja ja varianssianalyysia monimutkaisempia, ryhmäkohtaisia odotusarvoja koskevia nollahypoteeseja, esim. H 0 : μ k + μ k+1 = μ l + μ l+1 tai H 0 : μ k = 1 2 (μ l + μ l+1 ) Kontrastien testaamiseen voidaan käyttää joko t- tai F -testiä Ortogonaalisia kontrasteja on k:n ryhmän tapauksessa k 1 kpl Ortogonaaliset kontrastit dekomponoivat ryhmien välistä vaihtelua kuvaavan SSG-neliösumman (k 1) komponenttiin, joista jokaisen aste on 1 Vilkkumaa / Kuusinen 25