Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1
Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu ryhmiin yhden tekijän suhteen Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän suhteen Tavoitteena on kuten yksisuuntaisessa varianssianalyysissa testata hypoteesia, että tarkasteltavan muuttujan ryhmäkohtaiset odotusarvot ovat yhtä suuria. Vilkkumaa / Kuusinen 2
Kaksisuuntaisen varianssianalyysin perusasetelma 1/4 Oletetaan, että tutkimuksen kohteena oleva perusjoukko voidaan jakaa ryhmiin kahden tekijän A ja B suhteen. Oletetaan, että tekijällä A on I tasoa ja tekijällä B on J tasoa, jolloin jaossa syntyy ryhmiä I J kappaletta. Oletetaan, että ryhmistä poimitaan riippumattomat yksinkertaiset satunnaisotokset, joiden koko on K. Vilkkumaa / Kuusinen 3
Kaksisuuntaisen varianssianalyysin perusasetelma 2/4 Olkoon y kij = k. havainto tekijän A tason i ja tekijän B tason j määräämässä ryhmässä (i, j). Käytetystä otantamenetelmästä seuraa, että havainnot y kij voidaan olettaa riippumattomiksi satunnaismuuttujiksi. Vilkkumaa / Kuusinen 4
Kaksisuuntaisen varianssianalyysin perusasetelma 3/4 Oletetaan, että havainnot y kji ovat normaalijakautuneita: y kij N(μ ij, σ 2 ), k = 1,..., K, i = 1,..., I, j = 1,..., J Haluamme testata nollahypoteesia, että ryhmäkohtaiset odotusarvot E(y kij ) = μ ij ovat yhtä suuria. Nollahypoteesi on siis muotoa H 0 : μ ij = μ, i = 1,..., I, j = 1,..., J Jos nollahypoteesi H 0 pätee, ryhmät voidaan yhdistää havaintojen keskimääräisiä arvoja koskevissa tarkasteluissa. Vilkkumaa / Kuusinen 5
Kaksisuuntaisen varianssianalyysin perusasetelma 4/4 Kaksisuuntaisessa varianssianalyysissa nollahypoteesi H 0 : μ ij = μ, i = 1,..., I, j = 1,..., J on tapana jakaa kolmeksi nollahypoteesiksi, jotka koskevat tekijöiden A ja B päävaikutuksia ja tekijöiden A ja B yhdysvaikutusta. Tämä tekee ryhmäkohtaisten odotusarvojen yhtäsuuruutta koskevan testausongelman monimutkaisemmaksi kuin yksisuuntaisessa varianssianalyysissa. Syy: jos tekijöillä A ja B on yhdysvaikutusta, tekijöiden A ja B päävaikutuksia ei voida tarkastella erillisinä. Vilkkumaa / Kuusinen 6
Yhdysvaikutus Tekijöillä A ja B on yhdysvaikutusta, jos tekijän A vaikutus vastesuureeseen y on erilainen tekijän B eri tasoilla. Yhdysvaikutuksen olemassaolon voi tulkita havaintojen keskiarvodiagrammeista: jos ryhmäkeskiarvojen yhdysjanat eivät ole yhdensuuntaisia, havainnot viittaavat siihen, että tekijöillä on yhdysvaikutusta. Vilkkumaa / Kuusinen 7
Kaksisuuntaisen varianssianalyysin nollahypoteesit Tekijöiden A ja B yhdysvaikutusta koskeva nollahypoteesi on muotoa H AB : Ei yhdysvaikutusta Jos nollahypoteesi H AB jää voimaan, havaintojen ryhmittelyä tekijöiden A ja B suhteen voidaan tarkastella erillisinä. Tekijöiden A ja B päävaikutuksia koskevat nollahypoteesit ovat muotoa H A : Ei A-vaikutusta H B : Ei B-vaikutusta Vilkkumaa / Kuusinen 8
Ryhmäkeskiarvot ja kokonaiskeskiarvo Määritellään havaintoarvojen y kij ryhmäkeskiarvot kaavoilla ȳ ij = 1 K K k=1 y kij, i = 1,..., I, j = 1,..., J sekä kaikkien havaintoarvojen y ji kokonaiskeskiarvo kaavalla ȳ = 1 IJK I i=1 J j=1 K k=1 y kij, jossa IJK = N on havaintojen kokonaislukumäärä. Vilkkumaa / Kuusinen 9
Reunakeskiarvot Määritellään havaintoarvojen y kij marginaali- eli reunakeskiarvot kaavoilla ȳ i = 1 JK J j=1 K k=1 y kij = 1 J J j=1 ȳ ij, i = 1,..., I, ȳ j = 1 IK I i=1 K k=1 y kij = 1 I I i=1 ȳ ij, j = 1,..., J. Vilkkumaa / Kuusinen 10
Neliösummia 1/2 Olkoon I J K SST = (y kij ȳ ) 2 i=1 j=1 k=1 havaintoarvojen y kij kokonaisvaihtelua kuvaava neliösumma, SSA = JK I (ȳ i ȳ ) 2 i=1 tekijän A päävaikutusta kuvaava neliösumma ja SSB = IK J (ȳ j ȳ ) 2 j=1 tekijän B päävaikutusta kuvaava neliösumma. Vilkkumaa / Kuusinen 11
Neliösummia 2/2 Olkoon SSAB = K I J (ȳ ij ȳ i ȳ j + ȳ ) 2 i=1 j=1 tekijöiden A ja B yhdysvaikutusta kuvaava neliösumma ja SSE = I J K (y kij ȳ ij ) 2 i=1 j=1 k=1 ryhmien sisäistä vaihtelua kuvaava jäännösneliösumma. Neliösummille pätee varianssianalyysihajotelma SST = SSA + SSB + SSAB + SSE. Vilkkumaa / Kuusinen 12
Testisuure yhdysvaikutukselle Määritellään F -testisuure F AB = IJ(K 1) (I 1)(J 1) SSAB SSE Jos nollahypoteesi H AB : Ei yhdysvaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((I 1)(J 1), IJ(K 1)). Vilkkumaa / Kuusinen 13
Testisuure A-vaikutukselle Määritellään F A -testisuure F A = IJ(K 1) I 1 SSA SSE Jos nollahypoteesi H A : Ei A-vaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((I 1), IJ(K 1)). Vilkkumaa / Kuusinen 14
Testisuure B-vaikutukselle Määritellään F B -testisuure F B = IJ(K 1) J 1 SSB SSE Jos nollahypoteesi H B : Ei B-vaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((J 1), IJ(K 1)). Vilkkumaa / Kuusinen 15
Testisuureiden tulkinnat 1/2 Testisuureet F AB, F A, F B voidaan tulkita varianssien vertailutestisuureiksi, joissa varianssiestimaattoreita MSAB = SSAB SSA SSB, MSA =, MSB = (I 1)(J 1) I 1 J 1 verrataan ryhmien sisäisen varianssin estimaattoriin MSE = SSE IJ(K 1) Vilkkumaa / Kuusinen 16
Testisuureiden tulkinnat 2/2 Estimaattori MSE = SSE IJ(K 1) on aina harhaton havaintojen y kij varianssille σ 2, mutta estimaattorit MSAB = SSAB SSA SSB, MSA =, MSB = (I 1)(J 1) I 1 J 1 ovat harhattomia varianssille σ 2 ainoastaan jos nollahypoteesit pätevät. H AB, H A, H B Vilkkumaa / Kuusinen 17
Varianssianalyysitaulukko Kaksisuuntaisen varianssianalyysin tulokset on tapana esittää seuraavanlaisessa varianssianalyysitaulukossa: Vaihtelun SS df M S F lähde A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df F B = MSB/MSE AB SSAB (I 1)(J 1) MSAB = SSAB/df F AB = MSAB/MSE Jäännös SSE IJ(K 1) M SE = SSE/df Kokonais- SST IJK 1 vaihtelu Vilkkumaa / Kuusinen 18
Klikkeri-kysely Kahden tekijän suhteen ryhmitellylle aineistolle on tehty varianssianalyysi. Minkä johtopäätöksen voit tuloksista tehdä merkitsevyystasolla 0.05? 1. Tekijöillä A ja B on itsenäistä vaikutusta, muttei yhdysvaikutusta. 2. Tekijöillä A ja B on yhdysvaikutusta, muttei itsenäistä vaikutusta. 3. Tällä merkitsevyystasolla ei voi tehdä lainkaan johtopäätöksiä. Vilkkumaa / Kuusinen 19
Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi I 1/2 Kaksisuuntaisen varianssianalyysin tilastollinen malli voidaan parametroida seuraavasti: y kij = μ ij + ε kij, k = 1,..., K, i = 1,..., I, j = 1,..., J (1) jossa jäännöstermit ε kij ovat riippumattomia ja normaalijakautuneita: ε kij N(0, σ 2 ), k = 1,..., K, i = 1,..., I, j = 1,..., J Mallin parametreja ovat vakiot μ ij, i = 1,..., I, j = 1,..., J ja jäännösvarianssi σ 2. Vilkkumaa / Kuusinen 20
Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi I 2/2 Mallia koskevista oletuksista seuraa, että ja E(y kij ) = μ ij, k = 1,..., K, i = 1,..., I, j = 1,..., J Var(y kij ) = σ 2, k = 1,..., K, i = 1,..., I, j = 1,..., J. Vilkkumaa / Kuusinen 21
Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi II 1/3 Tilastollinen malli voidaan parametroida myös seuraavasti: jossa y kij = μ + α i + β j + (αβ) ij + ε kij, (2) k = 1,..., K, i = 1,..., I, j = 1,..., J, I J I J α i = β j = (αβ) ij = (αβ) ij = 0 i=1 j=1 i=1 j=1 ja jäännöstermit ε kij ovat riippumattomia ja normaalijakautuneita: ε kij N(0, σ 2 ), k = 1,..., K, i = 1,..., I, j = 1,..., J. Vilkkumaa / Kuusinen 22
Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi II 2/3 Mallin parametreja ovat vakiot μ α i β j (αβ) ij, i = 1,..., I, j = 1,..., J, i = 1,..., I, j = 1,..., J sekä jäännösvarianssi σ 2. Vilkkumaa / Kuusinen 23
Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi II 3/3 Mallia koskevista oletuksista seuraa, että E(y kij ) = μ + α i + β j + (αβ) ij, k = 1,..., K, i = 1,..., I, j = 1,..., J ja Var(y kij ) = σ 2, k = 1,..., K, i = 1,..., I, j = 1,..., J. Vilkkumaa / Kuusinen 24
Kaksisuuntaisen varianssianalyysin laskutoimitusten suorittaminen Kaksisuuntaisessa varianssianalyysissa tarvittavien neliösummien laskeminen voi olla työlästä ilman tietokonetta. Ohjeet tarvittavien laskutoimitusten suorittamiseen löytyy 8. laskuharjoituksen ratkaisuista sivuilta 14-15 (vanhat tehtävät). Vilkkumaa / Kuusinen 25
Yhteenveto Kaksisuuntaisella varianssianalyysilla testataan, poikkeavatko kahden tekijän suhteen ryhmitellyn aineiston ryhmäkohtaiset odotusarvot toisistaan Nollahypoteesi H 0 : μ ij = μ i, j jaetaan kolmeen osaan: - H AB : Ei yhdysvaikutusta - H A : Ei A-vaikutusta - H B : Ei B-vaikutusta F -testi perustuu varianssiestimaattorien vertailuun Jos tekijöillä ei ole yhdysvaikutusta, voidaan A- ja B-vaikutuksia tarkastella erillisinä Yhdysvaikutuksen olemassaolon voi tulkita havaintojen keskiarvodiagrammeista Vilkkumaa / Kuusinen 26