Lohkoasetelmat Vilkkumaa / Kuusinen 1
Motivointi 1/3 Kaksisuuntaisella varianssianalyysilla voidaan tutkia kahden tekijän A ja B vaikutusta sekä niiden yhdysvaikutusta tutkimuksen kohteeseen Kaksisuuntaisessa varianssianalyysissa kokonaisvaihtelua kuvaava neliösumma SST jaetaan osiin, jotka kuvaavat tekijöiden vaikutusten selittämää (SSA, SSB, SSAB) ja selittämättä jättämää (SSE) vaihtelua SST = SSA + SSB + SSAB + SSE Vilkkumaa / Kuusinen 2
Motivointi 2/3 Kaksisuuntaisen varianssianalyysin nollahypoteesit ovat muotoa ja testisuureet muotoa H : Ei -vaikutusta,, {A, B, AB} F = IJ(K 1) df( ) SS SSE siten, että nollahypoteesin pätiessä F F (df( ), IJ(K 1)). Vilkkumaa / Kuusinen 3
Motivointi 3/3 Jotta jäännösneliösumma SSE poikkeaisi nollasta, kukin käsittelykombinaatio A = i, B = j tulee kohdistaa vähintään 2 havaintoon, ts. K 2 I J K SSE = (y kij ȳ ij ) 2 i=1 j=1 k=1 Tarvittavien havaintojen lukumäärä on siis aina vähintään 2 IJ Mitä jos tekijä B tunnistetaan, mutta sen vaikutuksesta ei olla kiinnostuneita? Voiko tarvittavien havaintojen määrää tällöin vähentää? Vilkkumaa / Kuusinen 4
Kiusatekijä Tekijää, jolla on mahdollisesti vaikutusta vastemuuttujan arvoon, mutta jonka vaikutuksesta ei olla kiinnostuneita kutsutaan kiusatekijäksi Jos kiusatekijä on tuntematon (ja hallitsematon), sen vaikutusta tuloksiin voidaan estää satunnaistuksella. Jos kiusatekijä on tunnettu ja hallittu, sen vaikutus voidaan systemaattisesti estää lohkomalla. Lohkoasetelmat on yleisnimitys koesuunnitelmille, joissa käytetään lohkomista. Tällä kurssilla käsiteltäviä lohkoasetelmia ovat - satunnaistettu täydellinen lohkoasetelma (1 kiusatekijä) ja - latinalaisten neliöiden koeasetelma (2 kiusatekijää). Vilkkumaa / Kuusinen 5
Satunnaistettu täydellinen lohkoasetelma Vilkkumaa / Kuusinen 6
Satunnaistettu täydellinen lohkoasetelma (i) Oletetaan, että haluamme tutkia käsittelyn A vaikutusta vastemuuttujaan. Asetelmassa on kuitenkin mukana yksi kiusatekijä B, jonka vaikutus saattaa sekoittua käsittelyn A vaikutukseen. Oletetaan lisäksi, että kokeen mahdollisten kohteiden joukko voidaan lohkoa, eli jakaa homogeenisiin ryhmiin tekijän B tasojen suhteen. (ii) Oletetaan, että käsittelyllä A on I tasoa ja kiusatekijällä B on J tasoa, jolloin havainnot voidaan jakaa I J ryhmään. (iii) Kohdistetaan käsittelyt tutkimuksen kohteisiin satunnaisessa järjestyksessä jokaisessa kiusatekijän B määräämässä lohkossa. (iv) Mitataan vastemuuttujan y arvot. Vilkkumaa / Kuusinen 7
Satunnaistetun täydellisen lohkoasetelman nollahypoteesi Käsittelyiden vaikutusta koskeva nollahypoteesi on muotoa H A : Ei käsittelyvaikutusta Satunnaistetun täydellisen lohkoasetelman analyysi tarkoittaa nollahypoteesin H A testaamista, kun asetelmassa on mukana kiusatekijä B. Vilkkumaa / Kuusinen 8
Käsittelykeskiarvot, lohkokeskiarvot ja kokonaiskeskiarvo Määritellään havaintoarvojen y ij käsittelykeskiarvot: ȳ i = 1 J J j=1 y ij, i = 1, 2,..., I Määritellään havaintoarvojen y ij lohkokeskiarvot: ȳ j = 1 I I i=1 y ij, j = 1, 2,..., J Kaikkien havaintojen kokonaiskeskiarvo on ȳ = 1 IJ I i=1 J j=1 y ij Vilkkumaa / Kuusinen 9
Neliösummia 1/3 Olkoon I J SST = (y ij ȳ ) 2 i=1 j=1 havaintoarvojen y ij kokonaisvaihtelua kuvaava neliösumma, SSA = J I (ȳ i ȳ ) 2 i=1 käsittelyvaikutusta kuvaava neliösumma ja SSB = I J (ȳ j ȳ ) 2 j=1 lohkovaikutusta kuvaava neliösumma. Vilkkumaa / Kuusinen 10
Neliösummia 2/3 Määritellään jäännösneliösumma: SSE = I i=1 J (y ij ȳ i ȳ j + ȳ ) 2 j=1 Jäännösneliösumma voidaan laskea, jos kustakin käsittely-lohko-kombinaatiosta A = i, B = j on yksi havainto Havaintoja tarvitaan siis vähintään IJ kappaletta (vrt. 2 IJ kaksisuuntaisessa varianssianalyysissa) Vilkkumaa / Kuusinen 11
Neliösummia 3/3 Neliösummille pätee varianssianalyysihajotelma SST = SSA + SSB + SSE ja neliösummien vapausasteet toteuttavat yhtälön IJ 1 = (I 1) + (J 1) + (I 1)(J 1) Vilkkumaa / Kuusinen 12
Testi käsittelyvaikutukselle Määritellään F A -testisuure F A = (I 1)(J 1) I 1 SSA SSE Jos nollahypoteesi H A : Ei käsittelyvaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((I 1), (I 1)(J 1)). Vilkkumaa / Kuusinen 13
Lohkovaikutus Olkoon F B = (I 1)(J 1) J 1 SSB SSE Suureen F B suuret arvot viittaavat siihen, että lohkoihin jako on ollut perusteltua. Koska satunnaistaminen suoritetaan vain lohkojen sisällä, ei testiä lohko-odotusarvojen yhtäsuuruudesta voida perustaa suureeseen F B. Vilkkumaa / Kuusinen 14
Varianssianalyysitaulukko Tulokset on tapana esittää varianssianalyysitaulukon muodossa: Vaihtelun SS df M S F lähde A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df Jäännös SSE (I 1)(J 1) MSE = SSE/df Kokonais- SST IJ 1 vaihtelu Vilkkumaa / Kuusinen 15
Lohkoasetelman tilastollinen malli Satunnaistetun täydellisen lohkoasetelman tilastollinen malli voidaan parametroida seuraavasti: y ij = μ + α i + β j + ε ij i = 1, 2,..., I, j = 1, 2,..., J, missä jäännöstermit ε ij ovat riippumattomia ja normaalijakautuneita. Mallin parametreja ovat vakiot μ, α i, β j sekä jäännösvarianssi σ 2. Parametrien on toteutettava ehdot: I α i = J β j = 0 i=1 j=1 Vilkkumaa / Kuusinen 16
Kaksisuuntaisen varianssianalyysin tilastollinen malli Kaksisuuntaisen varianssianalyysin tilastollinen malli voidaan parametroida seuraavasti: missä y kij = μ + α i + β j + (αβ) ij + ε kij k, i, j, (1) I J I J α i = β j = (αβ) ij = (αβ) ij = 0 i=1 j=1 i=1 j=1 ja jäännöstermit ε kij ovat riippumattomia ja normaalijakautuneita. Mallin parametreja ovat vakiot μ, α i, β j, (αβ) ij sekä jäännösvarianssi σ 2 Vilkkumaa / Kuusinen 17
Yhteenveto Kahden tekijän vaikutusta tutkimuksen kohteeseen tutkitaan yleisesti kaksisuuntaisella varianssianalyysilla. Jos toisen tekijän vaikutuksesta ei olla kiinnostuneita, voidaan tarvittavien havaintojen määrä puolittaa käyttämällä satunnaistettua täydellistä lohkoasetelmaa varianssianalyysin sijaan Nollahypoteesi on tällöin H A : Ei käsittelyvaikutusta Nollahyopteesin pätiessä testisuure F A = (I 1)(J 1) I 1 SSA SSE F (I 1, (I 1)(J 1)) Vilkkumaa / Kuusinen 18
Tarvittavien laskutoimitusten suorittaminen Ohjeet tarvittavien laskutoimitusten suorittamiseen löytyvät 9. laskuharjoituksen ratkaisuista sivuilta 23-24 (vanhat tehtävät). Vilkkumaa / Kuusinen 19
Klikkeri-kysely Miksi kaksisuuntaista varianssianalyysia ei voida käyttää tilanteessa, jossa kukin kiusatekijä-käsittely-kombinaatio on kohdistettu vain yhteen havaintoon? 1. Estimoitujen parametrien varianssit jäävät liian suuriksi 2. Jäännösvarianssin estimaattoreista tulee harhaisia 3. Jäännösneliösumma menee nollaksi, eikä testisuureita voida tällöin muodostaa Vilkkumaa / Kuusinen 20
Latinalaiset neliöt Vilkkumaa / Kuusinen 21
Motivointi Tutkitaan kiinnostavan käsittelyn vaikutusta vastemuuttujaan siten, että vasteeseen vaikuttaa lisäksi kaksi kiusatekijää Kaikkien kolmen tekijän (käsittely ja kiusatekijät) vaikutuksia ja yhdysvaikutuksia voitaisiin tutkia kolmisuuntaisella varianssianalyysilla Jos kullakin tekijällä on P tasoa, tarvittaisiin tällöin 2 P 3 havaintoa jäännösneliösumman SSE laskemiseksi Havaintoja tarvitaan kuitenkin vain P 2 kappaletta, jos epäkiinnostavat kiusatekijät lohkotaan pois latinalaisten neliöiden koeasetelmalla Vilkkumaa / Kuusinen 22
Latinalaisten neliöiden koeasetelma (i) Oletetaan, että haluamme tutkia jonkin käsittelyn vaikutusta vastemuuttujaan y, josta tehtävät havainnot saattavat olla kahden kiusatekijän R ja C suhteen epähomogeenisia. (ii) Oletetaan, että kiinnostuksen kohteena olevalla käsittelyllä sekä kiusatekijöillä R ja C on P tasoa. (iii) Oletetaan, että tutkimuksen kohteet voidaan jakaa kiusatekijöiden R ja C tasojen suhteen P P = P 2 homogeeniseen ryhmään eli lohkoon. (iv) Poimitaan jokaisesta lohkosta satunnaisesti yksi yksilö kokeeseen ja arvotaan käsittelyt ko. yksilöille siten, että kiinnostuksen kohteena olevan käsittelyn tasot muodostavat ns. latinalaisen neliön. (v) Mitataan vastemuuttujan y arvot. Vilkkumaa / Kuusinen 23
Latinalaiset neliöt P P matriisi on latinalainen neliö, jos sen alkioina ovat kirjaimet A, B, C,... (P kpl) ja jokainen kirjain esiintyy täsmälleen kerran matriisin jokaisella rivillä ja sarakkeella. Samankokoisia latinalaisia neliöitä on useita kappaleita. Standardineliöksi kutsutaan latinalaista neliötä, jonka ensimmäisen rivin ja ensimmäisen sarakkeen kirjaimet ovat aakkosjärjestyksessä. Vilkkumaa / Kuusinen 24
Latinalaiset neliöt Esimerkkejä latinalaisista neliöistä, kun P = 2, 3, 4: B A A B A B C B C A C A B A B D C B C A D C D B A D A C B Esimerkkimatriiseista 3 3 matriisi on standardineliö. Vilkkumaa / Kuusinen 25
Satunnaistaminen Latinalaisten neliöiden koeasetelmassa satunnaistaminen voidaan tehdä niin, että kaikkien mahdollisten latinalaisten neliöiden joukosta arvotaan yksi neliö, jonka kirjaimet määräävät kuhunkin yksilöön sovellettavan käsittelyn. Vilkkumaa / Kuusinen 26
Rivikeskiarvot, sarakekeskiarvot ja käsittelykeskiarvot Määritellään havaintoarvojen y ijk rivikeskiarvot ȳ i = 1 P P P y ijk, i = 1,..., P, j=1 k=1 sarakekeskiarvot ȳ j = 1 P P P y ijk, j = 1,..., P i=1 k=1 sekä käsittelykeskiarvot ȳ k = 1 P P P y ijk, k = 1,..., P i=1 j=1 Vilkkumaa / Kuusinen 27
Kokonaiskeskiarvo Kaikkien havaintojen kokonaiskeskiarvo on ȳ = 1 P 2 P i=1 P j=1 P k=1 y ijk, missä P 2 on yhdistetyn otoksen havaintojen kokonaislukumäärä. Vilkkumaa / Kuusinen 28
Neliösummia 1/2 Olkoon P P P SST = (y ijk ȳ ) 2 i=1 j=1 k=1 havaintoarvojen y ijk kokonaisvaihtelua kuvaava neliösumma, SSR = P P (ȳ i ȳ ) 2 i=1 rivivaikutusta kuvaava neliösumma ja SSC = P P (ȳ j ȳ ) 2 j=1 sarakevaikutusta kuvaava neliösumma. Vilkkumaa / Kuusinen 29
Neliösummia 2/2 Määritellään lisäksi käsittelyvaikutusta kuvaava neliösumma SSA = P P (ȳ k ȳ ) 2 k=1 sekä jäännösneliösumma SSE = P P P (y ijk ȳ i ȳ j ȳ k + 2ȳ ) 2 i=1 j=1 k=1 Neliösummille pätee varianssianalyysihajotelma SST = SSR + SSC + SSA + SSE ja neliösummien vapausasteet toteuttavat yhtälön P 2 1 = (P 1) + (P 1) + (P 1) + (P 2)(P 1) Vilkkumaa / Kuusinen 30
Testi käsittelyvaikutukselle Määritellään F A -testisuure F A = (P 2)(P 1) P 1 SSA SSE Jos nollahypoteesi H A : Ei käsittelyvaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((P 1), (P 2)(P 1)). Vilkkumaa / Kuusinen 31
Rivivaikutus ja sarakevaikutus Olkoon F R = (P 2)(P 1) P 1 SSR SSE Suureen F R suuret arvot viittaavat siihen, että lohkoihin jako rivitekijän suhteen on ollut perusteltua. Olkoon F C = (P 2)(P 1) P 1 SSC SSE Suureen F C suuret arvot viittaavat siihen, että lohkoihin jako saraketekijän suhteen on ollut perusteltua. Ei kuitenkaan ole olemassa testiä, jolla voitaisiin testata lohkomisen merkitystä. Vilkkumaa / Kuusinen 32
Varianssianalyysitaulukko Tulokset on tapana esittää varianssianalyysitaulukon muodossa: Vaihtelun SS df M S F lähde A SSA P 1 MSA = SSA/df F A = MSA/MSE R SSR P 1 MSR = SSR/df C SSC P 1 MSC = SSC/df Jäännös SSE (P 2)(P 1) MSE = SSE/df Kokonais- SST P 2 1 vaihtelu Vilkkumaa / Kuusinen 33
Latinalaisten neliöiden koeasetelman tilastollinen malli Latinalaisten neliöiden koeasetelman tilastollinen malli voidaan parametroida seuraavasti: y ijk = μ + α i + β j + τ k + ε ijk i = 1, 2,..., P, j = 1, 2,..., P, k = 1, 2,..., P, jossa jäännöstermit ε ijk ovat riippumattomia ja normaalijakautuneita. Mallin parametreja ovat vakiot μ, α i, β j, τ k sekä jäännösvarianssi σ 2. Parametrien on toteutettava ehdot: P α i = P β j = P τ k = 0 i=1 j=1 k=1 Vilkkumaa / Kuusinen 34
Yhteenveto Kolmen tekijän vaikutusta tutkimuksen kohteeseen tutkitaan yleisesti kolmisuuntaisella varianssianalyysilla. Jos kahden tekijän vaikutuksista ei olla kiinnostuneita, voidaan tarvittavien havaintojen määrä vähentää arvosta 2 P 3 arvoon P 2 käyttämällä latinalaisten neliöiden koeasetelmaa Nollahypoteesi on tällöin H A : Ei käsittelyvaikutusta Nollahyopteesin pätiessä testisuure F A = (P 2)(P 1) P 1 SSA SSE F (P 1, (P 2)(P 1)) Vilkkumaa / Kuusinen 35
Kaksisuuntaisen varianssianalyysin laskutoimitusten suorittaminen Ohjeet tarvittavien laskutoimitusten suorittamiseen löytyvät 9. laskuharjoituksen ratkaisuista sivulta 37 (vanhat tehtävät). Vilkkumaa / Kuusinen 36
Klikkeri-kysely Haluat testata dieetin vaikutusta koe-eläinten painonlisäykseen. Kiusatekijöinä ovat eläinten aloituspaino ja ruokahalu, joiden suhteen 9 eläintä on lohkottu yhdeksään ryhmään. Miten jakaisit kolme dieettiä (A, B, C) koe-eläinten kesken? 1. Ruokahalu 1 2 3 2. Ruokahalu 1 2 3 3. Ruokahalu 1 2 3 Alkupaino 1 A B C 2 C B A 3 B A C Alkupaino 1 C A B 2 B C A 3 A B C Alkupaino 1 B A C 2 C B B 3 A A C Vilkkumaa / Kuusinen 37