Koesuunnittelu Latinalaiset neliöt TKK (c) Ilkka Mellin (2005) 1
Latinalaiset neliöt Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman analysointi Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa TKK (c) Ilkka Mellin (2005) 2
Latinalaiset neliöt: Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan, kun asetelmassa on mukana kaksi kiusatekijää, joiden vaikutukset sekoittuvat kiinnostuksen kohteena olevan tekijän vaikutukseen? Esitiedot: Yksisuuntainen varianssianalyysi Kaksisuuntainen varianssianalyysi Useampisuuntainen varianssianalyysi TKK (c) Ilkka Mellin (2005) 3
Latinalaiset neliöt Avainsanat Aritmeettinen keskiarvo Estimointi F-testi Interaktio Jäännösneliösumma Kiusatekijä Kokonaisvaihtelu Kolmisuuntainen varianssianalyysi Kontrollointi Latinalainen neliö Käsittely Käsittelyvaikutus Neliösumma Odotusarvo Rivivaikutus Ryhmä Ryhmäkeskiarvo Sarakevaikutus Sekoittuminen Taso Testaus Vapausaste Varianssi Varianssianalyysihajotelma Varianssianalyysitaulukko Vaste Yhdysvaikutus Yleiskeskiarvo TKK (c) Ilkka Mellin (2005) 4
Latinalaiset neliöt >> Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman analysointi Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa TKK (c) Ilkka Mellin (2005) 5
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelma 1/5 Oletetaan, että kokeen tavoitteena on verrata, miten käsittelyt A, B, C, ( kpl) vaikuttavat kiinnostuksen kohteena olevan vastemuuttujan y keskimääräisiin arvoihin. Asetelmassa on kuitenkin mukana kaksi kiusatekijää R ja C, joiden vaikutus saattaa sekoittua käsittelyiden A, B, C, vaikutukseen ja saattaa jopa peittää käsittelyiden vaikutuksen alleen. Jos kiusatekijöiden R ja C vaikutusta ei pystytä kontrolloimaan, käsittelyiden vaikutuksista saatetaan tehdä täysin virheellisiä johtopäätöksiä. TKK (c) Ilkka Mellin (2005) 6
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelma 2/5 Kiusatekijöiden R ja C vaikutusta voidaan kontrolloida, jos voimme tehdä seuraavan oletuksen: Tutkimuksen kohteena oleva perusjoukko voidaan jakaa kiusatekijöiden R ja C tasojen suhteen homogeenisiin ryhmiin. Ryhmiä kutsutaan koesuunnittelussa lohkoiksi ja tavoitteena on estää lohkovaikutuksen sekoittuminen käsittelyiden vaikutukseen. TKK (c) Ilkka Mellin (2005) 7
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelma 3/5 Valitaan kiusatekijälle Rtasot R 1, R 2,, R ja kiusatekijälle C tasot C 1, C 2,, C jolloin perusjoukko voidaan jakaa = 2 lohkoon. TKK (c) Ilkka Mellin (2005) 8
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelma 4/5 Latinalaisten neliöiden koeasetelmassa havainnot kerätään seuraavalla tavalla: (i) Olkoon vertailtavia käsittelyitä kpl: A, B, C, ( kpl) (ii) Jaetaan tutkimuksen kohteet = 2 lohkoon kiusatekijöille R ja C valittujen tasojen suhteen. (iii) Kohdistetaan jokaisessa lohkossa yksi käsittelyistä satunnaisesti yhteen tutkimuksen kohteeseen niin, että käsittelyitä vastaavat kirjaimet A, B, C, ( kpl) muodostavat ns. latinalaisen neliön. TKK (c) Ilkka Mellin (2005) 9
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelma 5/5 Satunnaistaminen voidaan tehdä niin, että kaikkien mahdollisten latinalaisten neliöiden joukosta arvotaan yksi neliö, jonka kirjainten järjestys määrää käsittelyiden A, B, C, ( kpl) soveltamisjärjestyksen. Huomautus: Latinalaisten neliöiden koeasetelmassa satunnaistamista on rajoitettu siinä mielessä, että kirjainten A, B, C ( kpl) on aina muodostettava latinalainen neliö. TKK (c) Ilkka Mellin (2005) 10
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaiset neliöt -matriisi on latinalainen neliö, jos sen alkioina ovat kirjaimet A, B, C, ( kpl) ja jokainen kirjain esiintyy täsmälleen kerran matriisin jokaisella rivillä ja sarakkeella. Huomautus: Samankokoisia latinalaisia neliöitä on useita kappaleita; ks. seuraavaa kalvoa. TKK (c) Ilkka Mellin (2005) 11
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaiset neliöt: Lukumäärä -neliöiden lukumäärä, kun = 1, 2, 3, 4, 5, 6, 7: 2 3 4 5 6 7 Standardineliöiden lukumäärä 1 1 4 56 9,408 16,942,080 K Neliöiden kokonaislukumäärä 576 161,280 818,851,200 61,479,419,904,000!( 1)! K Standardineliöksi kutsutaan latinalaista neliötä, jonka 1. rivin ja 1. sarakkeen kirjaimet ovat aakkosjärjestyksessä. 2 12 TKK (c) Ilkka Mellin (2005) 12
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaiset neliöt: Esimerkkejä Esimerkkejä latinalaisista neliöistä, kun = 1, 2, 3, 4, 5, 6: 2 2 3 3 4 4 5 5 6 6 A DC E BF A D B E C A B D C B A E C F D ABC D A C B E B A B C A D C E D F A B BC A C B E D A A B C D B A D C F B E A C A B B E A C D D A C B F B A D C E E C D A B E F B A D C Standardineliö TKK (c) Ilkka Mellin (2005) 13
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman nollahypoteesi Käsittelyiden vaikutusta koskeva nollahypoteesi on muotoa H A : Ei käsittelyvaikutusta Latinalaisten neliöiden koeasetelman analyysi tarkoittaa nollahypoteesin H A testaamista, kun asetelmassa on mukana kaksi kiusatekijää R ja C. TKK (c) Ilkka Mellin (2005) 14
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman havainnot ja niiden tilastollinen malli Olkoon y ijk = vastemuuttujan arvo, kun i. rivillä ja j. sarakkeessa on käytetty käsittelyä k i = 1, 2,,, j = 1, 2,,, k = 1, 2,, Käytetystä otantamenetelmästä seuraa, että havainnot y ijk voidaan olettaa riippumattomiksi (ja siten myös korreloimattomiksi) satunnaismuuttujiksi. Oletetaan, että havainnot y ijk ovat normaalijakautuneita: y ijk N(µ ijk, σ 2 ) i = 1, 2,,, j = 1, 2,,, k = 1, 2,, TKK (c) Ilkka Mellin (2005) 15
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman tilastollisen mallin parametrointi 1/3 Latinalaisten neliöiden koeasetelman tilastollinen malli voidaan parametroida seuraavalla tavalla: y ijk = µ + α i + β j + τ k + ε ijk i= 1, 2,,, j = 1, 2,,, k = 1, 2,, jossa jäännöstermit ε ijk ovat riippumattomia ja normaalijakautuneita: ε ijk 2 N(0, σ ) i= 1,2,,, j = 1,2,,, k = 1,2,, TKK (c) Ilkka Mellin (2005) 16
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman tilastollisen mallin parametrointi 2/3 Ei-satunnaiset vakiot µ, α i, β j, τ k i = 1, 2,,, j = 1, 2,,, k = 1, 2,, ja jäännösvarianssi σ 2 ovat latinalaisten neliöiden koeasetelman tilastollisen mallin parametreja. Mallin parametrien on toteutettava seuraavat ehdot: α = β = τ = i j k i= 1 j= 1 k= 1 0 TKK (c) Ilkka Mellin (2005) 17
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman tilastollisen mallin parametrointi 3/3 Mallia koskevista oletuksista seuraa, että ja E( ) y ijk = µ + α i + β j + τ k D( ) i= 1, 2,,, j = 1, 2,,, k = 1, 2,, 2 2 y ijk = σ i= 1, 2,,, j = 1, 2,,, k = 1, 2,, TKK (c) Ilkka Mellin (2005) 18
Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman mallin parametrit ja mallia koskeva nollahypoteesi Latinalaisten neliöiden koeasetelman nollahypoteesi H A voidaan ilmaista mallin parametrien avulla seuraavassa muodossa: H A : τ 1 = τ 2 = = τ k = 0 TKK (c) Ilkka Mellin (2005) 19
Latinalaiset neliöt Latinalaisten neliöiden koeasetelma ja sen malli >> Latinalaisten neliöiden koeasetelman analysointi Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa TKK (c) Ilkka Mellin (2005) 20
Latinalaisten neliöiden koeasetelman analysointi Havainnot Olkoon y ijk = vastemuuttujan arvo, kun i. rivillä ja j. sarakkeessa on käytetty käsittelyä k, i = 1, 2,,, j = 1, 2,,, k = 1, 2,, TKK (c) Ilkka Mellin (2005) 21
Latinalaisten neliöiden koeasetelman analysointi Rivikeskiarvot, sarakekeksiarvot ja käsittelykeskiarvot Määritellään havaintoarvojen y ijk rivikeskiarvot: 1 y = y, i= 1,2,, iii Määritellään havaintoarvojen y ijk sarakekeskiarvot: Määritellään havaintoarvojen y ijk käsittelykeskiarvot: 1 y = y, k = 1,2,, ii k j = 1 k = 1 i = 1 k = 1 i = 1 j = 1 ijk 1 y = y, j = 1,2,, i ji ijk ijk TKK (c) Ilkka Mellin (2005) 22
Latinalaisten neliöiden koeasetelman analysointi Kokonaiskeskiarvo Jos havainnot yhdistetään yhdeksi otokseksi, yhdistetyn otoksen havaintoarvojen yleis- eli kokonaiskeskiarvo on jossa y 1 I J K = iii 2 i = 1 j = 1 k = 1 y ijk = 2 = N on yhdistetyn otoksen havaintojen kokonaislukumäärä. TKK (c) Ilkka Mellin (2005) 23
Latinalaisten neliöiden koeasetelman analysointi oikkeamat keskiarvoista Kirjoitetaan identiteetti y y = ( y y ) + ( y y ) + ( y y ) ijk iii iii iii i ji iii iik iii + ( yijk yiii yi ji yiik + 2 yiii) Latinalaisten neliöiden koeasetelman perustuvat näiden sulkulausekkeilla esitettyjen poikkeamien neliösummille. TKK (c) Ilkka Mellin (2005) 24
Latinalaisten neliöiden koeasetelman analysointi Kokonaisneliösumma Määritellään havaintoarvojen kokonaisvaihtelua kuvaava kokonaisneliösumma: Jos kaikki havainnot yhdistetään yhdeksi otokseksi, saadun yhdistetyn otoksen varianssi on jossa SST = ( y y ) s 2 y = i= 1 j= 1 k= 1 1 SST 2 1 ijk = 2 = N on yhdistetyn otoksen havaintojen kokonaislukumäärä. iii 2 TKK (c) Ilkka Mellin (2005) 25
Latinalaisten neliöiden koeasetelman analysointi Rivivaikutuksen, sarakevaikutuksen ja käsittelyvaikutuksen neliösummat Määritellään rivivaikutusta kuvaava neliösumma: iii iii i= 1 SSR = ( y y ) 2 Määritellään sarakevaikutusta kuvaava neliösumma: i ji j= 1 SSC = ( y y ) iii 2 Määritellään käsittelyvaikutusta kuvaava neliösumma: iik k = 1 SSA = ( y y ) iii 2 TKK (c) Ilkka Mellin (2005) 26
Latinalaisten neliöiden koeasetelman analysointi Jäännösneliösumma Määritellään jäännösneliösumma: I J K ijk iii i ji iik iii i= 1 j= 1 k= 1 SSE = ( y y y y + 2 y ) 2 TKK (c) Ilkka Mellin (2005) 27
Latinalaisten neliöiden koeasetelman analysointi Varianssianalyysihajotelma Neliösummat SST, SSR, SSC, SSA, SSE toteuttavat varianssianalyysihajotelman SST = SSR + SSC + SSA + SSE ja neliösummiin liittyvät vapausasteiden lukumäärät toteuttavat yhtälön 2 1 = ( 1) + ( 1) + ( 1) + ( 2)( 1) TKK (c) Ilkka Mellin (2005) 28
Latinalaisten neliöiden koeasetelman analysointi Testi käsittelyvaikutukselle Määritellään F-testisuure ( 2)( 1) SSA FA = 1 SSE jossa SSA on käsittelyvaikutusta kuvaava neliösumma ja SSE on jäännösvaihtelua kuvaava neliösumma. Jos nollahypoteesi H A : Ei käsittelyvaikutusta pätee, niin F F(( 1),( 2)( 1)) A Suuret testisuureen F A arvot johtavat nollahypoteesin hylkäämiseen. TKK (c) Ilkka Mellin (2005) 29
Latinalaisten neliöiden koeasetelman analysointi Rivivaikutus Olkoon ( 2)( 1) SSR FR = 1 SSE jossa SSR on rivivaikutusta kuvaava neliösumma ja SSE on jäännösvaihtelua kuvaava neliösumma. Suureen F R suurten arvojen tulkitaan tavallisesti indikoivan sitä, että lohkoihin jako on ollut tarpeellinen. TKK (c) Ilkka Mellin (2005) 30
Latinalaisten neliöiden koeasetelman analysointi Sarakevaikutus Olkoon ( 2)( 1) SSC FC = 1 SSE jossa SSC on rivivaikutusta kuvaava neliösumma ja SSE on jäännösvaihtelua kuvaava neliösumma. Suureen F C suurten arvojen tulkitaan tavallisesti indikoivan sitä, että lohkoihin jako on ollut tarpeellinen. TKK (c) Ilkka Mellin (2005) 31
Latinalaisten neliöiden koeasetelman analysointi Varianssianalyysitaulukko 1/2 Varianssianalyysin tulokset esitetään tavallisesti varianssianalyysitaulukon muodossa: Vaihtelun lähde SS df MS F A SSA 1 MSA = SSA/df F A = MSA/MSE R SSR 1 MSR = SSR/df C SSC 1 MSC = SSC/df Jäännösvaihtelu SSE ( 2)( 1) MSE = SSE/df Kokonaisvaihtelu SST 2 1 TKK (c) Ilkka Mellin (2005) 32
Latinalaisten neliöiden koeasetelman analysointi Varianssianalyysitaulukko 2/2 Varianssianalyysitaulukon neliösummat toteuttavat yhtälön SST = SSA + SSR + SSC + SSE Yhtälö on varianssianalyysihajotelma. Varianssianalyysitaulukon neliösummien vapausasteet toteuttavat yhtälön 2 1 = ( 1) + ( 1) + ( 1) + ( 2)( 1) TKK (c) Ilkka Mellin (2005) 33
Latinalaisten neliöiden koeasetelman analysointi Latinalaisten neliöiden koeasetelma ja kolmisuuntainen varianssianalyysi Latinalaisten neliöiden koeasetelman analyysiin voidaan soveltaa kolmisuuntaista varianssianalyysia, jos otetaan huomioon seuraavat seikat: (i) Kolmisuuntaisen varianssianalyysin malliin ei saa liittää interaktiotermejä, koska latinalaisten neliöiden koeasetelmassa kiusatekijöiden ja kiinnostuksen kohteena olevan tekijän mahdolliset interaktiot sekoittuvat jäännösvaihteluun. (ii) Kolmisuuntaisen varianssianalyysin tuloksia modifioidaan sopivalla tavalla (sivuutamme tässä yksityiskohdat). TKK (c) Ilkka Mellin (2005) 34
Latinalaiset neliöt Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman analysointi >> Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa TKK (c) Ilkka Mellin (2005) 35
Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa Havainnot Olkoon y ijk = vastemuuttujan arvo, kun i. rivillä ja j. sarakkeessa on käytetty käsittelyä k, i = 1, 2,,, j = 1, 2,,, k = 1, 2,, TKK (c) Ilkka Mellin (2005) 36
Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa Kokonaissumma Määritellään havaintoarvojen y ijk kokonaissumma: T iii = i= 1 j= 1 k= 1 y ijk TKK (c) Ilkka Mellin (2005) 37
Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa Rivisummat, sarakesummat ja käsittelysummat Määritellään havaintoarvojen y ijk rivisummat: T = y, i= 1,2,, iii j= 1 k= 1 ijk Määritellään havaintoarvojen y ijk sarakesummat: T = y, j = 1,2,, i ji i= 1 k= 1 ijk Määritellään havaintoarvojen y ijk käsittelysummat: T = y, k = 1,2,, ii k i= 1 j= 1 ijk TKK (c) Ilkka Mellin (2005) 38
Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa Havaintoarvojen neliöiden summa Määritellään havaintoarvojen y ijk neliöiden summa: i= 1 j= 1 k= 1 y 2 ijk TKK (c) Ilkka Mellin (2005) 39
Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa Kokonaisvarianssin laskeminen Havaintoarvojen y ijk kokonaisvarianssi saadaan kaavalla 2 1 2 1 2 s = 2 iii yijk T 2 iii 1 I= 1 j= 1 j= 1 TKK (c) Ilkka Mellin (2005) 40
Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa Kokonaisneliösumman laskeminen Kokonaisneliösumma SST voidaan laskea kaavalla 1 SST = y T i= 1 j= 1 k= 1 2 2 ijk 2 iii TKK (c) Ilkka Mellin (2005) 41
Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa Rivivaikutuksen, sarakevaikutuksen ja käsittelyvaikutusten neliösummien laskeminen Rivivaikutusta kuvaava neliösumma saadaan kaavalla 1 1 SSR = T T 2 2 iii 2 iii i= 1 Sarakevaikutusta kuvaava neliösumma saadaan kaavalla 1 1 SSC = T T 2 2 i ji 2 iii j= 1 Käsittelyvaikutusta kuvaava neliösumma saadaan kaavalla 1 2 1 2 SSA = Tiik T 2 iii k = 1 TKK (c) Ilkka Mellin (2005) 42
Laskutoimitusten suorittaminen latinalaisten neliöiden analyysissa Jäännösneliösumman laskeminen Jäännösneliösumma SSE saadaan varianssianalyysihajotelman nojalla kaavalla SSE = SST SSA SSR SSC TKK (c) Ilkka Mellin (2005) 43