2 k -faktorikokeet Vilkkumaa / Kuusinen 1
Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta käytetään usein tutkimuksen alkuvaiheessa, jossa tutkittavia faktoreita on yleensä paljon - 2 k -faktorikoe vaatii pienimmän mahdollisen havaintomäärän k:n tekijän vaikutusten tutkimisessa - Kokeen perusteella voidaan tunnistaa tärkeimmät tekijät, joiden tasojen määrää voidaan lisätä Vilkkumaa / Kuusinen 2
2 2 -faktorikokeet Vilkkumaa / Kuusinen 3
2 2 -faktorikokeet Oletetaan, että haluamme tutkia, miten kaksi faktoria eli tekijää A ja B, joilla molemmilla on kaksi tasoa: matala (-) ja korkea (+) vaikuttavat vastemuuttujan y keskimääräisiin arvoihin. Kokeen kohteisiin voidaan kohdistaa 2 2 = 4 käsittelykombinaatiota: A B Käsittelykombinaatio Merkintä - - A =matala, B =matala (1) + - A =korkea, B =matala a - + A =matala, B =korkea b + + A =korkea, B =korkea ab Vilkkumaa / Kuusinen 4
Havaintoarvojen summat Oletetaan, että jokaista käsittelykombinaatiota on kokeessa toistettu n kertaa, jolloin havaintojen kokonaislukumäärä on 2 2 n = 2 2 n = 4n Merkitään vastemuuttujan y havaittujen arvojen summaa jokaiselle käsittelykombinaatiolle samalla tavalla kuin itse käsittelykombinaatiota: (1) = Havaintoarvojen summa, kun A = ( ), B = ( ) a = Havaintoarvojen summa, kun A = (+), B = ( ) b = Havaintoarvojen summa, kun A = ( ), B = (+) ab = Havaintoarvojen summa, kun A = (+), B = (+) Vilkkumaa / Kuusinen 5
Tekijän A päävaikutus Tekijän A vaikutus, kun tekijän B taso on matala (-): + b ab (a (1))/n B Tekijän A vaikutus, kun tekijän B taso on korkea (+): (1) a (ab b)/n A + Tekijän A päävaikutus saadaan edellisten keskiarvona: A = 1 2 [ a (1) n + ab b n ] = 1 [ab + a b (1)] 2n Vilkkumaa / Kuusinen 6
Tekijän B päävaikutus Tekijän B vaikutus, kun tekijän A taso on matala (-): + b ab (b (1))/n B Tekijän B vaikutus, kun tekijän A taso on korkea (+): (1) a (ab a)/n A + Tekijän B päävaikutus saadaan edellisten keskiarvona: B = 1 2 [ b (1) n + ab a n ] = 1 [ab + b a (1)] 2n Vilkkumaa / Kuusinen 7
Tekijöiden A ja B yhdysvaikutus Tekijöiden A ja B interaktio eli yhdysvaikutus: AB = 1 [ ab b a (1) ] = 1 [ ab a 2 n n 2 n = 1 [ab a b + (1)] 2n b (1) n ] + b ab B (1) a A + Vilkkumaa / Kuusinen 8
Neliösummia 1/3 Tekijöiden A ja B päävaikutukset ja yhdysvaikutus ovat käsittelykombinaatioiden (ab, a, b, (1)) ortogonaalisia kontrasteja: A = 1 [ab + a b (1)] 2n B = 1 [ab a + b (1)] 2n AB = 1 [ab a b + (1)] 2n Vilkkumaa / Kuusinen 9
Neliösummia 2/3 Koska tekijöiden A ja B päävaikutukset ja yhdysvaikutus ovat käsittelykombinaatioiden (ab, a, b, (1)) ortogonaalisia kontrasteja, niitä vastaavat neliösummat saadaan kaavoilla: SSA = 1 [ab + a b (1)]2 4n SSB = 1 [ab a + b (1)]2 4n SSAB = 1 [ab a b + (1)]2 4n Vilkkumaa / Kuusinen 10
Neliösummia 3/3 Olkoon y kij k. havainto tekijän A tason i ja tekijän B tason j määräämässä ryhmässä (i, j). Kokonaisneliösumma SST ja jäännösneliösumma SSE määritetään kuten kaksisuuntaisessa varianssianalyysissa: SST = 2 2 n (y kij ȳ ) 2 i=1 j=1 k=1 SSE = 2 2 n (y kij ȳ ij ) 2 i=1 j=1 k=1 Neliösummat toteuttavat kaksisuuntaisen varianssianalyysin varianssianalyysihajotelman SST = SSA + SSB + SSAB + SSE. Vilkkumaa / Kuusinen 11
2 2 -faktorikokeen nollahypoteesit 2 2 -faktorikokeessa kiinnostuksen kohteena olevat nollahypoteesit ovat: H AB : Ei yhdysvaikutusta H A : Ei A-vaikutusta H B : Ei B-vaikutusta Vilkkumaa / Kuusinen 12
Varianssianalyysitaulukko 2 2 -faktorikokeessa testit nollahypoteeseille H AB, H A ja H B perustuvat seuraavaan varianssianalyysitaulukkoon: Vaihtelun SS df M S F lähde A SSA 1 MSA = SSA/df F A = MSA/MSE B SSB 1 MSB = SSB/df F B = MSB/MSE AB SSAB 1 MSAB = SSAB/df F AB = MSAB/MSE Jäännös SSE 4(n 1) M SE = SSE/df Kokonais- SST 4n 1 vaihtelu Vilkkumaa / Kuusinen 13
Klikkeri-kysely Tutkitaan reaktantin konsentraation (A) ja katalyytin määrän (B) vaikutusta kemiallisen prosessin vasteeseen. Minkä johtopäätöksen voit tehdä? 1. Tekijöillä A ja B on yhdysvaikutusta, muttei itsenäisiä vaikutuksia 2. Tekijöillä A ja B on itsenäistä vaikutusta, muttei yhdysvaikutusta 3. Tekijöillä A ja B on sekä itsenäistä vaikutusta että yhdysvaikutusta Source SS df M S F p-value A 208.33 1 208.33 F A = 53.15 0.0001 B 75.00 1 75.00 F B = 19.13 0.0024 AB 8.33 1 8.33 F AB = 2.13 0.1826 Within 31.34 8 3.92 Total 323.00 11 Vilkkumaa / Kuusinen 14
2 k -faktorikokeet Vilkkumaa / Kuusinen 15
2 k -faktorikokeet Oletetaan, että haluamme tutkia, miten k faktoria eli tekijää A, B,..., K, joilla kaikilla on kaksi tasoa: matala ( ) ja korkea (+) vaikuttavat vastemuuttujan y keskimääräisiin arvoihin. 2 k -faktorikokeen tilastollinen malli sisältää k päävaikutusta, ( k 2) kahden tekijän yhdysvaikutusta, ( k 3) kolmen tekijän yhdysvaikutusta,..., yhden k:n tekijän yhdysvaikutuksen. Vilkkumaa / Kuusinen 16
2 k -faktorikokeet 2 k -faktorikokeen kohteisiin voidaan kohdistaa 2 k käsittelykombinaatiota. Esim. 2 3 -koe: Tekijä Merkintä A B C (1) a + b + ab + + c + ac + + bc + + abc + + + Vilkkumaa / Kuusinen 17
Havaintoarvojen summat Oletetaan, että jokaista käsittelykombinaatiota on kokeessa toistettu n kertaa, jolloin havaintojen kokonaislukumäärä on 2 k n. Merkitään vastemuuttujan y havaittujen arvojen summaa jokaiselle käsittelykombinaatiolle samalla tavalla kuin itse käsittelykombinaatiota. Esim. 2 3 -koe: (1) = Havaintoarvojen summa, kun A =, B =, C = a = Havaintoarvojen summa, kun A = +, B =, C = b = Havaintoarvojen summa, kun A =, B = +, C = ab = Havaintoarvojen summa, kun A = +, B = +, C = c = Havaintoarvojen summa, kun A =, B =, C = + ac = Havaintoarvojen summa, kun A = +, B =, C = + bc = Havaintoarvojen summa, kun A =, B = +, C = + abc = Havaintoarvojen summa, kun A = +, B = +, C = + Vilkkumaa / Kuusinen 18
2 k -faktorikokeen vaikutusten estimointi Tekijöiden A, B, C,..., K pää- ja yhdysvaikutukset voidaan estimoida kaavalla X = (a ± 1)(b ± 1) (k ± 1) n2 k 1, missä X viittaa estimoitavaan vaikutukseen ja sulkeiden sisällä käytetään miinus-merkkiä ( ), jos tekijä on mukana vaikutuksessa ja plus-merkkiä (+), jos tekijä ei ole mukana vaikutuksessa. Lopullisessa lausekkeessa 1 korvataan merkinnällä (1). Esim. 2 3 -koe: tekijöiden A ja C yhdysvaikutus AC = (a 1)(b + 1)(c 1)/n2 3 1 = (abc ab + ac a bc + b c + (1))/4n Vilkkumaa / Kuusinen 19
2 k -faktorikokeen vaikutusten neliösummien määrääminen Koska tekijöiden A, B, C,..., K pää- ja yhdysvaikutukset ovat käsittelykombinaatioiden ortogonaalisia kontrasteja, niitä vastaavat neliösummat saadaan kaavalla SSX = n2 k 2 X 2, missä X viittaa kiinnostuksen kohteena olevaan vaikutukseen. Vilkkumaa / Kuusinen 20
Kokonaisneliösumma Olkoon y lij k l. havainto tekijän A tason i, tekijän B tason j,..., tekijän K tason k määräämässä ryhmässä (i, j,..., k). Tällöin havaintoarvojen kokonaisneliösumma on SST = 2 2 2 n (y lij k ȳ ) 2. i=1 j=1 k=1 l=1 Vilkkumaa / Kuusinen 21
Jäännösneliösumma Määritellään ryhmien sisäistä vaihtelua kuvaava jäännösneliösumma kaavalla missä SSE = ȳ ij k = 1 n 2 i=1 2 j=1 2 k=1 n (y lij k ȳ ij k ) 2, l=1 n y lij k, i = 1, 2, j = 1, 2,..., k = 1, 2 l=1 on ryhmän (i, j,..., k) havaintoarvojen aritmeettinen keskiarvo. Neliösummat toteuttavat varianssianalyysihajotelman SST = SSA + SSB + + SSK + SSAB + SSAC + + SSJK + SSABC + SSABD + + SSIJK + + SSAB K + SSE Vilkkumaa / Kuusinen 22
2 k -faktorikokeen testit Jos nollahypoteesi H X : Ei X-vaikutusta pätee, testisuure F X = 2 k (n 1) SSX SSE noudattaa F-jakaumaa vapausastein (1, 2 k (n 1)). Suuret testisuureen arvot johtavat nollahypoteesin hylkäämiseen. Vilkkumaa / Kuusinen 23
Yhden toiston 2 k -faktorikoe Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä (2 k+1 kpl) voi ylittää kokeen tekijän resurssit. Suurin osa havainnoista käytetään korkean asteen yhdysvaikutustermien estimointiin, vaikka ko. termit ovat harvoin merkityksellisiä Koe voidaan aloittaa vain yhdellä toistolla eli 2 k havainnolla Näiden havaintojen perusteella ei voida muodostaa jäännösneliösummaa SSE, eikä täten testata tekijöiden vaikutuksia Vaikutusten neliösummien perusteella voidaan kuitenkin arvioida, mitkä vaikutukset ovat merkityksettömiä, ja muodostaa SSE näitä vastaavista neliösummista Vilkkumaa / Kuusinen 24
Esimerkki Vilkkumaa / Kuusinen 25
Yhden toiston 2 k -faktorikoe Vilkkumaa / Kuusinen 26
Yhden toiston 2 k -faktorikoe Vaikutusta B vastaavat summat pieniä asetetaan satunnaisvaihteluksi SSE = SSB + SSAB + SSBC +... + SSABCD Source SS df M S F p-value A 1870.56 1 1870.56 83.36 0.00002 C 390.06 1 390.06 17.38 0.003 D 855.56 1 855.56 38.12 0.0003 AC 1314.06 1 1314.06 58.56 0.00006 AD 1105.56 1 1105.56 49.27 0.0001 CD 5.06 1 5.06 0.2255 0.65 ACD 10.56 1 10.56 0.4706 0.51 Within 179.52 8 22.44 Total 5730.94 15 Vilkkumaa / Kuusinen 27
Yhteenveto: 2 k -faktorikokeet 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa 2 k -faktorikoetta käytetään usein tutkimuksen alkuvaiheessa, sillä - Havaintoja tarvitaan minimaalinen määrä k:n tekijän vaikutuksen tutkimiseen (2 k+1 kpl; tai yhden toiston kokeessa 2 k kpl) - Neliösummat saadaan helposti laskettua kontrastien kautta - Kokeen avulla voidaan tunnistaa kiinnostavimmat tekijät, joiden tasojen määrää voidaan jatkotutkimuksissa lisätä Vilkkumaa / Kuusinen 28
Osafaktorikokeet Vilkkumaa / Kuusinen 29
Motivointi Jos tutkittavia tekijöitä on paljon, voi yhteen toistoon vaadittava 2 k havaintoakin olla liikaa Esim. täyden 2 6 -faktorikokeen yksi toisto edellyttää 64 havainnon poimimista. Kyseinen koe sisältää 63 vapausastetta: - 6 vapausastetta liittyy päävaikutuksiin - 15 vapausastetta liittyy kahden faktorin yhdysvaikutuksiin - 42 vapausastetta liittyy kolmen tai useamman faktorin yhdysvaikutuksiin Vilkkumaa / Kuusinen 30
Motivointi Jos voidaan olettaa, että tietyt korkeamman asteen yhdysvaikutukset ovat merkityksettömiä, on kiinnostavien vaikutusten selvittäminen mahdollista ottamalla vain 1/2, 1/4, 1/8 jne. täyden 2 k -faktorikokeen havainnoista, eli 2 k p havaintoa. Tällaista koesuunnitelmaa kutsutaan osafaktorikokeeksi (eng. fractional factorial experiment). Myöhemmässä vaiheessa merkityksellisiä tekijöitä voidaan tutkia tarkemmin uusilla koejärjestelyillä. Vilkkumaa / Kuusinen 31
2 k 1 -osafaktorikokeet 2 k 1 -osafaktorikokeessa poimitaan puolet täyden 2 k -faktorikokeen havainnoista. Poimittavat havainnot valitaan siten, että saadusta datasta voidaan estimoida mahdollisimman hyvin päävaikutukset ja matalan asteen yhdysvaikutukset, ts. kokeen resoluutio on mahdollisimman korkea. Vilkkumaa / Kuusinen 32
2 k 1 -osafaktorikoesuunnitelman muodostaminen 2 k 1 -osafaktorikoesuunnitelma voidaan muodostaa seuraavasti: 1. Muodostetaan täysi faktorikoesuunnitelma (k 1):lle faktorille 2. Asetetaan k:nnen faktorin tasoiksi kussakin havainnossa sama kuin on korkeimman asteen yhdysvaikutuksen ABC (K 1) merkki: K = ABC (K 1) Tällä menetelmällä saadaan korkeimman mahdollisen resoluution 2 k 1 -osafaktorikoesuunnitelma. Saman resoluution osafaktorikoesuunnitelma saadaan myös asettamalla K = ABC (K 1) Vilkkumaa / Kuusinen 33
Esimerkki: 2 3 1 -koesuunnitelman muodostaminen 1/2 Muodostetaan ensin täysi 2 2 -koesuunnitelma: Käsittely A B a + b + (1) ab + + Vilkkumaa / Kuusinen 34
Esimerkki: 2 3 1 -koesuunnitelman muodostaminen 2/2 Asetetaan kolmannen faktorin C tasoksi kussakin havainnossa C = AB: Käsittely A B C = AB a + b + c + abc + + + Nämä käsittelykombinaatiot muodostavat 2 3 1 -koesuunnitelman. Vilkkumaa / Kuusinen 35
2 3 - ja 2 3 1 -koesuunnitelmat Koko taulukko muodostaa 2 3 -koesuunnitelman, ja taulukon yläpuolikas 2 3 1 -koesuunnitelman. Vaikutus Käsittely I A B C AB AC BC ABC a + + + + b + + + + c + + + + abc + + + + + + + + ab + + + + ac + + + + bc + + + + (1) + + + + Vilkkumaa / Kuusinen 36
2 k 1 -osafaktorikoe: määrittelevä relaatio Kokeen määrittelevä relaatio on niiden yhdysvaikutusten joukko, jotka ovat aina korkealla (+) tasolla. Koska myös identiteettisarake I on aina korkealla tasolla, merkitään edellisen kalvon yläpuolikkaan 2 3 1 -kokeen määrittelevää relaatiota I = ABC Tämä tarkoittaa, että kokeen kaikissa havainnoissa yhdysvaikutus ABC on korkealla (+) tasolla. Toinen mahdollinen 2 3 1 -koesuunnitelma saadaan määrittelevällä relaatiolla I = ABC (taulukon alapuolikas). Vilkkumaa / Kuusinen 37
Aliakset 1/2 Kun osafaktorikokeessa ei poimita kaikkia 2 k havaintoa, ei datasta voida laskea omia estimaatteja kaikille mahdollisille pää- ja yhdysvaikutuksille. Käytettävissä olevien havaintojen osalta eri vaikutukset saavat saman laskukaavan. Esim. 2 3 1 -kokeessa A-vaikutus ja BC-yhdysvaikutus lasketaan samalla kaavalla: - Vaikutuksia A ja BC on mahdotonta erottaa toisistaan. - Kun datasta lasketaan estimaatti A-vaikutukselle, estimoidaankin oikeasti vaikutusta A + BC. Kahta tai useampaa vaikutusta, joilla on tämä ominaisuus, kutsutaan toistensa aliaksiksi. Vilkkumaa / Kuusinen 38
Aliakset 2/2 Minkä tahansa vaikutuksen aliakset saadaan määrättyä kertomalla vaikutuksella kokeen määrittelevää relaatiota. Esim. 2 3 1 -kokeessa, jossa I = ABC, A:n alias on: A ABC = A 2 BC Koska minkä tahansa vaikutuksen neliö on aina I (pelkkää plussaa), saadaan A = BC Vastaavasti B = AC ja C = AB. Vilkkumaa / Kuusinen 39
Kokeen resoluutio Kokeen resoluutio on R, jos yksikään p:n tekijän vaikutus ei ole alias vaikutuksen kanssa, jossa on vähemmän kuin R p tekijää. Kokeen resoluutiota merkitään yleensä roomalaisilla numeroilla tyyliin 2 3 1 III. Mitä korkeampi resoluutio, sitä korkeamman asteen yhdysvaikutukset saadaan erotettua toisistaan Vain kalvon 33 tapa muodostaa 2 k 1 -osafaktorikoe tuottaa kokeelle korkeimman mahdollisen resoluution k. Vilkkumaa / Kuusinen 40
Esimerkki Vilkkumaa / Kuusinen 41
Esimerkki Esim. tekijän A vaikutus: A = 1 ( (1) + ad bd + ab cd + ac bc + abcd) 24 1 1 = 1 ( 45 + 100 45 + 65 75 + 60 80 + 96) = 19.00 4 Koska A = A ABCD = A 2 BCD = BCD, estimoidaan itse asiassa vaikutusta A + BCD Vilkkumaa / Kuusinen 42
Esimerkki Vaikutus A = 19.00 B = 1.50 C = 14.00 D = 16.50 AB = 1.00 AC = 18.50 AD = 19.00 Alias-rakenne A A + BCD B B + ACD C C + ABD D D + ABC AB AB + CD AC AC + BD AD AD + BC Havainnot muodostavat merkittäville tekijöille A, C ja D yhden otoksen 2 3 -faktorikokeen. Vilkkumaa / Kuusinen 43
Klikkeri-kysely Olkoon 2 3 1 -kokeen määrittelevä relaatio I = ABC. Mikä on vaikutuksen AB alias? 1. BC 2. A 3. C Vilkkumaa / Kuusinen 44
Yhteenveto: osafaktorikokeet 2 k -faktorikokeeseen tarvittavien havaintojen määrää voidaan vähentää merkittävästi käyttämällä osafaktorikoetta 2 k p Koska kaikkia tarvittavia havaintoja ei hankita, ei kaikkia vaikutuksia voida estimoida - Vaikutukset sekoittuvat alias-vaikutustensa kanssa Osafaktorikokeissa oletus onkin, etteivät korkeamman tason yhdysvaikutukset ole merkittäviä Muodostamalla korkeimman mahdollisimman resoluution koe voidaan estää päävaikutusten ja matalan tason yhdysvaikutusten sekoittuminen keskenään Vilkkumaa / Kuusinen 45