Osafaktorikokeet Kurssipalautetta voi antaa Oodissa 27.4.-25.5. Kuusinen/Heliövaara 1
Osafaktorikokeet Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä voi ylittää kokeen tekijän resurssit. Myös estimoitavien korkean asteen yhdysvaikutustermien määrä kasvaa ja suurin osa havainnoista käytetään näiden termien estimointiin. Korkean asteen yhdysvaikutustermit ovat kuitenkin harvoin merkityksellisiä. Kuusinen/Heliövaara 2
Esimerkki Täyden 2 6 -faktorikokeen yksi toisto edellyttää 64 havainnon poimimista. Kyseinen koe sisältää 63 vapausastetta: - 6 vapausastetta liittyy päävaikutuksiin - 15 vapausastetta liittyy kahden faktorin yhdysvaikutuksiin - 42 vapausastetta liittyy kolmen tai useamman faktorin yhdysvaikutuksiin Kuusinen/Heliövaara 3
Osafaktorikokeet Jos voidaan olettaa, että tietyt korkeamman asteen yhdysvaikutukset ovat merkityksettömiä, on kiinnostavien vaikutusten selvittäminen mahdollista poimimalla vain osa 2 k havainnosta. Tällaista koesuunnitelmaa kutsutaan osafaktorikokeeksi (eng. fractional factorial experiment). Tarvittavien havaintojen määrä voi olla 1/2, 1/4, 1/8, jne. täyden 2 k -faktorikokeen havainnoista, eli 2 k p havaintoa. Kuusinen/Heliövaara 4
Osafaktorikokeet Osafaktorikokeiden pääasiallinen käyttötarkoitus on seulontakokeet. Niissä tutkitaan suurta määrää faktoreita ja pyrkimyksenä on tunnistaa ne, joiden vaikutus vasteeseen on suuri. Seulontakokeita käytetään kokeellisen tutkimuksen alkuvaiheessa. Myöhemmässä vaiheessa merkityksellisiä faktoreita voidaan tutkia tarkemmin uusilla koejärjestelyillä. Kuusinen/Heliövaara 5
2 k 1 -osafaktorikokeet 2 k 1 -osafaktorikokeessa poimitaan puolet täyden 2 k -faktorikokeen havainnoista. Poimittavat havainnot valitaan siten, että saadusta datasta voidaan estimoida mahdollisimman hyvin päävaikutukset ja matalan asteen yhdysvaikutukset. Kuusinen/Heliövaara 6
2 k 1 -osafaktorikoesuunnitelman muodostaminen 2 k 1 -osafaktorikoesuunnitelma voidaan muodostaa seuraavasti: 1. Muodostetaan täysi faktorikoesuunnitelma (k 1):lle faktorille 2. Asetetaan k:nnen faktorin tasoiksi kussakin havainnossa sama kuin on korkeimman asteen yhdysvaikutuksen ABC (K 1) merkki: K = ABC (K 1) Tällä menetelmällä saadaan korkeimman mahdollisen resoluution 2 k 1 -osafaktorikoesuunnitelma. Saman resoluution osafaktorikoesuunnitelma saadaan myös asettamalla K = ABC (K 1) Kuusinen/Heliövaara 7
Esimerkki: 2 3 1 -koesuunnitelman muodostaminen 1/2 Muodostetaan ensin täysi 2 2 -koesuunnitelma: Käsittely A B a + b + (1) ab + + Kuusinen/Heliövaara 8
Esimerkki: 2 3 1 -koesuunnitelman muodostaminen 2/2 Asetetaan kolmannen faktorin C tasoksi kussakin havainnossa C = AB: Käsittely A B C = AB a + b + c + abc + + + Nämä koeasetelmat muodostavat 2 3 1 -koesuunnitelman. Kuusinen/Heliövaara 9
2 3 - ja 2 3 1 -koesuunnitelmat Koko taulukko muodostaa 2 3 -koesuunnitelman ja taulukon yläpuolikas 2 3 1 -koesuunnitelman. Vaikutus Käsittely I A B C AB AC BC ABC a + + + + b + + + + c + + + + abc + + + + + + + + ab + + + + ac + + + + bc + + + + (1) + + + + Kuusinen/Heliövaara 10
2 k 1 -osafaktorikoe: määrittelevä relaatio Kokeen määrittelevä relaatio on niiden yhdysvaikutusten joukko, jotka ovat aina korkealla (+) tasolla. Koska myös identiteetti sarake I on aina korkealla tasolla, merkitään edellisen kalvon yläpuolikkaan 2 3 1 -kokeen määrittelevää relaatiota I = ABC Tämä tarkoittaa, että kokeen kaikissa havainnoissa yhdysvaikutus ABC on korkealla (+) tasolla. Toinen mahdollinen 2 3 1 -koesuunnitelma saadaan määrittelevällä relaatiolla I = ABC (taulukon alapuolikas). Määrittelevä relaatio määrää kokeessa tarvittavat havainnot. Kuusinen/Heliövaara 11
Aliakset 1/2 Kun osafaktorikokeessa ei poimita kaikkia 2 k havaintoa, ei datasta voida laskea omia estimaatteja kaikille mahdollisille pää- ja yhdysvaikutuksille. Käytettävissä olevien havaintojen osalta eri vaikutukset saavat saman laskukaavan. Esim. 2 3 1 -kokeessa A-vaikutus ja BC-yhdysvaikutus lasketaan samalla kaavalla: - Vaikutuksia A ja BC on mahdotonta erottaa toisistaan. - Kun datasta lasketaan estimaatti A-vaikutukselle, estimoidaankin oikeasti vaikutusta A + BC. Kahta tai useampaa vaikutusta, joilla on tämä ominaisuus, kutsutaan toistensa aliaksiksi. Kuusinen/Heliövaara 12
Aliakset 2/2 Minkä tahansa vaikutuksen aliakset saadaan määrättyä kertomalla vaikutuksella kokeen määrittelevää relaatiota. Esim. 2 3 1 -kokeessa, jossa I = ABC, A:n alias on: A ABC = A 2 BC Koska minkä tahansa vaikutuksen neliö on aina I (pelkkää plussaa), saadaan A = BC Vastaavasti B = AC ja C = AB. Kuusinen/Heliövaara 13
Kokeen resoluutio Kokeen resoluutio on R, jos yksikään p:n tekijän vaikutus ei ole alias vaikutuksen kanssa, jossa on vähemmän kuin R p tekijää. Kokeen resoluutiota merkitään yleensä roomalaisilla numeroilla tyyliin 2 3 1 III. Resoluution III ja IV kokeiden määritelmät: - Resoluution III kokeet: Päävaikutukset eivät ole aliaksia toisten päävaikutusten kanssa, mutta voivat olla aliaksia kahden faktorin yhdysvaikutusten kanssa. Esim. 2 3 1 III -koe. - Resoluution IV kokeet: Päävaikutukset eivät ole aliaksia toisten päävaikutusten tai kahden faktorin yhdysvaikutusten kanssa. Lisäksi kahden faktorin yhdysvaikutukset voivat olla aliaksia keskenään. Esim. 2 4 1 IV -koe. Kokeen resoluutio on sama kuin kirjaimien lukumäärä kokeen määrittävän relaation lyhimmässä termissä. Kuusinen/Heliövaara 14
2 k 2 -osafaktorikokeet 2 k 2 -osafaktorikokeessa poimitaan 1/4 täyden 2 k -faktorikokeen havainnoista. 2 k 2 -osafaktorikoesuunnitelma voidaan muodostaa seuraavasti: 1. Muodostetaan täysi faktorikoesuunnitelma joillekin (k 2):lle faktorille. 2. Määrätään (k 1):nnen faktorin taso kussakin havainnossa siten, että se on sama kuin jokin (k 2):n ensimmäisen faktorin muodostama yhdysvaikutus. 3. Määrätään k:nnen faktorin taso samoin kuin kohdassa 2., mutta yhdistetään se eri yhdysvaikutukseen kuin (k 1):s faktori. Näin saadaan koesuunnitelma, jossa on 1/4 täyden 2 k -faktorikokeen havainnoista. Kuusinen/Heliövaara 15
2 k 2 -osafaktorikoe: määrittelevä relaatio Kokeen määrittelevä relaatio on niiden vaikutusten joukko, jotka ovat aina korkealla (+) tasolla. 2 k 2 -kokeen määrittelevään relaatioon kuuluu kolme vaikutusta: - Kun asetamme kahden viimeisen faktorin arvot yhtäsuuriksi jonkin yhdysvaikutuksen kanssa, saamme kaksi määrittelevää relaatiota. - Kolmas termi määrittelevään relaatioon saadaan kahden ensimmäisen tulona, koska jos kaksi termiä on aina (+)-tasolla, on myös niiden tulo aina (+)-tasolla. Kokeen määrittelevää relaatiota merkitään esim.: I = ABCE = BCDF = ADEF Tämä on eräs 2 6 2 -kokeen määrittelevä relaatio. Kuusinen/Heliövaara 16
Osafaktorikokeiden edut Osafaktorikokeiden erinomaisuus perustuu kolmeen keskeiseen asiaan: 1. Harvat vaikutukset (The sparsity of effects): Kun systeemissä on monta tekijää, merkittävät tekijät ovat usein päävaikutukset ja matalan asteen yhdysvaikutukset ("Ockhamin partaveitsi": Jos ilmiölle on useita mahdollisia selityksiä, yksinkertaisin on useimmiten oikea). 2. Projektio-ominaisuus (The projection property): Osafaktorikoe voidaan projisoida mille tahansa merkitsevien faktorien osajoukolle. Projisoimalla saatu koeasetelma mahdollistaa tarkemman analyysin kuin alkuperäinen. 3. Peräkkäisten kokeiden yhdistäminen (Sequential experimentation): Kahden tai useamman osafaktorikokeen toistot voidaan yhdistää laajemmaksi koesuunnitelmaksi, josta saadaan estimoitua halutut pää- ja yhdysvaikutukset harhattomasti. Kuusinen/Heliövaara 17
Osafaktorikokeen projektiot Minkä tahansa 2 k 1 -kokeen havainnoista voidaan muodostaa täysfaktorikokeen havainnot mille tahansa (k 1):lle faktorille. Vastaavasti 2 k 1 -kokeen havainnoista saadaan täysfaktorikokeen havainnot kahdella toistolla mille tahansa (k 2):lle faktorille. Alkupäräisistä havainnoista voidaan siis tehdä tarkempia johtopäätöksiä, jos osa faktoreista todetaan merkityksettömiksi. Yhdellä toistolla tehdyistä osafaktorikokeista ei saada estimoitua jäännösvarianssia, eikä näin ollen testattua vaikutusten tilastollista merkitsevyyttä. Kuitenkin, jos osa tekijöistä voidaan poistaa merkityksettöminä, alkuperäisistä havainnoista voidaan estimoida jäännösvarianssi. Kuusinen/Heliövaara 18
Varianssianalyysin kertaus Kuusinen/Heliövaara 19
Yksisuuntainen varianssianalyysi Vaihtelun lähde SS df M S F Ryhmien välinen SSG k 1 MSG = SSG/df F = MSG/MSE Ryhmien sisäinen SSE N k M SE = SSE/df Kokonaisvaihtelu SST N 1 SST = k n i i=1 j=1 y 2 ji 1 N T 2 SSG = k i=1 1 n i T 2 i 1 N T 2 SSE = SST SSG Kuusinen/Heliövaara 20
Kaksisuuntainen varianssianalyysi Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df F B = MSB/MSE AB SSAB (I 1)(J 1) MSAB = SSAB/df F AB = MSAB/MSE Jäännösvaihtelu SSE IJ(K 1) M SE = SSE/df Kokonaisvaihtelu SST IJK 1 SST = I J K i=1 j=1 k=1 y 2 kij 1 IJK T 2 SS = 1 K I J i=1 j=1 T 2 ij 1 IJK T 2 SSA = 1 JK SSB = 1 IK I i=1 J j=1 T 2 i 1 IJK T 2 T 2 j 1 IJK T 2 SSAB = SS SSA SSB SSE = SST SS Kuusinen/Heliövaara 21
Satunnaistettu täydellinen lohkoasetelma Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df Jäännösvaihtelu SSE (I 1)(J 1) M SE = SSE/df Kokonaisvaihtelu SST IJ 1 SST = I J i=1 j=1 yij 2 1 IJ T 2 SSA = 1 J SSB = 1 I I i=1 J j=1 Ti 2 1 IJ T 2 T j 2 1 IJ T 2 SSE = SST SSA SSB Kuusinen/Heliövaara 22
Latinalaisten neliöiden koeasetelma Vaihtelun lähde SS df M S F A SSA P 1 MSA = SSA/df F A = MSA/MSE R SSR P 1 MSR = SSR/df C SSC P 1 MSC = SSC/df Jäännösvaihtelu SSE (P 2)(P 1) M SE = SSE/df Kokonaisvaihtelu SST P 2 1 SST = P P P i=1 j=1 k=1 y 2 ijk 1 P 2 T 2 SSC = 1 P P j=1 T 2 j 1 P 2 T 2 SSR = 1 P P i=1 T 2 i 1 P 2 T 2 SSA = 1 P P k=1 T 2 k 1 P 2 T 2 SSE = SST SSA SSR SSC Kuusinen/Heliövaara 23
Kaksiasteinen hierarkkinen koeasetelma Tapaus 1: A kiinteä ja B kiinteä Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSE B(A) SSB(A) I(J 1) MSB(A) = SSB(A)/df F B(A) = MSB(A)/MSE Jäännösvaihtelu SSE IJ(K 1) M SE = SSE/df Kokonaisvaihtelu SST IJK 1 SST = I J K i=1 j=1 k=1 y 2 kij 1 IJK T 2 SSB(A) = 1 K I J i=1 j=1 T 2 ij 1 JK T 2 i SSA = 1 JK I i=1 T 2 i 1 IJK T 2 SSE = SST SSA SSB(A) Kuusinen/Heliövaara 24
Kaksiasteinen hierarkkinen koeasetelma Tapaus 2: A kiinteä ja B satunnainen Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSB(A) B(A) SSB(A) I(J 1) MSB(A) = SSB(A)/df F B(A) = MSB(A)/MSE Jäännösvaihtelu SSE IJ(K 1) M SE = SSE/df Kokonaisvaihtelu SST IJK 1 SST = I J K i=1 j=1 k=1 y 2 kij 1 IJK T 2 SSB(A) = 1 K I J i=1 j=1 T 2 ij 1 JK T 2 i SSA = 1 JK I i=1 T 2 i 1 IJK T 2 SSE = SST SSA SSB(A) Kuusinen/Heliövaara 25
Kaksiasteinen hierarkkinen koeasetelma Tapaus 3: A satunnainen ja B satunnainen Samoin kuin tapauksessa 2. Kuusinen/Heliövaara 26
2 2 faktorikokeet - 2 2 faktorikoe on kaksisuuntaisen varianssianalyysin erikoistapaus, jossa I = 2 ja J = 2. Vaihtelun lähde SS df M S F A SSA 1 MSA = SSA/df F A = MSA/MSE B SSB 1 MSB = SSB/df F B = MSB/MSE AB SSAB 1 MSAB = SSAB/df F AB = MSAB/MSE Jäännösvaihtelu SSE 4(n 1) M SE = SSE/df Kokonaisvaihtelu SST 4n 1 SSA = 1 [ab + a b (1)]2 4n SSB = 1 [ab a + b (1)]2 4n SSAB = 1 [ab a b + (1)]2 4n SST = I J K i=1 j=1 k=1 y 2 kij 1 IJK T 2 SSE = SST SSA SSB SSAB Kuusinen/Heliövaara 27
Sir Ronald A. Fisher Kehitti suurimman uskottavuuden menetelmän, varianssianalyysin ja paljon muuta... Kuusinen/Heliövaara 28