5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla Bbtasoa, niin jokainen koetoisto sisältää kaikki ab käsittelykombinaatiot (on myös mahdollista, että toistoja on eri määrät eri käsittelykombinaatioissa). Tekijän omaa vaikutusta vastemuuttujaan sanotaan päävaikutukseksi (main effect). Tämä näkyy muutoksena vastemuuttujassa siirryttäessä tekijän käsittelytasolta toiselle. Tekijöidem välillä onyhdysvaikutusta (interaction), jos vastemuuttujan arvojen muutos ei ole sama kaikilla toisen tekijän tasoilla. Toistot mahdollistavat faktoreiden yhdysvaikutuksen (interaction) analysoinnin. 1 2
Esimerkki 5.1: Olkoon tekijät A ja B, molemmilla tasot low ja high. Vastemuuttujan arvot ovat seuraavat: A Low High Average B Low 20 50 35 High 40 12 26 Average 30 31 A:n päävaikutus määritellään tasojen keskimääräisenä erotuksena 50 + 12 20 + 40 A = =1. 2 2 Vastaavasti B:n päävaikutus on 40 + 12 20 + 50 B = = 9. 2 2 Yhdysvaikuts: (12 50) (40 20) AB = = 29. 2 Esimerkki 5.2: Jos edellisessä esimerkissä tilanne olisi Päävaikutukset A Low High Average B Low 20 40 30 High 30 52 41 Average 25 46 A =46 25 = 21 B =41 30 = 11 Yhdysvaikutus (52 40) (30 20) AB = =1/2, 2 eli lähes olematon yhdysvaikutus. 3 4
Tilannetta voidaan havainnollistaa graafisesti. Esimerkissä 5.1: Response 60 50 40 30 20 10 B High B Low B Low B High Esimerkissä 5.2: Response 60 50 40 30 20 10 B High B Low B High B Low Low High Factor A Low High Factor A 5 6
5.2 Faktorikokeiden etuja Perinteisesti kokeet on toteutettu vaihtelemalla yhden tekijän tasoa kerrallaan. Tämä toimii, jos tekijöillä ei ole yhdysvaikutusta. Tässäkin tapauksessa faktorikokeilla voidaan päästä tehokkaampaan lopputulokseen. Esimerkki 5.3: Olkoon faktoreiden A ja B tasot jälleen matala (low) ja korkea (high). Peinteisessä yksi-faktori-kerrallaan kokeessa mittaukset thedään kombinaatioilla (A low B low ), (A high B low ) ja (A low B high ), jolloin saadaan A:n efekti (1) A high B low A low B low ja B:n efekti (2) A low B high A low B low. Kahdella toistolla per taso tulee kaikkiaan kuusi koetta. Tässä erikoistapauksessa, jossa ei ole interaktiota, faktorikokeella päästään neljällä kokeella, toteuttamalla vain yksi toisto kaikilla vaihtoehdoilla A low B low, A high B low, A low B high ja A high B high. Näistä saadaan laskettua (1) ja (2) täsmälleen sanamalla tarkkuudella (kaksi toistoa). Faktorikokeen suhteellinen etu on 6/4 =1.5. suh- Tämä korostuu faktoreiden määrän kasvaessa: teellinen etu = 1 (1 + #fact). 2 7 8
Jos tekijöiden välillä on yhdysvaikutusta, saadaan se selville vain faktorikokeen avulla. 5.3 Kahden tekijän faktorikokeet Faktori A: tasot i =1,...,a Faktori B: tasot j =1,...,b Toistoja kussakin solussa A i B j : k =1,...,n. Vastemuuttuja: y ijk. Havaintoja (toistoja): N = abn. Tilastollinen malli (3) y ijk = μ + τ i + β j +(τβ) ij + ε ijk, jossa μ on yleiskeskiarvo, τ i on faktorin A tason i vaikutus, β j faktorin B tason j vaikutus, (τβ) ij faktororeiden A ja B tasojen i ja j yhdeysvaikutus, ja ε ijk on virhetermi, josta oletetaan (4) ε ijk NID(0,σ 2 ε ), jossa NID tarkoittaa normaalisesti jakatuneita riippumattomia satunnaismuuttujia (Normally and independently distributed). 9 10
Molemmat faktorit oletetaan kiinteiksi (ei-satunnaisiksi). Lisäksi: (5) a i=1 τ i =0, Huom. 5.2: Kirjoittamalla (8) y ijk = μ ij + ε ijk jossa μ ij on solukeskiarvo. Mallissa (3) μ ij parametrisoidaan (9) μ ij = μ + τ i + β j +(τβ) ijk (6) ja b j=1 β j =0 (7) a (τβ) ij = i=1 b (τβ) ij =0. j=1 Huom. 5.1: (τβ) ij on yhdysvaikutuksen symboli, ei τ:n ja β:n tulo. Täten parametrien arvot kuvaavat poikkeamia yleiskeskiarvosta. 11 12
Testattavat hypoteesit: Equality of row treatment H (10) 0 : τ 1 = = τ a =0 H 1 :jokinτ i =0. Equality of column treatment H (11) 0 : β 1 = = β b =0 H 1 :jokinβ j =0. No interaction (12) H 0 :(τβ) ij = 0 kaikilla i, j H 1 : jokin (τβ) ij =0. Perinteisesti havaintoaineisto on esitetty taulukkomuodossa esimerkiksi seuraavasti: Factor B 1 2 b 1 y 111,y 112, y 121,y 122, y 1b1,y 1b2,...,y 11n,...,y 12n,...,y 1bn 2 y 211,y 112, y 221,y 222, y 2b1,y 2b2, Factor A...,y 21n,...,y 22n,...,y 2bn. a y a11,y a12, y a21,y a22, y ab1,y ab2,...,y a1n,...,y a2n,...,y abn 13 14
Keskiarvot: Yleiskeskiarvo (13) y... = 1 N faktori A, tasoi a (14) y i.. = 1 an faktori B, tasoj (15) y.j. = 1 bn solu i, j (16) y ij. = 1 n b n i=1 j=1 k=1 b j=1 a i=1 n k=1 y ijk, n y ijk, k n y ijk, k y ijk. Havainnon poikkeama yleiskeskiarvosta voidaan esittää muodossa: (17) y ijk y... = ( y i.. y... )+( y.j. y... ) +( y ij. y i.. y.j. + y... ) +( y ijk y ij. ) Korottamalla toiseen ja summaamalla, voidaan osoittaa, että pätee (18) a b i=1 j=1 k=1 n (y ijk y... ) 2 = bn +n + a ( y i.. y... ) 2 + an i=1 a i=1 j=1 a b i=1 j=1 k=1 b ( y.j. y... ) 2 j=1 b ( y ij. y i.. y.j. + y... ) 2 n ( y ijk y ij. ) 2 eli neliösummahajotelma (19) SS tot = SS A + SS B + SS AB + SS err. 15 16
Varianssitaulu: Mallin (3) parametrien estimaattorit: (22) ˆμ = y..., Source SS df MS F Amain SS A a 1 MS A MS A Bmain SS B b 1 MS B MS B AB interact SS AB (a 1)(b 1) MS AB MS AB Error SS err ab(n 1) Total SS tot abn a jossa esimerkiksi (20) MS A = SS A a 1 ja (21) F = MS A on testisuure hypoteesin (10) testaamiseksi, osoittajan vapausasteilla df A = a 1 (23) ˆτ i = y i.. y.., (24) ˆβ j = y.j. y... ja (25) ( ˆτβ) ij = y ij. y i.. y.j. + y.. Ennustearvo (sovite [fitted value]): (26) ˆy ijk =ˆμ +ˆτ i + ˆβ j +(ˆτβ) ij, joka redusoituu solukeskiarvoksi (27) ˆy ijk = y ij. Residuaali: e ijk = y ijk ˆy ijk (28) = y ijk y ij. ja nimittäjän vapausasteilla df err = ab(n 1). 17 18
Esimerkki 5.4: Use of statistical experimental design for robust product design. Lämmön ja valmistusmateriaalin vaikutus sähköpatterin kestoon (y: patterin kesto tunteina). Valmistusmateriaali on kontrolloitavissa, mutta käyttölämpötila, jossa pattereita tullaan käyttämään ei. Valmistusmateriaalia on kolmea eri tyyppiä. Suunnitteluinsinööri päättää testata materiaaleja kolmessa eri lämötilassa: 10C, 20C ja 50C. Kysymyksiä: Materiaalin ja lämpötilan vaikutus kestoon? Löytyykö materiaalia, josta saadaan pitkäkestoinen patteri kaikissa lämpötiloissa? Temperature (Celsius) Material 10C 20C 50C 1 130 155 34 40 20 70 74 180 80 75 82 58 2 150 188 136 122 25 70 159 126 106 115 58 45 3 138 110 174 120 96 104 168 160 150 139 82 60 Tässä a =3,b =3jan =4. 19 20
Koe on toteutettu täysin satunnaistettuna kokeena, jossa kokeet eri materiaali/lämpötila kombinaatioissa on suoritettu täysin satunnaisessa järjestyksessä. 175 150 Average battery lives (material type - temperature) Analyysi palautuu keskiarvojen vertailuihin (ryhmäkeskiarvojen poikkeamat yleiskeskiarvosta). Mallissa (3) τ i määritellään kuvaamaan materiaalin vaikutusta ja β j lämpötilan vaikutusta. Life (hours) 125 100 75 50 25 0-10C 20C 50C Material 1 134.8 57.3 57.5 Material 2 155.8 119.8 49.5 Material 3 144.0 145.8 85.5 Temperature Yllä olevan kuvion perusteella materiaali 3 näyttäisi tuottavan kestoltaan parhaat patterit. Kuvion perusteella on havaittavissa myös jonkinasteista interaktiota. Formaalisti vaikutuksia voidaan testata varianssitaulun F -testeillä. 21 22
SAS:lla toteutettuna saadaan tulokset: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 data batterylife; input A B y @@; label y = "Battery life (hours)"; label A = "Material"; label B = "Temperature (Celsius)"; datalines; 1-10 130 1-10 155 1 20 34 1 20 40 1 50 20 1 50 70 1-10 74 1-10 180 1 20 80 1 20 75 1 50 82 1 50 58 2-1 0 50 2-1 0 88 2 20 36 2 20 22 2 50 25 2 50 70 2-1 0 59 2-1 0 26 2 20 06 2 20 5 2 50 58 2 50 45 3-1 0 38 3-1 0 0 3 20 74 3 20 20 3 50 96 3 50 04 3-1 0 68 3-1 0 60 3 20 50 3 20 39 3 50 82 3 50 60 ; run; Title "Battery life data"; proc glm data = batterylife; class a b; model y = A B A*B; output out = battery_res p = yhat r = resid student = sres; run; Battery life data The GLM Procedure Dependent Variable: y Battery life (hours) Sum of Source DF Squares Mean Square F Value Pr > F Model 8 59416.22222 7427.02778 11.00 <.0001 Error 27 18230.75000 675.21296 Corrected Total 35 77646.97222 R-Square Coeff Var Root MSE y Mean 0.765210 24.62372 25.98486 105.5278 Source DF Type III SS Mean Square F Value Pr > F A 2 10683.72222 5341.86111 7.91 0.0020 B 2 39118.72222 19559.36111 28.97 <.0001 A*B 4 9613.77778 2403.44444 3.56 0.0186 Sekä päävaikutukset että yhdysvaikutus ovat tilastollisesti merkitseviä. Huom. 5.3: Selitysaste (29) R 2 = SS model SS total =0.7652 23 24
Jäännöstarkastelut [Mallin riittävyystarkastelut] Esimerkki 5.5: Patterien kestoaineisto: Jälleen, jos kaikki systemaattinen vaihtelu havainnoissa selittyy sovitetulla faktorimallilla, tulee residuaalien (28) olla puhtaasti satunnaisvaihtelua [lisäksi normaalisti jakautunutta oletuksen (4) mukaan]. Normaalisuuskuviolla (normal probability plot) voidaan tarkastella normaalisuutta. Kaksi residuaalia on jossain määrin poikkeavia, muuten normaalisuus ja vaihtelun homogeenisuus näyttäisi olevan kunnossa. 25 26
Kuviot on tuotettu SAS-komennoilla: proc gplot data = battery_res; axis1label = ( Studentized justufy = right residuals ) order = (-3 to 3 by 1) minor = none; axis2 label = ( Material ) minor = none axis3 offset = (1cm, 1cm); label = ( Temperature ) minor = none order = (-10 to 50 by 30) offset = (1cm, 1cm); symbol1value = dot height = 2; Title2 "Residuals (Studentized) vs Fitted Values (yhat)"; plot sres*yhat /haxis = 40 to 160 by 20 hminor = 1 vaxis = axis1 vref = 0; run; Title2 "Residuals (Studentized) vs Material (Factor A)"; plot sres*a / haxis = axis2 vaxis = axis1 vref = 0; run; Title2 "Residuals (Studentized) vs Temperature (Factor B)"; plot sres*b / haxis = axis3 hminor = 0 vaxis = axis1 vref = 0; run; quit; Huom. 5.4: Yllä on tarkasteltu vain balansoitua koetta, jossa jokaisessa faktoritason kombinaation muodostamassa solussa on n havaintoa. Jos havaintoja on eri määrät, sanotaan koetta eibalansoiduksi (unbalanced). Havaintojen kokonaismäärä N = a b i=1 j=1 n ij, jossa n ij on solun i, j toistojen määrä. Tällöin koe ei ole enää ortogonaalinen ja käytetään tyypin III neliösummia. Esimerkki 5.6: 2 2(2 2 ) unbalanced full factorial design: B 1 2 1 12 20 A 14 18 2 11 17 9 ods select TestForNormality MyNormalPlot; proc univariate data = battery_res normaltest; Title2 "Normal Probability Plot of Residual"; var resid; probplot resid / normal (mu = est sigma = est) square name = "MyNormalPlot"; run; 27 28
SAS-solution: options ls = 80; data unbalanced; input a $ b $ y; datalines; a1b112 a1b114 a1b2 20 a1b2 18 a2 b111 a2 b19 a2 b2 17 ; run; Title "Unbalanced full factorial"; proc glm data = unbalanced; class a b; model y = a b a*b; run; Unbalanced full factorial The GLM Procedure Class Level Information Class Levels Values a 2 a1a2 b 2 b1b2 Number of Observations Read 7 Number of Observations Used 7 Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr > F Model 3 91.71428571 30.57142857 15.29 0.0253 Error 3 6.00000000 2.00000000 Corrected Total 6 97.71428571 R-Square Coeff Var Root MSE y Mean 0.938596 9.801480 1.414214 14.42857 Source DF Type I SS Mean Square F Value Pr > F a 1 23.04761905 23.04761905 11.52 0.0426 b 1 68.26666667 68.26666667 34.13 0.0100 a*b 10.40000000 0.40000000 0.20 0.6850 Source DF Type III SS Mean Square F Value Pr > F a 1 10.00000000 10.00000000 5.00 0.1114 b 167.60000000 67.60000000 33.80 0.0101 a*b 10.40000000 0.40000000 0.20 0.6850 29 30
Ylin taulukko kertoo, että solukeskiarvot poikkeavat tilastollisesti merkitsevästi toisistaan. Type III tulosten perusteella yhdysvaikutuksella eikä faktorin A päävaikutuksella (main effect)ole tilastolliesti merkitsevää vaikutusta keskiarvoihin. Type I neliösummien perusteella faktorin A tilastollinen merkitsevyys on 5%:n rajoilla. Ainoa tilastollisesti merkitsevä tekijä on faktori B, eli keskiarvoit poikkeavat tilastollisesti merkitsevästi vain B:n luokissa. 5.3 Yleinen faktorikoe Kahden faktorin koe yleistyy ottamalla mukaan uesampia faktoreita: Faktori A, a tasoa; faktori B, b tasoa, faktori C, c tasoa, jne. Balansoidussa yleisessä faktorikokeessa on n toistoa jokaisessa solussa. Täten havaintojen kokonaismäärä esimerkiksi kolmen faktorin kokeessa on N = abcn kappaletta. 31 32
Kolmen faktorin koe: Varianssitaulu: Tilastollinen malli (30) y ijkl = μ + τ i + β j + γ k +(τβ) ij +(τγ) ik +(βγ) jk +(τβγ) ijk + ε ijkl, jossa ensimmäisen asteen termit τ i, β j ja γ k ovat päävaikutustermejä (main effects), (τβ) ij, (τγ) ik ja (βγ) jk ovat toisen asteen yhdysvaikutustermejä (second order interaction) ja Source SS df MS F A SS A a 1 MS A F = MSA B SS B b 1 MS A F = MSB C SS C c 1 MS C F = MSC AB SS AB (a 1)(b 1) MS AB F = MSAB AC SS AC (a 1)(c 1) MS AC F = MSAC BC SS BC (b 1)(c 1) MS BC F = MSBC ABC SS ABC (a 1)(b 1)(c 1) MS ABC F = MSABC Error SS A abc(n 1) Total SS A abcn 1 (τβγ) ijk muodostaa kolmannen asteen (third order term) termin, i =1,...,a, j =1,...,b, k =1,...,c ja l =1,...,n. 33 34
Esimerkki 5.7: Virkistysjuomapullojen täyttöaste. Kontrolloitavat tekijät: A hiilihapon määrä (prosentteina), B täyttöpaine, C nopeus (pulloja minuutissa). y poikkeama tavoitetäyttöasteesta. Toistoja n =2. 1-1 -1 1 ================================================================ Tayttopaine (B) ----------------------------------------------- 25 psi 30 psi ---------------------- ---------------------- liukuhihnan nopeus (C) liukuhihnan nopeus (C) ---------------------- ---------------------- Hiilihappo (A) 200 250 200 250 ---------------------------------------------------------------- 0-3 -10 0 1 1 2 0 2 2 6 1 1 3 5 1 4 5 7 7 1 0 4 6 9 1 ================================================================ SAS proc glm options ls = 80; data softdrink; input A B C y @@; label A = "Percentage of carbonation" B = "Operating pressure" C = "Line speed"; datalines; 10 25 200-3 10 25 250-1 10 30 200-1 10 30 250 1 10 25 200-1 10 25 250 0 10 30 200 0 10 30 250 1 12 25 200 0 12 25 250 2 12 30 200 2 12 30 250 6 12 25 200 1 12 25 250 1 12 30 200 3 12 30 250 5 14 25 200 5 14 25 250 7 14 30 200 7 14 30 250 10 14 25 200 4 14 25 250 6 14 30 200 9 14 30 250 11 ; run; proc glm data = softdrink; class A B C; model y = A B C; run; 35 36
SAS tulokset Class Level Information Class Levels Values A 3 1 0 2 4 B 2 25 30 C 2 200 250 Number of Observations 24 The GLM Procedure Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr > F Model 11 328.1250000 29.8295455 42.11 <.0001 Error 12 8.5000000 0.7083333 Total 23 336.6250000 Käytännöllisesti katsoen päävaikutukset ovat vain tilastollisesti merkitseviä. F -testisuureen perusteella hiilihapon (A) määrällä näyttäisi olevan suurin vaikutus. Tämä näkyy myös havaintoaineistosta. Graafinen esitys valaisee tilannetta. Average fill deviation 8 6 4 2 0 Carbonation effect on fill deviation Average fill deviation 8 6 4 2 0 Operating pressure effect on fill deviation R-Square Coeff Var Root MSE y Mean 0.974749 26.93201 0.841625 3.125000-2 10 12 14 Fill deviation -0.5 2.5 7.4 Percent carbonation (A) -2 25 psi 30 psi Fill deviation 1.75 4.5 Operating pressure (B) Source DF Type III SS Mean Square F Value Pr > F A 2 252.7500000 126.3750000 178.41 <.0001 B 145.3750000 45.3750000 64.06 <.0001 A*B 2 5.2500000 2.6250000 3.710.0558 C 1 22.0416667 22.0416667 31.12 0.0001 A*C 2 0.5833333 0.2916667 0.41 0.6715 B*C 1 1.0416667 1.0416667 1.47 0.2486 A*B*C 2 1.0833333 0.5416667 0.76 0.4869 Average fill deviation 8 6 4 2 0 Line speed effect on fill deviation -2 200 250 Fill deviation 2.17 4.08 Line speed (C) 37 38
5.4 Lohkominen faktorikoeissa Tähän astisissa kokeissa on toteutettu täysi satunnaistaminen. Joskus on huomioitavia taustatekijät joita ei voida kontrolloida (nuisance factors). Tällöin turvaudutaan lohkomiseen (blocking) ja satunnaistaminen toteutetaan lohkojen sisällä. Olkoon faktorit A ja B ja lohkot siten, että kussakin lohkossa on mahdollista tehdä ab koetta. Jos lohkoja (esim. raaka-aine-eriä) on n kappaletta, havaintojen kokonaismäärä onn = abn ja tilastollinen malli on muotoa (31) y ijk = μ + τ i + β j +(τβ) ij + δ k + ε ijk. jossa δ k on lohkon k vaikutus. Huom. 5.5: Lohkot muodostavat tässä tekijän C, joten virhetermiin absorboituu yhdysvaikutusterimt (τδ) ik, (βδ) jk ja (τβδ) ijk. Huom. 5.6: Samalla periaatteella voidaan soveltaa (yleisiä) latinalaisia neliöitä useampien lohkomuuttujien tapauksissa. 39 40