5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

Samankaltaiset tiedostot
Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

9.1 Hierarkiset asetelmat (Nested Designs)

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs)

Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä:

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Lohkoasetelmat. Heliövaara 1

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Vastepintamenetelmä. Kuusinen/Heliövaara 1

A250A0050 Ekonometrian perusteet Tentti

Vastepintamenetelmä. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1

2. Keskiarvojen vartailua

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Kertausluento. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Osafaktorikokeet. Heliövaara 1

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Altistusaika 1 kk 2 kk 3 kk

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Toimittaja Erä

Harjoitus 7: NCSS - Tilastollinen analyysi

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Perusnäkymä yksisuuntaiseen ANOVAaan

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Mat Tilastollisen analyysin perusteet, kevät 2007

Regressioanalyysi. Vilkkumaa / Kuusinen 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

nopeasti täydessä toteutuksessa (complete replicate).

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Väliestimointi (jatkoa) Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1

Harjoitus 9: Excel - Tilastollinen analyysi

Regressioanalyysi. Kuusinen/Heliövaara 1

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

Testejä suhdeasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...


805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi

2 2 -faktorikokeen määritelmä

Sovellettu todennäköisyyslaskenta B

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

pisteet Frekvenssi frekvenssi Yhteensä

Sovellettu todennäköisyyslaskenta B

Batch means -menetelmä

Yleistetyistä lineaarisista malleista

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Transkriptio:

5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla Bbtasoa, niin jokainen koetoisto sisältää kaikki ab käsittelykombinaatiot (on myös mahdollista, että toistoja on eri määrät eri käsittelykombinaatioissa). Tekijän omaa vaikutusta vastemuuttujaan sanotaan päävaikutukseksi (main effect). Tämä näkyy muutoksena vastemuuttujassa siirryttäessä tekijän käsittelytasolta toiselle. Tekijöidem välillä onyhdysvaikutusta (interaction), jos vastemuuttujan arvojen muutos ei ole sama kaikilla toisen tekijän tasoilla. Toistot mahdollistavat faktoreiden yhdysvaikutuksen (interaction) analysoinnin. 1 Esimerkki 5.1: Olkoon tekijät A ja B, molemmilla tasot low ja high. Vastemuuttujan arvot ovat seuraavat: A Low High Average B Low 0 50 35 High 40 1 6 Average 30 31 A:n päävaikutus määritellään tasojen keskimääräisenä erotuksena 50 + 1 0 + 40 A = =1. Vastaavasti B:n päävaikutus on Yhdysvaikuts: B = AB = 40 + 1 0 + 50 = 9. (1 50) (40 0) = 9. Esimerkki 5.: Jos edellisessä esimerkissä tilanne olisi A Low High Average B Low 0 40 30 High 30 5 41 Average 5 46 Päävaikutukset A =46 5 = 1 Yhdysvaikutus B =41 30 = 11 (5 40) (30 0) AB = eli lähes olematon yhdysvaikutus. =1/, 3 4

Tilannetta voidaan havainnollistaa graafisesti. Esimerkissä 5.1: Response 60 50 40 30 0 10 B Low B High B Low B High Esimerkissä 5.: Response 60 50 40 30 0 10 B High B Low B High B Low Low High Factor A Low High Factor A 5 6 5. Faktorikokeiden etuja Perinteisesti kokeet on toteutettu vaihtelemalla yhden tekijän tasoa kerrallaan. Tämä toimii, jos tekijöillä ei ole yhdysvaikutusta. Tässäkin tapauksessa faktorikokeilla voidaan päästä tehokkaampaan lopputulokseen. Esimerkki 5.3: Olkoon faktoreiden A ja B tasot jälleen matala (low) ja korkea (high). Peinteisessä yksi-faktori-kerrallaan kokeessa mittaukset thedään kombinaatioilla (A lowb low), (A highb low) ja (A lowb high), jolloin saadaan A:n efekti (1) A highb low A lowb low ja B:n efekti () A lowb high A lowb low. Kahdella toistolla per taso tulee kaikkiaan kuusi koetta. Tässä erikoistapauksessa, jossa ei ole interaktiota, faktorikokeella päästään neljällä kokeella, toteuttamalla vain yksi toisto kaikilla vaihtoehdoilla A lowb low, A highb low, A lowb high ja A highb high. Näistä saadaan laskettua (1) ja () täsmälleen sanamalla tarkkuudella (kaksi toistoa). Faktorikokeen suhteellinen etu on 6/4 =1.5. suh- Tämä korostuu faktoreiden määrän kasvaessa: teellinen etu = 1 (1 + #fact). 7 8

Jos tekijöiden välillä on yhdysvaikutusta, saadaan se selville vain faktorikokeen avulla. 5.3 Kahden tekijän faktorikokeet Faktori A: tasot i =1,...,a Faktori B: tasot j =1,...,b Toistoja kussakin solussa A i B j : k =1,...,n. Vastemuuttuja: y ijk. Havaintoja (toistoja): N = abn. Tilastollinen malli (3) y ijk = μ + τ i + β j +(τβ) ij + ε ijk, jossa μ on yleiskeskiarvo, τ i on faktorin A tason i vaikutus, β j faktorin B tason j vaikutus, (τβ) ij faktororeiden A ja B tasojen i ja j yhdeysvaikutus, ja ε ijk on virhetermi, josta oletetaan (4) ε ijk NID(0,σ ε ), jossa NID tarkoittaa normaalisesti jakatuneita riippumattomia satunnaismuuttujia (Normally and independently distributed). 9 10 Molemmat faktorit oletetaan kiinteiksi (ei-satunnaisiksi). Lisäksi: (5) τ i =0, i=1 Huom. 5.: Kirjoittamalla (8) y ijk = μ ij + ε ijk jossa μ ij on solukeskiarvo. Mallissa (3) μ ij parametrisoidaan (9) μ ij = μ + τ i + β j +(τβ) ijk (6) ja (7) b β j =0 j=1 b (τβ) ij = (τβ) ij =0. i=1 j=1 Huom. 5.1: (τβ) ij on yhdysvaikutuksen symboli, ei τ:n ja β:n tulo. Täten parametrien arvot kuvaavat poikkeamia yleiskeskiarvosta. 11 1

Testattavat hypoteesit: Equality of row treatment H (10) 0 : τ 1 = = τ a =0 H 1 :jokinτ i =0. Equality of column treatment H (11) 0 : β 1 = = β b =0 H 1 :jokinβ j =0. No interaction (1) H 0 :(τβ) ij = 0 kaikilla i, j H 1 : jokin (τβ) ij =0. Perinteisesti havaintoaineisto on esitetty taulukkomuodossa esimerkiksi seuraavasti: Factor B 1 b 1 y 111,y 11, y 11,y 1, y 1b1,y 1b,...,y 11n,...,y 1n,...,y 1bn y 11,y 11, y 1,y, y b1,y b, Factor A...,y 1n,...,y n,...,y bn. a y a11,y a1, y a1,y a, y ab1,y ab,...,y a1n,...,y an,...,y abn 13 14 Keskiarvot: Yleiskeskiarvo (13) y... = 1 b n y ijk, N i=1 j=1 k=1 faktori A, tasoi (14) y i.. = 1 b n y ijk, an j=1 k faktori B, tasoj (15) y.j. = 1 n y ijk, bn i=1 k solu i, j (16) y ij. = 1 n y ijk. n k=1 Havainnon poikkeama yleiskeskiarvosta voidaan esittää muodossa: (17) y ijk y... = ( y i.. y... )+( y.j. y... ) +( y ij. y i.. y.j. + y... ) +( y ijk y ij. ) Korottamalla toiseen ja summaamalla, voidaan osoittaa, että pätee (18) b n b (y ijk y...) = bn ( y i.. y...) + an ( y.j. y...) i=1 j=1 k=1 +n + i=1 i=1 j=1 i=1 j=1 k=1 j=1 b ( y ij. y i.. y.j. + y...) b n ( y ijk y ij. ) eli neliösummahajotelma (19) SS tot = SS A + SS B + SS AB + SS err. 15 16

Varianssitaulu: Source SS df MS F Amain SS A a 1 MS A MSA Bmain SS B b 1 MS B MSB AB interact SS AB (a 1)(b 1) MS AB MSAB Error SS err ab(n 1) MS err Total SS tot abn a jossa esimerkiksi (0) MS A = SS A a 1 ja (1) F = MS A MS err on testisuure hypoteesin (10) testaamiseksi, osoittajan vapausasteilla df A = a 1 ja nimittäjän vapausasteilla Mallin (3) parametrien estimaattorit: () ˆμ = y..., (3) ˆτ i = y i.. y.., (4) ˆβ j = y.j. y... ja (5) ( ˆτβ) ij = y ij. y i.. y.j. + y.. Ennustearvo (sovite [fitted value]): (6) ˆy ijk =ˆμ +ˆτ i + ˆβ j +(ˆτβ) ij, joka redusoituu solukeskiarvoksi (7) ˆy ijk = y ij. Residuaali: e ijk = y ijk ˆy ijk (8) = y ijk y ij. df err = ab(n 1). 17 18 Esimerkki 5.4: Use of statistical experimental design for robust product design. Lämmön ja valmistusmateriaalin vaikutus sähköpatterin kestoon (y: patterin kesto tunteina). Valmistusmateriaali on kontrolloitavissa, mutta käyttölämpötila, jossa pattereita tullaan käyttämään ei. Valmistusmateriaalia on kolmea eri tyyppiä. Suunnitteluinsinööri päättää testata materiaaleja kolmessa eri lämötilassa: 10C, 0C ja 50C. Kysymyksiä: Materiaalin ja lämpötilan vaikutus kestoon? Löytyykö materiaalia, josta saadaan pitkäkestoinen patteri kaikissa lämpötiloissa? Temperature (Celsius) Material 10C 0C 50C 1 130 155 34 40 0 70 74 180 80 75 8 58 150 188 136 1 5 70 159 16 106 115 58 45 3 138 110 174 10 96 104 168 160 150 139 8 60 Tässä a =3,b =3jan =4. 19 0

Koe on toteutettu täysin satunnaistettuna kokeena, jossa kokeet eri materiaali/lämpötila kombinaatioissa on suoritettu täysin satunnaisessa järjestyksessä. 175 150 Average battery lives (material type - temperature) Analyysi palautuu keskiarvojen vertailuihin (ryhmäkeskiarvojen poikkeamat yleiskeskiarvosta). Mallissa (3) τ i määritellään kuvaamaan materiaalin vaikutusta ja β j lämpötilan vaikutusta. Life (hours) 15 100 75 50 5 0-10C 0C 50C Material 1 134.8 57.3 57.5 Material 155.8 119.8 49.5 Material 3 144.0 145.8 85.5 Temperature Yllä olevan kuvion perusteella materiaali 3 näyttäisi tuottavan kestoltaan parhaat patterit. Kuvion perusteella on havaittavissa myös jonkinasteista interaktiota. Formaalisti vaikutuksia voidaan testata varianssitaulun F -testeillä. 1 SAS:lla toteutettuna saadaan tulokset: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 data batterylife; input A B y @@; label y = "Battery life (hours)"; label A = "Material"; label B = "Temperature (Celsius)"; datalines; 1-10 130 1-10 155 1 0 34 1 0 40 1 50 0 1 50 70 1-10 74 1-10 180 1 0 80 1 0 75 1 50 8 1 50 58-1 0 50-1 0 88 0 36 0 50 5 50 70-1 0 59-1 0 6 0 06 0 5 50 58 50 45 3-1 0 38 3-1 0 0 3 0 74 3 0 0 3 50 96 3 50 04 3-1 0 68 3-1 0 60 3 0 50 3 0 39 3 50 8 3 50 60 ; Title "Battery life data"; proc glm data = batterylife; class a b; model y = A B A*B; output out = battery_res p = yhat r = resid student = sres; Battery life data The GLM Procedure Dependent Variable: y Battery life (hours) Sum of Source DF Squares Mean Square F Value Pr > F Model 8 59416. 747.0778 11.00 <.0001 Error 7 1830.75000 675.196 Corrected Total 35 77646.97 R-Square Coeff Var Root MSE y Mean 0.76510 4.637 5.98486 105.578 Source DF Type III SS Mean Square F Value Pr > F A 10683.7 5341.86111 7.91 0.000 B 39118.7 19559.36111 8.97 <.0001 A*B 4 9613.77778 403.44444 3.56 0.0186 Sekä päävaikutukset että yhdysvaikutus ovat tilastollisesti merkitseviä. Huom. 5.3: Selitysaste (9) R = SSmodel SS total =0.765 3 4

Jäännöstarkastelut [Mallin riittävyystarkastelut] Esimerkki 5.5: Patterien kestoaineisto: Jälleen, jos kaikki systemaattinen vaihtelu havainnoissa selittyy sovitetulla faktorimallilla, tulee residuaalien (8) olla puhtaasti satunnaisvaihtelua [lisäksi normaalisti jakautunutta oletuksen (4) mukaan]. Normaalisuuskuviolla (normal probability plot) voidaan tarkastella normaalisuutta. Kaksi residuaalia on jossain määrin poikkeavia, muuten normaalisuus ja vaihtelun homogeenisuus näyttäisi olevan kunnossa. 5 6 Kuviot on tuotettu SAS-komennoilla: proc gplot data = battery_res; axis1label = ( Studentized justufy = right residuals ) order = (-3 to 3 by 1) minor = none; axis label = ( Material ) minor = none axis3 offset = (1cm, 1cm); label = ( Temperature ) minor = none order = (-10 to 50 by 30) offset = (1cm, 1cm); symbol1value = dot height = ; Title "Residuals (Studentized) vs Fitted Values (yhat)"; plot sres*yhat /haxis = 40 to 160 by 0 hminor = 1 vaxis = axis1 vref = 0; Title "Residuals (Studentized) vs Material (Factor A)"; plot sres*a / haxis = axis vaxis = axis1 vref = 0; Title "Residuals (Studentized) vs Temperature (Factor B)"; plot sres*b / haxis = axis3 hminor = 0 vaxis = axis1 vref = 0; quit; Huom. 5.4: Yllä on tarkasteltu vain balansoitua koetta, jossa jokaisessa faktoritason kombinaation muodostamassa solussa on n havaintoa. Jos havaintoja on eri määrät, sanotaan koetta eibalansoiduksi (unbalanced). Havaintojen kokonaismäärä N = a b i=1 j=1 n ij, jossa n ij on solun i, j toistojen määrä. Tällöin koe ei ole enää ortogonaalinen ja käytetään tyypin III neliösummia. Esimerkki 5.6: ( ) unbalanced full factorial design: B 1 1 1 0 A 14 18 11 17 9 ods select TestForNormality MyNormalPlot; proc univariate data = battery_res normaltest; Title "Normal Probability Plot of Residual"; var resid; probplot resid / normal (mu = est sigma = est) square name = "MyNormalPlot"; 7 8

SAS-solution: options ls = 80; data unbalanced; input a $ b $ y; datalines; a1b11 a1b114 a1b 0 a1b 18 a b111 a b19 a b 17 ; Title "Unbalanced full factorial"; proc glm data = unbalanced; class a b; model y = a b a*b; Unbalanced full factorial The GLM Procedure Class Level Information Class Levels Values a a1a b b1b Number of Observations Read 7 Number of Observations Used 7 Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr > F Model 3 91.7148571 30.5714857 15.9 0.053 Error 3 6.00000000.00000000 Corrected Total 6 97.7148571 R-Square Coeff Var Root MSE y Mean 0.938596 9.801480 1.41414 14.4857 Source DF Type I SS Mean Square F Value Pr > F a 1 3.04761905 3.04761905 11.5 0.046 b 1 68.6666667 68.6666667 34.13 0.0100 a*b 10.40000000 0.40000000 0.0 0.6850 Source DF Type III SS Mean Square F Value Pr > F a 1 10.00000000 10.00000000 5.00 0.1114 b 167.60000000 67.60000000 33.80 0.0101 a*b 10.40000000 0.40000000 0.0 0.6850 9 30 Ylin taulukko kertoo, että solukeskiarvot poikkeavat tilastollisesti merkitsevästi toisistaan. Type III tulosten perusteella yhdysvaikutuksella eikä faktorin A päävaikutuksella (main effect)ole tilastolliesti merkitsevää vaikutusta keskiarvoihin. Type I neliösummien perusteella faktorin A tilastollinen merkitsevyys on 5%:n rajoilla. Ainoa tilastollisesti merkitsevä tekijä on faktori B, eli keskiarvoit poikkeavat tilastollisesti merkitsevästi vain B:n luokissa. 5.3 Yleinen faktorikoe Kahden faktorin koe yleistyy ottamalla mukaan uesampia faktoreita: Faktori A, a tasoa; faktori B, b tasoa, faktori C, c tasoa, jne. Balansoidussa yleisessä faktorikokeessa on n toistoa jokaisessa solussa. Täten havaintojen kokonaismäärä esimerkiksi kolmen faktorin kokeessa on N = abcn kappaletta. 31 3

Kolmen faktorin koe: Varianssitaulu: Tilastollinen malli (30) y ijkl = μ + τ i + β j + γ k +(τβ) ij +(τγ) ik +(βγ) jk +(τβγ) ijk + ε ijkl, jossa ensimmäisen asteen termit τ i, β j ja γ k ovat päävaikutustermejä (main effects), (τβ) ij, (τγ) ik ja (βγ) jk ovat toisen asteen yhdysvaikutustermejä (second order interaction) ja Source SS df MS F A SS A a 1 MS A F = MSA B SS B b 1 MS A F = MSB C SS C c 1 MS C F = MSC AB SS AB (a 1)(b 1) MS AB F = MSAB AC SS AC (a 1)(c 1) MS AC F = MSAC BC SS BC (b 1)(c 1) MS BC F = MSBC ABC SS ABC (a 1)(b 1)(c 1) MS ABC F = MSABC Error SS A abc(n 1) MS err Total SS A abcn 1 (τβγ) ijk muodostaa kolmannen asteen (third order term) termin, i =1,...,a, j =1,...,b, k =1,...,c ja l =1,...,n. 33 34 Esimerkki 5.7: Virkistysjuomapullojen täyttöaste. Kontrolloitavat tekijät: A hiilihapon määrä (prosentteina), B täyttöpaine, C nopeus (pulloja minuutissa). y poikkeama tavoitetäyttöasteesta. Toistoja n =. 1-1 -1 1 ================================================================ Tayttopaine (B) ----------------------------------------------- 5 psi 30 psi ---------------------- ---------------------- liukuhihnan nopeus (C) liukuhihnan nopeus (C) ---------------------- ---------------------- Hiilihappo (A) 00 50 00 50 ---------------------------------------------------------------- 0-3 -10 0 1 1 0 6 1 1 3 5 1 4 5 7 7 1 0 4 6 9 1 ================================================================ SAS proc glm options ls = 80; data softdrink; input A B C y @@; label A = "Percentage of carbonation" B = "Operating pressure" C = "Line speed"; datalines; 10 5 00-3 10 5 50-1 10 30 00-1 10 30 50 1 10 5 00-1 10 5 50 0 10 30 00 0 10 30 50 1 1 5 00 0 1 5 50 1 30 00 1 30 50 6 1 5 00 1 1 5 50 1 1 30 00 3 1 30 50 5 14 5 00 5 14 5 50 7 14 30 00 7 14 30 50 10 14 5 00 4 14 5 50 6 14 30 00 9 14 30 50 11 ; proc glm data = softdrink; class A B C; model y = A B C; 35 36

SAS tulokset Class Level Information Class Levels Values A 3 1 0 4 B 5 30 C 00 50 Number of Observations 4 The GLM Procedure Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr > F Model 11 38.150000 9.895455 4.11 <.0001 Error 1 8.5000000 0.7083333 Total 3 336.650000 Käytännöllisesti katsoen päävaikutukset ovat vain tilastollisesti merkitseviä. F -testisuureen perusteella hiilihapon (A) määrällä näyttäisi olevan suurin vaikutus. Tämä näkyy myös havaintoaineistosta. Graafinen esitys valaisee tilannetta. Average fill deviation 8 6 4 0 Carbonation effect on fill deviation Average fill deviation 8 6 4 0 Operating pressure effect on fill deviation R-Square Coeff Var Root MSE y Mean 0.974749 6.9301 0.84165 3.15000-10 1 14 Fill deviation -0.5.5 7.4 Percent carbonation (A) - 5 psi 30 psi Fill deviation 1.75 4.5 Operating pressure (B) Source DF Type III SS Mean Square F Value Pr > F A 5.7500000 16.3750000 178.41 <.0001 B 145.3750000 45.3750000 64.06 <.0001 A*B 5.500000.650000 3.710.0558 C 1.0416667.0416667 31.1 0.0001 A*C 0.5833333 0.916667 0.41 0.6715 B*C 1 1.0416667 1.0416667 1.47 0.486 A*B*C 1.0833333 0.5416667 0.76 0.4869 Average fill deviation 8 6 4 0 Line speed effect on fill deviation - 00 50 Fill deviation.17 4.08 Line speed (C) 37 38 5.4 Lohkominen faktorikoeissa Tähän astisissa kokeissa on toteutettu täysi satunnaistaminen. Joskus on huomioitavia taustatekijät joita ei voida kontrolloida (nuisance factors). Tällöin turvaudutaan lohkomiseen (blocking) ja satunnaistaminen toteutetaan lohkojen sisällä. Olkoon faktorit A ja B ja lohkot siten, että kussakin lohkossa on mahdollista tehdä ab koetta. Jos lohkoja (esim. raaka-aine-eriä) on n kappaletta, havaintojen kokonaismäärä onn = abn ja tilastollinen malli on muotoa (31) y ijk = μ + τ i + β j +(τβ) ij + δ k + ε ijk. jossa δ k on lohkon k vaikutus. Huom. 5.5: Lohkot muodostavat tässä tekijän C, joten virhetermiin absorboituu yhdysvaikutusterimt (τδ) ik, (βδ) jk ja (τβδ) ijk. Huom. 5.6: Samalla periaatteella voidaan soveltaa (yleisiä) latinalaisia neliöitä useampien lohkomuuttujien tapauksissa. 39 40