Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)



Samankaltaiset tiedostot
9.1 Hierarkiset asetelmat (Nested Designs)

9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

A250A0050 Ekonometrian perusteet Tentti

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Altistusaika 1 kk 2 kk 3 kk

Lohkoasetelmat. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä:

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Osafaktorikokeet. Heliövaara 1

Vastepintamenetelmä. Heliövaara 1

2. Keskiarvojen vartailua

Perusnäkymä yksisuuntaiseen ANOVAaan

Toimittaja Erä

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Lohkoasetelmat. Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Vastepintamenetelmä. Kuusinen/Heliövaara 1

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1


Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Sovellettu todennäköisyyslaskenta B

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Kertausluento. Vilkkumaa / Kuusinen 1

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Mat Tilastollisen analyysin perusteet, kevät 2007

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i p X ip + u i

2 2 -faktorikokeen määritelmä

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

Harjoitus 7: NCSS - Tilastollinen analyysi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Otanta-aineistojen analyysi

nopeasti täydessä toteutuksessa (complete replicate).

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Mat Tilastollisen analyysin perusteet, kevät 2007

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Regressioanalyysi. Kuusinen/Heliövaara 1

Tilastotieteen jatkokurssi syksy 2003 Välikoe

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

Testit laatueroasteikollisille muuttujille

Terra Preta kasvatuskoe Pilkon pellolla

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Transkriptio:

9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa sanotaan sisäkkäiseksi tai hierarkiseksi (nested,hierarchical). Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) Kaksitasoisessa hierarkiseissa asetelmassa on kaksi faktoria A ja B,jossa B : n tasot ovat hierarkisesti A:n tasojen sisällä. Esimerkki 9.1: Oletetaan että yhtiöllä on kolme raakaainetoimittajaa (faktori A). Halutaan tutkia onko kunkin toimittajan raaka-aine puhtaudeltaan samanveroista. Jokaiselta toimittajalta tilataan neljä raaka-aine-erää (faktori B) ja jokaisesta erästä otetaan kolme näytettä (toistot n = 3) puhtaustestiä varten. 1 2

Asetelma on seuraavanlainen: Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 Hav. y 111 y 121 y 131 y 141 y 112 y 122 y 132 y 142 y 211 y 221 y 231 y 241 y 212 y 222 y 232 y 242 y 311 y 321 y 331 y 341 y 312 y 322 y 332 y 342 Huom. 9.1: Esimerkissä 9.1 erien (faktori B) numerointi 1 4 kunkin toimittajan (faktori A) kohdalla on vain sopimuskysymys. Yhtä hyvin ne voisivat olla toimittajalla 1: 1 4 toimittajalla 2: 5 8 ja toimittajalla 3: 9 12. Huom. 9.2: Aina ei ole itsestään selvää onko tietty koe hierarkinen vai ei. Kuitenkin periaatteena voidaan pitää,että jos faktorin tasot voidaan numeroida y 113 y 123 y 133 y 143 y 213 y 223 y 233 y 243 y 313 y 323 y 333 y 343 Figure 9.1: Two-stage nested design. Erityisesti havaitaan,että eri toimittajien erät eivät ole missään tekemisissä muiden toimittajien erien kanssa. Toimittajan 1 erällä 1 ei ole mitään tekemistä toimittajan 2 erän1kanssa,jne. 3 4

Tilastollinen Malli Jos tekijä B on hierarkinen (nested) A:han nähden,niin A ja B välillä ei voi olla interaktiota,sillä kukinb:n taso (arvo,luokka) on sidoksissa vain tiettyyn A:n tasoon (arvoon, luokkaan). Täten siis B luokka on A:sta riippuvainen (A:n funkiot). Kasksiasteisen hierarkisen asetelman tilastollinen malli on muotoa (1) y ijk = μ + τ i + β j(i) + ε (ij)k, i =1,...,a (= tekijän A tasot), j =1,...,b (= tekijän B tasot) ja k =1,...,n (= toistot), (2) ε (ij)k NID(0,σ 2 ). Alaindeksi j(i) osoittaa,että tekijän B luokka j: on tekijän A luokassa i (hierarkisuus). Alaindeksi (ij)k puolestaan viittaa toistoon k tekijöiden A ja B käsittelykombinaation ij sisällä. Yhdysvaikutusta (τβ) ij ei ole. 5 6

Jos tekijät A ja B ovat kiinteitä (ei-satunnaisia) (fixed effects), ja a i=1 b j=1 τ i =0 β j(i) =0. Jos A ja B ovat satunnaistekijöitä (random effects), (3) τ i N(0,σ 2 τ ) ja (4) β j(i) N(0,σ 2 β ). Asetelmaa,jossa B:n luokkia on kussakin A:n luokassa sama määrä ja toistojen n määrä on sama,sanotaan tasapainotetuksi hierarkiseksi asetelmaksi (balanced nested design). Neliösummahajotelma: (5) a b i=1 j=1 k=1 n (y ijk y... ) 2 = bn +n + a ( y i.. y... ) 2 i=1 a i=1 j=1 a b i=1 j=1 k=1 b ( y ij. y i.. ) 2 n (y ijk y ij. ) 2 eli (6) SS T = SS A + SS B(A) + SS E, 7 8

jossa (7) SS T = a b n (y ijk y... ) 2, i=1 j=1 k=1 a (8) SS A = bn ( y i.. y... ) 2, (9) SS B(A) = n ja i=1 a b i=1 j=1 ( y ij. y i.. ) 2 Varianssitaulu: Source SS df MS A SS A a 1 MS A BwithinA SS B(A) a(b 1) MS B(A) Error SS E ab(n 1) MS E Total SS T abn 1 (11) MS A = SS A (a 1), (10) SS E = a b n (y ijk y ij. ) 2. i=1 j=1 k=1 (12) MS B(A) = SS B(A) a(b 1), (13) SS E = SS E ab(n 1). Huom. 9.3: Testisuureet määräytyvät sen mukaan ovatko tekijät kiinteitä vai satunnaisia. 9 10

(a) Molemmat tekijät A ja B kiinteitä (fixed effects model): (b) Tekijät satunnaismuuttujia (random effects model [variance component model]): Hypoteesi: (14) H 0 : τ i = 0 kaikilla i =1,...,a. Testisuure: (15) F = MS A. MS E Hypoteesi: (16) H 0 : β j(i) = 0 kaikilla j =1,...,b,i=1,...,a. Testisuure: (17) F = MS B(A) MS E. Hypoteesi: (18) H 0 : σ 2 τ =0. Testisuure: (19) F = MS A. MS B(A) Hypoteesi: (20) H 0 : σ 2 β =0. Testisuure: (21) F = MS B(A) MS E. 11 12

(c) A kiinteä jab satunnaistekijä (mixed model): Sekatapauksessa,jossa A kiinteä jab satunnainen,testattavat hypoteesit ovat (14) ja (20). Hypoteesin (14) testisuure: (22) F = MS A MS B(A). Hypoteesin (20) testisuure: (23) F = MS B(A) MS E Esimerkki 9.2: Tarkastellaan kolmella menetelmällä valmistetun polttoaineen palamisominaisuuksia. Valitaan satunnaisesti neljä näyte-erää kustakin valmistusmenetelmästä jatehdään kolme palamiskoetta kustakin näytteestä. Kysymyksessä on siis sekamalli. =========================================================== Tyotantoprosessi (A) ------------------------------------------------- 1 2 3 ------------- ------------- ------------- Era(B) 1 2 3 4 1 2 3 4 1 2 3 4 ----------------------------------------------------------- 25 19 15 15 19 23 18 35 14 35 38 25 30 28 17 16 17 24 21 27 15 21 54 29 26 20 14 13 14 21 17 25 20 24 50 33 =========================================================== 13 14

SAS: Title "Design of Experiments, Example 9.2": options ls = 80; data example92; input A B y @@; label A = "Propellant manufacturing process" B = "Batch within process" y = "Propellant burning rate"; datalines; 1 1 25 1 2 19 1 3 15 1 4 15 2 1 19 2 2 23 2 3 18 2 4 35 3 1 14 3 2 35 3 3 38 3 4 25 1 1 30 1 2 28 1 3 17 1 4 16 2 1 17 2 2 24 2 3 21 2 4 27 3 1 15 3 2 21 3 3 54 3 4 29 1 1 26 1 2 20 1 3 14 1 4 13 2 1 14 2 2 21 2 3 17 2 4 25 3 1 20 3 2 24 3 3 50 3 4 33 ; run; proc glm data = example92; Title "Nested Random Effects Model"; class A B; model y = A B(A); random B(A) /test; run; quit; Tulokset: Source A B(A) The GLM Procedure Type III Expected Mean Square Var(Error) + 3 Var(B(A)) + Q(A) Var(Error) + 3 Var(B(A)) Source DF Type III SS Mean Square F Value Pr > F A 2 676.055556 338.027778 1.46 0.2815 Error: MS(B(A)) 9 2077.583333 230.842593 Source DF Type III SS Mean Square F Value Pr > F B(A) 9 2077.583333 230.842593 12.20 <.0001 Error: MS(Error) 24 454.000000 18.916667 Tekijän A vaikutus ei ole tilastollisesti merkitsevä. Tekijä B on tilstollisesti merkitsevä. Täten tuotantoprosessilla ei näytä olevan vaikutusta palamiseen. Sen sijaan näyte-erien välillä oneroa. Tuotannon optimoinnissa tulisi tten vaatia toimittajilta tasalaatuisempaa raaka-ainetta. 15 16

Huom 9.1: Kiinteän tekijän mallissa parametrien estimaatit ovat (24) ˆτ i = y i.. y.. ja (25) ˆβ j(i) = y ij. y i... Huom 9.2: Satunnaistekijän mallissa (random effects model),saadaan varianssit στ 2 ja σ2 β estimoitua kaavoilla Esimerkki 9.3: Esimerkissä 9.2 on sekamalli. Vaikutusten estimaatit ovat kaavojen (24) ja (27) mukaisesti ja ˆτ 1 =19.83 23.8 = 3.97, ˆτ 2 =21.75 23.8 = 2.05, ˆσ 2 β ˆτ 3 =29.83 23.8 =6.03 = 230.84 18.92 3 70.64 (26) ˆσ 2 τ = MS A MS B(A) bn ja (27) ˆσ 2 β = MS B(A) MS E n Huom. 9.3: Virhetermin ε (ij)k varianssin σ 2 estimaattori on (28) ˆσ 2 = MS E = SS E ab(n 1). Huom 9.4: Usein hierariksiset asetelmissa malli on niin sanottu sekamalli (mixed model),jossa tekijä A on kiinteä jab satunnaismuuttuja. 17 18

Yleinen m-tason hierarkinen asetelma (The general m-stage nested design) Kaksitasoinen malli yleistyy suoraviivaisesti useampitasoiseksi. Esimerkki 9.4: Oletetaan esimerkiksi,että valimossa tutkitaan kahden eri valutavan kovuutta. Tilastollinen malli yleiselle kolmitasoiselle asetelmalle (tekijät A, B ja C) on (29) y ijkl = μ + τ i + β j(i) + γ k(ij) + ε (ijk)l i =1,...,a, j =1,...,b, k =1,...,c ja l =1,...,n (n = toistojen lukumäärä). Neliösummajajotelma: Valu voi tapahtua kolmessa lämpötilassa. (30) SS T = SS A + SS B(A) + SS C(B) + SS E. Valitaan kaksi valutuotetta satunnaisesti kustakin lämpötilavaihtoehdosta joista mitataan kovuudet. Näin syntyy kolme tasoa: valutavat (2 kappaletta), lämpötila (3 vaihtoehtoa) ja lopputuotteet (2 kappaletta kussakin lämötilassa tuotetusta valutuotteesta). Tässä on siis kolmitasoisnen hierarkinen asetelma. 19 20

jossa (31) SS T = (y ijkl y... ) 2, i j k l a (32) SS A = bcn (y i... y... ) 2, i=1 a b (33) SS B(A) = cn ( y ij.. y i... ) 2, i=1 j=1 a b c (34) SS B(C) = n ( y ijk. y ij.. ) 2 i=1 j=1 k=1 Varianssitaulu: Source SS df MS A SS A a 1 MS A B(within A) SS B(A) a(b 1) MS B(A) C(within B) SS C(B) ab(n 1) MS C(B) Error SS E abc(n 1) MS E Total SS T jossa keskineliösummat (MS) saadaan jakamalla vastaava neliösumma (SS) vapausasteilla (df). (35) SS E = i (y ijkl y ijk. ) 2. j k l 21 22

Hierarkiset faktoriasetelmat (Designs with both nested and factorial factors) Kun osa faktoreista on faktorikokeen mukaisia (ei-hierarkisia) ja osa hierarkisia,sanotaan asetelmaa hierarkiseksi faktoriasetelmaksi (nestedfactorial design). Esimerkki 9.5: Piirilevylle aseteltavien elektronisten komponenttien käsinladontaprosessia halutaan parantaa. Vaihtoehtoina on kaksi erilaista kokoamislinjaa ja kolme erilaista kokoamiseen tarvittavaa laitteistoa. Käytännön syistä (tutantolinjat eri tehdasrakennuksissa) valitaan satunnaisesti neljä kokoajaa kumpaankin tuotantolinjaan,(eli yhteensä kahdeksan). Kuitenkin esimerkiksi tuotantolinjalle 1 valitut työntekijät kokoavat testissä kaikilla laitekokoonpanoilla (satunnaistetussa järjestyksessä). 23 24

Kokoamiseen menevä aika(y) mitataan sekunteina. Faktorit: A: Laitteisto (1,2,3) B: Kokoamislinja (1,2) C: Kokoaja (1,2,3,4). Toistoja tehdään kaksi (n =2). Tekijä C (kokoajat) on hierarkinen tuotantolinjan (B) suhteen. Tekijät A (laitteisto) ja B (tuotantolinja) eivät ole hierarkinen minkään faktorin suhteen,suhteen,sillä kaikkia laitekokoonpanoja testataan molemmilla linjoilla ja kaikki kokoajat operoivat jokaisella laitteella. Havaintoainisto: =============================================== layout/ tuotantolinja (B) ---------------------------------- Linja 1 Linja 2 Operator/ 1 2 3 4 1 2 3 4 kokoaja (C) ----------------------------------------------- fixture/ laitteisto (A) Laitteisto 1 22 23 28 25 26 27 28 24 24 24 29 23 28 25 25 23 Laitteisto 2 30 29 30 27 29 30 24 28 27 28 32 25 28 27 23 30 Laitteisto 3 25 24 27 26 27 26 24 28 21 22 25 23 25 24 27 27 =============================================== 25 26

Tilastollinen malli: (36) y ijkl = μ + τ i + β j + γ k(j) +(τβ) ij +(τγ) ik(j) + ε (ijk)l, jossa τ i on tekijän A (laitteisto) vaikutus (i =1, 2, 3), β j on tekijän B (tuotantolinja) vaikutus (j =1, 2), γ k(j) tekijän C (kokoaja) vaikutus tekijän B (tuotantolinja) tasolla j, (τβ) ij on ei-hierarkisten tekijöiden A ja B yhdysvaikutus ja (τγ) ik(j) on AC (kokoaja laitteisto) yhdysvaikutus,tekijän B (tuotantolinja) tasolla j. SAS-toteutus: options ls = 80; Title "Esimerkki 9.5: Hierarkinen kolmen faktorin sekamalli"; data example95; input layout fixture operator time @@; datalines; 1 1 1 22 1 1 2 23 1 1 3 28 1 1 4 25 1 1 1 24 1 1 2 24 1 1 3 29 1 1 4 23 1 2 1 30 1 2 2 29 1 2 3 30 1 2 4 27 1 2 1 27 1 2 2 28 1 2 3 32 1 2 4 25 1 3 1 25 1 3 2 24 1 3 3 27 1 3 4 26 1 3 1 21 1 3 2 22 1 3 3 25 1 3 4 23 2 1 1 26 2 1 2 27 2 1 3 28 2 1 4 24 2 1 1 28 2 1 2 25 2 1 3 25 2 1 4 23 2 2 1 29 2 2 2 30 2 2 3 24 2 2 4 28 2 2 1 28 2 2 2 27 2 2 3 23 2 2 4 30 2 3 1 27 2 3 2 26 2 3 3 24 2 3 4 28 2 3 1 25 2 3 2 24 2 3 3 27 2 3 4 27 ; run; proc glm data = example95; Title2 "Piirilevyn valmistusmenetlmat"; class layout fixture operator; model time = layout fixture operator(layout) layout*fixture fixture*operator(layout); random operator(layout) fixture*operator(layout) / test; run; quit; 27 28

Dependent Variable: time Source DF Type III SS Mean Square F Value Pr > F layout 1 4.083333 4.083333 0.34 0.5807 Error 6 71.916667 11.986111 Error: MS(operator(layout)) Source DF Type III SS Mean Square F Value Pr > F fixture 2 82.791667 41.395833 7.55 0.0076 operator(layout) 6 71.916667 11.986111 2.18 0.1174 layout*fixture 2 19.041667 9.520833 1.74 0.2178 Error 12 65.833333 5.486111 Error: MS(fixtu*operat(layout)) Source DF Type III SS Mean Square F Value Pr > F fixtu*oper(layout) 12 65.833333 5.486111 2.35 0.0360 Error: MS(Error) 24 56.000000 2.333333 Tuotantolinjalla (layout) ei ole vaikutusta eikä kokoajalla (operator). Sen sijaan laitteistolla (fixture) ja laitteiston ja kokoajan yhdysvaikutus tuotantolinjan sisällä on tilastollisesti merkitsevä vaikutus. Täten eri laitteistot näyttävät vaikuttavan eri tavoin kokoajien suoriutumiseen tehtävästä. 9.2 Osapalsta-asetelma (The Split-Plot Design) Joissakin useamman tekijän asetelmissa (useampisuuntaisessa varianssianalyysissa) ei ole mahdollista satunnaistaa toistoja täydellisesti. Esimerkki 9.6: Tutkitaan sellun valmistusprosessin vaikutusta paperin vetolujuuteen (y). Koetta varten päätetään valmistaa sellua kolmella eri menetelmällä (puun määrä seoksessa,faktori A) neljässä eri keittolämpötilassa (faktori B): ( o C) 90,110,130 ja 150. Kysymyksessä on siis 3 4 kahden tekijän koeasetelma (kaksisuuntainen varianssianalyysi),jossa on 12 käsittelykombinaatiota. Tarkastelemalla yksittäisiä keskiarvoja,saadaan selville koonpano,jolla suoriutumisaika on lyhin. 29 30

Toistoja tehdään kolme per käsittelykombinaatio. Päivässä ehditään tehdä 12 koetta. Niinpä päätetään toteuttaa yksi täysi koe jokaisena seuraavana kolmena päivänä. Päivät muodostavat täten periaatteessa lohkotekijän (toistot eivät ole satunnaistettavissa päivien yli). Kunakin päivänä koe toteutetaan seuraavasti: Tehdään ensin erä selluraaka-ainetta tietyllä mentelmällä (järjestys päivän sisällä voidaan satunnaistaa),jaetaan erä neljään osaan ja keitetään niistä lopulliset selluerät eri lämpötilassa. Näin saadaan kunakin päivänä 12 selluerää,yksi kullakin valmistustavalla (menetelmä/lämpötila). 31 32

Tilanne näyttää lohkokeelta,jossa päivät muodostavat lohkon. Kuitenkin päivän sisällä ei tapahdu täydellistä satunnaistamista,sillä käytännön syistä valmistetaan kerrallaan yhdellä valmistusmenetelmällä erä,jaetaan se neljään osaan yksi kutakin lämpötilavaihtoehtoa varten. Täydellinen satunnaistaminen vaatisi satunnaistamisen valmistusmentelmä-lämpötila kombinaatioiden eli kaikkien 12:n käsittely-yhdistelmän yli,mikä käytännön toteutuksena olisi liian hankala. Data: ============================================================== Toisto 1 Toisto 2 Toisto 3 (lohko) (lohko) (lohko) Valmistusmenetelma (A) 1 2 3 1 2 3 1 2 3 -------------------------------------------------------------- Lampotila (Factor B) 90 30 34 29 28 31 31 31 35 32 110 35 41 26 32 36 30 37 40 34 130 37 38 33 40 42 32 41 39 39 150 36 42 36 41 40 40 40 44 45 ============================================================== Tällä tavoin toteutettu koe on esimerkki ns. osapalsta (split-plot) asetelmasta,jossa jokainen lohko (päivä) jaetaan kolmeen osaan (pääpalstaan,main plots),jotka muodostuvat valmistusmenetelmistä ja joiden toteutusjärjestys voidaan satunnaistaa. Pääpalstan mukaisia käsittelyjä sanotaan pääkäsittelyiksi (main plots,main treatments). 33 34

Jokainen pääpalsta (main plot) jaetaan osapalstaan (subplot,split-plot). Yllä nämä muodostuvat lämpötiloista (voidaan myös toteuttaa satunnaisessa järjestyksessä). Näitä vastaavia käsittelyjä sanotaan alikäsittelyiksi (subplot treatments). Split-lot asetelman tilastollinen malli: (37) y ijk = μ + τ i + β j +(τβ) ij + γ k +(τγ) ik +(βγ) jk +(τβγ) ijk + ε ijk i =1,...,r, j =1,...,a, k =1,...,b,jossa τ i, β j ja (τβ) ij liittyvät pääpalstaan (main plot), edustaen lohkovaikutusta τ i,pääkäsittelyn A vaikutusta β j ja koko palstan virhetermiin (τβ) ij (whole plot error) (= lohko A). γ k,(τγ) ik,(βγ) jk ja (τβγ) ijk liittyvät alipalstaan (subplot); alipalstan käsittelyn B (subplot treatment) vaikutus γ k,lohko B vaikutus (τγ) ik, AB yhdysvaikus (βγ) jk ja alipalstan virhetermi (lohko AB) (τβγ) ijk. 35 36

Huom 9.5: Split-plot asetelmassa perusajatuksena on, että varsinaisilla faktoreilla ja lohko tekijällä ei ole yhdysvaikutusta. Täten niihin liittyvä vaihtely on virhevaihtelua,jota voidaan käyttää varsinaisten faktoreiden vaikutustan F -testeissä. Koeasetelman neliösummat lasketaan samalla tavalla kuin kolmisuuntaisessa (kolmen tekijän) varianssianalyysissa,jossa on vain yksi toisto (täten virhevarianssi ei ole estimoitavissa). Esimerkki 9.7: Paperikuidun vetolujuuden SAS-toteutus: data example96; * input R A B y @@; label R = "Replicate (toisto), Block factor" A = "Pulp preparation method (valmistusmenetelma)" B = "Temperateure (lampotila)"; do B = 90 to 150 by 20; do R = 1 to 3; do A = 1 to 3; input y @@; output; end; end; end; datalines; 30 34 29 28 31 31 31 35 32 35 41 26 32 36 30 37 40 34 37 38 33 40 42 32 41 39 39 36 42 36 41 40 40 40 44 45 ; run; 37 38

proc glm data = example96; Title2 "Pulp tensile"; class R A B; model y = R A R*A B R*B A*B R*A*B /ss3; Random R; test h = A e = R*A; test h = B e = R*B; test h = A*B e = R*A*B; run; quit; Split-Plot example Pulp tensile The GLM Procedure Class Level Information Class Levels Values R 3 1 2 3 A 3 1 2 3 B 4 90 110 130 150 Number of Observations Read 36 Number of Observations Used 36 Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr > F Model 35 822.9722222 23.5134921.. Error 0 0.0000000. Total 35 822.9722222 R-Square Coeff Var Root MSE y Mean 1.000000.. 36.02778 Source DF Type III SS Mean Square F Value Pr > F R 2 77.5555556 38.7777778.. A 2 128.3888889 64.1944444.. R*A 4 36.2777778 9.0694444.. B 3 434.0833333 144.6944444.. R*B 6 20.6666667 3.4444444.. A*B 6 75.1666667 12.5277778.. R*A*B 12 50.8333333 4.2361111.. 39 40

Source R A R*A B R*B A*B R*A*B Type III Expected Mean Square Var(Error) + 12 Var(R) + Q(R*A,R*B,R*A*B) Var(Error) + Q(A,R*A,A*B,R*A*B) Var(Error) + Q(R*A,R*A*B) Var(Error) + Q(B,R*B,A*B,R*A*B) Var(Error) + Q(R*B,R*A*B) Var(Error) + Q(A*B,R*A*B) Var(Error) + Q(R*A*B) Tests of Hypotheses Using the Type III MS for R*A as an Error Term Source DF Type III SS Mean Square F Value Pr > F A 2 128.3888889 64.1944444 7.08 0.0485 Tests of Hypotheses Using the Type III MS for R*B as an Error Term Source DF Type III SS Mean Square F Value Pr > F B 3 434.0833333 144.6944444 42.01 0.0002 Tests of Hypotheses Using the Type III MS for R*A*B as an Error Term Source DF Type III SS Mean Square F Value Pr > F A*B 6 75.16666667 12.52777778 2.96 0.0520 Havaitaan,että vetolujuuteen vaikuttaa ensisijaisesti lämpötila (faktori B). Myös valmistusmenetelmä (faktori A) on 5 prosentin tasolla tilastollisesti merkitsevä (kuitenkin rajalla),samoin yhdysvaikutus (AB) on rajalla. Lämpötilaluokissa laskettujen keskiarvojen perusteella vetolujuus näyttää kasvavan paperissa sen mukaan mitä korkeammassa läpötilassa sellu on keitetty. 41 42