Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1



Samankaltaiset tiedostot
Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Vastepintamenetelmä. Heliövaara 1

Altistusaika 1 kk 2 kk 3 kk

Hierarkkiset koeasetelmat. Heliövaara 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

2 2 -faktorikokeen määritelmä

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Testejä suhdeasteikollisille muuttujille

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Lohkoasetelmat. Heliövaara 1

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Kertausluento. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1


Regressioanalyysi. Vilkkumaa / Kuusinen 1

Testit järjestysasteikollisille muuttujille

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Regressioanalyysi. Kuusinen/Heliövaara 1

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Perusnäkymä yksisuuntaiseen ANOVAaan

Mat Tilastollisen analyysin perusteet, kevät 2007

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

9.1 Hierarkiset asetelmat (Nested Designs)

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Väliestimointi (jatkoa) Heliövaara 1

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Harjoitus 9: Excel - Tilastollinen analyysi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Osa 2: Otokset, otosjakaumat ja estimointi

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Mat Tilastollisen analyysin perusteet, kevät 2007

Otoskoko 107 kpl. a) 27 b) 2654

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Johdatus regressioanalyysiin. Heliövaara 1

Testit laatueroasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Frequencies. Frequency Table

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Sovellettu todennäköisyyslaskenta B

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i p X ip + u i

Estimointi. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Sovellettu todennäköisyyslaskenta B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Transkriptio:

Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Hierarkkiset koeasetelmat -faktorikokeet Vastepintamenetelmä Aritmeettinen keskiarvo, Estimaatti, Estimaattori, -testi, aktorikokeet, Gradienttimenetelmä, Hierarkkiset koeasetelmat, Interaktio, Jäännösneliösumma, Kaarevuus, Kaksisuuntainen varianssianalyysi, Keskiarvo-diagrammi, Kokonaisvaihtelu, Kolmisuuntainen varianssianalyysi, Kvantitatiivinen muuttuja, Optimointi, Päävaikutus, Reunakeskiarvo, Ryhmien sisäinen vaihtelu, Ryhmien välinen vaihtelu, Ryhmä, Ryhmäkeskiarvo, Vapausaste, Varianssi, Varianssianalyysi, Varianssianalyysihajotelma, Vastepinta, Vastepintamenetelmät, Yhteisvaihtelu, Yleiskeskiarvo 0.. Tehdas ostaa tarvitsemaansa raaka-ainetta erinä kolmelta raaka-aineen toimittajalta. Raakaaineen puhtaus vaihtelee jonkin verran, mikä aiheuttaa tehtaan tuotantoprosessissa ongelmia. Tehdas haluaa selvittää onko eri toimittajilta ostettujen raaka-aineiden keskimääräisissä puhtauksissa systemaattista eroa. Tätä varten jokaisen raaka-aineen toimittajan toimittamista raaka-aine-eristä valittiin satunnaisesti 4 erää tutkittavaksi ja jokaisesta erästä tutkittiin kolme näytettä. Tulokset on annettu alla olevassa taulukossa (yksikkö: puhtaus % 93). Puhtaus % 93 Toimittaja 3 Erä 3 4 3 4 3 4 0 0 3 3 0 4 4 0 3 4 0 0 4 0 3 0 Teoriaa: Tutki onko raaka-aineen toimittajien toimittamien erien keskimääräisessä puhtaudessa eroa. Tehtävän koeasetelmana on kaksiasteinen hierarkkinen koeasetelma. Oletetaan, että kokeen tavoitteena on tutkia, miten käsittelyt ja A, A,, A I B (i), B (i),, B J(i), i =,,, I vaikuttavat kiinnostuksen kohteena olevan vastemuuttujan y keskimääräisiin arvoihin tilanteessa, jossa käsittelyt B j(), B j(),, B j(i ) ovat samankaltaisia, mutta eivät identtisiä käsittelyille A, A,, A I, j =,,, J. Tällöin sanomme, että koeasetelma on hierarkkinen ja käsittelyt B (i), B (i),, B J(i) ovat alisteisia käsittelylle A i, i =,,, I. TKK @ Ilkka Mellin (005) /84

Kaksiasteista hierarkkista koeasetelmaa voidaan kuvata alla olevalla kaaviolla: A A A I B () B () B J() B () B () B J() B (I) B J(I) B (I) Kaksiasteisen hierarkkisen koeasetelman tilastollinen malli ja sen parametrointi Kaksiasteisen hierarkkisen koeasetelman tilastollinen malli on tässä seuraavaa muotoa: y kij = µ + α i + β j () i + ε( ij ) k k =,,, K, i =,,, I, j =,,, J jossa jäännöstermi ε ( ij) k N(0, σ ) k =,,, K, i =,,, I, j =,,, J Koska tehtävän tapauksessa tekijä A on kiinteä ja tekijä B on satunnainen, oletamme, että I i= β α = 0, i =,,, I ji () i N(0, σ ), i =,,, I, j =,,, J β Kaksiasteisen hierarkkisen koeasetelman nollahypoteesit Käsittelyiden vaikutusta koskevat nollahypoteesit ovat muotoa ja H A : Ei A-vaikutusta H B(A) : Ei B-vaikutusta tekijän A sisällä Koska tehtävän tapauksessa tekijää A voidaan pitää tässä kiinteänä ja tekijää B satunnaisena, Nollahypoteesit H A ja H B(A) voidaan ilmaista mallin parametrien avulla seuraavissa muodoissa: H A : α = α = = α I = 0 H B(A) : σ = 0 β TKK @ Ilkka Mellin (005) /84

Keskiarvot Havaintoarvojen y kij ryhmäkeskiarvo ryhmässä j(i), jossa tekijän B taso j on alisteinen tekijän A tasolle i: K yi = y, i =,,, I, j =,,, J ij K k = kij Havaintoarvojen y kij reunakeskiarvo kaikista havainnoista, jotka ovat alisteisia tekijän A tasolle i: J K J y = y = y, i =,,, I ii i i kij ij JK j= k= J j= Jos havainnot yhdistetään yhdeksi otokseksi, yhdistetyn otoksen havaintoarvojen yleis- eli kokonaiskeskiarvo on jossa I J K I J I y = y = y = iii kij iij iii IJK i= j= k= IJ i= j= I i= IJK = N on yhdistetyn otoksen havaintojen kokonaislukumäärä. y Varianssianalyysihajotelma Testit hypoteeseille H A ja H B(A) perustuvat varianssianssianalyysihajotelmaan SST = SSA + SSB(A) + SSE Neliösumma I J K kij iii ) y i= j= k= SST = ( y y ) = ( IJK s kuvaa havaintoarvojen kokonaisvaihtelua. Neliösumma I J K I ( iii iii) ( iii iii) i= j= k= i= SSA= y y = JK y y kuvaa tekijän A osuutta havaintojen kokonaisvaihtelusta. Neliösumma I J K I J iij iii iij iii i= j= k= i= j= SSB( A) = ( y y ) = K ( y y ) kuvaa tekijän B vaikutusta tekijän A sisällä. TKK @ Ilkka Mellin (005) 3/84

Neliösumma (jäännösneliösumma) I J K I J ( kij i ij ) ( ) ij i= j= k= i= j= SSE = y y = K s kuvaa havaintojen kokonaisvaihtelua tekijän B tasojen muodostamien ryhmien sisällä. Testisuureet Määritellään -testisuure A I( J ) SSA = I SSB( A) jossa SSA on tekijän A vaikutusta kuvaava neliösumma ja SSB(A) on tekijän B vaikutusta tekijän A sisällä kuvaava neliösumma. Jos nollahypoteesi pätee, niin H A : Ei A-vaikutusta (( I ), I( J )) A Suuret testisuureen A arvot johtavat nollahypoteesin hylkäämiseen. Määritellään -testisuure B( A) IJ ( K ) SSB( A) = I( J ) SSE jossa SSB(A) on tekijän B vaikutusta tekijän A sisällä kuvaava neliösumma ja SSE on jäännösneliösumma. Jos nollahypoteesi pätee, niin H B(A) : Ei B-vaikutusta tekijän A sisällä B( A) ( I( J ), IJ( K )) Suuret testisuureen B(A) arvot johtavat nollahypoteesin hylkäämiseen. Huomautus: Testisuureet ja niiden jakaumat perustuvat oletukseen, että tekijä A on kiinteä, mutta tekijä B on satunnainen. TKK @ Ilkka Mellin (005) 4/84

Hierarkkisen varianssianalyysin testien tulokset ilmaistaan tavallisesti varianssianalyysitaulukon muodossa: Vaihtelun lähde Neliösumma SS Vapausasteet df A SSA I B(A) SSB(A) I(J ) Varianssiestimaattori MS -testisuure SSA MSA MSA = = I MSB ( A ) SSB( A) MSB( A) = I( J ) = MSB( A) MSE Jäännös SSE IJ(K ) MSE = SSE IJ ( K ) Kokonaisvaihtelu SST IJK Varianssianssianalyysitaulukon neliösummat toteuttavat varianssianssianalyysihajotelmaan SST = SSA + SSB(A) + SSE ja neliösummiin liittyvät vapausasteet toteuttavat vastaavan yhtälön IJK = (I ) + I(J ) + IJ(K ) Kaksiasteisen hierarkkisen koeasetelma ja kaksisuuntainen varianssianalyysi Jos tekijöiden A ja B vaikutusta vastemuuttujaan y käsitellään (virheellisesti) samalla tavalla kuten kaksisuuntaisessa varianssianalyysissa, niin saadaan varianssianalyysihajotelma SST = SSA + SSB + SSAB + SSE Neliösummat SST, SSA ja SSE ovat täsmälleen samat kuin hierarkkisessa kaksiasteisessa varianssianalyysissa. Lisäksi pätee jossa SSB(A) = SSB + SSAB I J K J ( ii j iii) ( ii j iii) i= j= k= j= SSB = y y = IK y y on tekijän B (pää-) vaikutusta kuvaava neliösumma ja I J K J K ( iij iii ii j iii) ( iij iii ii j + iii) i= j= k= j= k= SSAB = y y y + y = K y y y y on tekijöiden A ja B interaktiota eli yhdysvaikutusta kuvaava neliösumma. TKK @ Ilkka Mellin (005) 5/84

Näissä kaavoissa I K I y = y = y, j =,,, J ii i j kij ij IK i= k= I i= Neliösummiin SSB(A), SSB ja SSAB liittyvät vapausasteet toteuttavat yhtälön I(J ) = (J ) + (I )(J ) Laskutoimitusten järjestely Jos varianssianalyysihajotelman neliösummat SST, SSA, SSB(A), SSE joudutaan laskemaan käsin tai laskimella, kannattaa laskutoimituksissa käyttää alla esitettäviä kaavoja. Määritellään seuraavat summat: T iij = K k = y kij J K J T = y = T ii i kij iij j= k= j= I J K I J I T = y = T = iii kij iij iii i= j= k= i= j= i= i =,,, I, j =,,, J Tällöin yllä määritellyt keskiarvot saadaan kaavoilla y y y iij ii i iii = Tiij K = Tii i JK = Tiii IJK i =,,, I, j =,,, J Havaintoarvojen kokonaisvaihtelua kuvaava neliösumma voidaan laskea kaavalla SST = y y = y T IJK I J K I J K ( kij iii) kij i= j= k= i= j= k= Tekijän A vaikutusta kuvaava neliösumma voidaan laskea kaavalla SSA = JK y y = T T I I ( iii iii) iii iii i= JK i= IJK Tekijän B vaikutusta tekijän A sisällä kuvaava neliösumma voidaan laskea kaavalla SSB( A) = K ( y y ) == T T Jäännösneliösumma saadaan kaavalla T I J I J I iij iii iij iii i= j= K i= j= JK i= SSE = SST SSA SSB(A) iii TKK @ Ilkka Mellin (005) 6/84

Käsin tai laskimella laskettaessa laskutoimitukset kannattaa järjestää seuraavan taulukon muotoon: A A $ AI B B $ B B B $ B $ B B $ B y y $ y y y $ y $ y y $ y y y $ y y y $ y $ y y $ y % % % % % % % % % yk yk $ ykj yk yk $ ykj $ yki yki $ y T T $ T T T T $ T T $ T T T $ T () () J () () () J() ( I) ( I) J( I) J J I I IJ J J I I IJ i i ij i i ij ii ii iij Summat ii ii ii i K Ti ij = y kij, i =,,, I, j =,,, J k = lasketaan taulukkoon havaintojen sarakesummina. Summat J K J T = y = T, i =,,, I ii i kij i ij j= k= j= lasketaan taulukkoon sarakesummien summina. Havaintojen kokonaissumma saadaan kaavalla Tiii = T I i= iii Lisäksi tarvitaan vain kaikkien havaintojen neliöiden summa I J K i= j= k= y kij KIJ Tehtävän 0.. ratkaisu: Tekijän A tasojen lukumäärä on I = 3 Tekijän B tasojen lukumäärä jokaista tekijän A tasoa kohden on J = 4 Havaintojen lukumäärä jokaisessa tekijän B tason määräämässä ryhmässä on K = 3 Siten havaintojen kokonaislukumäärä on N = IJK = 36 TKK @ Ilkka Mellin (005) 7/84

Neliösummien laskeminen Havaintoarvot on annettu tehtävässä laskutoimitusten kannalta sopivassa taulukkomuodossa. Täydennetään taulukkoa laskemalla siihen sarakesummat K Ti ij = y kij, i =,,, I, j =,,, J k = ja sarakesummien summat: J K J T = y = T, i =,,, I ii i kij i ij j= k= j= y kij A i 3 B j(i) 3 4 3 4 3 4 0 0 3 3 0 4 4 0 3 4 0 0 4 0 3 0 T ij 0 9 5 4 6 3 5 6 0 6 T i 5 4 4 Havaintojen kokonaissumma on I T = T = 5+ 4+ 4= 3 iii i= iii Havaintoarvojen neliöiden kokonaissumma on I J K i= j= k= y kij = 53 Havaintojen kokonaisvaihtelua kuvaava neliösumma on Taulukosta saadaan I J K Tiii 3 SST = ykij = 53 = 48.3056 N 36 I Tii i i= i= j= k= = 37 joten tekijän A vaikutusta kuvaava neliösumma on I Tiii 3 SSA = Tii i = 37 = 5.0556 JK N 4 3 36 i= TKK @ Ilkka Mellin (005) 8/84

Taulukosta saadaan I J Ti i= j= ij = 69 joten tekijän B vaikutusta tekijän A sisällä kuvaava neliösumma on SSB A y T I J I ( ) = iij iii = 69 37 = 69.967 K i= j= JK i= 3 4 3 Varianssianalyysihajotelmasta saadaan jäännösneliösummaksi SSE = SST SSA SSB(A) = 48.3056 5.0556 69.967 = 63.3333 -testisuureiden laskeminen Testisuureen A arvoiksi saadaan: A I( J ) SSA 3 (4 ) 5.0556 = = = 0.969 I SSB( A) 3 69.967 Jos nollahypoteesi H A : Ei A-vaikutusta pätee A ((I ), I(J )) = (, 9) Testisuureen B(A) arvoiksi saadaan: B( A) IJ ( K ) SSB( A) 3 4 (3 ) 69.967 = = =.944 I( J ) SSE 3 (4 ) 63.3333 Jos nollahypoteesi H B(A) : Ei B-vaikutusta tekijän A sisällä pätee B(A) (I(J ), IJ(K )) = (9, 4) Testien tekeminen Olkoon nollahypoteesina H A : Ei A-vaikutusta Testisuureen arvoksi saatiin A = 0.969 Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr( 0.969) = 0.46 TKK @ Ilkka Mellin (005) 9/84

Siten nollahypoteesia H A ei voida hylätä merkitsevyystasolla 0.05. Taulukoiden mukaan jossa Koska Pr( 4.56) = 0.05 ((I ), I(J )) = (, 9) 4.56 > = 0.969 A voimme todeta (kuten edellä), että nollahypoteesia H A ei voida hylätä merkitsevyystasolla 0.05. Olkoon nollahypoteesina H B(A) : Ei B-vaikutusta tekijän A sisällä Testisuureen arvoksi saatiin B( A) =.944 Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr(.944) = 0.07 Siten nollahypoteesi H B(A) voidaan hylätä merkitsevyystasolla 0.05, mutta ei merkitsevyystasolla 0.0. Taulukoiden mukaan jossa Koska Pr(.300) = 0.05 Pr( 3.56) = 0.0 (I(J ), IJ(K )) = (9, 4).300 < = B( A ).944 < 3.56 voimme todeta (kuten edellä), että nollahypoteesi H B(A) voidaan hylätä merkitsevyystasolla 0.05, mutta ei merkitsevyystasolla 0.0. TKK @ Ilkka Mellin (005) 0/84

Testien tulokset voidaan koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A 5.0556 7.578 0.969 0.46 B(A) 69.967 9 7.7685.944 0.07 E 63.3333 4.5639 T 48.3056 35 Johtopäätös Toimittajalla (tekijä A) ei ole systemaattista vaikutusta raaka-aineen puhtauteen. Sen sijaan toimittajien toimittaman raaka-aineen puhtaus vaihtelee erästä (tekijä B) toiseen. TKK @ Ilkka Mellin (005) /84

Tehtävän 0.. ratkaiseminen tilastollisella ohjelmistolla: Tehtävän aineisto koodattuna Ncss-ohjelmaa varten: Data Report Data List Section Row Purity Supplier Batch - 3-3 4 4 5 5 6 0 6 7-7 8 0 8 9 3 9 0-3 0 3 3 3 3-4 -3 5 0 3 6 4 4 7-5 8 4 6 9 0 7 0 3 8 4 3 9 0 3 0 3-3 4 3 5 0 6-4 7 3 8 0 4 9-3 5 30 6 3-7 3 8 33 0 3 9 34 3 0 35 3 36 3 TKK @ Ilkka Mellin (005) /84

Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan hierarkkista mallia: Analysis of Variance Report Response Purity Expected Mean Squares Section Source Term Denominator Expected Term D ixed? Term Mean Square A: Supplier Yes B(A) S+sB+bsA B(A): Batch 9 No S(AB) S+sB S(AB) 4 No S Analysis of Variance Table Source Sum of Mean Prob Power Term D Squares Square -Ratio Level (Alpha=0.05) A: Supplier 5.05556 7.57778 0.97 0.45783 0.6965 B(A): Batch 9 69.9666 7.76858.94 0.06674* S 4 63.33333.638889 Total (Adjusted) 35 48.3056 Total 36 * Term significant at alpha = 0.05 Means and Standard Error Section Standard Term Count Mean Error All 36 0.36 A: Supplier -0.466667 0.804597 0.3333333 0.804597 3.66667 0.804597 Plots Section 6.00 Means of Purity 3.00 Purity 0.00-3.00-6.00 3 Supplier Bonferroni (All-Pairwise) Multiple Comparison Test Response: Purity Term A: Supplier Alpha=0.050 Error Term=B(A) D=9 MSE=7.76858 Critical Value=.93334 Different Group Count Mean rom Groups -0.466667 0.3333333 3.66667 TKK @ Ilkka Mellin (005) 3/84

Tehtävän aineisto koodattuna Ncss-ohjelmaa varten, kun aineistoon sovelletaan kaksisuuntaista varianssianalyysia: Data Report Data List Section Row Purity Supplier Batch.0 -.0 3 -.0 3 4.0 4 5.0 6 0.0 7 -.0 3 8 0.0 4 9.0 3 0 -.0 3.0 3 3 3.0 3 4 3 -.0 4-3.0 5 0.0 3 6 4.0 4 7 -.0 8 4.0 9 0.0 3 0 3.0 4 4.0 3 0.0 3 3 -.0 3 3 4.0 3 4 5 0.0 6-4.0 7.0 3 8 0.0 4 9-3.0 30.0 3 -.0 3 3.0 4 33 0.0 3 34.0 3 35.0 3 3 36.0 3 4 TKK @ Ilkka Mellin (005) 4/84

Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan kaksisuuntaisen varianssianalyysin mallia, jossa tekijä Batch on satunnainen: Analysis of Variance Report Response Purity Expected Mean Squares Section Source Term Denominator Expected Term D ixed? Term Mean Square A: Supplier Yes AB S+sAB+bsA B: Batch 3 No S(AB) S+asB AB 6 No S(AB) S+sAB S(AB) 4 No S Note: Expected Mean Squares are for the balanced cell-frequency case. Analysis of Variance Table Source Sum of Mean Prob Power Term D Squares Square -Ratio Level (Alpha=0.05) A: Supplier 5.05556 7.57778.0 0.45586 0.56574 B: Batch 3 5.63889 8.54696 3.4 0.039838* AB 6 44.7778 7.37963.80 0.03306* S 4 63.33333.638889 Total (Adjusted) 35 48.3056 Total 36 * Term significant at alpha = 0.05 TKK @ Ilkka Mellin (005) 5/84

Plots Section Means of Purity 6.00 3.00 Purity 0.00-3.00-6.00 3 Supplier Means of Purity 6.00 3.00 Purity 0.00-3.00-6.00 6.00 3.00 3 4 Batch Means of Purity Batch 3 4 Purity 0.00-3.00-6.00 3 Supplier TKK @ Ilkka Mellin (005) 6/84

0.. Valmistettavan yhdisteen saanto riippuu eräässä kemiallisessa prosessissa lähtöaineen konsentraatiosta ja käytettävän katalysaattorin määrästä. Laboratoriossa tutkittiin saantoon vaikuttavien tekijöiden vaikutusta valitsemalla kummallekin tekijälle kaksi tasoa ja tutkimalla saaduilla tasokombinaatioilla kolme näytettä. Tulokset on annettu alla olevassa taulukossa. Saanto Näyte Lähtöaineen konsentraatio Katalysaattorin määrä 3 5 % pauna 8 5 7 5 % pauna 36 3 3 5 % paunaa 8 9 3 5 % paunaa 3 30 9 Teoriaa: Tutki millaisia keskimääräisiä vaikutuksia lähtöaineen konsentraatiolla ja katalysaattorin määrällä on valmistettavan yhdisteen saantoon. Tehtävän koeasetelmana on -faktorikoe. Oletetaan, että kokeen tavoitteena on tutkia, miten kaksi faktoria eli tekijää A, B vaikuttavat kiinnostuksen kohteena olevan vastemuuttujan y keskimääräisiin arvoihin, kun kummallekin tekijälle valitaan kokeessa kaksi tasoa: matala ( ) ja korkea (+) -faktorikokeen tilastollinen malli -faktorikoe on kaksisuuntaisen varianssianalyysin tilastollisen mallin erikoistapaus. Koska tekijöillä A ja B on molemmilla kaksi tasoa, havainnot tulevat luokitelluiksi = = 4 ryhmään. -faktorikokeen nollahypoteesit -faktorikokeen nollahypoteesit ovat seuraavaa muotoa: H A : Ei A-vaikutusta H B : Ei B-vaikutusta H AB : Ei yhdysvaikutusta TKK @ Ilkka Mellin (005) 7/84

-faktorikokeen havainnollistus Merkitään käsittelykombinaatioita (, ), (+, ), (,+), (+,+) seuraavalla tavalla: A B Merkintä () + a + b + + ab Oletetaan, että jokaista käsittelykombinaatiota on kokeessa toistettu n kertaa, joten havaintojen kokonaislukumäärä on n= = 4 n Merkitään havaintoarvojen summaa eri käsittelykombinaatioille samalla tavalla kuin vastaavia käsittelykombinaatioita: () = Havaintoarvojen summa, kun A = ( ), B = ( ) a = Havaintoarvojen summa, kun A = (+), B = ( ) b = Havaintoarvojen summa, kun A = ( ), B = (+) ab = Havaintoarvojen summa, kun A = (+), B = (+) -koeasetelmaa voidaan kuvata seuraavalla kaaviolla: + b ab B () + A a -faktorikokeen tekijöiden päävaikutukset ja interaktio eli yhdysvaikutus Yksinkertaisin tapa tekijöiden A ja B päävaikutuksien ja interaktion eli yhdysvaikutuksen laskemiseksi -faktorikokeessa on soveltaa havaintojen summiin eri käsittelykombinaatioille seuraavaa kaavaa: X = ( a± )( b± ) n TKK @ Ilkka Mellin (005) 8/84

jossa n = toistojen lukumäärä ja merkit sulkulausekkeissa määräytyvät seuraavalla tavalla: Merkki =, jos vastaava tekijä on vaikutuksessa mukana Merkki = +, jos vastaava tekijä ei ole vaikutuksessa mukana Lisäksi tulee korvata tulon määräämisen jälkeen merkinnällä (). Tekijän A päävaikutus on X = A ( a )( b ) ( ab a b ()) n + = n + Tekijän B päävaikutus on X = B ( a )( b ) ( ab a b ()) n + = n + Tekijöiden A ja B interaktio eli yhdysvaikutus on X = AB ( a )( b ) ( ab a b ()) n = n + Kaavoista nähdään, että tekijöiden A ja B päävaikutukset ja interaktio eli yhdysvaikutus ovat eri käsittelykombinaatioiden ortogonaalisia kontrasteja. Keskiarvot Olkoon jossa y kij = muuttujan y k. havaintoarvo ryhmässä, jonka määrittelee tekijän A taso i ja tekijän B taso j, k =,,, n, i =,, j =, A = ( ) i = A = (+) i = B = ( ) j = B = (+) j = Ryhmän (i, j) havaintoarvojen aritmeettinen keskiarvo eli ryhmäkeskiarvo on y y, i,, j, n i ij = kij = = n k = TKK @ Ilkka Mellin (005) 9/84

Huomaa, että ryhmäkeskiarvot voidaan ilmaista summien (), a, b, ab avulla: y y y y i i i i = () n = a n = b n = ab n Kaikkien havaintoarvojen aritmeettinen keskiarvo eli yleis- eli kokonaiskeskiarvo on n = kij = ij = ( + + b+ ( iii 4n i= j= k= 4 i i= j= 4n )) y y y ab a Varianssianalyysihajotelma Testit nollahypoteeseille H A, H B ja H AB perustuvat varianssianssianalyysihajotelmaan Neliösumma SST = SSA + SSB + SSAB + SSE n n ( kij iii) kij 4 iii (4 ) y i= j= k= i= j= k= SST = y y = y ny = n s kuvaa havaintoarvojen kokonaisvaihtelua. Koska tekijöiden A ja B päävaikutukset ja interaktio eli yhdysvaikutus ovat eri käsittelykombinaatioita vastaavien havaintojen keskiarvojen ortogonaalisia kontrasteja, niitä vastaavat neliösummat saadaan kaavoilla SSA = nx = ( ab + a b ( )) 4n A SSB = nx = ( ab a + b ( )) 4n B SSAB = nx = ( ab a b + ( )) 4n Neliösumma (jäännösneliösumma) AB n I J ( kij i ij ) ( ) ij i= j= k= i= j= SSE = y y = n s kuvaa havaintojen kokonaisvaihtelua tekijän B tasojen muodostamien ryhmien sisällä. Jäännösneliösumma saadaan tietysti myös laskutoimituksella SSE = SST SSA SSB SSAB TKK @ Ilkka Mellin (005) 0/84

Varianssianalyysihajotelman SST = SSA + SSB + SSAB + SSE neliösummien vapausasteet toteuttavat vastaavan yhtälön 4n = + + + 4(n ) Testisuureet Määritellään -testisuureet AB A B ( n ) SSAB SSAB = = 4( n ) ( )( ) SSE SSE ( n ) SSA SSA = = 4( n ) ( ) SSE SSE ( n ) SSB SSB = = 4( n ) ( ) SSE SSE Jos nollahypoteesi H AB : Ei yhdysvaikutusta pätee, niin (( )( ), ( n )) = (,4( n )) AB Suuret testisuureen AB arvot johtavat nollahypoteesin H AB hylkäämiseen. Jos nollahypoteesi pätee, niin H A : Ei A-vaikutusta (( ), ( n )) = (, 4( n )) A Suuret testisuureen A arvot johtavat nollahypoteesin H A hylkäämiseen. Jos nollahypoteesi pätee, niin H B : Ei B-vaikutusta (( ), ( n )) = (, 4( n )) B Suuret testisuureen B arvot johtavat nollahypoteesin H B hylkäämiseen. TKK @ Ilkka Mellin (005) /84

-kokeen testien tulokset ilmaistaan tavallisesti varianssianalyysitaulukon muodossa: Vaihtelun lähde Neliösumma SS Vapausasteet df Varianssiestimaattori MS -testisuure A SSA MSA = SSA = MSA MSE B SSB MSB = SSB = MSB MSE AB SSAB MSAB = SSAB = MSAB MSE Jäännös SSE 4(n ) SSE MSE = 4( n ) Kokonaisvaihtelu SST 4n Varianssianalyysitaulukon neliösummat toteuttavat varianssianalyysihajotelman SST = SSA + SSB + SSAB + SSE ja neliösummiin liittyvät vapausasteet toteuttavat vastaavan yhtälön 4n = + + + 4(n ). asteen vastepintamalli Siirrytään luonnollisista tekijöiden A ja B mittayksiköistä koodattuihin muuttujan arvoihin yhtälöllä X ( X+ + X )/ x =, X = X, X ( X X )/ + Koodatun muuttujan x arvot ovat +, jos X = X x =, jos X = X + + Määritellään vastemuuttujalle y. asteen vastepintamalli jossa y = β + β x + β x + β x x +ε 0 x = Tekijää A vastaava koodattu muuttuja x = Tekijää B vastaava koodattu muuttuja TKK @ Ilkka Mellin (005) /84

Estimoidaan. asteen vastepintamallin parametrit pienimmän neliösumman menetelmällä. Olkoot parametrien PNS-estimaattorit Tällöin pätee β 0, β, β, β b 0, b, b, b b b b b 0 = y = = = iii X X A X B AB Estimoitu. asteen vastepinnan yhtälö saa siten muodon Olkoon X X X yˆ = y + x + x + x x A B AB iii SST = SSM + SSE. asteen vastepintamallin selitettävän muuttujan y arvojen vaihtelua kuvaavan kokonaisneliösumman SST varianssianalyysihajotelma, jossa Voidaan osoittaa, että SSM = Estimoidun mallin mallineliösumma SSE = Estimoidun mallin jäännösneliösumma SSM = SSA + SSB + SSAB joten estimoidun mallin jäännösneliösumma SSE yhtyy edellä esitetyn kaksisuuntaisen varianssianalyysimallin jäännösneliösummaan. Tehtävän 0.. ratkaisu: Tekijän A tasojen lukumäärä: I = Tekijän B tasojen lukumäärä: J = Havaintojen lukumäärä jokaisessa tekijöiden A ja B tasojen määräämässä ryhmässä (i, j): n = 3 Siten havaintojen kokonaislukumäärä on I J n = n = 4 3 = TKK @ Ilkka Mellin (005) 3/84

Alla olevaan taulukkoon on laskettu havaintojen summat eri käsittelykombinaatioille: A B Summa () = 8 + 5 + 7 = 80 + a = 36 + 3 + 3 = 00 + b = 8 + 9 + 3 = 60 + + ab = 3 + 30 + 9 = 90 Tekijän A päävaikutus: Tekijän B päävaikutus: X A = ( ab+ a b ()) = (90 + 00 60 80) = 8.333 n 6 XB = ( ab a+ b ()) = (90 00 + 60 80) = 5 n 6 Tekijöiden A ja B interaktio eli yhdysvaikutus: X AB = ( ab a b+ ()) = (90 00 60 + 80) =.6667 n 6 Tekijöiden A ja B päävaikutuksia ja yhdysvaikutusta kuvaavat neliösummat: SSA = nx A SSB = nx B SSAB = nx AB = 08.3333 = 75 = 8.3333 Kaikkien havaintoarvojen aritmeettinen keskiarvo: yiii = ( ab+ a+ b+ ()) = (90 + 00 + 60 + 80) = 330 = 7.5 4n 4 3 Kaikkien havaintoarvojen neliöiden summa: n 3 ykij ykij i= j= k= i= j= k= = = 9398 Kaikkien havaintoarvojen kokonaisvaihtelua kuvaava neliösumma: n kij iii = i= j= k= SST = y 4ny = 9398 4 3 7.5 33 Jäännösneliösummaksi saadaan varianssianalyysihajotelman nojalla SSE = SST SSA SSB SSAB = 33 08.3333 75 8.3333 = 3.3333 TKK @ Ilkka Mellin (005) 4/84

-testisuureiden laskeminen Olkoon nollahypoteesina H AB : Ei yhdysvaikutusta Testisuureen AB arvoksi saadaan SSAB AB = 4( n ) SSE 8.3333 = 4(3 ) 3.3333 =.8 Jos nollahypoteesi H AB pätee, niin (, 4( n )) = (,8) AB Olkoon nollahypoteesina H A : Ei A-vaikutusta Testisuureen A arvoksi saadaan A SSA = 4( n ) SSE 08.3333 = 4(3 ) 3.3333 = 53.9 Jos nollahypoteesi H A pätee, niin (, 4( n )) = (,8) A Olkoon nollahypoteesina H B : Ei B-vaikutusta Testisuureen B arvoksi saadaan SSA B = 4( n ) SSE 75 = 4(3 ) 3.3333 = 9.49 Jos nollahypoteesi H B pätee, niin (, 4( n )) = (,8) B TKK @ Ilkka Mellin (005) 5/84

Testien tekeminen Olkoon nollahypoteesina H AB : Ei yhdysvaikutusta Testisuureen arvoksi saatiin AB =.8 Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr(.8) = 0.83 Siten nollahypoteesia H AB ei voida hylätä merkitsevyystasolla 0.05. Taulukoiden mukaan jossa Koska Pr( 5.38) = 0.05 (, 4( n )) = (,8) AB =.8 < 5.38 voimme todeta (kuten edellä), että nollahypoteesia H AB ei voida hylätä merkitsevyystasolla 0.05. Olkoon nollahypoteesina H A : Ei A-vaikutusta Testisuureen arvoksi saatiin = 53.9 A Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr( 53.9) = 0.000084 Siten nollahypoteesi H A voidaan hylätä kaikilla tavanomaisilla merkitsevyystasoilla. Taulukoiden mukaan jossa Koska Pr(.59) = 0.0 (, 4( n )) = (,8) = 53.9 >.59 A voimme todeta, että nollahypoteesi H A voidaan hylätä merkitsevyystasolla 0.0. TKK @ Ilkka Mellin (005) 6/84

Olkoon nollahypoteesina H B : Ei B-vaikutusta Testisuureen arvoksi saatiin = 9.49 B Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr( 9.49) = 0.004 Siten nollahypoteesi H B voidaan hylätä merkitsevyystasolla 0.0. Taulukoiden mukaan jossa Koska Pr(.59) = 0.0 (, 4( n )) = (,8) = 9.49 B >.59 voimme todeta, että nollahypoteesi H A voidaan hylätä merkitsevyystasolla 0.0. Testien tulokset voidaan koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A 08.3333 08.3333 53.9 0.000084 B 75.0000 75.0000 9.49 0.004 AB 8.3333 8.3333.8 0.83 E 3.3333 8 3.967 T 33.0000 Johtopäätös Tekijöillä A ja B ei ole interaktiota, mutta molemmilla tekijöillä on päävaikutus. TKK @ Ilkka Mellin (005) 7/84

Vastepintamallin estimointi Tekijöiden A ja B arvojen koodaus tapahtuu yhtälöillä A (5+ 5)/ A 0 x = =, A= A, A (5 5)/ 5 B ( + )/ B.5 x = =, B= B, B ( ) / 0.5 Estimoiduksi. asteen vastepintamalliksi saadaan edellä esitettyjen tulosten perustella X A XB X AB yˆ = yiii + x+ x + xx 8.333 5.667 = 7.5 + x x + xx = 7.5 + 4.67x.5x + 0.833x x + + Sama tulos saadaan soveltamalla PNS-menetelmää malliin y = β + β x + β x + β x x +ε 0 Estimoitu regressioyhtälö saa tekijöiden A ja B luonnollisissa mittayksiköissä muodon yˆ = 7.5 + 4.67x.5x + 0.833x x A 0 B.5 A 0 B.5 = 7.5 + 4.67.5 + 0.833 5 0.5 5 0.5 = 8.333+ 0.333A.667B+ 0.333AB Tehtävän 0.. ratkaiseminen tilastollisella ohjelmistolla: Tehtävän aineisto koodattuna Ncss-ohjelmaa varten: Data Report Data List Section Row Yield Concentration Catalyst TCon TCat TConTCat 8 5 - - 5 5 - - 3 7 5 - - 4 36 5 - - 5 3 5 - - 6 3 5 - - 7 8 5 - - 8 9 5 - - 9 3 5 - - 0 3 5 30 5 9 5 TKK @ Ilkka Mellin (005) 8/84

Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan kaksisuuntaista varianssianalyysia (faktoreina luonnolliset muuttujat): Analysis of Variance Report Response: Yield Expected Mean Squares Section Source Term Denominator Expected Term D ixed? Term Mean Square A: Concentration Yes S(AB) S+bsA B: Catalyst Yes S(AB) S+asB AB Yes S(AB) S+sAB S(AB) 8 No S Note: Expected Mean Squares are for the balanced cell-frequency case. Analysis of Variance Table Source Sum of Mean Prob Power Term D Squares Square -Ratio Level (Alpha=0.05) A: Concentration 08.3333 08.3333 53.9 0.000084* 0.99999 B: Catalyst 75 75 9.5 0.0036* 0.967790 AB 8.333333 8.333333.3 0.8776 0.547 S 8 3.33333 3.96667 Total (Adjusted) 33 Total * Term significant at alpha = 0.05 Means and Standard Error Section Standard Term Count Mean Error All 7.5 A: Concentration 5 6 3.33333 0.8079466 5 6 3.66667 0.8079466 B: Catalyst 6 30 0.8079466 6 5 0.8079466 AB: Concentration,Catalyst 5, 3 6.66667.4609 5, 3 0.4609 5, 3 33.33333.4609 5, 3 30.4609 TKK @ Ilkka Mellin (005) 9/84

Plots Section Means of Yield 40.00 33.75 Yield 7.50.5 5.00 5 5 Concentration Means of Yield 40.00 33.75 Yield 7.50.5 5.00 Catalyst Means of Yield 40.00 33.75 Catalyst Yield 7.50.5 5.00 5 5 Concentration TKK @ Ilkka Mellin (005) 30/84

Bonferroni (All-Pairwise) Multiple Comparison Test Response: Yield Term A: Concentration Alpha=0.050 Error Term=S(AB) D=8 MSE=3.96667 Critical Value=.306004 Different Group Count Mean rom Groups 5 6 3.33333 5 5 6 3.66667 5 Bonferroni (All-Pairwise) Multiple Comparison Test Response: Yield Term B: Catalyst Alpha=0.050 Error Term=S(AB) D=8 MSE=3.96667 Critical Value=.306004 Different Group Count Mean rom Groups 6 5 6 30 Bonferroni (All-Pairwise) Multiple Comparison Test Response: Yield Term AB: Concentration,Catalyst Alpha=0.050 Error Term=S(AB) D=8 MSE=3.96667 Critical Value=3.478879 Different Group Count Mean rom Groups 5, 3 0 (5,), (5,), (5,) 5, 3 6.66667 (5,), (5,) 5, 3 30 (5,) 5, 3 33.33333 (5,), (5,) TKK @ Ilkka Mellin (005) 3/84

Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan lineaarista regressioanalyysia (selittäjinä koodatut muuttujat): Multiple Regression Report Dependent Yield Descriptive Statistics Section Standard Variable Count Mean Deviation Minimum Maximum TCon.387779E-7.044466 - TCat -.775558E-7.044466 - TConTCat.387779E-7.044466 - Yield 7.5 5.488 8 36 Regression Equation Section Independent Regression Standard T-Value Prob Decision Power Variable Coefficient Error (Ho: B=0) Level (5%) (5%) Intercept 7.5 0.573046 48.354 0.000000 Reject Ho.000000 TCon 4.66667 0.573046 7.93 0.000084 Reject Ho 0.99999 TCat -.5 0.573046-4.3759 0.0036 Reject Ho 0.967790 TConTCat 0.8333333 0.573046.4586 0.8776 Accept Ho 0.547 R-Squared 0.90993 Model 7.5+ 4.66667*TCon-.5*TCat+.8333333*TConTCat Regression Coefficient Section Independent Regression Standard Lower Upper Standardized Variable Coefficient Error 95% C.L. 95% C.L. Coefficient Intercept 7.5 0.573046 6.857 8.8743 0.0000 TCon 4.66667 0.573046.84936 5.484097 0.803 TCat -.5 0.573046-3.8743 -.8569-0.489 TConTCat 0.8333333 0.573046-0.4840973.50764 0.606 T-Critical.306004 Analysis of Variance Section Sum of Mean Prob Power Source D Squares Square -Ratio Level (5%) Intercept 9075 9075 Model 3 9.6667 97. 4.87 0.00009 0.999956 Error 8 3.33333 3.96667 Total(Adjusted) 33 9.36364 Root Mean Square Error.979057 R-Squared 0.9030 Mean of Dependent 7.5 Adj R-Squared 0.8666 Coefficient of Variation 7.9657E-0 Press Value 70.5 Sum Press Residuals 5 Press R-Squared 0.787 TKK @ Ilkka Mellin (005) 3/84

Normality Tests Section Assumption Value Probability Decision(5%) Skewness.0993 0.7634 Accepted Kurtosis -0.5767 0.5643 Accepted Omnibus.54 0.46763 Accepted Serial-Correlation Section Durbin-Watson Value.8475 Sum of Squares and Correlation Section Independent Sequential Incremental Last Simple Partial Variable Sum Squares Sum Squares Sum Squares Correlation Correlation TCon 08.3333 08.3333 08.3333 0.8036 0.93343 TCat 83.3333 75 75-0.48869-0.839839 TConTCat 9.6667 8.333333 8.333333 0.6063 0.458349 Plots Section 3.0 Normal Probability Plot of Residuals of Yield Residuals of Yield.5 0.0 -.5-3.0 -.0 -.0 0.0.0.0 Expected Normals TKK @ Ilkka Mellin (005) 33/84

Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla, jota kutsutaan vastepintamalliksi. Tärkeimpiä motiiveja polynomimuotoisten vastepintamallien käyttämiselle on se, että polynomimuotoisten vastepintamallien avulla on helppo etsiä vasteeseen vaikuttavien tekijöiden arvojen optimaalista kombinaatiota. Vastepintamenetelmä on vaiheittain etenevä mallinrakentamisstrategia, jonka aikana joudutaan tavallisesti keräämään myös uusia havaintoja. Rajoitumme tässä esittelemään vastepintamallin soveltamista -koeasetelmaan. -koeasetelmassa tutkitaan kahden tekijän vaikutusta vastemuuttujaan, kun kummallekin tekijälle valitaan kokeessa kaksi tasoa. Tehtävät 0.3. 0.6. muodostavat jakokertomuksen, jossa näytetään miten erään kemiallisen prosessin saannolle löydetään optimaalinen reaktioaika-lämpötila-kombinaatio -koeasetelmaa ja vastepintamenetelmää käyttäen. () Tehtävässä 0.3. tutkitaan kemiallisen prosessin saannon riippuvuutta reaktioajasta ja lämpötilasta -koeasetelmaa käyttäen. Reaktioajan ja lämpötilan vaikutusten estimointiin riittää se, että vastemuuttujan arvo on mitattu kerran jokaisella -koeasetelman tekijöiden tasojen neljällä kombinaatiolla. Tällöin vastemuuttujaan vaikuttavien tekijöiden tilastollisen merkitsevyyden testaaminen ei ole kuitenkaan mahdollista. () Tehtävässä 0.4. tehtävän 0.3. -koeasetelmaan liitetään keskipiste. Keskipistehavaintojen liittäminen -koeasetelmaan tekee sekä vastemuuttujaan vaikuttavien tekijöiden tilastollisen merkitsevyyden että vastefunktion (kvadraattisen) kaarevuuden (epälineaarisuuden) testaamisen mahdolliseksi. (3) Jos vastepintaa voidaan approksimoida. asteen vastepinnalla, voidaan soveltaa gradienttimenetelmää vasteeseen vaikuttavien tekijöiden optimaalisten arvojen alueen etsimiseen. Gradienttimenetelmässä kerätään uusia havaintoja siitä suunnasta, jossa vastefunktio kasvaa nopeimmin, kunnes optimaalinen vasteeseen vaikuttavien tekijöiden arvojen alue löydetään. Kun vasteen kannalta optimaalinen tekijöiden arvojen alue on löydetty (tehtävä 0.4.), alueelta kerätään uudet havainnot sellaisen -koeasetelman mukaan, johon on liitetty keskipiste. (4) Tehtävässä 0.5. uusista havainnoista estimoidaan vasteeseen vaikuttavien tekijöiden efektit sekä testataan vastepinnan (kvadraattista) kaarevuutta. (5) Jos (kvadraattista) kaarevuutta esiintyy (tehtävä 0.5.), liitetään. asteen vastepintamalliin tekijöiden. potenssit ja estimoidaan havainnoista. asteen vastepintamalli. Tämä vaatii lisähavaintojen keräämistä sopivasti valituista suunnista.. asteen vastepintamallin avulla on helppo löytää se reaktioajan ja lämpötilan arvojen kombinaatio, joka optimoi vasteen arvon. TKK @ Ilkka Mellin (005) 34/84

0.3. Insinööri tutkii kemiallisen prosessin saantoa. Saantoon voidaan vaikuttaa reaktioajalla ja prosessin lämpötilalla. Insinööri tutkii tilannetta aluksi valitsemalla vain kaksi reaktioaikaa ja kaksi lämpötilaa sekä mittaamalla saannot. Tulokset on annettu alla olevassa taulukossa. Reaktioaika min Lämpötila Saanto 30 50 39.3 40 50 40.9 30 60 40.0 40 60 4.5 Määrää saantoon vaikuttavien tekijöiden päävaikutukset ja interaktio. Huomaa, että näiden tekijöiden tilastollista merkitystä ei voida testata. Miksi? Teoriaa: Tehtävän koeasetelmana on -faktorikoe. -faktorikokeen tulosten analysoinnissa käytettävät kaavat on esitelty tehtävässä 0.. Tehtävän 0.3. ratkaisu: Tekijän A tasojen lukumäärä: I = Tekijän B tasojen lukumäärä: J = Havaintojen lukumäärä jokaisessa tekijöiden A ja B tasojen määräämässä ryhmässä (i, j): n = Siten havaintojen kokonaislukumäärä on I J n = n = = 4 Alla olevaan taulukkoon on laskettu havaintojen summat eri käsittelykombinaatioille: A B Summa () = 39.3 + a = 40.9 + b = 40.0 + + ab = 4.5 TKK @ Ilkka Mellin (005) 35/84

Koeasetelman havainnollistus: + b = 40.0 ab = 4.5 B () = 39.3 a = 40.9 Tekijän A päävaikutus: Tekijän B päävaikutus: X A = ( ab+ a b ()) = (4.5 + 40.9 40.0 39.3) =.55 n XB = ( ab a+ b ()) = (4.5 40.9 + 40.0 39.3) = 0.65 n Tekijöiden A ja B interaktio eli yhdysvaikutus: X AB = ( ab a b+ ()) = (4.5 40.9 40.0 + 39.3) = 0.05 n Tekijöiden A ja B päävaikutuksia ja yhdysvaikutusta kuvaavat neliösummat: SSA = nx A SSB = nx B SSAB = nx AB =.405 = 0.45 = 0.005 Havaintoarvojen aritmeettinen keskiarvo: A yiii = ( ab+ a+ b+ ()) = (4.5 + 40.9 + 40.0 + 39.3) = 6.7 = 40.45 4n 4 4 Havaintoarvojen neliöiden summa: n ykij ykij i= j= k= i= j= k= = = 6539.55 Havaintoarvojen kokonaisvaihtelua kuvaava neliösumma: n kij iii i= j= k= SST = y 4ny = 6539.55 4 40.45 =.875 Varianssianalyysihajotelman nojalla jäännösneliösumma on + SSE = SST SSA SSB SSAB =.875.405 0.45 0.005 = 0 TKK @ Ilkka Mellin (005) 36/84

Tämä on sopusoinnussa sen kanssa, että jokaisesta tekijöiden A ja B tasojen määräämästä ryhmästä (i, j) on vain yksi havainto, jolloin ryhmien sisäistä vaihtelua ei ole ja sitä kuvaavan jäännösneliösumman SSE pitääkin hävitä. Koska SSE = 0 niin tekijöiden A ja B päävaikutuksien ja interaktion tilastollista merkitsevyyttä ei voida testata. Analyysin tulokset voidaan kuitenkin koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A.405.405 B 0.45 0.45 AB 0.005 0.005 E 0 0 T.875 3 Vastepintamallin estimointi Tekijöiden A ja B arvojen koodaus tapahtuu yhtälöillä: A (40 + 30) / A 35 x = =, A= A, A (40 30) / 5 + B (60 + 50) / B 55 x = =, B= B, B (60 50) / 5 + Estimoiduksi. asteen vastepintamalliksi saadaan edellä esitettyjen tulosten perustella X A XB X AB yˆ = yiii + x+ x + x x.55 0.65 0.05 = 40.45 + x+ x xx = 40.45 + 0.775x + 0.35x 0.05x x Sama tulos saadaan soveltamalla PNS-menetelmää malliin y = β + β x + β x + β x x +ε 0 TKK @ Ilkka Mellin (005) 37/84

Estimoitu regressioyhtälö saa luonnollisissa mittayksiköissä muodon yˆ = 40.45 + 0.775x + 0.35x 0.05x x A 35 B 55 A 35 B 55 = 40.45 + 0.775 + 0.35 0.05 5 5 5 5 = 9.5 + 0.3A+ 0.B 0.00AB Tehtävän 0.3. ratkaiseminen tilastollisella ohjelmistolla: Tehtävän aineisto koodattuna Ncss-ohjelmaa varten: Data Report Data List Section Row Y A B 39.3 - - 40.9-3 40.0-4 4.5 TKK @ Ilkka Mellin (005) 38/84

Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan -faktorikokeen mallia: Analysis of Two-Level Designs Design Information Section Input Data Response: Y Rows: 4 Reps: Blocks: None actor actor Level Level Symbol Name One Two A() A - B() B - Design / replication of factors. Confounding / Alias Section Term Terms No. Confounded A B 3 AB Means and Effects Section for Y Term Term Estimated Standard No. Symbol Mean - Mean + Effect Error 0 Grand Mean 40.43 0.00 A (A) 39.65 4.0.55 0.00 B (B) 40.0 40.75 0.65 0.00 3 AB 40.45 40.40-0.05 0.00 Sorted Means and Effects Section for Y Term Term Estimated Standard No. Symbol Mean - Mean + Effect Error 0 Grand Mean 40.43 0.00 A (A) 39.65 4.0.55 0.00 B (B) 40.0 40.75 0.65 0.00 3 AB 40.45 40.40-0.05 0.00 TKK @ Ilkka Mellin (005) 39/84

Analysis of Variance Section for Y Term Term Mean Prob Statistically No. Symbol D Square -Ratio Level Significant A (A).405 0.00 0.000000 Yes B (B) 0.45 0.00 0.000000 Yes 3 AB 0.005 0.00 0.000000 Yes Error 0 0.0000 Total 3.875 Means and Effects of B by A for Y A A B - Effect Overall - 39.30 40.90.60 40.0 40.00 4.50.50 40.75 Effect 0.70 0.60-0.05 0.65 Overall 39.65 4.0.55 40.43 Probability Plots Section.0 Normal Probability Plot of Effects.4 Effects 0.8 0. -0.5 -.0-0.5 0.0 0.5.0 Expected Normals TKK @ Ilkka Mellin (005) 40/84

0.4. Jatkoa tehtävälle 0.3. Insinöörin tavoitteena on käyttää vastepintamenetelmää prosessin analysoimiseksi. Hän päättää lisätä tehtävän 0.3. asetelmaan keskipisteen, jossa suoritetaan viisi mittausta. Tulokset lisämittauksista on annettu alla olevassa taulukossa. Reaktioaika min Lämpötila Saanto 35 55 40.3 35 55 40.5 35 55 40.7 35 55 40. 35 55 40.6 Teoriaa: Liitä nämä uudet havainnot tehtävän 0.3. aineistoon, estimoi yhdistetystä aineistosta. asteen vastepinta ja testaa saantoon vaikuttavien tekijöiden päävaikutuksien ja interaktion merkitystä sekä testaa myös vastefunktion kaarevuutta. Tehtävän koeasetelmana on -faktorikoe, johon on liitetty keskipiste. Keskipistehavaintojen liittäminen kokeeseen ei vaikuta tekijöiden A ja B päävaikutuksiin ja interaktioon ja niihin liittyviin neliösummiin. Sen sijaan keskipistehavainnot mahdollistavat ns. puhtaan virheen määräämisen ja siten myös tekijöiden A ja B päävaikutuksien ja interaktion tilastollisen merkityksen testaamisen. Lisäksi keskipistehavaintojen avulla voidaan testata vastefunktion (kvadraattista) kaarevuutta. Kutsumme -faktorikokeen alkuperäisiä havaintoja kulmapistehavainnoiksi. Jos jokaista -faktorikokeen käsittelykombinaatiota on toistettu kokeessa n kertaa, kulmapistehavaintojen lukumäärä on n= 4n= n (merkintä) -faktorikokeen tulosten kulmapistehavaintoihin perustuvassa analyysissa käytettävät kaavat on esitelty tehtävässä 0.. TKK @ Ilkka Mellin (005) 4/84

Olkoon jossa Olkoon y kij = muuttujan y k. havaintoarvo kulmapisteessä, jonka määrittelee tekijän A taso i ja tekijän B taso j, k =,,, n, i =,, j =, A = ( ) i = A = (+) i = B = ( ) j = B = (+) j = T y n = kij i= j= k= havaintoarvojen summa kulmapisteissä. Huomaa, että T = a b+ a+ b+ () jossa ab = Havaintoarvojen summa, kun A = (+), B = (+) a = Havaintoarvojen summa, kun A = (+), B = ( ) b = Havaintoarvojen summa, kun A = ( ), B = (+) () = Havaintoarvojen summa, kun A = ( ), B = ( ) Olkoon y = T n havaintoarvojen aritmeettinen keskiarvo kulmapisteissä. Huomaa, että Olkoon y = ( ab+ a+ b+ ( )) 4n Q n = i= j= k= havaintoarvojen neliöiden summa kulmapisteissä. y kij TKK @ Ilkka Mellin (005) 4/84

Keskipistehavaintojen liittäminen -koeasetelmaan Olkoon A = Tekijän A matala arvo A + = Tekijän A korkea arvo B = Tekijän B matala arvo B + = Tekijän B korkea arvo Olkoon AC = ( A + A+ ) BC = ( B + B+ ) Sanomme, että piste (A C, B C ) on -koeasetelman keskipiste. Olkoot keskipisteessä (A C, B C ) saadut havaintoarvot z, k =,,, n k Olkoon N = n + n C kaikkien havaintoarvojen lukumäärä. Olkoon T C n C = z k = k havaintoarvojen summa keskipisteessä ja olkoon T = T +T C C kaikkien havaintoarvojen summa (havaintoarvojen summa kulmapisteissä ja keskipisteessä). Havaintoarvojen aritmeettinen keskiarvo keskipisteessä on y C = T n C C ja kaikkien havaintoarvojen aritmeettinen keskiarvo on y = ( T + TC) = T n + n N C TKK @ Ilkka Mellin (005) 43/84

Olkoon Q C n C = z k = k havaintoarvojen neliöiden summa keskipisteessä ja olkoon Q= Q + Q C kaikkien havaintoarvojen neliöiden summa (havaintoarvojen neliöiden summa kulmapisteissä ja keskipisteessä). Kaikkien havaintoarvojen kokonaisvaihtelua kuvaava neliösumma on T SST = Q N Jäännösneliösumma Olkoon SSE = SST SSA SSB SSAB jäännösneliösumma, jossa neliösummat SSA, SSB ja SSAB lasketaan kulmapistehavainnoista; ks. tehtävä 0.. Puhdas virhe Määritellään puhdasta virhettä kuvaava neliösumma kaavalla jossa n n C ( kij iij ) ( k C ) i= j= k= k= SSPE = y y + z y = + Qiij Tiij QC TC i= j= n i= j= nc n T = y, i =,, j =, iij k = kij on havaintoarvojen summa kulmapisteessä (i, j), yiij = Ti ij, i =,, j =, n on havaintoarvojen aritmeettinen keskiarvo kulmapisteessä (i, j) ja n Q = y, i =,, j =, iij k = kij on havaintoarvojen neliöiden summa kulmapisteessä (i, j). TKK @ Ilkka Mellin (005) 44/84

Havaintoarvojen tavanomainen otosvarianssi kulmapisteessä (i, j) on s = ( y y ), i =,, j =, i n ij kij ij n k = ja havaintoarvojen tavanomainen otosvarianssi keskipisteessä on s n C C = ( zi y ) n C C i= Jos jokaisessa kulmapisteessä on käytettävissä on vain yksi havainto eli n =, niin n C SSPE = ( z y ) = Q T k = k C C C nc Puhdas kvadraattinen kaarevuus (Lack of it) Vastefunktion puhdasta kvadraattista kaarevuutta kuvaa neliö jossa nn C SSPQ = ( y yc) n + n C y = havaintoarvojen aritmeettinen keskiarvo kulmapisteissä y C = havaintoarvojen aritmeettinen keskiarvo keskipisteessä n n C = havaintojen lukumäärä kulmapisteissä = havaintojen lukumäärä keskipisteessä Varianssianalyysihajotelma -faktorikokeen, johon on liitetty keskipiste, varianssianalyysihajotelma on muotoa SST = SSA + SSB + SSAB + SSPQ + SSPE Huomaa, että tekijöiden A ja B päävaikutuksiin ja interaktioon liittyvät neliösummat SSA, SSB ja SSAB voidaan määrätä käyttämällä pelkästään kulmapistehavaintoja. Varianssianalyysihajotelman neliösummien vapausasteet toteuttavat vastaavan yhtälön n + n C + = + + + + (n + n C 5) Keskipistehavaintojen liittäminen faktorikokeeseen mahdollistaa jäännösneliösumman SSE hajottamisen puhdasta kvadraattista kaarevuutta kuvaavan neliösumman SSPQ ja puhdasta virhettä kuvaavan neliösumman SSPE summaksi: SSE = SSPQ + SSPE Neliösummiin SSE, SSPQ ja SSPE liittyvät vapausasteet toteuttavat yhtälön n + n C 4 = + (n + n C 5) TKK @ Ilkka Mellin (005) 45/84

Testit Määritellään -testisuureet ( n + nc 5) SSAB SSAB AB = = ( n + nc 5) ( )( ) SSPE SSPE ( n + nc 5) SSA SSA A = = ( n + nc 5) ( ) SSPE SSPE ( n + nc 5) SSB SSB B = = ( n + nc 5) ( ) SSPE SSPE ( n + nc 5) SSPQ SSPQ PQ = = ( n + nc 5) SSPE SSPE Jos nollahypoteesi H AB : Ei yhdysvaikutusta pätee, niin (( )( ),( n + n 5)) = (,( n + n 5)) AB C C Suuret testisuureen AB arvot johtavat nollahypoteesin H AB hylkäämiseen. Jos nollahypoteesi pätee, niin H A : Ei A-vaikutusta (( ),( n + n 5)) = (,( n + n 5)) A C Suuret testisuureen A arvot johtavat nollahypoteesin H A hylkäämiseen. Jos nollahypoteesi pätee, niin H B : Ei B-vaikutusta (( ),( n + n 5)) = (,( n + n 5)) B C Suuret testisuureen B arvot johtavat nollahypoteesin H B hylkäämiseen. Jos nollahypoteesi H PQ : Ei puhdasta kvadraattista kaarevuutta pätee, niin (, ( n + n )) PQ C Suuret testisuureen B arvot johtavat nollahypoteesin H B hylkäämiseen. C C TKK @ Ilkka Mellin (005) 46/84

-kokeen, johon on liitetty keskipiste, testien tulokset ilmaistaan tavallisesti varianssianalyysitaulukon muodossa: Vaihtelun lähde Neliösumma SS Vapausasteet df Varianssiestimaattori MS -testisuure A SSA MSA = SSA B SSB MSB = SSB AB SSAB MSAB = SSAB PQ SSPQ MSPQ = SSPQ MSA = MSPE MSB = MSPE MSAB = MSPE MSPQ = MSPE PE SSPE n n C 5 E SSE n + n C 4 SSPE MSPE = n + n 5 C SSE MSE = n + n 4 C Kokonaisvaihtelu SST n +n C Varianssianalyysitaulukon neliösummat toteuttavat varianssianalyysihajotelman SST = SSA + SSB + SSAB + SSE jossa SSE = SSPQ + SSPE Lisäksi neliösummiin liittyvät vapausasteet toteuttavat vastaavat yhtälöt n + n C = + + + (n + n C 4) ja n + n C 4 = + n + n C 5 TKK @ Ilkka Mellin (005) 47/84

. asteen vastepintamalli Siirrytään luonnollisista tekijöiden A ja B mittayksiköistä koodattuihin muuttujan arvoihin yhtälöllä X ( X+ + X )/ x =, X = X, X ( X X )/ + Koodatun muuttujan x arvot ovat, jos X X x = + =, jos X = X + + Määritellään vastemuuttujalle y. asteen vastepintamalli jossa y = β + β x + β x + β x x +ε 0 x = Tekijää A vastaava koodattu muuttuja x = Tekijää B vastaava koodattu muuttuja Estimoidaan. asteen vastepintamallin parametrit pienimmän neliösumman menetelmällä käyttäen kaikkia havaintoja. Olkoot parametrien PNS-estimaattorit Tällöin pätee β 0, β, β, β b 0, b, b, b b b b b 0 = y = = = X X A X B AB Estimoitu. asteen vastepinnan yhtälö saa siten muodon X A XB X AB yˆ = y+ x+ x + x x TKK @ Ilkka Mellin (005) 48/84

Tehtävän 0.4 ratkaisu: Yhteenveto tehtävän 0.3. ratkaisusta Tekijän A tasojen lukumäärä: I = Tekijän B tasojen lukumäärä: J = Havaintojen lukumäärä tekijöiden A ja B tasojen määräämässä ryhmässä (i, j), i =,, j =, : n = Kulmapistehavaintojen lukumäärä: n = I J n = = 4 Koeasetelman havainnollistus: + b = 40.0 ab = 4.5 B () = 39.3 A Tekijän A päävaikutus: Tekijän B päävaikutus: a = 40.9 + X A = ( ab+ a b ()) = (4.5 + 40.9 40.0 39.3) =.55 n XB = ( ab a+ b ()) = (4.5 40.9 + 40.0 39.3) = 0.65 n Tekijöiden A ja B interaktio eli yhdysvaikutus: X AB = ( ab a b+ ()) = (4.5 40.9 40.0 + 39.3) = 0.05 n TKK @ Ilkka Mellin (005) 49/84

Tekijöiden A ja B päävaikutuksia ja yhdysvaikutusta kuvaavat neliösummat: SSA = nx A SSB = nx B SSAB = nx AB =.405 = 0.45 = 0.005 Kulmapistehavaintojen summa: T = a b+ a+ b+ () = 4.5 + 40.9 + 40.0 + 39.3 = 6.7 Kulmapistehavaintojen aritmeettinen keskiarvo: y = T = 6.7 = 40.45 n 4 Kulmapistehavaintojen neliöiden summa: n kij kij i= j= k= i= j= k= Q = y = y = 6539.55 Kulmapistehavaintojen kokonaisvaihtelua kuvaava neliösumma: SST = Q T = 6539.55 6.7 =.875 4n 4 Kulmapistehavaintoihin perustuvan varianssianalyysin tulokset voidaan koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A.405.405 B 0.45 0.45 AB 0.005 0.005 E 0 0 T.875 3 Keskipistehavaintojen liittäminen kokeeseen Vastemuuttujasta on kerätty 5 havaintoa keskipisteessä. Keskipisteen (A C, B C ) koordinaatit saadaan yhtälöistä AC = ( A + A+ ) = (30 + 40) = 35 BC = ( B + B+ ) = (50 + 60) = 55 TKK @ Ilkka Mellin (005) 50/84

Kaikkien havaintojen lukumäärä on N = n + n C = 4 + 5 = 9 Keskipistehavaintojen summa: n C T = z = 0.3 C k = k Keskipistehavaintojen aritmeettinen keskiarvo: y C = TC = 0.3 = 40.46 n 5 Kaikkien havaintoarvojen summa: C T = T + = 6.7 + 0.3 = 364 TC Kaikkien havaintoarvojen aritmeettinen keskiarvo: 364 y = T = = 40.444 N 9 Keskipistehavaintojen neliöiden summa: Q C n C = z = 885.3 k = k Kaikkien havaintoarvojen neliöiden summa: Q= Q + Q = 6539.55 + 885.3 = 474.78 C Kaikkien havaintoarvojen kokonaisvaihtelua kuvaava neliösumma: T 364 SST = Q = 474.78 = 3.00 N 9 Puhdasta virhettä kuvaava neliösumma on tässä 0.3 SSPE = z y = Q T = = n C ( k C) C C 885.3 0.7 k = nc 5 Koska kulmapistehavaintojen aritmeettinen keskiarvo on y = 40.45 ja keskipistehavaintojen aritmeettinen keskiarvo on y C = 40.460 niin puhdasta kvadraattista kaarevuutta kuvaavaksi neliösummaksi saadaan nn 45 SSPQ = y y = = n + + C ( C) (40.45 40.460) 0.007 nc 4 5 TKK @ Ilkka Mellin (005) 5/84

Testit Testi tekijöiden A ja B interaktiolle: SSAB 0.005 AB = ( n + nc 5) = (4 + 5 5) = 0.058 SSPE 0.7 Koska testisuureen arvoa vastaava p-arvo on 0.8, nollahypoteesia H AB : Ei yhdysvaikutusta ei voida hylätä millään tavanomaisella merkitsevyystasolla. Testi tekijän A päävaikutukselle: SSA.405 A = ( n + nc 5) = (4 + 5 5) = 55.87 SSPE 0.7 Koska testisuureen arvoa vastaava p-arvo on 0.007, nollahypoteesi H A : Ei A-vaikutusta voidaan hylätä esimerkiksi merkitsevyystasolla 0.0. Testi tekijän B päävaikutukselle: SSB 0.45 B = ( n + nc 5) = (4+ 5 5) SSPE 0.7 Koska testisuureen arvoa vastaava p-arvo on 0.035, nollahypoteesi H B : Ei B-vaikutusta voidaan hylätä merkitsevyystasolla 0.05, mutta ei merkitsevyystasolla 0.0. Testi puhtaalle kvadraattiselle kaarevuudelle: SSPQ 0.007 PQ = ( n + nc 5) = (4 + 5 5) = 0.063 SSPE 0.7 Koska testisuureen arvoa vastaava p-arvo on 0.8, nollahypoteesia H PQ : Ei kaarevuutta ei voida hylätä millään tavanomaisella merkitsevyystasolla. TKK @ Ilkka Mellin (005) 5/84

Analyysin tulokset voidaan koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A.40500.40500 55.87 0.007 B 0.4500 0.4500 9.86 0.035 AB 0.00500 0.00500 0.058 0.8 PQ 0.007 0.007 0.063 0.8 PE 0.7000 4 0.043000 T 3.00 8 Johtopäätös Tekijöillä A ja B ei ole interaktiota, mutta molemmilla tekijöillä on päävaikutus. Lisäksi vastemuuttujan riippuvuutta tekijöistä A ja B voidaan approksimoida tarkastellulla alueella. asteen vastepinnalla. Vastepintamallin estimointi Tekijöiden A ja B arvojen koodaus tapahtuu yhtälöillä: A (40 + 30) / A 35 x = =, A= A, A (40 30) / 5 + B (60 + 50) / B 55 x = =, B= B, B (60 50) / 5 + Estimoiduksi. asteen vastepintamalliksi saadaan edellä esitettyjen tulosten perustella X X X ˆ = + + +.55 0.65 0.05 = 40.444 + x+ x xx = 40.444 + 0.775x + 0.35x 0.05x x A B AB y y x x xx Sama tulos saadaan soveltamalla PNS-menetelmää malliin y = β + β x + β x + β x x +ε 0 TKK @ Ilkka Mellin (005) 53/84

Estimoitu regressioyhtälö saa luonnollisissa mittayksiköissä muodon yˆ = 40.444 + 0.775x + 0.35x 0.05x x A 35 B 55 A 35 B 55 = 40.444 + 0.775 + 0.35 0.05 5 5 5 5 = 9.59 + 0.3A+ 0.B 0.00AB Tehtävän 0.4. ratkaiseminen tilastollisella ohjelmistolla: Tehtävän aineisto koodattuna Ncss-ohjelmaa varten: Data Report Data List Section Row Y A B AB 39.3 - - 40.9 - - 3 40.0 - - 4 4.5 5 40.3 0 0 0 6 40.5 0 0 0 7 40.7 0 0 0 8 40. 0 0 0 9 40.6 0 0 0 TKK @ Ilkka Mellin (005) 54/84

Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovitetaan. asteen vastepinta: Response-Surface Regression Report Response Y Descriptive Statistics Section Variable Count Mean Minimum Maximum A 9 0 - B 9 0 - Y 9 40.44444 39.3 4.5 Hierarchical Model Summary Section Number of Terms Removed 0 Number of Terms Remaining 3 R-Squared Cutoff Value 0.00000 R-Squared of inal Model 0.9480 Coded Hierarchical Model A B A A () B B Notes: or off-diagonal entries: =uw, =uw, 3=uw, 4=uw, 5=uw3,6=u3w, 7=uw3, 8=u3w, 9=u3w3. or diagonal entries: =u, =u, 3=u3. Where u=u, u=u^=u*u, and u3=u^3=u*u*u. Sequential ANOVA Section Sequential Mean Prob Incremental Source df Sum-Squares Square -Ratio Level R-Squared Regression 3.875 0.945 6.97 0.00630 0.9480 Linear.85.45 40.4 0.00089 0.940970 Lin x Lin 0.005 0.005 0.07 0.799787 0.000833 Total Error 5 0.747 3.494444E-0 0.05898 Lack of it.7e-03.7e-03 0.06 0.8374 0.000907 Pure Error 4 0.7 0.043 0.0579 Sequential ANOVA Section Using Pure Error Sequential Mean Prob Incremental Source df Sum-Squares Square -Ratio Level R-Squared Regression 3.875 0.945.9 0.006046 0.9480 Linear.85.45 3.85 0.00394 0.940970 Lin x Lin 0.005 0.005 0.06 0.836 0.000833 Total Error 5 0.747 3.494444E-0 0.05898 Lack of it.7e-03.7e-03 0.06 0.8374 0.000907 Pure Error 4 0.7 0.043 0.0579 TKK @ Ilkka Mellin (005) 55/84