nopeasti täydessä toteutuksessa (complete replicate).

Samankaltaiset tiedostot
8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Osafaktorikokeet. Heliövaara 1

Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

9.1 Hierarkiset asetelmat (Nested Designs)

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

A250A0050 Ekonometrian perusteet Tentti

9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs)

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Kertausluento. Vilkkumaa / Kuusinen 1

Tekijä Pitkä matematiikka On osoitettava, että jana DE sivun AB kanssa yhdensuuntainen ja sen pituus on 4 5

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

Lohkoasetelmat. Heliövaara 1

Hilbertin aksioomat ja tarvittavat määritelmät Tiivistelmä Geometria-luentomonisteesta Heikki Pitkänen

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Vastaukset 1. A = (-4,3) B = (6,1) C = (4,8) D = (-7,-1) E = (-1,0) F = (3,-3) G = (7,-9) 3. tämä on ihan helppoa


Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

Lukumäärän laskeminen 1/7 Sisältö ESITIEDOT:

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Kuusinen/Heliövaara 1

a) Arkistokatu ja Maaherrankatu ovat yhdensuuntaiset. Väite siis pitää paikkansa.

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

x 7 3 4x x 7 4x 3 ( 7 4)x 3 : ( 7 4), 7 4 1,35 < ln x + 1 = ln ln u 2 3u 4 = 0 (u 4)(u + 1) = 0 ei ratkaisua

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

c) Vektorit ovat samat, jos ne ovat samansuuntaiset ja yhtä pitkät. Vektorin a kanssa sama vektori on vektori d.

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Osa 2: Otokset, otosjakaumat ja estimointi

2. Keskiarvojen vartailua

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

33. pohjoismainen matematiikkakilpailu 2019 Ratkaisut

Johdanto 2. 2 Osamääräkunnan muodostaminen 7. 3 Osamääräkunnan isomorfismit 16. Lähdeluettelo 20

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Opiskelija viipymisaika pistemäärä

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Lohkoasetelmat. Kuusinen/Heliövaara 1

3. Kongruenssit. 3.1 Jakojäännös ja kongruenssi

pitkittäisaineistoissa

Vastepintamenetelmä. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Toimittaja Erä

Harjoitus 9: Excel - Tilastollinen analyysi

Helsingin, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo 10 13

Sovellettu todennäköisyyslaskenta B

Juuri 3 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Simuloinnin strategisia kysymyksiä

Harha mallin arvioinnissa

Matematiikan olympiavalmennus

pitkittäisaineistoissa

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

203 Asetetaan neliöt tasoon niin, että niiden keskipisteet yhtyvät ja eräiden sivujen välille muodostuu 45 kulma.

KOHDE: Kansakoulukuja 1 Fredrikinkatu 57 Tilatiedot 1. Kerros

Salausmenetelmät. Veikko Keränen, Jouko Teeriaho (RAMK, 2006)

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Kurssikoe on maanantaina Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

Load

Simuloinnin strategisia kysymyksiä

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä

Juuri 3 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus regressioanalyysiin. Heliövaara 1

Lataa ilmaiseksi mafyvalmennus.fi/mafynetti. Valmistaudu pitkän- tai lyhyen matematiikan kirjoituksiin ilmaiseksi Mafynetti-ohjelmalla!

0, niin vektorit eivät ole kohtisuorassa toisiaan vastaan.

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä

ARKISTOLUETTELO A MERKINTÄKIRJAT. Aa Luokkien päiväkirjat. sis. 5 sidosta. 1 kansio. Aa: Päiväkirjoja. Päiväkirja. 4 sidosta.

9 Projektiivisen geometrian alkeita

Projektiivisen geometrian alkeita

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

Estimointi. Vilkkumaa / Kuusinen 1

ATH-koulutus: R ja survey-kirjasto THL ATH-koulutus / Tommi Härkänen 1

Nopea kertolasku, Karatsuban algoritmi

Ratkaisut vuosien tehtäviin

Transkriptio:

8. Osittaiset 2 k faktorikokeet Faktoreiden lukumäärän k kasvaessa 2 k koeasetelmassa kasvaa koetoistojen (runs) määrää nopeasti täydessä toteutuksessa (complete replicate). Esimerkiksi 2 6 asetelman täysi toteutus vaatii 64 koetoistoa. Vapausasteita on kaikkiaan 63, joista vain 6 tarvitaan päävaikutusten estimointiin ja 15 toisen asteen yhdysvaikutusten estimoimiseksi. Loput 42 kuluvat kolmannen ja sitä korkeamman asteen yhdysvaikutusten estimointiin. 1

Niinpä, jos voidaan olettaa, että korekeamman asteen tekijät ovat käytännön kannalta merkityksettömiä, voidaan alemman asteen vaikutukset estimoida toteuttamalla vain osa täyden asetelman vaihtoehdoista. Tällaista koeasetelmaa sanotaan osittaiseksi faktorikokeeksi (fractional factorial design). Käyttökelpoinen etenkin, kun etsitään merkittäviä faktoreita suuresta määrästä potentiaalisia faktoreita. 2

Osittaisten faktorikokeiden käyttökelpoisuus nojautuu kolmeen periaatteeseen: (1) The sparsity of effects principle (Vaikutustekijöiden vähälukuisuus): Ainoastaan päävaikutukset ja alhaisen asteen yhdysvaikutukset vaikuttavat koetulokseen. (2) The projection property (Projisointiominaisuus): Identifioimalla osittaiskokeiden avulla merkittävät faktorit voidaan niiden suhteen toteuttaa korkeamman asteen yhdysvaikutukset sisältävä koe. (3) Sequential experimentation (Peräkkäistoteutus) Kahden tai useamman osittaiskokeen toistot (runs) voidaan yhdistää laajemmaksi asetelmaksi, josta saadan estimoitua halutut pää- ja yhdysvaikutukset. Näihin palataan tuonnempana. 3

8.1 The one-half fraction of the 2 k design (2 k kokeen puolitettu ositus) Jos 2 k kokeen toistoista voidaan toteuttaa vain puolet, eli 2 k /2 = 2 k 1, sanotaan asetelmaa 2 k kokeen puolitetuksi osittaiskokeeksi (one-half fraction) tai 2 k 1 asetelmaksi (2 k 1 design). 4

Käytännössä puolitettu asetelma toteutetaan siten, että tehdään kokeet, joissa korkeimman asteen yhdysvaikutustekijä on samaa merkkiä. Esimerkki 8.1: 2 3 kokeen puolitettu osakoe 2 3 1, jossa on siis 2 2 = 4 käsittelykombinaatiota. Vaihtoehtoina on toteuttaa käsittelyt, joissa ABC = +1 tai ABC = 1. Vaihtoehdossa ABC = +1 toteutetaan A B C AB AC BC ABC -1-1 +1 +1-1 -1 +1 +1-1 -1-1 -1 +1 +1-1 +1-1 -1 +1-1 +1 +1 +1 +1 +1 +1 +1 +1 Havaitaan, että AB = C, AC = B ja BC = A, täten kokeessa toisen asteen yhdysvaikutukset sulautuvat päävaikutuksiin, eikä niitä voida erikseen estimoida. 5

Itse asiassa estimoitaessa päävaikutuksia A, B ja C, estimoiduksi tuleekin päävaikutusten ja toisen asteen yhdysvaikutusten yhdistetyt tekijät, eli A + BC, B + AC ja C + AB. Tämä on hinta, joka joudutaan osittaiskokeessa maksamaan. Tässä konkretisoituu osittaiskokeen perusoletus: The sparsity of effects principle, joka 2 3 1 kokeessa tarkoittaa, että ainoastaan päävaikusten tulisi olla todellisuudessa merkityksellisiä. Vaihtoehto ABC = 1 johtaa käsittelyihin A B C AB AC BC ABC -1 +1 +1-1 -1 +1-1 +1 +1-1 +1-1 -1-1 -1-1 -1 +1 +1 +1-1 +1-1 +1-1 +1-1 -1 Havaitaan: AB = C, AC = B ja BC = A, eli yhdysvaikutukset jälleen sulautuvat päävaikutuksiin ja kun estimoidaan päävaikutukset A, B ja C estimoidaan itse asiassa A BC, B AC ja C AB. 6

Huom. 8.1: Tekijää ABC sanotaan 2 3 1 kokeen generaattoriksi. Huom. 8.2: Merkitsemällä ABC:n +1 saraketta 1 1 (1) I = 1 1 vektorilla, sanotaan relaatiota (2) I = ABC 2 3 1 koeasetelman määrittäväksi relaatioksi (defining relation). 7

Huom. 8.3: Relaation (3) I = +ABC määräämää ositusta sanotaan pääositukseksi (principal fraction) ja (4) I = ABC määräämää ositusta sanotaan komplementaariseksi (complementary) ositukseksi. 8

Asetelman resoluutio (design resolution) Edellä olevan esimerkin 2 3 1 asetelmaa sanotaan resoluutio III asetelmaksi (resolution III design). Siinä toisen asteen yhdysvaikutukset sulautuvat päävaikutuksiin (tai päävaikutukset sulautuvat toisen asteen tekijöiden kanssa). 9

Yleisesti sanotaan, että asetelman resoluutio on R, jos mikään p:n faktorin vaikutus ei sulaudu sellaisten vaikutusten kanssa, jotka muodostuvat vähemmästä kuin R p faktorista. 2 3 1 asetelmassa R = 3, p = 1 ja päävaikutukset sulautuvat R p = 3 1 = 2 faktorin muodostamiin (yhdys)vaikutuksiin. I = ABC (tai I = ABC) määräämää asetelmaa sanotaan usein myös 2III 3 1 asetelmaksi, joka osoittaa, että kysymyksessä on puolitettu osittaiskoe, jonka resoluutio on III. 10

Käytännön sovelluksissa resoluutiot III, IV ja V ovat käytettyjä: III resoluution kokeet (Resolution III designs): Päävaikutukset sulautuvat toisen asteen vaikutusten kanssa, mutta eivät muiden päävaikutukten kanssa. Toisen asteen vaikutukset voivat sulautua muihin toisen asteen vaikutuksiin. IV resoluution kokeet (Resolution IV designs): Päävaikutukset eivät sulaudu päävaikutusten kanssa eivätkä toisen asteen vaikutusten kanssa, mutta toisen asteen vaikutukset ovat sulautuneet joidenkin muiden toisen asteen vaikutusten kanssa. Esimerkiksi 2 4 1, asetelma, jossa I = ABCD, on IV asetelma (2 4 1 IV ). Resoluution V kokeet (Resolution V designs): Päävaikutukset eivätkä toisen asteen vaikutukset sulaudu muihin pää- tai toisen asteen vaikutuksiin. Toisen asteen vaikutukset ovat sulautuneet kolmannen asteen yhdysvaikutusten kanssa. Esimerkiksi 2 5 1, jossa I = ABCDE on 2 5 1 V asetelma. 11

Tavoitteena on aina korkein mahdollinen resoluutio, jolloin pienin määrä interaktioita sulautuu. 12

Puolittaisen osakokeen asetelman konstruointi 2 k puolittaisen asetelman eli 2 k 1 -asetelman korkeimman resoluution koe saadaan konstruoitua muodostamalla täysi 2 k 1 -kokeen asetelma, siten, että viimeinen faktori K = ABC (K 1). 13

Esimerkki 8.2: 2 4 1 IV -asetelma Full 2 3 factorial 2 4 1 IV, I = ABCD Run A B C A B C D = ABC 1-1 -1-1 -1-1 -1-1 2 +1-1 -1 +1-1 -1 +1 3-1 +1-1 -1 +1-1 +1 4 +1 +1-1 +1 +1-1 -1 5-1 -1 +1-1 -1 +1 +1 6 +1-1 +1 +1-1 +1-1 7-1 +1 +1-1 +1 +1-1 8 +1 +1 +1 +1 +1 +1 +1 Havaitaan esimerkiksi, että AD = A(ABC) = A 2 BC = BC eli AD sulautuu BC:n kanssa. Huomattavaa kuitenkin on, että valitsemalla mitkä tahansa kolme faktoria, kuten A, C ja D, niin ACD, AC, eikä CD sulaudu mihinkään tekijöiden A, C ja D muodostamiin pää- tai yhdysvaikutuksiin. Toisin sanoen yllä oleva 2 4 1 IV 2 3 faktorikokeen. asetelma sisältää täyden 14

Huom. 8.4: Mitä tahansa interaktion termiä voidaan käyttää viimeisen (k:nnen) faktorin sarakkeen muodostamiseksi, mutta ainoastaan ABC (K 1) tuottaa korkeimman resoluution mukaisen asetelman. 15

Osittaiskokeen projisointi faktorikokeeksi (Projection property): Jokainen resoluution R osittaiskoe sisältää täyden R 1 faktorin kokeen (ks. Esim. 8.2). Toisin sanoen resoluution R koe projisoituu täydeksi R 1 faktorin kokeeksi. Käyttökelpoinen, jos havaitaan, että viimeisellä faktorilla ei ole vaikutusta vastemuuttujaan. Yleistys: Jokainen 2 k 1 prosjisoituu kahden toiston täydeksi 2 k 2 faktorikokeeksi, neljän toiston täydeksi 2 k 3 faktorikokeeksi, jne. 16

Esimerkki 8.3: Suodatusesimerkki (Esim. 6.4). Alkuperäinen asetelma on 2 4, jossa on yksi toisto (replicate) kullakin faktorikombinaatiolla. Päävaikutukset A, C ja D sekä yhdysvaikutukset AC ja AD osoittautuivat nollasta poikkeavikisi. Oletetaan, että olisi toteutettu 2 4 1 -asetelma, jossa I = ABCD, eli 2 4 1 IV asetelma (resoluution IV), jossa toteutettavat käsittelyt ovat kuten Esimerkissä 8.2. proc glm:llä toteutettuna saadaan regressioestimaatit tekijöille A, B, C, D, AB, AC, AD. Todellisuudessa edellä olevat tekijät sisältävät myös sulautunvan termin tekijät, eli A A + BCD, B B + ACD, C C + ACD, D D + ABC, AB AB + DC, AC AC + BD, AD AD + BC. 17

Title "Design of Experiments: Example 8.3 2ˆ(4-1) resolution IV"; data ex83; input A B C D y; datalines; -1-1 -1-1 45 +1-1 -1 +1 100-1 +1-1 +1 45 +1 +1-1 -1 65-1 -1 +1 +1 75 +1-1 +1-1 60-1 +1 +1-1 80 +1 +1 +1 +1 96 ; Title2 "Regression coefficients for the full model"; proc glm data = ex83; model y = A B C D A*B A*C A*D /ss3; run; 18

Tuloksiksi saadaan: Intercept 70.75 A [+ BCD] 9.50 B [+ ACD] 0.75 C [+ ABD] 7.00 D [+ ABC] 8.25 AB [+ CD] -0.50 AC [+ BD] -9.25 AD [+ BC] 9.50 B:n ja AB:n kertoimet ovat selvästi merkityksettömiä. Pudottamalla ne pois vapautuu kaksi vapausastetta, jolloin voidaan aidosti estimoida jäljellä olevien parametrien merkitsevyyttä. 19

Toteuttamalla proc glm data = ex83; model y = A C D A*C A*D /ss3; run; saadaan The GLM Procedure Dependent Variable: y R-Square Coeff Var Root MSE y Mean 0.997884 2.548093 1.802776 70.75000 Source DF Type III SS Mean Square F Value Pr > F A 1 722.0000000 722.0000000 222.15 0.0045 C 1 392.0000000 392.0000000 120.62 0.0082 D 1 544.5000000 544.5000000 167.54 0.0059 A*C 1 684.5000000 684.5000000 210.62 0.0047 A*D 1 722.0000000 722.0000000 222.15 0.0045 Standard Parameter Estimate Error t Value Pr > t Intercept 70.75000000 0.63737744 111.00 <.0001 A 9.50000000 0.63737744 14.90 0.0045 C 7.00000000 0.63737744 10.98 0.0082 D 8.25000000 0.63737744 12.94 0.0059 A*C -9.25000000 0.63737744-14.51 0.0047 A*D 9.50000000 0.63737744 14.90 0.0045 20

Lopputulos on lähes sama kuin Esimerkissä 6.4. Ero johtuu pääasiassa siitä, että kukin tekijä on sulautuneiden tekijöiden summa. Kuitenkin, koska esimerkiksi B:n päävaikustus on merkityksetön, niin on uskottavaa, että myös korkeamman asteen termit, joissa B on mukana ovat merkityksettöminä, eli A + BCD A, AC + BD AC ja AD + BC AD. 21

Esimerkki 8.4: 2 5 1 asetelma piirilevyn tuotannon parantamisessa. Vastemuuttuja: y: piirilevytuotannon tuottavuus (process yield), sopivissa yksiköissä mitattuna. Faktorit: A: Apperture setting (small, large) B: Exposure time (20 percent below nominal, 20 percent above nominal) C: Develop time (30s, 40s) D: Mask dimension (small, large) E: Etch time (14.5 min, 15.5 min) 22

Generaattorin I = ABCDE mukaisen asetelman havainnot: ==================================== Run A B C D E = ABCD y ------------------------------------ 1 - - - - + 8 2 + - - - - 9 3 - + - - - 34 4 + + - - + 52 5 - - + - - 16 6 + - + - + 22 7 - + + - + 45 8 + + + - - 60 9 - - - + - 6 10 + - - + + 10 11 - + - + + 30 12 + + - + - 50 13 - - + + + 15 14 + - + + - 21 15 - + + + - 44 16 + + + + + 63 ==================================== Jokainen päävaikutus sulautuu neljännen asteen yhdysvaikutuksen kannsa, esimerkiksi A = BCDE. Vastaavasti jokainen toisen asteen yhdysvaikutus sulautuu jonkin kolmannen asteen yhdysvaikutuksen kanssa, esimerkiksi AB = CDE. 23

Kuitenkaan päävaikutukset eivätkä toisen asteen vaikutukset sulaudu muihin päävaikutuksiin tai toisen asteen vaikutuksiin. Täten kysymyksessä on resoluution V asetelma, eli 2 5 1 V koeasetelma. 24

SAS-ajo: Title "Design of Experiments, Example 8.4"; Title2 "Integrated circuit process improvement"; options ls = 80; data example84; input A B C D E y; label A = "Aperture: -1 = small, +1 = large" B = "Exposure time: -1 = -20%, +1 = +20%" C = "Develop time: -1 = 30s, +1 = 40s" D = "Mask dimension: -1 = Small, +1 = Large" E = "Etch time: -1 = 14.5 min, +1 = 15.5 min" y = "Process yield"; datalines; -1-1 -1-1 +1 8 +1-1 -1-1 -1 9-1 +1-1 -1-1 34 +1 +1-1 -1 +1 52-1 -1 +1-1 -1 16 +1-1 +1-1 +1 22-1 +1 +1-1 +1 45 +1 +1 +1-1 -1 60-1 -1-1 +1-1 6 +1-1 -1 +1 +1 10-1 +1-1 +1 +1 30 +1 +1-1 +1-1 50-1 -1 +1 +1 +1 15 +1-1 +1 +1-1 21-1 +1 +1 +1-1 44 +1 +1 +1 +1 +1 63 ; run; proc glm data = example84; Title3 "Regression coefficients"; model y = A B C D E@2; run; quit; 25

Kokoamalla tulokset estimoinnista, saadaan ======================================================== Regression Effect Coefficient Estimate Parameter Estimate (= 2 x reg coeff) SS -------------------------------------------------------- Intercept 30.3125 A 5.5625 11.125 495.0625 B 16.9375 33.875 4590.0625 C 5.4375 10.875 473.0625 D -0.4375-0.875 3.0625 E 0.3125 0.625 1.5625 A*B 3.4375 6.875 189.0625 A*C 0.1875 0.375 0.5625 A*D 0.5625 1.125 5.0625 A*E 0.5625 1.125 5.0625 B*C 0.3125 0.625 1.5625 B*D -0.0625-0.125 0.0625 B*E -0.0625-0.125 0.0625 C*D 0.4375 0.875 3.0625 C*E 0.1875 0.375 0.5625 D*E -0.6875-1.375 7.5625 ======================================================== Huom. Regressio-kertoimet ilmaisevat yhden yksik\"on muutoksen ja "effect estimate" ilmaisee muutoksen -1:sta +1:een, eli kahden yksikon muuoksen. Taten effect estimate = 2 x regression coefficeint. 26

Silmämääräisesti havaitaan välittömästi, että muut kuin päävaikutukset A (= A + BCDE), B (= B + ACDE), C (= C +ABDE) ja yhdysvaikutus AB (= AB +CDE) ovat selvästi vähämerkityksellisiä. Alla oleva normaalijakauman kvantiilikuvio (qq-plot) vahvistaa tämän näkemyksen. Huom. Vaikka kaikkiin termeihin sulautuu korkeamman asteen termejä, ne eivät ole ilmeisesti merkityksellisiä, sillä kaikki sulautuvat tekijät ovat vähintään kolmatta astetta, eikä mikään niistä sinänsä näytä olevan merkityksellinen. 27

Normal Quantile Plot 2 A B 1 AB C 0-2 0 2 4 6 8 10 12 14 16 18-1 -2 Tulkitsemalla merkityksettömät termit satunnaiskohinaksi ja tekijät muuttujiksi, jotka saavat arvoja välillä [ 1, 1], estimoidaan malli (5) y = μ + β a A + β a B + β c C + β ab AB + ε. Saadaan: proc glm data = example84; model y = A B C A*B; run; 28

R-Square Coeff Var Root MSE y Mean 0.995119 5.280927 1.600781 30.31250 Source DF Type III SS Mean Square F Value Pr > F A 1 495.062500 495.062500 193.20 <.0001 B 1 4590.062500 4590.062500 1791.24 <.0001 C 1 473.062500 473.062500 184.61 <.0001 A*B 1 189.062500 189.062500 73.78 <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept 30.31250000 0.40019526 75.74 <.0001 A 5.56250000 0.40019526 13.90 <.0001 B 16.93750000 0.40019526 42.32 <.0001 C 5.43750000 0.40019526 13.59 <.0001 A*B 3.43750000 0.40019526 8.59 <.0001 29

1 s r e s 0-1 -2 20 40 60 yhat Residuaalikuviot näyttävät jäännösten olevan satunnaisia. Regressiokertoimet ovat positiivisia, joten tuotos maksimoituu, kun faktoreiden arvot valitaan +1:stä vastaaviksi. 30

Peräkkäisyys (Sequences of Fractional Factorials) Osaittaisfaktorikokeiden etu on niiden ekonomisuus ja tehokkuus. Edut korostuvat, jos koeasetelmat on tehtävissä peräkkäin. 31

Esimerkiksi k = 4 faktorin kokeessa täydessä kokeessa on 2 4 = 16 käsittelykombinaatiota. Yleensä kannattaa toteuttaa koe peräkkäisenä sitem, että ensin toteutetaan 2 4 1 IV asetelma, esimerkiksi I = ABCD (kahdeksan käsittelyä). Jos ei saada selkeää kuvaa faktoreiden (yhdys) vaikutuksista, voidaan toteuttaa I = ABCD. Tällöin koko koe muodostaa lohkokokeen, jossa lohkotekijänä on ABCD. Korkein yhdysvaikutus (ABCD) informaatio menetetään, mutta useimmissa tapauksissa tätä toista puolikasta ei tarvitse toteuttaa, jolloin syntyy (merkittävä) säästö. 32

Esimerkki 8.5: Tarkastellaan Esimerkin 8.1 (Esim. 6.4 aineisto) komplementaarista puolta (I = ABCD) =============== A B C D y --------------- - - - + 43 + - - - 71 - + - - 48 + + - + 104 - - + - 68 + - + + 86 - + + + 70 + + + - 65 =============== 33

========================================= I = ABCD ----------------------------------------- A B C D AB AC AD y ----------------------------------------- -1-1 -1-1 +1 +1 +1 45 +1-1 -1 +1-1 -1 +1 100-1 +1-1 +1-1 +1-1 45 +1 +1-1 -1 +1-1 -1 65-1 -1 +1 +1 +1-1 -1 75 +1-1 +1-1 -1 +1-1 60-1 +1 +1-1 -1-1 +1 80 +1 +1 +1 +1 +1 +1 +1 96 ----------------------------------------- 19.0 1.5 14.0 16.5-1.0-18.5 19.0 = mean(factor. y) ========================================= ======================================================== I = -ABCD -------------------------------------------------------- A B C D AB AC AD y -------------------------------------------------------- -1-1 -1 +1 +1 +1-1 43 +1-1 -1-1 -1-1 -1 71-1 +1-1 -1-1 +1 +1 48 +1 +1-1 +1 +1-1 +1 104-1 -1 +1-1 +1-1 +1 68 +1-1 +1 +1-1 +1 +1 86-1 +1 +1 +1-1 -1-1 70 +1 +1 +1-1 +1 +1-1 65 -------------------------------------------------------- 24.25 4.75 5.75 12.75 1.25-17.75 14.25 ======================================================== 34

================================== Aliased effects in I = -ABCD in I = ABCD ---------------------------------- A - BCD = 24.25 A + BCD = 19.0 B - ACD = 4.75 B + ACD = 1.5 C - ABD = 5.75 C + ABD = 14.0 D - ABC = 12.75 D + ABC = 16.5 AB - CD = 1.25 AB + CD = -1.0 AC - BD =-17.75 AC + BD = -18.5 AD - BC = 14.25 AD + BC = 19.0 ================================== True Effect Estimates (from the Aliased effects) A = 21.63 = [(A-BCD)+(A+BCD)]/2 B = 3.13 C = 9.88 D = 14.63 AB = 0.13 AC = -18.13 AD = 16.63 ABC = 1.88 = [(D+ABC)-(D-ABC)]/2 ABD = 4.13 ACD = -1.63 BCD = -2.63 Havaitaan, että estimaatit (= 2 reg.coeff) ovat samat kuin alkuperäisessä täydessä kokeessa. Yhdysvaikutuksista ainoastaan AC ja AD ovat merkityksellisiä, 35

8.2 The One-Quarter Fraction of the 2 k Design (2 k asetelman neljännes ositus) 2 k -asetelman neljännesositus saadaan, kun kokeesta tehdään 2 k 2 = 2 k /4 käsittelykombinaatiota. Toteutus: Laaditaan 2 k 2 asetelmaa vastaava täysi faktorikoe ja määrätään jäljelle jäävien kahden faktorin käsittelyt kahden sopivan yhdysvaikutuksen avulla. Täten 2 k 2 asetelmassa on kaksi generaattoria. Merkitään generaattoreita P :llä ja Q:lla. I = P ja I = Q ovat asetelman generoivat relaatiot. 36

Generaattorin etumerkki määrää minkä neljänneksen mukaan koe toteutetaan. ±P ja ±Q ovat P :n ja Q:n muodostman generaattoriperheen jäseniä. Ositus, jossa molemmat P ja Q ovat positiivisia määrittää pääosituksen (pricnipal fraction). 37

Asetelman (täysin) määrittävä relaatio (complete defining relation) muodostuu sarakkeiden mukaan, jotka ovat ykkösvektoreita (= I). Näitä ovat P, Q ja P Q (I = P = Q = P Q). Termiä P Q sanotaan yleistetyksi yhdysvaikutukseksi (generalized interaction). Tekijöitä P, Q ja P Q määrittävässä relaatiossa kutsutaan sanoiksi (words). Huom. 8.5: Asetelman resoluutio on sama kuin määrittävän generaattorin lyhimmän sanan pituus (eli kirjaimien lukumäärä). Sulautuvat tekijät, joita sanotaan usein myös alias tekijöiksi, muodostuvat kun kerrotaan tekijöiden sarakkeet P :llä Q:lla ja P Q:lla. 38

Esimerkki 8.6: 2 6 2 aliasrakenne. Valitaan generaattorit I = ABCE ja I = BCDF. Asetelman määrittävä relaatio on tällöin (6) I = ABCE = BCDF = ADEF, joten asetelman resoluutio on IV. Aliasrakenne (sulautumiset) ================================================= A = BCE = DEF = ABCDF AB = CE = ACDF = BDEF B = ACE = CDF = ABDEF AC = BE = ABDF = CDEF C = ABE = BDF = ACDEF AD = EF = BCDE = ABCF D = BCF = AEF = ABCDE AE = BC = DF = ABCDEF E = ABC = ADF = BCDEF AF = DE = BCEF = ABCD F = BCD = ADE = ABCEF BD = CF = ACDE = ABEF BF = CD = ACEF = ABDE ABD = CDE = ACF = BEF ACD = BDE = ABF = CEF ================================================= Täten, kun estimoidaan päävaikutus A, estimoidaan tosiasiassa efekti A + BCE + DEF + ABCDF. 39

Taulukosta havaitaan, että jokainen päävaikutus sulautuu joidenkin kolmen ja viiden faktorin yhdysvaikutusten kanssa, mutta ei toisen asteen vaikutusten kanssa. Toisen asteen vaikutukset ovat sulautuneet joidenkin toisen asteen vaikutusten kanssa. Täten kysymyksessä tosiaankin on resoluution IV, eli 2 6 2 IV asetelma. 40

Esimerkki 8.7: Parts manufacture in an injection molding process show excessive shrinkage. Six factors impact on the shrinkage are investigated: A: Mold temperature B: Screw speed C: Holding time D: Cycle time E: Gate size F : Holding pressure Each factor has two levels. y: Shrinkage in percentage (response variable). 2 6 2 design is used with one replicate, i.e a 16 runs two-level fractional factorial design. Generating relations: I = ABCE and I = BCDF. Complete generating relations: I = ABCE = BCDF = ADEF, implying a 2 6 2 IV design. 41

Data: ================================== Basic design ------------ A B C D E = ABC F = BCD y --------------------------------- - - - - - - 6 + - - - + - 10 - + - - + + 32 + + - - - + 60 - - + - + + 4 + - + - - + 15 - + + - - - 26 + + + - + - 60 - - - + - + 8 + - - + + + 12 - + - + - - 34 + + - + - - 60 - - + + + - 16 + - + + - - 5 - + + + - + 37 + + + + + + 52 ================================= 42

SAS-ajo options ls = 80; Title "Example 8.7: Injection Molding Process"; Title2 "A 2ˆ6-2 Resolution IV Design"; data example86; input A B C D y; E = A*B*C; F = B*C*D; label A = "Mold temperature" B = "Screw speed" C = "Holding time" D = "Cycle time" E = "Gate size" F = "Holding pressure" y = "Shrinkage of manufatured parts (x 10)"; datalines; -1-1 -1-1 6 +1-1 -1-1 10-1 +1-1 -1 32 +1 +1-1 -1 60-1 -1 +1-1 4 +1-1 +1-1 15-1 +1 +1-1 26 +1 +1 +1-1 60-1 -1-1 +1 8 +1-1 -1 +1 12-1 +1-1 +1 34 +1 +1-1 +1 60-1 -1 +1 +1 16 +1-1 +1 +1 5-1 +1 +1 +1 37 +1 +1 +1 +1 52 ; run; proc glm data = example86; Title3 "Regression Estimates of the Full Model"; model y = A B C D E F A*B A*C A*D A*E A*F B*D B*F A*B*D A*C*D / ss3; run; quit; 43

=================================== Parameter Estimate SS ----------------------------------- Intercept 27.3125 A 6.9375 770.0625 B 17.8125 5076.5625 C -0.4375 3.0625 D 0.6875 7.5625 E 0.1875 0.5625 F 0.1875 0.5625 A*B 5.9375 564.0625 A*C -0.8125 10.5625 A*D -2.6875 115.5625 A*E -0.9375 14.0625 A*F 0.3125 1.5625 B*D -0.0625 0.0625 B*F -0.0625 0.0625 A*B*D 0.0625 0.0625 A*C*D -2.4375 95.0625 =================================== Tekijöiden A (alias A + BCE + DEF + ABCDF), B (B + ACE + CDF + ABDEF) ja AB (AB + CE + ACDF + BDEF) kertoimet poikkeavat ainoastaan merkittävästi nollata. Tämä näkyy selvästi narmaalijakauman kavantiilikuviosta. 44

Regressiokertoimien normaalijakauman qq-plot (vasen kuvio) ja AB-interaktio (oikealla). 2.5 70 1.5 AB A B 60 50 B+ Normal value (z) 0.5-5 0 5 10 15 20-0.5 Shrinkage 40 30 B+ 20-1.5 10 B- B- -2.5 Factor regression estimate 0-1 +1 Mold temperature (A) Merkittäviä tekijöitä ovat siis vain A ja B sekä niiden yhdysvaikutus. Oikean puolen kuvioista nähdään, että prosessiiin ei paljoakaan vaikuta A:n taso (mold temperature), jos B (screw speed) on -1 eli alhaalla. Sen sijaan prosessi on sensitiivinen lämpötilalle, jos B on +1 (screw speed high). Pitämällä B alhaalla on kutistuminen noin 10 prosentin luokkaa riippumatta lämpötilasta. Pienimpään kutistumaan päästään siis, kun A ja B ovat alimmissa arvoissaan. 45

2.5 10 8 1.5 A B 6 AB 4 Normal value (z) 0.5-8 -6-4 -2 0 2 4 6 8 10-0.5 Residuals 2 0-2 -1 0 1 2-2 -1.5-4 -6-2.5-8 Residual Factor C Residuaalien normaalisuuskuvio ei osoita suurempia poikkeamia. Residuaalien variaatio näyttää kuitenkin olevan riippuvainen C:n arvoista. Säätämällä C alimpaan arvoon minimoituu myös vaihtelu, eli tuotteet ovat homogeenisempia. 46

Huom. 8.6: 2 6 2 IV asetelma voidaan projisoida yhden toiston täydeksi 2 4 faktorikokeeksi, kahden toiston 2 3 kokeeksi ja neljän toiston 2 2 kokeeksi. Esimerkki 8.8: Esimerkissä 8.7 vain faktoreilla A ja B sekä yhdysvaikutuksella AB on vaikutusta, joten yllä oleva koe projisoitui 2 2 kokeeksi, jossa on n = 4 toistoa per käsittely kombinaatio. Huom 8.7: Yleisesi 2 k 2 osakoe voidaan projisoida joidenkin r:n faktorin, r k 2 täydeksi faktorikokeeksi tai osakokeeksi. Täydet 2 r kokeet voidaan muodostaa faktoreista, joiden kombinaatiot eivät muodosta sanoja (words) täysin määrittävässä relaatiossa (complete defining relation, I = P = Q = P Q). 47

8.3 Yleinen 2 k p Osakoe (General 2 k p Fractional Factorial Design) 2 k -kokeen osakoetta, jossa totetutetaan 2 k p käsittelykombinaatiota sanotaan 2 k -kokeen 1/2 p -osakokeeksi, lyhysti 2 k p -osakokeeksi (2 k p fractional factorial design). Määrittävä relaatio (complete defining relation) muodostuu p:stä (riippumattomasta) generaattorista ja niiden 2 p p 1 yleistetystä yhdysvaikutuksesta. Aliasrakenne saadaan selville kertomalla jokainen pää- ja yhdysvaikutustemi määrittävän relaation tekijöillä. 48

Resoluutio ilmaisee kuinka pahasti asetelman vaikutukset ovat sulautuneita (mitä alhaisempi sitä huonompi). Lähtökohtaisesti generaattorit valitaan siten, että saavutetaan mahdollisimman korkea resoluutio. Lisäksi, jos on useampia saman resoluutiotason asetelmia, niin yleensä kannattaa valita se, jolla on vähiten alimman tason aliasrekanteita. 49

Esimerkki 8.8: Kolmen 2 7 2 IV asetelman kahden faktorin interaktion aliasrakenteet: Generaattorit I Generaattorit II Generaattorit III F = ABC F = ABC F = ABCD G = BCD G = ADE G = ABDE AB = AC AB = AF CE = F G AC = BF AC = BF CF = EG AD = F G AD = EG CG = EF AG = DF AE = DG BD = CG AF = BC BG = CD AG = DE AF = BC = DG Vähiten toisen asteen yhdysvaikutusten aliasrakenteita muodostuu generaattoreiden III mukaisessa asetelmassa, joten se on paras vaihtoehto. 50

Määrittävän relaation (complete defining relation) sanojen pituuskaavio (length pattern) on lukujono, jossa kukin luku ilmaisee vastaavan sanan pituuden relaatiossa. Esimerkiksi 2 7 2 -asetelman määrittävn relaation I = ABCF = BCDG = ADF G pituuskaavio on {4, 4, 4}. Määrittävä relaatio, jossa on pienin määrä pituudeltaan lyhimpiä sanoja muodostaa pienimmän aberraation asetelman (minimum aberration design). 51

Voidaan osoittaa, että minimoimalla aberraatio resoluution R asetelmassa takaa, että pienin määrä päävaikutuksia sulautuu asteen R 1 yhdysvaikutusten kanssa, pienin määrä kahden tekijän yhdysvaikutuksia sulautuu asteen R 2 yhdysvaikutustan kanssa, jne. Esimerkki 8.9: Esimerkin 8.8 astelmien pituuskaaviot: I: 4, 4, 4, II: 4, 4, 5 ja III: 5, 5, 4. Täten asetelmassa III on pienin määrä lyhimpiä sanoja, joten se on pienimmän aberraation asetelma. Seuraavan sivun taulukkoon on koottu pienimmän aberraation asetelmia, kun k 8. 52

Selected 2 k p Fractional Factorial Designs: Number of Number Design factors,k Fraction of runs generators 3 2 3 1 III 4 C = ±AC 4 2 4 1 IV 8 D = ±ABC 5 2 5 1 V 16 E = ±ABCD 2 5 2 IV 8 D = ±AB E = ±AC 6 2 6 1 VI 32 F = ±ABCDE 2 6 2 IV 16 E = ±ABC F = ±BCD 2 6 3 III 8 D = ±AB E = ±AC F = ±BC 7 2 7 1 VII 64 G = ±ABCDEF 2 7 2 IV 32 F = ±ABCD G = ±ABDE 2 7 3 IV 16 E = ±ABC F = ±BCD G = ±ACD 8 2 8 2 V 64 G = ±ABCD H = ±ABEF 2 8 3 IV 32 F = ±ABC G = ±ABD H = ±BCDE 2 8 4 IV 16 E = ±BCD F = ±ACD G = ±ABC H = ±ABD 53

Esimerkki 8.9: Olkoon k = 7 ja tavoitteena on estimoida päävaikutukset ja saada joitain käsitystä toisen asteen yhdysvaikutuksia. Kolmen ja korkeamman asteen yhdysvaikutusten uskotaan olevan käytännössä merkityksettömiä. Näillä perusteilla resoluution IV asetelma on sopiva, sillä siinä päävaikutukset eivät sulaudu toisen asteen termien kanssa. Toisen asteen termit sulautuvat johinkin toisen asteen termeihin (tarkoituksena onkin saada jotain käsitystä toisen asteen yhdysvaikutuksista). Yllä olevan taukukon mukaan vaihtoehtoina ovat 2 7 2 IV (1/8 ositus, 16 tois- (1/4 ositus, 32 toistoa) tai 2 7 3 IV toa). 54

Tutkimalla aliasrakenteita tehdään lopullinen valinta. (ks. www.itl.nist.gov/div898/handbook- /pri/section3/eqns/2to7m2.txt ja www.itl.nist.gov/div898/handbook- /pri/section3/eqns/2to7m3.txt) Tässä tavoitteisiin nähden riittäväksi osoittautuu 2 7 3 IV - asetelma. 55

8.4 Placket-Burman asetelmat Placket-Burman (PB) koeasetelmat ovat osittaiskokeita, joissa voi olla maksimissaan k = N 1 faktoria, missä N neljällä jaollinen toistojen lukumäärä (12, 20, 24, 28, 36). Jos N on kakkosen potenssi, PB-asetelma palautuu tavanomaiseksi osittaiskokeeksi. PB-asetelmaa voidaan käyttää tapauksissa, joissa yhdysvaikutusten oletetaan olevan merkityksettömiä. Tällöin suuresta määrästä faktoreita voidaan PB-menetelmällä tehokkaasti seuloa tärkeimmät. Lisää asiasta: www.itl.nist.gov/div898/handbook/pri/section3/pri335.htm 56