proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

Title "Exercises 6"; Data ex61; input A B C D E y @@; Label A = "Furnance Temperature" B = "Heating Time" C = "Transfer Time" D = "Hold Down Time" E = "Quench of Oil Temperature" y = "Free Height of Leaf Spring"; datalines; -1-1 -1-1 -1 7.78-1 -1-1 -1-1 7.78-1 -1-1 -1-1 7.81 +1-1 -1 +1-1 8.15 +1-1 -1 +1-1 8.18 +1-1 -1 +1-1 7.88-1 +1-1 +1-1 7.50-1 +1-1 +1-1 7.56-1 +1-1 +1-1 7.50 +1 +1-1 -1-1 7.59 +1 +1-1 -1-1 7.56 +1 +1-1 -1-1 7.75-1 -1 +1 +1-1 7.54-1 -1 +1 +1-1 8.00-1 -1 +1 +1-1 7.88 +1-1 +1-1 -1 7.69 +1-1 +1-1 -1 8.09 +1-1 +1-1 -1 8.06-1 +1 +1-1 -1 7.56-1 +1 +1-1 -1 7.52-1 +1 +1-1 -1 7.44 +1 +1 +1 +1-1 7.56 +1 +1 +1 +1-1 7.81 +1 +1 +1 +1-1 7.69-1 -1-1 -1 +1 7.50-1 -1-1 -1 +1 7.25-1 -1-1 -1 +1 7.12 +1-1 -1 +1 +1 7.88 +1-1 -1 +1 +1 7.88 +1-1 -1 +1 +1 7.44-1 +1-1 +1 +1 7.50-1 +1-1 +1 +1 7.56-1 +1-1 +1 +1 7.50 +1 +1-1 -1 +1 7.63 +1 +1-1 -1 +1 7.75 +1 +1-1 -1 +1 7.56-1 -1 +1 +1 +1 7.32-1 -1 +1 +1 +1 7.44-1 -1 +1 +1 +1 7.44 +1-1 +1-1 +1 7.56 +1-1 +1-1 +1 7.69 +1-1 +1-1 +1 7.62-1 +1 +1-1 +1 7.18-1 +1 +1-1 +1 7.18-1 +1 +1-1 +1 7.25 +1 +1 +1 +1 +1 7.81 +1 +1 +1 +1 +1 7.50 +1 +1 +1 +1 +1 7.59 ; Tehtävä 6.1 a) Generaattori tässä on I = ABCD, joten kysymyksessä on 2_IV^(5-1) koe (resoluutio = määrittävän generaattorin lyhimmän sanan pituus, k.s. Huom. 8.5 luennot). Alisarakenne saadaan kertomalla vaikutukset generoivalla relaatiolla, täten esim. A = A(ABCD) = BCD, eli A ja BCD sulautuvat, B = B(ABCD) = ACD, eli B ja ACD sulautuvat, jne. Nämä saadaan myös helposti SAS-ohjelmalla antamalla MODEL määrityksessä ALISASING optio. Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; Kokoamalla (ja järjestelemällä hieman): 6.1a) Alias structure: A B C D E --> A + B*C*D --> B + A*C*D --> C + A*B*D --> D + A*B*C --> E + A*B*C*D*E

A*B --> A*B + C*D A*C --> A*C + B*D A*D --> A*D + B*C A*E --> A*E + B*C*D*E B*E --> B*E + A*C*D*E C*E --> C*E + A*B*D*E D*E --> D*E + A*B*C*E A*B*E --> A*B*E + C*D*E A*C*E --> A*C*E + B*D*E A*D*E --> A*D*E + B*C*E Vertaamalla aliasrakennetta luentojen kpl 6, sivun 11 määritelmiin havaitaan, että todellakin kysymyksessä on resoluution IV asetelma. 6.1 b) Estimointi voidaan toteuttaa joko ajamalla täysi malli ja poimimalla niistä tilastollisesti merkitsevät tai kirjoittamalla vain 6.1a) kohdan tekijät. Alla on menetelty jälkimmäisen vaihtoehdon mukaan: Title2 "Estimation of the model"; model y = A B C D E A*B A*C A*D B*E C*E D*E A*B*E A*C*E A*D*E / ss3; Results (ANOVA table) A 1 0.70325208 0.70325208 34.34 <.0001 B 1 0.32176875 0.32176875 15.71 0.0004 C 1 0.02950208 0.02950208 1.44 0.2386 D 1 0.09991875 0.09991875 4.88 0.0342 E 1 0.68401875 0.68401875 33.40 <.0001 A*B 1 0.01050208 0.01050208 0.51 0.4790 A*C 1 0.00001875 0.00001875 0.00 0.9760 A*D 1 0.00630208 0.00630208 0.31 0.5828 B*E 1 0.28060208 0.28060208 13.70 0.0008 C*E 1 0.01300208 0.01300208 0.63 0.4313 D*E 1 0.01880208 0.01880208 0.92 0.3449 A*B*E 1 0.00005208 0.00005208 0.00 0.9601 A*C*E 1 0.00460208 0.00460208 0.22 0.6386 A*D*E 1 0.04260208 0.04260208 2.08 0.1586 Päävaikutukset A B D E ja yhdysvaikutus BE osoittautuvat tilastollisesti merkitseviksi, joten valitaan ne lopulliseen malliin. Title2 "Exerceise 61 b) Final model"; model y = A B D E B*E / ss3; output out = ex61b_res p = yhat r = res rstudent = sres;

Lopullisen mallin estimointitulokset: 6.1b) Residuaalit talletettu ex61b_res-tiedostoon Sum of Source DF Squares Mean Square F Value Pr > F Model 5 2.08956042 0.41791208 21.91 <.0001 Error 42 0.80122083 0.01907669 Corrected Total 47 2.89078125 R-Square Coeff Var Root MSE y Mean 0.722836 1.811240 0.138118 7.625625 A 1 0.70325208 0.70325208 36.86 <.0001 B 1 0.32176875 0.32176875 16.87 0.0002 D 1 0.09991875 0.09991875 5.24 0.0272 E 1 0.68401875 0.68401875 35.86 <.0001 B*E 1 0.28060208 0.28060208 14.71 0.0004 Standard Parameter Estimate Error t Value Pr > t Intercept 7.625625000 0.01993567 382.51 <.0001 A 0.121041667 0.01993567 6.07 <.0001 B -0.081875000 0.01993567-4.11 0.0002 D 0.045625000 0.01993567 2.29 0.0272 E -0.119375000 0.01993567-5.99 <.0001 B*E 0.076458333 0.01993567 3.84 0.0004 Tehtävä 6.1 c): Tämä on paraste tehdä Excel-ohjelmalla, kopiomalla data sinne. Osoittautuu, että C*E luokissa residuaalikeskhajonta on 0.11, kun C*E = -1 ja 0.07, kun C*E = +1, joten F-arvo on (0.11/0.07)**2 = 2.59, df1 = df2 = N - 6 = 48-6 = 42 (havaintojen määrä - estimoidut parametrit), p-arvo on 0.026, varianssien yhtäsuuduustestissä, joten se on 5% tasolla tilastollisesti merkitsevä. Niinpä, CE = +1 näyttää kasvattavan satunnaisvirhettä lopputuloksessa. Tämä luonnollisesti kannattaa minimoida tuotantoprosessissa ja pyrkiä säätämään tuotantoprosessi siten, että CE = -1. Tehtävä 6.1 d) Jäännösten normaalisuutta saadaan takasteltua PROC UNIVARIATE:lla proc univariate data = ex61b_res normaltest; Title2 "Tehtävä 61b) Residuaalitarkastelut"; var res; qqplot res / normal(mu = 0 sigma = est);

Testisuureet antavat viitteitä, että normaalisuus ei ole aivan OK Shapiro-Wilk W 0.950694 Pr < W 0.0426 Kolmogorov-Smirnov D 0.130014 Pr > D 0.0415 Cramer-von Mises W-Sq 0.133213 Pr > W-Sq 0.0402 Anderson-Darling A-Sq 0.760526 Pr > A-Sq 0.0456 Kuitenkaan normaalisuuskuvio ei ole kovian hälyyttävä. Jonkin verran on havaittavissa 'S'muotoa, mikä viittaa että virhetermin jakauma olisi himan "ohuthäntäisempi" kuin normaalijakauma, kuitenkin symmetrinen, mikä on tärkeää. Poikkeama on normaalisuudesta on kuienkin siinä määrin vähäinen, ettei se vaikuttane tulokssiin. Etenkin kun toistoja on kolme per käsittelykombinaatio. Tehtävä 6.1.e) Resoluution V asetelma saadaan, jos toeteutetaan koe esimerkiksi, että E = ABCD Tehtävä 6.2: Jos tavoitteena on maksimoida y (mahdollisimman korkea free height, mikä tarkoittanee mahdollisimman suurta joustovaraa), niin faktorit säätää siten, että y maksimoituu, kuitenkin siten, että samalla virhevaihtelu olisi mahdollisimman pientä. Nyt C ei vaikuta y:hyn, joten se voidaan valita vapaasti. E:n kerroin on negatiivinen (-0.119) (E:n vaikutusta ei kuitnenkaan voida kontrolloida). CE ja ABDE sulautuvat, joten varianssin minimoimiseksi kannattaa valita C = -ABD, jolloin sulautumisen seurauksena CE ja ADBE vatakkaismerkkisinä mahdollisesti kumoavat toisensa. Niinpä, koska A:n ja D:n regressiokertoimet ovat positiivisia ja B:n negatiivinen, maksimoituu y, kun valitaan A = +1, B = -1 ja D = +1. Valitsemalla lisäksi C = +1, jolloin CE = (+1)E = E ja ABDE = (-1)E = -E (mahdollisesti) kumoavat toisiaan ja virhevariaatio pienenee. Tehtävä 6.3: a) Kysymyksessä on kahden tekijän hierarkinen asetelma (nested deesign), jossa koneen käyttäjät (operator) ovat satunnaistekijöitä ja koneisiin (machine) nähden hierarkisia. Toistoja n = 3. Tehtävä 6.3: b) Data ex63; input machine operator y @@; label y = "surface finish quality"; datalines;

1 1 25 1 2 19 1 3 15 1 4 15 2 1 19 2 2 23 2 3 18 2 4 35 3 1 14 3 2 35 3 3 38 3 4 25 1 1 30 1 2 28 1 3 17 1 4 16 2 1 17 2 2 24 2 3 21 2 4 27 3 1 15 3 2 21 3 3 54 3 4 29 1 1 26 1 2 20 1 3 14 1 4 13 2 1 14 2 2 21 2 3 17 2 4 25 3 1 20 3 2 24 3 3 50 3 4 33 ; proc glm data = ex63; class machine operator; model y = machine operator(machine) / ss3; random operator(machine) / test; Tulokset: machine 2 676.055556 338.027778 1.46 0.2815 Error 9 2077.583333 230.842593 Error: MS(operator(machine)) operator(machine) 9 2077.583333 230.842593 12.20 <.0001 Error: MS(Error) 24 454.000000 18.916667 Koneilla ei näytä olevan vaikutusta tulokseen. Sen sijaan koneen käyttäjien kesken lopputulos vaihtelee. Koneen käyttäjien koulutuksella on ilmeisesti mahdollista saada tuotantoa homogenisoitua.