proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

Samankaltaiset tiedostot
7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen

nopeasti täydessä toteutuksessa (complete replicate).

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

9.1 Hierarkiset asetelmat (Nested Designs)

A250A0050 Ekonometrian perusteet Tentti

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs)

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.


Osafaktorikokeet. Heliövaara 1

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Kertausluento. Vilkkumaa / Kuusinen 1

ATH-koulutus: R ja survey-kirjasto THL ATH-koulutus / Tommi Härkänen 1

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Tekijä Pitkä matematiikka On osoitettava, että jana DE sivun AB kanssa yhdensuuntainen ja sen pituus on 4 5

2. Tietokoneharjoitukset

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

Hilbertin aksioomat ja tarvittavat määritelmät Tiivistelmä Geometria-luentomonisteesta Heikki Pitkänen

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

a) Arkistokatu ja Maaherrankatu ovat yhdensuuntaiset. Väite siis pitää paikkansa.

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

Johdanto 2. 2 Osamääräkunnan muodostaminen 7. 3 Osamääräkunnan isomorfismit 16. Lähdeluettelo 20

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

2. Keskiarvojen vartailua

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

ARVIOINTIPERIAATTEET

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Vastaukset 1. A = (-4,3) B = (6,1) C = (4,8) D = (-7,-1) E = (-1,0) F = (3,-3) G = (7,-9) 3. tämä on ihan helppoa

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

( )

Vastepintamenetelmä. Kuusinen/Heliövaara 1

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i p X ip + u i

KOHDE: Kansakoulukuja 1 Fredrikinkatu 57 Tilatiedot 1. Kerros

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Testejä suhdeasteikollisille muuttujille

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

A DEA Game II. Juha Saloheimo S ysteemianalyysin. Laboratorio. Teknillinen korkeakoulu

203 Asetetaan neliöt tasoon niin, että niiden keskipisteet yhtyvät ja eräiden sivujen välille muodostuu 45 kulma.

Laskuharjoitus 9, tehtävä 6

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

j n j a b a c a d b c c d m j b a c a d a c b d c c j

Harjoitus 9: Excel - Tilastollinen analyysi

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä:

linux linux: käyttäjän oikeudet + lisää ja - poistaa oikeuksia

linux linux: käyttäjän oikeudet + lisää ja - poistaa oikeuksia

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Juuri 3 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

33. pohjoismainen matematiikkakilpailu 2019 Ratkaisut

Juuri 3 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

x 7 3 4x x 7 4x 3 ( 7 4)x 3 : ( 7 4), 7 4 1,35 < ln x + 1 = ln ln u 2 3u 4 = 0 (u 4)(u + 1) = 0 ei ratkaisua

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

v 8 v 9 v 5 C v 3 v 4

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Ratkaisut vuosien tehtäviin

Väliestimointi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

a) Mitkä seuraavista ovat samassa ekvivalenssiluokassa kuin (3, 8), eli kuuluvat joukkoon

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Lukumäärän laskeminen 1/7 Sisältö ESITIEDOT:

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Identifiointiprosessi

4. Tietokoneharjoitukset

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Identifiointiprosessi

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi

4. Tietokoneharjoitukset

pitkittäisaineistoissa

VETUMA-PALVELUN PALVELINVARMENTEET

Toimittaja Erä

Transkriptio:

Title "Exercises 6"; Data ex61; input A B C D E y @@; Label A = "Furnance Temperature" B = "Heating Time" C = "Transfer Time" D = "Hold Down Time" E = "Quench of Oil Temperature" y = "Free Height of Leaf Spring"; datalines; -1-1 -1-1 -1 7.78-1 -1-1 -1-1 7.78-1 -1-1 -1-1 7.81 +1-1 -1 +1-1 8.15 +1-1 -1 +1-1 8.18 +1-1 -1 +1-1 7.88-1 +1-1 +1-1 7.50-1 +1-1 +1-1 7.56-1 +1-1 +1-1 7.50 +1 +1-1 -1-1 7.59 +1 +1-1 -1-1 7.56 +1 +1-1 -1-1 7.75-1 -1 +1 +1-1 7.54-1 -1 +1 +1-1 8.00-1 -1 +1 +1-1 7.88 +1-1 +1-1 -1 7.69 +1-1 +1-1 -1 8.09 +1-1 +1-1 -1 8.06-1 +1 +1-1 -1 7.56-1 +1 +1-1 -1 7.52-1 +1 +1-1 -1 7.44 +1 +1 +1 +1-1 7.56 +1 +1 +1 +1-1 7.81 +1 +1 +1 +1-1 7.69-1 -1-1 -1 +1 7.50-1 -1-1 -1 +1 7.25-1 -1-1 -1 +1 7.12 +1-1 -1 +1 +1 7.88 +1-1 -1 +1 +1 7.88 +1-1 -1 +1 +1 7.44-1 +1-1 +1 +1 7.50-1 +1-1 +1 +1 7.56-1 +1-1 +1 +1 7.50 +1 +1-1 -1 +1 7.63 +1 +1-1 -1 +1 7.75 +1 +1-1 -1 +1 7.56-1 -1 +1 +1 +1 7.32-1 -1 +1 +1 +1 7.44-1 -1 +1 +1 +1 7.44 +1-1 +1-1 +1 7.56 +1-1 +1-1 +1 7.69 +1-1 +1-1 +1 7.62-1 +1 +1-1 +1 7.18-1 +1 +1-1 +1 7.18-1 +1 +1-1 +1 7.25 +1 +1 +1 +1 +1 7.81 +1 +1 +1 +1 +1 7.50 +1 +1 +1 +1 +1 7.59 ; Tehtävä 6.1 a) Generaattori tässä on I = ABCD, joten kysymyksessä on 2_IV^(5-1) koe (resoluutio = määrittävän generaattorin lyhimmän sanan pituus, k.s. Huom. 8.5 luennot). Alisarakenne saadaan kertomalla vaikutukset generoivalla relaatiolla, täten esim. A = A(ABCD) = BCD, eli A ja BCD sulautuvat, B = B(ABCD) = ACD, eli B ja ACD sulautuvat, jne. Nämä saadaan myös helposti SAS-ohjelmalla antamalla MODEL määrityksessä ALISASING optio. Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; Kokoamalla (ja järjestelemällä hieman): 6.1a) Alias structure: A B C D E --> A + B*C*D --> B + A*C*D --> C + A*B*D --> D + A*B*C --> E + A*B*C*D*E

A*B --> A*B + C*D A*C --> A*C + B*D A*D --> A*D + B*C A*E --> A*E + B*C*D*E B*E --> B*E + A*C*D*E C*E --> C*E + A*B*D*E D*E --> D*E + A*B*C*E A*B*E --> A*B*E + C*D*E A*C*E --> A*C*E + B*D*E A*D*E --> A*D*E + B*C*E Vertaamalla aliasrakennetta luentojen kpl 6, sivun 11 määritelmiin havaitaan, että todellakin kysymyksessä on resoluution IV asetelma. 6.1 b) Estimointi voidaan toteuttaa joko ajamalla täysi malli ja poimimalla niistä tilastollisesti merkitsevät tai kirjoittamalla vain 6.1a) kohdan tekijät. Alla on menetelty jälkimmäisen vaihtoehdon mukaan: Title2 "Estimation of the model"; model y = A B C D E A*B A*C A*D B*E C*E D*E A*B*E A*C*E A*D*E / ss3; Results (ANOVA table) A 1 0.70325208 0.70325208 34.34 <.0001 B 1 0.32176875 0.32176875 15.71 0.0004 C 1 0.02950208 0.02950208 1.44 0.2386 D 1 0.09991875 0.09991875 4.88 0.0342 E 1 0.68401875 0.68401875 33.40 <.0001 A*B 1 0.01050208 0.01050208 0.51 0.4790 A*C 1 0.00001875 0.00001875 0.00 0.9760 A*D 1 0.00630208 0.00630208 0.31 0.5828 B*E 1 0.28060208 0.28060208 13.70 0.0008 C*E 1 0.01300208 0.01300208 0.63 0.4313 D*E 1 0.01880208 0.01880208 0.92 0.3449 A*B*E 1 0.00005208 0.00005208 0.00 0.9601 A*C*E 1 0.00460208 0.00460208 0.22 0.6386 A*D*E 1 0.04260208 0.04260208 2.08 0.1586 Päävaikutukset A B D E ja yhdysvaikutus BE osoittautuvat tilastollisesti merkitseviksi, joten valitaan ne lopulliseen malliin. Title2 "Exerceise 61 b) Final model"; model y = A B D E B*E / ss3; output out = ex61b_res p = yhat r = res rstudent = sres;

Lopullisen mallin estimointitulokset: 6.1b) Residuaalit talletettu ex61b_res-tiedostoon Sum of Source DF Squares Mean Square F Value Pr > F Model 5 2.08956042 0.41791208 21.91 <.0001 Error 42 0.80122083 0.01907669 Corrected Total 47 2.89078125 R-Square Coeff Var Root MSE y Mean 0.722836 1.811240 0.138118 7.625625 A 1 0.70325208 0.70325208 36.86 <.0001 B 1 0.32176875 0.32176875 16.87 0.0002 D 1 0.09991875 0.09991875 5.24 0.0272 E 1 0.68401875 0.68401875 35.86 <.0001 B*E 1 0.28060208 0.28060208 14.71 0.0004 Standard Parameter Estimate Error t Value Pr > t Intercept 7.625625000 0.01993567 382.51 <.0001 A 0.121041667 0.01993567 6.07 <.0001 B -0.081875000 0.01993567-4.11 0.0002 D 0.045625000 0.01993567 2.29 0.0272 E -0.119375000 0.01993567-5.99 <.0001 B*E 0.076458333 0.01993567 3.84 0.0004 Tehtävä 6.1 c): Tämä on paraste tehdä Excel-ohjelmalla, kopiomalla data sinne. Osoittautuu, että C*E luokissa residuaalikeskhajonta on 0.11, kun C*E = -1 ja 0.07, kun C*E = +1, joten F-arvo on (0.11/0.07)**2 = 2.59, df1 = df2 = N - 6 = 48-6 = 42 (havaintojen määrä - estimoidut parametrit), p-arvo on 0.026, varianssien yhtäsuuduustestissä, joten se on 5% tasolla tilastollisesti merkitsevä. Niinpä, CE = +1 näyttää kasvattavan satunnaisvirhettä lopputuloksessa. Tämä luonnollisesti kannattaa minimoida tuotantoprosessissa ja pyrkiä säätämään tuotantoprosessi siten, että CE = -1. Tehtävä 6.1 d) Jäännösten normaalisuutta saadaan takasteltua PROC UNIVARIATE:lla proc univariate data = ex61b_res normaltest; Title2 "Tehtävä 61b) Residuaalitarkastelut"; var res; qqplot res / normal(mu = 0 sigma = est);

Testisuureet antavat viitteitä, että normaalisuus ei ole aivan OK Shapiro-Wilk W 0.950694 Pr < W 0.0426 Kolmogorov-Smirnov D 0.130014 Pr > D 0.0415 Cramer-von Mises W-Sq 0.133213 Pr > W-Sq 0.0402 Anderson-Darling A-Sq 0.760526 Pr > A-Sq 0.0456 Kuitenkaan normaalisuuskuvio ei ole kovian hälyyttävä. Jonkin verran on havaittavissa 'S'muotoa, mikä viittaa että virhetermin jakauma olisi himan "ohuthäntäisempi" kuin normaalijakauma, kuitenkin symmetrinen, mikä on tärkeää. Poikkeama on normaalisuudesta on kuienkin siinä määrin vähäinen, ettei se vaikuttane tulokssiin. Etenkin kun toistoja on kolme per käsittelykombinaatio. Tehtävä 6.1.e) Resoluution V asetelma saadaan, jos toeteutetaan koe esimerkiksi, että E = ABCD Tehtävä 6.2: Jos tavoitteena on maksimoida y (mahdollisimman korkea free height, mikä tarkoittanee mahdollisimman suurta joustovaraa), niin faktorit säätää siten, että y maksimoituu, kuitenkin siten, että samalla virhevaihtelu olisi mahdollisimman pientä. Nyt C ei vaikuta y:hyn, joten se voidaan valita vapaasti. E:n kerroin on negatiivinen (-0.119) (E:n vaikutusta ei kuitnenkaan voida kontrolloida). CE ja ABDE sulautuvat, joten varianssin minimoimiseksi kannattaa valita C = -ABD, jolloin sulautumisen seurauksena CE ja ADBE vatakkaismerkkisinä mahdollisesti kumoavat toisensa. Niinpä, koska A:n ja D:n regressiokertoimet ovat positiivisia ja B:n negatiivinen, maksimoituu y, kun valitaan A = +1, B = -1 ja D = +1. Valitsemalla lisäksi C = +1, jolloin CE = (+1)E = E ja ABDE = (-1)E = -E (mahdollisesti) kumoavat toisiaan ja virhevariaatio pienenee. Tehtävä 6.3: a) Kysymyksessä on kahden tekijän hierarkinen asetelma (nested deesign), jossa koneen käyttäjät (operator) ovat satunnaistekijöitä ja koneisiin (machine) nähden hierarkisia. Toistoja n = 3. Tehtävä 6.3: b) Data ex63; input machine operator y @@; label y = "surface finish quality"; datalines;

1 1 25 1 2 19 1 3 15 1 4 15 2 1 19 2 2 23 2 3 18 2 4 35 3 1 14 3 2 35 3 3 38 3 4 25 1 1 30 1 2 28 1 3 17 1 4 16 2 1 17 2 2 24 2 3 21 2 4 27 3 1 15 3 2 21 3 3 54 3 4 29 1 1 26 1 2 20 1 3 14 1 4 13 2 1 14 2 2 21 2 3 17 2 4 25 3 1 20 3 2 24 3 3 50 3 4 33 ; proc glm data = ex63; class machine operator; model y = machine operator(machine) / ss3; random operator(machine) / test; Tulokset: machine 2 676.055556 338.027778 1.46 0.2815 Error 9 2077.583333 230.842593 Error: MS(operator(machine)) operator(machine) 9 2077.583333 230.842593 12.20 <.0001 Error: MS(Error) 24 454.000000 18.916667 Koneilla ei näytä olevan vaikutusta tulokseen. Sen sijaan koneen käyttäjien kesken lopputulos vaihtelee. Koneen käyttäjien koulutuksella on ilmeisesti mahdollista saada tuotantoa homogenisoitua.