Altistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72



Samankaltaiset tiedostot
Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Heliövaara 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Toimittaja Erä

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Hierarkkiset koeasetelmat. Heliövaara 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 2 -faktorikokeen määritelmä

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Regressioanalyysi. Kuusinen/Heliövaara 1

Testejä suhdeasteikollisille muuttujille

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Testit järjestysasteikollisille muuttujille

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Perusnäkymä yksisuuntaiseen ANOVAaan

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Harjoitus 9: Excel - Tilastollinen analyysi

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Väliestimointi (jatkoa) Heliövaara 1

Kertausluento. Vilkkumaa / Kuusinen 1

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

11. laskuharjoituskierros, vko 15, ratkaisut


1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Sovellettu todennäköisyyslaskenta B

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Latinalaiset neliöt ja taikaneliöt

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

Terra Preta kasvatuskoe Pilkon pellolla

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Sovellettu todennäköisyyslaskenta B

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

9.1 Hierarkiset asetelmat (Nested Designs)

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Sovellettu todennäköisyyslaskenta B

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Olkoon R S otosavaruuksien R ja S karteesinen tulo: Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan:

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 6 -- Ratkaisut

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

Sovellettu todennäköisyyslaskenta B

10. laskuharjoituskierros, vko 14, ratkaisut

Johdatus regressioanalyysiin. Heliövaara 1

Ratkaisuehdotukset LH 3 / alkuvko 45

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Estimointi. Vilkkumaa / Kuusinen 1

Transkriptio:

Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut iheet: vainsanat: Kaksisuuntainen varianssianalsi Lohkoasetelmat Latinalaiset neliöt ritmeettinen keskiarvo, Estimointi, F-testi, Interaktio, äännösneliösumma, Kaksisuuntainen varianssianalsi, Keskiarvodiagrammi, Kiusatekijä, Kokonaisvaihtelu, Kolmisuuntainen varianssianalsi, Latinalainen neliö, Lohkoasetelma, Merkitsevstaso, p-arvo, äävaikutus, Reunakeskiarvo, Rhmien sisäinen vaihtelu, Rhmien välinen vaihtelu, Rhmä, Rhmäkeskiarvo, Testi, Testisuure, Vapausaste, Varianssi, Varianssianalsi, Varianssianalsihajotelma, Yhteisvaihtelu, Yleiskeskiarvo Tehtävä 9.. Tutkimuksen kohteena oli lehtinippujen hajoamisnopeus. Nippujen hajoamista tutkittiin neljässä erilaisessa mpäristössä kolmella erilaisella altistusajalla. okaisen mpäristöaltistusaika-hdistelmän kohteeksi valittiin satunnaisesti kaksi nippua. Niput punnittiin kokeen alussa ja kätettjen altistusaikojen jälkeen ja nipuista kirjattiin painon pudotus (grammoina). Tulokset kokeesta on annettu alla olevassa taulukossa. ainon pudotus (g) Ympäristö E.09.06 E.6.03 E 3.0.04 E 4 0.90.03 ltistusaika kk kk 3 kk.35.53.38.35.63.5.60.7.60.40.8.77.66.98.73.76 Mitä vaikutuksia mpäristöllä ja altistusajalla on painonpudotukseen? Tarkastele asiaa sekä graafisesti että sopivilla testeillä. Formuloi mös analsissa kättämäsi tilastollinen malli. TKK @ Ilkka Mellin (005) /46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Tehtävä 9.. Mitä opimme? Tehtävässä sovelletaan kaksisuuntaista varianssianalsia. Kaksisuuntaisen varianssianalsin tutkimusasetelma (i) (ii) Oletetaan, että haluamme tutkia kahden rhmittelevän tekijän ja B vaikutusta vastemuuttujan keskimääräiseen arvoon. Oletetaan, että tekijällä on I tasoa ja tekijällä B on tasoa, jolloin havainnot voidaan luokitella ristiin I rhmään. (iii) oimitaan kokeen mahdollisten kohteiden joukosta jokaiseen rhmään satunnaisesti K ksilöä. (iv) Mitataan vastemuuttujan arvot. Havainnot Olkoon kij = muuttujan k. havaintoarvo rhmässä, jonka määrittelee tekijän taso i ja tekijän B taso j, k =,,, K, i =,,, I, j =,,, Kaksisuuntaisen varianssianalsin tilastollinen malli ja sen parametrointi Kaksisuuntaisen varianssianalsin tilastollisella mallilla on seuraavat ekvivalentit esitsmuodot: () = µ + ( µ µ ) + ( µ µ ) + ( µ µ µ + µ ) + ( µ ) () kij = µ ij + ε kij kij ii i j ij ìi i j kij ij (3) = µ + α + β + ( αβ) + ε kij i j ij kij k =,,, K, i =,,, I, j =,,, äännöstermit ε kij ovat riippumattomia ja normaalijakautuneita: Mallissa () ε kij N(0, σ ) µ ìi = µ ij k =,,, K, i =,,, I, j =,,, j = I µ i j = µ ij I i= µ = µ = µ = I I I I µ ij ii i j i= j= i= j= TKK @ Ilkka Mellin (005) /46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Mallien (), () ja (3) parametrien välillä on seuraavat htälöt: α = µ µ i j ii β = µ µ i j ( αβ ) = µ µ µ +µ ij ij ìi i j ε = µ kij kij ij Mallin (3) parametrit toteuttavat htälöt I I α = β = ( αβ ) = ( αβ ) = 0 i i ij ij i= j= i= j= Kaksisuuntaisen varianssianalsin nollahpoteesit Kaksisuuntaisella varianssianalsilla tarkoitetaan seuraavien nollahpoteesien testaamista: H B : Ei hdsvaikutusta H H B : Ei -vaikutusta : Ei B-vaikutusta Nämä nollahpoteesit voidaan ilmaista mallin (3) parametrien avulla seuraavassa muodossa: H : ( αβ ) = 0, i =,,, I, j =,,, B ij H : α = α = $ = α = 0 H : β = β = $ = β = 0 B I Keskiarvot Rhmän (i, j) havaintoarvojen aritmeettinen keskiarvo eli rhmäkeskiarvo on K i =, i =,,, I, j =,,, ij K k = Tekijän tasoon i liittvä reunakeskiarvo on kij K = =, i =,,, I ii i i kij ij K j= k= j= Tekijän B tasoon j liittvä reunakeskiarvo on I K I = =, j =,,, ii i j kij ij IK i= k= I i= Kaikkien havaintoarvojen aritmeettinen keskiarvo eli leis- eli kokonaiskeskiarvo on iii I K I = = IK kij i= j= k= I i= j= iij TKK @ Ilkka Mellin (005) 3/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Kaksisuuntaisen varianssianalsin varianssianalsihajotelma Testit nollahpoteeseille H B, H, H B perustuvat varianssianalsihajotelmaan Neliösumma SST = SS + SSB + SSB + SSE I K kij iii ) i= j= k= SST = ( ) = ( IK s kuvaa havaintojen kokonaisvaihtelua. Neliösumma I K I ( iii iii) ( iii iii) i= j= k= i= SS= = K kuvaa tekijän osuutta havaintojen kokonaisvaihtelusta eli tekijän päävaikutusta. Neliösumma I K ( ii j iii) ( ii j iii) i= j= k= j= SSB = = IK kuvaa tekijän B osuutta havaintojen kokonaisvaihtelusta eli tekijän B päävaikutusta. Neliösumma I K I ( iij iii ii j iii) ( iij iii ii j iii ) i= j= k= i= j= SSB = + = K + kuvaa tekijöiden ja B hteisvaihtelun osuutta kokonaisvaihtelusta eli tekijöiden ja B interaktiota. Neliösumma (jäännösneliösumma) I K I ( kij i ij ) ( ) ij i= j= k= i= j= SSE = = K s kuvaa rhmien sisäisen vaihtelun osuutta havaintojen kokonaisvaihtelusta. Kaksisuuntaisen varianssianalsin testisuureet Määritellään F-testisuureet F F F B B I ( K ) SSB = ( I )( ) SSE I ( K ) SS = ( I ) SSE I ( K ) SSB = ( ) SSE TKK @ Ilkka Mellin (005) 4/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit os nollahpoteesi H B : Ei hdsvaikutusta pätee, niin F F(( I )( ), I( K )) B Suuret testisuureen F B arvot johtavat nollahpoteesin H B hlkäämiseen. os nollahpoteesi H : Ei -vaikutusta pätee, niin F F(( I ), I( K )) Suuret testisuureen F arvot johtavat nollahpoteesin H hlkäämiseen. os nollahpoteesi H B : Ei B-vaikutusta pätee, niin F F(( ), I( K )) B Suuret testisuureen F B arvot johtavat nollahpoteesin H B hlkäämiseen. Kaksisuuntaisen varianssianalsin testien tulokset ilmaistaan tavallisesti varianssianalsitaulukon muodossa: Vaihtelun lähde Neliösumma SS Vapausasteet df Varianssiestimaattori MS F-testisuure SS I SS MS = F = MS I MSE B SSB MSB = SSB F = MSB MSE B SSB (I )( ) SSB MSB = ( I )( ) F = MSB MSE äännös SSE I(K ) MSE = SSE I ( K ) Kokonaisvaihtelu SST IK TKK @ Ilkka Mellin (005) 5/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Varianssianalsitaulukon neliösummat toteuttavat varianssianalsihajotelman SST = SS + SSB + SSB + SSE ja neliösummia vastaavat vapausasteet toteuttavat htälön IK = (I ) + ( ) + (I )( ) + I(K ) Laskutoimitusten järjestel kaksisuuntaisessa varianssianalsissa os varianssianalsihajotelman neliösummat SST, SS, SSB, SSB, SSE joudutaan laskemaan käsin tai laskimella, kannattaa laskutoimituksissa kättää alla esitettäviä kaavoja. Määritellään seuraavat summat: T iij = K k = kij K T = = T ii i kij iij j= k= j= I K I T = = T ii j kij iij i= k= i= I K I I T = = T = T = iii kij iij iii ii j i= j= k= i= j= i= j= i =,,, I, j =,,, Tällöin llä määritellt keskiarvot saadaan kaavoilla iij ii i ii j iii = Tiij K = Tii i K = Tii j IK = Tiii IK i =,,, I, j =,,, Havaintoarvojen kokonaisvaihtelua kuvaava neliösumma voidaan laskea kaavalla SST = = T IK I K I K ( kij iii) kij i= j= k= i= j= k= Tekijän päävaikutusta kuvaava neliösumma voidaan laskea kaavalla SS = K = T T I I ( iii iii) iii iii i= K i= IK T iii TKK @ Ilkka Mellin (005) 6/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Tekijän B päävaikutusta kuvaava neliösumma voidaan laskea kaavalla SSB = IK = T T I ( ii j iii) ii j iii j= IK i= IK Tekijöiden ja B hdsvaikutusta kuvaava neliösumma kannattaa laskea kahdessa vaiheessa. Lasketaan ensin rhmäkeskiarvojen kokonaisvaihtelua kuvaava neliösumma Tällöin SS = K = T T I I ( iij iii) iij iii i= j= K i= j= IK I SSB = K( iij iii ii j + iii) = SS SS SSB i= j= Rhmien sisäistä vaihtelua kuvaava neliösumma saadaan kaavalla SSE = SST SSB SS SSB = SST SS Käsin tai laskimella laskettaessa havainnot kannattaa järjestää seuraavan taulukon muotoon: $ I B,,,,,, $,,, B,,,,,, $,,, % % % % B,,,,,, $,,, k k I I ki k k I I ki k k I I ki Tästä taulukosta lasketaan solukohtaiset summat K Ti =, i =,,, I, j =,,, ij k = ja kaikkien havaintojen neliöiden summa I K i= j= k= kij kij Solusummat Ti ij, i =,,, I, j =,,, järjestetään seuraavaksi taulukoksi, josta kaikki loput tarvittavista summista saadaan rivi- ja sarakesummina: $ I Summa B Ti Ti $ TiI Tii B Ti Ti $ TiI Tii % % % % % B Ti Ti $ TiI Tii Summa T T $ T T ii ii ii i iii TKK @ Ilkka Mellin (005) 7/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Tehtävä 9.. Ratkaisu: Tehtävän tapauksessa Tekijä = ika; tasot: altistusaika kk, kk, 3 kk Tekijä B = Ympäristö; tasot: mpäristö E, E, E 3, E 4 Siten I = 3 ja = 4 ja luokituksessa snt rhmää. I = 3 4 = okaisesta rhmästä on kerätt havaintoa. (i, j), i =,, 3, j =,, 3, 4 K = Satunnaistamista voidaan kuvata seuraavalla lokeromallilla: (i) (ii) Muodostetaan lokerikko, jossa on I = 3 4 = lokeroa, jotka indeksoidaan lukupareilla (i, j), i =,, 3, j =,, 3, 4 Tehdään 4 samanlaista lehtinippua ja sijoitetaan lehtiniput satunnaisesti lokeroihin niin, että jokaiseen lokeroon tulee nippua. Lokeron (i, j) molempiin lehtinippuihin kohdistetaan lokeron indeksointia vastaava käsittelkombinaatio (i, j), i =,, 3, j =,, 3, 4 Tehtävän tapauksessa kokeen tuloksena saatiin seuraava taulukko: ainon pudotus (g) Ympäristö E.09.06 E.6.03 E 3.0.04 E 4 0.90.03 ika kk kk 3 kk.35.53.38.35.63.5.60.7.60.40.8.77.66.98.73.76 TKK @ Ilkka Mellin (005) 8/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Neliösummien laskeminen Lasketaan kaikkien havaintojen neliöiden summa: I K i= j= k= kij = 5.083 Lasketaan seuraavaksi jokaisesta solusta havaintojen summa ja järjestetään summat taulukoksi, josta lasketaan lisäksi rivi- ja sarakesummat. Lasketaan solusummat: T = =.09 +.06 =.5 i k k = T = =.35 +.53 =.88 i k k = T = =.60 +.40 = 3.00 i3 k3 k = T = =.6 +.03 =.9 i k k = T = =.38 +.5 =.73 i k k = T = =.8 +.77 = 3.95 i3 k 3 k = T = =.0+.04 =.05 i3 k 3 k = T = =.63 +.5 = 3.4 i3 k 3 k = T = =.66 +.98 = 3.64 i33 k 33 k = T = = 0.90 +.03 =.93 i4 k 4 k = T = =.60 +.7 = 3.3 i4 k 4 k = T = =.73 +.76 = 3.49 i43 k 43 k = TKK @ Ilkka Mellin (005) 9/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Lasketaan rivisummat: 3 T = T =.5 +.88 + 3.00 = 8.03 ii ii i= 3 T = T =.9 + 3.73 + 3.95 = 8.87 ii ii i= 3 T = T =.05 + 3.4 + 3.64 = 8.83 ii3 ii3 i= 3 T = T =.93 + 3.3 + 3.49 = 8.74 ii4 ii4 i= Lasketaan sarakesummat: 4 T = T =.5 +.9 +.05 +.93 = 8.3 ii ij j = 4 T = T =.88 +..73 + 3.4 + 3.3 =.07 ii i j j = 4 T = T = 3.00 + 3.95 + 3.64 + 3.49 = 4.08 i3i i3j j = Lasketaan kokonaissumma: 3 T = T = 8.3 +.07 + 4.08 = 34.47 iii i= iii T ij ika kk kk 3 kk Summa E.5.88 3.00 8.03 Ympäristö E.9 3.73 3.95 8.87 E 3.05 3.4 3.64 8.83 E 4.93 3.3 3.49 8.74 Summa 8.3.07 4.08 34.47 TKK @ Ilkka Mellin (005) 0/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Lasketaan kaksisuuntaisen varianssianalsin varianssianalsihajotelman neliösummat: I K SST = T IK i= j= k= kij iii = 5.083 34.47 3 4 =.700763 I SS = Ti ii Tiii K i= IK = + + 4 3 4 =.36675 (8.3.07 4.08 ) 34.47 SSB = T T IK ii j iii j = IK = + + + 3 3 4 = 0.07879 (8.03 8.87 8.83 8.74 ) 34.47 I SS = Ti T K IK i= j= ij iii (.5.9.05.93 = + + + +.88 +.73 + 3.4 + 3.3 + + + + 3 4 =.4963 SSB = SS SS SSB 3.00 3.95 3.64 3.49 ) 34.47 =.4963.36675 0.07879 = 0.8358 SSE = SST SS SSB SSB = SST SS =.700763.4963 = 0.04550 TKK @ Ilkka Mellin (005) /46

Mat-.03 Koesuunnittelu ja tilastolliset mallit F-testisuureiden laskeminen Olkoon nollahpoteesina H B : Ei hdsvaikutusta Testisuureen F B arvoksi saadaan F B I ( K ) SSB = ( I )( ) SSE 3 4 ( ) 0.8358 = (3 ) (4 ) 0.04550 =.75 os nollahpoteesi H B pätee, niin F F(( I )( ), I( K )) = F(6,) B Olkoon nollahpoteesina H : Ei -vaikutusta Testisuureen F arvoksi saadaan F I ( K ) SS = ( I ) SSE 3 4 ( ).36675 = (3 ) 0.04550 = 6.67 os nollahpoteesi H pätee, niin F F(( I ), I( K )) = F(,) Olkoon nollahpoteesina H B : Ei B-vaikutusta Testisuureen F B arvoksi saadaan F B I ( K ) SS = ( ) SSE 3 4 ( ) 0.07870 = (4 ) 0.04550 =.53 os nollahpoteesi H B pätee, niin F F(( ), I( K )) = F(3,) B TKK @ Ilkka Mellin (005) /46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Testien tekeminen Olkoon nollahpoteesina H B : Ei hdsvaikutusta Testisuureen arvoksi saatiin F B =.75 Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla r( F.75) = 0.064 Siten nollahpoteesi H B voidaan hlätä merkitsevstasolla 0.0, mutta ei aivan merkitsevstasolla 0.05. Taulukoiden mukaan jossa Koska r(f.996) = 0.05 F F(( I )( ), I( K )) = F(6,) F B =.75 <.996 voimme todeta (kuten edellä), että nollahpoteesia H B ei voida hlätä merkitsevstasolla 0.05. Olkoon nollahpoteesina H : Ei -vaikutusta Testisuureen arvoksi saatiin F = 6.67 Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla r( F 6.67) < 0.000 Siten nollahpoteesi H voidaan hlätä kaikilla tavanomaisilla merkitsevstasoilla. Taulukoiden mukaan jossa Koska r(f 6.97) = 0.0 F F(( I ), I( K )) = F(,) F = 6.67 > 6.97 voimme todeta, että nollahpoteesi H voidaan hlätä merkitsevstasolla 0.0. TKK @ Ilkka Mellin (005) 3/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Olkoon nollahpoteesina H B : Ei B-vaikutusta Testisuureen arvoksi saatiin F =.53 B Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla r( F.53) = 0.58 Siten nollahpoteesia H B ei voida hlätä edes merkitsevstasolla 0.. Taulukoiden mukaan jossa Koska r(f 3.490) = 0.05 F F(( ), I( K )) = F(3,) F =.53 B < 3.490 voimme todeta, että nollahpoteesia H B ei voida hlätä merkitsevstasolla 0.05. Varianssianalsitaulukko Testien tuloksista voidaan rakentaa seuraava varianssianalsitaulukko: Vaihtelun lähde SS df MS F p.36675.068338 6.67 < 0.000 B 0.07879 3 0.06060.53 0.58 B 0.8358 6 0.046893.75 0.064 E 0.04550 0.07046 T.700763 3 TKK @ Ilkka Mellin (005) 4/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit ohtopäätös: os kätämme 5 %:n merkitsevstasoa, voimme hlätä kaksisuuntaisen varianssianalsin nollahpoteeseista vain hpoteesin H : Ei -vaikutusta Testien mukaan vain altistusajalla on vaikutusta lehtinippujen hajoamiseen. os kätämme hieman tavanomaista suurempaa 0 %:n merkitsevstasoa, voimme hlätä nollahpoteesit: H B : Ei hdsvaikutusta H : Ei -vaikutusta Siten mpäristöllä ja altistusajalla saattaa olla (lievää) hdsvaikutusta, vaikka vain altistusajalla on vaikutusta erillisenä tekijänä lehtinippujen hajoamiseen. TKK @ Ilkka Mellin (005) 5/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Ncss-ohjelma antaa tehtävän 9.. aineistosta seuraavan tulostuksen: nalsis of Variance Report Expected Mean Squares Section Source Term Denominator Expected Term DF Fixed? Term Mean Square : ika Yes S(B) S+bs B: Ymparisto 3 Yes S(B) S+asB B 6 Yes S(B) S+sB S(B) No S Note: Expected Mean Squares are for the balanced cell-frequenc case. nalsis of Variance Table Source Sum of Mean rob ower Term DF Squares Square F-Ratio Level (lpha=0.0) : ika.36675.068337 6.67 0.000000*.000000 B: Ymparisto 3 7.8797E-0.60597E-0.53 0.57579 0.445366 B 6 0.83583 4.689306E-0.75 0.064083* 0.794696 S 0.0455.704583E-0 Total (djusted) 3.700763 Total 4 * Term significant at alpha = 0.0 Means and Standard Error Section Standard Term Count Mean Error ll 4.4365 : ika 8.04 4.6598E-0 8.50875 4.6598E-0 3 8.76 4.6598E-0 B: Ymparisto 6.338333 5.330077E-0 6.478333 5.330077E-0 3 6.47667 5.330077E-0 4 6.456667 5.330077E-0 B: ika,ymparisto,.075 9.3964E-0,.095 9.3964E-0,3.05 9.3964E-0,4 0.965 9.3964E-0,.44 9.3964E-0,.365 9.3964E-0,3.57 9.3964E-0,4.66 9.3964E-0 3,.5 9.3964E-0 3,.975 9.3964E-0 3,3.8 9.3964E-0 3,4.745 9.3964E-0 TKK @ Ilkka Mellin (005) 6/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit lots Section Means of ainonudotus.0.85 ainonudotus.50.5 0.80 3 ika Means of ainonudotus.0.85 ainonudotus.50.5 0.80 3 4 Ymparisto Means of ainonudotus ainonudotus.0.85.50.5 Ymparisto 3 4 0.80 3 ika TKK @ Ilkka Mellin (005) 7/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Bonferroni (ll-airwise) Multiple Comparison Test Response: ainonudotus Term : ika lpha=0.050 Error Term=S(B) DF= MSE=.704583E-0 Critical Value=.779473 Different Group Count Mean From Groups 8.04, 3 8.50875, 3 3 8.76, Bonferroni (ll-airwise) Multiple Comparison Test Response: ainonudotus Term B: Ymparisto lpha=0.050 Error Term=S(B) DF= MSE=.704583E-0 Critical Value=3.568 Different Group Count Mean From Groups 6.338333 4 6.456667 3 6.47667 6.478333 Bonferroni (ll-airwise) Multiple Comparison Test Response: ainonudotus Term B: ika,ymparisto lpha=0.050 Error Term=S(B) DF= MSE=.704583E-0 Critical Value=4.476084 Different Group Count Mean From Groups,4 0.965 (,3), (,4), (3,4), (3,3), (3,),3.05 (,4), (3,4), (3,3), (3,),.075 (,4), (3,4), (3,3), (3,),.095 (3,4), (3,3), (3,),.365 (3,),.44 3,.5,3.57 (,4),4.66 (,4), (,3), (,) 3,4.745 (,4), (,3), (,), (,) 3,3.8 (,4), (,3), (,), (,) 3,.975 (,4), (,3), (,), (,), (,) TKK @ Ilkka Mellin (005) 8/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Tehtävä 9.. Laadunvalvontainsinööri tutki kokemuksen merkitstä kokoonpanolinjalla kokoonpanotehtävään kuluvan ajan avulla. Insinööri valitsi satunnaisesti kahdeksan töntekijää neljästä eri rhmästä kustakin: Rhmä : vuoden tökokemus Rhmä B: vuoden tökokemus Rhmä C: 3 vuoden tökokemus Rhmä D: 4 vuoden tökokemus Kokoonpanotehtävät arvottiin töntekijöille. Tuloksena kokeesta saatiin alla oleva taulukko. Tehtävään kulunut aika (s) Tökokemuksen pituus v v 3 v 4 v Tehtävä 40.3 34. 8.8 6.6 5.4 5.4 9.. 3 8. 8.0 4.6 3. 4 4.6 4.9 9. 7.0 5 8.8 39. 34.8 7. 6 38.7 9.5 6.6 7.3 7 9.4 9.0 36.0 34. 8 37.7 5.6 5.6 5. Mitä vaikutus kokemuksella on tötehtävään kuluneeseen aikaan? Tarkastele asiaa sekä graafisesti että sopivilla testeillä. Formuloi mös analsissa kättämäsi tilastollinen malli. Tehtävä 9.. Mitä opimme? Tehtävässä sovelletaan satunnaistettua tädellistä lohkoasetelmaa. TKK @ Ilkka Mellin (005) 9/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Satunnaistettu tädellinen lohkoasetelma (i) (ii) Oletetaan, että haluamme tutkia rhmittelevän tekijän tai käsitteln vaikutusta vastemuuttujan keskimääräiseen arvoon koetilanteessa, jossa mukana on kiusatekijä B, jonka tasojen suhteen kokeen mahdollisten kohteiden joukko voidaan lohkoa eli jakaa homogeenisiin rhmiin. Oletetaan, että tekijällä on I tasoa ja kiusatekijällä B on tasoa, jolloin havainnot voidaan lohkoa I rhmään. (iii) oimitaan jokaisesta kiusatekijän B tason määräämästä lohkosta satunnaisesti I ksilöä ja arvotaan käsittelt ko. ksilöille. (iv) Mitataan vastemuuttujan arvot. Havainnot Olkoon ij = muuttujan havaintoarvo rhmässä, jonka määrittelee tekijän taso i ja kiusatekijän B taso j, i =,,, I, j =,,, Satunnaistetun tädellisen lohkoasetelman tilastollinen malli ja sen parametrointi Satunnaistetun tädellisen lohkoasetelman tilastollisella mallilla on seuraava esitsmuoto: () ij = µ + αi + β j + εij i =,,, I, j =,,, äännöstermit ε ij ovat riippumattomia ja normaalijakautuneita: ε ij N(0, σ ) i =,,, I, j =,,, Mallin () parametrit toteuttavat htälöt I α = β = 0 i i= j= i Satunnaistetun tädellisen lohkoasetelman nollahpoteesi Lohkoasetelman analsi tarkoittaa seuraavan nollahpoteesien testaamista: H : Ei -vaikutusta kun asetelmassa on mukana kiusatekijä B. Tämä nollahpoteesi voidaan ilmaista mallin () parametrien avulla seuraavassa muodossa: H : α = α = $ = α = 0 I TKK @ Ilkka Mellin (005) 0/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Keskiarvot Varsinaisen kiinnostuksen kohteena olevan tekijän tasoon i liittvä käsittelkeskiarvo on =, i =,,, I ii j = ij Kiusatekijän B tasoon j liittvä lohkokeskiarvo on I =, j =,,, i j I i = ij Kaikkien havaintoarvojen aritmeettinen keskiarvo eli leis- eli kokonaiskeskiarvo on ii I ij I i = j = = Satunnaistetun tädellisen lohkoasetelman varianssianalsihajotelma Testi nollahpoteesille H perustuu varianssianalsihajotelmaan Neliösumma SST = SS + SSB + SSE I ( ij ii) ( i= j= SST = = I ) s kuvaa havaintojen kokonaisvaihtelua. Neliösumma I I ( ii ii) ( ii ii ) i= j= i= SS = = kuvaa varsinaisen kiinnostuksen kohteena olevan tekijän osuutta havaintojen kokonaisvaihtelusta. Neliösumma I ( i j ii) ( i j ii ) i= j= j= SSB = = I kuvaa kiusatekijän B osuutta havaintojen kokonaisvaihtelusta. äännösneliösumma on I ij ii i j ii i= j= SSE = ( + ) TKK @ Ilkka Mellin (005) /46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Satunnaistetun tädellisen lohkoasetelman testisuure Määritellään F-testisuure F ( I )( ) SS = I SSE os nollahpoteesi H : Ei -vaikutusta pätee, niin F F(( I ),( I )( )) Suuret testisuureen F arvot johtavat nollahpoteesin H hlkäämiseen. Satunnaistetun tädellisen lohkoasetelman testin tulos ilmaistaan tavallisesti varianssianalsitaulukon muodossa: Vaihtelun lähde Neliösumma SS Vapausasteet df Varianssiestimaattori MS F-testisuure SS I SS MS = F = MS I MSE B SSB MSB = SSB äännös SSE (I )( ) SSE MSE = ( I )( ) Kokonaisvaihtelu SST I Varianssianalsitaulukon neliösummat toteuttavat varianssianalsihajotelman SST = SS + SSB + SSE ja neliösummia vastaavat vapausasteet toteuttavat htälön I = (I ) + ( ) + (I )( ) TKK @ Ilkka Mellin (005) /46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Laskutoimitusten järjestel satunnaistetussa tädellisessä lohkoasetelmassa os varianssianalsihajotelman neliösummat SST, SS, SSB, SSE joudutaan laskemaan käsin tai laskimella, kannattaa laskutoimituksissa kättää alla esitettäviä kaavoja. Määritellään seuraavat summat: T T T ii i j ii = = = j = I i= I ij ij i= j= ij i =,,, I, j =,,, Tällöin llä määritellt keskiarvot saadaan kaavoilla ii i j ii = Tii = Ti j I = Tii I i =,,, I, j =,,, Havaintoarvojen kokonaisvaihtelua kuvaava neliösumma voidaan laskea kaavalla SST = = T ii I I I ( ij ii) ij i= j= i= j= Käsitteln vaikutusta kuvaava neliösumma voidaan laskea kaavalla SS = = T T I I I ( ii ii) ii i= i= Kiusatekijän B vaikutusta kuvaava neliösumma voidaan laskea kaavalla SSB = I = T T ii ( i j ii) i j iii j= I j= I äännösvaihtelua kuvaava neliösumma saadaan kaavalla SSE = SST SS SSB TKK @ Ilkka Mellin (005) 3/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Käsin tai laskimella laskettaessa havainnot kannattaa järjestää seuraavan taulukon muotoon: $ I B $ B $ % % % % B $ I I I Tästä taulukosta lasketaan kaikkien havaintojen neliöiden summa I i= j= ij Samaan taulukkoon lasketaan mös loput tarvittavista summista rivi- ja sarakesummina: $ I Summa B $ I Ti B $ I Ti % % % % % B $ TI Ti Summa T T $ T T i i I i ii Tehtävä 9.. Ratkaisu: Tehtävän tapauksessa Tekijä = Tökokemuksen pituus; tasot: v, v, 3 v, 4 v Kiusatekijä B = Tötehtävä; tasot: tehtävä,, 3, 4, 5, 6, 7, 8 Siten I = 4 ja = 8 ja luokituksessa snt I = 4 8 = 3 rhmää. okaisesta rhmästä (i, j), i =,, 3, 4, j =,, 3, 4, 5, 6, 7, 8 on kerätt havainto. Satunnaistamista voidaan kuvata seuraavalla lokeromallilla: (i) Muodostetaan lokerikko, jossa on I = 4 8 = 3 lokeroa, jotka indeksoidaan pareilla (i, j), i =,, 3, 4, j =,, 3, 4, 5, 6, 7, 8 TKK @ Ilkka Mellin (005) 4/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit (ii) Valitaan satunnaisesti kahdeksan töntekijää, joiden tökokemuksen pituus on i vuotta, i =,, 3, 4 lokeroihin (i, j), j =,, 3, 4, 5, 6, 7, 8 Lokeroon (i, j) töntekijä tekee tötehtävän j, i =,, 3, 4, j =,, 3, 4, 5, 6, 7, 8. Tehtävän tapauksessa kokeen tuloksena saatiin seuraava taulukko: Tehtävään kulunut aika (s) Tökokemuksen pituus v v 3 v 4 v Tehtävä 40.3 34. 8.8 6.6 5.4 5.4 9.. 3 8. 8.0 4.6 3. 4 4.6 4.9 9. 7.0 5 8.8 39. 34.8 7. 6 38.7 9.5 6.6 7.3 7 9.4 9.0 36.0 34. 8 37.7 5.6 5.6 5. Neliösummien laskeminen Lasketaan kaikkien havaintojen neliöiden summa: I i= j= ij = 94.5 Lasketaan seuraavaksi käsittel- ja lohkosummat. Lasketaan käsittelsummat eli taulukon sarakesummat: 8 T = = 40.3 + 5.4 + 8. + 4.6 + 8.8 + 38.7 + 9.4 + 37.7 = 70. i j j = 8 T = = 34. + 5.4 + 8.0 + 4.9 + 39. + 9.5 + 9.0 + 5.6 = 35.8 i j j = 8 T = = 8.8 + 9. + 4.6 + 9.+ 34.8 + 6.6 + 36.0 + 5.6 = 34.7 3i 3j j = 8 T = = 6.6 +. + 3. + 7.0 + 7.+ 7.3 + 34. + 5. =.8 4i 4 j j = TKK @ Ilkka Mellin (005) 5/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Lasketaan lohkosummat eli taulukon rivisummat: 4 T = = 40.3 + 34. + 8.8 + 6.6 = 9.9 i i i= 4 T = = 5.4 + 5.4 + 9. +. = 0. i i i= 4 T = = 8. + 8.0 + 4.6 + 3. = 04.0 i3 i3 i= 4 T = = 4.6 + 4.9 + 9.+ 7.0 =.6 i4 i4 i= 4 T = = 8.8 + 39. + 34.8 + 7. = 9.9 i5 i5 i= 4 T = = 38.7 + 9.5 + 6.6 + 7.3 =. i6 i6 i= 4 T = = 9.4 + 9.0 + 36.0 + 34. = 8.6 i7 i7 i= 4 T = = 37.7 + 5.6 + 5.6 + 5. = 4. i8 i8 i= Lasketaan kokonaissumma: 4 T = T = 70.+ 35.8 + 34.7 +.8 = 95.4 ii i= ii Tehtävään kulunut aika (s) Tökokemuksen pituus v v 3 v 4 v Summa 40.3 34. 8.8 6.6 9.9 5.4 5.4 9.. 0. 3 8. 8.0 4.6 3. 04.0 Tehtävä 4 4.6 4.9 9. 7.0.6 5 8.8 39. 34.8 7. 9.9 6 38.7 9.5 6.6 7.3. 7 9.4 9.0 36.0 34. 8.6 8 37.7 5.6 5.6 5. 4. Summa 70. 35.8 34.7.8 95.4 TKK @ Ilkka Mellin (005) 6/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Lasketaan satunnaistetun tädellisen lohkoasetelman varianssianalsihajotelman neliösummat: I SST = T I i= j= kij ii = 94.5 95.4 48 = 896.750 I SS = Ti i Tii i= I = + + + 8 4 8 = 6.5675 (70. 35.8 34.7.8 ) 95.4 SSB = T T I i j ii j = I (9.9 0. 04.0.6 = + + + 4 + + + + 48 = 9.5450 SSE = SST SS SSB 0.9. 8.6 4. ) 95.4 = 896.750 6.5675 9.5450 = 450.605 F-testisuureen laskeminen Olkoon nollahpoteesina H : Ei -vaikutusta Testisuureen F arvoksi saadaan F ( I )( ) SS = ( I ) SSE (4 )(8 ) 6.5675 = (4 ) 450.605 = 3.36 os nollahpoteesi H pätee, niin F F(( I ),( I )( )) = F(3,) TKK @ Ilkka Mellin (005) 7/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Testin tekeminen Olkoon nollahpoteesina H : Ei -vaikutusta Testisuureen arvoksi saatiin F = 3.36 Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla r( F 3.364) = 0.038 Siten nollahpoteesi H voidaan hlätä merkitsevstasolla 0.05, mutta ei merkitsevstasolla 0.0. Taulukoiden mukaan jossa Koska r(f 3.07) = 0.05 r(f 4.874) = 0.0 F F(( I ), ( I )( )) = F(3, ) 3.07 < F = 3.36 < 4.874 voimme todeta (htäpitävästi llä esitetn kanssa), että nollahpoteesi H voidaan hlätä merkitsevstasolla 0.05, mutta ei merkitsevstasolla 0.0. Testien tuloksista voidaan rakentaa seuraava varianssianalsitaulukko: Vaihtelun lähde SS df MS F p 6.5675 3 7.89 3.364 0.038 B 9.5450 7 3.79 E 450.605.4573 T 896.750 3 TKK @ Ilkka Mellin (005) 8/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit ohtopäätös: os kätämme 5 %:n merkitsevstasoa, voimme hlätä nollahpoteesin H : Ei -vaikutusta Testin mukaan tökokemuksella on vaikutusta tötehtäviin kätettn aikaan. TKK @ Ilkka Mellin (005) 9/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Ncss-ohjelma antaa tehtävän 9.. aineistosta seuraavan tulostuksen: nalsis of Variance Report Expected Mean Squares Section Source Term Denominator Expected Term DF Fixed? Term Mean Square : Experience 3 Yes S(B) S+bs B: Task 7 Yes S(B) S+asB S(B) No S Note: Expected Mean Squares are for the balanced cell-frequenc case. nalsis of Variance Table Source Sum of Mean rob ower Term DF Squares Square F-Ratio Level (lpha=0.05) : Experience 3 6.5675 7.896 3.36 0.03795* 0.67675 B: Task 7 9.545 3.794.53 0.939 0.493666 S 450.605.4576 Total (djusted) 3 896.75 Total 3 * Term significant at alpha = 0.05 Means and Standard Error Section Standard Term Count Mean Error ll 3 9.765 : Experience 8 33.765.63779 8 9.475.63779 3 8 9.3375.63779 4 8 6.475.63779 B: Task 4 3.475.36099 4 5.3.36099 3 4 6.36099 4 4 30.65.36099 5 4 3.475.36099 6 4 30.55.36099 7 4 3.5.36099 8 4 8.55.36099 TKK @ Ilkka Mellin (005) 30/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit lots Section Means of Time 45.00 38.75 Time 3.50 6.5 0.00 3 4 Experience Means of Time 45.00 38.75 Time 3.50 6.5 0.00 3 4 5 6 7 8 Task TKK @ Ilkka Mellin (005) 3/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Bonferroni (ll-airwise) Multiple Comparison Test Response: Time Term : Experience lpha=0.050 Error Term=S(B) DF= MSE=.4576 Critical Value=.9086 Different Group Count Mean From Groups 4 8 6.475 3 8 9.3375 8 9.475 8 33.765 4 Bonferroni (ll-airwise) Multiple Comparison Test Response: Time Term B: Task lpha=0.050 Error Term=S(B) DF= MSE=.4576 Critical Value=3.57507 Different Group Count Mean From Groups 4 5.3 3 4 6 8 4 8.55 6 4 30.55 4 4 30.65 7 4 3.5 5 4 3.475 4 3.475 TKK @ Ilkka Mellin (005) 3/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Tehtävä 9.3. Tutkimuksessa haluttiin verrata autojen keskimääräistä bensiininkulutusta kolmella eri bensiinilaadulla ( = Regular, B = Super, C = Extra). Tunnistettiin kaksi ulkopuolista vaihtelun lähdettä: ajaja (,, 3) ja auton tppi (4 slinteriä, 6 slinteriä, 8 slinteriä). Tulokset testistä (annetulla bensiinimäärällä ajetut matkat maileina) on annettu alla olevassa taulukossa. jettu matka (mile) uton tppi 4 s 6 s 8 s 36.0 B 33.0 C 6.5 jaja B 36.5 C 33.5 5.0 3 C 38.0 3.5 B 6.0 Testaa onko keskimääräinen bensiininkulutus eri bensiinilaaduilla erilainen. Tehtävä 9.3. Mitä opimme? Tehtävässä sovelletaan latinalaisten neliöiden koeasetelmaa. Latinalaisten neliöiden koeasetelma (i) (ii) Oletetaan, että haluamme tutkia jonkin rhmittelevän tekijän tai käsitteln vaikutusta vastemuuttujan keskimääräiseen arvoon tilanteessa, jossa mukana on kaksi kiusatekijää R ja C, joiden tasojen suhteen kokeen mahdollisten kohteiden joukko voidaan lohkoa eli jakaa homogeenisiin rhmiin. Oletetaan, että kiinnostuksen kohteena olevalla käsittelllä on tasoa ja mös kiusatekijöillä R ja C on tasoa, jolloin havainnot voidaan lohkoa = rhmään. (iii) oimitaan jokaisesta kiusatekijöiden R ja C tasojen määräämästä lohkosta satunnaisesti ksilö kokeeseen ja arvotaan käsittelt ko. ksilöille niin, että kiinnostuksen kohteena olevan käsitteln tasot muodostavat tekijöiden R ja C määräämässä -matriisissa ns. latinalaisen neliön. -matriisi on latinalainen neliö, jos kirjaimet, B, C, ( kpl) esiintvät täsmälleen kerran matriisin jokaisella rivillä ja sarakkeella. (iv) Mitataan vastemuuttujan arvot. TKK @ Ilkka Mellin (005) 33/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Havainnot Olkoon ijk = muuttujan havaintoarvo rhmässä, jonka määrittelee rivitekijän R taso i ja saraketekijän C taso j ja käsittel k, i =,,,, j =,,,, k =,,, Latinalaisten neliöiden koeasetelman tilastollinen malli ja sen parametrointi Latinalaisten neliöiden koeasetelman tilastollisella mallilla on seuraava esitsmuoto: () ijk = µ + αi + β j + τk + εijk i =,,,, j =,,,, k =,,, äännöstermit ε ijk ovat riippumattomia ja normaalijakautuneita: ε ijk σ N(0, ) i =,,,, j =,,,, k =,,, Mallin () parametrit toteuttavat htälöt α = β = τ = 0 i i k i= j= k= Latinalaisten neliöiden koeasetelman nollahpoteesi Latinalaisten neliöiden analsi tarkoittaa seuraavan nollahpoteesien testaamista: H : Ei -vaikutusta kun asetelmassa on mukana rivitekijä R ja saraketekijä C. Tämä nollahpoteesi voidaan ilmaista mallin () parametrien avulla seuraavassa muodossa: H : τ = τ = $ = τ = 0 Keskiarvot Varsinaisen kiinnostuksen kohteena olevan tekijän tasoon i liittvä käsittelkeskiarvo on =, k =,,, ii k i = j = Rivitekijän R tasoon i liittvä rivikeskiarvo on =, i =,,, iii j = k = ijk ijk TKK @ Ilkka Mellin (005) 34/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Saraketekijän C tasoon j liittvä sarakekeskiarvo on =, j =,,, i ji i = k = ijk Kaikkien havaintoarvojen aritmeettinen keskiarvo eli leis- eli kokonaiskeskiarvo on iii ijk i = j = k = = Latinalaisten neliöiden koeasetelman varianssianalsihajotelma Testi nollahpoteesille H perustuu varianssianalsihajotelmaan Neliösumma SST = SSR + SSC + SS + SSE SST = ( ijk iii) = ( ) s i= j= k= kuvaa havaintojen kokonaisvaihtelua. Neliösumma iik iii k = SS = ( ) kuvaa varsinaisen kiinnostuksen kohteena olevan tekijän osuutta havaintojen kokonaisvaihtelusta eli tekijän päävaikutusta. Neliösumma iii iii i= SSR = ( ) kuvaa rivitekijän R osuutta havaintojen kokonaisvaihtelusta. Neliösumma i ji iii j = SSC = ( ) kuvaa saraketekijän C osuutta havaintojen kokonaisvaihtelusta. äännösneliösumma on SSE = ( + I K ) ijk iii i ji iik iii i= j= k= TKK @ Ilkka Mellin (005) 35/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Latinalaisten neliöiden koeasetelman testisuure Määritellään F-testisuure F os nollahpoteesi pätee, niin H ( )( ) SS = SSE : Ei -vaikutusta F F(( ),( )( )) Suuret testisuureen F arvot johtavat nollahpoteesin H hlkäämiseen. Satunnaistetun tädellisen lohkoasetelman testin tulos ilmaistaan tavallisesti varianssianalsitaulukon muodossa: Vaihtelun lähde Neliösumma SS Vapaus-asteet df Varianssiestimaattori MS F-testisuure SS MS = SS F = MS MSE R SSR MSR = SSR C SSC MSC = SSC SSE MSE = äännös SSE ( )( ) ( )( ) Kokonaisvaihtelu SST Varianssianalsitaulukon neliösummat toteuttavat varianssianalsihajotelman SST = SS + SSR + SSC + SSE ja neliösummia vastaavat vapausasteet toteuttavat htälön = ( ) + ( ) + ( ) + ( )( ) TKK @ Ilkka Mellin (005) 36/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Laskutoimitusten järjestel latinalaisten neliöiden koeasetelmassa os varianssianalsihajotelman neliösummat SST, SS, SSB, SSC, SSE joudutaan laskemaan käsin tai laskimella, kannattaa laskutoimituksissa kättää alla esitettäviä kaavoja. Määritellään seuraavat summat: T T iii i ji j= k= i= k= T = T iik iii = = = i= j= ijk ijk ijk i= j= k= ijk i =,,,, j =,,,, k =,,, Tällöin llä määritellt keskiarvot saadaan kaavoilla iii i ji iik = Tiii = Ti ji = Tiik i =,,,, j =,,,, k =,,, Havaintoarvojen kokonaisvaihtelua kuvaava neliösumma voidaan laskea kaavalla SST = = T ( ijk iii) ijk i= j= k= i= j= k= Käsittelvaikutusta kuvaava neliösumma voidaan laskea kaavalla SS = = T T ( iik ii) iik iii k= k= Rivivaikutusta kuvaava neliösumma voidaan laskea kaavalla SSR = = T T ( iii ii) iii iii i= i= Sarakevaikutusta kuvaava neliösumma saadaan kaavalla SSC = = T T ( i ji ii) i ji iii j= i= äännösvaihtelua kuvaava neliösumma saadaan kaavalla SSE = SST SS SSR SSC iii TKK @ Ilkka Mellin (005) 37/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Tehtävä 9.3. Ratkaisu: Tehtävän tapauksessa Tekijä = Bensiinilaatu; tasot: = regular, B = super, C = extra Rivitekijä R = jaja; tasot: ajaja,, 3 Saraketekijä C = uton tppi; tasot: 4 slinteriä, 6 slinteriä, 8 slinteriä Siten = 3 ja luokituksessa snt rhmää. okaisesta rhmästä = = 3 = 9 (i, j), i =,, 3 (rivi), j =,, 3 (sarake) on kerätt havainto siten, että jokaista käsittelä (k = ), B (k = ), C (k = 3) on sovellettu täsmälleen kerran indeksien i ja j määräämällä rivillä ja sarakkeella. Satunnaistamista voidaan kuvata seuraavalla lokeromallilla: (i) (ii) Muodostetaan lokerikko, jossa on = = 3 = 9 lokeroa, jotka indeksoidaan rivitekijän R ja saraketekijän C tasojen määräämillä lukupareilla (i, j), i =,, 3, j =,, 3 Valitaan satunnaisesti ksi kaikista mahdollisista latinalaisista 3 3-neliöistä. Lokeroa (i, j) vastaava ajaja-auto-kombinaatio kättää sitä bensiinilaatua, jota vastaava kirjain on osunut ko. lokeroon, i =,, 3, j =,, 3. Tehtävän tapauksessa kokeen tuloksena saatiin seuraava taulukko: jettu matka (mile) uton tppi 4 s 6 s 8 s 36.0 B 33.0 C 6.5 jaja B 36.5 C 33.5 5.0 3 C 38.0 3.5 B 6.0 TKK @ Ilkka Mellin (005) 38/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Neliösummien laskeminen Lasketaan kaikkien havaintojen neliöiden summa: i= j= k= ijk Lasketaan käsittelsummat: = 9343 : Tii ii j= i= = = 36.0 + 3.5 + 5.0 = 93.5 B: Tii ii j= i= = = 33.0 + 36.5 + 6.0 = 95.5 C: Tii3 ii3 j= i= Lasketaan rivisummat: = = 6.5 + 33.5 + 38.0 = 98.0 T = = 36.0 + 33.0 + 6.5 = 95.5 ii ii j= k= T = = 36.5 + 33.5 + 5.0 = 95.0 ii ii j= k= T = = 38.0 + 3.5 + 6.0 = 96.5 3ii 3ii j= k= Lasketaan sarakesummat: T = = 36.0 + 36.5 + 38.5 = 0.5 ii ii i= k= T = = 33.0 + 33.5 + 3.5 = 99.0 ii ii i= k= T = = 6.5 + 5.0 + 6.0 = 77.5 i3i i3i i= k= Lasketaan kokonaissumma: 3 T = T = 0.5 + 99.0 + 77.5 = 87.0 iii j = i ji TKK @ Ilkka Mellin (005) 39/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit jettu matka (mile) uton tppi 4 s 6 s 8 s Summa 36.0 B 33.0 C 6.5 95.5 jaja B 36.5 C 33.5 5.0 95.0 3 C 38.0 3.5 B 6.0 96.5 Summa 0.5 99.0 77.5 87.0 Lasketaan latinalaisten neliöiden koeasetelman varianssianalsihajotelman neliösummat: SST = T i= j= k= = 9343 87 3 = 90.8889 ijk iii SS = Tiik T iii k = = + + 3 9 = 3.3889 (93.5 95.5 98.0 ) 87 SSR = Ti ii T iii i= = + + 3 3 = 0.3889 (95.5 95.0 96.5 ) 87 SSC = T T i ji iii j = = + + 3 3 = 87.0556 (0.5 99.0 77.5 ) 87 SSE = SST SS SSR SSC = 90.889 3.3889 0.3889 87.0566 = 0.0556 TKK @ Ilkka Mellin (005) 40/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit F-testisuureen laskeminen Olkoon nollahpoteesina H : Ei -vaikutusta Testisuureen F arvoksi saadaan F ( )( ) SS = ( ) SSE (3 )(3 ) 3.3889 = (3 ) 0.0556 = 6.00 os nollahpoteesi H pätee, niin F F(( ),( )( )) = F(,) Testin tekeminen Olkoon nollahpoteesina H : Ei -vaikutusta Testisuureen arvoksi saatiin F = 6.00 Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla r( F 6.00) = 0.06 Siten nollahpoteesi H voidaan hlätä merkitsevstasolla 0.05, mutta ei merkitsevstasolla 0.0. Taulukoiden mukaan jossa Koska r(f 9.000) = 0.05 r(f 99.000) = 0.0 F F(( ),( )( )) = F(,) 9.00 < F = 6.00 < 99.00 voimme todeta (htäpitävästi llä esitetn kanssa), että nollahpoteesi H voidaan hlätä merkitsevstasolla 0.05, mutta ei merkitsevstasolla 0.0. TKK @ Ilkka Mellin (005) 4/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Testien tuloksista voidaan rakentaa seuraava varianssianalsitaulukko: Vaihtelun lähde SS df MS F p 3.3889.6944 6.00 0.06 R 0.3889 0.944 C 87.0566 93.578 E 0.0556 0.0778 T 90.8889 8 ohtopäätös: os kätämme 5 %:n merkitsevstasoa, voimme hlätä nollahpoteesin H : Ei -vaikutusta Testin mukaan bensiinin laadulla on vaikutusta annetulla bensiinimäärällä ajettuun matkaan. TKK @ Ilkka Mellin (005) 4/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Ncss-ohjelma antaa tehtävän 9.3. aineistosta seuraavan tulostuksen: nalsis of Variance Report Expected Mean Squares Section Source Term Denominator Expected Term DF Fixed? Term Mean Square : Driver Yes S(BC) S+bcs B: Tpeofuto Yes S(BC) S+acsB C: Gasoline Yes S(BC) S+absC S(BC) No S Note: Expected Mean Squares are for the balanced cell-frequenc case. nalsis of Variance Table Source Sum of Mean rob ower Term DF Squares Square F-Ratio Level (lpha=0.05) : Driver 0.3888889 0.944444 7.00 0.5000 0.330546 B: Tpeofuto 87.0556 93.5778 3367.00 0.00097*.000000 C: Gasoline 3.388889.694444 6.00 0.069* 0.955009 S 5.555556E-0.777778E-0 Total (djusted) 8 90.8889 Total 9 * Term significant at alpha = 0.05 Means and Standard Error Section Standard Term Count Mean Error ll 9 3.88889 : Driver 3 3.83333 9.6505E-0 3 3.66667 9.6505E-0 3 3 3.6667 9.6505E-0 B: Tpeofuto 3 36.83333 9.6505E-0 3 33 9.6505E-0 3 3 5.83333 9.6505E-0 C: Gasoline 3 3.6667 9.6505E-0 3 3.83333 9.6505E-0 3 3 3.66667 9.6505E-0 TKK @ Ilkka Mellin (005) 43/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit lots Section Means of Mileage 40.00 36.00 Mileage 3.00 8.00 4.00 3 Driver Means of Mileage 40.00 36.00 Mileage 3.00 8.00 4.00 3 Tpeofuto Means of Mileage 40.00 36.00 Mileage 3.00 8.00 4.00 3 Gasoline TKK @ Ilkka Mellin (005) 44/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Bonferroni (ll-airwise) Multiple Comparison Test Response: Mileage Term : Driver lpha=0.050 Error Term=S(BC) DF= MSE=.777778E-0 Critical Value=7.648804 Different Group Count Mean From Groups 3 3.66667 3 3.83333 3 3 3.6667 Bonferroni (ll-airwise) Multiple Comparison Test Response: Mileage Term B: Tpeofuto lpha=0.050 Error Term=S(BC) DF= MSE=.777778E-0 Critical Value=7.648804 Different Group Count Mean From Groups 3 3 5.83333, 3 33 3, 3 36.83333 3, Bonferroni (ll-airwise) Multiple Comparison Test Response: Mileage Term C: Gasoline lpha=0.050 Error Term=S(BC) DF= MSE=.777778E-0 Critical Value=7.648804 Different Group Count Mean 3 3.6667 From Groups 3 3 3.83333 3 3 3.66667 TKK @ Ilkka Mellin (005) 45/46

Mat-.03 Koesuunnittelu ja tilastolliset mallit Tehtävien 9., 9., 9.3 laskutoimitusten suorittaminen Microsoft Excel -ohjelmalla: Tehtävä Tehtävä 9.. Tehtävä 9.. Tehtävä 9.3. Tiedosto KsHt9.xls > Ht9.. KsHt9.xls > Ht9.. KsHt9.xls > Ht9.3. Tehtävien 9., 9., 9.3 laskutoimitusten suorittaminen Ncss-ohjelmalla: Tehtävä Tehtävä 9.. Tehtävä 9.. Tehtävä 9.3. Tiedostot Lehtiniput.S0, Lehtiniput.S Tokokemus.S0, Tokokemus.S GasMileage.S0, GasMileage.S TKK @ Ilkka Mellin (005) 46/46