1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA



Samankaltaiset tiedostot
Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Hierarkkiset koeasetelmat. Heliövaara 1

Lohkoasetelmat. Heliövaara 1

Toimittaja Erä

Altistusaika 1 kk 2 kk 3 kk

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Mat Tilastollisen analyysin perusteet, kevät 2007

Lohkoasetelmat. Kuusinen/Heliövaara 1

Perusnäkymä yksisuuntaiseen ANOVAaan

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Testejä suhdeasteikollisille muuttujille

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

Vastepintamenetelmä. Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

2 2 -faktorikokeen määritelmä

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Kertausluento. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3


Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

MS-C2{04 Tilastollisen analyysin perusteet

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Aki Taanila VARIANSSIANALYYSI

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Otoskoko 107 kpl. a) 27 b) 2654

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Kvantitatiiviset menetelmät

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Mat Sovellettu todennäköisyyslasku A

Teema 9: Tilastollinen merkitsevyystestaus

Yleistetyistä lineaarisista malleista

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Testit järjestysasteikollisille muuttujille

MTTTP5, luento Luottamusväli, määritelmä

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Regressioanalyysi. Kuusinen/Heliövaara 1

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

voidaan hylätä, pienempi vai suurempi kuin 1 %?

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Frequencies. Frequency Table

Terra Preta kasvatuskoe Pilkon pellolla

Tilastotieteen jatkokurssi syksy 2003 Välikoe

Sovellettu todennäköisyyslaskenta B

SPSS-perusteet. Sisältö

Mat Tilastollisen analyysin perusteet, kevät 2007

A250A0050 Ekonometrian perusteet Tentti

Mat Tilastollisen analyysin perusteet

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Transkriptio:

Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalyysi Bonferronin menetelmä, F-testi, Jäännösneliösumma, Kaksisuuntainen varianssianalyysi Kokonaiskeskiarvo, Kokonaisneliösumma, Kokonaisvaihtelu, Luottamusväli, Neliösumma, Odotusarvo, Odotusarvojen vertailu, Päävaikutus, Reunahajonta, Reunakeskiarvo, Ryhmien sisäinen vaihtelu, Ryhmien välinen vaihtelu, Ryhmä, Ryhmäkeskiarvo, Ryhmäneliösumma, Taso, Testi, Vapauaste, Varianssi, Varianssianalyysihajotelma, Yhdysvaikutus, Yksisuuntainen varianssianalyysi, Yleiskeskiarvo 1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA STATISTIX-tiedostossa SATO on esitetty tulokset maissinviljelykokeesta, jossa on tutkittu viiden eri lannoiteseoksen (tekijä A) vaikutusta viiden eri maissilajikkeen (tekijä B) satoon. Jokaista lannoiteaineseos-maissilajikeyhdistelmää kokeiltiin kuudella eri koealalla. Sadot eri koealoilta on annettu muuttujana SATO. Indikaattorimuuttuja LANNOITE ilmaisee käytetyn lannoiteaineseoksen ja indikaattorimuuttuja MAISSI ilmaisee maissilajikkeen. (a) (b) (c) (d) (e) (f) Tutustu tiedoston SATO rakenteeseen ja indikaattorimuuttujien logiikkaan. Mikä on selitettävänä muuttujana? Tee aineistolle kaksisuuntainen varianssianalyysi. Mitkä ovat yhdysvaikutuksen neliösumma, päävaikutusten neliösummat, jäännösneliösumma eli ryhmien sisäistä vaihtelua kuvaava neliösumma ja kokonaisneliösumma sekä vastaavat vapausasteet? Esitä myös miten vapausasteet saadaan. Testaa nollahypoteeseja H AB : H A : H B : Ei yhdysvaikutusta Ei A-vaikutusta Ei B-vaikutusta Mitkä ovat näitä hypoteeseja testaavien testisuureiden arvot ja vastaavat p-arvot? Ovatko hypoteesit perusteltuja? Laske kaksisuuntaisen varianssianalyysin testisuureiden arvot varianssianalyysihajotelman neliösummista ja tarkista, että tulos on sama kuin (d)-kohdassa. Laske ryhmäkeskiarvot ja -hajonnat, reunakeskiarvot ja -hajonnat sekä yleiskeskiarvo. TKK/SAL Ilkka Mellin (2005) 1/36

(g) Esitä ryhmäkeskiarvot graafisesti: STATISTIX: Statistics > Summary Statistics > Error Bar Chart Model Specification = Categorical Dependent Variable = SATO Categorical Variables = LANNOITE, MAISSI / MAISSI, LANNOITE Chart Type = Line Error Bar Type = Std Deviation (h) (i) RATKAISU: Esitä tulkinnat kuvioille. Vertaile sekä eri lannoiteseosten että eri maissilajikkeiden odotusarvoja käyttämällä Bonferronin menetelmää. Millaisia ryhmityksiä aineistosta löytyy? Esitä tulkinnat testituloksille. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. (a) AINEISTON ESITYSMUOTO STATISTIX-tiedostossa SATO on seuraavat muuttujat: SATO = Maissin sato; LANNOITE = Selitettävä muuttuja Lannoiteseos; MAISSI = Maissilajike; Indikaattorimuuttuja; arvot = 1, 2, 3, 4, 5; tekijä A Indikaattorimuuttuja; arvot = 1, 2, 3, 4, 5; tekijä B Tutkimuksen päämääränä oli selvittää millä tavalla maissin sato (muuttuja SATO) riippuu erilaisista lannoiteaineseos-maissilajikeyhdistelmistä. Lannoiteaineseoksia (tekijä A) oli 5 erilaista ja maissilajikkeita (tekijä B) oli 5 erilaista, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 5 5 = 25. Jokaista lannoiteaineseos-maissilajike-yhdistelmää kokeiltiin 6:lla koealalla, joten havaintojen kokonaislukumäärä oli 25 6 = 150. Siis Tekijän A tasojen lukumäärä: I = 5 Tekijän B tasojen lukumäärä: J = 5 Ryhmien lukumäärä: IJ = 25 Havaintojen lukumäärä ryhmässä: K = 6 Havaintojen kokonaislukumäärä: N = KIJ = 150 TKK/SAL Ilkka Mellin (2005) 2/36

(b) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston SATO aineistolle. STATISTIX: Statistics > Linear Models > General AOV/AOCV Dependent Variable = SATO AOV Model Statement LANNOITE MAISSI LANNOITE*MAISSI Varianssianalyysimalli kirjoitetaan ikkunaan AOV Model Statement antamalla päävaikutukset ja yhdysvaikutukset. Koska muuttujan SATO mallina on kaksisuuntaisen varianssianalyysin malli ja jokaisesta ryhmästä on useampia havaintoja, päävaikutuksia on kaksi: LANNOITE MAISSI ja yhdysvaikutuksia on yksi: LANNOITE*MAISSI STATISTIX FOR WINDOWS SATO ANALYSIS OF VARIANCE TABLE FOR SATO SOURCE DF SS MS F P ------------- ---- ---------- ---------- ------- ------ LANNOITE (A) 4 2997.69 749.423 45.80 0.0000 MAISSI (B) 4 803.827 200.957 12.28 0.0000 A*B 16 226.573 14.1608 0.87 0.6096 RESIDUAL 125 2045.17 16.3613 ------------- ---- ---------- TOTAL 149 6073.26 (c) VARIANSSIANALYYSIHAJOTELMA JA VAPAUSASTEET KAKSISUUNTAISESSA VARIANSSIANALYYSISSA Neliösummat Varianssianalyysihajotelman neliösummat annetaan sarakkeessa SS. Päävaikutuksen A (LANNOITE) neliösumma SSA: 2997.69 Päävaikutuksen B (MAISSI) neliösumma SSB: 803.827 Yhdysvaikutuksen A*B neliösumma SSAB: 226.573 Jäännösneliösumma SSE: 2045.17 Kokonaisneliösumma SST: 6073.26 TKK/SAL Ilkka Mellin (2005) 3/36

Varianssianalyysihajotelma: SST = SSA + SSB + SSAB + SSE Vapausasteet Varianssianalyysihajotelman neliösummien vapausasteet annetaan sarakkeessa DF. Päävaikutuksen A neliösumman vapausasteet I 1: 5 1 = 4 Päävaikutuksen B neliösumman vapausasteet J 1: 5 1 = 4 Yhdysvaikutuksen A*B neliösumman vapausasteet (I 1)(J 1): (5 1) (5 1) = 16 Jäännösneliösumman vapausasteet N IJ: 150 5 5 = 125 Kokonaisneliösumman vapausasteet N 1: 150 1 = 149 (d) TESTIT KAKSISUUNTAISESSA VARIANSSIANALYYSISSA Testisuureet kaksisuuntaisen varianssianalyysin nollahypoteeseille annetaan sarakkeessa F ja vastaavat p-arvot annetaan sarakkeessa P. Nollahypoteesi H AB : Ei yhdysvaikutusta Testisuureen arvo: F AB = 0.97 Vastaava p-arvo: p = 0.6096 Johtopäätös: Nollahypoteesi H AB voidaan jättää voimaan. Nollahypoteesi H A : Ei A-vaikutusta Testisuureen arvo: F A = 45.80 Vastaava p-arvo (neljällä desimaalilla): p = 0.0000 Johtopäätös: Nollahypoteesi H A voidaan hylätä. Nollahypoteesi H B : Ei B-vaikutusta Testisuureen arvo: F B = 45.80 Vastaava p-arvo (neljällä desimaalilla): p = 0.0000 TKK/SAL Ilkka Mellin (2005) 4/36

Johtopäätös: Nollahypoteesi H B voidaan hylätä. (e) KAKSISUUNTAISEN VARIANSSIANALYYSIN TESTISUUREIDEN LASKEMINEN NELIÖSUMMISTA Nollahypoteesi H AB : Ei yhdysvaikutusta Testisuureen arvo on F AB N IJ SSAB MSAB 14.1608 = = = = 0.87 ( I 1)( J 1) SSE MSE 16.3613 jossa SSAB MSAB = = 14.1608 ( I 1)( J 1) SSE MSE = = 16.3613 N IJ Nollahypoteesi H A : Ei A-vaikutusta Testisuureen arvo on F A N IJ SSA MSA 749.423 = = = = 45.80 I 1 SSE MSE 16.3613 jossa SSA MSA = = 749.423 I 1 SSE MSE = = 16.3613 N IJ Nollahypoteesi H B : Ei B-vaikutusta Testisuureen arvo on F B N IJ SSB MSB 200.957 = = = = 12.28 J 1 SSE MSE 16.3613 jossa SSB MSB = = 200.957 J 1 SSE MSE = = 16.3613 N IJ TKK/SAL Ilkka Mellin (2005) 5/36

(f) RYHMÄKESKIARVOT JA -HAJONNAT, REUNAKESKIARVOT JA -HAJONNAT SEKÄ YLEISKESKIARVO Lasketaan ryhmäkeskiarvot ja -hajonnat, reunakeskiarvot ja -hajonnat sekä yleiskeskiarvo. STATISTIX: General AOV/AOCV AOV Table > Results Means and Standard Errors Main Effects and Interactions LANNOITE MAISSI LANNOITE*MAISSI Niiden ryhmitysten, joiden suhteen keskiarvot halutaan, kirjoitetaan ikkunaan Main Effects and Interactions Jos ikkunaan, kirjoitetaan vain päävaikutukset, saadaan reunakeskiarvot. Jos ikkunaan kirjoitetaan yhdysvaikutukset, saadaan myös ryhmäkeskiarvot. Koska muuttujan SATO mallina on kaksisuuntaisen varianssianalyysin malli ja jokaisesta ryhmästä on useampia havaintoja, päävaikutuksia on kaksi: LANNOITE MAISSI ja yhdysvaikutuksia on yksi LANNOITE*MAISSI TKK/SAL Ilkka Mellin (2005) 6/36

Yleiskeskiarvo sekä ja reunakeskiarvot ja -hajonnat STATISTIX FOR WINDOWS SATO GRAND MEAN 81.460 SE 0.3303 MEANS OF SATO FOR LANNOITE LANNOITE MEAN SS (MEAN) --------- ---------- ----------- 1 79.567 571.37 2 74.333 884.67 3 87.567 425.37 4 84.333 462.67 5 81.500 731.50 OBSERVATIONS PER CELL 30 STD ERROR OF AN AVERAGE 0.7385 STD ERROR (DIFF OF 2 AVE'S) 1.0444 ERROR TERM USED: RESIDUAL, 125 DF MEANS OF SATO FOR MAISSI MAISSI MEAN SS (MEAN) --------- ---------- ----------- 1 80.967 1329.0 2 77.367 1349.0 3 83.933 987.87 4 81.667 792.67 5 83.367 810.97 OBSERVATIONS PER CELL 30 STD ERROR OF AN AVERAGE 0.7385 STD ERROR (DIFF OF 2 AVE'S) 1.0444 ERROR TERM USED: RESIDUAL, 125 DF Yleiskeskiarvo: Reunakeskiarvot tekijän A suhteen: Reunakeskiarvot tekijän B suhteen: GRAND MEAN MEANS OF SATO FOR LANNOITE MEANS OF SATO FOR MAISSI Vastaavat neliösummat on annettu sarakkeessa SS (MEAN). Ryhmäkohtaiset varianssit voidaan laskea näistä neliösummista tavanomaisilla varianssin kaavoilla: s s 1 K J 2 2 ii = ( yki j yiii) KJ 1 k= 1 j= 1 1 K I 2 2 i j = ( ykij yi i j) KI 1 k= 1 i= 1 TKK/SAL Ilkka Mellin (2005) 7/36

Keskiarvojen keskivirheet STD ERROR OF AN AVERAGE on määrätty varianssianalyysin päätulostuksen jäännösvarianssin estimaattoreista: 2 SSE MSE s ( xii i ) = = KJ ( N IJ ) KJ 2 SSE MSE s ( xii j ) = = KI( N IJ ) KI Ryhmäkeskiarvot ja -hajonnat MEANS OF SATO FOR LANNOITE*MAISSI LANNOITE MAISSI MEAN SS (MEAN) --------- --------- ---------- ----------- 1 1 79.500 71.500 1 2 74.167 60.833 1 3 83.000 70.000 1 4 80.500 37.500 1 5 80.667 73.333 2 1 73.000 186.00 2 2 69.500 187.50 2 3 76.500 109.50 2 4 74.667 51.333 2 5 78.000 90.000 3 1 87.667 69.333 3 2 84.000 94.000 3 3 89.833 46.833 3 4 86.500 29.500 3 5 89.833 40.833 4 1 85.500 77.500 4 2 82.500 53.500 4 3 87.000 56.000 4 4 83.167 128.83 4 5 83.500 63.500 5 1 79.167 118.83 5 2 76.667 95.333 5 3 83.333 101.33 5 4 83.500 69.500 5 5 84.833 62.833 OBSERVATIONS PER CELL 6 STD ERROR OF AN AVERAGE 1.6513 STD ERROR (DIFF OF 2 AVE'S) 2.3353 ERROR TERM USED: RESIDUAL, 125 DF Ryhmäkeskiarvot: MEANS OF SATO FOR LANNOITE*MAISSI Vastaavat neliösummat on annettu sarakkeessa SS (MEAN). Ryhmäkohtaiset varianssit voidaan laskea näistä neliösummista tavanomaisella varianssin kaavalla: s 1 K 2 2 ij = ( ykij y ij ) K 1 i k = 1 TKK/SAL Ilkka Mellin (2005) 8/36

Keskiarvojen keskivirheet STD ERROR OF AN AVERAGE on määrätty varianssianalyysin päätulostuksen jäännösvarianssin estimaattorista: SSE MSE s 2 ( xi ij ) = = K( N IJ) K (g) RYHMÄKESKIARVOJEN GRAAFINEN ESITYS Esitetään ryhmäkeskiarvot ja -hajonnat graafisesti. STATISTIX: Statistics > Summary Statistics > Error Bar Chart Model Specification = Categorical Dependent Variable = SATO Categorical Variables = LANNOITE, MAISSI / MAISSI, LANNOITE Chart Type = Line Error Bar Type = Std Deviation Kummankin kuvion murtoviivojen yhdensuuntaisuus kuvastaa sitä, että tekijöiden A (LANNOITE) ja B (MAISSI) välillä ei todettu yhdysvaikusta. Sen sijaan murtoviivojen eritasoisuus saattaa merkitä sitä, että sato riippuu toisistaan riippumatta tekijöistä A ja B; ks. (f)-kohta. TKK/SAL Ilkka Mellin (2005) 9/36

Alla olevassa kuviossa murtoviivat kuvaavat sadon vaihtelua eri lannoiteseoksilla. 93 Error Bar Chart with SD SATO 87 81 75 69 MAISSI 1 2 3 4 5 63 1 2 3 4 5 LANNOITE 150 cases Alla olevassa kuviossa murtoviivat kuvaavat sadon vaihtelua eri maissilajikkeilla. 93 Error Bar Chart with SD SATO 87 81 75 69 LANNOITE 1 2 3 4 5 63 1 2 3 4 5 MAISSI 150 cases TKK/SAL Ilkka Mellin (2005) 10/36

(h) ODOTUSARVOJEN VERTAILU Koska nollahypoteesi H AB : Ei yhdysvaikutusta jäi voimaan, voidaan tekijöitä A (LANNOITE) ja B (MAISSI) tarkastella erillisinä. Tekijä A (LANNOITE) STATISTIX: General AOV/AOCV AOV Table > Results Comparison of Means Main Effects or Interactions LANNOITE Comparison Method = Bonferroni Alpha = 0.05 STATISTIX FOR WINDOWS SATO BONFERRONI COMPARISON OF MEANS OF SATO BY LANNOITE HOMOGENEOUS LANNOITE MEAN GROUPS --------- ---------- ----------- 3 87.567 I 4 84.333.. I 5 81.500.. I I 1 79.567... I 2 74.333... I THERE ARE 4 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 2.858 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 2.9846 STANDARD ERROR FOR COMPARISON 1.0444 ERROR TERM USED: RESIDUAL, 125 DF Vertailutulosten mukaan aineisto koostuu viiden sijasta neljästä ryhmästä: Ryhmä 1: Lannoiteseos 3 Ryhmä 2: Lannoiteseokset 4 ja 5 Ryhmä 3: Lannoiteseokset 5 ja 1 Ryhmä 4: Lannoiteseos 2 Parhaan sadon tuottaa lannoiteseos 3. TKK/SAL Ilkka Mellin (2005) 11/36

Tekijä B (MAISSI) STATISTIX: General AOV/AOCV AOV Table > Results Comparison of Means Main Effects or Interactions MAISSI Comparison Method = Bonferroni Alpha = 0.05 STATISTIX FOR WINDOWS SATO BONFERRONI COMPARISON OF MEANS OF SATO BY MAISSI HOMOGENEOUS MAISSI MEAN GROUPS --------- ---------- ----------- 3 83.933 I 5 83.367 I 4 81.667 I 1 80.967 I 2 77.367.. I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 2.858 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 2.9846 STANDARD ERROR FOR COMPARISON 1.0444 ERROR TERM USED: RESIDUAL, 125 DF Vertailutulosten aineisto koostuu viiden sijasta kahdesta ryhmästä: Ryhmä 1: Lajikkeet 3, 5, 4, 1 Ryhmä 2: Lajike 2 Lajikkeet 3, 5, 4 ja 1 tuottavat parhaan sadon. (i) JOHTOPÄÄTÖKSET (1) Tekijöiden MAISSI ja LANNOITE välillä ei ole yhdysvaikutusta, joten maissin lajike ja lannoiteseos valita toisistaan riippumatta. (2) Maissin lajikkeista 3, 5, 4 ja 1 tuottavat parhaan sadon ja ovat yhtä hyviä. (3) Lannoiteseoksista 3 tuottaa parhaan sadon. TKK/SAL Ilkka Mellin (2005) 12/36

2. KAKSISUUNTAINEN VARIANSSIANALYYSI, KUN JOKAISESSA SOLUSSA ON VAIN YKSI HAVAINTO Sementtitehtaan tuote täytetään 50 kg säkkeihin. Säkkejä on täyttämässä kuusi konetta. Tietyin väliajoin jokaiselta koneelta poimitaan yksi säkki tarkistuspunnitukseen. STATISTIX-tiedostossa PAKPAINOT on esitetty punnitustulokset 16 otoksesta. Punnituksien tulokset on annettu poikkeamina tavoitearvosta 50 kg muuttujana PAINO. Indikaattorimuuttuja KONE (tekijä A) ilmaisee säkin täyttäneen koneen ja indikaattorimuuttuja OTOS (tekijä B) ajanhetken, jona säkit on otettu tarkistukseen. Huomaa, että jokaisessa solussa on vain yksi havainto. (a) (b) (c) (d) (e) (f) (g) (h) RATKAISU: Esitä tulkinnat tekijöille A ja B sekä formuloi testattavat hypoteesit. Mikä on selitettävänä muuttujana? Tee aineistolle kaksisuuntainen varianssianalyysi. Mitkä ovat yhdysvaikutuksen neliösumma, päävaikutusten neliösummat ja kokonaisneliösumma sekä vastaavat vapausasteet? Et voi nyt muodostaa ryhmien sisäistä vaihtelua kuvaavaa neliösummaa. Miksi? Testaa nollahypoteeseja H A : Ei A-vaikutusta H B : Ei B-vaikutusta Et voi nyt testata yhdysvaikutuksen olemassaoloa. Miksi? Mitkä ovat hypoteeseja testaavien testisuureiden arvot ja vastaavat p-arvot? Ovatko hypoteesit perusteltuja? Laske ryhmäkeskiarvot ja -hajonnat, reunakeskiarvot ja -hajonnat sekä yleiskeskiarvot. Esitä ryhmäkeskiarvot graafisesti. Vertaile sekä eri lannoiteseosten että eri maissilajikkeiden odotusarvoja käyttämällä Bonferronin menetelmää. Millaisia ryhmityksiä aineistosta löytyy? Esitä tulkinnat testituloksille. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. STATISTIX-tiedostossa PAKPAINOT on seuraavat muuttujat: PAINO = Poikkeama sementtisäkin painon tavoitearvosta 50 kg; Selitettävä muuttuja KONE = Säkkejä täyttänyt kone; Indikaattorimuuttuja; arvot = 1, 2, 3, 4, 5, 6; tekijä A OTOS = Näytteen numero; Indikaattorimuuttuja; arvot = 1, 2,, 16; tekijä B TKK/SAL Ilkka Mellin (2005) 13/36

Tutkimuksen päämääränä oli selvittää millä tavalla säkin paino (muuttuja PAINO) riippuu säkkejä täyttäneestä koneesta ja näytteen numerosta. Kiinnostus kohdistuu varsinaisesti konekohtaisiin eroihin. Näytteen numero on mukana selittävänä tekijänä, koska saattaa olla mahdollista, että koneiden toiminnassa esiintyy ryömimisefektejä eli poikkeamat säkkien painon tavoitearvosta kasvavat tai vähenevät systemaattisesti. Koneita (tekijä A) oli 6 ja ajankohtia (tekijä B), jolloin näytteitä poimittiin oli 16, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 6 16 = 96. Kultakin koneelta otettiin kunakin ajanhetkenä vain 1 näyte, joten havaintojen kokonaislukumäärä oli myös 96. Siis Tekijän A tasojen lukumäärä: I = 6 Tekijän B tasojen lukumäärä: J = 16 Ryhmien lukumäärä: IJ = 96 Havaintojen lukumäärä ryhmässä: K = 1 Havaintojen kokonaislukumäärä: N = KIJ = 96 Testattavat nollahypoteesit: H A : Ei A-vaikutusta H B : Ei B-vaikutusta Koska jokaisesta ryhmästä on vain yksi havainto, tekijöiden A ja B yhdysvaikutusta ei voida testata. (b) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston PAKPAINOT aineistolle. STATISTIX: Statistics > Linear Models > General AOV/AOCV Dependent Variable = PAINO AOV Model Statement KONE OTOS Varianssianalyysimalli kirjoitetaan ikkunaan AOV Model Statement antamalla päävaikutukset ja yhdysvaikutukset. Koska muuttujan PAINO mallina on kaksisuuntaisen varianssianalyysin malli ja jokaisesta ryhmästä on vain yksi havainto, päävaikutuksia on kaksi (KONE ja OTOS) ja yhdysvaikutuksia ei ole. TKK/SAL Ilkka Mellin (2005) 14/36

STATISTIX FOR WINDOWS PAKPAINOT ANALYSIS OF VARIANCE TABLE FOR PAINO SOURCE DF SS MS F P ------------- ---- ---------- ---------- ------- ------ KONE (A) 5 201.708 40.3417 11.52 0.0000 OTOS (B) 15 951.500 63.4333 18.12 0.0000 A*B 75 262.625 3.50167 ------------- ---- ---------- TOTAL 95 1415.83 (c) VARIANSSIANALYYSIHAJOTELMA JA VAPAUSASTEET KAKSISUUNTAISESSA VARIANSSIANALYYSISSA Neliösummat Varianssianalyysihajotelman neliösummat annetaan sarakkeessa SS. Päävaikutuksen A (KONE) neliösumma SSA: 201.708 Päävaikutuksen B (OTOS) neliösumma SSB: 951.500 Yhdysvaikutuksen A*B neliösumma SSAB: 262.625 Kokonaisneliösumma SST: 1415.83 Varianssianalyysihajotelma: SST = SSA + SSB + SSAB Vapausasteet Varianssianalyysihajotelman neliösummien vapausasteet annetaan sarakkeessa DF. Päävaikutuksen A neliösumman vapausasteet I 1: 6 1 = 5 Päävaikutuksen B neliösumman vapausasteet J 1: 16 1 = 15 Yhdysvaikutuksen A*B neliösumman vapausasteet (I 1)(J 1): (6 1) (16 1) = 75 Kokonaisneliösumman vapausasteet N 1: 96 1 = 95 Ryhmien sisäistä vaihtelua kuvaavaa jäännösneliösummaa SSE ei voida muodostaa, koska ryhmien sisäistä vaihtelua ei ole (1 havainto per ryhmä). (d) TESTIT KAKSISUUNTAISESSA VARIANSSIANALYYSISSA Testisuureet kaksisuuntaisen varianssianalyysin nollahypoteeseille annetaan sarakkeessa F ja vastaavat p-arvot annetaan sarakkeessa P. TKK/SAL Ilkka Mellin (2005) 15/36

Nollahypoteesi H A : Ei A-vaikutusta Testisuureen arvo: F A = 11.52 Vastaava p-arvo (neljällä desimaalilla): p = 0.0000 Johtopäätös: Nollahypoteesi H A voidaan hylätä. Nollahypoteesi H B : Ei B-vaikutusta Testisuureen arvo: F B = 18.12 Vastaava p-arvo (neljällä desimaalilla): p = 0.0000 Johtopäätös: Nollahypoteesi H B voidaan hylätä. (e) RYHMÄKESKIARVOT JA -HAJONNAT, REUNAKESKIARVOT JA -HAJONNAT SEKÄ YLEISKESKIARVO Lasketaan reunakeskiarvot ja -hajonnat sekä yleiskeskiarvo. STATISTIX: General AOV/AOCV AOV Table > Results Means and Standard Errors Main Effects and Interactions KONE OTOS Niiden ryhmitysten, joiden suhteen keskiarvot halutaan, kirjoitetaan ikkunaan Main Effects and Interactions Jos ikkunaan, kirjoitetaan vain päävaikutukset, saadaan reunakeskiarvot. Jos ikkunaan kirjoitetaan yhdysvaikutukset, saadaan myös ryhmäkeskiarvot. Koska muuttujan PAINO mallina on kaksisuuntaisen varianssianalyysin malli ja jokaisesta ryhmästä on vain yksi havainto, päävaikutuksia on kaksi (LANNOITE ja MAISSI) ja yhdysvaikutuksia ei ole. TKK/SAL Ilkka Mellin (2005) 16/36

STATISTIX FOR WINDOWS PAKPAINOT GRAND MEAN 1.7083 SE 0.1910 MEANS OF PAINO FOR KONE KONE MEAN SS (MEAN) --------- ---------- ----------- 1 0.3750 135.75 2 2.7500 137.00 3 4.1875 322.44 4 0.9375 156.94 5 6.94E-18 220.00 6 2.0000 242.00 OBSERVATIONS PER CELL 16 STD ERROR OF AN AVERAGE 0.4678 STD ERROR (DIFF OF 2 AVE'S) 0.6616 ERROR TERM USED: KONE*OTOS, 75 DF MEANS OF PAINO FOR OTOS OTOS MEAN SS (MEAN) --------- ---------- ----------- 1 4.8333 14.833 2 2.8333 14.833 3 5.6667 37.333 4 3.8333 60.833 5 3.3333 27.333 6 3.5000 41.500 7 3.6667 59.333 8 3.3333 39.333 9 3.5000 21.500 10-1.1667 64.833 11 0.5000 15.500 12-0.6667 13.333 13-0.1667 18.833 14 0.3333 19.333 15 1.8333 8.8333 16-7.8333 6.8333 OBSERVATIONS PER CELL 6 STD ERROR OF AN AVERAGE 0.7639 STD ERROR (DIFF OF 2 AVE'S) 1.0804 ERROR TERM USED: KONE*OTOS, 75 DF TKK/SAL Ilkka Mellin (2005) 17/36

(f) REUNAKESKIARVOJEN GRAAFINEN ESITYS Esitetään reunakeskiarvot ja -hajonnat graafisesti. STATISTIX: Statistics > Summary Statistics > Error Bar Chart Model Specification = Categorical Dependent Variable = SATO Categorical Variables = KONE / OTOS / OTOS, KONE Chart Type = Line Error Bar Type = Std Deviation 10 Error Bar Chart with SD 5 PAINO 0-5 1 2 3 4 5 6 KONE 96 cases TKK/SAL Ilkka Mellin (2005) 18/36

Error Bar Chart with SD 10 5 PAINO 0-5 -10 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 OTOS 96 cases Error Bar Chart with SD 10 5 KONE 1 PAINO 0-5 2 3 4 5 6-10 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 OTOS 96 cases TKK/SAL Ilkka Mellin (2005) 19/36

(g) ODOTUSARVOJEN VERTAILU Tekijä A (KONE) STATISTIX: General AOV/AOCV AOV Table > Results Comparison of Means Main Effects or Interactions KONE Comparison Method = Bonferroni Alpha = 0.05 STATISTIX FOR WINDOWS PAKPAINOT BONFERRONI COMPARISON OF MEANS OF PAINO BY KONE HOMOGENEOUS KONE MEAN GROUPS --------- ---------- ----------- 3 4.1875 I 2 2.7500 I I 6 2.0000.. I I 4 0.9375.. I I 1 0.3750... I 5 0.0000... I THERE ARE 3 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 3.032 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 2.0060 STANDARD ERROR FOR COMPARISON 0.6616 ERROR TERM USED: KONE*OTOS, 75 DF Vertailutulosten mukaan aineisto koostuu kuuden sijasta kahdesta ryhmästä: Ryhmä 1: Koneet 3 ja 2 Ryhmä 2: Koneet 6, 4, 1, 5 TKK/SAL Ilkka Mellin (2005) 20/36

Tekijä B (OTOS) STATISTIX: General AOV/AOCV AOV Table > Results Comparison of Means Main Effects or Interactions OTOS Comparison Method = Bonferroni Alpha = 0.05 STATISTIX FOR WINDOWS PAKPAINOT BONFERRONI COMPARISON OF MEANS OF PAINO BY OTOS HOMOGENEOUS OTOS MEAN GROUPS --------- ---------- ----------- 3 5.6667 I 1 4.8333 I 4 3.8333 I I 7 3.6667 I I I 6 3.5000 I I I 9 3.5000 I I I 8 3.3333 I I I 5 3.3333 I I I 2 2.8333 I I I I 15 1.8333 I I I I I 11 0.5000.. I I I I 14 0.3333.. I I I I 13-0.1667... I I I 12-0.6667... I I 10-1.1667... I 16-7.8333... I THERE ARE 6 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 3.694 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 3.9911 STANDARD ERROR FOR COMPARISON 1.0804 ERROR TERM USED: KONE*OTOS, 75 DF Vertailutulosten mukaan aineisto koostuu kuudentoista sijasta kolmesta ryhmästä: Ryhmä 1: Otokset 3, 1, 4, 7, 6, 9, 8, 5, 2, 15 Ryhmä 2: Otokset 15, 11, 14, 13, 12, 10 Ryhmä 3: Otos 16 TKK/SAL Ilkka Mellin (2005) 21/36

(h) JOHTOPÄÄTÖKSET (1) Koneet 3 ja 2 ovat tuottaneet selvästi liian painavia säkkejä. (2) Näytteissä 1-9 säkkien painot ovat olleet järjestelmällisesti liian suuria. Sen sijaan näytteissä 10-15 painot ovat olleet lähellä tavoitearvoa, kun taas näytteessä 16 säkkien painot ovat olleet liian pieniä. (3) Kone 3 on tuottanut näytteissä 1-8 muita painavampia säkkejä. (4) Koneissa 4 ja 5 on saattanut ollut häiriö näytteen 10 aikana. (5) Kaikki koneet ovat tuottaneet näytteen 16 aikana liian kevyitä säkkejä. Yhteenveto (6) Koneiden toiminnassa on eroja. (7) Koneiden toiminnassa on tapahtunut ryömimisefektejä. TKK/SAL Ilkka Mellin (2005) 22/36

3. KAKSISUUNTAINEN VARIANSSIANALYYSI: SOVELLUS 1 STATISTIX-tiedostossa SATO2 on esitetty tulokset kahdesta vehnänviljelykokeiden sarjasta, joissa on tutkittu kolmen eri lannoiteseoksen (tekijä A) vaikutusta kolmen eri vehnälajikkeen (tekijä B) satoon. Sadot eri koealoilta on annettu muuttujana YIELD. Indikaattorimuuttuja FERTIL ilmaisee käytetyn lannoiteaineseoksen, indikaattori-muuttuja VARIETY ilmaisee vehnälajikkeen ja indikaattorimuuttuja OBS ilmaisee kokeen. RATKAISU: Tee aineistolle kaksisuuntainen varianssianalyysi ja tulkitse tulokset. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. (a) AINEISTON ESITYSMUOTO STATISTIX-tiedostossa SATO2 on seuraavat muuttujat: YIELD FERTIL = Vehnän sato; Selitettävä muuttuja = Lannoiteseos; Indikaattorimuuttuja; arvot = 1, 2, 3; tekijä A VARIETY = Vehnälajike; Indikaattorimuuttuja; arvot = 1, 2, 3, 4; tekijä B Tutkimuksen päämääränä oli selvittää millä tavalla vehnän sato (muuttuja YIELD) riippuu erilaisista lannoiteaineseos-maissilajikeyhdistelmistä. Lannoiteaineseoksia (tekijä A) oli 3 erilaista ja vehnälajikkeita (tekijä B) oli 4 erilaista, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 3 4 = 12. Jokaista lannoiteaineseos-vehnälajike-yhdistelmää kokeiltiin 2:lla koealalla, joten havaintojen kokonaislukumäärä oli 12 2 = 24. Siis Tekijän A tasojen lukumäärä: I = 3 Tekijän B tasojen lukumäärä: J = 4 Ryhmien lukumäärä: IJ = 12 Havaintojen lukumäärä ryhmässä: K = 2 Havaintojen kokonaislukumäärä: N = KIJ = 24 Testattavat nollahypoteesit: H AB : H A : H B : Ei yhdysvaikutusta Ei A-vaikutusta Ei B-vaikutusta TKK/SAL Ilkka Mellin (2005) 23/36

(b) KESKIARVOJEN GRAAFINEN ESITYS Esitetään ryhmäkeskiarvot ja -hajonnat graafisesti. Murtoviivojen erisuuntaisuus ja mutkittelu alla olevissa kuviossa viittaavat sekä yhdysvaikutuksen että päävaikutusten olemassaoloon. Error Bar Chart with SD 95 87 FERTIL YIELD 1 2 79 3 71 1 2 3 4 VARIETY 24 cases Error Bar Chart with SD 95 YIELD 87 79 VARIETY 1 2 3 4 71 1 2 3 FERTIL 24 cases TKK/SAL Ilkka Mellin (2005) 24/36

(c) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston SATO2 aineistolle. STATISTIX FOR WINDOWS SATO2 ANALYSIS OF VARIANCE TABLE FOR YIELD SOURCE DF SS MS F P ------------- ---- ---------- ---------- ------- ------ FERTIL (A) 2 340.333 170.167 30.94 0.0000 VARIETY (B) 3 199.333 66.4444 12.08 0.0006 A*B 6 259.667 43.2778 7.87 0.0013 RESIDUAL 12 66.0000 5.50000 ------------- ---- ---------- TOTAL 23 865.333 Kaikki kolme kaksisuuntaisen varianssianalyysin nollahypoteesia voidaan hylätä. (d) ODOTUSARVOJEN VERTAILU Tekijä A (FERTIL) STATISTIX FOR WINDOWS SATO2 BONFERRONI COMPARISON OF MEANS OF YIELD BY FERTIL HOMOGENEOUS FERTIL MEAN GROUPS --------- ---------- ----------- 2 89.250 I 1 83.000.. I 3 80.250.. I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 2.779 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 3.2592 STANDARD ERROR FOR COMPARISON 1.1726 ERROR TERM USED: RESIDUAL, 12 DF Parhaan sadon antaa lannoiteseos 2. TKK/SAL Ilkka Mellin (2005) 25/36

Tekijä B (VARIETY) STATISTIX FOR WINDOWS SATO2 BONFERRONI COMPARISON OF MEANS OF YIELD BY VARIETY HOMOGENEOUS VARIETY MEAN GROUPS --------- ---------- ----------- 4 86.667 I 2 86.000 I 1 84.667 I 3 79.333.. I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 3.153 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 4.2688 STANDARD ERROR FOR COMPARISON 1.3540 ERROR TERM USED: RESIDUAL, 12 DF Parhaan sadon antavat lajikkeet 4, 2, 1. Tekijä A*B (FERTIL*VARIETY) STATISTIX FOR WINDOWS SATO2 BONFERRONI COMPARISON OF MEANS OF YIELD BY FERTIL*VARIETY HOMOGENEOUS FERTIL VARIETY MEAN GROUPS --------- --------- ---------- ----------- 2 1 93.000 I 2 4 93.000 I 2 2 91.000 I I 1 2 88.000 I I I 1 4 86.000 I I I 1 1 83.000 I I I I 3 3 83.000 I I I I 3 4 81.000.. I I I 2 3 80.000... I I 3 2 79.000... I I 3 1 78.000... I I 1 3 75.000... I THERE ARE 4 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 4.476 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 10.497 STANDARD ERROR FOR COMPARISON 2.3452 ERROR TERM USED: RESIDUAL, 12 DF TKK/SAL Ilkka Mellin (2005) 26/36

Parhaan sadon antavat seuraavat lannoiteseos-vehnälajikeyhdistelmät: (2, 1); (2, 4); (2, 2); (1, 2); (1, 4); (1, 1); (3, 3) 4. KAKSISUUNTAINEN VARIANSSIANALYYSI: SOVELLUS 2 Tehtaalla valmistetaan rakennuslevyjä kolmella koneella. Valmistettujen levyjen permeabiliteettia (läpäisyä sekunteina) tutkittiin yhdeksänä peräkkäisenä päivänä poimimalla jokaisena päivänä jokaiselta kolmelta koneelta kolme levyä mitattaviksi. STATISTIX-tiedostossa SHEETS on esitetty tulokset mittauksista. Mittaustulokset on annettu (permeabiliteetin logaritmeina) muuttujana LOGPERM. Indikaattorimuuttuja MACHINE ilmaisee käytetyn koneen, indikaattorimuuttuja DAY ilmaisee mittauspäivän. RATKAISU: Tee aineistolle kaksisuuntainen varianssianalyysi ja tulkitse tulokset. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. (a) AINEISTON ESITYSMUOTO STATISTIX-tiedostossa SHEETS on seuraavat muuttujat: LOGPERM = Rakennuslevyn permeabiliteetin logaritmi; MACHINE = Kone; DAY Selitettävä muuttuja Indikaattorimuuttuja; arvot = 1, 2, 3; tekijä A = Näytteenottopäivä; Indikaattorimuuttuja; arvot = 1, 2,, 9; tekijä B Tutkimuksen päämääränä oli selvittää millä tavalla rakennuslevyn permeabiliteetin logaritmi (muuttuja LOGPERM) riippuu levyn valmistaneesta koneesta ja näytteenotto-päivästä. Koneita (tekijä A) oli 3 ja näytteenottopäiviä (tekijä B) oli 9, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 3 9 = 27. Jokaisena päivänä jokaiselta koneelta poimittiin 3 levyä mittauksiin, joten havaintojen kokonaislukumäärä oli 27 3 = 81. Siis Tekijän A tasojen lukumäärä: I = 3 Tekijän B tasojen lukumäärä: J = 9 Ryhmien lukumäärä: IJ = 27 Havaintojen lukumäärä ryhmässä: K = 3 Havaintojen kokonaislukumäärä: N = KIJ = 81 TKK/SAL Ilkka Mellin (2005) 27/36

Testattavat nollahypoteesit: H AB : Ei yhdysvaikutusta H A : Ei A-vaikutusta H B : Ei B-vaikutusta (b) KESKIARVOJEN GRAAFINEN ESITYS Esitetään ryhmäkeskiarvot ja -hajonnat graafisesti. Kuvioiden perusteella koneella saattaa olla vaikutusta levyjen permeabiliteettiin. Sen sijaan näytteenottopäivän vaikutus ei ole kovin ilmeinen. Error Bar Chart with SD 2.0 1.8 LOGPERM 1.6 1.4 1.2 1 2 3 MACHINE 81 cases TKK/SAL Ilkka Mellin (2005) 28/36

Error Bar Chart with SD 2.1 1.8 LOGPERM 1.5 1.2 1 2 3 4 5 6 7 8 9 DAY 81 cases Error Bar Chart with SD 2.4 2.1 LOGPERM 1.8 1.5 MACHINE 1 2 3 1.2 0.9 1 2 3 4 5 6 7 8 9 DAY 81 cases TKK/SAL Ilkka Mellin (2005) 29/36

(c) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston SHEETS aineistolle. STATISTIX FOR WINDOWS SHEETS ANALYSIS OF VARIANCE TABLE FOR LOGPERM SOURCE DF SS MS F P ------------- ---- ---------- ---------- ------- ------ MACHINE (A) 2 0.91676 0.45838 12.28 0.0000 DAY (B) 8 0.55344 0.06918 1.85 0.0869 A*B 16 0.86569 0.05411 1.45 0.1543 RESIDUAL 54 2.01502 0.03732 ------------- ---- ---------- TOTAL 80 4.35091 Nollahypoteesit H AB : Ei yhdysvaikutusta H B : Ei B-vaikutusta voidaan jättää voimaan, sen sijaan nollahypoteesi H A : Ei A-vaikutusta voidaan hylätä. (d) ODOTUSARVOJEN VERTAILU Tekijä A (KONE) STATISTIX FOR WINDOWS SHEETS BONFERRONI COMPARISON OF MEANS OF LOGPERM BY MACHINE HOMOGENEOUS MACHINE MEAN GROUPS --------- ---------- ----------- 1 1.6855 I 3 1.5933 I 2 1.4283.. I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 2.471 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 0.1299 STANDARD ERROR FOR COMPARISON 0.0526 ERROR TERM USED: RESIDUAL, 54 DF TKK/SAL Ilkka Mellin (2005) 30/36

Suurin permeabiliteetti on koneiden 1 ja 3 valmistamilla levyillä, pienin koneen 2 valmistamilla levyillä. 5. KAKSISUUNTAINEN VARIANSSIANALYYSI: SOVELLUS 3 Eräässä tutkimuksessa vertailtiin kolmen automerkin polttoainetaloudellisuutta. Vertailu tehtiin niin, että viisi autoilijaa ajoi jokaista autoa kolme eri kertaa samalla radalla. Koska ajotavat saattavat vaikuttaa polttoaineen kulutukseen, ajajat valittiin eri ikäluokista. Ajajien ikäluokat olivat 1: 25 ja alle; 2: 26-35; 3: 36-45; 4: 46-55; 5: 56-65. STATISTIX-tiedostossa CARS on esitetty tulokset eri ajokerroista. Tulokset on annettu muuttujana FUELCONS (mailia/gallona). Indikaattorimuuttuja CAR ilmaisee auton ja indikaattorimuuttuja DRIVER ilmaisee ajajan. RATKAISU: Tee aineistolle kaksisuuntainen varianssianalyysi ja tulkitse tulokset. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. (a) AINEISTON ESITYSMUOTO STATISTIX-tiedostossa CARS on seuraavat muuttujat: FUELCONS = Polttoainetaloudellisuus (mailia/gallona); CAR DRIVER Selitettävä muuttuja = Automerkki; Indikaattorimuuttuja; arvot = 1, 2, 3; tekijä A = Ajaja; Indikaattorimuuttuja; arvot = 1, 2, 3, 4, 5; tekijä B Tutkimuksen päämääränä oli selvittää millä tavalla polttoainetaloudellisuus (muuttuja FUELCONS) riippuu automerkistä ja ajajasta. Autoja (tekijä A) oli 3 ja ajajia (tekijä B) oli 5, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 3 5 = 15. Jokainen ajaja ajoi jokaisella autolla kolme eri kertaa, joten havaintojen kokonaislukumäärä oli 15 3 = 45. Siis Tekijän A tasojen lukumäärä: I = 3 Tekijän B tasojen lukumäärä: J = 5 Ryhmien lukumäärä: IJ = 15 Havaintojen lukumäärä ryhmässä: K = 3 Havaintojen kokonaislukumäärä: N = KIJ = 45 TKK/SAL Ilkka Mellin (2005) 31/36

Testattavat nollahypoteesit: H AB : H A : H B : Ei yhdysvaikutusta Ei A-vaikutusta Ei B-vaikutusta (b) KESKIARVOJEN GRAAFINEN ESITYS Esitetään ryhmäkeskiarvot ja -hajonnat graafisesti. Murtoviivojen erisuuntaisuus ja mutkittelu alla olevissa kuviossa viittaavat sekä yhdysvaikutuksen että päävaikutusten olemassaoloon. Error Bar Chart with SD 26.0 25.2 FUELCONS 24.4 23.6 1 2 3 CAR 45 cases TKK/SAL Ilkka Mellin (2005) 32/36

Error Bar Chart with SD 26.3 25.4 FUELCONS 24.5 23.6 1 2 3 4 5 DRIVER 45 cases Error Bar Chart with SD 26.4 FUELCONS 25.8 25.2 24.6 24.0 DRIVER 1 2 3 4 5 23.4 1 2 3 CAR 45 cases TKK/SAL Ilkka Mellin (2005) 33/36

Error Bar Chart with SD 26.4 25.8 FUELCONS 25.2 24.6 CAR 1 2 3 24.0 23.4 1 2 3 4 5 DRIVER 45 cases (c) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston CARS aineistolle. STATISTIX FOR WINDOWS DRIVERS ANALYSIS OF VARIANCE TABLE FOR FUELCONS SOURCE DF SS MS F P ------------- ---- ---------- ---------- ------- ------ CAR (A) 2 7.15600 3.57800 92.53 0.0000 DRIVER (B) 4 13.1480 3.28700 85.01 0.0000 A*B 8 6.60400 0.82550 21.35 0.0000 RESIDUAL 30 1.16000 0.03867 ------------- ---- ---------- TOTAL 44 28.0680 Kaikki kolme kaksisuuntaisen varianssianalyysin nollahypoteesia voidaan hylätä. TKK/SAL Ilkka Mellin (2005) 34/36

(d) ODOTUSARVOJEN VERTAILU Tekijä A (CAR) STATISTIX FOR WINDOWS DRIVERS BONFERRONI COMPARISON OF MEANS OF FUELCONS BY CAR HOMOGENEOUS CAR MEAN GROUPS --------- ---------- ----------- 3 25.100 I 1 24.860.. I 2 24.160... I ALL 3 MEANS ARE SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 2.536 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 0.1821 STANDARD ERROR FOR COMPARISON 0.0718 ERROR TERM USED: RESIDUAL, 30 DF Taloudellisin on auto 3, sitten auto 1 ja epätaloudellisen on auto 2. Tekijä B (DRIVER) STATISTIX FOR WINDOWS DRIVERS BONFERRONI COMPARISON OF MEANS OF FUELCONS BY DRIVER HOMOGENEOUS DRIVER MEAN GROUPS --------- ---------- ----------- 3 25.567 I 1 25.000.. I 2 24.533... I 5 24.467... I 4 23.967... I THERE ARE 4 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 3.030 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 0.2809 STANDARD ERROR FOR COMPARISON 0.0927 ERROR TERM USED: RESIDUAL, 30 DF Taloudellisimmin on ajanut ajaja 3, sitten ajaja 1, ajajat 2 ja 5 ja epätaloudellisimmin on ajanut ajaja 4. TKK/SAL Ilkka Mellin (2005) 35/36

Tekijä A*B (CAR*DRIVER) STATISTIX FOR WINDOWS DRIVERS BONFERRONI COMPARISON OF MEANS OF FUELCONS BY CAR*DRIVER HOMOGENEOUS CAR DRIVER MEAN GROUPS --------- --------- ---------- ----------- 1 3 26.200 I 3 1 25.700 I I 3 3 25.700 I I 3 2 25.200.. I I 1 1 25.200.. I I 3 5 25.200.. I I 2 3 24.800... I I 1 2 24.700... I I I 2 5 24.300... I I I 1 4 24.300... I I I 2 1 24.100... I I 2 4 23.900... I 1 5 23.900... I 3 4 23.700... I 2 2 23.700... I THERE ARE 6 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 3.919 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 0.6293 STANDARD ERROR FOR COMPARISON 0.1606 ERROR TERM USED: RESIDUAL, 30 DF Ajaja 3 on ajanut autolla 1 kaikkein taloudellisimmin. Tilastollisesti yhtä hyvään tulokseen ovat päässeet ajajat 1 ja 3 autolla 3. Seuraavan ryhmän muodostavat ajaja 2 autoilla 3 ja 1, ajaja 1 autolla 1, ajaja 5 autolla 3 ja ajaja 3 autolla 2. Huonoimman ryhmän muodostavat ajaja 5 autoilla 2 ja 1, ajaja 4 autoilla 1, 2 ja 3, ajaja 1 autolla 2 ja ajaja 2 autolla 2. TKK/SAL Ilkka Mellin (2005) 36/36