1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Koko: px
Aloita esitys sivulta:

Download "1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA"

Transkriptio

1 Mat Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalyysi Bonferronin menetelmä, F-testi, Jäännösneliösumma, Kaksisuuntainen varianssianalyysi Kokonaiskeskiarvo, Kokonaisneliösumma, Kokonaisvaihtelu, Luottamusväli, Neliösumma, Odotusarvo, Odotusarvojen vertailu, Päävaikutus, Reunahajonta, Reunakeskiarvo, Ryhmien sisäinen vaihtelu, Ryhmien välinen vaihtelu, Ryhmä, Ryhmäkeskiarvo, Ryhmäneliösumma, Taso, Testi, Vapauaste, Varianssi, Varianssianalyysihajotelma, Yhdysvaikutus, Yksisuuntainen varianssianalyysi, Yleiskeskiarvo 1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA STATISTIX-tiedostossa SATO on esitetty tulokset maissinviljelykokeesta, jossa on tutkittu viiden eri lannoiteseoksen (tekijä A) vaikutusta viiden eri maissilajikkeen (tekijä B) satoon. Jokaista lannoiteaineseos-maissilajikeyhdistelmää kokeiltiin kuudella eri koealalla. Sadot eri koealoilta on annettu muuttujana SATO. Indikaattorimuuttuja LANNOITE ilmaisee käytetyn lannoiteaineseoksen ja indikaattorimuuttuja MAISSI ilmaisee maissilajikkeen. (a) (b) (c) (d) (e) (f) Tutustu tiedoston SATO rakenteeseen ja indikaattorimuuttujien logiikkaan. Mikä on selitettävänä muuttujana? Tee aineistolle kaksisuuntainen varianssianalyysi. Mitkä ovat yhdysvaikutuksen neliösumma, päävaikutusten neliösummat, jäännösneliösumma eli ryhmien sisäistä vaihtelua kuvaava neliösumma ja kokonaisneliösumma sekä vastaavat vapausasteet? Esitä myös miten vapausasteet saadaan. Testaa nollahypoteeseja H AB : H A : H B : Ei yhdysvaikutusta Ei A-vaikutusta Ei B-vaikutusta Mitkä ovat näitä hypoteeseja testaavien testisuureiden arvot ja vastaavat p-arvot? Ovatko hypoteesit perusteltuja? Laske kaksisuuntaisen varianssianalyysin testisuureiden arvot varianssianalyysihajotelman neliösummista ja tarkista, että tulos on sama kuin (d)-kohdassa. Laske ryhmäkeskiarvot ja -hajonnat, reunakeskiarvot ja -hajonnat sekä yleiskeskiarvo. TKK/SAL Ilkka Mellin (2005) 1/36

2 (g) Esitä ryhmäkeskiarvot graafisesti: STATISTIX: Statistics > Summary Statistics > Error Bar Chart Model Specification = Categorical Dependent Variable = SATO Categorical Variables = LANNOITE, MAISSI / MAISSI, LANNOITE Chart Type = Line Error Bar Type = Std Deviation (h) (i) RATKAISU: Esitä tulkinnat kuvioille. Vertaile sekä eri lannoiteseosten että eri maissilajikkeiden odotusarvoja käyttämällä Bonferronin menetelmää. Millaisia ryhmityksiä aineistosta löytyy? Esitä tulkinnat testituloksille. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. (a) AINEISTON ESITYSMUOTO STATISTIX-tiedostossa SATO on seuraavat muuttujat: SATO = Maissin sato; LANNOITE = Selitettävä muuttuja Lannoiteseos; MAISSI = Maissilajike; Indikaattorimuuttuja; arvot = 1, 2, 3, 4, 5; tekijä A Indikaattorimuuttuja; arvot = 1, 2, 3, 4, 5; tekijä B Tutkimuksen päämääränä oli selvittää millä tavalla maissin sato (muuttuja SATO) riippuu erilaisista lannoiteaineseos-maissilajikeyhdistelmistä. Lannoiteaineseoksia (tekijä A) oli 5 erilaista ja maissilajikkeita (tekijä B) oli 5 erilaista, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 5 5 = 25. Jokaista lannoiteaineseos-maissilajike-yhdistelmää kokeiltiin 6:lla koealalla, joten havaintojen kokonaislukumäärä oli 25 6 = 150. Siis Tekijän A tasojen lukumäärä: I = 5 Tekijän B tasojen lukumäärä: J = 5 Ryhmien lukumäärä: IJ = 25 Havaintojen lukumäärä ryhmässä: K = 6 Havaintojen kokonaislukumäärä: N = KIJ = 150 TKK/SAL Ilkka Mellin (2005) 2/36

3 (b) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston SATO aineistolle. STATISTIX: Statistics > Linear Models > General AOV/AOCV Dependent Variable = SATO AOV Model Statement LANNOITE MAISSI LANNOITE*MAISSI Varianssianalyysimalli kirjoitetaan ikkunaan AOV Model Statement antamalla päävaikutukset ja yhdysvaikutukset. Koska muuttujan SATO mallina on kaksisuuntaisen varianssianalyysin malli ja jokaisesta ryhmästä on useampia havaintoja, päävaikutuksia on kaksi: LANNOITE MAISSI ja yhdysvaikutuksia on yksi: LANNOITE*MAISSI STATISTIX FOR WINDOWS SATO ANALYSIS OF VARIANCE TABLE FOR SATO SOURCE DF SS MS F P LANNOITE (A) MAISSI (B) A*B RESIDUAL TOTAL (c) VARIANSSIANALYYSIHAJOTELMA JA VAPAUSASTEET KAKSISUUNTAISESSA VARIANSSIANALYYSISSA Neliösummat Varianssianalyysihajotelman neliösummat annetaan sarakkeessa SS. Päävaikutuksen A (LANNOITE) neliösumma SSA: Päävaikutuksen B (MAISSI) neliösumma SSB: Yhdysvaikutuksen A*B neliösumma SSAB: Jäännösneliösumma SSE: Kokonaisneliösumma SST: TKK/SAL Ilkka Mellin (2005) 3/36

4 Varianssianalyysihajotelma: SST = SSA + SSB + SSAB + SSE Vapausasteet Varianssianalyysihajotelman neliösummien vapausasteet annetaan sarakkeessa DF. Päävaikutuksen A neliösumman vapausasteet I 1: 5 1 = 4 Päävaikutuksen B neliösumman vapausasteet J 1: 5 1 = 4 Yhdysvaikutuksen A*B neliösumman vapausasteet (I 1)(J 1): (5 1) (5 1) = 16 Jäännösneliösumman vapausasteet N IJ: = 125 Kokonaisneliösumman vapausasteet N 1: = 149 (d) TESTIT KAKSISUUNTAISESSA VARIANSSIANALYYSISSA Testisuureet kaksisuuntaisen varianssianalyysin nollahypoteeseille annetaan sarakkeessa F ja vastaavat p-arvot annetaan sarakkeessa P. Nollahypoteesi H AB : Ei yhdysvaikutusta Testisuureen arvo: F AB = 0.97 Vastaava p-arvo: p = Johtopäätös: Nollahypoteesi H AB voidaan jättää voimaan. Nollahypoteesi H A : Ei A-vaikutusta Testisuureen arvo: F A = Vastaava p-arvo (neljällä desimaalilla): p = Johtopäätös: Nollahypoteesi H A voidaan hylätä. Nollahypoteesi H B : Ei B-vaikutusta Testisuureen arvo: F B = Vastaava p-arvo (neljällä desimaalilla): p = TKK/SAL Ilkka Mellin (2005) 4/36

5 Johtopäätös: Nollahypoteesi H B voidaan hylätä. (e) KAKSISUUNTAISEN VARIANSSIANALYYSIN TESTISUUREIDEN LASKEMINEN NELIÖSUMMISTA Nollahypoteesi H AB : Ei yhdysvaikutusta Testisuureen arvo on F AB N IJ SSAB MSAB = = = = 0.87 ( I 1)( J 1) SSE MSE jossa SSAB MSAB = = ( I 1)( J 1) SSE MSE = = N IJ Nollahypoteesi H A : Ei A-vaikutusta Testisuureen arvo on F A N IJ SSA MSA = = = = I 1 SSE MSE jossa SSA MSA = = I 1 SSE MSE = = N IJ Nollahypoteesi H B : Ei B-vaikutusta Testisuureen arvo on F B N IJ SSB MSB = = = = J 1 SSE MSE jossa SSB MSB = = J 1 SSE MSE = = N IJ TKK/SAL Ilkka Mellin (2005) 5/36

6 (f) RYHMÄKESKIARVOT JA -HAJONNAT, REUNAKESKIARVOT JA -HAJONNAT SEKÄ YLEISKESKIARVO Lasketaan ryhmäkeskiarvot ja -hajonnat, reunakeskiarvot ja -hajonnat sekä yleiskeskiarvo. STATISTIX: General AOV/AOCV AOV Table > Results Means and Standard Errors Main Effects and Interactions LANNOITE MAISSI LANNOITE*MAISSI Niiden ryhmitysten, joiden suhteen keskiarvot halutaan, kirjoitetaan ikkunaan Main Effects and Interactions Jos ikkunaan, kirjoitetaan vain päävaikutukset, saadaan reunakeskiarvot. Jos ikkunaan kirjoitetaan yhdysvaikutukset, saadaan myös ryhmäkeskiarvot. Koska muuttujan SATO mallina on kaksisuuntaisen varianssianalyysin malli ja jokaisesta ryhmästä on useampia havaintoja, päävaikutuksia on kaksi: LANNOITE MAISSI ja yhdysvaikutuksia on yksi LANNOITE*MAISSI TKK/SAL Ilkka Mellin (2005) 6/36

7 Yleiskeskiarvo sekä ja reunakeskiarvot ja -hajonnat STATISTIX FOR WINDOWS SATO GRAND MEAN SE MEANS OF SATO FOR LANNOITE LANNOITE MEAN SS (MEAN) OBSERVATIONS PER CELL 30 STD ERROR OF AN AVERAGE STD ERROR (DIFF OF 2 AVE'S) ERROR TERM USED: RESIDUAL, 125 DF MEANS OF SATO FOR MAISSI MAISSI MEAN SS (MEAN) OBSERVATIONS PER CELL 30 STD ERROR OF AN AVERAGE STD ERROR (DIFF OF 2 AVE'S) ERROR TERM USED: RESIDUAL, 125 DF Yleiskeskiarvo: Reunakeskiarvot tekijän A suhteen: Reunakeskiarvot tekijän B suhteen: GRAND MEAN MEANS OF SATO FOR LANNOITE MEANS OF SATO FOR MAISSI Vastaavat neliösummat on annettu sarakkeessa SS (MEAN). Ryhmäkohtaiset varianssit voidaan laskea näistä neliösummista tavanomaisilla varianssin kaavoilla: s s 1 K J 2 2 ii = ( yki j yiii) KJ 1 k= 1 j= 1 1 K I 2 2 i j = ( ykij yi i j) KI 1 k= 1 i= 1 TKK/SAL Ilkka Mellin (2005) 7/36

8 Keskiarvojen keskivirheet STD ERROR OF AN AVERAGE on määrätty varianssianalyysin päätulostuksen jäännösvarianssin estimaattoreista: 2 SSE MSE s ( xii i ) = = KJ ( N IJ ) KJ 2 SSE MSE s ( xii j ) = = KI( N IJ ) KI Ryhmäkeskiarvot ja -hajonnat MEANS OF SATO FOR LANNOITE*MAISSI LANNOITE MAISSI MEAN SS (MEAN) OBSERVATIONS PER CELL 6 STD ERROR OF AN AVERAGE STD ERROR (DIFF OF 2 AVE'S) ERROR TERM USED: RESIDUAL, 125 DF Ryhmäkeskiarvot: MEANS OF SATO FOR LANNOITE*MAISSI Vastaavat neliösummat on annettu sarakkeessa SS (MEAN). Ryhmäkohtaiset varianssit voidaan laskea näistä neliösummista tavanomaisella varianssin kaavalla: s 1 K 2 2 ij = ( ykij y ij ) K 1 i k = 1 TKK/SAL Ilkka Mellin (2005) 8/36

9 Keskiarvojen keskivirheet STD ERROR OF AN AVERAGE on määrätty varianssianalyysin päätulostuksen jäännösvarianssin estimaattorista: SSE MSE s 2 ( xi ij ) = = K( N IJ) K (g) RYHMÄKESKIARVOJEN GRAAFINEN ESITYS Esitetään ryhmäkeskiarvot ja -hajonnat graafisesti. STATISTIX: Statistics > Summary Statistics > Error Bar Chart Model Specification = Categorical Dependent Variable = SATO Categorical Variables = LANNOITE, MAISSI / MAISSI, LANNOITE Chart Type = Line Error Bar Type = Std Deviation Kummankin kuvion murtoviivojen yhdensuuntaisuus kuvastaa sitä, että tekijöiden A (LANNOITE) ja B (MAISSI) välillä ei todettu yhdysvaikusta. Sen sijaan murtoviivojen eritasoisuus saattaa merkitä sitä, että sato riippuu toisistaan riippumatta tekijöistä A ja B; ks. (f)-kohta. TKK/SAL Ilkka Mellin (2005) 9/36

10 Alla olevassa kuviossa murtoviivat kuvaavat sadon vaihtelua eri lannoiteseoksilla. 93 Error Bar Chart with SD SATO MAISSI LANNOITE 150 cases Alla olevassa kuviossa murtoviivat kuvaavat sadon vaihtelua eri maissilajikkeilla. 93 Error Bar Chart with SD SATO LANNOITE MAISSI 150 cases TKK/SAL Ilkka Mellin (2005) 10/36

11 (h) ODOTUSARVOJEN VERTAILU Koska nollahypoteesi H AB : Ei yhdysvaikutusta jäi voimaan, voidaan tekijöitä A (LANNOITE) ja B (MAISSI) tarkastella erillisinä. Tekijä A (LANNOITE) STATISTIX: General AOV/AOCV AOV Table > Results Comparison of Means Main Effects or Interactions LANNOITE Comparison Method = Bonferroni Alpha = 0.05 STATISTIX FOR WINDOWS SATO BONFERRONI COMPARISON OF MEANS OF SATO BY LANNOITE HOMOGENEOUS LANNOITE MEAN GROUPS I I I I I I THERE ARE 4 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 125 DF Vertailutulosten mukaan aineisto koostuu viiden sijasta neljästä ryhmästä: Ryhmä 1: Lannoiteseos 3 Ryhmä 2: Lannoiteseokset 4 ja 5 Ryhmä 3: Lannoiteseokset 5 ja 1 Ryhmä 4: Lannoiteseos 2 Parhaan sadon tuottaa lannoiteseos 3. TKK/SAL Ilkka Mellin (2005) 11/36

12 Tekijä B (MAISSI) STATISTIX: General AOV/AOCV AOV Table > Results Comparison of Means Main Effects or Interactions MAISSI Comparison Method = Bonferroni Alpha = 0.05 STATISTIX FOR WINDOWS SATO BONFERRONI COMPARISON OF MEANS OF SATO BY MAISSI HOMOGENEOUS MAISSI MEAN GROUPS I I I I I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 125 DF Vertailutulosten aineisto koostuu viiden sijasta kahdesta ryhmästä: Ryhmä 1: Lajikkeet 3, 5, 4, 1 Ryhmä 2: Lajike 2 Lajikkeet 3, 5, 4 ja 1 tuottavat parhaan sadon. (i) JOHTOPÄÄTÖKSET (1) Tekijöiden MAISSI ja LANNOITE välillä ei ole yhdysvaikutusta, joten maissin lajike ja lannoiteseos valita toisistaan riippumatta. (2) Maissin lajikkeista 3, 5, 4 ja 1 tuottavat parhaan sadon ja ovat yhtä hyviä. (3) Lannoiteseoksista 3 tuottaa parhaan sadon. TKK/SAL Ilkka Mellin (2005) 12/36

13 2. KAKSISUUNTAINEN VARIANSSIANALYYSI, KUN JOKAISESSA SOLUSSA ON VAIN YKSI HAVAINTO Sementtitehtaan tuote täytetään 50 kg säkkeihin. Säkkejä on täyttämässä kuusi konetta. Tietyin väliajoin jokaiselta koneelta poimitaan yksi säkki tarkistuspunnitukseen. STATISTIX-tiedostossa PAKPAINOT on esitetty punnitustulokset 16 otoksesta. Punnituksien tulokset on annettu poikkeamina tavoitearvosta 50 kg muuttujana PAINO. Indikaattorimuuttuja KONE (tekijä A) ilmaisee säkin täyttäneen koneen ja indikaattorimuuttuja OTOS (tekijä B) ajanhetken, jona säkit on otettu tarkistukseen. Huomaa, että jokaisessa solussa on vain yksi havainto. (a) (b) (c) (d) (e) (f) (g) (h) RATKAISU: Esitä tulkinnat tekijöille A ja B sekä formuloi testattavat hypoteesit. Mikä on selitettävänä muuttujana? Tee aineistolle kaksisuuntainen varianssianalyysi. Mitkä ovat yhdysvaikutuksen neliösumma, päävaikutusten neliösummat ja kokonaisneliösumma sekä vastaavat vapausasteet? Et voi nyt muodostaa ryhmien sisäistä vaihtelua kuvaavaa neliösummaa. Miksi? Testaa nollahypoteeseja H A : Ei A-vaikutusta H B : Ei B-vaikutusta Et voi nyt testata yhdysvaikutuksen olemassaoloa. Miksi? Mitkä ovat hypoteeseja testaavien testisuureiden arvot ja vastaavat p-arvot? Ovatko hypoteesit perusteltuja? Laske ryhmäkeskiarvot ja -hajonnat, reunakeskiarvot ja -hajonnat sekä yleiskeskiarvot. Esitä ryhmäkeskiarvot graafisesti. Vertaile sekä eri lannoiteseosten että eri maissilajikkeiden odotusarvoja käyttämällä Bonferronin menetelmää. Millaisia ryhmityksiä aineistosta löytyy? Esitä tulkinnat testituloksille. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. STATISTIX-tiedostossa PAKPAINOT on seuraavat muuttujat: PAINO = Poikkeama sementtisäkin painon tavoitearvosta 50 kg; Selitettävä muuttuja KONE = Säkkejä täyttänyt kone; Indikaattorimuuttuja; arvot = 1, 2, 3, 4, 5, 6; tekijä A OTOS = Näytteen numero; Indikaattorimuuttuja; arvot = 1, 2,, 16; tekijä B TKK/SAL Ilkka Mellin (2005) 13/36

14 Tutkimuksen päämääränä oli selvittää millä tavalla säkin paino (muuttuja PAINO) riippuu säkkejä täyttäneestä koneesta ja näytteen numerosta. Kiinnostus kohdistuu varsinaisesti konekohtaisiin eroihin. Näytteen numero on mukana selittävänä tekijänä, koska saattaa olla mahdollista, että koneiden toiminnassa esiintyy ryömimisefektejä eli poikkeamat säkkien painon tavoitearvosta kasvavat tai vähenevät systemaattisesti. Koneita (tekijä A) oli 6 ja ajankohtia (tekijä B), jolloin näytteitä poimittiin oli 16, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 6 16 = 96. Kultakin koneelta otettiin kunakin ajanhetkenä vain 1 näyte, joten havaintojen kokonaislukumäärä oli myös 96. Siis Tekijän A tasojen lukumäärä: I = 6 Tekijän B tasojen lukumäärä: J = 16 Ryhmien lukumäärä: IJ = 96 Havaintojen lukumäärä ryhmässä: K = 1 Havaintojen kokonaislukumäärä: N = KIJ = 96 Testattavat nollahypoteesit: H A : Ei A-vaikutusta H B : Ei B-vaikutusta Koska jokaisesta ryhmästä on vain yksi havainto, tekijöiden A ja B yhdysvaikutusta ei voida testata. (b) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston PAKPAINOT aineistolle. STATISTIX: Statistics > Linear Models > General AOV/AOCV Dependent Variable = PAINO AOV Model Statement KONE OTOS Varianssianalyysimalli kirjoitetaan ikkunaan AOV Model Statement antamalla päävaikutukset ja yhdysvaikutukset. Koska muuttujan PAINO mallina on kaksisuuntaisen varianssianalyysin malli ja jokaisesta ryhmästä on vain yksi havainto, päävaikutuksia on kaksi (KONE ja OTOS) ja yhdysvaikutuksia ei ole. TKK/SAL Ilkka Mellin (2005) 14/36

15 STATISTIX FOR WINDOWS PAKPAINOT ANALYSIS OF VARIANCE TABLE FOR PAINO SOURCE DF SS MS F P KONE (A) OTOS (B) A*B TOTAL (c) VARIANSSIANALYYSIHAJOTELMA JA VAPAUSASTEET KAKSISUUNTAISESSA VARIANSSIANALYYSISSA Neliösummat Varianssianalyysihajotelman neliösummat annetaan sarakkeessa SS. Päävaikutuksen A (KONE) neliösumma SSA: Päävaikutuksen B (OTOS) neliösumma SSB: Yhdysvaikutuksen A*B neliösumma SSAB: Kokonaisneliösumma SST: Varianssianalyysihajotelma: SST = SSA + SSB + SSAB Vapausasteet Varianssianalyysihajotelman neliösummien vapausasteet annetaan sarakkeessa DF. Päävaikutuksen A neliösumman vapausasteet I 1: 6 1 = 5 Päävaikutuksen B neliösumman vapausasteet J 1: 16 1 = 15 Yhdysvaikutuksen A*B neliösumman vapausasteet (I 1)(J 1): (6 1) (16 1) = 75 Kokonaisneliösumman vapausasteet N 1: 96 1 = 95 Ryhmien sisäistä vaihtelua kuvaavaa jäännösneliösummaa SSE ei voida muodostaa, koska ryhmien sisäistä vaihtelua ei ole (1 havainto per ryhmä). (d) TESTIT KAKSISUUNTAISESSA VARIANSSIANALYYSISSA Testisuureet kaksisuuntaisen varianssianalyysin nollahypoteeseille annetaan sarakkeessa F ja vastaavat p-arvot annetaan sarakkeessa P. TKK/SAL Ilkka Mellin (2005) 15/36

16 Nollahypoteesi H A : Ei A-vaikutusta Testisuureen arvo: F A = Vastaava p-arvo (neljällä desimaalilla): p = Johtopäätös: Nollahypoteesi H A voidaan hylätä. Nollahypoteesi H B : Ei B-vaikutusta Testisuureen arvo: F B = Vastaava p-arvo (neljällä desimaalilla): p = Johtopäätös: Nollahypoteesi H B voidaan hylätä. (e) RYHMÄKESKIARVOT JA -HAJONNAT, REUNAKESKIARVOT JA -HAJONNAT SEKÄ YLEISKESKIARVO Lasketaan reunakeskiarvot ja -hajonnat sekä yleiskeskiarvo. STATISTIX: General AOV/AOCV AOV Table > Results Means and Standard Errors Main Effects and Interactions KONE OTOS Niiden ryhmitysten, joiden suhteen keskiarvot halutaan, kirjoitetaan ikkunaan Main Effects and Interactions Jos ikkunaan, kirjoitetaan vain päävaikutukset, saadaan reunakeskiarvot. Jos ikkunaan kirjoitetaan yhdysvaikutukset, saadaan myös ryhmäkeskiarvot. Koska muuttujan PAINO mallina on kaksisuuntaisen varianssianalyysin malli ja jokaisesta ryhmästä on vain yksi havainto, päävaikutuksia on kaksi (LANNOITE ja MAISSI) ja yhdysvaikutuksia ei ole. TKK/SAL Ilkka Mellin (2005) 16/36

17 STATISTIX FOR WINDOWS PAKPAINOT GRAND MEAN SE MEANS OF PAINO FOR KONE KONE MEAN SS (MEAN) E OBSERVATIONS PER CELL 16 STD ERROR OF AN AVERAGE STD ERROR (DIFF OF 2 AVE'S) ERROR TERM USED: KONE*OTOS, 75 DF MEANS OF PAINO FOR OTOS OTOS MEAN SS (MEAN) OBSERVATIONS PER CELL 6 STD ERROR OF AN AVERAGE STD ERROR (DIFF OF 2 AVE'S) ERROR TERM USED: KONE*OTOS, 75 DF TKK/SAL Ilkka Mellin (2005) 17/36

18 (f) REUNAKESKIARVOJEN GRAAFINEN ESITYS Esitetään reunakeskiarvot ja -hajonnat graafisesti. STATISTIX: Statistics > Summary Statistics > Error Bar Chart Model Specification = Categorical Dependent Variable = SATO Categorical Variables = KONE / OTOS / OTOS, KONE Chart Type = Line Error Bar Type = Std Deviation 10 Error Bar Chart with SD 5 PAINO KONE 96 cases TKK/SAL Ilkka Mellin (2005) 18/36

19 Error Bar Chart with SD 10 5 PAINO OTOS 96 cases Error Bar Chart with SD 10 5 KONE 1 PAINO OTOS 96 cases TKK/SAL Ilkka Mellin (2005) 19/36

20 (g) ODOTUSARVOJEN VERTAILU Tekijä A (KONE) STATISTIX: General AOV/AOCV AOV Table > Results Comparison of Means Main Effects or Interactions KONE Comparison Method = Bonferroni Alpha = 0.05 STATISTIX FOR WINDOWS PAKPAINOT BONFERRONI COMPARISON OF MEANS OF PAINO BY KONE HOMOGENEOUS KONE MEAN GROUPS I I I I I I I I I THERE ARE 3 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: KONE*OTOS, 75 DF Vertailutulosten mukaan aineisto koostuu kuuden sijasta kahdesta ryhmästä: Ryhmä 1: Koneet 3 ja 2 Ryhmä 2: Koneet 6, 4, 1, 5 TKK/SAL Ilkka Mellin (2005) 20/36

21 Tekijä B (OTOS) STATISTIX: General AOV/AOCV AOV Table > Results Comparison of Means Main Effects or Interactions OTOS Comparison Method = Bonferroni Alpha = 0.05 STATISTIX FOR WINDOWS PAKPAINOT BONFERRONI COMPARISON OF MEANS OF PAINO BY OTOS HOMOGENEOUS OTOS MEAN GROUPS I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I THERE ARE 6 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: KONE*OTOS, 75 DF Vertailutulosten mukaan aineisto koostuu kuudentoista sijasta kolmesta ryhmästä: Ryhmä 1: Otokset 3, 1, 4, 7, 6, 9, 8, 5, 2, 15 Ryhmä 2: Otokset 15, 11, 14, 13, 12, 10 Ryhmä 3: Otos 16 TKK/SAL Ilkka Mellin (2005) 21/36

22 (h) JOHTOPÄÄTÖKSET (1) Koneet 3 ja 2 ovat tuottaneet selvästi liian painavia säkkejä. (2) Näytteissä 1-9 säkkien painot ovat olleet järjestelmällisesti liian suuria. Sen sijaan näytteissä painot ovat olleet lähellä tavoitearvoa, kun taas näytteessä 16 säkkien painot ovat olleet liian pieniä. (3) Kone 3 on tuottanut näytteissä 1-8 muita painavampia säkkejä. (4) Koneissa 4 ja 5 on saattanut ollut häiriö näytteen 10 aikana. (5) Kaikki koneet ovat tuottaneet näytteen 16 aikana liian kevyitä säkkejä. Yhteenveto (6) Koneiden toiminnassa on eroja. (7) Koneiden toiminnassa on tapahtunut ryömimisefektejä. TKK/SAL Ilkka Mellin (2005) 22/36

23 3. KAKSISUUNTAINEN VARIANSSIANALYYSI: SOVELLUS 1 STATISTIX-tiedostossa SATO2 on esitetty tulokset kahdesta vehnänviljelykokeiden sarjasta, joissa on tutkittu kolmen eri lannoiteseoksen (tekijä A) vaikutusta kolmen eri vehnälajikkeen (tekijä B) satoon. Sadot eri koealoilta on annettu muuttujana YIELD. Indikaattorimuuttuja FERTIL ilmaisee käytetyn lannoiteaineseoksen, indikaattori-muuttuja VARIETY ilmaisee vehnälajikkeen ja indikaattorimuuttuja OBS ilmaisee kokeen. RATKAISU: Tee aineistolle kaksisuuntainen varianssianalyysi ja tulkitse tulokset. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. (a) AINEISTON ESITYSMUOTO STATISTIX-tiedostossa SATO2 on seuraavat muuttujat: YIELD FERTIL = Vehnän sato; Selitettävä muuttuja = Lannoiteseos; Indikaattorimuuttuja; arvot = 1, 2, 3; tekijä A VARIETY = Vehnälajike; Indikaattorimuuttuja; arvot = 1, 2, 3, 4; tekijä B Tutkimuksen päämääränä oli selvittää millä tavalla vehnän sato (muuttuja YIELD) riippuu erilaisista lannoiteaineseos-maissilajikeyhdistelmistä. Lannoiteaineseoksia (tekijä A) oli 3 erilaista ja vehnälajikkeita (tekijä B) oli 4 erilaista, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 3 4 = 12. Jokaista lannoiteaineseos-vehnälajike-yhdistelmää kokeiltiin 2:lla koealalla, joten havaintojen kokonaislukumäärä oli 12 2 = 24. Siis Tekijän A tasojen lukumäärä: I = 3 Tekijän B tasojen lukumäärä: J = 4 Ryhmien lukumäärä: IJ = 12 Havaintojen lukumäärä ryhmässä: K = 2 Havaintojen kokonaislukumäärä: N = KIJ = 24 Testattavat nollahypoteesit: H AB : H A : H B : Ei yhdysvaikutusta Ei A-vaikutusta Ei B-vaikutusta TKK/SAL Ilkka Mellin (2005) 23/36

24 (b) KESKIARVOJEN GRAAFINEN ESITYS Esitetään ryhmäkeskiarvot ja -hajonnat graafisesti. Murtoviivojen erisuuntaisuus ja mutkittelu alla olevissa kuviossa viittaavat sekä yhdysvaikutuksen että päävaikutusten olemassaoloon. Error Bar Chart with SD FERTIL YIELD VARIETY 24 cases Error Bar Chart with SD 95 YIELD VARIETY FERTIL 24 cases TKK/SAL Ilkka Mellin (2005) 24/36

25 (c) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston SATO2 aineistolle. STATISTIX FOR WINDOWS SATO2 ANALYSIS OF VARIANCE TABLE FOR YIELD SOURCE DF SS MS F P FERTIL (A) VARIETY (B) A*B RESIDUAL TOTAL Kaikki kolme kaksisuuntaisen varianssianalyysin nollahypoteesia voidaan hylätä. (d) ODOTUSARVOJEN VERTAILU Tekijä A (FERTIL) STATISTIX FOR WINDOWS SATO2 BONFERRONI COMPARISON OF MEANS OF YIELD BY FERTIL HOMOGENEOUS FERTIL MEAN GROUPS I I I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 12 DF Parhaan sadon antaa lannoiteseos 2. TKK/SAL Ilkka Mellin (2005) 25/36

26 Tekijä B (VARIETY) STATISTIX FOR WINDOWS SATO2 BONFERRONI COMPARISON OF MEANS OF YIELD BY VARIETY HOMOGENEOUS VARIETY MEAN GROUPS I I I I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 12 DF Parhaan sadon antavat lajikkeet 4, 2, 1. Tekijä A*B (FERTIL*VARIETY) STATISTIX FOR WINDOWS SATO2 BONFERRONI COMPARISON OF MEANS OF YIELD BY FERTIL*VARIETY HOMOGENEOUS FERTIL VARIETY MEAN GROUPS I I I I I I I I I I I I I I I I I I I I I I I I I I I I THERE ARE 4 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 12 DF TKK/SAL Ilkka Mellin (2005) 26/36

27 Parhaan sadon antavat seuraavat lannoiteseos-vehnälajikeyhdistelmät: (2, 1); (2, 4); (2, 2); (1, 2); (1, 4); (1, 1); (3, 3) 4. KAKSISUUNTAINEN VARIANSSIANALYYSI: SOVELLUS 2 Tehtaalla valmistetaan rakennuslevyjä kolmella koneella. Valmistettujen levyjen permeabiliteettia (läpäisyä sekunteina) tutkittiin yhdeksänä peräkkäisenä päivänä poimimalla jokaisena päivänä jokaiselta kolmelta koneelta kolme levyä mitattaviksi. STATISTIX-tiedostossa SHEETS on esitetty tulokset mittauksista. Mittaustulokset on annettu (permeabiliteetin logaritmeina) muuttujana LOGPERM. Indikaattorimuuttuja MACHINE ilmaisee käytetyn koneen, indikaattorimuuttuja DAY ilmaisee mittauspäivän. RATKAISU: Tee aineistolle kaksisuuntainen varianssianalyysi ja tulkitse tulokset. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. (a) AINEISTON ESITYSMUOTO STATISTIX-tiedostossa SHEETS on seuraavat muuttujat: LOGPERM = Rakennuslevyn permeabiliteetin logaritmi; MACHINE = Kone; DAY Selitettävä muuttuja Indikaattorimuuttuja; arvot = 1, 2, 3; tekijä A = Näytteenottopäivä; Indikaattorimuuttuja; arvot = 1, 2,, 9; tekijä B Tutkimuksen päämääränä oli selvittää millä tavalla rakennuslevyn permeabiliteetin logaritmi (muuttuja LOGPERM) riippuu levyn valmistaneesta koneesta ja näytteenotto-päivästä. Koneita (tekijä A) oli 3 ja näytteenottopäiviä (tekijä B) oli 9, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 3 9 = 27. Jokaisena päivänä jokaiselta koneelta poimittiin 3 levyä mittauksiin, joten havaintojen kokonaislukumäärä oli 27 3 = 81. Siis Tekijän A tasojen lukumäärä: I = 3 Tekijän B tasojen lukumäärä: J = 9 Ryhmien lukumäärä: IJ = 27 Havaintojen lukumäärä ryhmässä: K = 3 Havaintojen kokonaislukumäärä: N = KIJ = 81 TKK/SAL Ilkka Mellin (2005) 27/36

28 Testattavat nollahypoteesit: H AB : Ei yhdysvaikutusta H A : Ei A-vaikutusta H B : Ei B-vaikutusta (b) KESKIARVOJEN GRAAFINEN ESITYS Esitetään ryhmäkeskiarvot ja -hajonnat graafisesti. Kuvioiden perusteella koneella saattaa olla vaikutusta levyjen permeabiliteettiin. Sen sijaan näytteenottopäivän vaikutus ei ole kovin ilmeinen. Error Bar Chart with SD LOGPERM MACHINE 81 cases TKK/SAL Ilkka Mellin (2005) 28/36

29 Error Bar Chart with SD LOGPERM DAY 81 cases Error Bar Chart with SD LOGPERM MACHINE DAY 81 cases TKK/SAL Ilkka Mellin (2005) 29/36

30 (c) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston SHEETS aineistolle. STATISTIX FOR WINDOWS SHEETS ANALYSIS OF VARIANCE TABLE FOR LOGPERM SOURCE DF SS MS F P MACHINE (A) DAY (B) A*B RESIDUAL TOTAL Nollahypoteesit H AB : Ei yhdysvaikutusta H B : Ei B-vaikutusta voidaan jättää voimaan, sen sijaan nollahypoteesi H A : Ei A-vaikutusta voidaan hylätä. (d) ODOTUSARVOJEN VERTAILU Tekijä A (KONE) STATISTIX FOR WINDOWS SHEETS BONFERRONI COMPARISON OF MEANS OF LOGPERM BY MACHINE HOMOGENEOUS MACHINE MEAN GROUPS I I I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 54 DF TKK/SAL Ilkka Mellin (2005) 30/36

31 Suurin permeabiliteetti on koneiden 1 ja 3 valmistamilla levyillä, pienin koneen 2 valmistamilla levyillä. 5. KAKSISUUNTAINEN VARIANSSIANALYYSI: SOVELLUS 3 Eräässä tutkimuksessa vertailtiin kolmen automerkin polttoainetaloudellisuutta. Vertailu tehtiin niin, että viisi autoilijaa ajoi jokaista autoa kolme eri kertaa samalla radalla. Koska ajotavat saattavat vaikuttaa polttoaineen kulutukseen, ajajat valittiin eri ikäluokista. Ajajien ikäluokat olivat 1: 25 ja alle; 2: 26-35; 3: 36-45; 4: 46-55; 5: STATISTIX-tiedostossa CARS on esitetty tulokset eri ajokerroista. Tulokset on annettu muuttujana FUELCONS (mailia/gallona). Indikaattorimuuttuja CAR ilmaisee auton ja indikaattorimuuttuja DRIVER ilmaisee ajajan. RATKAISU: Tee aineistolle kaksisuuntainen varianssianalyysi ja tulkitse tulokset. Kaksisuuntaisessa varianssianalyysissa perusjoukko jaetaan ryhmiin kahden tekijän suhteen ja päämääränä on testata selitettävän muuttujan ryhmäkohtaisten odotusarvojen yhtäsuuruutta. (a) AINEISTON ESITYSMUOTO STATISTIX-tiedostossa CARS on seuraavat muuttujat: FUELCONS = Polttoainetaloudellisuus (mailia/gallona); CAR DRIVER Selitettävä muuttuja = Automerkki; Indikaattorimuuttuja; arvot = 1, 2, 3; tekijä A = Ajaja; Indikaattorimuuttuja; arvot = 1, 2, 3, 4, 5; tekijä B Tutkimuksen päämääränä oli selvittää millä tavalla polttoainetaloudellisuus (muuttuja FUELCONS) riippuu automerkistä ja ajajasta. Autoja (tekijä A) oli 3 ja ajajia (tekijä B) oli 5, joten erilaisten yhdistelmien (ryhmien) lukumäärä on 3 5 = 15. Jokainen ajaja ajoi jokaisella autolla kolme eri kertaa, joten havaintojen kokonaislukumäärä oli 15 3 = 45. Siis Tekijän A tasojen lukumäärä: I = 3 Tekijän B tasojen lukumäärä: J = 5 Ryhmien lukumäärä: IJ = 15 Havaintojen lukumäärä ryhmässä: K = 3 Havaintojen kokonaislukumäärä: N = KIJ = 45 TKK/SAL Ilkka Mellin (2005) 31/36

32 Testattavat nollahypoteesit: H AB : H A : H B : Ei yhdysvaikutusta Ei A-vaikutusta Ei B-vaikutusta (b) KESKIARVOJEN GRAAFINEN ESITYS Esitetään ryhmäkeskiarvot ja -hajonnat graafisesti. Murtoviivojen erisuuntaisuus ja mutkittelu alla olevissa kuviossa viittaavat sekä yhdysvaikutuksen että päävaikutusten olemassaoloon. Error Bar Chart with SD FUELCONS CAR 45 cases TKK/SAL Ilkka Mellin (2005) 32/36

33 Error Bar Chart with SD FUELCONS DRIVER 45 cases Error Bar Chart with SD 26.4 FUELCONS DRIVER CAR 45 cases TKK/SAL Ilkka Mellin (2005) 33/36

34 Error Bar Chart with SD FUELCONS CAR DRIVER 45 cases (c) KAKSISUUNTAINEN VARIANSSIANALYYSI Tehdään kaksisuuntainen varianssianalyysi tiedoston CARS aineistolle. STATISTIX FOR WINDOWS DRIVERS ANALYSIS OF VARIANCE TABLE FOR FUELCONS SOURCE DF SS MS F P CAR (A) DRIVER (B) A*B RESIDUAL TOTAL Kaikki kolme kaksisuuntaisen varianssianalyysin nollahypoteesia voidaan hylätä. TKK/SAL Ilkka Mellin (2005) 34/36

35 (d) ODOTUSARVOJEN VERTAILU Tekijä A (CAR) STATISTIX FOR WINDOWS DRIVERS BONFERRONI COMPARISON OF MEANS OF FUELCONS BY CAR HOMOGENEOUS CAR MEAN GROUPS I I I ALL 3 MEANS ARE SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 30 DF Taloudellisin on auto 3, sitten auto 1 ja epätaloudellisen on auto 2. Tekijä B (DRIVER) STATISTIX FOR WINDOWS DRIVERS BONFERRONI COMPARISON OF MEANS OF FUELCONS BY DRIVER HOMOGENEOUS DRIVER MEAN GROUPS I I I I I THERE ARE 4 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 30 DF Taloudellisimmin on ajanut ajaja 3, sitten ajaja 1, ajajat 2 ja 5 ja epätaloudellisimmin on ajanut ajaja 4. TKK/SAL Ilkka Mellin (2005) 35/36

36 Tekijä A*B (CAR*DRIVER) STATISTIX FOR WINDOWS DRIVERS BONFERRONI COMPARISON OF MEANS OF FUELCONS BY CAR*DRIVER HOMOGENEOUS CAR DRIVER MEAN GROUPS I I I I I I I I I I I I I I I I I I I I I I I I I I I I THERE ARE 6 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE REJECTION LEVEL CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 30 DF Ajaja 3 on ajanut autolla 1 kaikkein taloudellisimmin. Tilastollisesti yhtä hyvään tulokseen ovat päässeet ajajat 1 ja 3 autolla 3. Seuraavan ryhmän muodostavat ajaja 2 autoilla 3 ja 1, ajaja 1 autolla 1, ajaja 5 autolla 3 ja ajaja 3 autolla 2. Huonoimman ryhmän muodostavat ajaja 5 autoilla 2 ja 1, ajaja 4 autoilla 1, 2 ja 3, ajaja 1 autolla 2 ja ajaja 2 autolla 2. TKK/SAL Ilkka Mellin (2005) 36/36

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 k -faktorikokeet 2 2 -faktorikokeet 2 3 -faktorikokeet 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 2 k -faktorikokeet: Mitä opimme?

Lisätiedot

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa: Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen Kaksisuuntaisen varianssianalsin perusasetelma Jaetaan perusjoukko rhmiin kahden tekän A ja B suhteen

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT imat-2.104 Tilastollisen analyysin perusteet / Tehtävät Aiheet: Avainsanat: Ysisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Koonaisesiarvo,

Lisätiedot

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1 Lohkoasetelmat Vilkkumaa / Kuusinen 1 Motivointi 1/3 Kaksisuuntaisella varianssianalyysilla voidaan tutkia kahden tekijän A ja B vaikutusta sekä niiden yhdysvaikutusta tutkimuksen kohteeseen Kaksisuuntaisessa

Lisätiedot

Hierarkkiset koeasetelmat. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1 Hierarkkiset koeasetelmat Heliövaara 1 Hierarkkiset koeasetelmat Kaksiasteista hierarkkista koeasetelmaa käytetään tarkasteltaessa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tekijän

Lisätiedot

Lohkoasetelmat. Heliövaara 1

Lohkoasetelmat. Heliövaara 1 Lohkoasetelmat Heliövaara 1 Kiusatekijä Kaikissa kokeissa, kokeen tuloksiin voi vaikuttaa vaihtelu joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla mahdollisesti on vaikutusta vastemuuttujan arvoon,

Lisätiedot

Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1

Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1 Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Hierarkkiset koeasetelmat -faktorikokeet Vastepintamenetelmä Aritmeettinen keskiarvo, Estimaatti, Estimaattori, -testi, aktorikokeet,

Lisätiedot

Altistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72

Altistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72 Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut iheet: vainsanat: Kaksisuuntainen varianssianalsi Lohkoasetelmat Latinalaiset neliöt ritmeettinen

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen Kaksisuuntaisen varianssianalsin perusasetelma aetaan perusoukko rhmiin kahden tekän A a B suhteen

Lisätiedot

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Kuusinen/Heliövaara 1 Lohkoasetelmat Kuusinen/Heliövaara 1 Kiusatekijä Kaikissa kokeissa kokeen tuloksiin voi vaikuttaa vaihtelu, joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla on mahdollisesti vaikutusta vastemuuttujan

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1 ohdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi TKK (c) Ilkka Mellin (2005) Kaksisuuntainen varianssianalyysi Varianssianalyysi: ohdanto Kaksisuuntainen varianssianalyysi ja sen suorittaminen

Lisätiedot

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1 Osafaktorikokeet Kurssipalautetta voi antaa Oodissa 27.4.-25.5. Kuusinen/Heliövaara 1 Osafaktorikokeet Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä voi ylittää kokeen

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1 Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi (c) lkka Mellin (005) Useampisuuntainen varianssianalsi ohdatus tilastotieteeseen Useampisuuntainen varianssianalsi (c) lkka Mellin (005) Useampisuuntainen varianssianalsi: Mitä opimme? arkastelemme tässä

Lisätiedot

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,

Lisätiedot

Vastepintamenetelmä. Heliövaara 1

Vastepintamenetelmä. Heliövaara 1 Vastepintamenetelmä Kurssipalautteen antamisesta saa hyvityksenä yhden tenttipisteen. Palautelomakkeeseen tulee lähiaikoina linkki kurssin kotisivuille. Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu Vastepintamenetelmä TKK (c) Ilkka Mellin (2005) 1 Vastepintamenetelmä Vastepintamenetelmä: Johdanto 2 k -faktorikokeet Vastefunktion kaarevuuden testaaminen 1. asteen vastepintamallin varianssianalyysihajotelma

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

2 2 -faktorikokeen määritelmä

2 2 -faktorikokeen määritelmä TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tai useamman tekijän vaikutusta

Lisätiedot

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1 Vastepintamenetelmä Vilkkumaa / Kuusinen 1 Motivointi Varianssianalyysissa tutkitaan tekijöiden vaikutusta vasteeseen siten, että tekijöiden tasot on ennalta valittu. - Esim. tutkitaan kemiallisen prosessin

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Kertausluento. Vilkkumaa / Kuusinen 1

Kertausluento. Vilkkumaa / Kuusinen 1 Kertausluento Vilkkumaa / Kuusinen 1 Kokeellinen tutkimus Kokeellisessa tutkimuksessa on tavoitteena selvittää, miten erilaiset käsittelyt vaikuttavat tutkimuksen kohteisiin - Esim. miten lämpötila ja

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu Latinalaiset neliöt TKK (c) Ilkka Mellin (2005) 1 Latinalaiset neliöt Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman analysointi Laskutoimitusten suorittaminen

Lisätiedot

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Regressiodiagnostiikka Cooken etäisyys, Funktionaalinen muoto, Diagnostinen grafiikka, Diagnostiset testit, Heteroskedastisuus,

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat: Mat-.04 Tilastollise aalyysi perusteet / Ratkaisut Aiheet: Avaisaat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahde riippumattoma otokse t-testit, Nollahypoteesi, p-arvo, Päätössäätö, Testi,

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

MS-C2{04 Tilastollisen analyysin perusteet

MS-C2{04 Tilastollisen analyysin perusteet MS-C2{04 Tilastollisen analyysin perusteet Tentti 7.4.20 4A/irtanen Kirjoita selvästi jokaiseen koepaperiin alla mainitussa järjestyksessä: OHlprrn (i) (ii) MS-C204 TAP 7.4.204 opiskelijanumero + kirjain

Lisätiedot

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Aki Taanila VARIANSSIANALYYSI

Aki Taanila VARIANSSIANALYYSI Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

Teema 9: Tilastollinen merkitsevyystestaus

Teema 9: Tilastollinen merkitsevyystestaus Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5

Lisätiedot

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat: Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Mallin valinta Painotettu PNS-menetelmä Alaspäin askellus, Askellus, Askeltava valikointi, Diagnostinen grafiikka, Diagnostiset

Lisätiedot

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista. Mat-2.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit järjestysasteikollisille muuttujille Testit laatueroasteikollisille muuttujille Hypoteesi, Mannin ja Whitneyn testi (Wilcoxonin

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas NORMAALIJAKATUNEISUUDEN TESTAUS H 0 : Muuttuja on perusjoukossa normaalisti jakautunut. H 1 : Muuttuja ei ole perusjoukossa normaalisti

Lisätiedot

Frequencies. Frequency Table

Frequencies. Frequency Table GET FILE='C:\Documents and Settings\haukkala\My Documents\kvanti\kvanti_harjo'+ '_label.sav'. DATASET NAME DataSet WINDOW=FRONT. FREQUENCIES VARIABLES=koulv paino /ORDER= ANALYSIS. Frequencies [DataSet]

Lisätiedot

Terra Preta kasvatuskoe Pilkon pellolla 2012-2013

Terra Preta kasvatuskoe Pilkon pellolla 2012-2013 Terra Preta kasvatuskoe Pilkon pellolla 2012-2013 Karelia ammattikorkeakoulu Biotalouden keskus Simo Paukkunen Lokakuu 2013 Sisällys 1 Johdanto... 1 2 Aineisto ja menetelmät... 1 3 Tulokset... 6 3.1 Oraiden

Lisätiedot

Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003

Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Nimi Opiskelijanumero Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Normaalisti jakautuneiden yhdistyksessä on useita tuhansia jäseniä. Yhdistyksen sääntöjen mukaan sääntöihin tehtävää muutosta

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

Mat Tilastollisen analyysin perusteet

Mat Tilastollisen analyysin perusteet / Mat-2.21 04 Tilastollisen analyysin perusteet Tentti 24.5.2013/Virtanen Kirjoita selvasti jokaiseen koepaperiin alia mainitussa jarjestyksessa: Mat-2.2104 Tap 24.5.2013 opiskelijanumero kirjain TEKSTATEN

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot