Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Samankaltaiset tiedostot
Kaksisuuntainen varianssianalyysi. Heliövaara 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Mat Tilastollisen analyysin perusteet, kevät 2007

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Heliövaara 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Kertausluento. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Harjoitus 7: NCSS - Tilastollinen analyysi

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Regressioanalyysi. Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Johdatus regressioanalyysiin. Heliövaara 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Testejä suhdeasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Estimointi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Altistusaika 1 kk 2 kk 3 kk

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

2 2 -faktorikokeen määritelmä

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyden ominaisuuksia

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Testit järjestysasteikollisille muuttujille

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Yleistetyistä lineaarisista malleista

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

10. laskuharjoituskierros, vko 14, ratkaisut

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

Mat Sovellettu todennäköisyyslasku A

Testit laatueroasteikollisille muuttujille

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 5

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Toimittaja Erä

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Tilastollinen aineisto Luottamusväli

tilastotieteen kertaus

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

2. Keskiarvojen vartailua

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004

Mat Tilastollisen analyysin perusteet, kevät 2007

Korrelaatiokertoinen määrittely 165

Sovellettu todennäköisyyslaskenta B

Yleinen lineaarinen malli

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Transkriptio:

Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1

Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu ryhmiin yhden tekijän suhteen Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän suhteen Tavoitteena on kuten yksisuuntaisessa varianssianalyysissa testata hypoteesia, että tarkasteltavan muuttujan ryhmäkohtaiset odotusarvot ovat yhtä suuria. Vilkkumaa / Kuusinen 2

Kaksisuuntaisen varianssianalyysin perusasetelma 1/4 Oletetaan, että tutkimuksen kohteena oleva perusjoukko voidaan jakaa ryhmiin kahden tekijän A ja B suhteen. Oletetaan, että tekijällä A on I tasoa ja tekijällä B on J tasoa, jolloin jaossa syntyy ryhmiä I J kappaletta. Oletetaan, että ryhmistä poimitaan riippumattomat yksinkertaiset satunnaisotokset, joiden koko on K. Vilkkumaa / Kuusinen 3

Kaksisuuntaisen varianssianalyysin perusasetelma 2/4 Olkoon y kij = k. havainto tekijän A tason i ja tekijän B tason j määräämässä ryhmässä (i, j). Käytetystä otantamenetelmästä seuraa, että havainnot y kij voidaan olettaa riippumattomiksi satunnaismuuttujiksi. Vilkkumaa / Kuusinen 4

Kaksisuuntaisen varianssianalyysin perusasetelma 3/4 Oletetaan, että havainnot y kji ovat normaalijakautuneita: y kij N(μ ij, σ 2 ), k = 1,..., K, i = 1,..., I, j = 1,..., J Haluamme testata nollahypoteesia, että ryhmäkohtaiset odotusarvot E(y kij ) = μ ij ovat yhtä suuria. Nollahypoteesi on siis muotoa H 0 : μ ij = μ, i = 1,..., I, j = 1,..., J Jos nollahypoteesi H 0 pätee, ryhmät voidaan yhdistää havaintojen keskimääräisiä arvoja koskevissa tarkasteluissa. Vilkkumaa / Kuusinen 5

Kaksisuuntaisen varianssianalyysin perusasetelma 4/4 Kaksisuuntaisessa varianssianalyysissa nollahypoteesi H 0 : μ ij = μ, i = 1,..., I, j = 1,..., J on tapana jakaa kolmeksi nollahypoteesiksi, jotka koskevat tekijöiden A ja B päävaikutuksia ja tekijöiden A ja B yhdysvaikutusta. Tämä tekee ryhmäkohtaisten odotusarvojen yhtäsuuruutta koskevan testausongelman monimutkaisemmaksi kuin yksisuuntaisessa varianssianalyysissa. Syy: jos tekijöillä A ja B on yhdysvaikutusta, tekijöiden A ja B päävaikutuksia ei voida tarkastella erillisinä. Vilkkumaa / Kuusinen 6

Yhdysvaikutus Tekijöillä A ja B on yhdysvaikutusta, jos tekijän A vaikutus vastesuureeseen y on erilainen tekijän B eri tasoilla. Yhdysvaikutuksen olemassaolon voi tulkita havaintojen keskiarvodiagrammeista: jos ryhmäkeskiarvojen yhdysjanat eivät ole yhdensuuntaisia, havainnot viittaavat siihen, että tekijöillä on yhdysvaikutusta. Vilkkumaa / Kuusinen 7

Kaksisuuntaisen varianssianalyysin nollahypoteesit Tekijöiden A ja B yhdysvaikutusta koskeva nollahypoteesi on muotoa H AB : Ei yhdysvaikutusta Jos nollahypoteesi H AB jää voimaan, havaintojen ryhmittelyä tekijöiden A ja B suhteen voidaan tarkastella erillisinä. Tekijöiden A ja B päävaikutuksia koskevat nollahypoteesit ovat muotoa H A : Ei A-vaikutusta H B : Ei B-vaikutusta Vilkkumaa / Kuusinen 8

Ryhmäkeskiarvot ja kokonaiskeskiarvo Määritellään havaintoarvojen y kij ryhmäkeskiarvot kaavoilla ȳ ij = 1 K K k=1 y kij, i = 1,..., I, j = 1,..., J sekä kaikkien havaintoarvojen y ji kokonaiskeskiarvo kaavalla ȳ = 1 IJK I i=1 J j=1 K k=1 y kij, jossa IJK = N on havaintojen kokonaislukumäärä. Vilkkumaa / Kuusinen 9

Reunakeskiarvot Määritellään havaintoarvojen y kij marginaali- eli reunakeskiarvot kaavoilla ȳ i = 1 JK J j=1 K k=1 y kij = 1 J J j=1 ȳ ij, i = 1,..., I, ȳ j = 1 IK I i=1 K k=1 y kij = 1 I I i=1 ȳ ij, j = 1,..., J. Vilkkumaa / Kuusinen 10

Neliösummia 1/2 Olkoon I J K SST = (y kij ȳ ) 2 i=1 j=1 k=1 havaintoarvojen y kij kokonaisvaihtelua kuvaava neliösumma, SSA = JK I (ȳ i ȳ ) 2 i=1 tekijän A päävaikutusta kuvaava neliösumma ja SSB = IK J (ȳ j ȳ ) 2 j=1 tekijän B päävaikutusta kuvaava neliösumma. Vilkkumaa / Kuusinen 11

Neliösummia 2/2 Olkoon SSAB = K I J (ȳ ij ȳ i ȳ j + ȳ ) 2 i=1 j=1 tekijöiden A ja B yhdysvaikutusta kuvaava neliösumma ja SSE = I J K (y kij ȳ ij ) 2 i=1 j=1 k=1 ryhmien sisäistä vaihtelua kuvaava jäännösneliösumma. Neliösummille pätee varianssianalyysihajotelma SST = SSA + SSB + SSAB + SSE. Vilkkumaa / Kuusinen 12

Testisuure yhdysvaikutukselle Määritellään F -testisuure F AB = IJ(K 1) (I 1)(J 1) SSAB SSE Jos nollahypoteesi H AB : Ei yhdysvaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((I 1)(J 1), IJ(K 1)). Vilkkumaa / Kuusinen 13

Testisuure A-vaikutukselle Määritellään F A -testisuure F A = IJ(K 1) I 1 SSA SSE Jos nollahypoteesi H A : Ei A-vaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((I 1), IJ(K 1)). Vilkkumaa / Kuusinen 14

Testisuure B-vaikutukselle Määritellään F B -testisuure F B = IJ(K 1) J 1 SSB SSE Jos nollahypoteesi H B : Ei B-vaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((J 1), IJ(K 1)). Vilkkumaa / Kuusinen 15

Testisuureiden tulkinnat 1/2 Testisuureet F AB, F A, F B voidaan tulkita varianssien vertailutestisuureiksi, joissa varianssiestimaattoreita MSAB = SSAB SSA SSB, MSA =, MSB = (I 1)(J 1) I 1 J 1 verrataan ryhmien sisäisen varianssin estimaattoriin MSE = SSE IJ(K 1) Vilkkumaa / Kuusinen 16

Testisuureiden tulkinnat 2/2 Estimaattori MSE = SSE IJ(K 1) on aina harhaton havaintojen y kij varianssille σ 2, mutta estimaattorit MSAB = SSAB SSA SSB, MSA =, MSB = (I 1)(J 1) I 1 J 1 ovat harhattomia varianssille σ 2 ainoastaan jos nollahypoteesit pätevät. H AB, H A, H B Vilkkumaa / Kuusinen 17

Varianssianalyysitaulukko Kaksisuuntaisen varianssianalyysin tulokset on tapana esittää seuraavanlaisessa varianssianalyysitaulukossa: Vaihtelun SS df M S F lähde A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df F B = MSB/MSE AB SSAB (I 1)(J 1) MSAB = SSAB/df F AB = MSAB/MSE Jäännös SSE IJ(K 1) M SE = SSE/df Kokonais- SST IJK 1 vaihtelu Vilkkumaa / Kuusinen 18

Klikkeri-kysely Kahden tekijän suhteen ryhmitellylle aineistolle on tehty varianssianalyysi. Minkä johtopäätöksen voit tuloksista tehdä merkitsevyystasolla 0.05? 1. Tekijöillä A ja B on itsenäistä vaikutusta, muttei yhdysvaikutusta. 2. Tekijöillä A ja B on yhdysvaikutusta, muttei itsenäistä vaikutusta. 3. Tällä merkitsevyystasolla ei voi tehdä lainkaan johtopäätöksiä. Vilkkumaa / Kuusinen 19

Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi I 1/2 Kaksisuuntaisen varianssianalyysin tilastollinen malli voidaan parametroida seuraavasti: y kij = μ ij + ε kij, k = 1,..., K, i = 1,..., I, j = 1,..., J (1) jossa jäännöstermit ε kij ovat riippumattomia ja normaalijakautuneita: ε kij N(0, σ 2 ), k = 1,..., K, i = 1,..., I, j = 1,..., J Mallin parametreja ovat vakiot μ ij, i = 1,..., I, j = 1,..., J ja jäännösvarianssi σ 2. Vilkkumaa / Kuusinen 20

Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi I 2/2 Mallia koskevista oletuksista seuraa, että ja E(y kij ) = μ ij, k = 1,..., K, i = 1,..., I, j = 1,..., J Var(y kij ) = σ 2, k = 1,..., K, i = 1,..., I, j = 1,..., J. Vilkkumaa / Kuusinen 21

Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi II 1/3 Tilastollinen malli voidaan parametroida myös seuraavasti: jossa y kij = μ + α i + β j + (αβ) ij + ε kij, (2) k = 1,..., K, i = 1,..., I, j = 1,..., J, I J I J α i = β j = (αβ) ij = (αβ) ij = 0 i=1 j=1 i=1 j=1 ja jäännöstermit ε kij ovat riippumattomia ja normaalijakautuneita: ε kij N(0, σ 2 ), k = 1,..., K, i = 1,..., I, j = 1,..., J. Vilkkumaa / Kuusinen 22

Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi II 2/3 Mallin parametreja ovat vakiot μ α i β j (αβ) ij, i = 1,..., I, j = 1,..., J, i = 1,..., I, j = 1,..., J sekä jäännösvarianssi σ 2. Vilkkumaa / Kuusinen 23

Kaksisuuntaisen varianssianalyysin tilastollinen malli Parametrointi II 3/3 Mallia koskevista oletuksista seuraa, että E(y kij ) = μ + α i + β j + (αβ) ij, k = 1,..., K, i = 1,..., I, j = 1,..., J ja Var(y kij ) = σ 2, k = 1,..., K, i = 1,..., I, j = 1,..., J. Vilkkumaa / Kuusinen 24

Kaksisuuntaisen varianssianalyysin laskutoimitusten suorittaminen Kaksisuuntaisessa varianssianalyysissa tarvittavien neliösummien laskeminen voi olla työlästä ilman tietokonetta. Ohjeet tarvittavien laskutoimitusten suorittamiseen löytyy 8. laskuharjoituksen ratkaisuista sivuilta 14-15 (vanhat tehtävät). Vilkkumaa / Kuusinen 25

Yhteenveto Kaksisuuntaisella varianssianalyysilla testataan, poikkeavatko kahden tekijän suhteen ryhmitellyn aineiston ryhmäkohtaiset odotusarvot toisistaan Nollahypoteesi H 0 : μ ij = μ i, j jaetaan kolmeen osaan: - H AB : Ei yhdysvaikutusta - H A : Ei A-vaikutusta - H B : Ei B-vaikutusta F -testi perustuu varianssiestimaattorien vertailuun Jos tekijöillä ei ole yhdysvaikutusta, voidaan A- ja B-vaikutuksia tarkastella erillisinä Yhdysvaikutuksen olemassaolon voi tulkita havaintojen keskiarvodiagrammeista Vilkkumaa / Kuusinen 26