Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1



Samankaltaiset tiedostot
Hierarkkiset koeasetelmat. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

2 2 -faktorikokeen määritelmä

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Testejä suhdeasteikollisille muuttujille

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

Lohkoasetelmat. Heliövaara 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Testit järjestysasteikollisille muuttujille

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Vastepintamenetelmä. Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1

Testit laatueroasteikollisille muuttujille

Altistusaika 1 kk 2 kk 3 kk

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Osa 2: Otokset, otosjakaumat ja estimointi

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Kertausluento. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Toimittaja Erä

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Sovellettu todennäköisyyslaskenta B

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Regressioanalyysi. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Hypoteesin testaus Alkeet

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Sovellettu todennäköisyyslaskenta B

Yleistetyistä lineaarisista malleista

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

10. laskuharjoituskierros, vko 14, ratkaisut

ARVIOINTIPERIAATTEET

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Normaalijakaumasta johdettuja jakaumia

Mat Sovellettu todennäköisyyslasku A

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollinen aineisto Luottamusväli

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastolliset menetelmät: Varianssianalyysi

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

tilastotieteen kertaus

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Transkriptio:

ohdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi TKK (c) Ilkka Mellin (2005)

Kaksisuuntainen varianssianalyysi Varianssianalyysi: ohdanto Kaksisuuntainen varianssianalyysi ja sen suorittaminen Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Laskutoimitusten suorittaminen TKK (c) Ilkka Mellin (2005) 2

Kaksisuuntainen varianssianalyysi: Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten tavanomainen kahden riippumattoman otoksen t-testi yleistetään tilanteeseen, jossa ryhmiä on useampia kuin kaksi? Yksisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin yhden tekijän suhteen ja tavoitteena on testata ryhmistä poimittuihin toisistaan riippumattomiin yksinkertaisiin satunnaisotoksiin perustuen hypoteesia, jonka mukaan tarkasteltavan muuttujan ryhmäkohtaiset odotusarvot ovat yhtä suuria. Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän suhteen ja tavoitteena on testata ryhmistä poimittuihin toisistaan riippumattomiin yksinkertaisiin satunnaisotoksiin perustuen hypoteesia, jonka mukaan tarkasteltavan muuttujan ryhmäkohtaiset odotusarvot ovat yhtä suuria. TKK (c) Ilkka Mellin (2005) 3

Kaksisuuntainen varianssianalyysi >> Varianssianalyysi: ohdanto Kaksisuuntainen varianssianalyysi ja sen suorittaminen Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Laskutoimitusten suorittaminen TKK (c) Ilkka Mellin (2005) 4

Varianssianalyysi: ohdanto Avainsanat Kahden riippumattoman otoksen t-testi m-suuntainen varianssianalyysi Odotusarvo Ryhmä Testi Varianssi Yksisuuntainen varianssianalyysi TKK (c) Ilkka Mellin (2005) 5

Varianssianalyysi: ohdanto Kahden otoksen t-testi Suhdeasteikollisille muuttujille tarkoitettuja testejä käsitelleessä kappaleessa tarkasteltiin kahden riippumattoman otoksen t-testiä. Testin testausasetelma on seuraava: (i) Perusjoukko koostuu kahdesta ryhmästä. (ii) Havainnot noudattavat kummassakin ryhmässä normaalijakaumaa. (iii) Kummastakin ryhmästä on poimittu toisistaan riippumattomat yksinkertaiset satunnaisotokset. (iv) Tehtävänä on testata ryhmäkohtaisten odotusarvojen yhtäsuuruutta. TKK (c) Ilkka Mellin (2005) 6

Varianssianalyysi: ohdanto Varianssianalyysin perusongelma Varianssianalyysi voidaan ymmärtää kahden riippumattoman otoksen t-testin yleistykseksi tilanteisiin, jossa perusjoukko koostuu useammasta kuin kahdesta ryhmästä: (i) Perusjoukko koostuu kahdesta tai useammasta ryhmästä. (ii) Havainnot noudattavat jokaisessa ryhmässä normaalijakaumaa. (iii) okaisesta ryhmästä poimitaan toisistaan riippumattomat yksinkertaiset satunnaisotokset. (iv) Tehtävänä on testata ryhmäkohtaisten odotusarvojen yhtäsuuruutta. TKK (c) Ilkka Mellin (2005) 7

Varianssianalyysi: ohdanto Ryhmiin jako varianssianalyysissa Perusjoukon jako ryhmiin voidaan tehdä yhden tai useamman tekijän perusteella. os perusjoukon jako ryhmiin perustuu yhteen tekijään, puhutaan yksisuuntaisesta varianssianalyysista. os perusjoukon jako ryhmiin perustuu m tekijään, puhutaan m-suuntaisesta varianssianalyysista. Huomautus: Tässä luvussa käsitellään kaksisuuntaista varianssianalyysia. TKK (c) Ilkka Mellin (2005) 8

Varianssianalyysi: ohdanto Varianssianalyysin nimi Varianssianalyysin nimi on harhaanjohtava. Varianssianalyysissa testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta tilanteessa, jossa perusjoukko on jaettu kahteen tai useampaan ryhmään. Varianssianalyysin nimi johtuu siitä, että ryhmäkohtaisten odotusarvojen yhtäsuuruuden testaaminen perustuu eri tavoilla määrättyjen varianssien yhtäsuuruuden testaamiseen F-testeillä. TKK (c) Ilkka Mellin (2005) 9

Kaksisuuntainen varianssianalyysi Varianssianalyysi: ohdanto >> Kaksisuuntainen varianssianalyysi ja sen suorittaminen Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Laskutoimitusten suorittaminen TKK (c) Ilkka Mellin (2005) 0

Kaksisuuntainen varianssianalyysi ja sen suorittaminen Avainsanat F-testi Interaktio äännösneliösumma Kaksisuuntainen varianssianalyysi χ 2 -testi Kokonaiskeskiarvo Kokonaisneliösumma Kokonaisvaihtelu Marginaalikeskiarvo Neliösumma Odotusarvo Päävaikutus Reunakeskiarvo Ryhmien sisäinen vaihtelu Ryhmien välinen vaihtelu Ryhmä Ryhmäkeskiarvo Ryhmäneliösumma Taso Testi Vapausaste Varianssi Varianssianalyysihajotelma Varianssianalyysitaulukko Yhdysvaikutus Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2005)

Kaksisuuntaisen varianssianalyysin perusasetelma /6 Oletetaan, että tutkimuksen kohteena oleva perusjoukko voidaan jakaa ryhmiin kahden tekijän (tai muuttujan) A ja B suhteen. Oletetaan, että tekijällä A on I tasoa ja tekijällä B on tasoa, jolloin jaossa syntyy ryhmiä I kappaletta. Oletetaan, että ryhmistä on poimittu toisistaan riippumattomat yksinkertaiset satunnaisotokset, joiden koko on K. TKK (c) Ilkka Mellin (2005) 2

Kaksisuuntaisen varianssianalyysin perusasetelma 2/6 Olkoon y kij = k. havainto tekijän A tason i ja tekijän B tason j määräämässä ryhmässä (i, j) k =, 2,, K i =, 2,, I, j =, 2,, Käytetystä otantamenetelmästä seuraa, että havainnot y kij voidaan olettaa riippumattomiksi (ja siten myös korreloimattomiksi) satunnaismuuttujiksi. TKK (c) Ilkka Mellin (2005) 3

Kaksisuuntaisen varianssianalyysin perusasetelma 3/6 Oletetaan, että havainnot y kij ovat normaalijakautuneita: y kij N(µ ij, σ 2 ), k =, 2,, K i =, 2,, I, j =, 2,, TKK (c) Ilkka Mellin (2005) 4

Kaksisuuntaisen varianssianalyysin perusasetelma 4/6 Havainnoista y kij tehdystä oletuksesta seuraa: (i) Kaikilla samaan ryhmään (i, j) kuuluvilla havainnoilla on sama odotusarvo: E(y kij ) = µ ij, k =, 2,, K i =, 2,, I, j =, 2,, (ii) Kaikilla havainnoilla on ryhmästä riippumatta sama varianssi: D 2 (y kij ) = σ 2, k =, 2,, K i =, 2,, I, j =, 2,, TKK (c) Ilkka Mellin (2005) 5

Kaksisuuntaisen varianssianalyysin perusasetelma 5/6 Haluamme testata nollahypoteesia siitä, että ryhmäkohtaiset odotusarvot E(y kij ) = µ ij, k =, 2,, K i =, 2,, I, j =, 2,, ovat yhtä suuria. Asetetaan siis nollahypoteesi H 0 : µ ij = µ i =, 2,, I, j =, 2,, os nollahypoteesi ryhmäkohtaisten odotusarvojen yhtäsuuruudesta pätee, ryhmät voidaan yhdistää kaikissa havaintojen keskimääräisiä arvoja koskevissa tarkasteluissa. TKK (c) Ilkka Mellin (2005) 6

Kaksisuuntaisen varianssianalyysin perusasetelma 6/6 Kaksisuuntaisessa varianssianalyysissa nollahypoteesi H 0 : µ ij = µ i =, 2,, I, j =, 2,, on tapana jakaa kolmeksi nollahypoteesiksi, jotka koskevat tekijöiden A ja B päävaikutuksia ja tekijöiden A ja B interaktiota eli yhdysvaikutusta. Tämä tekee ryhmäkohtaisten odotusarvojen yhtäsuuruutta koskevan testausongelman monimutkaisemmaksi kuin yksisuuntaisessa varianssianalyysissa. Tämä johtuu siitä, että tekijöiden A ja B päävaikutuksia ei voida tarkastella erillisinä, jos tekijöillä A ja B on interaktiota eli yhdysvaikutusta. TKK (c) Ilkka Mellin (2005) 7

Kaksisuuntaisen varianssianalyysin nollahypoteesit /2 Kaksisuuntaisessa varianssianalyysissa testattavia nollahypoteeseja on kolme kappaletta. Tekijöiden A ja B yhdysvaikutusta koskeva nollahypoteesi on muotoa H AB : Ei yhdysvaikutusta os nollahypoteesi H AB jää voimaan, havaintojen ryhmittelyä tekijöiden A ja B suhteen voidaan tarkastella erillisinä. TKK (c) Ilkka Mellin (2005) 8

Kaksisuuntaisen varianssianalyysin nollahypoteesit 2/2 Tekijän A vaikutusta koskeva nollahypoteesi on muotoa H A : Ei A-vaikutusta Tekijän B vaikutusta koskeva nollahypoteesi on muotoa Huomautus: H B : Ei B-vaikutusta Nollahypoteesit H A ja H B ovat yksisuuntaisen varianssianalyysin nollahypoteeseja. TKK (c) Ilkka Mellin (2005) 9

Kaksisuuntainen varianssianalyysi: Määritelmä Kaksisuuntainen varianssianalyysi tarkoittaa em. testausasetelman nollahypoteesien H AB : Ei yhdysvaikutusta H A H B testaamista. : Ei A-vaikutusta : Ei B-vaikutusta TKK (c) Ilkka Mellin (2005) 20

Yhdysvaikutus: Havainnollistus /3 Tarkastellaan yksinkertaisten esimerkkien avulla ryhmittelevien tekijöiden A ja B interaktion eli yhdysvaikutuksen ilmenemistä ryhmäkohtaisia odotusarvoja kuvaavissa odotusarvodiagrammeissa. Oletetaan, että molemmilla ryhmittelevällä tekijöillä A ja B on kaksi tasoa: A : A i, i =, 2 B : B j, j =, 2 Olkoot vastaavat ryhmäodotusarvot µ ij, i=,2, j =,2 TKK (c) Ilkka Mellin (2005) 2

Yhdysvaikutus: Havainnollistus 2/3 Ei yhdysvaikutusta: µ ij µ ij µ 2 µ 22 B 2 µ µ B 2 22 µ B 2 µ 2 µ µ 2 B A A2 A A2 Kun tekijän B tasoa muutetaan, ryhmäodotusarvo muuttuu yhtä paljon tekijän A tasosta riippumatta. TKK (c) Ilkka Mellin (2005) 22

Yhdysvaikutus: Havainnollistus 3/3 Yhdysvaikutusta saattaa esiintyä: µ ij µ 2 µ ij µ µ 2 2 B µ µ µ 22 2 B B 2 µ µ 22 B 2 A A2 A A2 Kun tekijän B tasoa muutetaan, ryhmäodotusarvo muuttuu eri tavalla riippuen tekijän A tasosta. TKK (c) Ilkka Mellin (2005) 23

Kaksisuuntainen varianssianalyysi ja koesuunnittelu /2 Kaksisuuntaista varianssianalyysiä voidaan käyttää koetulosten analyysiin seuraavassa koeasetelmassa: (i) Oletetaan, että kokeen tavoitteena on verrata, miten käsittelyt ja A, A 2,, A I B, B 2,, B vaikuttavat kiinnostuksen kohteena olevan muuttujan y keskimääräisiin arvoihin. TKK (c) Ilkka Mellin (2005) 24

Kaksisuuntainen varianssianalyysi ja koesuunnittelu 2/2 (ii) Valitaan käsittelykombinaation (A i, B j ) kohteeksi kaikkien kokeen kohteiksi valittujen yksilöiden joukosta satunnaisesti K yksilöä, i =, 2,, I, j =, 2,, ja IK = N. (iii) Mitataan vasteet y kij eli kiinnostuksen kohteena olevan muuttujan y arvot: y kij, k =, 2,, K I =, 2,, I, j =, 2,, Huomaa, että koeasetelma on täydellisesti satunnaistettu: Sattuma määrää täydellisesti millaisen käsittelyn kohteeksi kokeen kohteiksi valitut yksilöt joutuvat. TKK (c) Ilkka Mellin (2005) 25

Ryhmäkeskiarvot Määritellään havaintoarvojen y kij ryhmäkeskiarvot eli ryhmäkohtaiset aritmeettiset keskiarvot tekijän A tason i ja tekijän B tason j määräämässä ryhmässä (i, j): K y ij = i ykij, i=,2,, I, j =,2,, K k = os kaikki nollahypoteesit H AB, H A ja H B pätevät, on odotettavissa, että ryhmäkeskiarvot eivät poikkea kovin paljon toisistaan. TKK (c) Ilkka Mellin (2005) 26

Kokonaiskeskiarvo os ryhmäkohtaiset otokset yhdistetään yhdeksi otokseksi, yhdistetyn otoksen havaintoarvojen yleis- eli kokonaiskeskiarvo on jossa y iii IK = N I K = IK i = j = k = on havaintojen kokonaislukumäärä. y kij TKK (c) Ilkka Mellin (2005) 27

Reunakeskiarvot Määritellään havaintoarvojen y kij marginaali-eli reunakeskiarvot kaavoilla: K y i = ii ykij, i=,2,, I K j= k= I K y j = ii ykij, j =,2,, IK i= i= Reunakeskiarvo y ii i on havaintojen y kij keskiarvo tekijän A määräämässä ryhmässä i, kun B-ryhmitystä ei oteta huomioon. y ii Reunakeskiarvo j on havaintojen y kij keskiarvo tekijän B määräämässä ryhmässä j, kun A-ryhmitystä ei oteta huomioon. TKK (c) Ilkka Mellin (2005) 28

Ryhmäkeskiarvot, kokonaiskeskiarvo ja reunakeskiarvot Kokonaiskeskiarvo on ryhmäkeskiarvojen keskiarvo: y iii I yiij I i = j = = Myös reunakeskiarvot voidaan määritellä ryhmäkeskiarvojen avulla: y i = ii yiij, i=,2,, I j= I y j = ii yiij, j =,2,, I i= TKK (c) Ilkka Mellin (2005) 29

Poikkeamat keskiarvoista Kirjoitetaan identiteetti y y = ( y y ) + ( y y ) kij iii iii iii ii j iii + ( ykij yiij ) 2-suuntaisen varianssianalyysin testit nollahypoteeseille H AB, H A ja H B perustuvat poikkeamien ( y y ),( y y ), ( y y y + y ), ( ykij yiij ) neliösummille. + ( y y y + y ) iii iii ii j iii iij iii ii j iii iij iii ii j iii TKK (c) Ilkka Mellin (2005) 30

Poikkeamat ja varianssianalyysin testit /3 2-suuntaisessa varianssianalyysissa testi nollahypoteesille H AB : Ei yhdysvaikutusta perustuu poikkeamien ( y y y + y ),( y y ) iij iii ii j iii kij iij neliösummille. os nollahypoteesi H AB pätee, on odotettavissa, että erotukset ( y y y + y ) iij iii ii j iii eivät ole itseisarvoiltaan kovin suuria. TKK (c) Ilkka Mellin (2005) 3

Poikkeamat ja varianssianalyysin testit 2/3 2-suuntaisessa varianssianalyysissa testi nollahypoteesille H A : Ei A-vaikutusta perustuu poikkeamien ( y y ),( y y ) ii i iii kij iij neliösummille. os nollahypoteesi H A pätee, on odotettavissa, että erotukset ( y y ) iii iii eivät ole itseisarvoiltaan kovin suuria. TKK (c) Ilkka Mellin (2005) 32

Poikkeamat ja varianssianalyysin testit 3/3 2-suuntaisessa varianssianalyysissa testi nollahypoteesille H A : Ei B-vaikutusta perustuu poikkeamien ( y y ),( y y ) ii j iii kij iij neliösummille. os nollahypoteesi H B pätee, on odotettavissa, että erotukset ( y y ) ii j iii eivät ole itseisarvoiltaan kovin suuria. TKK (c) Ilkka Mellin (2005) 33

Kokonaisneliösumma Määritellään havaintoarvojen kokonaisvaihtelua kuvaava kokonaisneliösumma: os ryhmäkohtaiset otokset yhdistetään yhdeksi otokseksi, saadun yhdistetyn otoksen varianssi on jossa SST = ( y y ) s 2 y = IK = N I K i= j= k= SST IK on havaintojen kokonaislukumäärä. kij iii 2 TKK (c) Ilkka Mellin (2005) 34

Päävaikutusten neliösummat Määritellään tekijän A päävaikutusta kuvaava neliösumma: I iii i= SSA = K ( y y ) Määritellään tekijän B päävaikutusta kuvaava neliösumma: ii j j= iii SSB = IK ( y y ) iii 2 2 TKK (c) Ilkka Mellin (2005) 35

Yhdysvaikutuksen neliösumma ja jäännösneliösumma Määritellään tekijöiden A ja B yhdysvaikutusta kuvaava neliösumma: I iij iii ii j iii i= j= SSAB = K ( y y y + y ) Määritellään ryhmien sisäistä vaihtelua kuvaava (jäännös-) neliösumma: K I SSE = ( y y ) k= i= j= kij iij 2 2 TKK (c) Ilkka Mellin (2005) 36

äännösneliösumman tulkinta Havaintojen y kij ryhmävarianssit eli ryhmäkohtaiset varianssit saadaan lausekkeista s y y K 2 2 ij = ( kij iij ) K k = i=, 2,, I, j =, 2,, Siten ryhmien sisäistä vaihtelua kuvaava neliösumman SSE lauseke voidaan esittää myös muodossa SSE = ( K ) s I i= j= 2 ij TKK (c) Ilkka Mellin (2005) 37

Varianssianalyysihajotelma /2 Korottamalla identiteetti y y = ( y y ) + ( y y ) kij iii iii iii ii j iii + ( y y y + y ) iij iii ii j iii + ( ykij yiij ) potenssiin kaksi ja laskemalla yhteen saadaan varianssianalyysihajotelma 2 2 2 ( ykij yiii) ( yiii yiii) ( yii j yiii) = + + ( y y y + y ) + ( y y ) iij iii ii j iii kij iij 2 2 TKK (c) Ilkka Mellin (2005) 38

Varianssianalyysihajotelma 2/2 Edellä esitettyjen neliösummien määritelmien perusteella varianssianalyysihajotelma ( y y ) = ( y y ) + ( y y ) voidaan esittää muodossa 2 2 2 kij iii iii iii ii j iii SST = SSA + SSB + SSAB + SSE + ( y y y + y ) + ( y y ) iij iii ii j iii kij iij 2 2 TKK (c) Ilkka Mellin (2005) 39

Varianssianalyysihajotelman tulkinta Varianssianalyysihajotelmassa SST = SSA + SSB + SSAB + SSE kokonaisneliösumma SST = ( ykij y iii ) neljän osatekijän summaksi, jossa osatekijä SSAB = K ( y y y + y ) iij iii ii j iii kuvaa tekijöiden A ja B yhdysvaikutusta, osatekijät 2 SSA = K ( y y ) ii i on hajotettu kuvaavat tekijöiden A ja B päävaikutuksia ja osatekijä kuvaa ryhmien sisäistä vaihtelua. iii SSB = IK ( y y ) ii j iii SSE = ( y y ) kij i ij 2 TKK (c) Ilkka Mellin (2005) 40 2 2

Testi yhdysvaikutukselle os tekijöiden A ja B yhdysvaikutusta kuvaava neliösumma SSAB = K ( y y y + y ) on suuri verrattuna ryhmien sisäistä vaihtelua kuvaavaan jäännösneliösummaan SSE = ( y y ) nollahypoteesi H AB : Ei yhdysvaikutusta on asetettava kyseenalaiseksi. kij iij iii ii j iii i ij 2 2 TKK (c) Ilkka Mellin (2005) 4

Testisuure yhdysvaikutukselle ja sen jakauma /2 Määritellään F-testisuure jossa F AB I ( K ) SSAB = ( I )( ) SSE SSAB = K ( y y y + y ) iij iii ii j iii on tekijöiden A ja B yhdysvaikutusta kuvaava neliösumma ja SSE = ( y y ) kij i ij on ryhmien sisäistä vaihtelua kuvaava neliösumma. 2 2 TKK (c) Ilkka Mellin (2005) 42

Testisuure yhdysvaikutukselle ja sen jakauma 2/2 os havainnot ovat normaalijakautuneita ja nollahypoteesi H AB : Ei yhdysvaikutusta pätee, testisuure F AB on jakautunut Fisherin F-jakauman mukaan vapausastein (I )( ) ja I(K ): F F(( I )( ), I( K )) AB Testisuureen F AB normaaliarvo on suurille N = IK N I E( FAB ) = H AB N I 2 Suuret testisuureen F AB arvot johtavat nollahypoteesin H AB hylkäämiseen. TKK (c) Ilkka Mellin (2005) 43

Testi A-vaikutukselle os tekijän A päävaikutusta kuvaava neliösumma SSA = K ( y y ) on suuri verrattuna ryhmien sisäistä vaihtelua kuvaavaan jäännösneliösummaan nollahypoteesi ii i H A : Ei A-vaikutusta on asetettava kyseenalaiseksi. iii SSE = ( y y ) kij i ij 2 2 TKK (c) Ilkka Mellin (2005) 44

Testisuure A-vaikutukselle ja sen jakauma /2 Määritellään F-testisuure jossa F A I ( K ) = I SSA SSE SSA = K ( y y ) ii i on tekijän A päävaikutusta kuvaava neliösumma ja on ryhmien sisäistä vaihtelua kuvaava jäännösneliösumma. iii SSE = ( y y ) kij i ij TKK (c) Ilkka Mellin (2005) 45

Testisuure A-vaikutukselle ja sen jakauma 2/2 os havainnot ovat normaalijakautuneita ja nollahypoteesi H A : Ei A-vaikutusta pätee, testisuure F A on jakautunut Fisherin F-jakauman mukaan vapausastein (I ) ja I(K ): F F(( I ), I( K )) A Testisuureen F A normaaliarvo on suurille N = IK N I E( FA ) = H A N I 2 Suuret testisuureen F A arvot johtavat nollahypoteesin H A hylkäämiseen. TKK (c) Ilkka Mellin (2005) 46

Testi B-vaikutukselle os tekijän B päävaikutusta kuvaava neliösumma SSB = KI ( y y ) on suuri verrattuna ryhmien sisäistä vaihtelua kuvaavaan jäännösneliösummaan nollahypoteesi ii j H B : Ei B-vaikutusta on asetettava kyseenalaiseksi. iii SSE = ( y y ) kij i ij 2 2 TKK (c) Ilkka Mellin (2005) 47

Testisuure B-vaikutukselle ja sen jakauma /2 Määritellään testisuure jossa F B I ( K ) SSB = SSE SSB = KI ( y y ) ii j on tekijän B päävaikutusta kuvaava neliösumma ja on jäännösneliösumma. iii SSE = ( y y ) kij i ij TKK (c) Ilkka Mellin (2005) 48

Testisuure B-vaikutukselle ja sen jakauma 2/2 os havainnot ovat normaalijakautuneita ja nollahypoteesi H B : Ei B-vaikutusta pätee, testisuure F B on jakautunut Fisherin F-jakauman mukaan vapausastein ( ) ja I(K ): F F(( ), I( K )) B Testisuureen F B normaaliarvo on suurille N = IK N I E( FB ) = HB N I 2 Suuret testisuureen F B arvot johtavat nollahypoteesin H B hylkäämiseen. TKK (c) Ilkka Mellin (2005) 49

Ryhmien sisäisen vaihtelun neliösumman SSE ja kokonaisneliösumman SST jakaumat Voidaan osoittaa, että aina pätee SSE 2 χ ( I ( K )) 2 σ Voidaan osoittaa, että jos nollahypoteesit H AB : Ei yhdysvaikutusta H A H B : Ei A-vaikutusta : Ei B-vaikutusta pätevät, niin SST 2 χ ( IK ) 2 σ TKK (c) Ilkka Mellin (2005) 50

Neliösummien SSAB, SSA, SSB jakaumat Edelleen voidaan osoittaa, että jos nollahypoteesit H AB : Ei yhdysvaikutusta H A H B pätevät, niin : Ei A-vaikutusta : Ei B-vaikutusta SSAB 2 χ (( I )( )) 2 σ SSA 2 χ ( I ) 2 σ SSB 2 χ ( ) 2 σ TKK (c) Ilkka Mellin (2005) 5

Neliösummien SSAB, SSA, SSB, SSE riippumattomuus /2 Varianssianalyysihajotelman mukaan SST = SSA + SSB + SSAB + SSE Edellä esitetyn mukaan suureet SST SSA SSB SSAB SSE,,,, 2 2 2 2 2 σ σ σ σ σ ovat nollahypoteesien H AB, H A, H B pätiessä χ 2 -jakautuneita vapausastein, jotka toteuttavat yhtälön IK = (I ) + ( ) + (I )( ) + I(K ) TKK (c) Ilkka Mellin (2005) 52

Neliösummien SSAB, SSA, SSB, SSE riippumattomuus 2/2 Siten suureet SSA SSB SSAB SSE,,, 2 2 2 2 σ σ σ σ ovat Cochranin lauseen mukaan riippumattomia (ks. lukua Yksisuuntainen varianssianalyysi). TKK (c) Ilkka Mellin (2005) 53

Testisuureiden jakaumat Edellä esitetyn nojalla testisuureet F AB, F A, F B noudattavat nollahypoteesien H AB, H A, H B pätiessä Fisherin F-jakaumaa suoraan F-jakauman määritelmän mukaan: MSAB FAB = F(( I )( ), I( K )) MSE MSA FA = F(( I ), I( K )) MSE MSB FB = F(( ), I( K )) MSE TKK (c) Ilkka Mellin (2005) 54

Testisuureiden tulkinnat /2 Testisuureet F AB, F A, F B voidaan tulkita varianssien vertailutestisuureiksi, joissa variansseja MSAB = SSAB, MSA = SSA, MSB = SSB ( I )( ) I verrataan ryhmien sisäiseen varianssiin MSE = SSE I ( K ) TKK (c) Ilkka Mellin (2005) 55

Testisuureiden tulkinnat 2/2 Estimaattori MSE = SSE I ( K ) on aina harhaton havaintojen y kij varianssille σ 2, mutta estimaattorit MSAB = SSAB, MSA = SSA, MSB = SSB ( I )( ) I ovat harhattomia havaintojen y kij varianssille σ 2 vain, jos nollahypoteesit H AB, H A, H B pätevät. TKK (c) Ilkka Mellin (2005) 56

Varianssiestimaattoreiden MSE, MSAB, MSA, MSB harhattomuus /3 Tarkastelemme seuraavassa lähemmin ehtoja, joiden pätiessä estimaattorit MSE MSAB = SSE I ( K ) = SSA MSA = I SSB MSB = SSAB ( I )( ) ovat harhattomia havaintojen y kij varianssille σ 2 TKK (c) Ilkka Mellin (2005) 57

Varianssiestimaattoreiden MSE, MSAB, MSA, MSB harhattomuus 2/3 Käytämme hyväksi sitä, että kaksisuuntaisen varianssianalyysin tilastollinen malli voidaan esittää muodossa (ks. tarkemmin seuraavaa kappaletta): = µ + α + β + ( αβ) + ε jossa ja y kij i j ij kij k =, 2,, K, i=, 2,, I, j =, 2,, I I α = β = ( αβ ) = ( αβ ) = 0 i j ij ij i= j= i= j= ε kij 2 N(0, σ ) k =, 2,, K, i=, 2,, I, j =, 2,, TKK (c) Ilkka Mellin (2005) 58

Varianssiestimaattoreiden MSE, MSAB, MSA, MSB harhattomuus 3/3 Voidaan osoittaa, että nollahypoteesit H AB : Ei yhdysvaikutusta H A H B : Ei A-vaikutusta : Ei B-vaikutusta ovat ekvivalentteja seuraavien ehtojen kanssa: H AB :( αβ ) ij = 0, i=, 2,, I, j =, 2,, H A : α = α2 = $ = α I = 0 H B : β = β2 = $ = β = 0 TKK (c) Ilkka Mellin (2005) 59

Varianssiestimaattorin MSE harhattomuus Voidaan osoittaa, että 2 E( MSE) = E( SSE) = σ I ( K ) Siten MSE on aina varianssin σ 2 harhaton estimaattori. TKK (c) Ilkka Mellin (2005) 60

Varianssiestimaattorin MSAB harhattomuus Voidaan osoittaa, että E( MSAB) = E( SSAB) ( I )( ) 2 = + σ K I i= j= ( αβ ) Siten MSAB on varianssin σ 2 harhaton estimaattori, jos nollahypoteesi H AB : ( αβ ) ij = 0, i=, 2,, I, j =, 2,, pätee. 2 ij ( I )( ) TKK (c) Ilkka Mellin (2005) 6

Varianssiestimaattorin MSA harhattomuus Voidaan osoittaa, että E( MSA) = E( SSA) I Siten MSA on varianssin σ 2 harhaton estimaattori, jos nollahypoteesi pätee. K 2 i= σ = + H A : α = α = $ = α I = I I α 2 i 2 0 TKK (c) Ilkka Mellin (2005) 62

Varianssiestimaattorin MSB harhattomuus Voidaan osoittaa, että E( MSB) = E( SSB) 2 = + σ KI j= Siten MSB on varianssin σ 2 harhaton estimaattori, jos nollahypoteesi H B : β = β2 = $ = β = 0 pätee. β 2 j TKK (c) Ilkka Mellin (2005) 63

Varianssianalyysitaulukko /2 Vaihtelun SS df MS F lähde A SSA I MSA = SSA/df F A = MSA/MSE B SSB MSB = SSB/df F B = MSB/MSE AB SSAB (I )( ) MSAB = SSAB/df F AB = MSAB/MSE äännös SSE I(K ) MSE = SSE/df Kokonaisvaihtelu SST IK TKK (c) Ilkka Mellin (2005) 64

Varianssianalyysitaulukko 2/2 Varianssianalyysitaulukon neliösummat toteuttavat yhtälön SST = SSA + SSB + SSAB + SSE Yhtälö on varianssianalyysihajotelma. Varianssianalyysitaulukon neliösummien vapausasteet toteuttavat yhtälön N = IK =(I ) + ( ) + (I )( ) + I(K ) TKK (c) Ilkka Mellin (2005) 65

Kaksisuuntainen varianssianalyysi Varianssianalyysi: ohdanto Kaksisuuntainen varianssianalyysi ja sen suorittaminen >> Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin mallin parametrien estimointi Laskutoimitusten suorittaminen TKK (c) Ilkka Mellin (2005) 66

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin tilastollinen malli: Parametrointi I /3 Kaksisuuntaisen varianssianalyysin tilastollinen malli voidaan parametroida seuraavalla tavalla: () = µ + ε y kij ij kij k =, 2,, K, i=, 2,, I, j =, 2,, jossa jäännöstermit ε kij ovat riippumattomia ja normaalijakautuneita: 2 ε N(0, σ ) kij k =, 2,, K, i=, 2,, I, j =, 2,, Mallissa () y kij = y-muuttujan k. havaintoarvo ryhmässä (i, j) µ ij = y-muuttujan odotusarvo ryhmässä (i, j) TKK (c) Ilkka Mellin (2005) 67

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin tilastollinen malli: Parametrointi I 2/3 Ei-satunnaiset vakiot µ ij, i =, 2,, I, j =, 2,, ja jäännösvarianssi σ 2 ovat kaksisuuntaisen varianssianalyysin tilastollisen mallin () = µ + ε y kij ij kji k =, 2,, K, i=, 2,, I, j =, 2,, parametreja. TKK (c) Ilkka Mellin (2005) 68

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin tilastollinen malli: Parametrointi I 3/3 Mallia () koskevista oletuksista seuraa, että E( ) = µ ja y kij ij k =, 2,, K, i=, 2,, I, j =, 2,, D( ) 2 2 y kij = σ k =, 2,, K, i=, 2,, I, j =, 2,, TKK (c) Ilkka Mellin (2005) 69

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin tilastollinen malli: Parametrointi II /3 Kaksisuuntaisen varianssianalyysin tilastollinen malli voidaan parametroida myös seuraavalla tavalla: (2) = µ + α + β + ( αβ) + ε jossa y kij i j ij kij k =, 2,, K, i =, 2,, I, j =, 2,, i j ij ij i= j= i= j= ja jäännöstermit ε kij ovat riippumattomia ja normaalijakautuneita: ε I I kij α = β = ( αβ ) = ( αβ ) = 0 2 N(0, σ ) k =, 2,, K, i=, 2,, I, j =, 2,, TKK (c) Ilkka Mellin (2005) 70

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin tilastollinen malli: Parametrointi II 2/3 Ei-satunnaiset vakiot µ α i, i =, 2,, I β j, j =, 2,, (αβ) ij, i =, 2,, I, j =, 2,, ja jäännösvarianssi σ 2 ovat kaksisuuntaisen varianssianalyysin tilastollisen mallin (2) = µ + α + β + ( αβ) + ε y kij i j ij kij k =, 2,, K, i =, 2,, I, j =, 2,, parametreja. TKK (c) Ilkka Mellin (2005) 7

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin tilastollinen malli: Parametrointi II 3/3 Mallia (2) koskevista oletuksista seuraa, että E( ) = µ + α + β + ( αβ) ja y kij i j ij k =, 2,, K, i =, 2,, I, j =, 2,, D( ) 2 2 y kij = σ k =, 2,, K, i=, 2,, I, j =, 2,, TKK (c) Ilkka Mellin (2005) 72

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Parametrointien I ja II vertailu /2 Mallissa () y kij = µ ij + ε kij k =, 2,, K, i=, 2,, I, j =, 2,, y-havainnot esitetään ryhmäkohtaisten odotusarvojen µ ij, i =, 2,, I, i =, 2,, avulla. TKK (c) Ilkka Mellin (2005) 73

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Parametrointien I ja II vertailu 2/2 Mallissa (2) y kij = µ + α i + β j + ( αβ) ij + ε kij k =, 2,, K, i =, 2,, I, j =, 2,, y-havainnot esitetään seuraavien tekijöiden summana: Yleisodotusarvo µ Ryhmittelevän tekijän A tason i vaikutus (efekti) α i i =, 2,, I Ryhmittelevän tekijän B tason j vaikutus (efekti) β j j =, 2,, Yhdysvaikutus (αβ) ij i =, 2,, I, j =, 2,, TKK (c) Ilkka Mellin (2005) 74

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Parametrointien I ja II ekvivalenssi /4 Mallit () ja (2) ovat ekvivalentteja mallit on vain parametroitu eri tavoilla. Määritellään µ i = i µ ij i= I µ j = i µ ij I i= I I µ = µ = µ = µ I I ij ii i j i= i= i= j= TKK (c) Ilkka Mellin (2005) 75

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Parametrointien I ja II ekvivalenssi 2/4 Kirjoitetaan identiteetti y = µ + ( µ µ ) + ( µ µ ) kij ii i j ja merkitään i j + ( µ µ µ + µ ) + ( y µ ) α = µ µ ij ii i j kij ij ii β = µ µ i j ( αβ ) = µ µ µ + µ ij ij ii i j ε = y µ kij kij ij TKK (c) Ilkka Mellin (2005) 76

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Parametrointien I ja II ekvivalenssi 3/4 Tällöin I i= j= I α = 0 i β = 0 j ( αβ ) = ( αβ ) = 0 ij i= j= ij TKK (c) Ilkka Mellin (2005) 77

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Parametrointien I ja II ekvivalenssi 4/4 Siten y y y = µ + ε kij ij kij = µ + ( µ µ ) + ( µ µ ) kij ii i j + ( µ µ µ + µ ) + ( y µ ) ij ii i j kij ij = µ + α + β + ( αβ) + ε kij i j ij kij ovat kaksisuuntaisen varianssianalyysin tilastollisen mallin ekvivalentteja esitysmuotoja. TKK (c) Ilkka Mellin (2005) 78

Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Nollahypoteesien ekvivalenssi Edellä esitetystä seuraa, että nollahypoteesit H AB H A H B : Ei yhdysvaikutusta : Ei A-vaikutusta : Ei B-vaikutusta ovat ekvivalentteja seuraavien ehtojen kanssa: H AB : ( αβ ) ij = 0, i=, 2,, I, j =, 2,, H A : α = α2 = $ = α I = 0 H B : β = β2 = $ = β = 0 TKK (c) Ilkka Mellin (2005) 79

Kaksi- ja useampisuuntainen varianssianalyysi Varianssianalyysi: ohdanto Kaksisuuntainen varianssianalyysi ja sen suorittaminen Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi >> Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Laskutoimitusten suorittaminen TKK (c) Ilkka Mellin (2005) 80

Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Kaksisuuntaisen varianssianalyysin malli Kaksisuuntaisen varianssianalyysin malli voidaan parametroida seuraavalla tavalla: = µ + α + β + ( αβ) + ε jossa y kij i j ij kij k =, 2,, K, i =, 2,, I, j =, 2,, i j ij ij i= j= i= j= ja jäännöstermit ε kij ovat riippumattomia ja normaalijakautuneita: ε I I kij α = β = ( αβ ) = ( αβ ) = 0 2 N(0, σ ) k =, 2,, K, i=, 2,, I, j =, 2,, TKK (c) Ilkka Mellin (2005) 8

Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Kaksisuuntaisen varianssianalyysin mallin parametrien PNS-estimaattorit /2 Mallin y kij = µ + α i + β j + ( αβ) ij + ε kij jossa k =, 2,, K, i =, 2,, I, j =, 2,, I I α = β = ( αβ ) = ( αβ ) = 0 i j ij ij i= j= i= j= parametrit voidaan estimoida pienimmän neliösumman menetelmällä. TKK (c) Ilkka Mellin (2005) 82

Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Kaksisuuntaisen varianssianalyysin mallin parametrien PNS-estimaattorit 2/2 Parametrien PNS-estimaattoreiksi saadaan ˆ µ = y ˆ α = y y, i=,2,, I i ii i ˆ β = y y, j =,2,, j iii ii j iii iii ( ˆ αβˆ ) = y y y + y, i=,2,, I, j =,2,, ij iij iii ii j iii TKK (c) Ilkka Mellin (2005) 83

Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Kaksisuuntaisen varianssianalyysin mallin parametrien PNS-estimaattorit: ohto /5 Estimoidaan mallin = µ + α + β + ( αβ) + ε jossa y kij i j ij kij k =, 2,, K, i =, 2,, I, j =, 2,, I I α = β = ( αβ ) = ( αβ ) = 0 i j ij ij i= j= i= j= parametrit PNS-menetelmällä. TKK (c) Ilkka Mellin (2005) 84

Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Kaksisuuntaisen varianssianalyysin mallin parametrien PNS-estimaattorit: ohto 2/5 Etsitään neliösumman minimi parametrien suhteen tavanomaiseen tapaan: (i) (ii) I K SS = ( y µ α β ( αβ) ) i= j= k= kij i j ij Derivoidaan neliösumma SS parametrien suhteen. Merkitään derivaatat nolliksi. (iii) Ratkaistaan saadut normaaliyhtälöt parametrien suhteen ottamalla huomioon side-ehdot I I α = β = ( αβ ) = ( αβ ) = 0 i j ij ij i= j= i= j= 2 TKK (c) Ilkka Mellin (2005) 85

Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Kaksisuuntaisen varianssianalyysin mallin parametrien PNS-estimaattorit: ohto 3/5 Normaaliyhtälöt ovat seuraavaa muotoa: I I () µ : IK µ + K α + K β + K ( αβ) = y i= i j= j i= j= ij iii (2) α : Kµ + Kα + K β + K ( αβ) = y i i j= j j= ij ii i i=, 2,, I (3) β : IKµ + K α + IKβ + K ( αβ) = y j i= i j i= ij ii j j =, 2,, I (4) ( αβ ) : Kµ + Kα + Kβ + K( αβ ) = y i=, 2,, I, j =, 2,, ij i j ij iij I TKK (c) Ilkka Mellin (2005) 86

Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Kaksisuuntaisen varianssianalyysin mallin parametrien PNS-estimaattorit: ohto 4/5 Huomaa, että parametrien lukumäärä normaaliyhtälöissä on + I + + I ja yhtälöiden lukumäärä on myös + I + + I Yhtälöt ovat kuitenkin yliparametroituja: (i) Yhtälöiden (2) summana saadaan yhtälö (). (ii) Yhtälöiden (3) summana saadaan yhtälö (). (iii) Yhtälöiden (4) summana saadaan kiinteälle i yhtälö (2). Yhtälöiden (4) summana saadaan kiinteälle j yhtälö (3). Siten yhtälösysteemin yhtälöiden välillä on + I + lineaarista riippuvuutta ja systeemillä ei ole yksikäsitteistä ratkaisua. TKK (c) Ilkka Mellin (2005) 87

Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Kaksisuuntaisen varianssianalyysin mallin parametrien PNS-estimaattorit: ohto 5/5 Yhtälösysteemi voidaan kuitenkin ratkaista ottamalla huomioon sideehdot I I α = β = ( αβ ) = ( αβ ) = 0 i j ij ij i= j= i= j= Huomaa, että riippumattomien side-ehtojen lukumäärä on yhtälösysteemin ratkaisemiseksi tarvittava + I + Ratkaisuksi saadaan ottamalla yo. side-ehdot huomioon ˆ µ = y ˆ α = y y, i=,2,, I i ii i ˆ β = y y, j =,2,, j iii ii j iii iii ( ˆ αβˆ ) = y y y + y, i=,2,, I, j =,2,, ij iij iii ii j iii TKK (c) Ilkka Mellin (2005) 88

Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi Kaksisuuntaisen varianssianalyysin mallin sovitteet ja residuaalit Estimoidun mallin sovitteet saadaan yhtälöstä yˆ = ˆ µ + ˆ α + ˆ β + ( ˆ αβˆ) kij i j ij = y + ( y y ) + ( y y ) + ( y y y + y ) = y iii iii iii ii j iii iij iii ii j iii iij k =, 2,, K, i =, 2,, I, j =, 2,, Estimoidun mallin residuaalit saadaan yhtälöstä e = y yˆ = y y kij kij kij kij iij k =, 2,, K, i=, 2,, I, j =, 2,, TKK (c) Ilkka Mellin (2005) 89

Kaksisuuntainen varianssianalyysi Varianssianalyysi: ohdanto Kaksisuuntainen varianssianalyysi ja sen suorittaminen Kaksisuuntaisen varianssianalyysin malli ja sen parametrointi Kaksisuuntaisen varianssianalyysin malli ja sen parametrien estimointi >> Laskutoimitusten suorittaminen TKK (c) Ilkka Mellin (2005) 90

Laskutoimitusten suorittaminen Havainnot Olkoon y kij = k. havainto tekijän A tason i ja tekijän B tason j määräämässä ryhmässä (i, j) k =, 2,, K i =, 2,, I j =, 2,, TKK (c) Ilkka Mellin (2005) 9

Laskutoimitusten suorittaminen Ryhmäsummat, reunasummat ja kokonaissumma Määritellään seuraavat summat: T iij = K k = y kij K T = y = T ii i kij iij j= k= j= I K I T = y = T ii j kij iij i= k= i= I K I I T = y = T = T = T iii kij iij iii ii j i= j= k= i= j= i= j= i=,2,, I, j =,2,, TKK (c) Ilkka Mellin (2005) 92

Laskutoimitusten suorittaminen Havaintoarvojen neliöiden summat Määritellään tekijän A tason i ja tekijän B tason j määräämän ryhmän (i, j) havaintoarvojen y kij neliöiden summa kaavalla K 2 kij = = k = y, i,2,, I, j,2,, ja kaikkien havaintoarvojen y kij neliöiden kokonaissumma kaavalla I K i= j= k= y 2 kij TKK (c) Ilkka Mellin (2005) 93

Laskutoimitusten suorittaminen Ryhmäkeskiarvojen, reunakeskiarvojen ja kokonaiskeskiarvon laskeminen Havaintoarvojen ryhmäkeskiarvot saadaan kaavoilla K y ij = i ykij = Ti ij, i=,2,, I, i=,2,, K k = K reunakeskiarvot saadaan kaavoilla K y i = ii ykij = Tii i, i=,2,, I K K j= k= I K y j = ii ykij = Tii j, j =,2,, IK I = k = IK ja kokonaiskeskiarvo saadaan kaavalla I K y = iii ykij = Tiii IK IK i= j= k= TKK (c) Ilkka Mellin (2005) 94

Laskutoimitusten suorittaminen Ryhmävarianssien ja kokonaisvarianssin laskeminen Havaintoarvojen ryhmävarianssit saadaan kaavoilla 2 K 2 2 s ij = i yiij Ti ij, i=,2,, I, j =,2,, K j= K ja kokonaisvarianssi saadaan kaavalla 2 I K 2 2 s = iii ykij Tiii IK I= j= j= IK TKK (c) Ilkka Mellin (2005) 95

Laskutoimitusten suorittaminen Kokonaisneliösumman sekä päävaikutusten neliösummien laskeminen Kokonaisneliösumma SST voidaan laskea kaavalla SST = y y = y T I K I K 2 2 2 ( ) kij iii kij iii i= j= k= i= j= k= IK Tekijän A päävaikutusta kuvaava neliösumma SSA saadaan kaavalla SSA K y y T T I I 2 2 2 ( ii i iii) ii i iii i= K i= IK = = ja tekijän B päävaikutusta kuvaava neliösumma SSB saadaan kaavalla SSB IK y y T T 2 2 2 ( i ji iii) ii j iii j= IK j= IK = = TKK (c) Ilkka Mellin (2005) 96

Laskutoimitusten suorittaminen Yhdysvaikutuksen neliösumman laskeminen Tekijöiden A ja B yhdysvaikutusta kuvaava neliösumma SSAB kannattaa laskea kahdessa vaiheessa. Lasketaan ensin ryhmäkeskiarvojen kokonaisvaihtelua kuvaava neliösumma I I 2 2 2 SS = K ( y ij y ) = i iii Ti ij Tiii K IK i= j= i= j= Tekijöiden A ja B yhdysvaikutusta kuvaava neliösumma SSAB saadaan kaavalla I iij iii ii j iii i= j= SSAB = K ( y y y + y ) = SS SSA SSB 2 TKK (c) Ilkka Mellin (2005) 97

Laskutoimitusten suorittaminen äännösneliösumman laskeminen Ryhmien sisäistä vaihtelua kuvaava jäännösneliösumma SSE saadaan varianssianalyysihajotelman nojalla kaavalla SSE = SST SSA SSB SSAB tai kaavalla SSE = SST SS TKK (c) Ilkka Mellin (2005) 98

Laskutoimitusten suorittaminen Laskutoimitusten järjestäminen taulukoksi /2 Havainnot kannattaa järjestää seuraavaksi taulukoksi: A A2 $ AI B y, y,, y y, y,, y $ y, y,, y B y, y,, y y, y,, y $ y, y,, y % % % % B y, y,, y y, y,, y $ y, y,, y 2 k 2 22 k2 I 2I ki 2 2 22 k2 22 222 k22 I2 2I2 ki2 2 k 2 22 k2 I 2I ki Taulukosta lasketaan havaintoarvojen neliöiden kokonaissumma I K i= j= k= y 2 kij ja jokaisen solun (i, j) havaintoarvojen summa K T ij = i ykij, i=,2,, I, j =,2,, k = TKK (c) Ilkka Mellin (2005) 99

Laskutoimitusten suorittaminen Laskutoimitusten järjestäminen taulukoksi 2/2 Muiden tarvittavien summien laskeminen järjestetään taulukoksi seuraavalla tavalla: A A2 $ AI Summa B Ti Ti2 $ TiI Tii B2 Ti 2 Ti22 $ TiI 2 Tii2 % % % % % B Ti Ti2 $ TiI Tii Summa T T $ T T jossa siis ii i2i ii i iii K T ij = i ykij, i=,2,, I, j =,2,, k = on solun (i, j) havaintoarvojen summa. TKK (c) Ilkka Mellin (2005) 00