Mat Tilastollisen analyysin perusteet, kevät 2007

Samankaltaiset tiedostot
Mat Tilastollisen analyysin perusteet, kevät 2007

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Testejä suhdeasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Hierarkkiset koeasetelmat. Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Testit laatueroasteikollisille muuttujille

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Vastepintamenetelmä. Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Altistusaika 1 kk 2 kk 3 kk

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Testit järjestysasteikollisille muuttujille

Regressioanalyysi. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Kuusinen/Heliövaara 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslasku A

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus regressioanalyysiin. Heliövaara 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollinen aineisto Luottamusväli

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Yleistetyistä lineaarisista malleista

riippumattomia ja noudattavat samaa jakaumaa.

10. laskuharjoituskierros, vko 14, ratkaisut

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Kertausluento. Vilkkumaa / Kuusinen 1

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Estimointi. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

tilastotieteen kertaus

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

3.6 Su-estimaattorien asymptotiikka

Harjoitus 9: Excel - Tilastollinen analyysi

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Hypoteesin testaus Alkeet

Korrelaatiokertoinen määrittely 165

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Teema 8: Parametrien estimointi ja luottamusvälit

5.7 Uskottavuusfunktioon perustuvia testejä II

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Transkriptio:

Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen

Kaksisuuntaisen varianssianalsin perusasetelma Jaetaan perusjoukko rhmiin kahden tekän A ja B suhteen Tekällä A I tasoa ja tekällä B J tasoa => rhmiä I J kpl Poimitaan jokaisesta rhmästä toisistaan riippumattomat ksinkertaiset satunnaisotokset, otoskoko K k = k. havainto tekän A tason i ja tekän B tason j määräämässä rhmässä, k=,,k; i=,,i; j=,,j Oletetaan E( k ) = µ : tekän A tason i ja tekän B tason j määräämän rhmän havainnoilla on sama odotusarvo Oletetaan D ( k ) = σ : kaikilla havainnoilla on rhmästä riippumatta sama varianssi Kaksisuuntaisessa varianssianalsissa testataan oletusta rhmäkohtaisten odotusarvojen htäsuuruudesta Testausongelma monimutkaisempi kuin ksisuuntaisessa varianssianalsissa teköiden A ja B välillä voi olla ns. interaktiota eli hdsvaikutusta Kai Virtanen

Kaksisuuntaisen varianssianalsin nollahpoteesit Kaksisuuntaisessa varianssianalsissa on 3 kpl nollahpoteeseja Testataan teköiden A ja B hdsvaikutuksen nollahpoteesia: H AB : Ei hdsvaikutusta Nollahpoteesi H AB ok => rhmitksiä teköiden A ja B suhteen voidaan tarkastella erillisinä Testataan tekän A päävaikutuksen nollahpoteesia: H A : Ei A-vaikutusta Testataan tekän B päävaikutuksen nollahpoteesia: H B : Ei B-vaikutusta Nollahpoteesit H A ja H B ovat ksisuuntaisen varianssianalsin nollahpoteeseja Huom! Vaikka teköiden välillä olisi hdsvaikutus, kannattaa tutkia mös päävaikutuksia!! Kai Virtanen 3

Rhmäkeskiarvot ja kokonaiskeskiarvo Havaintojen k rhmäkeskiarvot tekän A tason i ja tekän B tason j määräämässä rhmässä: H AB, H A ja H B ok => rhmäkeskiarvot eivät poikkea todennäköisesti kovin paljon toisistaan Yhdistetn otoksen kokonaiskeskiarvo: jossa N = KIJ on havaintojen kokonaislukumäärä Kokonaiskeskiarvo on rhmäkeskiarvojen keskiarvo: K = k, i=,, K, I, j =,, K, J K k = K I J k N k = i = j = = I J IJ i = j = = Kai Virtanen 4

Marginaali- eli reunakeskiarvot: Reunakeskiarvot K J i = k, i=,, K, I KJ k= j= K I j = k, j =,, K, J KI k= i= Reunakeskiarvo i on havaintojen k keskiarvo tekän A määrämässä rhmässä i, kun B-rhmitstä ei oteta huomioon j Reunakeskiarvo on havaintojen k keskiarvo tekän B määrämässä rhmässä j, kun A-rhmitstä ei oteta huomioon Reunakeskiarvot voidaan määritellä rhmäkeskiarvojen avulla: J i =, i=,, K, I J j= I j =, j =,, K, J I i= Kai Virtanen 5

Poikkeamat keskiarvoista Kirjoitetaan identiteetti = ( ) + ( ) kji i j + ( + ) i j + ( ) kji Kaksisuuntaisen varianssianalsin testit nollahpoteeseille H AB, H A ja H B perustuvat eo. poikkeamien neliösummille Kai Virtanen 6

Poikkeamat ja varianssianalsin testit Testi nollahpoteesille H AB : Ei hdsvaikutusta perustuu poikkeamien neliösummille ( i j + ), ( kji ) ( + ) H AB ok => erotukset i j eivät ole todennäköisesti itseisarvoiltaan kovin suuria Testi nollahpoteesille H A : Ei A-vaikutusta perustuu poikkeamien ( ), ( ) i kji neliösummille ( ) H A ok => erotukset i eivät ole todennäköisesti itseisarvoiltaan kovin suuria Testi nollahpoteesille H B : Ei B-vaikutusta perustuu poikkeamien ( ), ( ) j kji neliösummille ( ) H B ok => erotukset j eivät ole todennäköisesti itseisarvoiltaan kovin suuria Kai Virtanen 7

Kokonaisneliösumma ja päävaikutusten neliösumma Havaintojen kokonaisavaihtelua kuvaava kokonaisneliösumma: hdistetn otoksen varianssi on jossa N = KIJ on havaintojen kokonaislukumäärä Tekän A päävaikutusta kuvaava neliösumma: Tekän B päävaikutusta kuvaava neliösumma: K I J SST = ( ) s k= i= j= = N k SST I i i= J j j= SSA= KJ ( ) SSB = KI ( ) Kai Virtanen 8

Yhdsvaikutuksen neliösumma ja jäännösneliösumma Teköiden A ja B hdsvaikutusta kuvaava neliösumma: I J i j i= j= SSAB = K ( + ) Rhmien sisäistä vaihtelua kuvaava jäännösneliösumma: K I J SSE = ( ) k= i= j= jäännösneliösumman lauseke voidaan esittää mös muodossa jossa havaintojen k rhmävarianssit saadaan lausekkeista k SSE = ( K ) s i= j= s K = ( k ) K k= i=,, K, I ; j =,, K, J I J Kai Virtanen 9

Korota identiteetti Varianssianalsihajotelma potenssiin kaksi ja laske hteen => varianssianalsihajotelma joka voidaan esittää muodossa SST = SSA + SSB + SSAB + SSE = ( ) + ( ) kji i j + ( + ) i j + ( ) kji ( ) = ( ) + ( ) kji i j + ( + ) + ( ) i j kji Kai Virtanen 0

Varianssianalsihajotelman tulkinta Varianssianalsihajotelmassa SST = SSA + SSB + SSAB + SSE kokonaisneliösumma SST = ( ) on hajotettu neljän osatekän summaksi, jossa osatekä SSAB = K ( + ) kuvaa teköiden A ja B hdsvaikutusta, osatekät SSA= KJ ( ) i kuvaavat teköiden A ja B päävaikutuksia ja osatekä kuvaa rhmien sisäistä vaihtelua kji i j SSE = ( ) SSB = KI ( ) kji j Kai Virtanen

Testi hdsvaikutukselle Jos teköiden A ja B hdsvaikutusta kuvaava neliösumma SSAB= K ( + ) on suuri verrattuna rhmien sisäistä vaihtelua kuvaavaan jäännösneliösummaan => nollahpoteesi H AB : Ei hdsvaikutusta on asetettava kseenalaiseksi F-testisuure (Fisherin F-jakauma, vapausasteet (I )(J ) ja (N IJ) ) F AB i j SSE = ( ) N IJ SSAB = ( I )( J ) SSE Testisuureen normaaliarvo on (suurille N) on noin ksi Suuri testisuureen arvo / pieni p-arvo=p(f > testisuureen arvo) => H AB hlätään kji Kai Virtanen

Testi A-vaikutukselle Jos tekän A päävaikutusta kuvaava neliösumma SSA= KJ ( ) on suuri verrattuna rhmien sisäistä vaihtelua kuvaavaan jäännösneliösummaan SSE = ( kji ) => nollahpoteesi H A : Ei A-vaikutusta on asetettava kseenalaiseksi F-testisuure (Fisherin F-jakauma, vapausasteet (I ) ja (N IJ) ) F A Testisuureen normaaliarvo on (suurille N) on noin ksi Suuri testisuureen arvo / pieni p-arvo=p(f > testisuureen arvo) => H A hlätään i N IJ SSA = I SSE Kai Virtanen 3

Testi B-vaikutukselle Jos tekän B päävaikutusta kuvaava neliösumma SSB= KI ( ) on suuri verrattuna rhmien sisäistä vaihtelua kuvaavaan jäännösneliösummaan => nollahpoteesi H B : Ei B-vaikutusta on asetettava kseenalaiseksi F-testisuure (Fisherin F-jakauma, vapausasteet (J ) ja (N IJ) ) Testisuureen normaaliarvo on (suurille N) on noin ksi Suuri testisuureen arvo / pieni p-arvo=p(f > testisuureen arvo) => H B hlätään j SSE = ( kji ) F B N IJ SSB = J SSE Kai Virtanen 4

Testisuureiden tulkinnat Testisuureet F AB, F A, F B voidaan tulkita varianssien vertailutestisuureiksi, joissa variansseja SSAB, SSA, SSB ( I )( J ) ( I ) ( J ) SSE N IJ s SST N N = = = verrataan rhmien sisäiseen varianssiin Kokonaisvarianssi on aina havaintojen k varianssin σ harhaton estimaattori Estimaattorit K I J = = ( kji ) k i j SSAB, SSA, SSB ( I )( J ) ( I ) ( J ) ovat harhattomia havaintojen k varianssille σ vain, jos nollahpoteesit H AB, H A, H B pätevät Kai Virtanen 5

Varianssianalsitaulukko Vaihtelun Neliö- Vapaus- Varianssi- F-testisuure lähde summa asteet estimaattori A SSA I B SSB J AB SSAB (I )(J ) Jäännös SSE N IJ Kokonais- SST N vaihtelu SSA N IJ SSA FA = I I SSE SSB N IJ SSB FB = J J SSE SSAB N IJ F ( I )( J ) AB = ( I )( J ) SSE N IJ SST N SSAB SSE Neliösummat toteuttavat varianssianalsihajotelman SST = SSA + SSB + SSAB + SSE Vapausasteille pätee: N = KIJ = (I ) + (J ) + (I )(J ) + IJ(K ) Kai Virtanen 6

Homma etenee analogisesti ksisuuntaisen varianssianalsin kanssa... Teköiden A ja B välillä hdsvaikutus => Jaetaan rhmät (I J kpl) esim. Bonferronin menetelmällä (ks. Luento ) uusiin rhmiin, joissa odotusarvot eivät poikkea toisistaan tilastollisesti merkitsevästi A päävaikutus => Rhmien (I kpl) rhmittel odotusarvon suhteen ok B päävaikutus => Rhmien (J kpl) rhmittel odotusarvon suhteen ok Bartlettin testillä (ks. Luento ) voidaan testata rhmäkohtaisten varianssien htäsuurutta Varianssit erisuuria => suhtaudu kriittisesti varianssianalsin tuloksiin Kaksisuuntaisen varianssianalsin testausasetelma voidaan kuvata lineaarisella regressiomallilla Kai Virtanen 7

Jos kurssi vielä jatkuisi, niin... Kolmesuuntainen varianssianalsi Enemmän neliösummia Kolmen tekän hdsvaikutus, kahden tekän hdsvaikutukset, päävaikutukset m-suuntainen varianssianalsi Vielä enemmän neliösummia m:n tekän hdsvaikutus, m-:n tekän hdsvaikutukset, jne... Kruskal-Wallisin testi Wilcoxonin rankisummatestin (ks. Luento 3) leists useaan rhmään Mediaanien vertaaminen Järjestsasteikollinen muuttuja (mös välimatka- tai suhdeasteikollinen muuttuja ok) Kai Virtanen 8