Mat Tilastollisen analyysin perusteet, kevät 2007

Samankaltaiset tiedostot
Mat Tilastollisen analyysin perusteet, kevät 2007

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Väliestimointi (jatkoa) Heliövaara 1

Testejä suhdeasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Osa 2: Otokset, otosjakaumat ja estimointi

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Regressioanalyysi. Kuusinen/Heliövaara 1

Testit järjestysasteikollisille muuttujille

Vastepintamenetelmä. Heliövaara 1

Mat Sovellettu todennäköisyyslasku A

Altistusaika 1 kk 2 kk 3 kk

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus regressioanalyysiin. Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

10. laskuharjoituskierros, vko 14, ratkaisut

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollinen aineisto Luottamusväli

riippumattomia ja noudattavat samaa jakaumaa.

Tilastolliset menetelmät: Varianssianalyysi

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Hierarkkiset koeasetelmat. Heliövaara 1

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Vilkkumaa / Kuusinen 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Sovellettu todennäköisyyslaskenta B

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

3.6 Su-estimaattorien asymptotiikka

ABHELSINKI UNIVERSITY OF TECHNOLOGY

5.7 Uskottavuusfunktioon perustuvia testejä II

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Yleistetyistä lineaarisista malleista

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

9. laskuharjoituskierros, vko 12-13, ratkaisut

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Kaksisuuntainen varianssianalyysi. Kaksisuuntainen varianssianalyysi. Kaksisuuntainen varianssianalyysi

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

tilastotieteen kertaus

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Sovellettu todennäköisyyslaskenta B

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Transkriptio:

Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen Kaksisuuntaisen varianssianalsin perusasetelma aetaan perusoukko rhmiin kahden tekän A a B suhteen Tekällä A tasoa a tekällä B tasoa => rhmiä kpl Poimitaan okaisesta rhmästä toisistaan riippumattomat ksinkertaiset satunnaisotokset, otoskoko K k = k. havainto tekän A tason i a tekän B tason määräämässä rhmässä, k=,,k; i=,,; =,, Oletetaan E( k = µ : tekän A tason i a tekän B tason määräämän rhmän havainnoilla on sama odotusarvo Oletetaan D ( k = σ : kaikilla havainnoilla on rhmästä riippumatta sama varianssi Kaksisuuntaisessa varianssianalsissa testataan oletusta rhmäkohtaisten odotusarvoen htäsuuruudesta Testausongelma monimutkaisempi kuin ksisuuntaisessa varianssianalsissa teköiden A a B välillä voi olla ns. interaktiota eli hdsvaikutusta Kai Virtanen Kaksisuuntaisen varianssianalsin nollahpoteesit Kaksisuuntaisessa varianssianalsissa on 3 kpl nollahpoteesea Testataan teköiden A a B hdsvaikutuksen nollahpoteesia: H AB : Ei hdsvaikutusta Nollahpoteesi H AB ok => rhmitksiä teköiden A a B suhteen voidaan tarkastella erillisinä Testataan tekän A päävaikutuksen nollahpoteesia: H A : Ei A-vaikutusta Testataan tekän B päävaikutuksen nollahpoteesia: H B : Ei B-vaikutusta Nollahpoteesit H A a H B ovat ksisuuntaisen varianssianalsin nollahpoteesea Huom! Vaikka teköiden välillä olisi hdsvaikutus, kannattaa tutkia mös päävaikutuksia!! Kai Virtanen 3 Rhmäkeskiarvot a kokonaiskeskiarvo Havaintoen k rhmäkeskiarvot tekän A tason i a tekän B tason määräämässä rhmässä: K =, i=,, K,, =,, K, K k = H AB, H A a H B ok => rhmäkeskiarvot eivät poikkea todennäköisesti kovin palon toisistaan Yhdistetn otoksen kokonaiskeskiarvo: ossa N = K on havaintoen kokonaislukumäärä Kokonaiskeskiarvo on rhmäkeskiarvoen keskiarvo: k K k N k = i = = = i = = = Kai Virtanen 4

Reunakeskiarvot Marginaali- eli reunakeskiarvot: K i= k, i=,, K, K k= = K = k, =,, K, K k= i= Reunakeskiarvo i on havaintoen k keskiarvo tekän A määrämässä rhmässä i, kun B-rhmitstä ei oteta huomioon Reunakeskiarvo on havaintoen k keskiarvo tekän B määrämässä rhmässä, kun A-rhmitstä ei oteta huomioon Reunakeskiarvot voidaan määritellä rhmäkeskiarvoen avulla: i=, i=,, K, = =, =,, K, i= Kai Virtanen 5 Kiroitetaan identiteetti Poikkeamat keskiarvoista = ( + ( i + ( + i + ( Kaksisuuntaisen varianssianalsin testit nollahpoteeseille H AB, H A a H B perustuvat eo. poikkeamien neliösummille Kai Virtanen 6 Poikkeamat a varianssianalsin testit Testi nollahpoteesille H AB : Ei hdsvaikutusta perustuu poikkeamien ( neliösummille i +, ( H AB ok => erotukset ( i + eivät ole todennäköisesti itseisarvoiltaan kovin suuria Testi nollahpoteesille H A : Ei A-vaikutusta perustuu poikkeamien (, ( neliösummille i H A ok => erotukset ( i eivät ole todennäköisesti itseisarvoiltaan kovin suuria Testi nollahpoteesille H B : Ei B-vaikutusta perustuu poikkeamien (, ( neliösummille H B ok => erotukset ( eivät ole todennäköisesti itseisarvoiltaan kovin suuria Kai Virtanen 7 Kokonaisneliösumma a päävaikutusten neliösumma Havaintoen kokonaisavaihtelua kuvaava kokonaisneliösumma: hdistetn otoksen varianssi on s = SST N ossa N = K on havaintoen kokonaislukumäärä Tekän A päävaikutusta kuvaava neliösumma: Tekän B päävaikutusta kuvaava neliösumma: K SST = ( k= i= = k i i= = SSA= K ( = K ( Kai Virtanen 8

Yhdsvaikutuksen neliösumma a äännösneliösumma Teköiden A a B hdsvaikutusta kuvaava neliösumma: ( i i= = SSAB = K + Rhmien sisäistä vaihtelua kuvaava äännösneliösumma: K = ( k= i= = äännösneliösumman lauseke voidaan esittää mös muodossa = ( K s ossa havaintoen k rhmävarianssit saadaan lausekkeista K s = ( k K k= i=,, K, ; =,, K, k i= = Kai Virtanen 9 Korota identiteetti Varianssianalsihaotelma potenssiin kaksi a laske hteen => varianssianalsihaotelma = ( + ( i oka voidaan esittää muodossa SST = SSA + + SSAB + + ( + i + ( ( = ( + ( i + ( + + ( i Kai Virtanen 0 Varianssianalsihaotelman tulkinta Varianssianalsihaotelmassa SST = SSA + + SSAB + kokonaisneliösumma SST = ( on haotettu nelän osatekän summaksi, ossa osatekä SSAB = K ( + kuvaa teköiden A a B hdsvaikutusta, osatekät SSA= K ( = K ( i kuvaavat teköiden A a B päävaikutuksia a osatekä kuvaa rhmien sisäistä vaihtelua i = ( Testi hdsvaikutukselle os teköiden A a B hdsvaikutusta kuvaava neliösumma SSAB= K ( + i on suuri verrattuna rhmien sisäistä vaihtelua kuvaavaan äännösneliösummaan = ( => nollahpoteesi H AB : Ei hdsvaikutusta on asetettava kseenalaiseksi F-testisuure (Fisherin F-akauma, vapausasteet ( ( a (N N SSAB FAB ( ( Testisuureen normaaliarvo on (suurille N on noin ksi Suuri testisuureen arvo / pieni p-arvo=p(f > testisuureen arvo => H AB hlätään Kai Virtanen Kai Virtanen 3

Testi A-vaikutukselle os tekän A päävaikutusta kuvaava neliösumma SSA= K ( on suuri verrattuna rhmien sisäistä vaihtelua kuvaavaan äännösneliösummaan = ( => nollahpoteesi H A : Ei A-vaikutusta on asetettava kseenalaiseksi F-testisuure (Fisherin F-akauma, vapausasteet ( a (N N SSA FA Testisuureen normaaliarvo on (suurille N on noin ksi Suuri testisuureen arvo / pieni p-arvo=p(f > testisuureen arvo => H A hlätään i Kai Virtanen 3 Testi B-vaikutukselle os tekän B päävaikutusta kuvaava neliösumma = K ( on suuri verrattuna rhmien sisäistä vaihtelua kuvaavaan äännösneliösummaan = ( => nollahpoteesi H B : Ei B-vaikutusta on asetettava kseenalaiseksi F-testisuure (Fisherin F-akauma, vapausasteet ( a (N N FB Testisuureen normaaliarvo on (suurille N on noin ksi Suuri testisuureen arvo / pieni p-arvo=p(f > testisuureen arvo => H B hlätään Kai Virtanen 4 Testisuureiden tulkinnat Testisuureet F AB, F A, F B voidaan tulkita varianssien vertailutestisuureiksi, oissa varianssea SSAB, SSA, ( ( ( ( verrataan rhmien sisäiseen varianssiin N K Kokonaisvarianssi s = SST = ( N N = = = on aina havaintoen k varianssin σ harhaton estimaattori Estimaattorit SSAB, SSA, ( ( ( ( k i ovat harhattomia havaintoen k varianssille σ vain, os nollahpoteesit H AB, H A, H B pätevät Kai Virtanen 5 Varianssianalsitaulukko Vaihtelun Neliö- Vapaus- Varianssi- F-testisuure lähde summa asteet estimaattori A SSA B AB SSAB ( ( äännös N Kokonais- SST N vaihtelu SSA N SSA FA N FB SSAB N F ( ( AB = ( ( N SST N SSAB Neliösummat toteuttavat varianssianalsihaotelman SST = SSA + + SSAB + Vapausasteille pätee: N = K = ( + ( + ( ( + (K Kai Virtanen 6 4

Homma etenee analogisesti ksisuuntaisen varianssianalsin kanssa... Teköiden A a B välillä hdsvaikutus => aetaan rhmät ( kpl esim. Bonferronin menetelmällä (ks. Luento uusiin rhmiin, oissa odotusarvot eivät poikkea toisistaan tilastollisesti merkitsevästi A päävaikutus => Rhmien ( kpl rhmittel odotusarvon suhteen ok B päävaikutus => Rhmien ( kpl rhmittel odotusarvon suhteen ok Bartlettin testillä (ks. Luento voidaan testata rhmäkohtaisten varianssien htäsuurutta Varianssit erisuuria => suhtaudu kriittisesti varianssianalsin tuloksiin Kaksisuuntaisen varianssianalsin testausasetelma voidaan kuvata lineaarisella regressiomallilla os kurssi vielä atkuisi, niin... Kolmesuuntainen varianssianalsi Enemmän neliösummia Kolmen tekän hdsvaikutus, kahden tekän hdsvaikutukset, päävaikutukset m-suuntainen varianssianalsi Vielä enemmän neliösummia m:n tekän hdsvaikutus, m-:n tekän hdsvaikutukset, ne... Kruskal-Wallisin testi Wilcoxonin rankisummatestin (ks. Luento 3 leists useaan rhmään Mediaanien vertaaminen ärestsasteikollinen muuttua (mös välimatka- tai suhdeasteikollinen muuttua ok Kai Virtanen 7 Kai Virtanen 8 5