Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen Kaksisuuntaisen varianssianalsin perusasetelma aetaan perusoukko rhmiin kahden tekän A a B suhteen Tekällä A tasoa a tekällä B tasoa => rhmiä kpl Poimitaan okaisesta rhmästä toisistaan riippumattomat ksinkertaiset satunnaisotokset, otoskoko K k = k. havainto tekän A tason i a tekän B tason määräämässä rhmässä, k=,,k; i=,,; =,, Oletetaan E( k = µ : tekän A tason i a tekän B tason määräämän rhmän havainnoilla on sama odotusarvo Oletetaan D ( k = σ : kaikilla havainnoilla on rhmästä riippumatta sama varianssi Kaksisuuntaisessa varianssianalsissa testataan oletusta rhmäkohtaisten odotusarvoen htäsuuruudesta Testausongelma monimutkaisempi kuin ksisuuntaisessa varianssianalsissa teköiden A a B välillä voi olla ns. interaktiota eli hdsvaikutusta Kai Virtanen Kaksisuuntaisen varianssianalsin nollahpoteesit Kaksisuuntaisessa varianssianalsissa on 3 kpl nollahpoteesea Testataan teköiden A a B hdsvaikutuksen nollahpoteesia: H AB : Ei hdsvaikutusta Nollahpoteesi H AB ok => rhmitksiä teköiden A a B suhteen voidaan tarkastella erillisinä Testataan tekän A päävaikutuksen nollahpoteesia: H A : Ei A-vaikutusta Testataan tekän B päävaikutuksen nollahpoteesia: H B : Ei B-vaikutusta Nollahpoteesit H A a H B ovat ksisuuntaisen varianssianalsin nollahpoteesea Huom! Vaikka teköiden välillä olisi hdsvaikutus, kannattaa tutkia mös päävaikutuksia!! Kai Virtanen 3 Rhmäkeskiarvot a kokonaiskeskiarvo Havaintoen k rhmäkeskiarvot tekän A tason i a tekän B tason määräämässä rhmässä: K =, i=,, K,, =,, K, K k = H AB, H A a H B ok => rhmäkeskiarvot eivät poikkea todennäköisesti kovin palon toisistaan Yhdistetn otoksen kokonaiskeskiarvo: ossa N = K on havaintoen kokonaislukumäärä Kokonaiskeskiarvo on rhmäkeskiarvoen keskiarvo: k K k N k = i = = = i = = = Kai Virtanen 4
Reunakeskiarvot Marginaali- eli reunakeskiarvot: K i= k, i=,, K, K k= = K = k, =,, K, K k= i= Reunakeskiarvo i on havaintoen k keskiarvo tekän A määrämässä rhmässä i, kun B-rhmitstä ei oteta huomioon Reunakeskiarvo on havaintoen k keskiarvo tekän B määrämässä rhmässä, kun A-rhmitstä ei oteta huomioon Reunakeskiarvot voidaan määritellä rhmäkeskiarvoen avulla: i=, i=,, K, = =, =,, K, i= Kai Virtanen 5 Kiroitetaan identiteetti Poikkeamat keskiarvoista = ( + ( i + ( + i + ( Kaksisuuntaisen varianssianalsin testit nollahpoteeseille H AB, H A a H B perustuvat eo. poikkeamien neliösummille Kai Virtanen 6 Poikkeamat a varianssianalsin testit Testi nollahpoteesille H AB : Ei hdsvaikutusta perustuu poikkeamien ( neliösummille i +, ( H AB ok => erotukset ( i + eivät ole todennäköisesti itseisarvoiltaan kovin suuria Testi nollahpoteesille H A : Ei A-vaikutusta perustuu poikkeamien (, ( neliösummille i H A ok => erotukset ( i eivät ole todennäköisesti itseisarvoiltaan kovin suuria Testi nollahpoteesille H B : Ei B-vaikutusta perustuu poikkeamien (, ( neliösummille H B ok => erotukset ( eivät ole todennäköisesti itseisarvoiltaan kovin suuria Kai Virtanen 7 Kokonaisneliösumma a päävaikutusten neliösumma Havaintoen kokonaisavaihtelua kuvaava kokonaisneliösumma: hdistetn otoksen varianssi on s = SST N ossa N = K on havaintoen kokonaislukumäärä Tekän A päävaikutusta kuvaava neliösumma: Tekän B päävaikutusta kuvaava neliösumma: K SST = ( k= i= = k i i= = SSA= K ( = K ( Kai Virtanen 8
Yhdsvaikutuksen neliösumma a äännösneliösumma Teköiden A a B hdsvaikutusta kuvaava neliösumma: ( i i= = SSAB = K + Rhmien sisäistä vaihtelua kuvaava äännösneliösumma: K = ( k= i= = äännösneliösumman lauseke voidaan esittää mös muodossa = ( K s ossa havaintoen k rhmävarianssit saadaan lausekkeista K s = ( k K k= i=,, K, ; =,, K, k i= = Kai Virtanen 9 Korota identiteetti Varianssianalsihaotelma potenssiin kaksi a laske hteen => varianssianalsihaotelma = ( + ( i oka voidaan esittää muodossa SST = SSA + + SSAB + + ( + i + ( ( = ( + ( i + ( + + ( i Kai Virtanen 0 Varianssianalsihaotelman tulkinta Varianssianalsihaotelmassa SST = SSA + + SSAB + kokonaisneliösumma SST = ( on haotettu nelän osatekän summaksi, ossa osatekä SSAB = K ( + kuvaa teköiden A a B hdsvaikutusta, osatekät SSA= K ( = K ( i kuvaavat teköiden A a B päävaikutuksia a osatekä kuvaa rhmien sisäistä vaihtelua i = ( Testi hdsvaikutukselle os teköiden A a B hdsvaikutusta kuvaava neliösumma SSAB= K ( + i on suuri verrattuna rhmien sisäistä vaihtelua kuvaavaan äännösneliösummaan = ( => nollahpoteesi H AB : Ei hdsvaikutusta on asetettava kseenalaiseksi F-testisuure (Fisherin F-akauma, vapausasteet ( ( a (N N SSAB FAB ( ( Testisuureen normaaliarvo on (suurille N on noin ksi Suuri testisuureen arvo / pieni p-arvo=p(f > testisuureen arvo => H AB hlätään Kai Virtanen Kai Virtanen 3
Testi A-vaikutukselle os tekän A päävaikutusta kuvaava neliösumma SSA= K ( on suuri verrattuna rhmien sisäistä vaihtelua kuvaavaan äännösneliösummaan = ( => nollahpoteesi H A : Ei A-vaikutusta on asetettava kseenalaiseksi F-testisuure (Fisherin F-akauma, vapausasteet ( a (N N SSA FA Testisuureen normaaliarvo on (suurille N on noin ksi Suuri testisuureen arvo / pieni p-arvo=p(f > testisuureen arvo => H A hlätään i Kai Virtanen 3 Testi B-vaikutukselle os tekän B päävaikutusta kuvaava neliösumma = K ( on suuri verrattuna rhmien sisäistä vaihtelua kuvaavaan äännösneliösummaan = ( => nollahpoteesi H B : Ei B-vaikutusta on asetettava kseenalaiseksi F-testisuure (Fisherin F-akauma, vapausasteet ( a (N N FB Testisuureen normaaliarvo on (suurille N on noin ksi Suuri testisuureen arvo / pieni p-arvo=p(f > testisuureen arvo => H B hlätään Kai Virtanen 4 Testisuureiden tulkinnat Testisuureet F AB, F A, F B voidaan tulkita varianssien vertailutestisuureiksi, oissa varianssea SSAB, SSA, ( ( ( ( verrataan rhmien sisäiseen varianssiin N K Kokonaisvarianssi s = SST = ( N N = = = on aina havaintoen k varianssin σ harhaton estimaattori Estimaattorit SSAB, SSA, ( ( ( ( k i ovat harhattomia havaintoen k varianssille σ vain, os nollahpoteesit H AB, H A, H B pätevät Kai Virtanen 5 Varianssianalsitaulukko Vaihtelun Neliö- Vapaus- Varianssi- F-testisuure lähde summa asteet estimaattori A SSA B AB SSAB ( ( äännös N Kokonais- SST N vaihtelu SSA N SSA FA N FB SSAB N F ( ( AB = ( ( N SST N SSAB Neliösummat toteuttavat varianssianalsihaotelman SST = SSA + + SSAB + Vapausasteille pätee: N = K = ( + ( + ( ( + (K Kai Virtanen 6 4
Homma etenee analogisesti ksisuuntaisen varianssianalsin kanssa... Teköiden A a B välillä hdsvaikutus => aetaan rhmät ( kpl esim. Bonferronin menetelmällä (ks. Luento uusiin rhmiin, oissa odotusarvot eivät poikkea toisistaan tilastollisesti merkitsevästi A päävaikutus => Rhmien ( kpl rhmittel odotusarvon suhteen ok B päävaikutus => Rhmien ( kpl rhmittel odotusarvon suhteen ok Bartlettin testillä (ks. Luento voidaan testata rhmäkohtaisten varianssien htäsuurutta Varianssit erisuuria => suhtaudu kriittisesti varianssianalsin tuloksiin Kaksisuuntaisen varianssianalsin testausasetelma voidaan kuvata lineaarisella regressiomallilla os kurssi vielä atkuisi, niin... Kolmesuuntainen varianssianalsi Enemmän neliösummia Kolmen tekän hdsvaikutus, kahden tekän hdsvaikutukset, päävaikutukset m-suuntainen varianssianalsi Vielä enemmän neliösummia m:n tekän hdsvaikutus, m-:n tekän hdsvaikutukset, ne... Kruskal-Wallisin testi Wilcoxonin rankisummatestin (ks. Luento 3 leists useaan rhmään Mediaanien vertaaminen ärestsasteikollinen muuttua (mös välimatka- tai suhdeasteikollinen muuttua ok Kai Virtanen 7 Kai Virtanen 8 5