Mat-.04 Tlastollsen analyysn perusteet, evät 007. luento: Johdatus varanssanalyysn S ysteemanalyysn Laboratoro Ka Vrtanen
Kertaus: ahden rppumattoman otosen t-test () () Perusjouo oostuu ahdesta ryhmästä - Palansaajat: naset ja mehet Havannot noudattavat ummassan ryhmässä normaaljaaumaa - Nasten pala ja mesten pala () Kummastan ryhmästä pomtaan tosstaan rppumattomat ysnertaset satunnasotoset - Valtaan satunasest n nasta ja m mestä (v) Testataan ryhmäohtasten odotusarvojen yhtäsuuruutta - Nollahypotees: nasten esmääränen pala = mesten esmääränen pala S ysteemanalyysn Laboratoro Ka Vrtanen
Varanssanalyysn perusongelma Varanssanalyys ahden rppumattoman otosen t-testn ylestys () Perusjouo oostuu ahdesta ta useammasta ryhmästä - Palansaajat er läänessä () Havannot noudattavat joasessa ryhmässä normaaljaaumaa () Joasesta ryhmästä pomtaan tosstaan rppumattomat ysnertaset satunnasotoset (v) Testataan ryhmäohtasten odotusarvojen yhtäsuuruutta - es.pal. etelä = es.pal. tä = es.pal. läns = jne. Perusjouo vodaan jaaa ryhmn yhden ta useamman tejän perusteella ys tejä => yssuuntanen varanssanalyys m tejää => m-suuntanen varanssanalyys tänään yssuuntanen ja ens volla assuuntanen varanssanalyys S ysteemanalyysn Laboratoro Ka Vrtanen 3
Varanssanalyysn nm Varanssanalyysn nm harhaanjohtava Varanssanalyysssa testataan ryhmäohtasten odotusarvojen yhtäsuuruutta perusjouo jaettu ahteen ta useampaan ryhmään Ryhmäohtasten odotusarvojen yhtäsuuruuden testaamnen perustuu varanssen yhtäsuuruuden testaamseen F-testellä => Varanssanalyys S ysteemanalyysn Laboratoro Ka Vrtanen 4
Mat-.04 Tlastollsen analyysn perusteet, evät 007. luento: Yssuuntanen varanssanalyys S ysteemanalyysn Laboratoro Ka Vrtanen 5
Yssuuntasen varanssanalyysn testausasetelma Tutmusen ohteena oleva perusjouo jaetaan ahteen ta useampaan ryhmään yhden tejän (muuttujan) suhteen Tejällä tasoa => jaossa syntyy pl ryhmä Pomtaan joasesta ryhmästä tosstaan rppumattomat ysnertaset satunnasotoset, otosoot n, n,, n Mertään y j = j. havanto ryhmässä, j =,,, n, =,,, Oletetaan, että E(y j ) = µ, j =,,, n, =,,, alla ryhmän havannolla on sama odotusarvo Oletetaan, että D (y j ) = σ, j =,,,n, =,,, alla havannolla on ryhmästä rppumatta sama varanss varanssen yhtäsuuruutta vodaan testata Bartlettn testllä Testattava oletus: ryhmäohtaset odotusarvot E(y j ) = µ ovat yhtä suura S ysteemanalyysn Laboratoro Ka Vrtanen 6
Yssuuntasen varanssanalyysn nollahypotees Yssuuntanen varanssanalyys tarottaa em. testausasetelman nollahypoteesn H 0 : µ = µ = = µ testaamsta Nollahypoteesn H 0 muaan ryhmäohtaset odotusarvot ovat yhtä suura Nollahypotees H 0 hylätään => ryhmäohtaset odotusarvot eroavat tosstaan anan ahdessa ryhmässä ryhmäohtasa odotusarvoja vodaan verrata (parettan ta) smultaansest tosnsa S ysteemanalyysn Laboratoro Ka Vrtanen 7
n= n + n + L+ n S ysteemanalyysn Laboratoro Erlaset esarvot Havannot y j, j=,,,n, =,,, Ryhmäesarvot n Ryhmä : y, y, K, yn Ryhmä : y = y j n j= Ryhmä : y, y, K, yn n Ryhmä : y = M y n j= Ryhmä : y, y, K, yn M n Ryhmä : y = y n j Nollahypotees H 0 : µ = µ = = µ o = => ryhmäesarvot evät poea ovn paljon tosstaan Yhdstetyn otosen oonasesarvo on y n = n = j = y j j jossa n on havantojen oonasluumäärä, Ka Vrtanen 8 j
Poeamat esarvosta ja varanssanalyysn test S ysteemanalyysn Laboratoro Krjotetaan dentteett jossa y j y = ( y y ) + ( y j y ) y j y = havantoarvon y j poeama oonasesarvosta y y y = ryhmäesarvon y poeama oonasesarvosta y y j y = havantoarvon y j poeama ryhmäesarvosta y Test nollahypoteeslle H 0 : µ = µ = = µ perustuu poeamen ( y y ), ( y y ) nelösummlle j H 0 o => ryhmäesarvot evät poea paljon oonasesarvosta => poeamat y y evät ole tsesarvoltaan ovn suura Ka Vrtanen 9
Koonasnelösumma: SST = ( y y ) n = j= j Nelösummat Yhdstetyn otosen varanss: s y = SST n n = ( y j y ) n = j= Ryhmen välnen vahtelu, ryhmänelösumma: Ryhmen ssänen vahtelu, jäännösnelösumma: Ryhmäohtaset varansst (ryhmävaransst) SSE vodaan esttää myös muodossa S ysteemanalyysn Laboratoro j n j= SSG = ( y y ) = j= = n ( y y ) = n n s = ( y y ), =,,, K Ka Vrtanen 0 n SSE = ( y y ) = = j= SSE = ( n ) s j
Korota dentteett S ysteemanalyysn Laboratoro Varanssanalyyshajotelma potenssn as ja lase yhteen => varanssanalyyshajotelma n n n ( y j y ) = ( y y ) + ( y j y ) = j= = j= = j= el SST = SSG + SSE Koonasnelösumma hajotetaan ahden osatejän summas, jossa osatejä uvaa ryhmen välstä vahtelua ja osatejä uvaa ryhmen ssästä vahtelua y y = ( y y ) + ( y y ) j j SST = ( y y ) n = j= SSG = n ( y y ) = n SSE = ( y y ) = j= j j Ka Vrtanen
Test odotusarvojen yhtäsuuruudelle ja testsuure Ryhmänelösumma SSG suur verrattuna jäännösnelösummaan SSE => nollahypoteesn H 0 : µ = µ = = µ todenperäsyyttä syytä epällä!! F-testsuure: F Havannot normaaljaautuneta & H 0 o => testsuure noudattaa Fshern F-jaaumaa, vapausasteet ( ) ja (n ) Testsuureen normaalarvo on on non ys Suur testsuureen arvo / pen p-arvo = P(F > testsuureen arvo) => H 0 hylyyn S ysteemanalyysn Laboratoro n SSG = SSE n = = n = j= n ( y y ) ( y y ) j Ka Vrtanen
Testsuure Testsuureen tulnta F n SSG = SSE vodaan tulta varanssen vertalutestsuurees, jossa ryhmen välstä varanssa SSG = n ( y y ) = verrataan ryhmen ssäseen varanssn n SSE = ( y j y ) n n = j = S ysteemanalyysn Laboratoro Ka Vrtanen 3
Varanssanalyystauluo Vahtelun Nelö- Vapaus- Varanss- F-testsuure lähde summa asteet estmaattor Ryhmen välnen SSG vahtelu SSG F n SSG = SSE Ryhmen ssänen SSE n vahtelu n SSE Koonasvahtelu SST n n SST Nelösummat toteuttavat varanssanalyyshajotelman SST = SSG + SSE Nelösummen vapausasteet toteuttavat yhtälön n = ( ) + (n ) S ysteemanalyysn Laboratoro Ka Vrtanen 4
Varanssanalyys lneaarsen regressomalln erostapausena Yssuuntasen varanssanalyysn testausastelma vodaan uvata lneaarsella regressomalllla (e vaoselttäjää!) y j = µ z j +... + µ z j + ε j, j =,...,n x -µ : y-muuttujan odotusarvo ryhmässä - y j : y-muuttujan j. havantoarvo (ryhmät yhdstetty!!) - z j : dummy-muuttuja; z j = j. havanto uluu ryhmään ja z j = 0 muuten -ε j : jäännösterm; odotusarvo nolla, vao varanss, orrelomattoma, normaalajaautuneta Regressoertomen PNS-estmaattort = ryhmäohtaset esarvot F-test odotusarvojen yhtäsuuruudelle F-test regressoertomen yhtäsuuruudelle => Sama tulos! S ysteemanalyysn Laboratoro Ka Vrtanen 5
Odotusarvojen vertalu Nollahypotees H 0 : µ = µ = = µ hylyyn => anan as odotusarvosta µ eroaa tlastollsest mertseväst tosstaan H 0 hylätään => varanssanalyys jatuu ryhmttelyllä, jossa selvtetään mssä ryhmssä odotusarvojen erot ovat tlastollsest mertsevä Luonnollnen ajatus: vertallaan a part (µ,µ j ) t-testllä ta erotusen luottamusväln avulla Pareja yhteensä c= ( )/ pl Oloon P(H 0 hylätään erheellsest ysttäsessä testssä)=α Tällön P(H 0 hylätään anan yhdessä testssä, un testejä tehdään c pl)=cα Jos yhdstettyyn vertaluun halutaan rstaso α, nn ysttäset vertalut suortetaan rstasolla α /c!!!!!!! S ysteemanalyysn Laboratoro Ka Vrtanen 6
Bonferronn menetelmä odotusarvojen parvertaluun Odotusarvojen µ ja µ l erotusen luottamusväl, luottamustaso ( α) ( y yl ) ± tα sp + jossa yhdstetty varanss n nl n sp = ( n ) s n ja s = ( y j y ) = n j= Ono nolla luottamusväln ssäpuolella va e Testataan nollahypoteesa H 0 : µ = µ l assuuntasta vahtoehtosta hypoteesa vastaan, mertsevyystaso α Luottamusvält evät smultaansa (osevat van ryhmen ja l odotusarvoja) Smultaansten luottamusvälen onstruomseen erlasa menetelmä Bonferronn menetelmä: äytetään parvertalun em. luottamusvälejä rstaso α luottamustasossa ( α) orvataan penemmällä rstasolla α =α/c, c parvertalujen luumäärä S ysteemanalyysn Laboratoro Ka Vrtanen 7
Bartlettn test varanssen yhtäsuuruudelle Yssuuntasessa varanssanalyysssa oletetaan yhtäsuuret ryhmäohtaset varansst (havannot normaalsa) Bartlettn testn nollahypotees Ryhmäohtaset otosvaransst =,,, Otosvaranssesta lasettu yhdstetty varanss Bartlettn testsuure B=Q/h jossa (logartmt luonnollsa) ja S ysteemanalyysn Laboratoro H : σ = σ = L= σ ( ) log( P ) ( ) log( ) = Q = n s n s h = + 3( ) = n n 0 s n s P = ( ) n = n s = ( y y ) j n j= Ka Vrtanen 8
Bartlettn testn testsuureen jaauma Nollahypotees o => Bartlettn testsuure noudattaa suurssa otosssa approsmatvsest χ -jaaumaa, vapausasteet ( ) Testsuureen normaalarvo on - Suur testsuureen arvo / pen p-arvo = P(χ > testsuureen arvo) => nollahypotees hylätään => varansst eroavat tosstaan anan ahdessa ryhmässä Ersuuret varansst => varanssanalyysn antamaan tuloseen on syytä suhtautua aateemsen rttsest!! S ysteemanalyysn Laboratoro Ka Vrtanen 9