on tavanomainen yhden selittäjän lineaarinen regressiomalli, jossa jäännöstermit ε i toteuttavat seuraavat oletukset:

Samankaltaiset tiedostot
Mat Koesuunnittelu ja tilastolliset mallit. Yhden selittäjän lineaarinen regressiomalli. Avainsanat:

1. PARAMETRIEN ESTIMOINTI

Mat Tilastollisen analyysin perusteet, kevät 2007

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 6

Tilastollinen riippuvuus ja korrelaatio

Testaa onko lämpökäsittelyllä vaikutusta tankojen keskimääräiseen vetolujuuteen.

7.5. Yleinen lineaarinen malli ja suurimman uskottavuuden menetelmä

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslaskenta B 8. harjoitukset / Ratkaisut Aiheet: Otos ja otosjakaumat Avainsanat:

Mat Sovellettu todennäköisyyslasku A

2-suuntainen vaihtoehtoinen hypoteesi

Varianssianalyysi. Varianssianalyysi. Varianssianalyysi. Varianssianalyysi: Mitä opimme? Varianssianalyysi: Johdanto

= E(Y 2 ) 1 n. = var(y 2 ) = E(Y 4 ) (E(Y 2 )) 2. Materiaalin esimerkin b) nojalla log-uskottavuusfunktio on l(θ; y) = n(y θ)2

Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio: Esitiedot

MTTTP1 SELITYKSIÄ JA ESIMERKKEJÄ KAAVAKOKOELMAN KAAVOIHIN LIITTYEN

Tilastolliset menetelmät: Lineaarinen regressioanalyysi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 5 Aiheet: Tilastolliset testit Avainsanat:

Mat Koesuunnittelu ja tilastolliset mallit

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

Muuttujien välisten riippuvuuksien analysointi

Tilastolliset menetelmät: Otokset, otosjakaumat ja estimointi. 4. Otokset ja otosjakaumat 5. Estimointi 6. Estimointimenetelmät 7.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

1.4. Aritmeettisen keskiarvon otosjakauma: Suurten otosten tuloksia

1. (Monisteen teht. 5.16) Eräiden kuulalaakereiden kestoa (miljoonaa kierrosta) on totuttu kuvaamaan Weibull-jakaumalla, jonka tiheysfunktio on

13. Lineaariset ensimmäisen kertaluvun differentiaalisysteemit

Tilastollinen päättely. 3. Piste-estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet

Ilkka Mellin (2008) 1/24

ε i = jäännös- eli virhetermin ε satunnainen ja ei-havaittu arvo havaintoyksikössä i

1.2. Aritmeettisen keskiarvon ja otosvarianssin otosjakaumat: Odotusarvot ja varianssit

Generoidaan tiedostoon BINORM satunnaislukuja jakaumasta N(0,1) muuttujiksi U, V: (U, V): N 2 (0, 0, 1, 1, 0)

Suoran sovittaminen pistejoukkoon

Tilastollinen päättely. 3. Piste estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava: Esitiedot

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 7B Ratkaisuehdotuksia.

Moniulotteiset jakaumat ja havaintoaineistot

Mat Tilastollinen päättely 7. harjoitukset / Tehtävät. Hypoteesien testaus. Avainsanat:

Konvergenssikäsitteet ja raja-arvolauseet. Konvergenssikäsitteet ja raja-arvolauseet. Konvergenssikäsitteet ja raja-arvolauseet: Mitä opimme?

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 7: Lagrangen kertojat. Pienimmän neliösumman menetelmä.

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

Kaksisuuntainen varianssianalyysi. Kaksisuuntainen varianssianalyysi. Kaksisuuntainen varianssianalyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

Yhden selittäjän lineaarinen regressiomalli: Lisätiedot. Yhden selittäjän lineaarinen regressiomalli

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 6

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Tilastollinen päättely. 4. Hypoteesien testaus Johdanto Testien konstruointi Testien vertailu

Olkoon R S otosavaruuksien R ja S karteesinen tulo: Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan:

Tilastollinen päättely. 2. Datan redusoinnin periaatteet Tyhjentävyys Uskottavuus

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin. Sovellettu todennäköisyyslasku: Kaavat ja taulukot

Tilastollisten aineistojen kerääminen ja mittaaminen Tilastolliset aineistot

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Ratkaisu: Kaikki tehtävän laskutoimitukset on tehty Microsoft Excel -ohjelmalla; ks. taulukkoa tehtävän lopussa.

Tilastollinen päättely. 4. Hypoteesien testaus Johdanto Testien konstruointi Testien vertailu

Tilastollinen päättely. 2. Datan redusoinnin periaatteet Tyhjentävyys Uskottavuus

Väliestimointi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 6

Tilastolliset menetelmät: Lineaarinen regressioanalyysi

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

Yhden selittäjän lineaarinen regressiomalli

4. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

1. Luvut 1, 10 on laitettu ympyrän kehälle. Osoita, että löytyy kolme vierekkäistä

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Luento 6 Luotettavuus Koherentit järjestelmät

Regressioanalyysi. Kuusinen/Heliövaara 1

3. Datan käsittely lyhyt katsaus

Tilastolliset menetelmät: Otokset, otosjakaumat ja estimointi

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Menestyminen valintakokeissa ja todennäköisyyslaskussa

Yleinen lineaarinen malli. Yleinen lineaarinen malli. Yleinen lineaarinen malli: Mitä opimme? 2/4. Yleinen lineaarinen malli: Mitä opimme?

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Moniulotteisia todennäköisyysjakaumia

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Mat Tilastollisen analyysin perusteet, kevät 2007

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

5. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

3.5 Generoivat funktiot ja momentit

Monimuuttujamenetelmät: Multinormaalijakauma. Ilkka Mellin. 1. Multinormaalijakauma ja sen ominaisuudet

Estimointi. Vilkkumaa / Kuusinen 1

8. laskuharjoituskierros, vko 11, ratkaisut

Satunnaismuuttujien muunnokset ja niiden jakaumat. Satunnaismuuttujien muunnokset ja niiden jakaumat

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Turingin kone on kuin äärellinen automaatti, jolla on käytössään

Transkriptio:

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset / Ratkasut Aheet: Avasaat: Yhde selttäjä leaare regressomall Ylee leaare mall Artmeette keskarvo, Estmot, F-jakauma, F-test, F-testsuure, Hajotakuvo, Hpotees, Jääöselösumma, Jääösterm, Jääösvahtelu, Kokoasvahtelu, Korrelaato, Kovarass, Krtte raja, Kulmakerro, Leaare regressomall, Luottamuskerro, Luottamustaso, Luottamusväl, Mallelösumma, Matrs, Nelösumma, Merktsevs taso, Nollahpotees, Otostuusluku, p-arvo, Pemmä elösumma meetelmä, Pstedagramm, Regressokerro, Regressosuora, Resduaal, Seltettävä muuttuja, Selttäjä, Selttävä muuttuja, Selts, Seltsaste, Sovte, Stadardpokkeama, t-jakauma, t-test, t-testsuure, Test, Testsuure, Vahtoehtoe hpotees, Varass, Varassaalshajotelma, Vrheterm Tehtävä 5.. Oletetaa, että β0 + β + ε,,,, o tavaomae hde selttäjä leaare regressomall, jossa jääöstermt ε toteuttavat seuraavat oletukset: () E( ε ) 0,,,, () Var( ε ) σ,,,, (3) ε, ε,, ε ovat korrelomattoma el Olkoo Cor( ε, ε j) 0, j s b s ( )( ) ( ) parametr β el regressosuora kulmakertome pemmä elösumma (PNS-) estmaattor ja olkoo seltettävä muuttuja havattuje arvoje artmeette keskarvo. Osota, että Cov( b, ) 0 Tehtävä 5.. Mtä opmme? Tehtävässä tarkastellaa regressosuora kulmakertome PNS-estmaattor stokastsa omasuuksa. TKK @ Ilkka Mell (005) /3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Tehtävä 5.. Ratkasu: Huomaa, että jääöstermejä ε koskevasta oletuksesta () seuraa, että E( ) E( β + β + ε ) 0 β + β + E( ε ) 0 β + β,,,, 0 Satuasmuuttuja odotusarvo muodostaa hde selttäjä leaarse regressomall rakeeosa. Merktää E( ) β + β µ,,,, 0 Jääöstermejä ε koskevsta oletukssta () ja (3) seuraa, että Cov(, j) E ( E( ))( j E( j)) E ( µ )( j µ j) E( εε ) j 0, j Cov( ε, ε j) σ, j Ste satuasmuuttujat (seltettävä muuttuja havatut arvot),,,, ovat korrelomattoma satuasmuuttuja. Todetaa seuraavaks, että satuasmuuttujat ja b vodaa esttää satuasmuuttuje (seltettävä muuttuja havattuje arvoje),,,, leaarkombaatoa. Artmeettse keskarvo ests seltettävä muuttuja havattuje arvoje,,,, leaarkombaatoa: u jossa paokertomet u,,,, ovat e-satuasa vakota. TKK @ Ilkka Mell (005) /3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Regressosuora kulmakertome b ests seltettävä muuttuja havattuje arvoje,,,, leaarkombaatoa: jossa paokertomet ( )( ) ( ) b ( ) ( ) ( ) v,,,, ( ) ovat e-satuasa vakota. Regressokerrota b koskevaa tulosta johdettaessa o kätett hväks stä, että koska v ( )( ) ( ) ( ) ( ) ( ) ( ) 0 ( ) ( ) 0 Kättäe hväks satuasmuuttuje ja b estsmuotoja satuasmuuttuje,,,, leaarkombaatoa ja odotusarvo-operaattor E( ) leaarsuutta ähdää, että ja jossa ss E( ) u E( ) u µ E( b) v E( ) v 0 µ µ E( ) β + β,,,, TKK @ Ilkka Mell (005) 3/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Yllä estetstä seuraa, että Edellä todett, että [ ] Cov( b, ) E ( E( ))( b E( b)) E u uµ v vµ E u( µ ) v( µ ) E uv j( µ )( j µ j) j uv je ( µ )( j µ j) j uv E j ( E( ))( j E( j)) j j 0, j Cov(, j) σ, j uv Cov(, ) j j Ste seltettävä muuttuja havattuje arvoje artmeettse keskarvo ja regressokertome β PNS-estmaattor b kovarass o Cov( b, ) uvcov(, ) j σ uv Var( ) σ j j uv ( ) σ ( ) ( ) σ 0 0 ( ) TKK @ Ilkka Mell (005) 4/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Tämä perustuu she, että edellä todett, että ( ) 0 Olemme ss todstaeet, että seltettävä muuttuja havattuje arvoje artmeette keskarvo ja regressokertome β PNS-estmaattor b ovat korrelomattoma satuasmuuttuja. TKK @ Ilkka Mell (005) 5/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Tehtävä 5.. Tarkastellaa seuraavaa havatoaestoa: (a) (b) 95 0 8 4 45 40 85 90 05 08 6 0 8 55 58 78 59 84 Prrä havatoaestosta pstedagramm (hajotakuvo). Sovta havatoaestoo hde selttäjä leaare regressomall β0 + β + ε,,,, pemmä elösumma meetelmää kättäe. (c) Muodosta 99 %: luottamusväl parametrlle β. (d) (e) (f) Testaa ollahpoteesa H 0 : β 0 t-testä kättäe, ku merktsevstasoa o 0.0 ja vahtoehtosea hpoteesa o H : β 0 Testaa ollahpoteesa H 0 : β 0 estmodu mall seltsasteesee R perustuvaa F-testä kättäe, ku merktsevstasoa o 0.0 ja vahtoehtosea hpoteesa o H : β 0 Vertaa kohte (c), (d) ja (e) tuloksa tossa. Oletamme, että mall toteuttaa s. stadardoletukset. Tehtävä 5.. Mtä opmme? Tehtävässä tarkastellaa hde selttäjä leaarse regressomall el regressosuora kulmakerrota koskevaa tlastollsta päättelä: () () Mte kulmakerro estmodaa PNS-meetelmällä? Mte kulmakertomelle kostruodaa luottamusväl? () Mte kulmakertome arvoa koskeva hpoteeseja testataa t-testllä ta F-testllä. TKK @ Ilkka Mell (005) 6/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Tehtävä deaa o havaollstaa stä, mte luottamusväl, t-test ja F-test kättö regressosuora kulmakerrota koskevssa testessä johtavat samaa tuloksee, ku luottamustaso ja teste merktsevstasot valtaa sopvalla tavalla. Yhde selttäjä leaare regressomall lee muoto o jossa β0 + β + ε,,,, seltettävä muuttuja satuae ja havattu arvo havatokskössä selttäjä (selttävä muuttuja) e-satuae ja havattu arvo havatokskössä ε jääös- el vrheterm satuae ja e-havattu arvo havatokskössä β 0 e-satuae ja tutemato vako (vakoselttäjä regressokerro) β selttäjä e-satuae ja tutemato regressokerro Mall jääöstermstä tehdää seuraavat stokastset oletukset: () ε, ε,, ε ovat rppumattoma () ε σ N(0, ),,,, Jos mall selttäjä arvot ovat satuasa, korvataa jääöstermä ε koskeva oletus () llä estetssä s. stadardoletuksssa seuraavalla oletuksella: () ε σ N(0, ),,,, Oletus () tarkottaa, että satuasmuuttuja ε ehdolle jakauma ehdolla o ormaale. Mall β0 + β + ε,,,, regressokertome β 0 ja β pemmä elösumma (PNS-) estmaattort saadaa kaavolla b b 0 s s b r s s Regressokertome estmaattorede kaavossa ja TKK @ Ilkka Mell (005) 7/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset s s ( ) ( s ( )( ) r s ss ) Jos regressokertomet joudutaa laskemaa käs ta laskmella, laskutomtukset kaattaa järjestää seuraava tauluko muotoo: ˆ e e ˆ e e ˆ e e # # # # # # # # # ˆ e e Sum e e Huomaa, että samaa taulukkoo kaattaa laskea mös estmodu mall sovtteet resduaalt e (ks. määrtelmä alla) sekä resduaale elösumma. Artmeettset keskarvot ja, otosvarasst s ja s sekä otoskovarass s saadaa llä oleva tauluko sarakesummsta kaavolla s s s josta regressokertome estmaatt saadaa ss lasketuks kaavolla s b s b b 0 ˆ ja TKK @ Ilkka Mell (005) 8/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Estmodu mall sovtteet saadaa kaavalla ˆ b + b,,,, 0 ja resduaalt kaavalla e ˆ b b,,,, 0 Estmodu mall seltsaste vodaa laskea kaavolla jossa R SSE SSM [Cor(, ˆ)] SST SST SSE e o estmodu mall jääöselösumma (resduaale elösumma) SST ( ) ( ) s o seltettävä muuttuja arvoje vahtelua kuvaava kokoaselösumma ja SSM SST SSE ( ˆ ) o estmodu mall mallelösumma. Seltsastee määrtelmä perustuu she, että (koska mallssa o mukaa vakoterm) aa pätee s. varassaalshajotelma SST SSM + SSE jossa mallelösumma SSM kuvaa stä osaa seltettävä muuttuja arvoje kokoasvahtelusta, joka mall o selttät ja jääöselösumma SSM kuvaa stä osaa seltettävä muuttuja arvoje kokoasvahtelusta, jota mall e ole selttät. Huomaa, että hde selttäjä leaarse regressomall tapauksessa pätee R r Vodaa osottaa, että s SSE e o jääösvarass σ harhato estmaattor. TKK @ Ilkka Mell (005) 9/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Parametr β luottamusväl luottamustasolla ( α) o muotoa ± b ˆD( tα / b) jossa ± t α / ovat luottamustasoo ( α) lttvät luottamuskertomet ja e s SSE /( ) b ( ) s ( ) ( ) ˆD ( ) o regressokertome β PNS-estmaattor b varass harhato estmaattor. Luottamuskertomet ±t α / määrätää ste, että jossa Pr( t t ) α / α / Pr( t + t ) α / α / t t( ) Ste luottamuskertomet ± t α / toteuttavat htälö Pr( t t + t ) α / α / α Oletetaa, että haluamme testata ollahpoteesa H 0 : β 0 Test vodaa perustaa t-testsuureesee t b ˆD( b ) jossa D( ˆ b ) o määrtelt edellä. Jos ollahpotees H0 pätee, testsuure t oudattaa Studet t-jakaumaa vapausaste ( ): t H t( ) 0 Testsuuree t ormaalarvo (odotusarvo ollahpotees pätessä) 0. Ste tsesarvoltaa suuret testsuuree arvot johtavat ollahpotees hlkäämsee. Valtaa test merktsevstasoks α. Test hlkäsalue määrätää täsmällee samalasella tekkalla ku tavaomase ormaaljakauma odotusarvoa koskeva t-test htedessä pats, että t-jakauma vapausastede lukumäärä o tässä ( ). TKK @ Ilkka Mell (005) 0/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Oletetaa, että vahtoehtoe hpotees o kakssuutae: H : β 0 Valtaa krttset rajat t α/ ja +t α/ ste, että jossa Pr( t t ) α / α / Pr( t + t ) α / α / t t( ) Valtaa test hlkäsalueeks (, t ) ( + t, + ) α / α / jollo test hväksmsalueea o suljettu väl [ t, + t α / α / ] Todeäköss, että testsuuree t arvo joutuu hlkäsalueelle ollahpotees pätessä o ss α, mkä merktsee stä, että hlkäsvrhee el I laj vrhee todeäköss testssä o α. Mös test p-arvo määrätää tavaomasee tapaa. Oletetaa, että vahtoehtoe hpotees o kakssuutae: H : β 0 Olkoo testsuuree t havattu arvo t *. Tällö test p-arvo o jossa p Pr( t > t ) t t( ) Todeäköss, että testsuure t saa ollahpotees pätessä (testsuuree ormaalarvoo ähde) pokkeuksellsempa arvoja ku t * o ss p. Test ollahpoteeslle H 0 : β 0 vodaa hde selttäjä regressomall tapauksessa perustaa mös F-testsuureesee R SST SSE F ( ) ( ) R SSE Jos ollahpotees H 0 pätee, testsuure F oudattaa Fsher F-jakaumaa vapausaste ja ( ): F H F(, ) 0 Testsuuree F ormaalarvo (odotusarvo ollahpotees pätessä) 0. Ste tsesarvoltaa suuret testsuuree arvot johtavat ollahpotees hlkäämsee. TKK @ Ilkka Mell (005) /3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Oletetaa, että haluamme testata ollahpoteesa H 0 : β 0 kakssuutasta vahtoehtosta hpoteesa H : β 0 vastaa kättäe samaa merktsevstasoa α. Tällö llä estett t-test ja F-test ovat tässä hde selttäjä leaarse regressomall tapauksessa ekvvaletteja el e hlkäävät ollahpotees H 0 täsmällee samossa tlatessa. Huomaa, että llä estett t- (ta F-) test, jossa merktsevstasoks o valttu α, o ekvvalett mös sellase testausmeettel kassa, jossa ollahpotees H 0 : β 0 hlätää, jos parametr β luottamustasoa ( α) vastaava luottamusväl e petä lukua olla. Tehtävä 5.. Ratkasu: (a) 00 60 0 80 80 0 60 00 40 (b) Ecel-taulukko tehtävä havatoaestosta: Sovte Res Res 95 08 905 664 060 06.97.80833 3.70058 0 6 00 5876 3860 5.065 0.8935 8.66876 3 8 0 394 0404 036 9.860-7.8605 39.0698 4 4 5376 464 5004 3.470 -.4697 5.89087 5 45 8 05 394 70 35.9077-7.9077 30.68593 6 40 55 9600 405 700 3.936.06390 486.85580 7 85 58 345 4964 930 59.6805 -.68053.8497 8 90 78 3600 3684 3380 6.65 5.34786 35.556857 9 05 59 405 58 3595 7.5669 -.56695 57.98 0 84 4984 33856 40848 8.6704.3960 5.47030 Yht 534 409 5684 0639 6463 409.0000 0.00000 656.0838 TKK @ Ilkka Mell (005) /3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Taulukosta saadaa: Ste 534 53.4 0 409 40.9 0 s 5684 534 99.8 0 0 s 0639 409 865.656 0 0 s 6463 534 409 46.93 0 0 s 46.93 b 0.5943 99.8 s b b 40.9 0.5943 53.4 49.73 0 Taulukkoo o laskettu mös estmodu mall sovtteet ja resduaalt ja de summat; esmerkks jollo ˆ 49.73 + 0.5943 0 5.065 e ˆ 6 5.065 0.8935 (c) Määrätää parametrlle β luottamusväl luottamustasolla 0.99. Luottamustasoa 0.99 vastaavks luottamuskertomks ±t 0.005 saadaa t-jakauma taulukosta ±3.355 Luottamuskertomet ±t 0.005 ±3.355 toteuttavat ss htälöt ja Pr( t 3.355) 0.005 Pr( t + 3.355) 0.005 Pr( 3.355 t + 3.355) 0.99 jossa t oudattaa t-jakaumaa vapausaste 0 8: t t(8) TKK @ Ilkka Mell (005) 3/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Jääösvarass σ estmaatks saadaa s SSE 656.08 07.00 0 e Ste PNS-estmaattor b varass estmaatks saadaa s 07.00 ˆD ( b ) 0.099 ( ) s (0 ) 99.8 jote regressokertome β PNS-estmaattor b keskvrheeks tulee ˆD( b ) 0.0973 Regressokertome β luottamustasoa 0.99 vastaava luottamusvälks saadaa ste b ± t ˆD( b) 0.5943± 3.355 0.0973 α / 0.5943± 0.36675 (0.8,0.960) (d) Olkoo ollahpoteesa H 0 : β 0 ja vahtoehtosea hpoteesa H : β 0 Valtaa merktsevstasoks α 0.0. t-testsuuree arvoks saadaa t b 0.5943 D( ˆ b ) 0.0973 5.44383 jossa regressokertome β PNS-estmaattor b keskvrhe kohdassa. ˆD( b ) o laskettu (c)- Merktsevstasoa α 0.0 vastaavks krttsks rajoks ±t 0.005 saadaa t-jakauma taulukosta ±3.355 Krttset rajat ±t 0.005 ±3.355 toteuttavat ss htälöt ja Pr( t 3.355) 0.005 Pr( t + 3.355) 0.005 Pr( 3.355 t + 3.355) 0.99 jossa t oudattaa t-jakaumaa vapausaste 0 8: t t(8) TKK @ Ilkka Mell (005) 4/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Test hlkäsalue o muotoa (, 3.355) ( + 3.355, + ) jote test hväksmsalue o suljettu väl Koska [ 3.355, + 3.355] t 5.444 > 3.355 t-testsuuree arvo o joutuut hlkäsalueelle ja ollahpotees hlätää merktsevstasolla α 0.0. (e) Olkoo ollahpoteesa H 0 : β 0 ja vahtoehtosea hpoteesa H : β 0 Valtaa merktsevstasoks α 0.0. Määrätää F-testsuuree arvo kaavalla SST SSE F ( ) SSE Kokoaselösumma SST o SST s ( ) (0 ) 865.656 7790.9 ja jääöselösumma o Ste SSE e 656.08 SST SSE 7790.9 656.08 F ( ) (0 ) 9.6353 SSE 656.08 Merktsevstasoa α 0.0 vastaavaks krttsks rajaks F 0.0 saadaa F-jakauma taulukosta.59 Krtte raja F 0.0.59 toteuttaa ss htälö ja Pr( F.59) 0.0 Pr( F.59) 0.99 jossa F oudattaa F-jakaumaa vapausaste ja 0 8: F F(,8) TKK @ Ilkka Mell (005) 5/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Test hlkäsalue o muotoa (.59, ) jote test hväksmsalue o suljettu väl Koska [ 0,.59] t 9.635 >.59 F-testsuuree arvo o joutuut hlkäsalueelle ja ollahpotees hlätää merktsevstasolla α 0.0. (f) Kohte (d) ja (e) testt ovat ekvvaletteja el e johtavat ollahpotees hlkäämsee täsmällee samossa tlatessa. Tämä ähdää stä, että testsuurede arvoje välllä pätee htälö t 5.44383 9.6353 F ja lsäks teste krttste arvoje välllä pätee htälö t 3.55.59 F 0.005 0.0 Teoreettsea perustelua tälle havaolle o se lee tosasa, että t F ja käätäe jossa F t t t( df) F F(, df) Oletetaa t, että kohda (c) luottamusvälä kätetää testaamsee seuraavalla tavalla: Hlätää ollahpotees H 0 : β 0, jos parametr β luottamustasoa ( α) vastaava luottamusväl e petä lukua olla. Tämä meettel o ekvvalett kohte (d) ja (e) teste kassa, mkä ähdää helpost todeks stä, että luottamustasoo ( α) lttvät luottamuskertomet ovat samat ku merktsevstasoo α lttvät krttset rajat kohda (d) t-testssä. Huomaa, että ekvvaless vaat stä, että testessä kätetää vahtoehtosea hpoteesa kakssuutasta vahtoehtosta hpoteesa H : β 0 TKK @ Ilkka Mell (005) 6/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Statst-ohjelma tuottaa tehtävä 5.. aestosta seuraava tulostukse: UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF Y PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P --------- ----------- --------- ----------- ------ CONSTANT 49.73 7.354.87 0.00 X 0.5943 0.097 5.44 0.0006 R-SQUARED 0.7874 ADJUSTED R-SQUARED 0.7609 RESID. MEAN SQUARE (MSE) 07.00 STANDARD DEVIATION 4.3879 SOURCE DF SS MS F P ---------- --- ------- -------- ----- ------ REGRESSION 634.8 634.8 9.64 0.0006 RESIDUAL 8 656.08 07.00 TOTAL 9 7790.90 CASES INCLUDED 0 MISSING CASES 0 TKK @ Ilkka Mell (005) 7/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Tehtävä 5.3. Tarkastellaa harjotustehtävä 4.4. aestoa. Aesto ol saatu tutkmuksesta, jossa kästelt eerga kulutukse ja kottaloude tulotaso välstä htettä. Seuraavassa taulukossa o aettu kottaloude tulotaso muuttujaa (kskkö: 000 $ per vuos) ja eerga kulutus muuttujaa (kskkö: 0 8 Btu per vuos): Eerga kulutus Kottaloude tulotaso.8 0.0 3.0 30.5 4.8 40.0 5.0 55. 6.5 60.3 7.0 74.9 9.0 88.4 9. 95. Tarkastellaa hde selttäjä leaare regressomall regressokertome estmota matrskaavo, ku seltettävää muuttuja o eerga kulutus ( ) ja selttäjä o tulotaso ( ) ja vakoterm. (a) Aa matrst ja X. (b) (c) Laske X X. Laske X. (d) Laske (X X). (e) Laske regressokertome β 0 ja β PNS-estmaatt matrsalgebra avulla. Tehtävä 5.3. Mtä opmme? Tehtävässä tarkastellaa leaarse regressomall ja mall regressokertome muodostama vektor PNS-estmaattor matrsestksä. Tarkastelussa kätetää esmerkkä hde selttäjä leaarsta regressomalla el regressosuoraa. TKK @ Ilkka Mell (005) 8/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Ylee leaare mall β0 + β + β + $ + βpp + ε,,,, vodaa esttää matrse muodossa Xβ + ε jossa # o seltettävä muuttuja havattuje arvoje muodostama -matrs, X $ $ p p # # # # $ p o selttävä muuttuja havattuje arvoje j muodostama (p+)-matrs, β β0 β β # β p o regressokertome β muodostama (p+) -matrs ja ε ε ε # ε o jääösterme ε muodostama -matrs. Olettae, että matrs X sarakkeet ovat leaarsest rppumattoma el, jos r(x) p + vektor β PNS-estmaattor b vodaa esttää matrse muodossa b ( XX ) X TKK @ Ilkka Mell (005) 9/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Tämä vodaa perustella esmerkks seuraavalla tavalla: Krjotetaa es ( X( β + h))( X( β + h)) (( Xβ) Xh) (( Xβ) Xh) ( Xβ)( Xβ) hx ( Xβ) + hxxh ( Xβ )( Xβ) + h ( X + XXβ ) + hxxh Atamalla h 0 ähdää, että elösumma εε ( Xβ)( Xβ ) dervaatta o ( Xβ )( Xβ) ( X + XXβ ) h Merktää dervaatta ollaks, jollo saadaa matrsmuotoe ormaalhtälö X + XXβ 0 Tämä ormaalhtälö ratkasuks saadaa βˆ b ( XX ) X joka vastaa elösumma ε ε mmä. Tehtävä 5.3. Ratkasu: (a).8 0.0 3.0 30.5 3 4.8 3 40.0 4 5.0 4 55. X 5 6.5 5 60.3 7.0 74.9 9.0 88.4 9. 95. 6 6 7 7 8 8 (b) 8 464.4 XX 464.4 3089.96 3 4 3 4 5 6 7 8 5 6 7 8 TKK @ Ilkka Mell (005) 0/3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset (c) 46. X 373.7 3 4 3 4 5 6 7 8 5 6 7 8 (d) Ste ( ) det( XX ) 8 3089.96 464.4 405.3 ( XX ) det( XX ) 3089.96 464.4 405.3 464.4 8 0.78684 0.034 0.034 0.00094873 Huomaa, että hde selttäjä leaarse regressomall tapauksessa ( ) XX ) ( ) s det( (e) Kohdsta (c) ja (d) vektor β PNS-estmaattorks b saadaa 0.78684 0.034 46. 0.7673 ( ) b XX X 0.034 0.00094873 373.7 0.095733 Tulos o sama ku tehtävässä 4.4. kute tetst ptääk. TKK @ Ilkka Mell (005) /3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Huomaa, että lesest pätee jote ja b ( XX) X det( XX ) ( ) + b b ( ) s s ( ) + 0 ( ) ( ) + ( ) ( ) ( ) ( ) s s s b s s Ste olemme johtaeet tehtävässä 5.. aetut kaavat hde selttäjä leaarse mall β0 + β + ε,,,, regressokertome β 0 ja β PNS-estmaattorelle. TKK @ Ilkka Mell (005) /3

Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Tehtävä 5. laskutomtuste suorttame Mcrosoft Ecel -ohjelmalla: Tehtävä Tehtävä 5.. Tedosto KsHt5.ls > Ht5.. Tehtävä 5. laskutomtuste suorttame Statst-ohjelmalla: Tehtävä Tehtävä 5.. Tedosto Sdata5.s TKK @ Ilkka Mell (005) 3/3