TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa Y i = β + (β 2 + γ) X 1,i + β 2 X 2,i + u i = β + γx 1,i + β 2 (X 1,i + X 2,i ) + u i ja testaa hypoteesia H : γ = (b) Kirjoita regressiomalli muodossa Y i = β + (γ aβ 2 ) X 1,i + β 2 X 2,i + u i = β + γx 1,i + β 2 (X 2,i ax 1,i ) + u i ja testaa nollahypoteesia H : γ = (c) Kirjoita regressiomalli muodossa Y i X 1,i = β + (β 1 1) X 1,i + β 2 X 2,1 + u i = β + (γ β 2 ) X 1,i + β 2 X 2,1 + u i = β + γx 1,i + β 2 (X 2,1 X 1,i ) u i ja testaa nollahypoteesia H : γ = 2 Tutkitaan aineistoa, josta löytyy erinäisiä tietoja kerättynä erinäisisltä High Schoolista valmiistuneilta opiskelijoilta (a) Regressiossa (a) 95 %:n luottamusväli dist muuttujalle on [, 98 ;, 48] Näin ollen ryhmän olettama regressiokerroin β dist =, 75 kuuluu 95 %:n luottamusvälin sisään 1
dist, 73 (,13) Malli (a) (b) (c), 31 (,12) bytest, 92 (,3) female, 143 (,5) black, 354 (,67) hispanic, 42 (,74) incomehi, 367 (,62) ownhome, 146 (,65) dadcoll, 57 (,76) momcoll, 379 (,84) cue8, 24 (,9) stwmfg8, 5 (,2), 33,13, 93 (,3), 144 (,5), 338 (,69), 348 (,77), 374 (,62), 143 (,65), 574 (,76), 379 (,84), 28 (,1), 43 (,2) urban, 652 (,63) tuition, 184 (,99) intercept 13, 956 (,38) 8, 861 (,241) 8, 893 (,243) SER 1,81 1,54 1,54 R2,7,282,284 R 2,7,281,281 Taulukko 1: Estimointitulokset Lähde S& W mallivastaukset (b) Regressiomallissa (b) on kontrolloitu muita tärkeitä selittäviä muuttujia kuin etäisyyttä Kaikki regressiokertoimet ovat yksinään tilastollisesti erittäin merkitseviä Etäisyyden regressiokerroin muuttuu huomattavasti, -,73:sta -,31:een, kun malliin lisätään enemmän muuttujia Mallissa (c) regressioon on lisätty edelleen kaksi muuttujaa, jotka eivät ole tilastollisesti merkitseviä Näiden muuttujien lisääminen regressioon ei juurikaan muuta etäisyyden regressiokertointa, ku- 2
ten ei muidenkaan aikaisemmin lisättyjen muuttujien kertoimia (c) Regressiossa (b) kertoimet β black ja β hispanic ovat positiivisia ja tilastollisesti erittäin merkitseviä Tämä tukisi väitettä 3 Tutkitaan aineistoa jossa on tietoa 65 eri maasta, niiden keskimääräisestä kasvuvauhdista ja muita kasvua selittäviä muuttujia Kasvuaste -2 2 4 6 5 1 15 2 Vaihtoaste Kuva 1: 65 eri maan kasvuasteen ja vaihtoasteen välinen yhteys (a) Kuvaan 1 on piirretty aineiston 65 eri maata, x-akselilla havaitun maan vaihtoaste ja y-akselilla maan keskimääräinen talouskasvu näiden muuttujien välistä yhteyttä on hankala silmämääräisesti arvioida, mutta lievä positiivinen yhteys saattaa olla havaittavissa (b) Maltaa kuvaava havainto löytyy kuvan oikeasta ylälaidasta Malta vaikuttaisi olevan poikkeava havainto aineistossa (c) Estimoidaan regressiomalli, jossa kasvuvauhtia selitetään vaihtoasteella Growth i =, 64 (,459) + 2, 37 Tradeshr i + û i (,663) 3
Kulmakerroin on selvästi tilastollisesti merkitsevä (t = 3, 479 > 2, 58) ja positiivinen Jos maan vaihtoaste on,5 tai 1, olisi estimointitulosten mukaiset kasvuasteet vastaavasti 1,758 ja ja 2,947 Ennusteen luottamusväliä varten meidän tarvitsee laskea ennusteen Ŷi = ˆβ + α 1 ˆβT radeshr keskihajonta, jossa α i on maan i Tradeshr Lasketaan suoraviivaisesti ( ) ( ) SE(Ŷi) = SE ˆβ + α i ˆβT radeshr = Var ˆβ + α i ˆβT radeshr = Var( ˆβ ) + αi 2Var( ˆβ 1 ) + 2α i Cov( ˆβ, ˆβ 1 ) =, 211 + αi 2, 44 + 2α(, 267) Sijoittamalla α i :n paikalla 1 ja,5 saamme ennusteille vastaavasti keskihajonnat SE(Ŷα=1) =, 342 ja SE(Ŷα=1/2) =, 232 Näin ollen ennusteiden 95 %:n luottamusväleiksi saadaan [1, 34 ; 2, 247] ja [2, 277 ; 3, 617] Toinen tapa laskea keskivirheet on muodostaa F testi hypoteesille H : β + α i β 1 = ja laskea ennusteen keskihajonta SE(Ŷi) = Ŷi F (d) Tehdään edellinen kohta uudestaan, mutta käytetään aineistoa josta Malta on poistettu Estimoitu regressioyhtälö on Growth i =, 957 (,552) + 1, 681 Tradeshr i + û i (,899) Regressiokertoimet ovat jälleen tilastollisesti merkitseviä Ennusteen luottamusvälit ovat nyt [1, 342 ; 2, 253] kun Tradeshr =, 5 ja [1, 746 ; 3, 53] kun Tradeshr = 1 (e) Tehtävänannossa pyydetyn regressioyhtälön estimointi tuottaa Ŷ i =, 627 (,95) + 1, 341 (,929) 2, 15 (,977) tradeshare i +, 564 yearsschool i (,135) revcoups i +, 323 (,41) assasinations i, (,) rgdp6 i Tradeshr:in 95 %:n luottamusväli on [, 479 ; 3, 161] t-testisuure saa arvon t = 1, 444 ja sen p-arvo on,149 Tradeshr:in regressiokerroin ei tämän perusteella poikkea tilastollisesti merkitsevästi nollasta 4
(f) testataan F-testillä ovatko YearsSchool ja RGDP6 muuttujat yhdessä tilastollisesti nollasta poikkeavia Nollahypoteesi on H : β Y earsschool = β RGDP 6 = F-testiä varten tarvittava lineaarinen rajoite R ˆβ r = on nyt ˆβ [ ] ˆβ tradeshare [ ] [ ] 1 ˆβ yearsschool = 1 ˆβ revcoups ˆβ assasinations ˆβ rgdp6 Mallissa on kaksi lineaarista rajoitetta, joten q = 2 ja testisuure saa arvon F = 8, 99 Testisuure on F 2, -jakautunut ja sen p- arvo on <,1 Nollahypoteesi voidaan siis testin perusteella hylätä (g) Testataan vielä, voidaanko vaihtosuhdetta lukuun ottamatta kaikki selittäjät hylätä Nollahypoteesi on β yearsschool β revcoups H : = β assasinations β rgdp6 Lineaarinen rajoite R ˆβ = r muotoillaan nyt ˆβ 1 ˆβ tradeshare 1 ˆβ yearsschool 1 = ˆβ revcoups 1 ˆβ assasinations ˆβ rgdp6 Rajoitteiden lukumäärä on q = 4 ja testisuure saa arvon F = 7, 237 Vastaava p-arvo F 4, -jakaumalta on <,1 Nollahypoteesi voidaan siis hylätä 5