A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin yläreunaan, jos olet suorittanut harjoitustyön viime vuoden kurssin yhteydessä. Tehtävä 1 (max 12 pistettä) Vastaa seuraaviin kysymyksiin lyhyesti mutta täsmällisesti. a) Miksi ekonometriseen malliin lisätään virhetermi? (2 p.) b) Mikä on nollahypoteesi, kun testataan estimoidun kertoimen tilastollista merkitsevyyttä? (2 p.) c) Mitä tarkoitetaan mallin määrittelyvirheellä? Millaiset määrittelyvirheet ovat tavallisia? (4 p.) d) Millaisessa tilanteessa voit käyttää logit mallia? Anna esimerkki kysymyksestä, johon voit hakea vastausta logit mallin avulla. (4 p.) Tehtävä 2 (max 40 pistettä) a) Mitä tarkoitetaan multikollineaarisuudella, ja mitä seurauksia sillä on? (6 p.) b) Mitä tarkoitetaan heteroskedastisuudella ja millä keinoin se voidaan havaita? Millä tavoin heteroskedastisuus voidaan korjata ja/tai ottaa huomioon (kerro eri menetelmistä)? (10 p.) c) Mikä on autokorrelaation määritelmä ja miten se voidaan havaita ja korjata tai huomioida yhtälön estimoinnissa? (10 p.) d) Vertaile heteroskedastisuuden ja autokorrelaation seurauksia pienimmän neliösumman estimointimenetelmän käytön yhteydessä. (6 p.) e) Mitä asioita pitää huomioida, kun valitaan estimointimenetelmää paneelidatalle? Luettele kurssilla mainitut estimointimenetelmät ja pohdi lyhyesti kunkin käytön edellytyksiä ja taustaoletuksia. (8 p.) Tehtävä 3 (max 28 pistettä) Broilerintuotannon analysoimiseksi on kerätty dataa seuraavista muuttujista: ln_qprod t = broilerinlihan kokonaistuotanto vuonna t (luonnollinen logaritmi), ln_p t = broilerinlihan reaalinen hintaindeksi vuonna t (luonnollinen logaritmi), ln_pf t = broilerin rehun reaalinen hintaindeksi vuonna t (luonnollinen logaritmi), ln_y t = henkeä kohti laskettu BKT vuonna t (luonnollinen logaritmi), ln_pb t = naudanlihan reaalinen hintaindeksi vuonna t (luonnollinen logaritmi), popgro t = väestönkasvuprosentti vuosien t ja t 1 välillä ja lexpts t = broilerinlihan vienti vuonna t (luonnollinen logaritmi). Sivu 1 / 2
Alalla tapahtuvan teknisen kehityksen vaikutukset broilerinlihan kokonaistuotantoon huomioidaan sisällyttämällä aikamuuttuja year selittävien muuttujien joukkoon. Lisäksi broilerintuotannon arvellaan riippuvan broilerinlihan kokonaistuotannon viivästetystä arvosta lag_ln_qprod. Vastaa seuraaviin kysymyksiin liitteenä olevien SAS tulosteiden pohjalta. a) Mikä on pienimmän neliösumman menetelmällä (OLS) estimoitu yhtälö? Tarkastele yhtälön parametriestimaattien merkitsevyyttä ja pohdi, vastaavatko tulokset etumerkkien osalta odotuksiasi. Perustele. (4 p.) b) Miksi yhtälö on estimoitu OLS:n lisäksi 2 vaiheisella pienimmän neliösumman estimointimenetelmällä (2SLS)? Mihin muuttujaan ongelma todennäköisesti liittyy, miksi tällaista tilannetta kutsutaan ja mitä se tarkoittaa OLS:n käytön kannalta? (6 p.) c) Millä menetelmällä voit testata edellisen kohdan ongelman vakavuutta? Mikä testin nimi on ja miten sen voi käytännössä tehdä? Entä mikä on testin nollahypoteesi? Analysoi SAS tulosteiden avulla, onko huoli OLS:n sopimattomuudesta tehtävän tilanteessa perusteltu. Kerro täsmällisesti, mihin tulosteiden kohtiin johtopäätöksesi perustuu. (8 p.) d) Mitä ominaisuuksia hyvältä instrumenttimuuttujalta vaaditaan? (6 p.) e) Ovatko käytetyt instrumenttimuuttujat SAS tulosteiden mukaan heikkoja vai vahvoja? Miksi? Miksi tämän kysymyksen pohtiminen on tärkeää? (4 p.) Sivu 2 / 2
Tehtävä 3: SAS-tuloste 1 The REG Procedure Model: Linear_Regression_Model Dependent Variable: ln_qprod Log of broiler production Number of Observations Read 52 Number of Observations Used 40 Number of Observations with Missing Values 12 Source Sum of Squares Mean Square F Value Pr > F Model 4 11.98160 2.99540 3102.48 <.0001 Error 35 0.03379 0.00096549 Corrected Total 39 12.01539 Root MSE 0.03107 R-Square 0.9972 Dependent Mean 8.96049 Adj R-Sq 0.9969 Coeff Var 0.34677 s Variable Label Intercept Intercept 1-19.66196 9.27240-2.12 0.0411 ln_p ln_pf lag_ln_qprod broiler Log of broiler production, 1 0.00911 0.06794 0.13 0.8941 1-0.09019 0.04265-2.11 0.0416 1 0.73269 0.10663 6.87 <.0001 year Year 1 0.01117 0.00515 2.17 0.0369
Tehtävä 3: SAS-tuloste 2 The SYSLIN Procedure Two-Stage Least Squares Estimation Model Dependent Variable Label ln_qprod ln_qprod Log of broiler production Source Sum of Squares Mean Square F Value Pr > F Model 4 11.98836 2.997089 2089.96 <.0001 Error 35 0.050191 0.001434 Corrected Total 39 12.01539 Root MSE 0.03787 R-Square 0.99583 Dependent Mean 8.96049 Adj R-Sq 0.99535 Coeff Var 0.42262 s Variable Variable Label Intercept 1-37.3278 13.06988-2.86 0.0072 Intercept ln_p 1 0.289120 0.133000 2.17 0.0366 broiler ln_pf 1-0.16353 0.058689-2.79 0.0086 lag_ln_qprod 1 0.598974 0.139139 4.30 0.0001 Log of broiler production, year 1 0.020679 0.007202 2.87 0.0069 Year
Tehtävä 3: SAS-tuloste 3 The REG Procedure Model: Linear_Regression_Model Dependent Variable: ln_p broiler Number of Observations Read 52 Number of Observations Used 40 Number of Observations with Missing Values 12 Source Sum of Squares Mean Square F Value Pr > F Model 8 1.63556 0.20444 49.48 <.0001 Error 31 0.12809 0.00413 Corrected Total 39 1.76365 Root MSE 0.06428 R-Square 0.9274 Dependent Mean 0.19390 Adj R-Sq 0.9086 Coeff Var 33.15154 s Variable Label Intercept Intercept 1 109.85897 37.98804 2.89 0.0069 ln_pf lag_ln_qprod Log of broiler production, 1 0.14844 0.10082 1.47 0.1510 1 0.16088 0.28487 0.56 0.5763 year Year 1-0.06229 0.02231-2.79 0.0089 ln_y Log of real per capita income 1 1.23558 0.62482 1.98 0.0569 ln_pb Log of real price of beef 1 0.02008 0.21059 0.10 0.9246 popgro Population growth rate 1 0.06116 0.08578 0.71 0.4812 lag_ln_p lexpts broiler, Log of estimate of exports of boneless chicken 1 0.34221 0.15329 2.23 0.0329 1 1.67985 0.74007 2.27 0.0303
Tehtävä 3: SAS-tuloste 4 The REG Procedure Model: Linear_Regression_Model Dependent Variable: ln_qprod Log of broiler production Number of Observations Read 52 Number of Observations Used 40 Number of Observations with Missing Values 12 Source Sum of Squares Mean Square F Value Pr > F Model 5 11.99198 2.39840 3482.93 <.0001 Error 34 0.02341 0.00068861 Corrected Total 39 12.01539 Root MSE 0.02624 R-Square 0.9981 Dependent Mean 8.96049 Adj R-Sq 0.9978 Coeff Var 0.29286 s Variable Label Intercept Intercept 1-37.32781 9.05688-4.12 0.0002 ln_p ln_pf lag_ln_qprod broiler Log of broiler production, 1 0.28912 0.09216 3.14 0.0035 1-0.16353 0.04067-4.02 0.0003 1 0.59897 0.09642 6.21 <.0001 year Year 1 0.02068 0.00499 4.14 0.0002 residual_ln_p Residual 1-0.45723 0.11777-3.88 0.0005