A250A0050 Ekonometrian perusteet Tentti

Samankaltaiset tiedostot
VARIANSSIANALYYSI ANALYSIS OF VARIANCE

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)


Frequencies. Frequency Table

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i p X ip + u i

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Harjoitukset 6 :IV-mallit (Palautus )

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

9.1 Hierarkiset asetelmat (Nested Designs)

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

Mat Tilastollisen analyysin perusteet

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli:

Lineaaristen mallien sovellukset -harjoitustyö

Load

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

MS-C2{04 Tilastollisen analyysin perusteet

9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs)

MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

2. Tietokoneharjoitukset

Pienimmän neliösumman menetelmä (PNS)

Pienimmän neliösumman menetelmä (PNS)

o Ohjeet annetaan kurssin aikana. MAY1 Luvut ja lukujonot, Opintokortti

Pienimmän neliösumman menetelmä (PNS)

I. Principles of Pointer Year Analysis

Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla

SEM1, työpaja 2 ( )

Evaluation of 32 Years of the AAEA Extension Outlook Survey. Ronald Plain University of Missouri. Survey Coordinators

A B DIFFERENCE

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

LASKENTATOIMEN OSAAMINEN vs. LIIKETALOUDELLINEN ENNUSTETARKKUUS

Pienimmän Neliösumman menetelmä (PNS)

Kaikkiin kysymyksiin vastataan kysymys paperille pyri pitämään vastaukset lyhyinä, voit jatkaa paperien kääntöpuolille tarvittaessa.

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

LASKIN ON SALLITTU ELLEI TOISIN MAINITTU! TARKISTA TEHTÄVÄT KOKEEN JÄLKEEN JA ANNA PISTEESI RUUTUUN!

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Perusnäkymä yksisuuntaiseen ANOVAaan

4. Tietokoneharjoitukset

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages Esa Virtala.

4. Tietokoneharjoitukset

voidaan hylätä, pienempi vai suurempi kuin 1 %?

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

Vastepintamenetelmä. Kuusinen/Heliövaara 1

SELVITTÄJÄN KOMPETENSSISTA

4.2 Useampi selittävä muuttuja (kertausta)

Toimittaja Erä

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa

Regressioanalyysi. Vilkkumaa / Kuusinen 1

ATH-koulutus: R ja survey-kirjasto THL ATH-koulutus / Tommi Härkänen 1

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli:

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä

MAY1 Luvut ja lukujonot, opintokortti

MAA5 Vektori, Opintokortti

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä

Kvantitatiiviset menetelmät

Menestyminen valintakokeissa ja todennäköisyyslaskussa

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

MAA8 Juuri- ja logaritmifunktiot, Opintokortti

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

19. Statistical Approaches to. Data Variations Tuomas Koivunen S ysteemianalyysin. Laboratorio. Optimointiopin seminaari - Syksy 2007

Opiskelija viipymisaika pistemäärä

Perhevapaiden palkkavaikutukset

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

The relationship between leisuretime physical activity and work stress with special reference to heart rate variability analyses

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1

Osa 15 Talouskasvu ja tuottavuus

Muuttuvan ilmaston vaikutukset vesistöihin

TILASTOTIEDE KÄYTÄNNÖN TUTKIMUKSESSA, 8 10 OP Luennoi: yliopisto-opettaja Pekka Pere. Logaritmin muutos ja suhteellinen muutos

Transkriptio:

A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin yläreunaan, jos olet suorittanut harjoitustyön viime vuoden kurssin yhteydessä. Tehtävä 1 (max 12 pistettä) Vastaa seuraaviin kysymyksiin lyhyesti mutta täsmällisesti. a) Miksi ekonometriseen malliin lisätään virhetermi? (2 p.) b) Mikä on nollahypoteesi, kun testataan estimoidun kertoimen tilastollista merkitsevyyttä? (2 p.) c) Mitä tarkoitetaan mallin määrittelyvirheellä? Millaiset määrittelyvirheet ovat tavallisia? (4 p.) d) Millaisessa tilanteessa voit käyttää logit mallia? Anna esimerkki kysymyksestä, johon voit hakea vastausta logit mallin avulla. (4 p.) Tehtävä 2 (max 40 pistettä) a) Mitä tarkoitetaan multikollineaarisuudella, ja mitä seurauksia sillä on? (6 p.) b) Mitä tarkoitetaan heteroskedastisuudella ja millä keinoin se voidaan havaita? Millä tavoin heteroskedastisuus voidaan korjata ja/tai ottaa huomioon (kerro eri menetelmistä)? (10 p.) c) Mikä on autokorrelaation määritelmä ja miten se voidaan havaita ja korjata tai huomioida yhtälön estimoinnissa? (10 p.) d) Vertaile heteroskedastisuuden ja autokorrelaation seurauksia pienimmän neliösumman estimointimenetelmän käytön yhteydessä. (6 p.) e) Mitä asioita pitää huomioida, kun valitaan estimointimenetelmää paneelidatalle? Luettele kurssilla mainitut estimointimenetelmät ja pohdi lyhyesti kunkin käytön edellytyksiä ja taustaoletuksia. (8 p.) Tehtävä 3 (max 28 pistettä) Broilerintuotannon analysoimiseksi on kerätty dataa seuraavista muuttujista: ln_qprod t = broilerinlihan kokonaistuotanto vuonna t (luonnollinen logaritmi), ln_p t = broilerinlihan reaalinen hintaindeksi vuonna t (luonnollinen logaritmi), ln_pf t = broilerin rehun reaalinen hintaindeksi vuonna t (luonnollinen logaritmi), ln_y t = henkeä kohti laskettu BKT vuonna t (luonnollinen logaritmi), ln_pb t = naudanlihan reaalinen hintaindeksi vuonna t (luonnollinen logaritmi), popgro t = väestönkasvuprosentti vuosien t ja t 1 välillä ja lexpts t = broilerinlihan vienti vuonna t (luonnollinen logaritmi). Sivu 1 / 2

Alalla tapahtuvan teknisen kehityksen vaikutukset broilerinlihan kokonaistuotantoon huomioidaan sisällyttämällä aikamuuttuja year selittävien muuttujien joukkoon. Lisäksi broilerintuotannon arvellaan riippuvan broilerinlihan kokonaistuotannon viivästetystä arvosta lag_ln_qprod. Vastaa seuraaviin kysymyksiin liitteenä olevien SAS tulosteiden pohjalta. a) Mikä on pienimmän neliösumman menetelmällä (OLS) estimoitu yhtälö? Tarkastele yhtälön parametriestimaattien merkitsevyyttä ja pohdi, vastaavatko tulokset etumerkkien osalta odotuksiasi. Perustele. (4 p.) b) Miksi yhtälö on estimoitu OLS:n lisäksi 2 vaiheisella pienimmän neliösumman estimointimenetelmällä (2SLS)? Mihin muuttujaan ongelma todennäköisesti liittyy, miksi tällaista tilannetta kutsutaan ja mitä se tarkoittaa OLS:n käytön kannalta? (6 p.) c) Millä menetelmällä voit testata edellisen kohdan ongelman vakavuutta? Mikä testin nimi on ja miten sen voi käytännössä tehdä? Entä mikä on testin nollahypoteesi? Analysoi SAS tulosteiden avulla, onko huoli OLS:n sopimattomuudesta tehtävän tilanteessa perusteltu. Kerro täsmällisesti, mihin tulosteiden kohtiin johtopäätöksesi perustuu. (8 p.) d) Mitä ominaisuuksia hyvältä instrumenttimuuttujalta vaaditaan? (6 p.) e) Ovatko käytetyt instrumenttimuuttujat SAS tulosteiden mukaan heikkoja vai vahvoja? Miksi? Miksi tämän kysymyksen pohtiminen on tärkeää? (4 p.) Sivu 2 / 2

Tehtävä 3: SAS-tuloste 1 The REG Procedure Model: Linear_Regression_Model Dependent Variable: ln_qprod Log of broiler production Number of Observations Read 52 Number of Observations Used 40 Number of Observations with Missing Values 12 Source Sum of Squares Mean Square F Value Pr > F Model 4 11.98160 2.99540 3102.48 <.0001 Error 35 0.03379 0.00096549 Corrected Total 39 12.01539 Root MSE 0.03107 R-Square 0.9972 Dependent Mean 8.96049 Adj R-Sq 0.9969 Coeff Var 0.34677 s Variable Label Intercept Intercept 1-19.66196 9.27240-2.12 0.0411 ln_p ln_pf lag_ln_qprod broiler Log of broiler production, 1 0.00911 0.06794 0.13 0.8941 1-0.09019 0.04265-2.11 0.0416 1 0.73269 0.10663 6.87 <.0001 year Year 1 0.01117 0.00515 2.17 0.0369

Tehtävä 3: SAS-tuloste 2 The SYSLIN Procedure Two-Stage Least Squares Estimation Model Dependent Variable Label ln_qprod ln_qprod Log of broiler production Source Sum of Squares Mean Square F Value Pr > F Model 4 11.98836 2.997089 2089.96 <.0001 Error 35 0.050191 0.001434 Corrected Total 39 12.01539 Root MSE 0.03787 R-Square 0.99583 Dependent Mean 8.96049 Adj R-Sq 0.99535 Coeff Var 0.42262 s Variable Variable Label Intercept 1-37.3278 13.06988-2.86 0.0072 Intercept ln_p 1 0.289120 0.133000 2.17 0.0366 broiler ln_pf 1-0.16353 0.058689-2.79 0.0086 lag_ln_qprod 1 0.598974 0.139139 4.30 0.0001 Log of broiler production, year 1 0.020679 0.007202 2.87 0.0069 Year

Tehtävä 3: SAS-tuloste 3 The REG Procedure Model: Linear_Regression_Model Dependent Variable: ln_p broiler Number of Observations Read 52 Number of Observations Used 40 Number of Observations with Missing Values 12 Source Sum of Squares Mean Square F Value Pr > F Model 8 1.63556 0.20444 49.48 <.0001 Error 31 0.12809 0.00413 Corrected Total 39 1.76365 Root MSE 0.06428 R-Square 0.9274 Dependent Mean 0.19390 Adj R-Sq 0.9086 Coeff Var 33.15154 s Variable Label Intercept Intercept 1 109.85897 37.98804 2.89 0.0069 ln_pf lag_ln_qprod Log of broiler production, 1 0.14844 0.10082 1.47 0.1510 1 0.16088 0.28487 0.56 0.5763 year Year 1-0.06229 0.02231-2.79 0.0089 ln_y Log of real per capita income 1 1.23558 0.62482 1.98 0.0569 ln_pb Log of real price of beef 1 0.02008 0.21059 0.10 0.9246 popgro Population growth rate 1 0.06116 0.08578 0.71 0.4812 lag_ln_p lexpts broiler, Log of estimate of exports of boneless chicken 1 0.34221 0.15329 2.23 0.0329 1 1.67985 0.74007 2.27 0.0303

Tehtävä 3: SAS-tuloste 4 The REG Procedure Model: Linear_Regression_Model Dependent Variable: ln_qprod Log of broiler production Number of Observations Read 52 Number of Observations Used 40 Number of Observations with Missing Values 12 Source Sum of Squares Mean Square F Value Pr > F Model 5 11.99198 2.39840 3482.93 <.0001 Error 34 0.02341 0.00068861 Corrected Total 39 12.01539 Root MSE 0.02624 R-Square 0.9981 Dependent Mean 8.96049 Adj R-Sq 0.9978 Coeff Var 0.29286 s Variable Label Intercept Intercept 1-37.32781 9.05688-4.12 0.0002 ln_p ln_pf lag_ln_qprod broiler Log of broiler production, 1 0.28912 0.09216 3.14 0.0035 1-0.16353 0.04067-4.02 0.0003 1 0.59897 0.09642 6.21 <.0001 year Year 1 0.02068 0.00499 4.14 0.0002 residual_ln_p Residual 1-0.45723 0.11777-3.88 0.0005