Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen. Ekonometria (STAT.2020) Syksy 2005 Seppo PynnÄonen Vaasan yliopisto, matemaattisten tieteiden laitos SisÄaltÄo: Ekonometrian tekniikkaa; mallin rakentamista; teorian, havaintoaineiston ja tilastollisen teorian vuorovaikutus mallin kehittäamisessäa; ekonometrisen tutkimuksen käayttäotarkoituksista; rakenneanalyysia; ennustaminen; päaäatäoksenteko. Luennot (40 tuntia) Harjoitukset (12 tuntia): RyhmittÄain Suoritustapa: Tentti. EdeltÄavÄat opinnot: Riippuvuusanalyysi Luentorunko. Ei ole tarkoitettu kattavaksi kokonaisuudeksi kurssin loppukuulusteluun! cseppo PynnÄonen. Versio syyskuu 2005 Huom. Seuraa Web-sivuja: http://www.uwasa. /mathdept/ http://www.uwasa. /sjp/
SISÄALT ÄO Kirjallisuutta 1 Taustaa 2 Yhden selittäajäan regressiomalli 3 Useamman selittäajäan regressiomalli 4 Poikkeamat regressio-oletuksista 5 Aikasarja- ja poikileikkausaineistot Dougherty, Christopher (2002). Introduction to Econometrics. 2nd ed., Oxford University Press. Ramanathan, R. (1998). Introductory Econometrics with Applications, Fourth Edition. New York: The Dryden Press. Muita: Gujarati, Damodar (1999). Essentials of Econometrics, Second Edition. Singapore: McGraw-Hill. Hill, R., Carter, William E. Gri±ths, George G. Judge (2001). Undergraduate Econometrics, 2nd ed., New York: Wiley. Maddala, G.S. (1992). Introduction to Econometrics. New York: Maxwell MacMillan. 1 2
1. Johdantoa 1.1 MitÄa onekonometria? Ekonometriassa sovelletaan tilasollisia ja matemaattisia menetelmiäa taloudellisten ilmiäoiden empiirisessäa tutkimisessa. Huom. Matemaattinen taloustiede ei perustu havaintoaineistoon. TÄaten se ei ole ekonometriaa. Kuitenkin teoreettista tutkimusta, jossa tutkitaan käaytettäaviäa tilastollisiamene- telmiäa kutsutaanmyäos ekonometriaksi! Raja ei suinkaan ole selväa. Tarkemmin sanottuna: Ekonometria koostuu menetelmistäa, joilla talouden, liiketalouden ja muun yhteiskuntatieteiden teorioihin perustuen voidaan hyäodyntäaäa havaintoaineistoa tuottamaan optimaalisia (kvantitatiivisia) ennusteita ja selitysmalleja, sekäa testata empiirisesti itse kyseisiäa teorioita.... the object of statistical methods is the reduction of data. A quantity of data, which usually by its mere bulk is incapable of entering the mind, is to be replaced by relatively few quantities which shall adequately represent the whole, or which, in other words, shall contain as much as possible, ideally the whole, of the relevant information contained in the original data. R. A. Fisher, On the mathematical foundations of theoretical statistics, Phil. Trans. Royal Soc., A222, 1922, p. 309, quoted in T. C. Koopmans, Linear Regression Analysis of Economic Time Series, Netherlands Economic Institute, Haarlem, 1937. 3 4
Mielenkiinnon kohteina ovat: Talodellisten vuorovaikutussuhteiden tilastollinen estimointi Taloustieteiden teoreettisten mallien empiirinen testaus Ennustaminen 1.2 Otossuure ja teoreettinen suure Teoreettinen suure Otossuure Keskiarvo: µ =E(x) ¹x = 1 n n i=1 x i Varianssi: 2 =E(x µ) 2 s 2 = 1 n n1 i=1 (x i ¹x) 2 Keskihajonta: = 2 s = s 2 Vinous: (Skewness) = E (xµ)3 3 ^ = 1 n n i=1 (xi¹x)3 ~s 3 n 1 n i=1 (xi¹x)4 ~s 4 Huipukkuus: = E (xµ)4 ^ = (Kurtosis) 4 Kovarianssi: xy =E(x µ x )(y µ y ) s xy = 1 n n1 i=1 (x i ¹x) (y i ¹y) Korrelaatio: xy = xy x y r xy = sxy s xs y 1 xy 1 1 r xy 1 jossa ~s 2 = 1 n ni=1 (x i ¹x) 2. 5 6
Huom. E (g(x)) = = g(x)df (x) ni=1 g(x i )p i, kun x on diskreetti g(x)f(x)dx, kun x on jatk. jossa p i = P (x = x i )jag on jokin funktio. Esim. x Po(), = 10. Otos: 13, 4, 10, 11, 14 (n =5) Voidaan osoittaa, ettäa µ =E(x) = =10ja 2 = Var(x) = = 10. Nyt ¹x =10.4 ja s 2 =15.3 (varianssi hieman yliestimoi). Esim. Satunnaismuuttujat x ja y noudattavat kaksiulotteista normaalijakaumaa parametrein E(x) = 178, Var(x) = 100 E(y) = 170, Var(y) = 81 Corr(x,y)=0.8. Sadan havainnon otoksesta saatiin seuraavat estimaatit: Descriptive Statistics X Y Frequency Distributions X Y Mean 178.1 169.8 Bin Frequency Bin Frequency Standard Error 0.973 0.845 153.4 1 146.2 1 Median 177.7 169.3 158.7 1 150.5 2 Standard Deviation 9.7 8.5 164.0 4 154.9 0 Sample Variance 94.8 71.4 169.2 9 159.2 4 Kurtosis 0.51 0.37 174.5 19 163.5 15 Skewness 0.29-0.05 179.7 30 167.8 21 Range 52.6 43.3 185.0 17 172.2 16 Minimum 153.4 146.2 190.3 6 176.5 19 Maximum 206.0 189.5 195.5 8 180.8 12 Sum 17812.8 16981.5 200.8 3 185.2 5 Count 100 100 More 2 More 5 Correlation 0.744 Frequency 30 25 20 15 10 5 0 Histogram (X) 153.4 164.0 174.5 185.0 195.5 More y Scatter Plot of a Sample from a Bi-variate Normal Distribution with E(X) = 178, V(X) = 100, E(Y) = 170, V(Y) = 9, and Corr(X, Y) = 0.8 190 185 180 175 170 165 160 155 Frequency 25 20 15 10 5 0 Histogram (Y) 146.2 154.9 163.5 172.2 180.8 More 150 150 160 170 180 190 200 210 x 7 8
1.3 Malli Ekonometrinen malli: Malli: Yksinkertistettu esitys todellisuudesta Esim. Omenien kysyntäa riippuu omenien hinnasta. 1. Talouden mallia kuvaava yhtäaläoryhmäa + satunnaistekijäa. Esim. q = + p + u, jossa q on mäaäaräa, p hinta ja u satunnaistermi. Yksinkertaistus, silläa on monia muitakin tekijäoitäa, kuten muiden hedelmien hinnat, terveysnäakäokohdat, kulutustottumukset, jne. Taloustieteellinen malli: Joukko oletuksia, joiden alaisuudessa talouden ajatellaan toimivan. 2. SisÄaltyykÄo havaintoihin satunnaisvirhettäa? 3. Virhetermin todennäakäoisyysjakauman mäaäarittäaminen. Esim. (jatkoa) E (u p) = 0, eri havaintojen virhetermit ovat riippumattomia, normaalisti jakautuneita varianssilla V (u p) = 2. 9 10
Ekonometriassa tarkastellaan usein aikasarjaaineistoja. Toisin sanoen samasta tai samoista tilastoyksikäoistäa tehdäaäan havaintoja peräakkäaisinäa ajanjaksoina. Esimerkiksi yrityksen voitto eri vuosina. Vaihtoehtona aikasarja-aineistolle on poikkileikkausaineisto, jossatietylläaajanhetkelläatehdäaäan havaintoja useista tilastoyksikäoistäa. Esimerkiksi poimitaan otos yrityksistäa ja mitataan kustakin ROE viimeiseltäa tilikaudelta. Joskus tarkastellaan myäos näaiden tapausten yhdistelmiäa: Aikasarja-poikkileikkausaineistossa (Pooled data) tarkastellaan esimerkiksi kymmenen yrityksen liikevaihtoja tietylläa ajanjaksolla. Paneeli- eli seurantaaineisto (panel data, longitudinal data) on vieläa erikoistapauus, jossa esimerkiksi poimitaan otos perheitäa ja tutkitaan heidäan tilaansa tietyn ajanjakson (yleensäa useampia vuosia). Eityisesti aikasarja-aineistoissa mallintamisen läahtäokohdaksi on hyäodyllistäa ottaa liikeyhtäaläo. Muutos derivaatta. Esim. VÄaestÄo (BKT, tms) kasvaa 100 -prosenttia vuosittain. Y t = ( Y t = Y t Y t1 ). Y t1 SiirrytttÄaessa jatkuva-aikaiseen, saadaan differentiaaliyhtäaläo 1 dy t Y t dt = (separoituva!), josta Y t = Ae t, jossa A on jokin vakio. 11 12
Esim. Tulot (Y ) kulutus (C), mutta miten? C = C(Y ) a) Y C = Y absoluuttinen muutos, 1 b) C C = Y, %-muutos (samassa suhteesa) Y Jousto: y = f(x) E = lim x0 y y x x = x dy y dx "%-muutosten suhde". = d ln y. d ln x c) C C = Y,( 1) Y a) dc dy = C = + Y b) 1 dc C dy = 1 Y log C = a +logy,elic = AY Esim. (jatkoa) Tapauksessa (a) kulutuksen tulojousto on Y dc C dy = Y C. c) 1 dc C dy = 1 Y log C = a + log Y,eliC = AY Jos tarkastellaan regressioyhtäaläoäa C i = + Y + u i, voidaan jousto laskea esimerkiksi keskiarvon kohdalla. Esimerkiksi, jos ¹C = 80, ¹Y = 90 ja ^ = 0.80, niin kulutuksen tulojousto keskiarvojen kohdalla on Y ^ ¹ =9/10 = 0.90, ¹C toisin sanoen tulojen lisäaäantyessäa 10prosen- tilla lisäaäantyy kulutus 9 prosentilla (keskimäaäarin?) 13 14
1.4 Staattisuus ja dynaamisuus AikatekijÄa! Malli y t = x t + t on staattinen. Malli y t = 0 x t + 1 x t1 + t on dynaaminen. Kun x t x t + 1, niin y t muuttuu väalittäomäasti mäaäaräalläa 0. TÄaysimÄaÄarÄainen muutos on 0 + 1. Nyt y t1 = y t2 + x t1 + t1,jne,joten E(y t )=x t + x t1 + 2 x t2 +... Kun < 1, niin etäaäalläa olevien viipeiden merkitys häaviäaäa. Esim. jolloin E(y t ) = x t = x 0, kun t<t 0 x t = x 0 +1, kun t t 0 x 0 1,t<t 0 1 tt 0+1 1 x 0 1 + 1. + x 0 1,t t 0 Malli y t = y t1 + x t + t, E( t )=0 on myäos dynaaminen. 15 16
Graa sesti Kertoimet (Multipliers) EdellÄa havaittiin,ettäa yksikäon muutos x:ssäa aiheuttaa kokonaisuudessaan 1 x 0 1 2 1 = j=0 j suuruisen muutoksen y t :ssäa. TÄatÄa sanotaan kokonaiskertoimeksi (Total multiplier) jase saadaan x:n viipeiden kertoimien summana. HÄairiÄo aiheuttaa ikuisen sopetumisen. Kuitenkin, jos on läahelläa nollaa, tapahtuus sopeutuminen tasapainotilaan nopeasti. Sopeutuminen on hidasta, jos on läahelläa ykkäostäa. Yleisemmin, jos viivekertoimia merkitäaäan j :lläa, niin kokonaiskerroin on = j=0 j. 17 18
J:s osakerroin (Interim multiplier) mäaäariteläaäan lukuna Esim. (jatkoa) EdellÄa J = J = J j=0 J j=0 j. j = 1 J+1 1. 0 :aa sanotaan sysäayskertoimeksi (Impact multiplier), joka siis ilmaisee x:ssäa tapahtuneen yksikäon muutoksen väalittäomäan vaikutuksen y:ssäa. Standardoimalla J kokonaiskertoimella saadaan standardoitu osakeroin J = J. Jos kaikki viivekertoimet ovat positiivisia, niin voidaan laskea keskiviive (mean lag), joka on muotoa j=0 j j ¹J =, joka voidaan tulkita siten, ettäa se kertoo viipeen pituuden, jos muutos x:ssäa tapahtuisi tasaisella intensiteetilläa eikäa pieneneväalläa (edelläa j, 0 < < 1). Mediaaniviive kertoo sen kuinka monen periodin jäalkeen 50% sopeutumisesta on tapahtunut. Mediaaniviive saadaan laskettua kaavasta J m = J m1 + 0.50 m1 m, m1 19 20
jossa J m1 on mediaania edeltäaväan viive, m1 on mediaaniluokkaa edeltäaväa standardoitu osakerroin ja m on ensimmäainen standrdoitu osakerroin, jolle päatee m > 0.5. 1.6 Tilastollinen päaäattely Estimointi ja hypoteesin testaus. Esim. Silloin 0 =0. y t =0.2x t2 +0.4x t3 +0.1x t4 =0.2+0.4+0.1 =0.7 ja 0.2 2+0.4 3+0.1 4 ¹J = 0.7 Nyt 2 =0.29 ja 3 =0.86, joten =2.86 Hypoteesin testaus Esim. Kahden maalilajin kestäavyyden testaus asfaltoidun tien ajoratamerkkeinäa. ViivanpÄatkÄat (10 cm kukin) on tehty satunnaisessa jäarjestyksessäa ( riippumattomat otokset). J m =2.0+ 0.5 0.29 0.86 0.29 =2.37. 21 22
Data Paint 1 Paint 2 1 12.5 9.4 2 11.7 11.6 3 9.9 9.7 4 9.6 10.4 5 10.3 6.9 6 9.6 7.3 7 9.4 8.4 8 11.3 7.2 9 8.7 7.0 10 11.5 8.2 11 10.6 12.7 12 9.7 9.2 Hypoteesit ja testisuure: Testataan poikkeavatko kestot toisistaan Hypoteesit H 0 : µ 1 = µ 2 H 1 : µ 1 = µ 2. Huom. Kaksisuuntainen testaus, kun ei ole etukäateisolettamusta kumpi maaleista kestäaäa pitempäaäan. Huom. Jos toinen maaleista, esim. ykkäonen, olisi täahäan asti käaytetty maali ja kakkonen olisi uusi tuote, niin silloin testattaisiin hypoteesia, ettäa onko kakkosmaali kestäaväampäaäa. Vastahypoteesi olisi silloin muotoa: H 1 : µ 1 <µ 2. 23 24
Oletetaan, ettäa molempien perusjoukkojen varianssit ovat samat (tarvittaessa testattava). Testisuure (kahden perusjouko t-testi): t = ¹x 1 ¹x 2, 1 s n 1 + 1 n 2 jossa s on varianssien painotetun keskiarvon neliäojuuri, eli (n 1 1)s 2 1 s = +(n 2 1)s 2 2, n 1 + n 2 2 jossa s 2 j on otoksen j varianssi ja n j on vastaava otoskoko (j =1, 2). Testisuure t noudattaa t-jakaumaa vapausasteilla n 1 + n 2 2, kun H 0 on tosi. Huom. s 2 (1/n 1 +1/n 2 )onvar(¹x 1 ¹x 2 ):n estimaattori. Testitulokset (Excel taulukkolaskentaohjelma) t-test: (Two-Sample Assuming Equal Variances) Paint 1 Paint 2 Mean 10.4 9.0 Variance (s 2 j ) 1.28 3.51 Observations (n j ) 12 12 Pooled Variance (s 2 ) 2.40 Hypothesized Mean Di erence 0 df 22 t-stat 2.22 P (T > t) one-tail 0.0187 t Critical one-tail 1.7171 P (T > t ) two-tail 0.0374 t Critical two-tail 2.0739 Huom. EdellÄa t-testisuuretta vastaavaa satunnaismuuttujaa on merkitty T :lläa (Excel). 25 26
Estimointi Estimaatorin hyvyyskriteerejäa Parametri : Esim. regressio mallin -kerroin. Estimaattori ^: Otosvirhe ^. Harha B(^) =E(^) Estimaattoria sanotaan harhattomaksi, jos B(^) =0. Muita hyvyyskriteerejäa ovat mm. tarkentuvuus (consistency), tehokkuus (e±ciency), ja tyhjentäavyys (su±ciency). Tarkentuvuutta tarkastellaan seuraavien rajaarvokäasitteiden yhteydessäa ja tehokkuuteen palataan myäohemmin. TyhjentÄavyydellÄa tarkoitetaan heuristisesti tulkittuna, ettäa estimaattori hyäodyntäaäa kaiken parametria koskevan informaation otoksesta. 1.7 Suurten lukujen laki ja keskeinen rajaarvolause Suurten lukujen laki [The (Strong) Law of Large Numebers (SLLN)]: Olkoon ¹x otoksen x 1,...,x n keskiarvo. Silloin plim ¹x =E(¹x), jossa "plim " tarkoitaa, ettäa otoskeskiarvojen jono ¹x 1, ¹x 2,...,¹x n läahestyy (todennäakäoisyysmielessäa) raja-arvoa E (¹x), kun n läahestyy ÄaÄaretÄontÄa. TÄasmÄallisesti: Olkoon µ = E(¹x n ), silloin plim ¹x n = µ kaikilla > 0lim n P ( ¹x n µ > ) =0. 27 28
Estimaattoria sanotaan ^ tarkentuvaksi, jos plim ^ =. Raja-arvolle plim päatee: Olkoon plim x n = a ja plim y n = b, silloin Esim. Olkoon x 1,...,x n otos jakaumasta, jossa E (x i )= µ, javar(¹x i )= 2. Silloin E (¹x) =µ ja SLLN:n perusteella, plim ¹x = µ, eli otoskeskiarvo ¹x on sekäa harhaton ettäa tarkentuva µ:n estimaattori. Vastaavasti otosvarianssille s 2 = 1 n (x n 1 i ¹x) 2 i=1 päatee: E(s 2 )= 2 ja SLLN:n perusteella plim s 2 = 2, joten otosvarianssi s 2 on 2 :n harhaton ja tarkentuva estimaattori. (i) plim (x n +y n )=plimx n +plim y n = a+b (ii) plim (x n y n )=ab (iii) Jos g on jatkuva funktion, niin plim g(x n )= g(plim x n )=g(a). Huom./Esim. Olkoon y i N(µ, 2 ), µ = 0 ja ¹y =(1/n) y i. Silloin plim ¹y n = µ ja ominaisuuden (iii) perusteella plim ¹y 1 = µ 1, mutta E (¹y 1 ):täa ei ole edes olemassa! 29 30
Keskeinen raja-arvolause [The Central Limit Theorem (CLT)]: Olkoon x 1,...,x n samoin jakautuneita ja riippumattomia [independent and identically distributed (iid)] satunnaismuuttujia, odotusarvona E (x i )=µ ja varianssina Var (x i )= 2. Silloin satunnaismuuttujan n(¹x µ) z = jakauma läahestyy standardoitua nomaalijakaumaa N(0, 1), kun n läahestyy ÄaÄaretÄontÄa. Huom. 1: CLT sanoo, ettäa jos satunnaismuuttuja muodostuu summana riippumattomaista satunnaismuuttujista, niin summattavien tekijäoiden ollessa "suuri", on sen jakamuma hyvin approksimoitavissa normaalijakaumalla. Huom. 2: Jos x i N(µ, 2 ), toisin sanoen summattavan tekijäat ovat valmiiksi jo normaalisia, niin summamuuttujan jakauma on myäos normaalinen (siis ei vain aproksimaationa). 31