Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen.



Samankaltaiset tiedostot
Testejä suhdeasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

11 Raja-arvolauseita ja approksimaatioita

Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen.

Tilastollinen aineisto Luottamusväli

2. Keskiarvojen vartailua

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

3.6 Su-estimaattorien asymptotiikka

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

tilastotieteen kertaus

Estimointi. Vilkkumaa / Kuusinen 1

Testit järjestysasteikollisille muuttujille

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Sovellettu todennäköisyyslaskenta B

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

7. laskuharjoituskierros, vko 10, ratkaisut

Tutkimustiedonhallinnan peruskurssi

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

805306A Johdatus monimuuttujamenetelmiin, 5 op

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Kvantitatiiviset tutkimusmenetelmät maantieteessä

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Dynaamiset regressiomallit

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 7: NCSS - Tilastollinen analyysi

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

dx=5&uilang=fi&lang=fi&lvv=2014

Parametrin estimointi ja bootstrap-otanta

Harjoitus 2: Matlab - Statistical Toolbox

Tilastollisia peruskäsitteitä ja Monte Carlo

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

Regressioanalyysi. Kuusinen/Heliövaara 1

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Maximum likelihood-estimointi Alkeet

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Testit laatueroasteikollisille muuttujille

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MTTTP5, luento Luottamusväli, määritelmä

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

riippumattomia ja noudattavat samaa jakaumaa.

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Todennäköisyyden ominaisuuksia

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Teema 8: Parametrien estimointi ja luottamusvälit

Otoskoko 107 kpl. a) 27 b) 2654

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) viikko 4

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

4.0.2 Kuinka hyvä ennuste on?

Johdatus tn-laskentaan torstai

2. Keskiarvojen vartailua

Todennäköisyysjakaumia

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Batch means -menetelmä

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mat Sovellettu todennäköisyyslasku A

Jatkuvat satunnaismuuttujat

Ekonometria (STAT.2020) Syksy 2005 Seppo PynnÄonen Vaasan yliopisto, matemaattisten tieteiden laitos

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Transkriptio:

Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen. Ekonometria (STAT.2020) Syksy 2005 Seppo PynnÄonen Vaasan yliopisto, matemaattisten tieteiden laitos SisÄaltÄo: Ekonometrian tekniikkaa; mallin rakentamista; teorian, havaintoaineiston ja tilastollisen teorian vuorovaikutus mallin kehittäamisessäa; ekonometrisen tutkimuksen käayttäotarkoituksista; rakenneanalyysia; ennustaminen; päaäatäoksenteko. Luennot (40 tuntia) Harjoitukset (12 tuntia): RyhmittÄain Suoritustapa: Tentti. EdeltÄavÄat opinnot: Riippuvuusanalyysi Luentorunko. Ei ole tarkoitettu kattavaksi kokonaisuudeksi kurssin loppukuulusteluun! cseppo PynnÄonen. Versio syyskuu 2005 Huom. Seuraa Web-sivuja: http://www.uwasa. /mathdept/ http://www.uwasa. /sjp/ SISÄALT ÄO Kirjallisuutta 1 Taustaa 2 hden selittäajäan regressiomalli 3 Useamman selittäajäan regressiomalli 4 Poikkeamat regressio-oletuksista 5 Aikasarja- ja poikileikkausaineistot Dougherty, Christopher (2002). Introduction to Econometrics. 2nd ed., Oxford University Press. Ramanathan, R. (1998). Introductory Econometrics with Applications, Fourth Edition. New ork: The Dryden Press. Muita: Gujarati, Damodar (1999). Essentials of Econometrics, Second Edition. Singapore: McGraw-Hill. Hill, R., Carter, William E. Gri±ths, George G. Judge (2001). Undergraduate Econometrics, 2nd ed., New ork: Wiley. Maddala, G.S. (1992). Introduction to Econometrics. New ork: Maxwell MacMillan. 1 2

1. Johdantoa 1.1 MitÄa onekonometria? Ekonometriassa sovelletaan tilasollisia ja matemaattisia menetelmiäa taloudellisten ilmiäoiden empiirisessäa tutkimisessa. Huom. Matemaattinen taloustiede ei perustu havaintoaineistoon. TÄaten se ei ole ekonometriaa. Kuitenkin teoreettista tutkimusta, jossa tutkitaan käaytettäaviäa tilastollisiamene- telmiäa kutsutaanmyäos ekonometriaksi! Raja ei suinkaan ole selväa. Tarkemmin sanottuna: Ekonometria koostuu menetelmistäa, joilla talouden, liiketalouden ja muun yhteiskuntatieteiden teorioihin perustuen voidaan hyäodyntäaäa havaintoaineistoa tuottamaan optimaalisia (kvantitatiivisia) ennusteita ja selitysmalleja, sekäa testata empiirisesti itse kyseisiäa teorioita.... the object of statistical methods is the reduction of data. A quantity of data, which usually by its mere bulk is incapable of entering the mind, is to be replaced by relatively few quantities which shall adequately represent the whole, or which, in other words, shall contain as much as possible, ideally the whole, of the relevant information contained in the original data. R. A. Fisher, On the mathematical foundations of theoretical statistics, Phil. Trans. Royal Soc., A222, 1922, p. 309, quoted in T. C. Koopmans, Linear Regression Analysis of Economic Time Series, Netherlands Economic Institute, Haarlem, 1937. 3 4 Mielenkiinnon kohteina ovat: Talodellisten vuorovaikutussuhteiden tilastollinen estimointi Taloustieteiden teoreettisten mallien empiirinen testaus Ennustaminen 1.2 Otossuure ja teoreettinen suure Teoreettinen suure Otossuure Keskiarvo: µ =E(x) ¹x = 1 n n i=1 xi Varianssi: 2 =E(x µ) 2 s 2 = 1 n (xi ¹x)2 n1 i=1 Keskihajonta: = 2 s = s 2 Vinous: (Skewness) = E (xµ)3 3 ^ = 1 n 1 n n n Huipukkuus: = E (xµ)4 ^ = (Kurtosis) 4 Kovarianssi: xy =E(x µ x)(y µ y) s xy = 1 Korrelaatio: i=1 (xi¹x)3 ~s 3 i=1 (xi¹x)4 ~s 4 xy = xy r xy = sxy xy sxsy 1 xy 1 1 r xy 1 jossa ~s 2 = 1 n ni=1 (x i ¹x) 2. n (xi ¹x) n1 i=1 (y i ¹y) 5 6

y Huom. E (g(x)) = g(x)df (x) = ni=1 g(x i )p i, kun x on diskreetti g(x)f(x)dx, kun x on jatk. jossa p i = P (x = x i )jag on jokin funktio. Esim. x Po(), = 10. Otos: 13, 4, 10, 11, 14 (n =5) Voidaan osoittaa, ettäa µ =E(x) = =10ja 2 = Var(x) = = 10. Nyt ¹x =10.4 ja s 2 =15.3 (varianssi hieman yliestimoi). Esim. Satunnaismuuttujat x ja y noudattavat kaksiulotteista normaalijakaumaa parametrein E(x) = 178, Var(x) = 100 E(y) = 170, Var(y) = 81 Corr(x,y)=0.8. Sadan havainnon otoksesta saatiin seuraavat estimaatit: Descriptive Statistics X Frequency Distributions X Mean 178.1 169.8 Bin Frequency Bin Frequency Standard 0.973 0.845 153.4 1 146.2 1 Error Median 177.7 169.3 158.7 1 150.5 2 Standard Deviation 9.7 8.5 164.0 4 154.9 0 Sample Variance 94.8 71.4 169.2 9 159.2 4 Kurtosis 0.51 0.37 174.5 19 163.5 15 Skewness 0.29-0.05 179.7 30 167.8 21 Range 52.6 43.3 185.0 17 172.2 16 Minimum 153.4 146.2 190.3 6 176.5 19 Maximum 206.0 189.5 195.5 8 180.8 12 Sum 17812.8 16981.5 200.8 3 185.2 5 Count 100 100 More 2 More 5 Correlation 0.744 Frequency Histogram (X) 30 25 20 15 10 5 0 153.4 164.0 174.5 185.0 195.5 More Histogram () 25 20 15 10 5 0 146.2 154.9 163.5 172.2 180.8 More Scatter Plot of a Sample from a Bi-variate Normal Distribution with E(X) = 178, V(X) = 100, E() = 170, V() = 9, and Corr(X, ) = 0.8 190 185 180 175 170 165 160 155 Frequency 150 150 160 170 180 190 200 210 x 7 8 1.3 Malli Ekonometrinen malli: Malli: ksinkertistettu esitys todellisuudesta Esim. Omenien kysyntäa riippuu omenien hinnasta. 1. Talouden mallia kuvaava yhtäaläoryhmäa + satunnaistekijäa. Esim. q = + p + u, jossa q on mäaäaräa, p hinta ja u satunnaistermi. ksinkertaistus, silläa on monia muitakin tekijäoitäa, kuten muiden hedelmien hinnat, terveysnäakäokohdat, kulutustottumukset, jne. Taloustieteellinen malli: Joukko oletuksia, joiden alaisuudessa talouden ajatellaan toimivan. 2. SisÄaltyykÄo havaintoihin satunnaisvirhettäa? 3. Virhetermin todennäakäoisyysjakauman mäaäarittäaminen. Esim. (jatkoa) E (u p) = 0, eri havaintojen virhetermit ovat riippumattomia, normaalisti jakautuneita varianssilla V (u p) = 2. 9 10

Ekonometriassa tarkastellaan usein aikasarjaaineistoja. Toisin sanoen samasta tai samoista tilastoyksikäoistäa tehdäaäan havaintoja peräakkäaisinäa ajanjaksoina. Esimerkiksi yrityksen voitto eri vuosina. Vaihtoehtona aikasarja-aineistolle on poikkileikkausaineisto, jossatietylläaajanhetkelläatehdäaäan havaintoja useista tilastoyksikäoistäa. Esimerkiksi poimitaan otos yrityksistäa ja mitataan kustakin ROE viimeiseltäa tilikaudelta. Joskus tarkastellaan myäos näaiden tapausten yhdistelmiäa: Aikasarja-poikkileikkausaineistossa (Pooled data) tarkastellaan esimerkiksi kymmenen yrityksen liikevaihtoja tietylläa ajanjaksolla. Paneeli- eli seurantaaineisto (panel data, longitudinal data) on vieläa erikoistapauus, jossa esimerkiksi poimitaan otos perheitäa ja tutkitaan heidäan tilaansa tietyn ajanjakson (yleensäa useampia vuosia). Eityisesti aikasarja-aineistoissa mallintamisen läahtäokohdaksi on hyäodyllistäa ottaa liikeyhtäaläo. Muutos derivaatta. Esim. VÄaestÄo (BKT, tms) kasvaa 100 -prosenttia vuosittain. t = ( t = t t1 ). t1 SiirrytttÄaessa jatkuva-aikaiseen, saadaan differentiaaliyhtäaläo 1 d t t dt = (separoituva!), josta t = Ae t, jossa A on jokin vakio. 11 12 Esim. Tulot ( ) kulutus (C), mutta miten? C = C( ) a) C = absoluuttinen muutos, 1 b) C C =, %-muutos (samassa suhteesa) Jousto: y = f(x) y y E = lim = x dy x0 x x y dx "%-muutosten suhde". = d ln y. d ln x c) C C =,( 1) a) dc d = C = + b) 1 dc C d = 1 log C = a +log,elic = A c) 1 dc C d = 1 log C = a + log,elic = A Esim. (jatkoa) Tapauksessa (a) kulutuksen tulojousto on dc C d = C. Jos tarkastellaan regressioyhtäaläoäa C i = + + u i, voidaan jousto laskea esimerkiksi keskiarvon kohdalla. Esimerkiksi, jos ¹C = 80, ¹ = 90 ja ^ = 0.80, niin kulutuksen tulojousto keskiarvojen kohdalla on ^ ¹ =9/10 = 0.90, ¹C toisin sanoen tulojen lisäaäantyessäa 10prosen- tilla lisäaäantyy kulutus 9 prosentilla (keskimäaäarin?) 13 14

1.4 Staattisuus ja dynaamisuus AikatekijÄa! Malli y t = x t + t on staattinen. Malli y t = 0 x t + 1 x t1 + t on dynaaminen. Kun x t x t + 1, niin y t muuttuu väalittäomäasti mäaäaräalläa 0. TÄaysimÄaÄarÄainen muutos on 0 + 1. Nyt y t1 = y t2 + x t1 + t1,jne,joten E(y t )=x t + x t1 + 2 x t2 +... Kun < 1, niin etäaäalläa olevien viipeiden merkitys häaviäaäa. Esim. jolloin E(y t ) = x t = x 0, kun t<t 0 x t = x 0 +1, kun t t 0 x 0 1,t<t 0 1 tt0+1 1 x 0 1 + 1. + x 0 1,t t 0 Malli y t = y t1 + x t + t, E( t )=0 on myäos dynaaminen. 15 16 Graa sesti Kertoimet (Multipliers) EdellÄa havaittiin,ettäa yksikäon muutos x:ssäa aiheuttaa kokonaisuudessaan 1 x 0 1 2 1 = j j=0 suuruisen muutoksen y t :ssäa. TÄatÄa sanotaan kokonaiskertoimeksi (Total multiplier) jase saadaan x:n viipeiden kertoimien summana. HÄairiÄo aiheuttaa ikuisen sopetumisen. Kuitenkin, jos on läahelläa nollaa, tapahtuus sopeutuminen tasapainotilaan nopeasti. Sopeutuminen on hidasta, jos on läahelläa ykkäostäa. leisemmin, jos viivekertoimia merkitäaäan j :lläa, niin kokonaiskerroin on = j. j=0 17 18

J:s osakerroin (Interim multiplier) mäaäariteläaäan lukuna J J = j. j=0 Esim. (jatkoa) EdellÄa J = J j=0 j = 1 J+1 1. 0 :aa sanotaan sysäayskertoimeksi (Impact multiplier), joka siis ilmaisee x:ssäa tapahtuneen yksikäon muutoksen väalittäomäan vaikutuksen y:ssäa. Standardoimalla J kokonaiskertoimella saadaan standardoitu osakeroin J = J. Jos kaikki viivekertoimet ovat positiivisia, niin voidaan laskea keskiviive (mean lag), joka on muotoa j=0 j j ¹J =, joka voidaan tulkita siten, ettäa sekertoovii- peen pituuden, jos muutos x:ssäa tapahtuisi tasaisella intensiteetilläa eikäa pieneneväalläa (edelläa j, 0 < < 1). Mediaaniviive kertoo sen kuinka monen periodin jäalkeen 50% sopeutumisesta on tapahtunut. Mediaaniviive saadaan laskettua kaavasta J m = J m1 + 0.50 m1 m, m1 19 20 jossa J m1 on mediaania edeltäaväan viive, m1 on mediaaniluokkaa edeltäaväa standardoitu osakerroin ja m on ensimmäainen standrdoitu osakerroin, jolle päatee m > 0.5. 1.6 Tilastollinen päaäattely Estimointi ja hypoteesin testaus. Esim. y t =0.2x t2 +0.4x t3 +0.1x t4 Silloin 0 =0. =0.2+0.4+0.1 =0.7 ja 0.2 2+0.4 3+0.1 4 ¹J = =2.86 0.7 Nyt 2 =0.29 ja 3 =0.86, joten 0.5 0.29 J m =2.0+ 0.86 0.29 =2.37. Hypoteesin testaus Esim. Kahden maalilajin kestäavyyden testaus asfaltoidun tien ajoratamerkkeinäa. ViivanpÄatkÄat (10 cm kukin) on tehty satunnaisessa jäarjestyksessäa ( riippumattomat otokset). 21 22

Data Paint 1 Paint 2 1 12.5 9.4 2 11.7 11.6 3 9.9 9.7 4 9.6 10.4 5 10.3 6.9 6 9.6 7.3 7 9.4 8.4 8 11.3 7.2 9 8.7 7.0 10 11.5 8.2 11 10.6 12.7 12 9.7 9.2 Hypoteesit ja testisuure: Testataan poikkeavatko kestot toisistaan Hypoteesit H 0 : µ 1 = µ 2 H 1 : µ 1 = µ 2. Huom. Kaksisuuntainen testaus, kun ei ole etukäateisolettamusta kumpi maaleista kestäaäa pitempäaäan. Huom. Jos toinen maaleista, esim. ykkäonen, olisi täahäan asti käaytetty maali ja kakkonen olisi uusi tuote, niin silloin testattaisiin hypoteesia, ettäa onko kakkosmaali kestäaväampäaäa. Vastahypoteesi olisi silloin muotoa: H 1 : µ 1 <µ 2. 23 24 Oletetaan, ettäa molempien perusjoukkojen varianssit ovat samat (tarvittaessa testattava). Testisuure (kahden perusjouko t-testi): t = ¹x 1 ¹x 2, 1 s n1 + 1 n2 jossa s on varianssien painotetun keskiarvon neliäojuuri, eli (n 1 1)s 2 1 s = +(n 2 1)s 2 2, n 1 + n 2 2 jossa s 2 j on otoksen j varianssi ja n j on vastaava otoskoko (j =1, 2). Testisuure t noudattaa t-jakaumaa vapausasteilla n 1 + n 2 2, kun H 0 on tosi. Huom. s 2 (1/n 1 +1/n 2 )onvar(¹x 1 ¹x 2 ):n estimaattori. Testitulokset (Excel taulukkolaskentaohjelma) t-test: (Two-Sample Assuming Equal Variances) Paint 1 Paint 2 Mean 10.4 9.0 Variance (s 2 j ) 1.28 3.51 Observations (n j ) 12 12 Pooled Variance (s 2 ) 2.40 Hypothesized Mean Di erence 0 df 22 t-stat 2.22 P (T > t) one-tail 0.0187 t Critical one-tail 1.7171 P (T > t ) two-tail 0.0374 t Critical two-tail 2.0739 Huom. EdellÄa t-testisuuretta vastaavaa satunnaismuuttujaa on merkitty T :lläa (Excel). 25 26

Estimointi Estimaatorin hyvyyskriteerejäa Parametri : Esim. regressio mallin -kerroin. Estimaattori ^: Otosvirhe ^. Harha B(^) =E(^) Estimaattoria sanotaan harhattomaksi, jos B(^) =0. Muita hyvyyskriteerejäa ovat mm. tarkentuvuus (consistency), tehokkuus (e±ciency), ja tyhjentäavyys (su±ciency). Tarkentuvuutta tarkastellaan seuraavien rajaarvokäasitteiden yhteydessäa ja tehokkuuteen palataan myäohemmin. TyhjentÄavyydellÄa tarkoitetaan heuristisesti tulkittuna, ettäa estimaattori hyäodyntäaäa kaiken parametria koskevan informaation otoksesta. 1.7 Suurten lukujen laki ja keskeinen rajaarvolause Suurten lukujen laki [The (Strong) Law of Large Numebers (SLLN)]: Olkoon ¹x otoksen x 1,...,x n keskiarvo. Silloin plim ¹x =E(¹x), jossa "plim " tarkoitaa, ettäa otoskeskiarvojen jono ¹x 1, ¹x 2,...,¹x n läahestyy (todennäakäoisyysmielessäa) raja-arvoa E (¹x), kun n läahestyy ÄaÄaretÄontÄa. TÄasmÄallisesti: Olkoon µ = E(¹x n ), silloin plim ¹x n = µ kaikilla > 0lim n P ( ¹x n µ > ) =0. 27 28 Estimaattoria sanotaan ^ tarkentuvaksi, jos plim ^ =. Raja-arvolle plim päatee: Olkoon plim x n = a ja plim y n = b, silloin Esim. Olkoon x 1,...,x n otos jakaumasta, jossa E (x i )= µ, javar(¹x i )= 2. Silloin E (¹x) =µ ja SLLN:n perusteella, plim ¹x = µ, eli otoskeskiarvo ¹x on sekäa harhaton ettäa tarkentuva µ:n estimaattori. Vastaavasti otosvarianssille s 2 = 1 n (x n 1 i ¹x) 2 i=1 päatee: E(s 2 )= 2 ja SLLN:n perusteella plim s 2 = 2, joten otosvarianssi s 2 on 2 :n harhaton ja tarkentuva estimaattori. (i) plim (x n +y n )=plimx n +plim y n = a+b (ii) plim (x n y n )=ab (iii) Jos g on jatkuva funktion, niin plim g(x n )= g(plim x n )=g(a). Huom./Esim. Olkoon y i N(µ, 2 ), µ = 0 ja ¹y =(1/n) y i. Silloin plim ¹y n = µ ja ominaisuuden (iii) perusteella plim ¹y 1 = µ 1, mutta E (¹y 1 ):täa ei ole edes olemassa! 29 30

Keskeinen raja-arvolause [The Central Limit Theorem (CLT)]: Olkoon x 1,...,x n samoin jakautuneita ja riippumattomia [independent and identically distributed (iid)] satunnaismuuttujia, odotusarvona E (x i )=µ ja varianssina Var (x i )= 2. Silloin satunnaismuuttujan n(¹x µ) z = jakauma läahestyy standardoitua nomaalijakaumaa N(0, 1), kun n läahestyy ÄaÄaretÄontÄa. Huom. 1: CLT sanoo, ettäa jos satunnaismuuttuja muodostuu summana riippumattomaista satunnaismuuttujista, niin summattavien tekijäoiden ollessa "suuri", on sen jakamuma hyvin approksimoitavissa normaalijakaumalla. Huom. 2: Jos x i N(µ, 2 ), toisin sanoen summattavan tekijäat ovat valmiiksi jo normaalisia, niin summamuuttujan jakauma on myäos normaalinen (siis ei vain aproksimaationa). 31