Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen.



Samankaltaiset tiedostot
Ekonometria (STAT.2020) Syksy 2005 Seppo PynnÄonen Vaasan yliopisto, matemaattisten tieteiden laitos

Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen.

Testejä suhdeasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

11 Raja-arvolauseita ja approksimaatioita

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

2. Keskiarvojen vartailua

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Sovellettu todennäköisyyslaskenta B

Testit järjestysasteikollisille muuttujille

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

3.6 Su-estimaattorien asymptotiikka

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

tilastotieteen kertaus

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Kvantitatiiviset tutkimusmenetelmät maantieteessä

7. laskuharjoituskierros, vko 10, ratkaisut

Estimointi. Vilkkumaa / Kuusinen 1

Tutkimustiedonhallinnan peruskurssi

Sovellettu todennäköisyyslaskenta B

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Dynaamiset regressiomallit

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Mat Tilastollisen analyysin perusteet, kevät 2007

dx=5&uilang=fi&lang=fi&lvv=2014

Hypoteesin testaus Alkeet

805306A Johdatus monimuuttujamenetelmiin, 5 op

Sovellettu todennäköisyyslaskenta B

Harjoitus 2: Matlab - Statistical Toolbox

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Otoskoko 107 kpl. a) 27 b) 2654

Regressioanalyysi. Kuusinen/Heliövaara 1

Testit laatueroasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisia peruskäsitteitä ja Monte Carlo

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Parametrin estimointi ja bootstrap-otanta

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) viikko 4

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

riippumattomia ja noudattavat samaa jakaumaa.

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Batch means -menetelmä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Teema 3: Tilastollisia kuvia ja tunnuslukuja

2. Keskiarvojen vartailua

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Maximum likelihood-estimointi Alkeet

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Mat Tilastollisen analyysin perusteet, kevät 2007

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

Todennäköisyyden ominaisuuksia

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TILASTOMATEMATIIKKA. Keijo Ruohonen

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

MTTTP5, luento Luottamusväli, määritelmä

Teema 8: Parametrien estimointi ja luottamusvälit

Harjoitus 9: Excel - Tilastollinen analyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

4.0.2 Kuinka hyvä ennuste on?

Ohjeita kvantitatiiviseen tutkimukseen

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Sovellettu todennäköisyyslasku A

Transkriptio:

Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen. Ekonometria (STAT.2020) Syksy 2005 Seppo PynnÄonen Vaasan yliopisto, matemaattisten tieteiden laitos SisÄaltÄo: Ekonometrian tekniikkaa; mallin rakentamista; teorian, havaintoaineiston ja tilastollisen teorian vuorovaikutus mallin kehittäamisessäa; ekonometrisen tutkimuksen käayttäotarkoituksista; rakenneanalyysia; ennustaminen; päaäatäoksenteko. Luennot (40 tuntia) Harjoitukset (12 tuntia): RyhmittÄain Suoritustapa: Tentti. EdeltÄavÄat opinnot: Riippuvuusanalyysi Luentorunko. Ei ole tarkoitettu kattavaksi kokonaisuudeksi kurssin loppukuulusteluun! cseppo PynnÄonen. Versio syyskuu 2005 Huom. Seuraa Web-sivuja: http://www.uwasa. /mathdept/ http://www.uwasa. /sjp/

SISÄALT ÄO Kirjallisuutta 1 Taustaa 2 Yhden selittäajäan regressiomalli 3 Useamman selittäajäan regressiomalli 4 Poikkeamat regressio-oletuksista 5 Aikasarja- ja poikileikkausaineistot Dougherty, Christopher (2002). Introduction to Econometrics. 2nd ed., Oxford University Press. Ramanathan, R. (1998). Introductory Econometrics with Applications, Fourth Edition. New York: The Dryden Press. Muita: Gujarati, Damodar (1999). Essentials of Econometrics, Second Edition. Singapore: McGraw-Hill. Hill, R., Carter, William E. Gri±ths, George G. Judge (2001). Undergraduate Econometrics, 2nd ed., New York: Wiley. Maddala, G.S. (1992). Introduction to Econometrics. New York: Maxwell MacMillan. 1 2

1. Johdantoa 1.1 MitÄa onekonometria? Ekonometriassa sovelletaan tilasollisia ja matemaattisia menetelmiäa taloudellisten ilmiäoiden empiirisessäa tutkimisessa. Huom. Matemaattinen taloustiede ei perustu havaintoaineistoon. TÄaten se ei ole ekonometriaa. Kuitenkin teoreettista tutkimusta, jossa tutkitaan käaytettäaviäa tilastollisiamene- telmiäa kutsutaanmyäos ekonometriaksi! Raja ei suinkaan ole selväa. Tarkemmin sanottuna: Ekonometria koostuu menetelmistäa, joilla talouden, liiketalouden ja muun yhteiskuntatieteiden teorioihin perustuen voidaan hyäodyntäaäa havaintoaineistoa tuottamaan optimaalisia (kvantitatiivisia) ennusteita ja selitysmalleja, sekäa testata empiirisesti itse kyseisiäa teorioita.... the object of statistical methods is the reduction of data. A quantity of data, which usually by its mere bulk is incapable of entering the mind, is to be replaced by relatively few quantities which shall adequately represent the whole, or which, in other words, shall contain as much as possible, ideally the whole, of the relevant information contained in the original data. R. A. Fisher, On the mathematical foundations of theoretical statistics, Phil. Trans. Royal Soc., A222, 1922, p. 309, quoted in T. C. Koopmans, Linear Regression Analysis of Economic Time Series, Netherlands Economic Institute, Haarlem, 1937. 3 4

Mielenkiinnon kohteina ovat: Talodellisten vuorovaikutussuhteiden tilastollinen estimointi Taloustieteiden teoreettisten mallien empiirinen testaus Ennustaminen 1.2 Otossuure ja teoreettinen suure Teoreettinen suure Otossuure Keskiarvo: µ =E(x) ¹x = 1 n n i=1 x i Varianssi: 2 =E(x µ) 2 s 2 = 1 n n1 i=1 (x i ¹x) 2 Keskihajonta: = 2 s = s 2 Vinous: (Skewness) = E (xµ)3 3 ^ = 1 n n i=1 (xi¹x)3 ~s 3 n 1 n i=1 (xi¹x)4 ~s 4 Huipukkuus: = E (xµ)4 ^ = (Kurtosis) 4 Kovarianssi: xy =E(x µ x )(y µ y ) s xy = 1 n n1 i=1 (x i ¹x) (y i ¹y) Korrelaatio: xy = xy x y r xy = sxy s xs y 1 xy 1 1 r xy 1 jossa ~s 2 = 1 n ni=1 (x i ¹x) 2. 5 6

Huom. E (g(x)) = = g(x)df (x) ni=1 g(x i )p i, kun x on diskreetti g(x)f(x)dx, kun x on jatk. jossa p i = P (x = x i )jag on jokin funktio. Esim. x Po(), = 10. Otos: 13, 4, 10, 11, 14 (n =5) Voidaan osoittaa, ettäa µ =E(x) = =10ja 2 = Var(x) = = 10. Nyt ¹x =10.4 ja s 2 =15.3 (varianssi hieman yliestimoi). Esim. Satunnaismuuttujat x ja y noudattavat kaksiulotteista normaalijakaumaa parametrein E(x) = 178, Var(x) = 100 E(y) = 170, Var(y) = 81 Corr(x,y)=0.8. Sadan havainnon otoksesta saatiin seuraavat estimaatit: Descriptive Statistics X Y Frequency Distributions X Y Mean 178.1 169.8 Bin Frequency Bin Frequency Standard Error 0.973 0.845 153.4 1 146.2 1 Median 177.7 169.3 158.7 1 150.5 2 Standard Deviation 9.7 8.5 164.0 4 154.9 0 Sample Variance 94.8 71.4 169.2 9 159.2 4 Kurtosis 0.51 0.37 174.5 19 163.5 15 Skewness 0.29-0.05 179.7 30 167.8 21 Range 52.6 43.3 185.0 17 172.2 16 Minimum 153.4 146.2 190.3 6 176.5 19 Maximum 206.0 189.5 195.5 8 180.8 12 Sum 17812.8 16981.5 200.8 3 185.2 5 Count 100 100 More 2 More 5 Correlation 0.744 Frequency 30 25 20 15 10 5 0 Histogram (X) 153.4 164.0 174.5 185.0 195.5 More y Scatter Plot of a Sample from a Bi-variate Normal Distribution with E(X) = 178, V(X) = 100, E(Y) = 170, V(Y) = 9, and Corr(X, Y) = 0.8 190 185 180 175 170 165 160 155 Frequency 25 20 15 10 5 0 Histogram (Y) 146.2 154.9 163.5 172.2 180.8 More 150 150 160 170 180 190 200 210 x 7 8

1.3 Malli Ekonometrinen malli: Malli: Yksinkertistettu esitys todellisuudesta Esim. Omenien kysyntäa riippuu omenien hinnasta. 1. Talouden mallia kuvaava yhtäaläoryhmäa + satunnaistekijäa. Esim. q = + p + u, jossa q on mäaäaräa, p hinta ja u satunnaistermi. Yksinkertaistus, silläa on monia muitakin tekijäoitäa, kuten muiden hedelmien hinnat, terveysnäakäokohdat, kulutustottumukset, jne. Taloustieteellinen malli: Joukko oletuksia, joiden alaisuudessa talouden ajatellaan toimivan. 2. SisÄaltyykÄo havaintoihin satunnaisvirhettäa? 3. Virhetermin todennäakäoisyysjakauman mäaäarittäaminen. Esim. (jatkoa) E (u p) = 0, eri havaintojen virhetermit ovat riippumattomia, normaalisti jakautuneita varianssilla V (u p) = 2. 9 10

Ekonometriassa tarkastellaan usein aikasarjaaineistoja. Toisin sanoen samasta tai samoista tilastoyksikäoistäa tehdäaäan havaintoja peräakkäaisinäa ajanjaksoina. Esimerkiksi yrityksen voitto eri vuosina. Vaihtoehtona aikasarja-aineistolle on poikkileikkausaineisto, jossatietylläaajanhetkelläatehdäaäan havaintoja useista tilastoyksikäoistäa. Esimerkiksi poimitaan otos yrityksistäa ja mitataan kustakin ROE viimeiseltäa tilikaudelta. Joskus tarkastellaan myäos näaiden tapausten yhdistelmiäa: Aikasarja-poikkileikkausaineistossa (Pooled data) tarkastellaan esimerkiksi kymmenen yrityksen liikevaihtoja tietylläa ajanjaksolla. Paneeli- eli seurantaaineisto (panel data, longitudinal data) on vieläa erikoistapauus, jossa esimerkiksi poimitaan otos perheitäa ja tutkitaan heidäan tilaansa tietyn ajanjakson (yleensäa useampia vuosia). Eityisesti aikasarja-aineistoissa mallintamisen läahtäokohdaksi on hyäodyllistäa ottaa liikeyhtäaläo. Muutos derivaatta. Esim. VÄaestÄo (BKT, tms) kasvaa 100 -prosenttia vuosittain. Y t = ( Y t = Y t Y t1 ). Y t1 SiirrytttÄaessa jatkuva-aikaiseen, saadaan differentiaaliyhtäaläo 1 dy t Y t dt = (separoituva!), josta Y t = Ae t, jossa A on jokin vakio. 11 12

Esim. Tulot (Y ) kulutus (C), mutta miten? C = C(Y ) a) Y C = Y absoluuttinen muutos, 1 b) C C = Y, %-muutos (samassa suhteesa) Y Jousto: y = f(x) E = lim x0 y y x x = x dy y dx "%-muutosten suhde". = d ln y. d ln x c) C C = Y,( 1) Y a) dc dy = C = + Y b) 1 dc C dy = 1 Y log C = a +logy,elic = AY Esim. (jatkoa) Tapauksessa (a) kulutuksen tulojousto on Y dc C dy = Y C. c) 1 dc C dy = 1 Y log C = a + log Y,eliC = AY Jos tarkastellaan regressioyhtäaläoäa C i = + Y + u i, voidaan jousto laskea esimerkiksi keskiarvon kohdalla. Esimerkiksi, jos ¹C = 80, ¹Y = 90 ja ^ = 0.80, niin kulutuksen tulojousto keskiarvojen kohdalla on Y ^ ¹ =9/10 = 0.90, ¹C toisin sanoen tulojen lisäaäantyessäa 10prosen- tilla lisäaäantyy kulutus 9 prosentilla (keskimäaäarin?) 13 14

1.4 Staattisuus ja dynaamisuus AikatekijÄa! Malli y t = x t + t on staattinen. Malli y t = 0 x t + 1 x t1 + t on dynaaminen. Kun x t x t + 1, niin y t muuttuu väalittäomäasti mäaäaräalläa 0. TÄaysimÄaÄarÄainen muutos on 0 + 1. Nyt y t1 = y t2 + x t1 + t1,jne,joten E(y t )=x t + x t1 + 2 x t2 +... Kun < 1, niin etäaäalläa olevien viipeiden merkitys häaviäaäa. Esim. jolloin E(y t ) = x t = x 0, kun t<t 0 x t = x 0 +1, kun t t 0 x 0 1,t<t 0 1 tt 0+1 1 x 0 1 + 1. + x 0 1,t t 0 Malli y t = y t1 + x t + t, E( t )=0 on myäos dynaaminen. 15 16

Graa sesti Kertoimet (Multipliers) EdellÄa havaittiin,ettäa yksikäon muutos x:ssäa aiheuttaa kokonaisuudessaan 1 x 0 1 2 1 = j=0 j suuruisen muutoksen y t :ssäa. TÄatÄa sanotaan kokonaiskertoimeksi (Total multiplier) jase saadaan x:n viipeiden kertoimien summana. HÄairiÄo aiheuttaa ikuisen sopetumisen. Kuitenkin, jos on läahelläa nollaa, tapahtuus sopeutuminen tasapainotilaan nopeasti. Sopeutuminen on hidasta, jos on läahelläa ykkäostäa. Yleisemmin, jos viivekertoimia merkitäaäan j :lläa, niin kokonaiskerroin on = j=0 j. 17 18

J:s osakerroin (Interim multiplier) mäaäariteläaäan lukuna Esim. (jatkoa) EdellÄa J = J = J j=0 J j=0 j. j = 1 J+1 1. 0 :aa sanotaan sysäayskertoimeksi (Impact multiplier), joka siis ilmaisee x:ssäa tapahtuneen yksikäon muutoksen väalittäomäan vaikutuksen y:ssäa. Standardoimalla J kokonaiskertoimella saadaan standardoitu osakeroin J = J. Jos kaikki viivekertoimet ovat positiivisia, niin voidaan laskea keskiviive (mean lag), joka on muotoa j=0 j j ¹J =, joka voidaan tulkita siten, ettäa se kertoo viipeen pituuden, jos muutos x:ssäa tapahtuisi tasaisella intensiteetilläa eikäa pieneneväalläa (edelläa j, 0 < < 1). Mediaaniviive kertoo sen kuinka monen periodin jäalkeen 50% sopeutumisesta on tapahtunut. Mediaaniviive saadaan laskettua kaavasta J m = J m1 + 0.50 m1 m, m1 19 20

jossa J m1 on mediaania edeltäaväan viive, m1 on mediaaniluokkaa edeltäaväa standardoitu osakerroin ja m on ensimmäainen standrdoitu osakerroin, jolle päatee m > 0.5. 1.6 Tilastollinen päaäattely Estimointi ja hypoteesin testaus. Esim. Silloin 0 =0. y t =0.2x t2 +0.4x t3 +0.1x t4 =0.2+0.4+0.1 =0.7 ja 0.2 2+0.4 3+0.1 4 ¹J = 0.7 Nyt 2 =0.29 ja 3 =0.86, joten =2.86 Hypoteesin testaus Esim. Kahden maalilajin kestäavyyden testaus asfaltoidun tien ajoratamerkkeinäa. ViivanpÄatkÄat (10 cm kukin) on tehty satunnaisessa jäarjestyksessäa ( riippumattomat otokset). J m =2.0+ 0.5 0.29 0.86 0.29 =2.37. 21 22

Data Paint 1 Paint 2 1 12.5 9.4 2 11.7 11.6 3 9.9 9.7 4 9.6 10.4 5 10.3 6.9 6 9.6 7.3 7 9.4 8.4 8 11.3 7.2 9 8.7 7.0 10 11.5 8.2 11 10.6 12.7 12 9.7 9.2 Hypoteesit ja testisuure: Testataan poikkeavatko kestot toisistaan Hypoteesit H 0 : µ 1 = µ 2 H 1 : µ 1 = µ 2. Huom. Kaksisuuntainen testaus, kun ei ole etukäateisolettamusta kumpi maaleista kestäaäa pitempäaäan. Huom. Jos toinen maaleista, esim. ykkäonen, olisi täahäan asti käaytetty maali ja kakkonen olisi uusi tuote, niin silloin testattaisiin hypoteesia, ettäa onko kakkosmaali kestäaväampäaäa. Vastahypoteesi olisi silloin muotoa: H 1 : µ 1 <µ 2. 23 24

Oletetaan, ettäa molempien perusjoukkojen varianssit ovat samat (tarvittaessa testattava). Testisuure (kahden perusjouko t-testi): t = ¹x 1 ¹x 2, 1 s n 1 + 1 n 2 jossa s on varianssien painotetun keskiarvon neliäojuuri, eli (n 1 1)s 2 1 s = +(n 2 1)s 2 2, n 1 + n 2 2 jossa s 2 j on otoksen j varianssi ja n j on vastaava otoskoko (j =1, 2). Testisuure t noudattaa t-jakaumaa vapausasteilla n 1 + n 2 2, kun H 0 on tosi. Huom. s 2 (1/n 1 +1/n 2 )onvar(¹x 1 ¹x 2 ):n estimaattori. Testitulokset (Excel taulukkolaskentaohjelma) t-test: (Two-Sample Assuming Equal Variances) Paint 1 Paint 2 Mean 10.4 9.0 Variance (s 2 j ) 1.28 3.51 Observations (n j ) 12 12 Pooled Variance (s 2 ) 2.40 Hypothesized Mean Di erence 0 df 22 t-stat 2.22 P (T > t) one-tail 0.0187 t Critical one-tail 1.7171 P (T > t ) two-tail 0.0374 t Critical two-tail 2.0739 Huom. EdellÄa t-testisuuretta vastaavaa satunnaismuuttujaa on merkitty T :lläa (Excel). 25 26

Estimointi Estimaatorin hyvyyskriteerejäa Parametri : Esim. regressio mallin -kerroin. Estimaattori ^: Otosvirhe ^. Harha B(^) =E(^) Estimaattoria sanotaan harhattomaksi, jos B(^) =0. Muita hyvyyskriteerejäa ovat mm. tarkentuvuus (consistency), tehokkuus (e±ciency), ja tyhjentäavyys (su±ciency). Tarkentuvuutta tarkastellaan seuraavien rajaarvokäasitteiden yhteydessäa ja tehokkuuteen palataan myäohemmin. TyhjentÄavyydellÄa tarkoitetaan heuristisesti tulkittuna, ettäa estimaattori hyäodyntäaäa kaiken parametria koskevan informaation otoksesta. 1.7 Suurten lukujen laki ja keskeinen rajaarvolause Suurten lukujen laki [The (Strong) Law of Large Numebers (SLLN)]: Olkoon ¹x otoksen x 1,...,x n keskiarvo. Silloin plim ¹x =E(¹x), jossa "plim " tarkoitaa, ettäa otoskeskiarvojen jono ¹x 1, ¹x 2,...,¹x n läahestyy (todennäakäoisyysmielessäa) raja-arvoa E (¹x), kun n läahestyy ÄaÄaretÄontÄa. TÄasmÄallisesti: Olkoon µ = E(¹x n ), silloin plim ¹x n = µ kaikilla > 0lim n P ( ¹x n µ > ) =0. 27 28

Estimaattoria sanotaan ^ tarkentuvaksi, jos plim ^ =. Raja-arvolle plim päatee: Olkoon plim x n = a ja plim y n = b, silloin Esim. Olkoon x 1,...,x n otos jakaumasta, jossa E (x i )= µ, javar(¹x i )= 2. Silloin E (¹x) =µ ja SLLN:n perusteella, plim ¹x = µ, eli otoskeskiarvo ¹x on sekäa harhaton ettäa tarkentuva µ:n estimaattori. Vastaavasti otosvarianssille s 2 = 1 n (x n 1 i ¹x) 2 i=1 päatee: E(s 2 )= 2 ja SLLN:n perusteella plim s 2 = 2, joten otosvarianssi s 2 on 2 :n harhaton ja tarkentuva estimaattori. (i) plim (x n +y n )=plimx n +plim y n = a+b (ii) plim (x n y n )=ab (iii) Jos g on jatkuva funktion, niin plim g(x n )= g(plim x n )=g(a). Huom./Esim. Olkoon y i N(µ, 2 ), µ = 0 ja ¹y =(1/n) y i. Silloin plim ¹y n = µ ja ominaisuuden (iii) perusteella plim ¹y 1 = µ 1, mutta E (¹y 1 ):täa ei ole edes olemassa! 29 30

Keskeinen raja-arvolause [The Central Limit Theorem (CLT)]: Olkoon x 1,...,x n samoin jakautuneita ja riippumattomia [independent and identically distributed (iid)] satunnaismuuttujia, odotusarvona E (x i )=µ ja varianssina Var (x i )= 2. Silloin satunnaismuuttujan n(¹x µ) z = jakauma läahestyy standardoitua nomaalijakaumaa N(0, 1), kun n läahestyy ÄaÄaretÄontÄa. Huom. 1: CLT sanoo, ettäa jos satunnaismuuttuja muodostuu summana riippumattomaista satunnaismuuttujista, niin summattavien tekijäoiden ollessa "suuri", on sen jakamuma hyvin approksimoitavissa normaalijakaumalla. Huom. 2: Jos x i N(µ, 2 ), toisin sanoen summattavan tekijäat ovat valmiiksi jo normaalisia, niin summamuuttujan jakauma on myäos normaalinen (siis ei vain aproksimaationa). 31