Endogeenisuus lineaarisessa regressiossa. Endogeneity in linear regression

Koko: px
Aloita esitys sivulta:

Download "Endogeenisuus lineaarisessa regressiossa. Endogeneity in linear regression"

Transkriptio

1 LAPPEENRANNAN TEKNILLINEN YLIOPISTO Kauppatieteellinen tiedekunta Kandidaatintutkielma Talousjohtaminen Endogeenisuus lineaarisessa regressiossa Endogeneity in linear regression Elsa Nyman

2 Sisällysluettelo 1 Johdanto Lineaarinen regressiomalli Pienimmän neliösumman menetelmä Endogeenisuusongelma Tilanteita joissa selittävä muuttuja ja virhetermi ovat korreloituneet Puuttuvat selittävät muuttujat Samanaikaisuusharha Mittausvirheet Miksi pienimmän neliösumman menetelmää ei voida käyttää? Momenttimenetelmä Instrumenttimuuttujamenetelmä eli kaksivaiheinen pienimmän neliösumman menetelmä Instrumenttimuuttujan pätevyyden testaaminen Endogeenisuuden testaaminen Esimerkki endogeenisuusongelmasta: tutkimus siirtomaiden instituutioiden vaikutuksesta maiden taloudelliseen suorituskykyyn Tutkimuksen taustaa Tutkimuksen hypoteesit Tutkimuksen aineisto ja muuttujat Tutkimuksessa ilmenevät ongelmat Mallin lineaarisuus Puuttuvat selittävät muuttujat Samanaikaisuusharha Mittausvirhe Endogeenisuuden korjaus Endogeenisuuden testaaminen Tutkimustulokset... 25

3 7 Johtopäätökset LIITTEET Liite 1: Tutkimuksen aineisto ja muuttujat... 32

4 1 1 Johdanto Tämän kandidaatintutkielman tarkoituksena on tarkastella lineaarisessa regressiomallissa esiintyvää endogeenisuusongelmaa. Tutkielmassa lähdetään liikkeelle lineaarisen regressiomallin ja sen parametrien yleisimmän estimointimenetelmän pienimmän neliösumman menetelmän määrittelystä. Jos jokin lineaarisen regressiomallin perusoletuksista ei ole voimassa pienimmän neliösumman menetelmällä ei saada luotettavia estimaatteja mallin parametreista (Hill Griffiths & Lim 2012). Tässä tutkielmassa keskitytään lineaarisen regressiomallin oletukseen jonka mukaan mallin selittävän muuttujan ja virhetermin välillä ei saa olla korrelaatiota. Jos kyseiset muuttujat ovat korreloituneet keskenään mallissa on endogeenisuusongelma ja parametrien estimointiin ei voida käyttää pienimmän neliösumman menetelmää (Hill et al. 2012). Pienimmän neliösumman menetelmä esitetään lyhyesti kappaleessa 3. Kappaleessa 4 kuvataan yleisimmät tilanteet jotka aiheuttavat regressiomallin endogeenisuusongelman: puuttuvat selittävät muuttujat samanaikaisuusharha ja mittausvirhe (Hill et al. 2012). Berkowitz & Hoekstra (2010) ovat tutkineet Yhdysvaltain parhaiden yksityisten lukioiden opiskelijoiden todennäköisyyttä päästä parhaimpiin yliopistoihin. Kyseisessä tutkimuksessa esitetään että saadut opiskelupaikat riippuvat kuitenkin myös muista seikoista joita ei ole otettu mallissa huomioon. Jos jokin näistä seikoista on korreloitunut tarkasteltavan henkilön lukiokoulutuksen tasoa mittaavan muuttujan kanssa mallissa on endogeenisuusongelma. Tätä puuttuvien selittävien muuttujien ongelmaa eli omitted variables ongelmaa tarkastellaan kappaleessa Kappaleessa esitetään moniyhtälömalleissa esiintyvä samanaikaisuusharha eli simultaneous bias ongelma hyödykkeen kysyntä- ja tarjontayhtälöiden avulla. Hyödykkeen hinnan ja vaihdetun määrän välinen kausaalisuus on epäselvä: ei voida selkeästi sanoa vaikuttaako hyödykkeen hinta vaihdettuun määrään vai päinvastoin. Taloudellisia muuttujia on vaikea mitata. Tällöin muuttuja on voitu korvata toisella muuttujalla joka ei mittaa täsmällisesti haluttua asiaa. Tämä johtaa siihen että mallissa on mittausvirhe eli errors-in-variables ongelma. (Hill et al. 2010) Kappalees-

5 2 sa tarkastellaan esimerkkiä jossa henkilön tulotason ja koulutustason välillä on endogeenisuusongelma johtuen koulutustason vaikeasta mitattavuudesta (Greene 2003). Edellisten esimerkkien perusteella voidaan todeta että endogeenisuusongelmaa esiintyy hyvinkin arkipäiväisissä tilanteissa. Näiden tilanteiden tunteminen on erityisen tärkeää kvantitatiivisessa tutkimuksessa jotta saadaan oikeanlaisia tuloksia. Endogeenisuusongelman tapauksessa pienimmän neliösumman menetelmällä saadaan harhaisia estimaatteja mallin parametreista. Mikäli endogeenisuusongelma havaitaan voidaan parametrit estimoida vaihtoehtoisella estimointimenetelmällä esimerkiksi kappaleessa esitetyllä instrumenttimuuttujamenetelmällä. (Hill et al. 2012) Acemoglu Johson ja Robinson (2000) ovat tutkineet siirtomaihin perustettujen instituutioiden ja maiden taloudellisen suorituskyvyn välisessä suhteessa ilmenevää endogeenisuusongelmaa. Tutkimus koostuu 71 maasta jotka ovat olleet eurooppalaisten siirtomaita 1900-luvulla. Acemoglu et al. (2000) esittävät että instituutioita mittaava muuttuja on mitattu virheellisesti ja siten korreloitunut mallin virhetermin kanssa. Tällöin pienimmän neliösumman menetelmällä saadut tulokset ovat harhaisia. Kappaleessa 5 analysoin kyseistä tutkimusta kappaleen 4 teoriarungon mukaisesti. Tutkimuksen mukaisten testien suorittamiseen olen käyttänyt tilastollista ohjelmistoa. Kappaleeseen 6 olen koonnut suorittamieni testien tulokset joista nähdään että mallissa ilmenee endogeenisuusongelma. Ilman tietoa endogeenisuutta aiheuttavista tekijöistä tutkimuksen tuloksista olisi todennäköisesti tehty virheellisiä päätelmiä. Kappaleessa 7 esitetään tutkielman johtopäätökset ja jatkotutkimusaiheet. 2 Lineaarinen regressiomalli Taloustieteissä ollaan kiinnostuneita yhden muuttujan vaihtelun vaikutuksesta toiseen muuttujaan. Yleinen tutkimuksen kohde on hinnan muutoksen vaikutus hyödykkeen vaihdettuun määrään. Lisäksi taloustieteissä pyritään ennustamaan yhden

6 3 muuttujan arvo kun toisen muuttujan arvo tunnetaan. Tällaisia ongelmia voidaan tutkia regressiomallin avulla. (Hill et al. 2012) Regressiomallissa yhtälön vasemmalla puolella on selitettävä muuttuja ja oikealla puolella siihen vaikuttavat tekijät. Yhden selittävän muuttujan lineaarinen regressiomalli on muotoa: missä y = selitettävä muuttuja β 0 = vakiotermi β 1 = kulmakerroin x = selittävä muuttuja ja e = virhetermi. Vakiotermi kertoo sen pisteen jossa regressio leikkaa koordinaatiston vertikaalisen akselin. Kulmakerroin kuvaa selittävän muuttujan vaihtelun vaikutusta selitettävään muuttujaan. Virhetermi sisältää muut selitettävään muuttujaan vaikuttavat tekijät. (Hill et al. 2012) Usean selittävän muuttujan lineaarinen regressiomalli on muotoa: missä y = selitettävä muuttuja β 0 = vakiotermi (x 1 x k ) = selittävät muuttujat ja e = virhetermi. Parametrit (β 1 β k ) kuvaavat kunkin selittävän muuttujan vaikutusta selitettävään muuttujaan. (Roberts & Whited 2011) Oletetaan esimerkiksi että henkilön korkeampi koulutustaso mahdollistaa korkeamman tulotason. Lineaarinen regressiomalli muodostetaan seuraavasti: missä β 0 = vakiotermi β 1 = kulmakerroin ja e = virhetermi. Vakiotermi kertoo tulotason alhaisimman mahdollisimman arvon. Kulmakerroin kuvaa sitä kuinka paljon koulutustason muutos vaikuttaa tulotasoon. (Greene 2003) Selitettävään muuttujaan vaikuttavat tekijät jaetaan kahteen komponenttiin: systemaattiseen komponenttiin ja satunnaiseen komponenttiin eli virhetermiin e.

7 4 Systemaattinen komponentti on selitettävän muuttujan odotusarvo eli selitettävän muuttujan saamien arvojen keskiarvo joka on painotettu arvojen todennäköisyyksillä. Systemaattisen komponentin odotusarvo on ehdollinen sillä se riippuu selittävän muuttujan saamista arvoista. Ehdollinen odotusarvo esitetään seuraavasti: ( ) missä E(y x) = selitettävän muuttujan odotusarvo selittävän muuttujan suhteen β 0 = vakiotermi β 1 = kulmakerroin ja x = selittävä muuttuja. Systemaattinen komponentti on matemaattinen odotus minkä vuoksi se ei ole satunnainen. (Hill et al. 2012) Selitettävä muuttuja ja satunnainen komponentti sen sijaan ovat satunnaisia. Tämä tarkoittaa että kyseisten muuttujien arvoja ei tiedetä ennen tutkimuksen suorittamista. Satunnainen komponentti esitetään selitettävän muuttujan ja systemaattisen komponentin erotuksena: ( ) Yhtälöstä nähdään että selitettävä muuttuja ja satunnainen komponentti eroavat toisistaan vain ei-satunnaisen systemaattisen komponentin verran. Tällöin satunnaisen komponentin odotusarvo on myös riippuvainen selittävän muuttujan saamista arvoista. Satunnaisen komponentin ehdollinen odotusarvo esitetään seuraavasti: ( ) ( ) ( ) missä E(e x) = virhetermin odotusarvo selittävän muuttujan suhteen E(y x) = selitettävän muuttujan odotusarvo selittävän muuttujan suhteen ja (β 0 + β 1 x) = systemaattinen komponentti. Yhtälöstä nähdään että virhetermin odotetaan olevan nolla. Tällöin lineaarinen regressio on muotoa y=β 0 +β 1 x ja voidaan olettaa että selitettävään muuttujaan vaikuttaa vain selittävä muuttuja x. Koska virhetermi kuvaa kaikkia niitä muita selitettävään muuttujaan vaikuttavia tekijöitä virhetermin poikkeaminen nollasta voi viitata siihen että mallista puuttuu merkittäviä selittäviä muuttujia. Toisaalta jos selittävä muuttuja on mitattu virheellisesti todellisen selittävän muuttujan vaikutus selitet-

8 5 tävään muuttujaan näkyy virhetermissä. Tällaisissa tapauksissa selittävää muuttujaa sanotaan endogeeniseksi. (Hill et al. 2012) 3 Pienimmän neliösumman menetelmä Yhden muuttujan lineaarisessa regressiomallissa tarkoituksena on ratkaista parametrit β 0 ja β 1 eli mallin vakiotermi ja kulmakerroin. Pienimmän neliösumman menetelmässä estimoitu suora muodostuu siten että vertikaalisen etäisyyden neliö jokaista aineiston arvoa vastaavasta pisteestä suoralle on mahdollisimman pieni. Vertikaalisten etäisyyksien neliöön korottamisella vältytään suurten negatiivisten etäisyyksien vaikutukselta. Saadun suoran vakiotermi b 0 ja kulmakerroin b 1 ovat pienimmän neliösumman estimaatit parametreista β 0 ja β 1. Estimoitu suora on muotoa: missä = estimoitu selitettävä muuttuja b 0 = vakiotermin estimaatti b 1 = kulmakertoimen estimaatti ja x i = selittävä muuttuja. Todellisen selitettävän muuttujan ja estimoidun selitettävän muuttujan etäisyyttä sanotaan pienimmän neliösumman residuaaliksi ja se esitetään seuraavan yhtälön avulla: missä = pienimmän neliösumman residuaali y i = selitettävä muuttuja ja = estimoitu selitettävä muuttuja. Pienimmän neliösumman estimaateille b 0 ja b 1 on ominaista että niiden residuaalien neliösumma on pienempi kuin minkä tahansa muun suoran residuaalien neliösumma. (Hill et al. 2012) Pienimmän neliösumman estimaatit saadaan etsimällä kaikista mahdollisista parametrien β 0 ja β 1 arvoista piste (b 0 b 1 ) jossa neliösummafunktio S(β 0 β 1 ) minimoituu seuraavan kaavan mukaisesti:

9 6 ( ) ( ) Kyseisessä pisteessä saadaan estimaattorit b 0 ja b 1 : b 0 = b 1 = ( )( ) ( ) missä ja. Ne ovat selitettävän muuttujan y ja selittävän muuttujan x havaintojen otoskeskiarvoja. Vakiotermi b 0 saadaan selitettävän muuttujan otoskeskiarvoa selittävästä yhtälöstä. Kulmakerrointa b 1 estimoivan yhtälön osoittajassa lasketaan yhteen tulo joka koostuu kahdesta komponentista: selittävän muuttujan x havaintojen poikkeamasta otoskeskiarvosta ja selitettävän muuttujan y havaintojen poikkeamasta otoskeskiarvosta. Näiden kahden komponentin tuloa sanotaan kovarianssiksi. Yhtälön nimittäjä koostuu osoittajan ensimmäisen komponentin neliöstä eli selittävän muuttujan havaintojen varianssien summasta. Pienimmän neliösumman estimaatit parametreille β 0 ja β 1 saadaan kun selitettävän muuttujan otosarvot y i ja selittävän muuttujan otosarvot x i sijoitetaan yllä oleviin yhtälöihin. (Hill et al. 2012) Lineaarisen regressiomallin oletusten pitäessä paikkansa pienimmän neliösumman estimaattori on paras lineaarinen harhaton estimaattori. Jos jokin oletus ei pidä paikkansa sanotaan että pienimmän neliösumman estimointimenetelmä ei ole konsistentti eli ristiriidaton. Endogeenisuusongelman tapauksessa satunnainen selittävä muuttuja korreloi virhetermin kanssa jolloin pienimmän neliösumman menetelmä ei ole paras lineaarinen harhaton estimointimenetelmä. Tällöin tulisi käyttää jotakin toista estimointimenetelmää. (Hill et al. 2012)

10 7 4 Endogeenisuusongelma Lineaarisessa regressiossa oletuksena on että virhetermin odotusarvo on nolla. Jos oletus pitää paikkansa selittävä muuttuja ei korreloi virhetermin kanssa ja sen sanotaan olevan eksogeeninen. Jos virhetermin odotusarvo poikkeaa nollasta ja se korreloi selittävän muuttujan kanssa sanotaan selittävää muuttujaa endogeeniseksi. Jos mallissa on endogeenisuusongelma pienimmän neliösumman estimaattorit eivät ole konsistentteja. (Hill et al. 2012) 4.1 Tilanteita joissa selittävä muuttuja ja virhetermi ovat korreloituneet Puuttuvat selittävät muuttujat Puuttuvilla selittävillä muuttujilla tarkoitetaan sellaisia muuttujia joilla on merkittävä vaikutus selitettävään muuttujaan mutta jotka on jätetty mallin ulkopuolelle. Tällöin kyseiset muuttujat eivät näy selittävissä muuttujissa vaan virhetermissä. Jos puuttuvat selittävät muuttujat eivät korreloi mukaan otettujen selittävien muuttujien kanssa pienimmän neliösumman estimaattorit ovat konsistentteja ja harhattomia. Endogeenisuusongelma syntyy jos kyseiset muuttujat ovat korreloituneita keskenään. Ongelmaa voidaan kuvata seuraavan yhtälön mukaisesti: missä y = selitettävä muuttuja β 0 = vakiotermi β 1 = kulmakerroin x = selittävä muuttuja w = havaitsematon selittävä muuttuja k = havaitsemattoman selittävän muuttujan kerroin ja e = virhetermi. Malli voidaan muotoilla seuraavasti: missä v = kw + e eli yhdistetty virhetermi. Jos havaitsematon selittävä muuttuja on korreloitunut mallin selittävän muuttujan kanssa myös yhdistetty virhetermi on korreloitunut selittävän muuttujan kanssa. Tällöin voidaan olettaa että korreloitunut selit-

11 8 tävä muuttuja on endogeeninen ja pienimmän neliösumman estimointimenetelmä tuottaa epäkonsistentteja estimaattoreita kaikista mallin parametreista. (Roberts & Whited 2011) Berkowitz & Hoekstra (2010) ovat tutkineet kuinka parhaat yksityiset lukiot vaikuttavat yliopistopaikkoihin Yhdysvalloissa. Tutkimuksen tulokset osoittavat että yksityisten koulujen vaikutus parhaiden yliopistopaikkojen saamiseen on suurempi kuin julkisten koulujen. Tätä yhteyttä voidaan kuvata seuraavan yhtälön avulla: missä x 1 = keskikoulun keskiarvo x 2 = muuttuja joka mittaa sitä onko tarkasteltava henkilö käynyt yksityistä koulua x 3 = pääsykoepisteet x 4 = muuttuja joka kertoo onko joku tarkasteltavan henkilön sukulaisista käynyt yksityistä koulua x 5 = vektori joka kuvaa muita selitettävään muuttujaan vaikuttavia muuttujia (esimerkiksi naapurusto tulot hakuvuosi) (β 0 β 5 ) = mallin parametrit ja e = virhetermi. Mallin endogeenisuusongelma syntyy jos jokin muuttujista (x2 x5) on korreloitunut muuttujan x1 kanssa. Berkowitzin ja Hoekstran (2010) tutkimuksen tuloksista voidaan todeta että yksityisten lukioiden oppilaat pääsevät todennäköisemmin parempiin yliopistoihin kuin julkisten lukioiden. Tuloksista havaitaan myös että mikään havaitsemattomista muuttujista ei korreloi tarkasteltavan henkilön koulutustasoa mittaavan muuttujan kanssa. Tällöin mallissa ei ole puuttuvien selittävien muuttujien aiheuttamaa endogeenisuusongelmaa ja pienimmän neliösumman menetelmä on konsistentti Samanaikaisuusharha Samanaikaisuusharha esiintyy moniyhtälömalleissa kun selitettävä muuttuja y ja jokin selittävistä muuttujista x k määräytyvät tasapainossa siten että voidaan sanoa sekä muuttujan x k vaikuttavan muuttujaan y että muuttujan y vaikuttavan muuttujaan x k (Roberts & Whited 2011). Samanaikaisuusharhaa voidaan havainnollistaa markkinoiden kysynnän ja tarjonnan tasapainon avulla. Kysyntä:

12 9 Tarjonta: missä Q = hyödykkeiden vaihdettu määrä P = hinta I = tulot α 1 ja α 2 = kysyntäfunktion kulmakertoimet β 1 = tarjontafunktion kulmakerroin e d = kysyntäfunktion virhetermi ja e s = tarjontafunktion virhetermi. Yhtälöryhmällä on kaksi yhteistä muuttujaa: selitettävä muuttuja Q ja selittävä muuttuja P. Nämä kaksi muuttujaa ovat endogeenisia sillä ne määräytyvät yhtälöryhmän sisällä. Kysyntäfunktiossa oleva selittävä muuttuja I sen sijaan on eksogeeninen muuttuja sillä se tulee järjestelmän ulkopuolelta. Yhtälön oikealla puolella oleva endogeeninen muuttuja P korreloi virhetermien e d ja e s kanssa minkä vuoksi pienimmän neliösumman menetelmä on harhainen ja epäkonsistentti. (Hill et al. 2012) Mittausvirheet Mallissa on mittausvirhe jos selittävä muuttuja on mitattu virheellisesti. Vaikeasti mitattavissa oleva muuttuja on voitu korvata toisella muuttujalla joka ei mittaa täsmällisesti haluttua asiaa. Kyseistä muuttujaa kutsutaan proxy- muuttujaksi. (Hill et al. 2012) Mittausvirhettä voidaan mallintaa seuraavanlaisella yhtälöllä: missä y = selitettävä muuttuja β 0 = vakiotermi = kulmakerroin = proxy-muuttuja ja e = virhetermi. Todellisen selittävän muuttujan vaikutusta selitettävään muuttujaan voidaan kuvata seuraavalla tavalla: missä y = selitettävä muuttuja = vakiotermi = kulmakerroin = vaikeasti mitattava muuttuja ja v = virhetermi johon sisältyy mittausvirhe. Vaikeasti mitattavan

13 10 selittävän muuttujan ja sen proxy-muuttujan välistä yhteyttä voidaan havainnollistaa seuraavasti. missä x = proxy-muuttuja x * = alkuperäinen selittävä muuttuja ja u = mittausvirhe. Tästä nähdään että proxy-muuttuja koostuu todellisen muuttujan ja mittausvirheen summasta eikä siten mittaa täsmällisesti haluttua ominaisuutta. (Hill et al. 2012) Todellisen selittävän muuttujan vaikutus näkyy virhetermissä (Roberts & Whited 2011). Tällöin proxy-muuttuja ja virhetermi ovat korreloituneet ja pienimmän neliösumman menetelmä ei ole konsistentti (Hill et al. 2012). Mittausvirheen havainnollistamiseksi oletetaan että kappaleessa 2 esitetyssä esimerkissä koulutustasoa on vaikea mitata. Ongelma voidaan esittää seuraavasti: missä β 0 = vakiotermi = kulmakerroin ja v = virhetermi johon sisältyy mittausvirhe. Mallin parametrien estimoimiseksi koulutustasoa mittaavan muuttujan voisi korvata mittarilla joka kuvaa opiskeluun käytettyjä vuosia. Tätä yhteyttä voidaan kuvata seuraavalla tavalla: missä u = mittausvirhe. Yhtälöstä nähdään että opiskeluaikaa mittaava muuttuja ei kuvaa täsmällisesti koulutustasoa sillä siihen sisältyy mittausvirhe u. Tällöin opiskeluaikaa mittaava muuttuja on korreloitunut virhetermin kanssa ja mallissa on endogeenisuusongelma. (Hill et al. 2012) Jos malli on lineaarinen muuttujien suhteen satunnainen mittausvirhe voidaan korjata vaihtoehtoisella instrumenttimuuttujamenetelmällä (Wang & Hsiao 2011).

14 Miksi pienimmän neliösumman menetelmää ei voida käyttää? Kun selittävä muuttuja ja virhetermi ovat korreloituneet mallissa on endogeenisuusongelma. Tällöin pienimmän neliösumman estimointimenetelmällä ei saada konsistentteja estimaatteja. Tämä voidaan todistaa algebrallisesti seuraavalla tavalla: (1) Muodostetaan lineaarisen regressiomallin y = β 0 +β 1 x+e ja sen systemaattisen osan β 0 +β 1 E(x) erotus. ( ) ( ) mistä saadaan: ( ) ( ) (2) Kerrotaan molemmat puolet tekijällä [(x-e(x)) ( ) ( ) ( ) ( ) (3) Muodostetaan yhtälön kaikista tekijöitä odotusarvot: ( ) ( ) ( ) ( ) (4) Edellinen yhtälö voidaan ilmaista myös seuraavalla tavalla: ( ) ( ) ( ) missä cov(xy) = E[x-E(x)][y-E(y)] var(x) = E[x-E(x)] 2 ja cov(xe) = E[x-E(x)]e. (5) Ratkaistaan parametri β 1 : ( ) ( ) ( ) ( ) Pienimmän neliösumman estimaattori ilmaistaan seuraavasti: ( )( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) Pienimmän neliösumman estimaattori on otoskovarianssin ja -varianssin osamäärä. Otoskoon kasvaessa otosvarianssi ja kovarianssi konvergoituvat todelliseen va-

15 12 rianssiin ja kovarianssiin siten että pienimmän neliösumman estimaattori b 1 konvergoituu todelliseen parametriin β 1. Jos selittävän muuttujan ja virhetermin kovarianssi on nolla parametri β 1 on muotoa: ( ) ( ) Pienimmän neliösumman estimaatti konvergoituu parametriin β 1 : ( ) ( ) ( ) ( ) Tällöin pienimmän neliösumman estimaattori on konsistentti. Jos selittävä muuttuja korreloi virhetermin kanssa parametri β 1 on muotoa: ( ) ( ) ( ) ( ) Tällöin pienimmän neliösumman estimaattori konvergoituu parametrin β 1 ja osamäärän ( ) ( ) summaan: ( ) ( ) ( ) ( ) ( ) ( ) Endogeenisuusongelman tapauksessa pienimmän neliösumman estimaattoriin liittyy selittävän muuttujan ja virhetermin kovarianssin ja selittävän muuttujan varianssin osamäärän suuruinen harha ja estimaatit ovat epäkonsistentteja. Jos selittävän muuttujan ja virhetermin välinen korrelaatio on positiivista pienimmän neliösumman menetelmä tuottaa liian suuria estimaatteja. Vastaavasti jos korrelaatio kyseisten muuttujien välillä on negatiivista saadaan estimointimenetelmällä todellista pienemmät estimaatit. (Hill et al. 2012) 4.3 Momenttimenetelmä Kun selittävä muuttuja on satunnainen ja korreloitunut virhetermin kanssa pienimmän neliösumman estimaattorit ovat harhaisia ja epäkonsistentteja. Tällöin estimointiin voidaan käyttää momenttimenetelmää. Kun kaikki lineaarisen regression olettamukset pitävät paikkansa momenttimenetelmä johtaa pienimmän neliösumman es-

16 13 timaattoriin. Jos mallissa on endogeenisuusongelma momenttimenetelmä johtaa instrumenttimuuttajamenetelmään eli kaksivaiheiseen pienimmän neliösumman menetelmään. (Hill et al. 2012) Momenttimenetelmässä satunnaismuuttujan k:nnes momentti on k:nteen potenssiin korotettu satunnaismuuttujan odotusarvo joka on keskiarvo äärettömistä kokeellisista tuloksista: ( ) missä Y= satunnaismuuttuja ja µ=keskiarvo. Vastaavasti k:nnes otosmomentti ilmaistaan seuraavasti: ( ) Momenttimenetelmässä m kappaletta populaatiomomentteja asetetaan yhtä suuriksi m kappaleen otosmomentin kanssa ja tällöin voidaan estimoida m kappaletta tuntemattomia parametreja. (Hill et al. 2012) Satunnaismuuttujan Y odotusarvo E(Y) ja varianssi var(y) ilmaistaan seuraavasti: ( ) ( ) ( ) ( ) Jotta voidaan estimoida populaation keskiarvo asetetaan ensimmäinen populaatiomomentti ja ensimmäinen otosmomentti yhtä suuriksi: missä = ensimmäinen populaatiomomentti = ensimmäinen otosmomentti ja = otoskeskiarvo. (Hill et al. 2012) Populaation varianssin estimoimiseksi korvataan toinen populaatiomomentti sen otosarvolla ja ensimmäinen momentti otoskeskiarvolla: var(y) = ( )

17 14 missä = = toinen otosmomentti = neliöön korotettu ensimmäinen otosmomentti = otoskeskiarvo. Populaation keskiarvon estimaatiksi saatiin otoskeskiarvo ja varianssin estimaatiksi otosvarianssi ( ). Momenttimenetelmällä estimoidut estimaattorit ovat konsistentteja ja konvergoituvat todellisiin parametriarvoihin suurissa otoksissa. (Hill et al. 2012) Lineaarisen regression oletuksista voidaan muotoilla momenttiehdot: (1) E(e) = 0 (2) E(xe) = 0 Kun kaksi populaatiomomenttia korvataan kahdella otosmomentilla saadaan kaksi yhtälöä joissa on kaksi tuntematonta parametria: ( ) ( ) Kun nämä yhtälöt ratkaistaan saadaan pienimmän neliösumman estimaattorit b 0 ja b 1 jotka on esitetty kappaleessa 3. Jos mallissa on endogeenisuusongelma momenttimenetelmä johtaa instrumenttimuuttujaestimaattoreihin. (Hill et al. 2012) Instrumenttimuuttujamenetelmä eli kaksivaiheinen pienimmän neliösumman menetelmä Toinen momenttiehto E(xe)=0 esittää että selittävä muuttuja ei saa korreloida virhetermin kanssa. Tällöin pienimmän neliösumman estimaattori ei ole konsistentti. Kuitenkin jos on olemassa jokin muuttuja z jolla on tietyt ominaisuudet voidaan momenttimenetelmän avulla saada konsistentteja estimaatteja. Muuttujaa z kutsutaan instrumenttimuuttujaksi sillä se toimii eräänlaisena instrumenttina mallissa. Instrumenttimuuttujalla ei saa olla suoraa vaikutusta selitettävään muuttujaan eikä se saa korreloida virhetermin kanssa eli sen tulee olla eksogeeninen. Lisäksi kyseisen muut-

18 15 tujan on korreloitava riittävän vahvasti endogeenisen muuttujan kanssa. Instrumenttimuuttujan avulla voidaan muodostaa kolmas momenttiehto: (3) ( ) mistä ilmenee että instrumenttimuuttuja ja virhetermi eivät saa korreloida keskenään. Ensimmäisen ja kolmannen momenttiehdon avulla saadaan estimaatit parametreille β 0 ja β 1. Korvaamalla kaksi momenttipopulaatiota kahdella otosmomentilla saadaan kaksi yhtälöä: ( ) ( ) Näiden yhtälöiden ratkaisu johtaa momenttimenetelmän estimaattoreihin joita kutsutaan instrumenttimuuttujaestimaattoreiksi: ( )( ) ( )( ) Estimoitu vakiotermi saadaan pienimmän neliösumman menetelmän tavoin selitettävän muuttujan otoskeskiarvoa selittävästä yhtälöstä. Kulmakertoimen instrumenttimuuttujaestimaattori eroaa pienimmän neliösumman vastaavasta estimaattorista siten että yhtälön osoittaja esittää selitettävän muuttujan ja instrumenttimuuttujan hajonnan yhteisvaihtelua ja nimittäjä selittävän muuttujan ja instrumenttimuuttujan yhteisvaihtelua. Parametrit ja ovat konsistentteja jos instrumenttimuuttujalle asetetut ehdot täyttyvät. (Hill et al. 2012) Usean muuttujan regressiomallissa instrumenttimuuttujaestimointi toteutetaan kahdessa vaiheessa: (1) Oletetaan että yhtälössä muuttuja on endogeeninen ja muuttujat (x 1 x k-1 ) ovat eksogeenisia. Endogeenisen muuttujan instrumenttimuuttujaa kuvataan symbolilla z 1. Ensimmäisen vaiheen yhtälössä

19 16 selitetään endogeenista muuttujaa sen instrumenttimuuttujalla ja kaikilla eksogeenisilla muuttujilla: missä x k = endogeeninen muuttuja = vakiotermin estimaatti (x 1 ) = selittävät eksogeeniset muuttujat ( ) = selittävien eksogeenisten muuttujien parametriestimaatit = instrumenttimuuttuja = instrumenttimuuttujan kerroin ja v = ensimmäisen vaiheen virhetermi. Yhtälö muodostetaan jokaiselle endogeeniselle muuttujalle erikseen. Koska kaikki yllä olevan yhtälön oikean puolen selittävistä muuttujista on eksogeenisia yhtälö voidaan estimoida pienimmän neliösumman menetelmällä. Tällöin saadaan endogeenisen selittävän muuttujan estimoitu yhtälö: (2) Toisessa vaiheessa korvataan alkuperäisen yhtälön endogeeninen muuttuja sen estimaatilla: missä y = selitettävä muuttuja = vakiotermi = kulmakerroin = estimoitu selittävä muuttuja ja = toisen vaiheen virhetermi. Yhtälöstä saadaan estimaattorit ja joita kutsutaan instrumenttimuuttujaestimaattoreiksi eli kaksivaiheisen pienimmän neliösumman estimaattoreiksi. (Hill et al. 2012) Instrumenttimuuttujan pätevyyden testaaminen Jos instrumenttimuuttuja korreloi virhetermin kanssa kolmas momenttiehto E(ze) = 0 ei täyty. Tällöin instrumenttimuuttuja ei ole pätevä eikä instrumenttimuuttujaestimaattorit ole konsistentteja. Instrumenttimuuttujien pätevyyttä voidaan arvioida jos instrumenttimuuttujia on vähintään yhtä monta kuin mahdollisia endogeenisia muuttujia. Usean selittävän muuttujan regressiomallissa instrumenttimuuttujan pätevyyttä voidaan testata seuraavalla tavalla: (1) Muodostetaan yhtälö siten että selittävinä muuttujina ovat instrumenttimuuttujat ja eksogeeniset muuttujat:

20 17 missä = selitettävä muuttuja = vakiotermi (x 1 x k ) = eksogeeniset selittävät muuttujat ( ) = eksogeenisten muuttujien parametrit ( z k ) = instrumenttimuuttujat ( ) = instrumenttimuuttujien parametrit ja v = virhetermi. (Roberts & Whited 2011) (2) Yhtälöstä saadaan residuaalit. (3) Muodostetaan jokaiselle instrumenttimuuttujalle yhtälö siten että selittävänä muuttujana on edellisessä vaiheessa saatu residuaali. (4) Arvioidaan instrumenttimuuttujan pätevyyttä otoskoolla kerrotun selitysasteen avulla. (Hill et al. 2012) Empiirisessä tutkimuksessa instrumenttimuuttujamenetelmässä käytettyjen instrumenttimuuttujien ja endogeenisten muuttujien välinen korrelaatio on usein heikkoa. (Staiger & Stock 1997). Tällöin saaduilla estimaateilla on suuret keskivirheet. Instrumenttimuuttujien käytössä voidaan havaita kaksi perusongelmaa. Ensiksi jos korrelaatio instrumenttimuuttujan ja endogeenisen selittävän muuttujan välillä on heikkoa instrumenttimuuttujaestimaattorit voivat olla epäkonsistentteja. Toiseksi äärellisissä otoksissa instrumenttimuuttujaestimaattorit ovat pienimmän neliösumman estimaattoreiden tapaan harhaisia kun instrumenttien ja endogeenisten muuttujien välinen selityskerroin lähenee nollaa. (Bound Jaeger & Baker 1995) 4.4 Endogeenisuuden testaaminen Jos selittävän muuttujan ja virhetermin välillä on korrelaatiota ei pienimmän neliösumman menetelmää voida käyttää. Pienimmän neliösumman menetelmälle vaihtoehtoinen estimointimenetelmä on instrumenttimuuttujamenetelmä. Jotta tiedetään mitä estimointimenetelmää voidaan käyttää tulee selittävän muuttujan ja virhetermin välinen korrelaatio selvittää. Tämä voidaan toteuttaa Hausman- testin avulla. Testin nollahypoteesina että selittävä muuttuja ja virhetermi eivät korreloi keskenään. Hausman-testi vertaa pienimmän neliösumman menetelmän ja instrumenttimuuttujamenetelmän toimivuutta.

21 18 Hausman- testi toteutetaan seuraavien vaiheiden mukaisesti: (1) Ensimmäisessä vaiheessa selitetään endogeenista muuttujaa kaikilla mallin eksogeenisilla muuttujilla ja instrumenttimuuttujilla: missä x = endogeeninen selittävä muuttuja = vakiotermi (z 1 z L ) = instrumenttimuuttujat ( ) = instrumenttimuuttujien kertoimet ja v = virhetermi. Yhtälö muodostetaan jokaiselle endogeeniselle muuttujalle erikseen. Ensimmäisestä vaiheesta saadaan residuaalit: (2) Ensimmäisen vaiheen residuaalit lisätään alkuperäiseen yhtälöön: missä y = selitettävä muuttuja = vakiotermi = kulmakerroin = selittävä muuttuja = ensimmäisen vaiheen residuaali = edellisen kerroin ja e = virhetermi. Kyseinen yhtälö estimoidaan pienimmän neliösumman menetelmällä ja Hausman-testin nollahypoteesin paikkansapitävyys ratkaistaan t-testin avulla. Jos kertoimen k estimaatti ei t-testin mukaan poikkea tilastollisesti merkittävästi nollasta Hausman-testin nollahypoteesi jää voimaan. Tällöin selittävän muuttujan ja virhetermin välillä ei ole korrelaatiota. Hausman-testin jäädessä voimaan sekä pienimmän neliösumman estimaattori että instrumenttimuuttujaestimaattori ovat konsistentteja. Näiden kahden estimaattorin ero konvergoituu nollaan suurissa otoksissa. Tällöin tulee käyttää tehokkaampaa pienimmän neliösumman estimaattoria. Vastaavasti jos kertoimen k estimaatti poikkeaa tilastollisesti merkitsevästi nollasta Hausman-testin nollahypoteesi hylätään ja selittävän muuttujan ja virhetermin välillä voidaan olettaa olevan korrelaatiota. Tämä johtaa siihen että pienimmän neliösumman menetelmä ei ole konsistentti ja on käytettävä instrumenttimuuttujaestimointimenetelmää. (Hill et al. 2012)

22 19 5 Esimerkki endogeenisuusongelmasta: tutkimus siirtomaiden instituutioiden vaikutuksesta maiden taloudelliseen suorituskykyyn 5.1 Tutkimuksen taustaa Acemoglu Johnson ja Robinson (2000) ovat tutkineet siirtomaihin perustettujen instituutioiden vaikutusta maiden taloudelliseen suorituskykyyn. Eurooppalaisten kolonisaatiostrategioiden välillä oli suuria eroja ja siten eri maihin syntyi erilaisia instituutioita. Kolonialismin aikana syntyneet siirtomaiden olosuhteet ja instituutiot ovat säilyneet maiden itsenäisyyden jälkeenkin. Paremmat instituutiot mahdollistavat investoimaan enemmän fyysiseen ja henkiseen pääomaan mikä johtaa parempaan taloudelliseen suorituskykyyn. (Acemoglu Johnson & Robinson 2000) Ääritapauksena eurooppalaiset loivat eristettyjä valtioita joiden instituutiot eivät toimineet yksityisen omistuksen puolesta eivätkä valvoneet julkisen vallan pakkolunastusta. Eristyneiden valtioiden päätarkoitus oli siirtää siirtomaiden resursseja eurooppalaisille kolonialisteille. Toisena ääritapauksena luotiin uuseurooppalais- valtioita joissa uudisasukkaat kopioivat eurooppalaisia instituutioita korostaen yksityisomistusta ja julkisen vallan valvontaa. (Acemoglu et al. 2000) Kolonisaatiostrategiaan vaikutti keskeisesti kysymys siitä pystyivätkö eurooppalaiset asettumaan siirtomaahan. Eurooppalaiset eivät voineet asettua maihin joissa kuolleisuus oli suurta jolloin todennäköisyys eristettyjen valtioiden luontiin oli suuri. (Acemoglu et al. 2000) 5.2 Tutkimuksen hypoteesit Tutkimuksen hypoteesit voidaan esittää seuraavien yhtälöiden avulla: 1. Siirtomaiden nykyiset instituutiot vaikuttavat maiden taloudelliseen suorituskykyyn:

23 20 missä log y i = asukasta kohti laskettu tulotaso = vakiotermi = nykyiset instituutiot = vektori joka kuvaa muita selittäviä muuttujia γ = edellisen kerroin ja e i = virhetermi. 2. Kolonialismin aikana syntyneet instituutiot ja nykyiset instituutiot korreloivat keskenään: missä = nykyiset instituutiot = vakiotermi = kulmakerroin = kolonialismin aikana syntyneet instituutiot = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja =virhetermi. 3. Kolonisaatiostrategia riippui siitä pystyivätkö eurooppalaiset asettumaan siirtomaahan: missä = kolonialismin aikana syntyneet instituutiot = vakiotermi = kulmakerroin = kolonialistien asettuminen siirtomaahan = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja = virhetermi. 4. Eurooppalaisten kolonialistien kohtaamat siirtomaiden kuolleisuusluvut vaikuttivat kyseiseen maahan asettumiseen: missä = kolonialistien asettuminen siirtomaahan = vakiotermi = kulmakerroin = kolonialistien kohtaamat kuolleisuusluvut = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja = virhetermi.

24 Tutkimuksen aineisto ja muuttujat Tutkimuksen otos koostuu 71 maasta jotka ovat olleet eurooppalaisten maiden siirtomaita 1900-luvulla. Kyseiset maat ja niiden eri muuttujien arvot on esitetty liitteen 1 taulukossa. Taloudellisen suorituskyvyn mittarina on käytetty dollarimääräistä asukasta kohdin laskettua bruttokansantuotetta vuonna Kyseinen mittari on peräisin World DataBank tietokannasta. Useiden muiden taloudellisten muuttujien tavoin bruttokansantuotteen jakauma on vino. Jotta jakauma olisi lähempänä normaalijakaumaa muuttujasta on tehty logaritmimuunnos. (Hill et al. 2012) Nykyisiä instituutioita on kuvattu indeksillä joka mittaa julkisen vallan pakkolunastuksen riskiltä suojautumista asteikolla Maat joissa kyseiseltä riskiltä suojautuminen oli heikointa saavat arvon nolla ja vastaavasti maat joissa riskiltä suojautuminen oli vahvinta saavat arvon 10. Odotuksena on että kolonialistien luomat eristetyt valtiot saisivat arvon nolla ja uuseurooppalais -valtiot arvon 10. (Acemoglu et al. 2000) Kolonialismin aikana syntyneitä instituutioita on mitattu indeksillä joka kuvaa toimeenpanovallan rajoittamista 1900-luvulla. Muuttuja saa arvoja väliltä 1-7. Mikäli maa ei ollut itsenäinen kyseisenä ajanjaksona se saa arvon yksi. Eurooppalaisten kolonialistien asettumista siirtomaahan on kuvattu mittarilla joka kertoo eurooppalaista alkuperää olevien henkilöiden prosenttiosuuden väestöstä luvulla. Kuolleisuuslukuja mittaava muuttuja kuvaa estimoituja kuolleisuuslukuja antaen maalle arvon väliltä Muuttujasta tehdään logaritmimuunnos jotta Afrikan maiden korkeilla kuolleisuusluvuilla ei ole liian suurta vaikutusta tulokseen (Acemoglu et al. 2000). Taloudellista suorituskykyä mittaavaa muuttujaa lukuun ottamatta aineistot ovat peräisin MIT Economics sivustolta.

25 Tutkimuksessa ilmenevät ongelmat Mallin lineaarisuus Instituutioita mittaavan indeksin ja asukasta kohdin lasketun bruttokansantuotteen välistä lineaarisuutta voidaan tutkia muodostamalla instituutioita mittaavan indeksin jakaumasta dummy-muuttujat D 1 D 2 D 3 ja D 4 : D 1 = indeksin arvot pienempiä tai yhtä suuria kuin 5125 D 2 = indeksin arvot välillä (5126; 675) D 3 = indeksin arvot välillä (676; 8375) D 4 = indeksin arvot suurempia tai yhtä suuria kuin 8376 (Acemoglu et al. 2000) Kun haluttu ominaisuus on läsnä dummy-muuttuja saa arvon yksi ja vastaavasti kun ominaisuus ei ole läsnä se saa arvon nolla. (Hill et al. 2012) Muuttujien lineaarisuuden selvittämiseksi muodostetaan regressiomalli siten että selitettävä muuttuja on taloudellista suorituskykyä mittaava muuttuja ja selittävinä muuttujina ovat dummy-muuttujat: ( ) ( ) ( ) ( ) missä log y i = selitettävä muuttuja = vakiotermi R i = nykyiset instituutiot β 1 = nykyisten instituutioiden kulmakerroin = ensimmäisen kvartaalin dummy-muuttuja = toisen kvartaalin dummy-muuttuja = kolmannen kvartaalin dummy-muuttuja = neljännen kvartaalin dummy-muuttuja ( ) = kulmakertoimet ja e = virhetermi. Muuttuja ( ) on interaktiomuuttuja joka kuvaa instituutioiden ja eri kvartaalien yhteisvaikutusta. (Hill et al. 2012) Vertailuryhmänä on ensimmäiseen kvartaaliin kuuluvat maat eli maat joilla on suurin julkisen vallan pakkolunastuksen riski. Hypoteesina on että indeksin arvon kasvaessa vaikutus taloudelliseen suorituskykyyn on positiivisesti suurempi. (Acemoglu et al. 2000)

26 Puuttuvat selittävät muuttujat Tutkimus tulee ongelmalliseksi jos mallista puuttuu oleellisia selittäviä muuttujia jotka ovat korreloituneet instituutioita mittaavan muuttujan kanssa. Instituutioita mittaavan muuttujan ja potentiaalisten mukaan otettavien muuttujien välistä korrelaatiota voidaan tutkia seuraavan yhtälön avulla: missä y = selitettävä muuttuja β 0 = vakiotermi x 1 = nykyiset instituutiot x 2 = ilmasto x 3 = maantiede x 4 = uskonto x 5 = luonnonvarat x 6 = maaperän laatu (β 1 β 6 ) = kulmakertoimet ja v = yhdistetty virhetermi. (Acemoglu et al. 2000) Jos yhdistetty virhetermi korreloi jonkun havaitsemattoman selittävän muuttujan kanssa instituutioita mittaava muuttuja on endogeeninen (Roberts & Whited 2011) Samanaikaisuusharha Acemoglu et al. (2000) esittävät että koska instituutioiden mittaus perustuu nykyisiin instituutioihin on todennäköistä että rikkailla talouksilla on varaa parempiin instituutioihin. Tällöin kausaalisuuden suunta on epäselvä: ei voida täsmällisesti sanoa vaikuttavatko instituutiot taloudelliseen suorituskykyyn vai taloudellinen suorituskyky instituutioihin. Tässä tutkielmassa ei keskitytä puuttuvien selittävien muuttujien aiheuttamaan endogeenisuusongelmaan eikä samanaikaisuusharhaan sillä Acemoglu et al. (2000) toteavat että suorittamassaan tutkimuksessa keskeisin endogeenisuutta aiheuttava ongelma on mittausvirhe Mittausvirhe Instituutiot on mitattu jälkikäteen ja sen vuoksi mittaukseen voi liittyä harha siitä että rikkaissa talouksissa oletetaan olevan parempia instituutioita. Instituutioiden mittarina on käytetty indeksiä joka mittaa julkisen vallan pakkolunastuksen riskiltä suojautumista asteikolla (Acemoglu et al. 2000) Kyseinen indeksi ei kuvaa nykyisiä ins-

27 24 tituutioita täsmällisesti eli se on instituutioiden proxy-muuttuja. Tällöin instituutioita mittaava muuttuja on korreloitunut virhetermin kanssa. (Hill et al. 2000) 5.5 Endogeenisuuden korjaus Jos mallissa on endogeenisuusongelma se voidaan korjata instrumenttimuuttujan avulla. Acemoglu et al. (2000) esittävät että eurooppalaisten kolonialistien kohtaamien kuolleisuuslukujen muutokset aiheuttavat mahdollisesti instituutioissa eksogeenista vaihtelua. Tämän perusteella kuolleisuusluvuista muodostetaan instrumenttimuuttuja instituutioille. Kuolleisuuslukujen ja instituutioiden välinen yhteys esitetään seuraavasti: missä R i = instituutioita mittaava indeksi = vakiotermi = kulmakerroin = kuolleisuuslukujen logaritmi = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja = virhetermi. Tämä instrumenttistrategia toimii vain jos instrumenttimuuttuja log M i täyttää kappaleessa määritetyt ehdot. Kun kuolleisuusluvuista otetaan logaritmi kuolleisuuslukujen ja instituutioita mittaavan muuttujan välillä on suhteellisen lineaarinen yhteys. (Acemoglu et al. 2000) Estimoidaan alkuperäinen yhtälö ja yllä mainittu yhtälö instrumenttimuuttujamenetelmällä kahdessa vaiheessa: (1) Ensimmäisessä vaiheessa selitetään endogeenista muuttujaa R i sen instrumenttimuuttujalla log M i ja eksogeenisilla muuttujilla: Yhtälöstä saadaan endogeenisen muuttujan estimaatti. (2) Sijoitetaan endogeenisen muuttujan estimaatti alkuperäiseen yhtälöön. Toisesta vaiheesta saadaan parametrien µ ja α instrumenttimuuttujaestimaattorit:

28 25 ( )( ) ( )( ) 5.6 Endogeenisuuden testaaminen Mallin endogeenisuutta voidaan testata Hausman-testin avulla. Tällöin nollahypoteesina on että instituutioita mittaava selittävä muuttuja ei korreloi virhetermin kanssa. Hausman-testi toteutetaan kahdessa vaiheessa: (1) Ensimmäisen vaiheen yhtälö on muotoa: missä R i = nykyiset instituutiot = vakiotermi = kolonialistien kohtaamat kuolleisuusluvut = edellisen kerroin = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja v = virhetermi. Ensimmäisen vaiheesta saadaan residuaaliksi: (2) Toiseen vaiheen yhtälö muodostetaan seuraavasti: Hausman-testin nollahypoteesin paikkansapitävyys testataan t-testillä. Jos kerroin k on tilastollisesti merkitsevä voidaan olettaa että instituutioita mittaava muuttuja on endogeeninen. Tällöin estimointi suoritetaan instrumenttimuuttujamenetelmän avulla. 6 Tutkimustulokset Tämän kappaleen taulukoihin on koottu kappaleessa 5.2. esitettyjen hypoteesien mukaisten testien tulokset. Tulokseni poikkeavat osittain alkuperäisen tutkimuksen tuloksista sillä käytössäni oleva aineisto on hieman erilainen. Taulukossa esitetään muuttujien osalta kaksi lukua: ensimmäinen kuvaa parametriestimaatin arvoa ja su-

29 26 luissa oleva luku on parametrin keskivirhe. Selitysaste kuvaa sitä kuinka paljon selittävä muuttuja kertoo selitettävän muuttujan vaihtelusta. (Hill et al. 2012) TAULUKKO 1. Pienimmän neliösumman estimaatit Hausman-testi ja instrumenttimuuttujaestimaatit hypoteesille Vakiotermi 476 (041) 735 (019) 804 (012) 914 (061) 178 (109) Julkisen vallan pakkolunastuksen riskiltä suojautuminen 051 (006) 097 (017) Julkisen vallan pakkolunastuksen riskiltä suojautumisen dummy toisessa kvartaalissa 030 (024) Julkisen vallan pakkolunastuksen riskiltä suojautumisen dummy kolmannessa kvartaalissa 119 (025) Julkisen vallan pakkolunastuksen riskiltä suojautumisen dummy neljännessä kvartaalissa 265 (039) Kolonialistien kohtaamat kuolleisuusluvut (log) -058 (013) Residuaali_Julkisen vallan pakkolunastuksen riskiltä suojautuminen 036 (009) Korjattu selitysaste (Adjusted R²) Taulukon 1 ensimmäisessä sarakkeessa esitetään taloudellisen suorituskyvyn ja nykyisten instituutioiden välistä yhteyttä kuvaavan hypoteesin tulokset. Estimointiin on käytetty pienimmän neliösumman menetelmää. Sekä vakiotermi että kulmakerroin

30 27 ovat tilastollisesti merkitseviä. Selitysaste kertoo että julkisen vallan pakkolunastuksen riskiltä suojautumista kuvaava muuttuja selittää noin puolet taloudellista suorituskykyä mittaavasta muuttujasta. Toisessa sarakkeessa on kuvattu edellä mainittujen muuttujien lineaarista yhteyttä tarkastelevan hypoteesin tulokset. Taulukosta nähdään toiseen kolmanteen ja neljänteen kvartaaliin kuuluvien maiden ero ensimmäiseen kvartaaliin kuuluviin maihin nähden. Taloudellisen suorituskyvyn ja instituutioiden välinen yhteys voidaan olettaa lineaariseksi sillä indikaattorimuuttujat saavat kertoimet odotetussa järjestyksessä: mitä voimakkaampaa suojautuminen julkisen vallan pakkolunastuksen riskiä vastaan on sitä suurempi positiivinen vaikutus sillä on taloudelliseen suorituskykyyn. Koska instituutioiden mittarina on käytetty proxy-muuttujaa on todennäköistä että mallissa on endogeenisuusongelma. Tämän selvittämiseksi olen suorittanut Hausman-testin vaikka kyseistä testiä ei alkuperäisessä tutkimuksessa ole suoritettu. Hausman-testin tulokset olen koonnut kolmanteen sarakkeeseen. Hausman-testin nollahypoteesi hylätään sillä residuaalin kerroin poikkeaa tilastollisesti merkittävästi nollasta. Tämä tarkoittaa että instituutioita mittaava muuttuja on endogeeninen ja korreloitunut mallin virhetermin kanssa. Tällöin ensimmäisessä sarakkeessa kuvatut pienimmän neliösumman estimaatit eivät ole luotettavia. Koska instituutioita mittaavan muuttujan ja taloudellisen suorituskyvyn välinen yhteys on lineaarinen voidaan endogeenisuus korjata instrumenttimuuttujan avulla (Wang & Hsiao 2011). Tutkimuksessa on käytetty instrumenttimuuttujana kolonialistien kohtaamia kuolleisuuslukuja. Kaksivaiheisen pienimmän neliösumman menetelmän ensimmäisen vaiheen tulokset ovat sarakkeessa 4 ja toisen vaiheen tulokset sarakkeessa 5. Tulokset esittävät että instituutioita mittaavan muuttujan vaikutus taloudelliseen suorituskykyyn on hieman suurempi kuin pienimmän neliösumman menetelmällä estimoitaessa. Tuloksista havaitaan myös että selitysaste on pienempi kuin sarakkeessa 1 esitetty selitysaste. Tämä tarkoittaa että instituutioiden vaihtelun vaikutus taloudelliseen suorituskykyyn oli arvioitu liian suureksi pienimmän neliösumman menetelmällä estimoitaessa.

31 28 TAULUKKO 2. Pienimmän neliösumman estimaatit hypoteeseille 2 3 ja 4. Selitettävä muuttuja: julkisen vallan pakkolunastuksen riskiltä suojautuminen Vakiotermi 566 (025) Kolonialismin aikana syntyneet instituutiot 033 (008) Korjattu selitysaste (Adjusted R²) 021 Selitettävä muuttuja: kolonialismin aikana syntyneet instituutiot Vakiotermi 127 (022) Kolonialistien asettuminen siirtomaahan 005 (001) Korjattu selitysaste (Adjusted R²) 045 Selitettävä muuttuja: Kolonialistien asettuminen siirtomaahan Vakiotermi 6362 (1006) Kolonialistien kohtaamat kuolleisuusluvut (208) Korjattu selitysaste (Adjusted R²) 026 Taulukossa 2 on esitetty muiden kuin taloudellisen suorituskyvyn ja nykyisten instituutioiden välistä yhteyttä kuvaavien hypoteesien tulokset. Taulukon ensimmäisessä osiossa on kuvattu kolonialismin aikaisten ja nykyisten instituutioiden välistä korrelaatiota. Keskimmäisessä osassa on tulokset hypoteesille joka esittää kolonialismin ai-

32 29 kaisten siirtomaiden riippuvuutta siitä pystyttiinkö kyseiseen maahan asettumaan. Viimeinen osio esittää kolonialistien kohtaamien kuolleisuuslukujen vaikutuksen siirtomaahan asettumiseen. Tuloksien perusteella voidaan päätellä että minkään hypoteesin selittävä muuttuja ei selitä kovinkaan paljoa selitettävän muuttujan vaihtelusta mutta muuttujat korreloivat keskenään. Tämän tutkielman pääpaino on taloudellisen suorituskyvyn ja siirtomaiden nykyisten instituutioiden välisessä suhteessa mutta sitä voisi laajentaa tarkastelemaan myös muiden muuttujien välisiä yhteyksiä. 7 Johtopäätökset Endogeenisuusongelma syntyy kun mallin selittävä muuttuja on korreloitunut virhetermin kanssa. Tällöin pienimmän neliösumman estimointimenetelmän avulla ei saada luotettavia tuloksia. Tämän vuoksi endogeenisuusongelmaa aiheuttavat tilanteet on tärkeä tuntea. Mittausvirhe kuvaa virheellisesti mitatun selittävän muuttujan ja virhetermin välistä korrelaatiota. Jos mallista puuttuu oleellisia selittäviä muuttujia malliin mukaan otettu selittävä muuttuja on endogeeninen jos se korreloi kyseisten puuttuvien selittävien muuttujien kanssa. Samanaikaisuusharhaa esiintyy moniyhtälömalleissa kun kausaalisuuden suunta ei ole selvä. Tällöin mallin sisällä määräytyvät endogeeniset muuttujat ovat korreloituneet yhtälöiden virhetermien kanssa. Kaikki nämä ongelmat voidaan ratkaista instrumenttimuuttujan avulla. Endogeenisuusongelmaa esiintyy hyvin arkipäiväisissä tilanteissa. Kappaleessa käsiteltiin esimerkkiä jossa henkilön koulutustason ja tulotason välillä havaittiin endogeenisuusongelma. Koulutustasoa mittaava muuttuja oli korvattu muuttujalla joka mittaa koulutukseen käytettyjä vuosia jolloin mallissa oli mittausvirhe. Endogeenisuusongelmaa käsiteltiin myös tarkastelemalla siirtomaiden instituutioiden ja taloudellisen suorituskyvyn välistä suhdetta jota Acemoglu et al. (2000) ovat tutkineet. Kuitenkin suuri osa analysoimani tutkimuksen sisällöstä jäi käsittelemättä. Tutkielmani pääpaino oli mittausvirheen aiheuttamassa endogeenisuusongelmassa. Sitä voisi laajentaa tarkastelemalla myös puuttuvien selittävien muuttujien aiheuttamaa endogeenisuusongelmaa sekä samanaikaisuusharhaa. Mallin identifioitavuutta voi-

33 30 taisiin tarkastella vaihtoehtoisten aineistojen avulla kuten Acemoglu et al. (2000) ovat tutkimuksessaan tehneet. Lisäksi tutkimuksen analysointia voisi kehittää edelleen siten että myös muiden kuin taloudellisen suorituskyvyn ja instituutioiden välistä yhteyttä tutkittaisiin tarkemmin. Instrumenttimuuttujan valinta voi olla erityisen ongelmallista. Tästä aiheesta on tehty valtavasti tutkimuksia ja jatkotutkimusten kannalta mielenkiintoista olisi tarkastella instrumenttimuuttujien pätevyyttä. Jos instrumenttimuuttuja on vain heikosti korreloitunut selittävän muuttujan kanssa instrumenttimuuttujaestimaattorit voivat olla harhaisia (Wang & Hsiao 2011). Tällöin instrumenttimuuttujamenetelmällä ei saada sen luotettavampia tuloksia kuin pienimmän neliösumman menetelmälläkään. Esimerkiksi koskien analysoimaani tutkimusta siirtomaiden instituutioiden vaikutuksesta taloudelliseen suorituskykyyn voitaisiin tutkia kuolleisuuslukujen pätevyyttä instrumenttimuuttujana. Endogeenisuusongelmaa voidaan tutkia hyvinkin laajasti. Mitä syvemmälle endogeenisuusongelman analysoinnissa edetään sitä luotettavampia tuloksia saadaan ja sitä paremmin voidaan ymmärtää erilaisia lineaarisia yhteyksiä.

34 31 LÄHDELUETTELO Acemoglu D. Johnson S. & Robinson J. A. (2000) The Colonial Origins of Comparative Development: An Empirical Investigation. Työpaperi National Bureau of Economic Research. Saatavilla Berkovitz D. & Hoekstra M. (2010) Does High School Quality Matter? University of Pittsburgh. Saatavilla Bound J. Jaeger D. A. & Baker R. M. (1995) Problems with Instrumental variables Estimation When the Correlation Between the Instruments and the Endogenous Explanatory Variable is Weak. American Statistical Association Greene W. H. (2003) Econometric Analysis. 5. p. Upper Saddle River Prentice Hall. Hill R. C. Griffiths W. E: & Lim G. C. (2012) Principles of Econometrics. 4. p. Hoboken John Wiley & Sons Inc. Roberts M. R. & Whited T. M. (2011) Endogeneity in Empirical Corporate Finance. Työpaperi University of Rochester. Saatavilla Staiger D. & Stock J. H. (1997) Instrumental Variables Regression with Weak Instruments. Econometrica Wang L. & Hsiao C. (2011) Method of Moments Estimation and Identifiability of Sem-iparametric Nonlinear Errors-in-variables Models. Journal of Econometrics

35 32 LIITTEET Liite 1: Tutkimuksen aineisto ja muuttujat Entinen siirtomaa Bruttokansantuote 1995 (log) Instituutiot 1995 Instituutiot 1900 Asettuminen siirtomaahan 1900 Kuolleisuus 1900 Algeria Angola Argentiina Australia Bahama Bangladesh Barbados Bolivia Brasilia Burkina Faso Chile Costa Rica Dominikaaninen tasavalta Egypti El Salvador Equador Etelä-Afrikka Etiopia Gambia Ghana Guatemala Guinea Guyana Haiti Honduras Hong Kong Indonesia Intia Jamaika Kamerun Kanada Kenia Keski-Afrikan liittovaltio Kolumbia

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Harjoitukset 6 :IV-mallit (Palautus )

Harjoitukset 6 :IV-mallit (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 6 :IV-mallit (Palautus 21.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1 Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä

Lisätiedot

3.6 Su-estimaattorien asymptotiikka

3.6 Su-estimaattorien asymptotiikka 3.6 Su-estimaattorien asymptotiikka su-estimaattorit ovat usein olleet puutteellisia : ne ovat usein harhaisia ja eikä ne välttämättä ole täystehokkaita asymptoottisilta ominaisuuksiltaan ne ovat yleensä

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

4.0.2 Kuinka hyvä ennuste on?

4.0.2 Kuinka hyvä ennuste on? Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

2. Teoriaharjoitukset

2. Teoriaharjoitukset 2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien

Lisätiedot

Harjoitukset 4 : Paneelidata (Palautus )

Harjoitukset 4 : Paneelidata (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3

Lisätiedot

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2004) 1 Yleinen lineaarinen malli Usean selittäjän lineaarinen regressiomalli Yleisen lineaarisen mallin matriisisesitys Yleisen

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Korrelaatiokertoinen määrittely 165

Korrelaatiokertoinen määrittely 165 kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

9. laskuharjoituskierros, vko 12-13, ratkaisut

9. laskuharjoituskierros, vko 12-13, ratkaisut 9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden 1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma

Lisätiedot

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät

Lisätiedot

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1 Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

Inversio-ongelmien laskennallinen peruskurssi Luento 2

Inversio-ongelmien laskennallinen peruskurssi Luento 2 Inversio-ongelmien laskennallinen peruskurssi Luento 2 Kevät 2012 1 Lineaarinen inversio-ongelma Määritelmä 1.1. Yleinen (reaaliarvoinen) lineaarinen inversio-ongelma voidaan esittää muodossa m = Ax +

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Otannasta ja mittaamisesta

Otannasta ja mittaamisesta Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016

Lisätiedot

Harjoitusten 4 vastaukset

Harjoitusten 4 vastaukset Harjoitusten 4 vastaukset 4.1. Prosessi on = 1 +, jossa»iid( 2 )ja =1 2. PNS estimaattori :lle on (" P P 2 ") = +( X X 2 ) 1 1. =1 Suluissa oleva termi on deterministinen ja suppenee vihjeen mukaan 2 6:teen.

Lisätiedot

Johdatus regressioanalyysiin

Johdatus regressioanalyysiin Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2007) 1 Johdatus regressioanalyysiin >> Regressioanalyysin lähtökohdat ja tavoitteet

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

Batch means -menetelmä

Batch means -menetelmä S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 1(9) Batch means -menetelmä Batch means -menetelmää käytetään hyvin yleisesti Simulointi suoritetaan tässä yhtenä pitkänä ajona olkoon simuloinnin

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Yleinen lineaarinen malli

Yleinen lineaarinen malli MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: 1 Määritelmä ja standardioletukset 2

Lisätiedot

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 018 Harjoitus B Ratkaisuehdotuksia Tehtäväsarja I 1 (Monisteen tehtävä 14) Olkoon f Y (y; θ) tilastollinen malli, jonka

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot