Endogeenisuus lineaarisessa regressiossa. Endogeneity in linear regression
|
|
- Mikko Kahma
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 LAPPEENRANNAN TEKNILLINEN YLIOPISTO Kauppatieteellinen tiedekunta Kandidaatintutkielma Talousjohtaminen Endogeenisuus lineaarisessa regressiossa Endogeneity in linear regression Elsa Nyman
2 Sisällysluettelo 1 Johdanto Lineaarinen regressiomalli Pienimmän neliösumman menetelmä Endogeenisuusongelma Tilanteita joissa selittävä muuttuja ja virhetermi ovat korreloituneet Puuttuvat selittävät muuttujat Samanaikaisuusharha Mittausvirheet Miksi pienimmän neliösumman menetelmää ei voida käyttää? Momenttimenetelmä Instrumenttimuuttujamenetelmä eli kaksivaiheinen pienimmän neliösumman menetelmä Instrumenttimuuttujan pätevyyden testaaminen Endogeenisuuden testaaminen Esimerkki endogeenisuusongelmasta: tutkimus siirtomaiden instituutioiden vaikutuksesta maiden taloudelliseen suorituskykyyn Tutkimuksen taustaa Tutkimuksen hypoteesit Tutkimuksen aineisto ja muuttujat Tutkimuksessa ilmenevät ongelmat Mallin lineaarisuus Puuttuvat selittävät muuttujat Samanaikaisuusharha Mittausvirhe Endogeenisuuden korjaus Endogeenisuuden testaaminen Tutkimustulokset... 25
3 7 Johtopäätökset LIITTEET Liite 1: Tutkimuksen aineisto ja muuttujat... 32
4 1 1 Johdanto Tämän kandidaatintutkielman tarkoituksena on tarkastella lineaarisessa regressiomallissa esiintyvää endogeenisuusongelmaa. Tutkielmassa lähdetään liikkeelle lineaarisen regressiomallin ja sen parametrien yleisimmän estimointimenetelmän pienimmän neliösumman menetelmän määrittelystä. Jos jokin lineaarisen regressiomallin perusoletuksista ei ole voimassa pienimmän neliösumman menetelmällä ei saada luotettavia estimaatteja mallin parametreista (Hill Griffiths & Lim 2012). Tässä tutkielmassa keskitytään lineaarisen regressiomallin oletukseen jonka mukaan mallin selittävän muuttujan ja virhetermin välillä ei saa olla korrelaatiota. Jos kyseiset muuttujat ovat korreloituneet keskenään mallissa on endogeenisuusongelma ja parametrien estimointiin ei voida käyttää pienimmän neliösumman menetelmää (Hill et al. 2012). Pienimmän neliösumman menetelmä esitetään lyhyesti kappaleessa 3. Kappaleessa 4 kuvataan yleisimmät tilanteet jotka aiheuttavat regressiomallin endogeenisuusongelman: puuttuvat selittävät muuttujat samanaikaisuusharha ja mittausvirhe (Hill et al. 2012). Berkowitz & Hoekstra (2010) ovat tutkineet Yhdysvaltain parhaiden yksityisten lukioiden opiskelijoiden todennäköisyyttä päästä parhaimpiin yliopistoihin. Kyseisessä tutkimuksessa esitetään että saadut opiskelupaikat riippuvat kuitenkin myös muista seikoista joita ei ole otettu mallissa huomioon. Jos jokin näistä seikoista on korreloitunut tarkasteltavan henkilön lukiokoulutuksen tasoa mittaavan muuttujan kanssa mallissa on endogeenisuusongelma. Tätä puuttuvien selittävien muuttujien ongelmaa eli omitted variables ongelmaa tarkastellaan kappaleessa Kappaleessa esitetään moniyhtälömalleissa esiintyvä samanaikaisuusharha eli simultaneous bias ongelma hyödykkeen kysyntä- ja tarjontayhtälöiden avulla. Hyödykkeen hinnan ja vaihdetun määrän välinen kausaalisuus on epäselvä: ei voida selkeästi sanoa vaikuttaako hyödykkeen hinta vaihdettuun määrään vai päinvastoin. Taloudellisia muuttujia on vaikea mitata. Tällöin muuttuja on voitu korvata toisella muuttujalla joka ei mittaa täsmällisesti haluttua asiaa. Tämä johtaa siihen että mallissa on mittausvirhe eli errors-in-variables ongelma. (Hill et al. 2010) Kappalees-
5 2 sa tarkastellaan esimerkkiä jossa henkilön tulotason ja koulutustason välillä on endogeenisuusongelma johtuen koulutustason vaikeasta mitattavuudesta (Greene 2003). Edellisten esimerkkien perusteella voidaan todeta että endogeenisuusongelmaa esiintyy hyvinkin arkipäiväisissä tilanteissa. Näiden tilanteiden tunteminen on erityisen tärkeää kvantitatiivisessa tutkimuksessa jotta saadaan oikeanlaisia tuloksia. Endogeenisuusongelman tapauksessa pienimmän neliösumman menetelmällä saadaan harhaisia estimaatteja mallin parametreista. Mikäli endogeenisuusongelma havaitaan voidaan parametrit estimoida vaihtoehtoisella estimointimenetelmällä esimerkiksi kappaleessa esitetyllä instrumenttimuuttujamenetelmällä. (Hill et al. 2012) Acemoglu Johson ja Robinson (2000) ovat tutkineet siirtomaihin perustettujen instituutioiden ja maiden taloudellisen suorituskyvyn välisessä suhteessa ilmenevää endogeenisuusongelmaa. Tutkimus koostuu 71 maasta jotka ovat olleet eurooppalaisten siirtomaita 1900-luvulla. Acemoglu et al. (2000) esittävät että instituutioita mittaava muuttuja on mitattu virheellisesti ja siten korreloitunut mallin virhetermin kanssa. Tällöin pienimmän neliösumman menetelmällä saadut tulokset ovat harhaisia. Kappaleessa 5 analysoin kyseistä tutkimusta kappaleen 4 teoriarungon mukaisesti. Tutkimuksen mukaisten testien suorittamiseen olen käyttänyt tilastollista ohjelmistoa. Kappaleeseen 6 olen koonnut suorittamieni testien tulokset joista nähdään että mallissa ilmenee endogeenisuusongelma. Ilman tietoa endogeenisuutta aiheuttavista tekijöistä tutkimuksen tuloksista olisi todennäköisesti tehty virheellisiä päätelmiä. Kappaleessa 7 esitetään tutkielman johtopäätökset ja jatkotutkimusaiheet. 2 Lineaarinen regressiomalli Taloustieteissä ollaan kiinnostuneita yhden muuttujan vaihtelun vaikutuksesta toiseen muuttujaan. Yleinen tutkimuksen kohde on hinnan muutoksen vaikutus hyödykkeen vaihdettuun määrään. Lisäksi taloustieteissä pyritään ennustamaan yhden
6 3 muuttujan arvo kun toisen muuttujan arvo tunnetaan. Tällaisia ongelmia voidaan tutkia regressiomallin avulla. (Hill et al. 2012) Regressiomallissa yhtälön vasemmalla puolella on selitettävä muuttuja ja oikealla puolella siihen vaikuttavat tekijät. Yhden selittävän muuttujan lineaarinen regressiomalli on muotoa: missä y = selitettävä muuttuja β 0 = vakiotermi β 1 = kulmakerroin x = selittävä muuttuja ja e = virhetermi. Vakiotermi kertoo sen pisteen jossa regressio leikkaa koordinaatiston vertikaalisen akselin. Kulmakerroin kuvaa selittävän muuttujan vaihtelun vaikutusta selitettävään muuttujaan. Virhetermi sisältää muut selitettävään muuttujaan vaikuttavat tekijät. (Hill et al. 2012) Usean selittävän muuttujan lineaarinen regressiomalli on muotoa: missä y = selitettävä muuttuja β 0 = vakiotermi (x 1 x k ) = selittävät muuttujat ja e = virhetermi. Parametrit (β 1 β k ) kuvaavat kunkin selittävän muuttujan vaikutusta selitettävään muuttujaan. (Roberts & Whited 2011) Oletetaan esimerkiksi että henkilön korkeampi koulutustaso mahdollistaa korkeamman tulotason. Lineaarinen regressiomalli muodostetaan seuraavasti: missä β 0 = vakiotermi β 1 = kulmakerroin ja e = virhetermi. Vakiotermi kertoo tulotason alhaisimman mahdollisimman arvon. Kulmakerroin kuvaa sitä kuinka paljon koulutustason muutos vaikuttaa tulotasoon. (Greene 2003) Selitettävään muuttujaan vaikuttavat tekijät jaetaan kahteen komponenttiin: systemaattiseen komponenttiin ja satunnaiseen komponenttiin eli virhetermiin e.
7 4 Systemaattinen komponentti on selitettävän muuttujan odotusarvo eli selitettävän muuttujan saamien arvojen keskiarvo joka on painotettu arvojen todennäköisyyksillä. Systemaattisen komponentin odotusarvo on ehdollinen sillä se riippuu selittävän muuttujan saamista arvoista. Ehdollinen odotusarvo esitetään seuraavasti: ( ) missä E(y x) = selitettävän muuttujan odotusarvo selittävän muuttujan suhteen β 0 = vakiotermi β 1 = kulmakerroin ja x = selittävä muuttuja. Systemaattinen komponentti on matemaattinen odotus minkä vuoksi se ei ole satunnainen. (Hill et al. 2012) Selitettävä muuttuja ja satunnainen komponentti sen sijaan ovat satunnaisia. Tämä tarkoittaa että kyseisten muuttujien arvoja ei tiedetä ennen tutkimuksen suorittamista. Satunnainen komponentti esitetään selitettävän muuttujan ja systemaattisen komponentin erotuksena: ( ) Yhtälöstä nähdään että selitettävä muuttuja ja satunnainen komponentti eroavat toisistaan vain ei-satunnaisen systemaattisen komponentin verran. Tällöin satunnaisen komponentin odotusarvo on myös riippuvainen selittävän muuttujan saamista arvoista. Satunnaisen komponentin ehdollinen odotusarvo esitetään seuraavasti: ( ) ( ) ( ) missä E(e x) = virhetermin odotusarvo selittävän muuttujan suhteen E(y x) = selitettävän muuttujan odotusarvo selittävän muuttujan suhteen ja (β 0 + β 1 x) = systemaattinen komponentti. Yhtälöstä nähdään että virhetermin odotetaan olevan nolla. Tällöin lineaarinen regressio on muotoa y=β 0 +β 1 x ja voidaan olettaa että selitettävään muuttujaan vaikuttaa vain selittävä muuttuja x. Koska virhetermi kuvaa kaikkia niitä muita selitettävään muuttujaan vaikuttavia tekijöitä virhetermin poikkeaminen nollasta voi viitata siihen että mallista puuttuu merkittäviä selittäviä muuttujia. Toisaalta jos selittävä muuttuja on mitattu virheellisesti todellisen selittävän muuttujan vaikutus selitet-
8 5 tävään muuttujaan näkyy virhetermissä. Tällaisissa tapauksissa selittävää muuttujaa sanotaan endogeeniseksi. (Hill et al. 2012) 3 Pienimmän neliösumman menetelmä Yhden muuttujan lineaarisessa regressiomallissa tarkoituksena on ratkaista parametrit β 0 ja β 1 eli mallin vakiotermi ja kulmakerroin. Pienimmän neliösumman menetelmässä estimoitu suora muodostuu siten että vertikaalisen etäisyyden neliö jokaista aineiston arvoa vastaavasta pisteestä suoralle on mahdollisimman pieni. Vertikaalisten etäisyyksien neliöön korottamisella vältytään suurten negatiivisten etäisyyksien vaikutukselta. Saadun suoran vakiotermi b 0 ja kulmakerroin b 1 ovat pienimmän neliösumman estimaatit parametreista β 0 ja β 1. Estimoitu suora on muotoa: missä = estimoitu selitettävä muuttuja b 0 = vakiotermin estimaatti b 1 = kulmakertoimen estimaatti ja x i = selittävä muuttuja. Todellisen selitettävän muuttujan ja estimoidun selitettävän muuttujan etäisyyttä sanotaan pienimmän neliösumman residuaaliksi ja se esitetään seuraavan yhtälön avulla: missä = pienimmän neliösumman residuaali y i = selitettävä muuttuja ja = estimoitu selitettävä muuttuja. Pienimmän neliösumman estimaateille b 0 ja b 1 on ominaista että niiden residuaalien neliösumma on pienempi kuin minkä tahansa muun suoran residuaalien neliösumma. (Hill et al. 2012) Pienimmän neliösumman estimaatit saadaan etsimällä kaikista mahdollisista parametrien β 0 ja β 1 arvoista piste (b 0 b 1 ) jossa neliösummafunktio S(β 0 β 1 ) minimoituu seuraavan kaavan mukaisesti:
9 6 ( ) ( ) Kyseisessä pisteessä saadaan estimaattorit b 0 ja b 1 : b 0 = b 1 = ( )( ) ( ) missä ja. Ne ovat selitettävän muuttujan y ja selittävän muuttujan x havaintojen otoskeskiarvoja. Vakiotermi b 0 saadaan selitettävän muuttujan otoskeskiarvoa selittävästä yhtälöstä. Kulmakerrointa b 1 estimoivan yhtälön osoittajassa lasketaan yhteen tulo joka koostuu kahdesta komponentista: selittävän muuttujan x havaintojen poikkeamasta otoskeskiarvosta ja selitettävän muuttujan y havaintojen poikkeamasta otoskeskiarvosta. Näiden kahden komponentin tuloa sanotaan kovarianssiksi. Yhtälön nimittäjä koostuu osoittajan ensimmäisen komponentin neliöstä eli selittävän muuttujan havaintojen varianssien summasta. Pienimmän neliösumman estimaatit parametreille β 0 ja β 1 saadaan kun selitettävän muuttujan otosarvot y i ja selittävän muuttujan otosarvot x i sijoitetaan yllä oleviin yhtälöihin. (Hill et al. 2012) Lineaarisen regressiomallin oletusten pitäessä paikkansa pienimmän neliösumman estimaattori on paras lineaarinen harhaton estimaattori. Jos jokin oletus ei pidä paikkansa sanotaan että pienimmän neliösumman estimointimenetelmä ei ole konsistentti eli ristiriidaton. Endogeenisuusongelman tapauksessa satunnainen selittävä muuttuja korreloi virhetermin kanssa jolloin pienimmän neliösumman menetelmä ei ole paras lineaarinen harhaton estimointimenetelmä. Tällöin tulisi käyttää jotakin toista estimointimenetelmää. (Hill et al. 2012)
10 7 4 Endogeenisuusongelma Lineaarisessa regressiossa oletuksena on että virhetermin odotusarvo on nolla. Jos oletus pitää paikkansa selittävä muuttuja ei korreloi virhetermin kanssa ja sen sanotaan olevan eksogeeninen. Jos virhetermin odotusarvo poikkeaa nollasta ja se korreloi selittävän muuttujan kanssa sanotaan selittävää muuttujaa endogeeniseksi. Jos mallissa on endogeenisuusongelma pienimmän neliösumman estimaattorit eivät ole konsistentteja. (Hill et al. 2012) 4.1 Tilanteita joissa selittävä muuttuja ja virhetermi ovat korreloituneet Puuttuvat selittävät muuttujat Puuttuvilla selittävillä muuttujilla tarkoitetaan sellaisia muuttujia joilla on merkittävä vaikutus selitettävään muuttujaan mutta jotka on jätetty mallin ulkopuolelle. Tällöin kyseiset muuttujat eivät näy selittävissä muuttujissa vaan virhetermissä. Jos puuttuvat selittävät muuttujat eivät korreloi mukaan otettujen selittävien muuttujien kanssa pienimmän neliösumman estimaattorit ovat konsistentteja ja harhattomia. Endogeenisuusongelma syntyy jos kyseiset muuttujat ovat korreloituneita keskenään. Ongelmaa voidaan kuvata seuraavan yhtälön mukaisesti: missä y = selitettävä muuttuja β 0 = vakiotermi β 1 = kulmakerroin x = selittävä muuttuja w = havaitsematon selittävä muuttuja k = havaitsemattoman selittävän muuttujan kerroin ja e = virhetermi. Malli voidaan muotoilla seuraavasti: missä v = kw + e eli yhdistetty virhetermi. Jos havaitsematon selittävä muuttuja on korreloitunut mallin selittävän muuttujan kanssa myös yhdistetty virhetermi on korreloitunut selittävän muuttujan kanssa. Tällöin voidaan olettaa että korreloitunut selit-
11 8 tävä muuttuja on endogeeninen ja pienimmän neliösumman estimointimenetelmä tuottaa epäkonsistentteja estimaattoreita kaikista mallin parametreista. (Roberts & Whited 2011) Berkowitz & Hoekstra (2010) ovat tutkineet kuinka parhaat yksityiset lukiot vaikuttavat yliopistopaikkoihin Yhdysvalloissa. Tutkimuksen tulokset osoittavat että yksityisten koulujen vaikutus parhaiden yliopistopaikkojen saamiseen on suurempi kuin julkisten koulujen. Tätä yhteyttä voidaan kuvata seuraavan yhtälön avulla: missä x 1 = keskikoulun keskiarvo x 2 = muuttuja joka mittaa sitä onko tarkasteltava henkilö käynyt yksityistä koulua x 3 = pääsykoepisteet x 4 = muuttuja joka kertoo onko joku tarkasteltavan henkilön sukulaisista käynyt yksityistä koulua x 5 = vektori joka kuvaa muita selitettävään muuttujaan vaikuttavia muuttujia (esimerkiksi naapurusto tulot hakuvuosi) (β 0 β 5 ) = mallin parametrit ja e = virhetermi. Mallin endogeenisuusongelma syntyy jos jokin muuttujista (x2 x5) on korreloitunut muuttujan x1 kanssa. Berkowitzin ja Hoekstran (2010) tutkimuksen tuloksista voidaan todeta että yksityisten lukioiden oppilaat pääsevät todennäköisemmin parempiin yliopistoihin kuin julkisten lukioiden. Tuloksista havaitaan myös että mikään havaitsemattomista muuttujista ei korreloi tarkasteltavan henkilön koulutustasoa mittaavan muuttujan kanssa. Tällöin mallissa ei ole puuttuvien selittävien muuttujien aiheuttamaa endogeenisuusongelmaa ja pienimmän neliösumman menetelmä on konsistentti Samanaikaisuusharha Samanaikaisuusharha esiintyy moniyhtälömalleissa kun selitettävä muuttuja y ja jokin selittävistä muuttujista x k määräytyvät tasapainossa siten että voidaan sanoa sekä muuttujan x k vaikuttavan muuttujaan y että muuttujan y vaikuttavan muuttujaan x k (Roberts & Whited 2011). Samanaikaisuusharhaa voidaan havainnollistaa markkinoiden kysynnän ja tarjonnan tasapainon avulla. Kysyntä:
12 9 Tarjonta: missä Q = hyödykkeiden vaihdettu määrä P = hinta I = tulot α 1 ja α 2 = kysyntäfunktion kulmakertoimet β 1 = tarjontafunktion kulmakerroin e d = kysyntäfunktion virhetermi ja e s = tarjontafunktion virhetermi. Yhtälöryhmällä on kaksi yhteistä muuttujaa: selitettävä muuttuja Q ja selittävä muuttuja P. Nämä kaksi muuttujaa ovat endogeenisia sillä ne määräytyvät yhtälöryhmän sisällä. Kysyntäfunktiossa oleva selittävä muuttuja I sen sijaan on eksogeeninen muuttuja sillä se tulee järjestelmän ulkopuolelta. Yhtälön oikealla puolella oleva endogeeninen muuttuja P korreloi virhetermien e d ja e s kanssa minkä vuoksi pienimmän neliösumman menetelmä on harhainen ja epäkonsistentti. (Hill et al. 2012) Mittausvirheet Mallissa on mittausvirhe jos selittävä muuttuja on mitattu virheellisesti. Vaikeasti mitattavissa oleva muuttuja on voitu korvata toisella muuttujalla joka ei mittaa täsmällisesti haluttua asiaa. Kyseistä muuttujaa kutsutaan proxy- muuttujaksi. (Hill et al. 2012) Mittausvirhettä voidaan mallintaa seuraavanlaisella yhtälöllä: missä y = selitettävä muuttuja β 0 = vakiotermi = kulmakerroin = proxy-muuttuja ja e = virhetermi. Todellisen selittävän muuttujan vaikutusta selitettävään muuttujaan voidaan kuvata seuraavalla tavalla: missä y = selitettävä muuttuja = vakiotermi = kulmakerroin = vaikeasti mitattava muuttuja ja v = virhetermi johon sisältyy mittausvirhe. Vaikeasti mitattavan
13 10 selittävän muuttujan ja sen proxy-muuttujan välistä yhteyttä voidaan havainnollistaa seuraavasti. missä x = proxy-muuttuja x * = alkuperäinen selittävä muuttuja ja u = mittausvirhe. Tästä nähdään että proxy-muuttuja koostuu todellisen muuttujan ja mittausvirheen summasta eikä siten mittaa täsmällisesti haluttua ominaisuutta. (Hill et al. 2012) Todellisen selittävän muuttujan vaikutus näkyy virhetermissä (Roberts & Whited 2011). Tällöin proxy-muuttuja ja virhetermi ovat korreloituneet ja pienimmän neliösumman menetelmä ei ole konsistentti (Hill et al. 2012). Mittausvirheen havainnollistamiseksi oletetaan että kappaleessa 2 esitetyssä esimerkissä koulutustasoa on vaikea mitata. Ongelma voidaan esittää seuraavasti: missä β 0 = vakiotermi = kulmakerroin ja v = virhetermi johon sisältyy mittausvirhe. Mallin parametrien estimoimiseksi koulutustasoa mittaavan muuttujan voisi korvata mittarilla joka kuvaa opiskeluun käytettyjä vuosia. Tätä yhteyttä voidaan kuvata seuraavalla tavalla: missä u = mittausvirhe. Yhtälöstä nähdään että opiskeluaikaa mittaava muuttuja ei kuvaa täsmällisesti koulutustasoa sillä siihen sisältyy mittausvirhe u. Tällöin opiskeluaikaa mittaava muuttuja on korreloitunut virhetermin kanssa ja mallissa on endogeenisuusongelma. (Hill et al. 2012) Jos malli on lineaarinen muuttujien suhteen satunnainen mittausvirhe voidaan korjata vaihtoehtoisella instrumenttimuuttujamenetelmällä (Wang & Hsiao 2011).
14 Miksi pienimmän neliösumman menetelmää ei voida käyttää? Kun selittävä muuttuja ja virhetermi ovat korreloituneet mallissa on endogeenisuusongelma. Tällöin pienimmän neliösumman estimointimenetelmällä ei saada konsistentteja estimaatteja. Tämä voidaan todistaa algebrallisesti seuraavalla tavalla: (1) Muodostetaan lineaarisen regressiomallin y = β 0 +β 1 x+e ja sen systemaattisen osan β 0 +β 1 E(x) erotus. ( ) ( ) mistä saadaan: ( ) ( ) (2) Kerrotaan molemmat puolet tekijällä [(x-e(x)) ( ) ( ) ( ) ( ) (3) Muodostetaan yhtälön kaikista tekijöitä odotusarvot: ( ) ( ) ( ) ( ) (4) Edellinen yhtälö voidaan ilmaista myös seuraavalla tavalla: ( ) ( ) ( ) missä cov(xy) = E[x-E(x)][y-E(y)] var(x) = E[x-E(x)] 2 ja cov(xe) = E[x-E(x)]e. (5) Ratkaistaan parametri β 1 : ( ) ( ) ( ) ( ) Pienimmän neliösumman estimaattori ilmaistaan seuraavasti: ( )( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) Pienimmän neliösumman estimaattori on otoskovarianssin ja -varianssin osamäärä. Otoskoon kasvaessa otosvarianssi ja kovarianssi konvergoituvat todelliseen va-
15 12 rianssiin ja kovarianssiin siten että pienimmän neliösumman estimaattori b 1 konvergoituu todelliseen parametriin β 1. Jos selittävän muuttujan ja virhetermin kovarianssi on nolla parametri β 1 on muotoa: ( ) ( ) Pienimmän neliösumman estimaatti konvergoituu parametriin β 1 : ( ) ( ) ( ) ( ) Tällöin pienimmän neliösumman estimaattori on konsistentti. Jos selittävä muuttuja korreloi virhetermin kanssa parametri β 1 on muotoa: ( ) ( ) ( ) ( ) Tällöin pienimmän neliösumman estimaattori konvergoituu parametrin β 1 ja osamäärän ( ) ( ) summaan: ( ) ( ) ( ) ( ) ( ) ( ) Endogeenisuusongelman tapauksessa pienimmän neliösumman estimaattoriin liittyy selittävän muuttujan ja virhetermin kovarianssin ja selittävän muuttujan varianssin osamäärän suuruinen harha ja estimaatit ovat epäkonsistentteja. Jos selittävän muuttujan ja virhetermin välinen korrelaatio on positiivista pienimmän neliösumman menetelmä tuottaa liian suuria estimaatteja. Vastaavasti jos korrelaatio kyseisten muuttujien välillä on negatiivista saadaan estimointimenetelmällä todellista pienemmät estimaatit. (Hill et al. 2012) 4.3 Momenttimenetelmä Kun selittävä muuttuja on satunnainen ja korreloitunut virhetermin kanssa pienimmän neliösumman estimaattorit ovat harhaisia ja epäkonsistentteja. Tällöin estimointiin voidaan käyttää momenttimenetelmää. Kun kaikki lineaarisen regression olettamukset pitävät paikkansa momenttimenetelmä johtaa pienimmän neliösumman es-
16 13 timaattoriin. Jos mallissa on endogeenisuusongelma momenttimenetelmä johtaa instrumenttimuuttajamenetelmään eli kaksivaiheiseen pienimmän neliösumman menetelmään. (Hill et al. 2012) Momenttimenetelmässä satunnaismuuttujan k:nnes momentti on k:nteen potenssiin korotettu satunnaismuuttujan odotusarvo joka on keskiarvo äärettömistä kokeellisista tuloksista: ( ) missä Y= satunnaismuuttuja ja µ=keskiarvo. Vastaavasti k:nnes otosmomentti ilmaistaan seuraavasti: ( ) Momenttimenetelmässä m kappaletta populaatiomomentteja asetetaan yhtä suuriksi m kappaleen otosmomentin kanssa ja tällöin voidaan estimoida m kappaletta tuntemattomia parametreja. (Hill et al. 2012) Satunnaismuuttujan Y odotusarvo E(Y) ja varianssi var(y) ilmaistaan seuraavasti: ( ) ( ) ( ) ( ) Jotta voidaan estimoida populaation keskiarvo asetetaan ensimmäinen populaatiomomentti ja ensimmäinen otosmomentti yhtä suuriksi: missä = ensimmäinen populaatiomomentti = ensimmäinen otosmomentti ja = otoskeskiarvo. (Hill et al. 2012) Populaation varianssin estimoimiseksi korvataan toinen populaatiomomentti sen otosarvolla ja ensimmäinen momentti otoskeskiarvolla: var(y) = ( )
17 14 missä = = toinen otosmomentti = neliöön korotettu ensimmäinen otosmomentti = otoskeskiarvo. Populaation keskiarvon estimaatiksi saatiin otoskeskiarvo ja varianssin estimaatiksi otosvarianssi ( ). Momenttimenetelmällä estimoidut estimaattorit ovat konsistentteja ja konvergoituvat todellisiin parametriarvoihin suurissa otoksissa. (Hill et al. 2012) Lineaarisen regression oletuksista voidaan muotoilla momenttiehdot: (1) E(e) = 0 (2) E(xe) = 0 Kun kaksi populaatiomomenttia korvataan kahdella otosmomentilla saadaan kaksi yhtälöä joissa on kaksi tuntematonta parametria: ( ) ( ) Kun nämä yhtälöt ratkaistaan saadaan pienimmän neliösumman estimaattorit b 0 ja b 1 jotka on esitetty kappaleessa 3. Jos mallissa on endogeenisuusongelma momenttimenetelmä johtaa instrumenttimuuttujaestimaattoreihin. (Hill et al. 2012) Instrumenttimuuttujamenetelmä eli kaksivaiheinen pienimmän neliösumman menetelmä Toinen momenttiehto E(xe)=0 esittää että selittävä muuttuja ei saa korreloida virhetermin kanssa. Tällöin pienimmän neliösumman estimaattori ei ole konsistentti. Kuitenkin jos on olemassa jokin muuttuja z jolla on tietyt ominaisuudet voidaan momenttimenetelmän avulla saada konsistentteja estimaatteja. Muuttujaa z kutsutaan instrumenttimuuttujaksi sillä se toimii eräänlaisena instrumenttina mallissa. Instrumenttimuuttujalla ei saa olla suoraa vaikutusta selitettävään muuttujaan eikä se saa korreloida virhetermin kanssa eli sen tulee olla eksogeeninen. Lisäksi kyseisen muut-
18 15 tujan on korreloitava riittävän vahvasti endogeenisen muuttujan kanssa. Instrumenttimuuttujan avulla voidaan muodostaa kolmas momenttiehto: (3) ( ) mistä ilmenee että instrumenttimuuttuja ja virhetermi eivät saa korreloida keskenään. Ensimmäisen ja kolmannen momenttiehdon avulla saadaan estimaatit parametreille β 0 ja β 1. Korvaamalla kaksi momenttipopulaatiota kahdella otosmomentilla saadaan kaksi yhtälöä: ( ) ( ) Näiden yhtälöiden ratkaisu johtaa momenttimenetelmän estimaattoreihin joita kutsutaan instrumenttimuuttujaestimaattoreiksi: ( )( ) ( )( ) Estimoitu vakiotermi saadaan pienimmän neliösumman menetelmän tavoin selitettävän muuttujan otoskeskiarvoa selittävästä yhtälöstä. Kulmakertoimen instrumenttimuuttujaestimaattori eroaa pienimmän neliösumman vastaavasta estimaattorista siten että yhtälön osoittaja esittää selitettävän muuttujan ja instrumenttimuuttujan hajonnan yhteisvaihtelua ja nimittäjä selittävän muuttujan ja instrumenttimuuttujan yhteisvaihtelua. Parametrit ja ovat konsistentteja jos instrumenttimuuttujalle asetetut ehdot täyttyvät. (Hill et al. 2012) Usean muuttujan regressiomallissa instrumenttimuuttujaestimointi toteutetaan kahdessa vaiheessa: (1) Oletetaan että yhtälössä muuttuja on endogeeninen ja muuttujat (x 1 x k-1 ) ovat eksogeenisia. Endogeenisen muuttujan instrumenttimuuttujaa kuvataan symbolilla z 1. Ensimmäisen vaiheen yhtälössä
19 16 selitetään endogeenista muuttujaa sen instrumenttimuuttujalla ja kaikilla eksogeenisilla muuttujilla: missä x k = endogeeninen muuttuja = vakiotermin estimaatti (x 1 ) = selittävät eksogeeniset muuttujat ( ) = selittävien eksogeenisten muuttujien parametriestimaatit = instrumenttimuuttuja = instrumenttimuuttujan kerroin ja v = ensimmäisen vaiheen virhetermi. Yhtälö muodostetaan jokaiselle endogeeniselle muuttujalle erikseen. Koska kaikki yllä olevan yhtälön oikean puolen selittävistä muuttujista on eksogeenisia yhtälö voidaan estimoida pienimmän neliösumman menetelmällä. Tällöin saadaan endogeenisen selittävän muuttujan estimoitu yhtälö: (2) Toisessa vaiheessa korvataan alkuperäisen yhtälön endogeeninen muuttuja sen estimaatilla: missä y = selitettävä muuttuja = vakiotermi = kulmakerroin = estimoitu selittävä muuttuja ja = toisen vaiheen virhetermi. Yhtälöstä saadaan estimaattorit ja joita kutsutaan instrumenttimuuttujaestimaattoreiksi eli kaksivaiheisen pienimmän neliösumman estimaattoreiksi. (Hill et al. 2012) Instrumenttimuuttujan pätevyyden testaaminen Jos instrumenttimuuttuja korreloi virhetermin kanssa kolmas momenttiehto E(ze) = 0 ei täyty. Tällöin instrumenttimuuttuja ei ole pätevä eikä instrumenttimuuttujaestimaattorit ole konsistentteja. Instrumenttimuuttujien pätevyyttä voidaan arvioida jos instrumenttimuuttujia on vähintään yhtä monta kuin mahdollisia endogeenisia muuttujia. Usean selittävän muuttujan regressiomallissa instrumenttimuuttujan pätevyyttä voidaan testata seuraavalla tavalla: (1) Muodostetaan yhtälö siten että selittävinä muuttujina ovat instrumenttimuuttujat ja eksogeeniset muuttujat:
20 17 missä = selitettävä muuttuja = vakiotermi (x 1 x k ) = eksogeeniset selittävät muuttujat ( ) = eksogeenisten muuttujien parametrit ( z k ) = instrumenttimuuttujat ( ) = instrumenttimuuttujien parametrit ja v = virhetermi. (Roberts & Whited 2011) (2) Yhtälöstä saadaan residuaalit. (3) Muodostetaan jokaiselle instrumenttimuuttujalle yhtälö siten että selittävänä muuttujana on edellisessä vaiheessa saatu residuaali. (4) Arvioidaan instrumenttimuuttujan pätevyyttä otoskoolla kerrotun selitysasteen avulla. (Hill et al. 2012) Empiirisessä tutkimuksessa instrumenttimuuttujamenetelmässä käytettyjen instrumenttimuuttujien ja endogeenisten muuttujien välinen korrelaatio on usein heikkoa. (Staiger & Stock 1997). Tällöin saaduilla estimaateilla on suuret keskivirheet. Instrumenttimuuttujien käytössä voidaan havaita kaksi perusongelmaa. Ensiksi jos korrelaatio instrumenttimuuttujan ja endogeenisen selittävän muuttujan välillä on heikkoa instrumenttimuuttujaestimaattorit voivat olla epäkonsistentteja. Toiseksi äärellisissä otoksissa instrumenttimuuttujaestimaattorit ovat pienimmän neliösumman estimaattoreiden tapaan harhaisia kun instrumenttien ja endogeenisten muuttujien välinen selityskerroin lähenee nollaa. (Bound Jaeger & Baker 1995) 4.4 Endogeenisuuden testaaminen Jos selittävän muuttujan ja virhetermin välillä on korrelaatiota ei pienimmän neliösumman menetelmää voida käyttää. Pienimmän neliösumman menetelmälle vaihtoehtoinen estimointimenetelmä on instrumenttimuuttujamenetelmä. Jotta tiedetään mitä estimointimenetelmää voidaan käyttää tulee selittävän muuttujan ja virhetermin välinen korrelaatio selvittää. Tämä voidaan toteuttaa Hausman- testin avulla. Testin nollahypoteesina että selittävä muuttuja ja virhetermi eivät korreloi keskenään. Hausman-testi vertaa pienimmän neliösumman menetelmän ja instrumenttimuuttujamenetelmän toimivuutta.
21 18 Hausman- testi toteutetaan seuraavien vaiheiden mukaisesti: (1) Ensimmäisessä vaiheessa selitetään endogeenista muuttujaa kaikilla mallin eksogeenisilla muuttujilla ja instrumenttimuuttujilla: missä x = endogeeninen selittävä muuttuja = vakiotermi (z 1 z L ) = instrumenttimuuttujat ( ) = instrumenttimuuttujien kertoimet ja v = virhetermi. Yhtälö muodostetaan jokaiselle endogeeniselle muuttujalle erikseen. Ensimmäisestä vaiheesta saadaan residuaalit: (2) Ensimmäisen vaiheen residuaalit lisätään alkuperäiseen yhtälöön: missä y = selitettävä muuttuja = vakiotermi = kulmakerroin = selittävä muuttuja = ensimmäisen vaiheen residuaali = edellisen kerroin ja e = virhetermi. Kyseinen yhtälö estimoidaan pienimmän neliösumman menetelmällä ja Hausman-testin nollahypoteesin paikkansapitävyys ratkaistaan t-testin avulla. Jos kertoimen k estimaatti ei t-testin mukaan poikkea tilastollisesti merkittävästi nollasta Hausman-testin nollahypoteesi jää voimaan. Tällöin selittävän muuttujan ja virhetermin välillä ei ole korrelaatiota. Hausman-testin jäädessä voimaan sekä pienimmän neliösumman estimaattori että instrumenttimuuttujaestimaattori ovat konsistentteja. Näiden kahden estimaattorin ero konvergoituu nollaan suurissa otoksissa. Tällöin tulee käyttää tehokkaampaa pienimmän neliösumman estimaattoria. Vastaavasti jos kertoimen k estimaatti poikkeaa tilastollisesti merkitsevästi nollasta Hausman-testin nollahypoteesi hylätään ja selittävän muuttujan ja virhetermin välillä voidaan olettaa olevan korrelaatiota. Tämä johtaa siihen että pienimmän neliösumman menetelmä ei ole konsistentti ja on käytettävä instrumenttimuuttujaestimointimenetelmää. (Hill et al. 2012)
22 19 5 Esimerkki endogeenisuusongelmasta: tutkimus siirtomaiden instituutioiden vaikutuksesta maiden taloudelliseen suorituskykyyn 5.1 Tutkimuksen taustaa Acemoglu Johnson ja Robinson (2000) ovat tutkineet siirtomaihin perustettujen instituutioiden vaikutusta maiden taloudelliseen suorituskykyyn. Eurooppalaisten kolonisaatiostrategioiden välillä oli suuria eroja ja siten eri maihin syntyi erilaisia instituutioita. Kolonialismin aikana syntyneet siirtomaiden olosuhteet ja instituutiot ovat säilyneet maiden itsenäisyyden jälkeenkin. Paremmat instituutiot mahdollistavat investoimaan enemmän fyysiseen ja henkiseen pääomaan mikä johtaa parempaan taloudelliseen suorituskykyyn. (Acemoglu Johnson & Robinson 2000) Ääritapauksena eurooppalaiset loivat eristettyjä valtioita joiden instituutiot eivät toimineet yksityisen omistuksen puolesta eivätkä valvoneet julkisen vallan pakkolunastusta. Eristyneiden valtioiden päätarkoitus oli siirtää siirtomaiden resursseja eurooppalaisille kolonialisteille. Toisena ääritapauksena luotiin uuseurooppalais- valtioita joissa uudisasukkaat kopioivat eurooppalaisia instituutioita korostaen yksityisomistusta ja julkisen vallan valvontaa. (Acemoglu et al. 2000) Kolonisaatiostrategiaan vaikutti keskeisesti kysymys siitä pystyivätkö eurooppalaiset asettumaan siirtomaahan. Eurooppalaiset eivät voineet asettua maihin joissa kuolleisuus oli suurta jolloin todennäköisyys eristettyjen valtioiden luontiin oli suuri. (Acemoglu et al. 2000) 5.2 Tutkimuksen hypoteesit Tutkimuksen hypoteesit voidaan esittää seuraavien yhtälöiden avulla: 1. Siirtomaiden nykyiset instituutiot vaikuttavat maiden taloudelliseen suorituskykyyn:
23 20 missä log y i = asukasta kohti laskettu tulotaso = vakiotermi = nykyiset instituutiot = vektori joka kuvaa muita selittäviä muuttujia γ = edellisen kerroin ja e i = virhetermi. 2. Kolonialismin aikana syntyneet instituutiot ja nykyiset instituutiot korreloivat keskenään: missä = nykyiset instituutiot = vakiotermi = kulmakerroin = kolonialismin aikana syntyneet instituutiot = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja =virhetermi. 3. Kolonisaatiostrategia riippui siitä pystyivätkö eurooppalaiset asettumaan siirtomaahan: missä = kolonialismin aikana syntyneet instituutiot = vakiotermi = kulmakerroin = kolonialistien asettuminen siirtomaahan = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja = virhetermi. 4. Eurooppalaisten kolonialistien kohtaamat siirtomaiden kuolleisuusluvut vaikuttivat kyseiseen maahan asettumiseen: missä = kolonialistien asettuminen siirtomaahan = vakiotermi = kulmakerroin = kolonialistien kohtaamat kuolleisuusluvut = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja = virhetermi.
24 Tutkimuksen aineisto ja muuttujat Tutkimuksen otos koostuu 71 maasta jotka ovat olleet eurooppalaisten maiden siirtomaita 1900-luvulla. Kyseiset maat ja niiden eri muuttujien arvot on esitetty liitteen 1 taulukossa. Taloudellisen suorituskyvyn mittarina on käytetty dollarimääräistä asukasta kohdin laskettua bruttokansantuotetta vuonna Kyseinen mittari on peräisin World DataBank tietokannasta. Useiden muiden taloudellisten muuttujien tavoin bruttokansantuotteen jakauma on vino. Jotta jakauma olisi lähempänä normaalijakaumaa muuttujasta on tehty logaritmimuunnos. (Hill et al. 2012) Nykyisiä instituutioita on kuvattu indeksillä joka mittaa julkisen vallan pakkolunastuksen riskiltä suojautumista asteikolla Maat joissa kyseiseltä riskiltä suojautuminen oli heikointa saavat arvon nolla ja vastaavasti maat joissa riskiltä suojautuminen oli vahvinta saavat arvon 10. Odotuksena on että kolonialistien luomat eristetyt valtiot saisivat arvon nolla ja uuseurooppalais -valtiot arvon 10. (Acemoglu et al. 2000) Kolonialismin aikana syntyneitä instituutioita on mitattu indeksillä joka kuvaa toimeenpanovallan rajoittamista 1900-luvulla. Muuttuja saa arvoja väliltä 1-7. Mikäli maa ei ollut itsenäinen kyseisenä ajanjaksona se saa arvon yksi. Eurooppalaisten kolonialistien asettumista siirtomaahan on kuvattu mittarilla joka kertoo eurooppalaista alkuperää olevien henkilöiden prosenttiosuuden väestöstä luvulla. Kuolleisuuslukuja mittaava muuttuja kuvaa estimoituja kuolleisuuslukuja antaen maalle arvon väliltä Muuttujasta tehdään logaritmimuunnos jotta Afrikan maiden korkeilla kuolleisuusluvuilla ei ole liian suurta vaikutusta tulokseen (Acemoglu et al. 2000). Taloudellista suorituskykyä mittaavaa muuttujaa lukuun ottamatta aineistot ovat peräisin MIT Economics sivustolta.
25 Tutkimuksessa ilmenevät ongelmat Mallin lineaarisuus Instituutioita mittaavan indeksin ja asukasta kohdin lasketun bruttokansantuotteen välistä lineaarisuutta voidaan tutkia muodostamalla instituutioita mittaavan indeksin jakaumasta dummy-muuttujat D 1 D 2 D 3 ja D 4 : D 1 = indeksin arvot pienempiä tai yhtä suuria kuin 5125 D 2 = indeksin arvot välillä (5126; 675) D 3 = indeksin arvot välillä (676; 8375) D 4 = indeksin arvot suurempia tai yhtä suuria kuin 8376 (Acemoglu et al. 2000) Kun haluttu ominaisuus on läsnä dummy-muuttuja saa arvon yksi ja vastaavasti kun ominaisuus ei ole läsnä se saa arvon nolla. (Hill et al. 2012) Muuttujien lineaarisuuden selvittämiseksi muodostetaan regressiomalli siten että selitettävä muuttuja on taloudellista suorituskykyä mittaava muuttuja ja selittävinä muuttujina ovat dummy-muuttujat: ( ) ( ) ( ) ( ) missä log y i = selitettävä muuttuja = vakiotermi R i = nykyiset instituutiot β 1 = nykyisten instituutioiden kulmakerroin = ensimmäisen kvartaalin dummy-muuttuja = toisen kvartaalin dummy-muuttuja = kolmannen kvartaalin dummy-muuttuja = neljännen kvartaalin dummy-muuttuja ( ) = kulmakertoimet ja e = virhetermi. Muuttuja ( ) on interaktiomuuttuja joka kuvaa instituutioiden ja eri kvartaalien yhteisvaikutusta. (Hill et al. 2012) Vertailuryhmänä on ensimmäiseen kvartaaliin kuuluvat maat eli maat joilla on suurin julkisen vallan pakkolunastuksen riski. Hypoteesina on että indeksin arvon kasvaessa vaikutus taloudelliseen suorituskykyyn on positiivisesti suurempi. (Acemoglu et al. 2000)
26 Puuttuvat selittävät muuttujat Tutkimus tulee ongelmalliseksi jos mallista puuttuu oleellisia selittäviä muuttujia jotka ovat korreloituneet instituutioita mittaavan muuttujan kanssa. Instituutioita mittaavan muuttujan ja potentiaalisten mukaan otettavien muuttujien välistä korrelaatiota voidaan tutkia seuraavan yhtälön avulla: missä y = selitettävä muuttuja β 0 = vakiotermi x 1 = nykyiset instituutiot x 2 = ilmasto x 3 = maantiede x 4 = uskonto x 5 = luonnonvarat x 6 = maaperän laatu (β 1 β 6 ) = kulmakertoimet ja v = yhdistetty virhetermi. (Acemoglu et al. 2000) Jos yhdistetty virhetermi korreloi jonkun havaitsemattoman selittävän muuttujan kanssa instituutioita mittaava muuttuja on endogeeninen (Roberts & Whited 2011) Samanaikaisuusharha Acemoglu et al. (2000) esittävät että koska instituutioiden mittaus perustuu nykyisiin instituutioihin on todennäköistä että rikkailla talouksilla on varaa parempiin instituutioihin. Tällöin kausaalisuuden suunta on epäselvä: ei voida täsmällisesti sanoa vaikuttavatko instituutiot taloudelliseen suorituskykyyn vai taloudellinen suorituskyky instituutioihin. Tässä tutkielmassa ei keskitytä puuttuvien selittävien muuttujien aiheuttamaan endogeenisuusongelmaan eikä samanaikaisuusharhaan sillä Acemoglu et al. (2000) toteavat että suorittamassaan tutkimuksessa keskeisin endogeenisuutta aiheuttava ongelma on mittausvirhe Mittausvirhe Instituutiot on mitattu jälkikäteen ja sen vuoksi mittaukseen voi liittyä harha siitä että rikkaissa talouksissa oletetaan olevan parempia instituutioita. Instituutioiden mittarina on käytetty indeksiä joka mittaa julkisen vallan pakkolunastuksen riskiltä suojautumista asteikolla (Acemoglu et al. 2000) Kyseinen indeksi ei kuvaa nykyisiä ins-
27 24 tituutioita täsmällisesti eli se on instituutioiden proxy-muuttuja. Tällöin instituutioita mittaava muuttuja on korreloitunut virhetermin kanssa. (Hill et al. 2000) 5.5 Endogeenisuuden korjaus Jos mallissa on endogeenisuusongelma se voidaan korjata instrumenttimuuttujan avulla. Acemoglu et al. (2000) esittävät että eurooppalaisten kolonialistien kohtaamien kuolleisuuslukujen muutokset aiheuttavat mahdollisesti instituutioissa eksogeenista vaihtelua. Tämän perusteella kuolleisuusluvuista muodostetaan instrumenttimuuttuja instituutioille. Kuolleisuuslukujen ja instituutioiden välinen yhteys esitetään seuraavasti: missä R i = instituutioita mittaava indeksi = vakiotermi = kulmakerroin = kuolleisuuslukujen logaritmi = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja = virhetermi. Tämä instrumenttistrategia toimii vain jos instrumenttimuuttuja log M i täyttää kappaleessa määritetyt ehdot. Kun kuolleisuusluvuista otetaan logaritmi kuolleisuuslukujen ja instituutioita mittaavan muuttujan välillä on suhteellisen lineaarinen yhteys. (Acemoglu et al. 2000) Estimoidaan alkuperäinen yhtälö ja yllä mainittu yhtälö instrumenttimuuttujamenetelmällä kahdessa vaiheessa: (1) Ensimmäisessä vaiheessa selitetään endogeenista muuttujaa R i sen instrumenttimuuttujalla log M i ja eksogeenisilla muuttujilla: Yhtälöstä saadaan endogeenisen muuttujan estimaatti. (2) Sijoitetaan endogeenisen muuttujan estimaatti alkuperäiseen yhtälöön. Toisesta vaiheesta saadaan parametrien µ ja α instrumenttimuuttujaestimaattorit:
28 25 ( )( ) ( )( ) 5.6 Endogeenisuuden testaaminen Mallin endogeenisuutta voidaan testata Hausman-testin avulla. Tällöin nollahypoteesina on että instituutioita mittaava selittävä muuttuja ei korreloi virhetermin kanssa. Hausman-testi toteutetaan kahdessa vaiheessa: (1) Ensimmäisen vaiheen yhtälö on muotoa: missä R i = nykyiset instituutiot = vakiotermi = kolonialistien kohtaamat kuolleisuusluvut = edellisen kerroin = vektori joka kuvaa muita selittäviä muuttujia = edellisen kerroin ja v = virhetermi. Ensimmäisen vaiheesta saadaan residuaaliksi: (2) Toiseen vaiheen yhtälö muodostetaan seuraavasti: Hausman-testin nollahypoteesin paikkansapitävyys testataan t-testillä. Jos kerroin k on tilastollisesti merkitsevä voidaan olettaa että instituutioita mittaava muuttuja on endogeeninen. Tällöin estimointi suoritetaan instrumenttimuuttujamenetelmän avulla. 6 Tutkimustulokset Tämän kappaleen taulukoihin on koottu kappaleessa 5.2. esitettyjen hypoteesien mukaisten testien tulokset. Tulokseni poikkeavat osittain alkuperäisen tutkimuksen tuloksista sillä käytössäni oleva aineisto on hieman erilainen. Taulukossa esitetään muuttujien osalta kaksi lukua: ensimmäinen kuvaa parametriestimaatin arvoa ja su-
29 26 luissa oleva luku on parametrin keskivirhe. Selitysaste kuvaa sitä kuinka paljon selittävä muuttuja kertoo selitettävän muuttujan vaihtelusta. (Hill et al. 2012) TAULUKKO 1. Pienimmän neliösumman estimaatit Hausman-testi ja instrumenttimuuttujaestimaatit hypoteesille Vakiotermi 476 (041) 735 (019) 804 (012) 914 (061) 178 (109) Julkisen vallan pakkolunastuksen riskiltä suojautuminen 051 (006) 097 (017) Julkisen vallan pakkolunastuksen riskiltä suojautumisen dummy toisessa kvartaalissa 030 (024) Julkisen vallan pakkolunastuksen riskiltä suojautumisen dummy kolmannessa kvartaalissa 119 (025) Julkisen vallan pakkolunastuksen riskiltä suojautumisen dummy neljännessä kvartaalissa 265 (039) Kolonialistien kohtaamat kuolleisuusluvut (log) -058 (013) Residuaali_Julkisen vallan pakkolunastuksen riskiltä suojautuminen 036 (009) Korjattu selitysaste (Adjusted R²) Taulukon 1 ensimmäisessä sarakkeessa esitetään taloudellisen suorituskyvyn ja nykyisten instituutioiden välistä yhteyttä kuvaavan hypoteesin tulokset. Estimointiin on käytetty pienimmän neliösumman menetelmää. Sekä vakiotermi että kulmakerroin
30 27 ovat tilastollisesti merkitseviä. Selitysaste kertoo että julkisen vallan pakkolunastuksen riskiltä suojautumista kuvaava muuttuja selittää noin puolet taloudellista suorituskykyä mittaavasta muuttujasta. Toisessa sarakkeessa on kuvattu edellä mainittujen muuttujien lineaarista yhteyttä tarkastelevan hypoteesin tulokset. Taulukosta nähdään toiseen kolmanteen ja neljänteen kvartaaliin kuuluvien maiden ero ensimmäiseen kvartaaliin kuuluviin maihin nähden. Taloudellisen suorituskyvyn ja instituutioiden välinen yhteys voidaan olettaa lineaariseksi sillä indikaattorimuuttujat saavat kertoimet odotetussa järjestyksessä: mitä voimakkaampaa suojautuminen julkisen vallan pakkolunastuksen riskiä vastaan on sitä suurempi positiivinen vaikutus sillä on taloudelliseen suorituskykyyn. Koska instituutioiden mittarina on käytetty proxy-muuttujaa on todennäköistä että mallissa on endogeenisuusongelma. Tämän selvittämiseksi olen suorittanut Hausman-testin vaikka kyseistä testiä ei alkuperäisessä tutkimuksessa ole suoritettu. Hausman-testin tulokset olen koonnut kolmanteen sarakkeeseen. Hausman-testin nollahypoteesi hylätään sillä residuaalin kerroin poikkeaa tilastollisesti merkittävästi nollasta. Tämä tarkoittaa että instituutioita mittaava muuttuja on endogeeninen ja korreloitunut mallin virhetermin kanssa. Tällöin ensimmäisessä sarakkeessa kuvatut pienimmän neliösumman estimaatit eivät ole luotettavia. Koska instituutioita mittaavan muuttujan ja taloudellisen suorituskyvyn välinen yhteys on lineaarinen voidaan endogeenisuus korjata instrumenttimuuttujan avulla (Wang & Hsiao 2011). Tutkimuksessa on käytetty instrumenttimuuttujana kolonialistien kohtaamia kuolleisuuslukuja. Kaksivaiheisen pienimmän neliösumman menetelmän ensimmäisen vaiheen tulokset ovat sarakkeessa 4 ja toisen vaiheen tulokset sarakkeessa 5. Tulokset esittävät että instituutioita mittaavan muuttujan vaikutus taloudelliseen suorituskykyyn on hieman suurempi kuin pienimmän neliösumman menetelmällä estimoitaessa. Tuloksista havaitaan myös että selitysaste on pienempi kuin sarakkeessa 1 esitetty selitysaste. Tämä tarkoittaa että instituutioiden vaihtelun vaikutus taloudelliseen suorituskykyyn oli arvioitu liian suureksi pienimmän neliösumman menetelmällä estimoitaessa.
31 28 TAULUKKO 2. Pienimmän neliösumman estimaatit hypoteeseille 2 3 ja 4. Selitettävä muuttuja: julkisen vallan pakkolunastuksen riskiltä suojautuminen Vakiotermi 566 (025) Kolonialismin aikana syntyneet instituutiot 033 (008) Korjattu selitysaste (Adjusted R²) 021 Selitettävä muuttuja: kolonialismin aikana syntyneet instituutiot Vakiotermi 127 (022) Kolonialistien asettuminen siirtomaahan 005 (001) Korjattu selitysaste (Adjusted R²) 045 Selitettävä muuttuja: Kolonialistien asettuminen siirtomaahan Vakiotermi 6362 (1006) Kolonialistien kohtaamat kuolleisuusluvut (208) Korjattu selitysaste (Adjusted R²) 026 Taulukossa 2 on esitetty muiden kuin taloudellisen suorituskyvyn ja nykyisten instituutioiden välistä yhteyttä kuvaavien hypoteesien tulokset. Taulukon ensimmäisessä osiossa on kuvattu kolonialismin aikaisten ja nykyisten instituutioiden välistä korrelaatiota. Keskimmäisessä osassa on tulokset hypoteesille joka esittää kolonialismin ai-
32 29 kaisten siirtomaiden riippuvuutta siitä pystyttiinkö kyseiseen maahan asettumaan. Viimeinen osio esittää kolonialistien kohtaamien kuolleisuuslukujen vaikutuksen siirtomaahan asettumiseen. Tuloksien perusteella voidaan päätellä että minkään hypoteesin selittävä muuttuja ei selitä kovinkaan paljoa selitettävän muuttujan vaihtelusta mutta muuttujat korreloivat keskenään. Tämän tutkielman pääpaino on taloudellisen suorituskyvyn ja siirtomaiden nykyisten instituutioiden välisessä suhteessa mutta sitä voisi laajentaa tarkastelemaan myös muiden muuttujien välisiä yhteyksiä. 7 Johtopäätökset Endogeenisuusongelma syntyy kun mallin selittävä muuttuja on korreloitunut virhetermin kanssa. Tällöin pienimmän neliösumman estimointimenetelmän avulla ei saada luotettavia tuloksia. Tämän vuoksi endogeenisuusongelmaa aiheuttavat tilanteet on tärkeä tuntea. Mittausvirhe kuvaa virheellisesti mitatun selittävän muuttujan ja virhetermin välistä korrelaatiota. Jos mallista puuttuu oleellisia selittäviä muuttujia malliin mukaan otettu selittävä muuttuja on endogeeninen jos se korreloi kyseisten puuttuvien selittävien muuttujien kanssa. Samanaikaisuusharhaa esiintyy moniyhtälömalleissa kun kausaalisuuden suunta ei ole selvä. Tällöin mallin sisällä määräytyvät endogeeniset muuttujat ovat korreloituneet yhtälöiden virhetermien kanssa. Kaikki nämä ongelmat voidaan ratkaista instrumenttimuuttujan avulla. Endogeenisuusongelmaa esiintyy hyvin arkipäiväisissä tilanteissa. Kappaleessa käsiteltiin esimerkkiä jossa henkilön koulutustason ja tulotason välillä havaittiin endogeenisuusongelma. Koulutustasoa mittaava muuttuja oli korvattu muuttujalla joka mittaa koulutukseen käytettyjä vuosia jolloin mallissa oli mittausvirhe. Endogeenisuusongelmaa käsiteltiin myös tarkastelemalla siirtomaiden instituutioiden ja taloudellisen suorituskyvyn välistä suhdetta jota Acemoglu et al. (2000) ovat tutkineet. Kuitenkin suuri osa analysoimani tutkimuksen sisällöstä jäi käsittelemättä. Tutkielmani pääpaino oli mittausvirheen aiheuttamassa endogeenisuusongelmassa. Sitä voisi laajentaa tarkastelemalla myös puuttuvien selittävien muuttujien aiheuttamaa endogeenisuusongelmaa sekä samanaikaisuusharhaa. Mallin identifioitavuutta voi-
33 30 taisiin tarkastella vaihtoehtoisten aineistojen avulla kuten Acemoglu et al. (2000) ovat tutkimuksessaan tehneet. Lisäksi tutkimuksen analysointia voisi kehittää edelleen siten että myös muiden kuin taloudellisen suorituskyvyn ja instituutioiden välistä yhteyttä tutkittaisiin tarkemmin. Instrumenttimuuttujan valinta voi olla erityisen ongelmallista. Tästä aiheesta on tehty valtavasti tutkimuksia ja jatkotutkimusten kannalta mielenkiintoista olisi tarkastella instrumenttimuuttujien pätevyyttä. Jos instrumenttimuuttuja on vain heikosti korreloitunut selittävän muuttujan kanssa instrumenttimuuttujaestimaattorit voivat olla harhaisia (Wang & Hsiao 2011). Tällöin instrumenttimuuttujamenetelmällä ei saada sen luotettavampia tuloksia kuin pienimmän neliösumman menetelmälläkään. Esimerkiksi koskien analysoimaani tutkimusta siirtomaiden instituutioiden vaikutuksesta taloudelliseen suorituskykyyn voitaisiin tutkia kuolleisuuslukujen pätevyyttä instrumenttimuuttujana. Endogeenisuusongelmaa voidaan tutkia hyvinkin laajasti. Mitä syvemmälle endogeenisuusongelman analysoinnissa edetään sitä luotettavampia tuloksia saadaan ja sitä paremmin voidaan ymmärtää erilaisia lineaarisia yhteyksiä.
34 31 LÄHDELUETTELO Acemoglu D. Johnson S. & Robinson J. A. (2000) The Colonial Origins of Comparative Development: An Empirical Investigation. Työpaperi National Bureau of Economic Research. Saatavilla Berkovitz D. & Hoekstra M. (2010) Does High School Quality Matter? University of Pittsburgh. Saatavilla Bound J. Jaeger D. A. & Baker R. M. (1995) Problems with Instrumental variables Estimation When the Correlation Between the Instruments and the Endogenous Explanatory Variable is Weak. American Statistical Association Greene W. H. (2003) Econometric Analysis. 5. p. Upper Saddle River Prentice Hall. Hill R. C. Griffiths W. E: & Lim G. C. (2012) Principles of Econometrics. 4. p. Hoboken John Wiley & Sons Inc. Roberts M. R. & Whited T. M. (2011) Endogeneity in Empirical Corporate Finance. Työpaperi University of Rochester. Saatavilla Staiger D. & Stock J. H. (1997) Instrumental Variables Regression with Weak Instruments. Econometrica Wang L. & Hsiao C. (2011) Method of Moments Estimation and Identifiability of Sem-iparametric Nonlinear Errors-in-variables Models. Journal of Econometrics
35 32 LIITTEET Liite 1: Tutkimuksen aineisto ja muuttujat Entinen siirtomaa Bruttokansantuote 1995 (log) Instituutiot 1995 Instituutiot 1900 Asettuminen siirtomaahan 1900 Kuolleisuus 1900 Algeria Angola Argentiina Australia Bahama Bangladesh Barbados Bolivia Brasilia Burkina Faso Chile Costa Rica Dominikaaninen tasavalta Egypti El Salvador Equador Etelä-Afrikka Etiopia Gambia Ghana Guatemala Guinea Guyana Haiti Honduras Hong Kong Indonesia Intia Jamaika Kamerun Kanada Kenia Keski-Afrikan liittovaltio Kolumbia
Regressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
Lisätiedot1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset
TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotTilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotTA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET
TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen
LisätiedotJohdatus regressioanalyysiin. Heliövaara 1
Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotHarjoitukset 6 :IV-mallit (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 6 :IV-mallit (Palautus 21.3.2017) Tämän harjoituskerran tarkoitus on perehtyä
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotYhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1
Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
Lisätiedot1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
LisätiedotOletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen
Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä
Lisätiedot3.6 Su-estimaattorien asymptotiikka
3.6 Su-estimaattorien asymptotiikka su-estimaattorit ovat usein olleet puutteellisia : ne ovat usein harhaisia ja eikä ne välttämättä ole täystehokkaita asymptoottisilta ominaisuuksiltaan ne ovat yleensä
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
LisätiedotMTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)
21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.
LisätiedotOdotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
LisätiedotTilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
Lisätiedot1. Tutkitaan tavallista kahden selittäjän regressiomallia
TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa
Lisätiedot4.0.2 Kuinka hyvä ennuste on?
Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotAki Taanila YHDEN SELITTÄJÄN REGRESSIO
Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
Lisätiedotedellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾
ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos
Lisätiedot2. Teoriaharjoitukset
2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien
LisätiedotHarjoitukset 4 : Paneelidata (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3
LisätiedotJohdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2004) 1 Yleinen lineaarinen malli Usean selittäjän lineaarinen regressiomalli Yleisen lineaarisen mallin matriisisesitys Yleisen
LisätiedotJohdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle
LisätiedotKorrelaatiokertoinen määrittely 165
kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x
Lisätiedotxi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
LisätiedotJos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
Lisätiedot9. laskuharjoituskierros, vko 12-13, ratkaisut
9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
LisätiedotOtoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden
1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma
LisätiedotHarjoitukset 3 : Monimuuttujaregressio 2 (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät
LisätiedotVastepintamenetelmä. Kuusinen/Heliövaara 1
Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,
LisätiedotTilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
LisätiedotTodennäköisyyden ominaisuuksia
Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotInversio-ongelmien laskennallinen peruskurssi Luento 2
Inversio-ongelmien laskennallinen peruskurssi Luento 2 Kevät 2012 1 Lineaarinen inversio-ongelma Määritelmä 1.1. Yleinen (reaaliarvoinen) lineaarinen inversio-ongelma voidaan esittää muodossa m = Ax +
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
LisätiedotErityiskysymyksiä yleisen lineaarisen mallin soveltamisessa
Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotHAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
Lisätiedot7. laskuharjoituskierros, vko 10, ratkaisut
7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
LisätiedotTilastollisia peruskäsitteitä ja Monte Carlo
Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia
LisätiedotIlkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli
LisätiedotDynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman
LisätiedotTestit laatueroasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten
LisätiedotEstimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio
17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
LisätiedotTilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
LisätiedotJohdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
LisätiedotParametrin estimointi ja bootstrap-otanta
Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista
Lisätiedot031021P Tilastomatematiikka (5 op) kertausta 2. vk:een
031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11
Lisätiedot/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:
4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2
LisätiedotVALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotOtannasta ja mittaamisesta
Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,
LisätiedotLuento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja
1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma
LisätiedotMS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016
LisätiedotHarjoitusten 4 vastaukset
Harjoitusten 4 vastaukset 4.1. Prosessi on = 1 +, jossa»iid( 2 )ja =1 2. PNS estimaattori :lle on (" P P 2 ") = +( X X 2 ) 1 1. =1 Suluissa oleva termi on deterministinen ja suppenee vihjeen mukaan 2 6:teen.
LisätiedotJohdatus regressioanalyysiin
Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2007) 1 Johdatus regressioanalyysiin >> Regressioanalyysin lähtökohdat ja tavoitteet
LisätiedotA250A0050 Ekonometrian perusteet Tentti
A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5
MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai
LisätiedotAalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,
Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten
LisätiedotBatch means -menetelmä
S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 1(9) Batch means -menetelmä Batch means -menetelmää käytetään hyvin yleisesti Simulointi suoritetaan tässä yhtenä pitkänä ajona olkoon simuloinnin
LisätiedotMTTTP1, luento KERTAUSTA
26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotYleinen lineaarinen malli
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: 1 Määritelmä ja standardioletukset 2
Lisätiedotl (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on
HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 018 Harjoitus B Ratkaisuehdotuksia Tehtäväsarja I 1 (Monisteen tehtävä 14) Olkoon f Y (y; θ) tilastollinen malli, jonka
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
Lisätiedot/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:
2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2
LisätiedotOtoskoko 107 kpl. a) 27 b) 2654
1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää
Lisätiedot