Harjoitukset 4 : Paneelidata (Palautus )

Samankaltaiset tiedostot
Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Harjoitukset 6 :IV-mallit (Palautus )

Harjoitukset 5 : Differences-in-Differences - mallit (Palautus )

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan tavallista kahden selittäjän regressiomallia

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Yleistetyistä lineaarisista malleista

Regressioanalyysi. Vilkkumaa / Kuusinen 1

HAVAITUT JA ODOTETUT FREKVENSSIT

Valinnanvapaus ja alueellinen saatavuus Kelan kuntoutuksessa. Visa Pitkänen Tutkija Kelan

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

TILASTOTIEDE KÄYTÄNNÖN TUTKIMUKSESSA, 8 10 OP Luennoi: yliopisto-opettaja Pekka Pere. Logaritmin muutos ja suhteellinen muutos

Harjoitus 9: Excel - Tilastollinen analyysi

Usean selittävän muuttujan regressioanalyysi

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Mat Tilastollisen analyysin perusteet, kevät 2007

Tarkastusmuistio Poliisin toimintojen yhdistäminen ja liikennevalvonnan määrä

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Regressioanalyysi. Kuusinen/Heliövaara 1

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

805306A Johdatus monimuuttujamenetelmiin, 5 op

Dynaamiset regressiomallit

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus regressioanalyysiin. Heliövaara 1

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

Mat Tilastollisen analyysin perusteet, kevät 2007

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa

Liite artikkeliin Intohimo tasa-arvoon

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Tilastollisen analyysin perusteet, kevät 2007

805306A Johdatus monimuuttujamenetelmiin, 5 op

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Til.yks. x y z

Aikasarjamallit. Pekka Hjelt

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Mat Tilastollisen analyysin perusteet, kevät 2007

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Haitallinen valikoituminen: Kahden tyypin malli

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Kvantitatiiviset menetelmät

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Pientalojen radonpitoisuuksien tilastollinen analyysi

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Sovellettu todennäköisyyslaskenta B

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

4.2 Useampi selittävä muuttuja (kertausta)

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA


Harjoitus 7: NCSS - Tilastollinen analyysi

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Capstone: Kerrostaloasuntojen hinnanmuodostumisen tutkiminen Helsingissä ja Espoossa käyttäen hedonistista regressiota

Digitaalinen markkinointi ja myynti Mitä DIVA meille kertoi?

4. www-harjoitusten mallivastaukset 2017

Sovellettu todennäköisyyslaskenta B

Til.yks. x y z

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Identifiointiprosessi

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Identifiointiprosessi

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tutkielmien arvosanat Helsingin yliopistossa

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

1. Tilastollinen malli??

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Tuhat Suomalaista Mainonnan neuvottelukunta Joulukuu SFS ISO20252 Sertifioitu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

SEM1, työpaja 2 ( )

Facebookin käyttäjien iän, sukupuolen ja asuinpaikan vaikutus. matkailumotivaatioihin ja aktiviteetteihin Juho Pesonen

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Transkriptio:

31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä kiinteiden vaikutusten paneelimallien käyttöön Elisa-aineiston avulla. Aineisto ja sen kuvaus löytyvät kurssin Mycourses-sivulta. Tehtävät voi tehdä 1-2 opiskelijan ryhmissä. Kumpikin opiskelija osallistuu kaikkien harjoituksen osien tekemiseen. Vaikka harjoitukset tehtäisiin yhdessä, vastaukset kirjoitetaan itsenäisesti ja palautetaan erikseen. Jokainen palauttaa vastauksensa Mycourses-sivuston kautta. Liittäkää käyttämänne Stata-koodi kommentoituna jokaisen tehtävän loppuun. 1. Kiinteiden vaikutusten mallit Taulukko 1: Tehtävän 1 regressiot (1) (2) (3) (4) ln(hinta) ln(hinta) ln(hinta) ln(hinta) ln(tulot) 0.103** 0.0382 0.0382 0.0384 (0.0411) (0.0481) (0.0481) (0.0481) ln(asukasluku) 0.0266*** 0.0251*** 0.0251*** 0.0248*** (0.00387) (0.00454) (0.00454) (0.00454) Sukupuoli(1:nainen,0=mies) -0.0727*** -0.0724*** -0.0724*** -0.0719*** (0.0110) (0.0110) (0.0110) (0.0110) Vakio 4.369*** 5.019*** 5.129*** 5.013*** (0.403) (0.479) (0.736) (0.479) Maakuntatason kiinteä vaikutus X X X Kuukausitason kiinteä vaikutus X N 19,914 19,914 19,914 19,914 R 2 0.006 0.004 0.008 0.008 (a) Suorita ols-regressio missä selität laitteen hinnan logaritmia kunnan asukasluvun logaritmilla, postinumero-alueen tulojen logaritmilla ja ostajan sukupuolella. Luo ostajan sukupuolta kuvaava muuttuja seuraavasti(1=nainen, 0=mies). Kuinka tulkitset mallin kertoimia? Taulukko 1 sisältää vastaukset tehtävän 1 kysymyksiin. Sarake 1 sisältää tämän kohdan vastauksen. Tuloilla ja asukasluvulla on positiivinen vaikutus ostetun laitteen hintaan. Prosentin lisäys tuloissa nostaa ostetun laitteen hintaa noin 0.10% verran ja prosentin kasvu asukasluvussa nostaa ostetun laitteen hintaa noin 0.027% verran. Naiset ostavat noin 7.3% halvempia laitteita kuin miehet. (b) Suorita a)-kohdan regressio kiinteiden vaikutusten regressiomallin avulla, missä hyödynnät maakuntatason kiinteitä vaikutuksia. Hyödynnä Statan xtreg-komentoa, xtset-komennon avulla voi määrittää mallin paneelimuuttujan. Miten tulokset muuttuvat verrattuna a)-kohtaan? Mitä hyötyä maakunta-tason kiinteiden vaikutuksien lisäämisestä on? Sarakkeessa 2 malliin lisätään maakuntaa kuvaavat kiinteät vaikutukset. Kiinteiden vaikutusten tulkinta on se, että kiinteät vaikutukset kontrolloivat kaikki maakuntakohtaiset tekijät jotka eivät muutu ajassa. Elisa-aineistossa ajanjakso on vuosi. Tällöin voidaan kuvitella, että esimerkiksi kuluttajien demografiset piirteet ja maakunnan työllisyystilanne eivät muutu paljoa vuoden 1

sisällä. Maakunta-tason havaitsemattoman heterogeenisuuden kontrolloiminen näyttää vaikuttavan eniten postinumero-tason tuloja kuvaavan muuttujan kertoimeen. Ilman kiinteitä vaikutuksia muuttujan kerroin oli 0.103 ja kiinteiden vaikutuksien kanssa kerroin on 0.0382. Samalla vaikutus muuttuu 5% tilastollisesti merkitsevästä vaikutuksesta ei-merkitseväksi vaikutukseksi. Myös asukasluvun kerroin pienentyy hiukan. Ols-mallin ja kiinteiden vaikutusten mallien vakiotermit eivät ole vertailukelpoisia, koska Stata raportoi keskimääräisen kiinteän vaikutuksen mallin vakiotermiksi. (c) Suorita a) kohdan regressio, niin että lisäät regressiomalliin maakuntaa kuvaavat indikaattorimuuttujat(luentojen dummy variable approach). Miten b) ja c) kohdan tulokset eroavat toisistaan? Sarakkeiden 1 ja 3 mallit ovat identtisiä selittävien muuttujien parametriestimaattien suhteen. Luentojen "dummy variable approach-lähestymistavan idea on se, että sen avulla voi estimoida kiinteiden vaikutusten mallin parametrit ja kiinteiden vaikutusten estimaatit. Jossain sovelluksissa myös itse kiinteät vaikutukset voivat olla tutkimuksen mielenkiinnonkohteita. Täydelliset regressiotaulukot löytyvät mallivastausten lopusta. Kiinteiden vaikutuksien malleissa Stata raportoi "vakiotermin", joka kuvaa kiinteän vaikutuksen keskiarvoa. Ols-mallin ja kiinteiden vaikutusten mallin vakiotermit eivät siis kuvaa samaa asiaa. (d) Suorita b) kohdan kiinteiden vaikutusten regressiomalli niin, että lisäät malliin laitteen ostokuukautta kuvaavat indikaattorimuuttujat. Tulkitse mallin kertoimia ja vertaa tuloksia b)-kohdan tuloksiin. Mitä hyötyä ostokuukautta kuvaavien indikaattorimuuttujien käyttämisestä on? Kun malliin lisätään ostokuukautta kuvaavat kiinteät vaikutukset niin silloin malli huomioi kuukausittaisen vaihtelun laitteiden hinnoissa, joka on sama kaikille laitteille. Indikaattorit kontrolloivat kuukausikohtaiset hintaan kohdistuvat shokit. Kuukausi-indikaattorien lisääminen malliin muuttaa hiukan jokaista mallin kerrointa. Esimerkiksi asukasluvun kerroin laskee 0.0003 verran. Tehtävän 1 malleista paras on taulukon 1 sarakkeessa 4 esitetty malli, koska malli huomio maakunta ja-kuukausitasolla havaitsemattomia tekijöitä, jotka vaikuttavat ostetun laitteen hintaan. 2. Saavatko vanhat asiakkaat parempia laitetarjouksia kuin uudet asiakkaat? 2

Taulukko 2: Tehtävän 2 regressiot (1) (2) (3) (4) ln(hinta) ln(hinta) ln(hinta) ln(hinta) Asiakasmuuttuja(0=uusi,1=vanha) -0.134*** -0.154*** -0.163*** -0.154*** (0.0113) (0.0165) (0.0172) (0.0165) Sukupuoli(1=nainen,0=mies) -0.0965*** -0.114*** -0.0965*** (0.0175) (0.0182) (0.0175) Asiakasmuuttuja*Sukupuoli 0.0357 0.0453* 0.0357 (0.0225) (0.0234) (0.0225) ASUKKAITA_1000_KUNNASSA XX XX Vakio 5.533*** 5.584*** 5.596*** 5.584*** (0.0212) (0.0232) (0.0240) (0.0232) Kuukausitason kiinteä vaikutus X X X X Kuntatason kiinteät vaikutukset X X X Postinumerotason kiinteät vaikutukset X N 19,917 19,917 19,956 19,917 R 2 0.011 0.013 0.014 0.013 (a) Luo aluksi muuttuja, mikä erottaa vanhat asiakkaat uusista asiakkaista(1=vanha asiakas,0=uusi asiakas). Kutsutaan tätä muuttujaa asiakasmuuttujaksi. Asiakasmuuttujan voi luoda asiakassuhteen pituutta kuvaavasta muuttujasta. Voit päättää itse miten toimit asiakassuhteiden kanssa joiden pituus saa arvon 0. Tämän lisäksi luo ostajan sukupuolta kuvaava muuttuja(1=nainen, 0=mies). Suorita regressio missä selität hinnan logaritmia asiakasmuuttujalla, ostokuukaudella ja kuntakohtaisella kiinteällä vaikutuksella. Hyödynnä tässä tehtävässä Statan xtreg-komentoa. Kuinka tulkitset asiakasmuuttujan kerrointa? Kurssikirjan sivut 277-286 käsittelevät interaktiotermien käyttöä regressioissa. Taulukon 2 sarake 1 pitää sisällään mallin, jossa laitteen hinnan logaritmia selitetään asiakasmuuttujalla ja kunta-ja kuukausitason kiinteillä vaikutuksilla. Tämän mallin mukaan vanhat asiakkaat saavat noin 13% halvempia tarjouksia kuin uudet asiakkaat. (b) Lisää a)-kohdan regressioon asiakkaan sukupuoli ja sukupuolen ja asiakasmuuttujan interaktio. Kuinka tulkitset asiakasmuuttujan, sukupuolen ja interaktiotermin kerrointa? Taulukon 2 sarake 2 malliin lisätään ostajan sukupuoli ja sukupuolen ja asiakasmuuttujan interaktio. Mallin mukainen asiakasmuuttujan kokonaisvaikutus hintaan on asiakasmuuttujan kerroin+ interaktiotermin kerroin jos asiakkaan sukupuoli on nainen. Interaktiotermi ei ole tilastollisesti merkitsevä 10%-tasolla. Tästä syystä vaikutus hintaan on -15.4%. Sukupuolen kokonaisvaikutus hintaan on sukupuolimuuttujan kerroin + interaktiotermin kerroin. Koska interaktiotermi ei ole merkitsevä, niin silloin sukupuolen kokonaisvaikutus hintaan tulee pelkästään sukupuolimuuttujan kertoimesta. Naiset ostavat noin 9.7% halvempia laitteita kuin miehet. (c) Suorita b)-kohdan regressio niin, että korvaat kuntatason kiinteän vaikutuksen postinumerotason kiinteällä vaikutuksella. Miten tulokset eroavat b)- ja c)-kohtien välillä? Mitkä tekijät voivat selittää eroja estimaattien välillä? Taulukon 2 sarakkeessa 3 mallin kiinteät vaikutukset vaihdetaan kuntatason vaikutuksista postinumerotason vaikutuksiin. Muutoksen seurauksena estimoitujen parametrien kertoimet muuttuvat hiukan ja nyt asiakasmuuttujan ja ostajan sukupuolen välinen interaktio on nyt tilastollisesti merkitsevä 10% tasolla. Samalla postinumero-alueella asuvat ihmiset ovat homogeeni- 3

sempi ryhmä kuin samassa kunnassa asuvat ihmiset. Tästä syystä postinumeroihin perustuvan kiinteän vaikutuksen käyttö kontrolloi useampia asioita kuin kuntaan perustuva kiinteä vaikutus. Mallin mukaan ostajan ollessa nainen hinta on 11.4% matalampi kuin jos ostaja olisi mies. Ostajan ollessa nainen, joka on myös vanha asiakas, hinta verrattuna miehiin on -0.114+0.046= 7%-matalampi. Vanhat asiakkaat saavat noin 16% halvempia tarjouksia kuin uudet asiakkaat. Jos vanha asiakas on nainen, niin silloin asiakas saa -16.3%+0.0453%=-12% matalampia tarjouksia kuin uudet asiakkaat. (d) Lisää b) kohdan regressioon kunnan asukasluku. Miksi asukasluvun kertoimen estimointi ei onnistu? Taulukon 2 sarakkeessa 4 malliin lisätään kunnan asukasluku. Asukasluvun parametriä ei pysty estimoimaan, kun mallissa on kuntaa kuvaavat kiinteät vaikutukset. Tämä johtuu siitä, että asukasluku ei vaihtele kunnan sisällä, jolloin käytettävä kiinteä vaikutus kontrolloi asukasluvun täysin. Tämän tehtävän tarkoitus on osoittaa, että kiinteiden vaikutuksien vuoksi malliin ei voi laittaa selittäjiä, jotka eivät vaihtele paneeliyksikön(kunta) sisällä. Taulukko 3: Kiinteät vaikutukset vs OLS tehtävässä 2 (1) (2) ln(hinta) ln(hinta) Asiakasmuuttuja(1=vanha,0=uusi) -0.163*** -0.158*** (0.0172) (0.0163) Sukupuoli(1=nainen,0=mies) -0.114*** -0.0965*** (0.0182) (0.0174) Asiakasmuuttuja*Sukupuoli 0.0458* 0.0361 (0.0234) (0.0224) Asukasluku 0.000220*** (2.76e-05) Vakio 5.595*** 5.554*** (0.0240) (0.0236) Postinumerotason kiinteät vaikutukset X Kuukausitason kiinteät vaikutukset X X Estimaattori Kiinteät vaikutukset OLS N 19,917 19,917 R 2 0.014 0.017 Suluissa keskivirheet Taulukko 3 havainnollistaa postinumerotason kiinteiden vaikutusten käyttöä verrattuna malliin, missä vastaavia kiinteitä vaikutuksia ei käytetä. Kiinteiden vaikutuksien käyttäminen tuo pieniä eroja mallien kertoimiin. Eroja on mahdollista selittää kaikilla hintaan vaikuttavilla tekijöillä, jotka eivät muutu ajassa. 3. Ostetaanko loppuvuodesta kalliimpia laitteita kuin muina ajankohtina? 4

Taulukko 4: Tehtävän 3 regressiot (1) (2) (3) ln(hinta) ln(hinta) ln(hinta) 1.Neljännes -0.0668*** 0.00101-0.00104 (0.0160) (0.0119) (0.0127) 2.Neljännes -0.0381** -0.0309*** -0.0391*** (0.0155) (0.0115) (0.0120) 3.Neljännes -0.0531*** -0.0126-0.0163 (0.0148) (0.0110) (0.0115) 2.Laitetyyppi 0.176*** (0.0252) 3.Laitetyyppi 0.586*** (0.0707) 1.Neljännes*2.Laitetyyppi -0.00883 (0.0379) 1.Neljännes*3.Laitetyyppi -0.0554 (0.0822) 2.Neljännes*2.Laitetyyppi 0.158*** (0.0444) 2.Neljännes*3.Laitetyyppi 0.0638 (0.0850) 3.Neljännes*2.Laitetyyppi 0.0865** (0.0394) 3.Neljännes*3.Laitetyyppi 0.0624 (0.0789) Vakio 5.504*** 6.112*** 5.540*** (0.0104) (0.0689) (0.0827) Kuntatason kiinteä vaikutus X X X Laitevalmistajatason kiinteä vaikutus X X N 19,917 19,917 19,917 R 2 0.001 0.458 0.466 (a) Luo aluksi muuttuja, joka kuvaa laitteen ostotapahtuman vuosineljännestä. Muodosta vuosineljännestä kuvaava indikaattorimuuttuja seuraavasti:kuukaudet 1-3=1,4-6=2,7-9=3,10-12=4. Suorita kiinteiden vaikutusten regressio, missä selität hinnan logaritmia vuosineljännes-indikaattoreilla(käytä vuoden viimeistä neljännestä vertailukohtana) ja kuntatason kiinteillä vaikutuksilla. Käytä tässä tehtävässä xtreg-komentoa. Kuinka tulkitset vuosineljännestä kuvaavien indikaattorien kertoimia? Taulukon 4 ensimmäinen sarake pitää sisällään regression missä laitteen hinnan logaritmia selitetään ostotapahtuman vuosineljännestä kuvaavilla indikaattoreilla. Indikaattorien perusteella laitteiden hinnat ovat vuosineljänneksinä 1-3 matalampia kuin viimeisellä vuosineljänneksellä. (b) Lisää a)-kohdan regressioon laitevalmistajaa kuvaavat indikaattorimuuttujat. Kuinka tulkitset ostotapahtuman vuosineljännestä kuvaavan muuttujan kertoimia? Taulukon 4 toisessa sarakkeessa malliin lisätään laitevalmistajaa kuvaavat kiinteät vaikutukset. Laitevalmistajan identiteetin kontrolloimisen jälkeen osa aiemmin havaituista hintaeroista katoaa. Nyt ainoastaan vuoden toisena neljänneksenä ostetaan halvempia laitteita kuin vuoden viimeisellä neljänneksellä. Samalla huomataan, että mallin selitysaste kasvaa noin 0.1%:n arvosta 45.8%. (c) Lisää b)-kohdan malliin laitetyyppi ja interaktio laitetyypin ja ostotapahtuman vuosineljännestä 5

kuvaavan muuttujan välillä. Miten tulkitset laitetyypin, vuosineljänneksen ja interaktiotermien kertoimia? Taulukon 4 kolmannessa sarakkeessa malliin lisätään vuosineljänneksen ja laitetyypin interaktio. Laitetyyppejä on 3 ja ensimmäinen laitetyyppi toimii nyt verrokkiryhmä. Laitetyypin ja vuosineljänneksen välisiä vaikutuksia laitteen hintaan tulkitaan seuraavasti: Toisen vuosineljänneksen hinnat ovat 3.9% halvemmat kuin viimeisellä neljänneksellä. Kun huomioidaan interaktiotermit, niin silloin tulkinta muuttuu toisen laitetyypin kohdalla. Tällöin toisen vuosineljänneksen hinta on noin 11%(-0.0391+0.158) korkeampi kuin joulukuun hinta jos kyseessä on toinen laitetyyppi. Kolmannen vuosineljänneksen tapauksessa vuosineljänneksen päävaikutus ei poikkea nollasta. Kuitenkin hinta on 8.65% korkeampi kuin viimeisellä neljänneksellä jos laitetyyppi on 2. Emme käsitelleet ensimmäisen vuosineljänneksen vaikutuksia, koska ensimmäisen neljänneksen tapauksessa päävaikutus ja interaktiotermi ovat aina ei-merkitseviä. Laitetyyppien tapauksessa ainoastaan toisen laitetyypin interaktiot ovat tilastollisesti merkitseviä. Tällöin tulkinta on seuraava: toinen laitetyyppi on keskimäärin 17.6% kalliimpi kuin ensimmäinen laitetyyppi. Vuoden toisena neljänneksenä toinen laitetyyppi on noin 33.8%(17.6%+15.8%) kalliimpi kuin ensimmäinen laitetyyppi. Vuoden kolmannella neljänneksellä toinen laitetyyppi on 26.25% (8.65%+17.6%) kalliimpi kuin ensimmäinen laitetyyppi. Interaktioiden käyttö antaa yksinkertaisen tavan mallintaa laitetyypin hinnan kehitystä vuoden sisällä. (d) Testaa laitevalmistajaa kuvaavien indikaattorimuuttujien yhteismerkitsevyyttä. Taulukko 5: Laitevalmistajien yhteismerkitsevyyden testaaminen F-testisuure 736.29 Testisuureen p-arvo 0.0000 Suoritetaan esimerkiksi edellisen kohdan regressio, missä laitevalmistajaa kuvaavat indikaattorit ovat selittäjinä. Tämän jälkeen muuttujien yhteismerkitsevyyttä on mahdollista testata. Laitevalmistajaa kuvaavat indikaattorimuuttujat ovat yhteismerkitseviä. Täydelliset regressiotaulukot 6

Taulukko 6: Tehtävän 1 täydellinen regressiotaulukko (1) (2) (3) (4) VARIABLES ln(hinta) ln(hinta) ln(hinta) ln(hinta) ln(tulot) 0.103** 0.0382 0.0382 0.0384 (0.0411) (0.0481) (0.0481) (0.0481) ln(asukasluku) 0.0266*** 0.0251*** 0.0251*** 0.0248*** (0.00387) (0.00454) (0.00454) (0.00454) Sukupuoli(1:nainen,0=mies) -0.0727*** -0.0724*** -0.0724*** -0.0719*** (0.0110) (0.0110) (0.0110) (0.0110) 2.Maakunta -0.131 3.Maakunta -0.0690 4.Maakunta -0.176 (0.549) 5.Maakunta -0.0916 (0.550) 6.Maakunta -0.103 7.Maakunta -0.179 (0.551) 8.Maakunta -0.163 9.Maakunta -0.137 10.Maakunta -0.0877 11.Maakunta -0.153 12.Maakunta -0.0178 13.Maakunta -0.111 14.Maakunta -0.136 15.Maakunta -0.183 16.Maakunta -0.141 17.Maakunta -0.0626 18.Maakunta -0.0920 (0.547) 19.Maakunta -0.0791 2.OSTOKUUKAUSI -0.00536 (0.0299) 3.OSTOKUUKAUSI -0.0610** (0.0287) 4.OSTOKUUKAUSI 0.0258 (0.0289) 5.OSTOKUUKAUSI 0.00356 (0.0285) 6.OSTOKUUKAUSI -0.0100 (0.0272) 7.OSTOKUUKAUSI 0.0122 (0.0268) 8.OSTOKUUKAUSI -0.0544** (0.0267) 9.OSTOKUUKAUSI 0.00651 (0.0276) 10.OSTOKUUKAUSI 0.141*** (0.0276) 11.OSTOKUUKAUSI -0.0200 (0.0265) 12.OSTOKUUKAUSI 0.0281 (0.0271) N 19,914 19,914 19,914 19,914 R 2 0.006 0.004 0.008 0.008 7

Taulukko 7: Tehtävä 2 täydellinen regressiotaulukko (1) (2) (3) (4) (5) ln(hinta) ln(hinta) ln(hinta) ln(hinta) ln(hinta) Asiakasmuuttuja -0.134*** -0.154*** -0.163*** -0.154*** -0.154*** (0.0113) (0.0165) (0.0172) (0.0165) (0.0165) Sukupuoli(1=nainen,0=mies) -0.0965*** -0.114*** -0.0965*** -0.0965*** (0.0175) (0.0182) (0.0175) (0.0175) Asiakasmuuttuja*Sukupuoli 0.0357 0.0458* 0.0357 0.0357 (0.0225) (0.0234) (0.0225) (0.0225) 2.OSTOKUUKAUSI -0.00135-0.00249-0.00248-0.00249-0.00249 (0.0300) (0.0300) (0.0312) (0.0300) (0.0300) 3.OSTOKUUKAUSI -0.0574** -0.0572** -0.0574* -0.0572** -0.0572** (0.0288) (0.0288) (0.0298) (0.0288) (0.0288) 4.OSTOKUUKAUSI 0.0330 0.0347 0.0359 0.0347 0.0347 (0.0290) (0.0290) (0.0300) (0.0290) (0.0290) 5.OSTOKUUKAUSI 0.00541 0.00585 0.00692 0.00585 0.00585 (0.0286) (0.0285) (0.0296) (0.0285) (0.0285) 6.OSTOKUUKAUSI 0.00307 0.00331 0.000229 0.00331 0.00331 (0.0273) (0.0272) (0.0283) (0.0272) (0.0272) 7.OSTOKUUKAUSI 0.0247 0.0248 0.0293 0.0248 0.0248 (0.0269) (0.0268) (0.0279) (0.0268) (0.0268) 8.OSTOKUUKAUSI -0.0339-0.0338-0.0302-0.0338-0.0338 (0.0268) (0.0268) (0.0279) (0.0268) (0.0268) 9.OSTOKUUKAUSI 0.0170 0.0169 0.0181 0.0169 0.0169 (0.0277) (0.0277) (0.0287) (0.0277) (0.0277) 10.OSTOKUUKAUSI 0.154*** 0.154*** 0.149*** 0.154*** 0.154*** (0.0278) (0.0277) (0.0288) (0.0277) (0.0277) 11.OSTOKUUKAUSI -0.00157 0.000165 0.00280 0.000165 0.000165 (0.0266) (0.0266) (0.0276) (0.0266) (0.0266) 12.OSTOKUUKAUSI 0.0310 0.0294 0.0243 0.0294 0.0294 (0.0272) (0.0271) (0.0282) (0.0271) (0.0271) ASUKKAITA_1000_KUNNASSA 0.00182 (1.183e+09) Vakio 5.533*** 5.584*** 5.595*** 5.285 5.584*** (0.0212) (0.0232) (0.0240) (1.950e+11) (0.0232) Kuntatason kiinteät vaikutukset X X X X Postinumerotason kiinteät vaikutukset X N 19,917 19,917 19,917 19,917 19,917 R 2 0.011 0.013 0.014 0.013 0.013 8

Taulukko 8: Tehtävän 3 täydelliset regressiotaulukot (1) (2) (3) ln(hinta) ln(hinta) ln(hinta) 1.Neljännes -0.0668*** 0.00101-0.00104 (0.0160) (0.0119) (0.0127) 2.Neljännes -0.0381** -0.0309*** -0.0391*** (0.0155) (0.0115) (0.0120) 3.Neljännes -0.0531*** -0.0126-0.0163 (0.0148) (0.0110) (0.0115) 2.Laitetyyppi 0.176*** (0.0252) 3.Laitetyyppi 0.586*** (0.0707) 1.Neljännes*2.Laitetyyppi -0.00883 (0.0379) 1.Neljännes*3.Laitetyyppi -0.0554 (0.0822) 2.Neljännes*2.Laitetyyppi 0.158*** (0.0444) 2.Neljännes*3.Laitetyyppi 0.0638 (0.0850) 3.Neljännes*2.Laitetyyppi 0.0865** (0.0394) 3.Neljännes*3.Laitetyyppi 0.0624 (0.0789) 2.Laitevalmistaja -1.049*** -0.475*** (0.0791) (0.0912) 3.Laitevalmistaja 0.310*** 0.861*** (0.0693) (0.0824) 4.Laitevalmistaja 0.0637 0.194* (0.0968) (0.0996) 5.Laitevalmistaja -1.240*** -0.665*** (0.100) (0.110) 6.Laitevalmistaja -2.667*** -2.097*** (0.613) (0.610) 7.Laitevalmistaja 0.131 0.408 (0.264) (0.268) 8.Laitevalmistaja 0.203** 0.173* (0.0973) (0.0968) 9.Laitevalmistaja -0.0484 0.527*** (0.0919) (0.102) 10.Laitevalmistaja -0.329*** 0.245*** (0.0714) (0.0847) 11.Laitevalmistaja -0.840*** -0.376*** (0.0704) (0.0835) 12.Laitevalmistaja -0.599*** -0.0230 (0.128) (0.136) 13.Laitevalmistaja -0.449*** 0.126 (0.0725) (0.0857) 14.Laitevalmistaja -0.411*** -0.306*** (0.0780) (0.0790) 15.Laitevalmistaja -1.255*** -0.680*** (0.0714) (0.0848) 16.Laitevalmistaja -0.242** 0.331*** (0.0967) (0.107) 17.Laitevalmistaja -1.425*** -0.850*** (0.0696) (0.0833) 18.Laitevalmistaja -2.707*** -2.133*** (0.265) (0.267) 19.Laitevalmistaja -0.799*** -0.242*** (0.0688) (0.0825) 20.Laitevalmistaja -0.182*** 0.387*** (0.0706) (0.0840) 21.Laitevalmistaja 0.515 1.088* (0.579) (0.576) 22.Laitevalmistaja -1.675*** -1.102*** (0.0979) (0.108) 23.Laitevalmistaja -1.675*** -1.103* (0.574) (0.572) Vakio 5.504*** 6.112*** 5.540*** (0.0104) (0.0689) (0.0827) N 19,917 19,917 19,917 R 2 0.001 0.458 0.466 9