Harjoitukset 4 : Paneelidata (Palautus )

Koko: px
Aloita esitys sivulta:

Download "Harjoitukset 4 : Paneelidata (Palautus )"

Transkriptio

1 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus ) Tämän harjoituskerran tarkoitus on perehtyä kiinteiden vaikutusten paneelimallien käyttöön Elisa-aineiston avulla. Aineisto ja sen kuvaus löytyvät kurssin Mycourses-sivulta. Tehtävät voi tehdä 1-2 opiskelijan ryhmissä. Kumpikin opiskelija osallistuu kaikkien harjoituksen osien tekemiseen. Vaikka harjoitukset tehtäisiin yhdessä, vastaukset kirjoitetaan itsenäisesti ja palautetaan erikseen. Jokainen palauttaa vastauksensa Mycourses-sivuston kautta. Liittäkää käyttämänne Stata-koodi kommentoituna jokaisen tehtävän loppuun. 1. Kiinteiden vaikutusten mallit Taulukko 1: Tehtävän 1 regressiot (1) (2) (3) (4) ln(hinta) ln(hinta) ln(hinta) ln(hinta) ln(tulot) 0.103** (0.0411) (0.0481) (0.0481) (0.0481) ln(asukasluku) *** *** *** *** ( ) ( ) ( ) ( ) Sukupuoli(1:nainen,0=mies) *** *** *** *** (0.0110) (0.0110) (0.0110) (0.0110) Vakio 4.369*** 5.019*** 5.129*** 5.013*** (0.403) (0.479) (0.736) (0.479) Maakuntatason kiinteä vaikutus X X X Kuukausitason kiinteä vaikutus X N 19,914 19,914 19,914 19,914 R (a) Suorita ols-regressio missä selität laitteen hinnan logaritmia kunnan asukasluvun logaritmilla, postinumero-alueen tulojen logaritmilla ja ostajan sukupuolella. Luo ostajan sukupuolta kuvaava muuttuja seuraavasti(1=nainen, 0=mies). Kuinka tulkitset mallin kertoimia? Taulukko 1 sisältää vastaukset tehtävän 1 kysymyksiin. Sarake 1 sisältää tämän kohdan vastauksen. Tuloilla ja asukasluvulla on positiivinen vaikutus ostetun laitteen hintaan. Prosentin lisäys tuloissa nostaa ostetun laitteen hintaa noin 0.10% verran ja prosentin kasvu asukasluvussa nostaa ostetun laitteen hintaa noin 0.027% verran. Naiset ostavat noin 7.3% halvempia laitteita kuin miehet. (b) Suorita a)-kohdan regressio kiinteiden vaikutusten regressiomallin avulla, missä hyödynnät maakuntatason kiinteitä vaikutuksia. Hyödynnä Statan xtreg-komentoa, xtset-komennon avulla voi määrittää mallin paneelimuuttujan. Miten tulokset muuttuvat verrattuna a)-kohtaan? Mitä hyötyä maakunta-tason kiinteiden vaikutuksien lisäämisestä on? Sarakkeessa 2 malliin lisätään maakuntaa kuvaavat kiinteät vaikutukset. Kiinteiden vaikutusten tulkinta on se, että kiinteät vaikutukset kontrolloivat kaikki maakuntakohtaiset tekijät jotka eivät muutu ajassa. Elisa-aineistossa ajanjakso on vuosi. Tällöin voidaan kuvitella, että esimerkiksi kuluttajien demografiset piirteet ja maakunnan työllisyystilanne eivät muutu paljoa vuoden 1

2 sisällä. Maakunta-tason havaitsemattoman heterogeenisuuden kontrolloiminen näyttää vaikuttavan eniten postinumero-tason tuloja kuvaavan muuttujan kertoimeen. Ilman kiinteitä vaikutuksia muuttujan kerroin oli ja kiinteiden vaikutuksien kanssa kerroin on Samalla vaikutus muuttuu 5% tilastollisesti merkitsevästä vaikutuksesta ei-merkitseväksi vaikutukseksi. Myös asukasluvun kerroin pienentyy hiukan. Ols-mallin ja kiinteiden vaikutusten mallien vakiotermit eivät ole vertailukelpoisia, koska Stata raportoi keskimääräisen kiinteän vaikutuksen mallin vakiotermiksi. (c) Suorita a) kohdan regressio, niin että lisäät regressiomalliin maakuntaa kuvaavat indikaattorimuuttujat(luentojen dummy variable approach). Miten b) ja c) kohdan tulokset eroavat toisistaan? Sarakkeiden 1 ja 3 mallit ovat identtisiä selittävien muuttujien parametriestimaattien suhteen. Luentojen "dummy variable approach-lähestymistavan idea on se, että sen avulla voi estimoida kiinteiden vaikutusten mallin parametrit ja kiinteiden vaikutusten estimaatit. Jossain sovelluksissa myös itse kiinteät vaikutukset voivat olla tutkimuksen mielenkiinnonkohteita. Täydelliset regressiotaulukot löytyvät mallivastausten lopusta. Kiinteiden vaikutuksien malleissa Stata raportoi "vakiotermin", joka kuvaa kiinteän vaikutuksen keskiarvoa. Ols-mallin ja kiinteiden vaikutusten mallin vakiotermit eivät siis kuvaa samaa asiaa. (d) Suorita b) kohdan kiinteiden vaikutusten regressiomalli niin, että lisäät malliin laitteen ostokuukautta kuvaavat indikaattorimuuttujat. Tulkitse mallin kertoimia ja vertaa tuloksia b)-kohdan tuloksiin. Mitä hyötyä ostokuukautta kuvaavien indikaattorimuuttujien käyttämisestä on? Kun malliin lisätään ostokuukautta kuvaavat kiinteät vaikutukset niin silloin malli huomioi kuukausittaisen vaihtelun laitteiden hinnoissa, joka on sama kaikille laitteille. Indikaattorit kontrolloivat kuukausikohtaiset hintaan kohdistuvat shokit. Kuukausi-indikaattorien lisääminen malliin muuttaa hiukan jokaista mallin kerrointa. Esimerkiksi asukasluvun kerroin laskee verran. Tehtävän 1 malleista paras on taulukon 1 sarakkeessa 4 esitetty malli, koska malli huomio maakunta ja-kuukausitasolla havaitsemattomia tekijöitä, jotka vaikuttavat ostetun laitteen hintaan. 2. Saavatko vanhat asiakkaat parempia laitetarjouksia kuin uudet asiakkaat? 2

3 Taulukko 2: Tehtävän 2 regressiot (1) (2) (3) (4) ln(hinta) ln(hinta) ln(hinta) ln(hinta) Asiakasmuuttuja(0=uusi,1=vanha) *** *** *** *** (0.0113) (0.0165) (0.0172) (0.0165) Sukupuoli(1=nainen,0=mies) *** *** *** (0.0175) (0.0182) (0.0175) Asiakasmuuttuja*Sukupuoli * (0.0225) (0.0234) (0.0225) ASUKKAITA_1000_KUNNASSA XX XX Vakio 5.533*** 5.584*** 5.596*** 5.584*** (0.0212) (0.0232) (0.0240) (0.0232) Kuukausitason kiinteä vaikutus X X X X Kuntatason kiinteät vaikutukset X X X Postinumerotason kiinteät vaikutukset X N 19,917 19,917 19,956 19,917 R (a) Luo aluksi muuttuja, mikä erottaa vanhat asiakkaat uusista asiakkaista(1=vanha asiakas,0=uusi asiakas). Kutsutaan tätä muuttujaa asiakasmuuttujaksi. Asiakasmuuttujan voi luoda asiakassuhteen pituutta kuvaavasta muuttujasta. Voit päättää itse miten toimit asiakassuhteiden kanssa joiden pituus saa arvon 0. Tämän lisäksi luo ostajan sukupuolta kuvaava muuttuja(1=nainen, 0=mies). Suorita regressio missä selität hinnan logaritmia asiakasmuuttujalla, ostokuukaudella ja kuntakohtaisella kiinteällä vaikutuksella. Hyödynnä tässä tehtävässä Statan xtreg-komentoa. Kuinka tulkitset asiakasmuuttujan kerrointa? Kurssikirjan sivut käsittelevät interaktiotermien käyttöä regressioissa. Taulukon 2 sarake 1 pitää sisällään mallin, jossa laitteen hinnan logaritmia selitetään asiakasmuuttujalla ja kunta-ja kuukausitason kiinteillä vaikutuksilla. Tämän mallin mukaan vanhat asiakkaat saavat noin 13% halvempia tarjouksia kuin uudet asiakkaat. (b) Lisää a)-kohdan regressioon asiakkaan sukupuoli ja sukupuolen ja asiakasmuuttujan interaktio. Kuinka tulkitset asiakasmuuttujan, sukupuolen ja interaktiotermin kerrointa? Taulukon 2 sarake 2 malliin lisätään ostajan sukupuoli ja sukupuolen ja asiakasmuuttujan interaktio. Mallin mukainen asiakasmuuttujan kokonaisvaikutus hintaan on asiakasmuuttujan kerroin+ interaktiotermin kerroin jos asiakkaan sukupuoli on nainen. Interaktiotermi ei ole tilastollisesti merkitsevä 10%-tasolla. Tästä syystä vaikutus hintaan on -15.4%. Sukupuolen kokonaisvaikutus hintaan on sukupuolimuuttujan kerroin + interaktiotermin kerroin. Koska interaktiotermi ei ole merkitsevä, niin silloin sukupuolen kokonaisvaikutus hintaan tulee pelkästään sukupuolimuuttujan kertoimesta. Naiset ostavat noin 9.7% halvempia laitteita kuin miehet. (c) Suorita b)-kohdan regressio niin, että korvaat kuntatason kiinteän vaikutuksen postinumerotason kiinteällä vaikutuksella. Miten tulokset eroavat b)- ja c)-kohtien välillä? Mitkä tekijät voivat selittää eroja estimaattien välillä? Taulukon 2 sarakkeessa 3 mallin kiinteät vaikutukset vaihdetaan kuntatason vaikutuksista postinumerotason vaikutuksiin. Muutoksen seurauksena estimoitujen parametrien kertoimet muuttuvat hiukan ja nyt asiakasmuuttujan ja ostajan sukupuolen välinen interaktio on nyt tilastollisesti merkitsevä 10% tasolla. Samalla postinumero-alueella asuvat ihmiset ovat homogeeni- 3

4 sempi ryhmä kuin samassa kunnassa asuvat ihmiset. Tästä syystä postinumeroihin perustuvan kiinteän vaikutuksen käyttö kontrolloi useampia asioita kuin kuntaan perustuva kiinteä vaikutus. Mallin mukaan ostajan ollessa nainen hinta on 11.4% matalampi kuin jos ostaja olisi mies. Ostajan ollessa nainen, joka on myös vanha asiakas, hinta verrattuna miehiin on = 7%-matalampi. Vanhat asiakkaat saavat noin 16% halvempia tarjouksia kuin uudet asiakkaat. Jos vanha asiakas on nainen, niin silloin asiakas saa -16.3% %=-12% matalampia tarjouksia kuin uudet asiakkaat. (d) Lisää b) kohdan regressioon kunnan asukasluku. Miksi asukasluvun kertoimen estimointi ei onnistu? Taulukon 2 sarakkeessa 4 malliin lisätään kunnan asukasluku. Asukasluvun parametriä ei pysty estimoimaan, kun mallissa on kuntaa kuvaavat kiinteät vaikutukset. Tämä johtuu siitä, että asukasluku ei vaihtele kunnan sisällä, jolloin käytettävä kiinteä vaikutus kontrolloi asukasluvun täysin. Tämän tehtävän tarkoitus on osoittaa, että kiinteiden vaikutuksien vuoksi malliin ei voi laittaa selittäjiä, jotka eivät vaihtele paneeliyksikön(kunta) sisällä. Taulukko 3: Kiinteät vaikutukset vs OLS tehtävässä 2 (1) (2) ln(hinta) ln(hinta) Asiakasmuuttuja(1=vanha,0=uusi) *** *** (0.0172) (0.0163) Sukupuoli(1=nainen,0=mies) *** *** (0.0182) (0.0174) Asiakasmuuttuja*Sukupuoli * (0.0234) (0.0224) Asukasluku *** (2.76e-05) Vakio 5.595*** 5.554*** (0.0240) (0.0236) Postinumerotason kiinteät vaikutukset X Kuukausitason kiinteät vaikutukset X X Estimaattori Kiinteät vaikutukset OLS N 19,917 19,917 R Suluissa keskivirheet Taulukko 3 havainnollistaa postinumerotason kiinteiden vaikutusten käyttöä verrattuna malliin, missä vastaavia kiinteitä vaikutuksia ei käytetä. Kiinteiden vaikutuksien käyttäminen tuo pieniä eroja mallien kertoimiin. Eroja on mahdollista selittää kaikilla hintaan vaikuttavilla tekijöillä, jotka eivät muutu ajassa. 3. Ostetaanko loppuvuodesta kalliimpia laitteita kuin muina ajankohtina? 4

5 Taulukko 4: Tehtävän 3 regressiot (1) (2) (3) ln(hinta) ln(hinta) ln(hinta) 1.Neljännes *** (0.0160) (0.0119) (0.0127) 2.Neljännes ** *** *** (0.0155) (0.0115) (0.0120) 3.Neljännes *** (0.0148) (0.0110) (0.0115) 2.Laitetyyppi 0.176*** (0.0252) 3.Laitetyyppi 0.586*** (0.0707) 1.Neljännes*2.Laitetyyppi (0.0379) 1.Neljännes*3.Laitetyyppi (0.0822) 2.Neljännes*2.Laitetyyppi 0.158*** (0.0444) 2.Neljännes*3.Laitetyyppi (0.0850) 3.Neljännes*2.Laitetyyppi ** (0.0394) 3.Neljännes*3.Laitetyyppi (0.0789) Vakio 5.504*** 6.112*** 5.540*** (0.0104) (0.0689) (0.0827) Kuntatason kiinteä vaikutus X X X Laitevalmistajatason kiinteä vaikutus X X N 19,917 19,917 19,917 R (a) Luo aluksi muuttuja, joka kuvaa laitteen ostotapahtuman vuosineljännestä. Muodosta vuosineljännestä kuvaava indikaattorimuuttuja seuraavasti:kuukaudet 1-3=1,4-6=2,7-9=3,10-12=4. Suorita kiinteiden vaikutusten regressio, missä selität hinnan logaritmia vuosineljännes-indikaattoreilla(käytä vuoden viimeistä neljännestä vertailukohtana) ja kuntatason kiinteillä vaikutuksilla. Käytä tässä tehtävässä xtreg-komentoa. Kuinka tulkitset vuosineljännestä kuvaavien indikaattorien kertoimia? Taulukon 4 ensimmäinen sarake pitää sisällään regression missä laitteen hinnan logaritmia selitetään ostotapahtuman vuosineljännestä kuvaavilla indikaattoreilla. Indikaattorien perusteella laitteiden hinnat ovat vuosineljänneksinä 1-3 matalampia kuin viimeisellä vuosineljänneksellä. (b) Lisää a)-kohdan regressioon laitevalmistajaa kuvaavat indikaattorimuuttujat. Kuinka tulkitset ostotapahtuman vuosineljännestä kuvaavan muuttujan kertoimia? Taulukon 4 toisessa sarakkeessa malliin lisätään laitevalmistajaa kuvaavat kiinteät vaikutukset. Laitevalmistajan identiteetin kontrolloimisen jälkeen osa aiemmin havaituista hintaeroista katoaa. Nyt ainoastaan vuoden toisena neljänneksenä ostetaan halvempia laitteita kuin vuoden viimeisellä neljänneksellä. Samalla huomataan, että mallin selitysaste kasvaa noin 0.1%:n arvosta 45.8%. (c) Lisää b)-kohdan malliin laitetyyppi ja interaktio laitetyypin ja ostotapahtuman vuosineljännestä 5

6 kuvaavan muuttujan välillä. Miten tulkitset laitetyypin, vuosineljänneksen ja interaktiotermien kertoimia? Taulukon 4 kolmannessa sarakkeessa malliin lisätään vuosineljänneksen ja laitetyypin interaktio. Laitetyyppejä on 3 ja ensimmäinen laitetyyppi toimii nyt verrokkiryhmä. Laitetyypin ja vuosineljänneksen välisiä vaikutuksia laitteen hintaan tulkitaan seuraavasti: Toisen vuosineljänneksen hinnat ovat 3.9% halvemmat kuin viimeisellä neljänneksellä. Kun huomioidaan interaktiotermit, niin silloin tulkinta muuttuu toisen laitetyypin kohdalla. Tällöin toisen vuosineljänneksen hinta on noin 11%( ) korkeampi kuin joulukuun hinta jos kyseessä on toinen laitetyyppi. Kolmannen vuosineljänneksen tapauksessa vuosineljänneksen päävaikutus ei poikkea nollasta. Kuitenkin hinta on 8.65% korkeampi kuin viimeisellä neljänneksellä jos laitetyyppi on 2. Emme käsitelleet ensimmäisen vuosineljänneksen vaikutuksia, koska ensimmäisen neljänneksen tapauksessa päävaikutus ja interaktiotermi ovat aina ei-merkitseviä. Laitetyyppien tapauksessa ainoastaan toisen laitetyypin interaktiot ovat tilastollisesti merkitseviä. Tällöin tulkinta on seuraava: toinen laitetyyppi on keskimäärin 17.6% kalliimpi kuin ensimmäinen laitetyyppi. Vuoden toisena neljänneksenä toinen laitetyyppi on noin 33.8%(17.6%+15.8%) kalliimpi kuin ensimmäinen laitetyyppi. Vuoden kolmannella neljänneksellä toinen laitetyyppi on 26.25% (8.65%+17.6%) kalliimpi kuin ensimmäinen laitetyyppi. Interaktioiden käyttö antaa yksinkertaisen tavan mallintaa laitetyypin hinnan kehitystä vuoden sisällä. (d) Testaa laitevalmistajaa kuvaavien indikaattorimuuttujien yhteismerkitsevyyttä. Taulukko 5: Laitevalmistajien yhteismerkitsevyyden testaaminen F-testisuure Testisuureen p-arvo Suoritetaan esimerkiksi edellisen kohdan regressio, missä laitevalmistajaa kuvaavat indikaattorit ovat selittäjinä. Tämän jälkeen muuttujien yhteismerkitsevyyttä on mahdollista testata. Laitevalmistajaa kuvaavat indikaattorimuuttujat ovat yhteismerkitseviä. Täydelliset regressiotaulukot 6

7 Taulukko 6: Tehtävän 1 täydellinen regressiotaulukko (1) (2) (3) (4) VARIABLES ln(hinta) ln(hinta) ln(hinta) ln(hinta) ln(tulot) 0.103** (0.0411) (0.0481) (0.0481) (0.0481) ln(asukasluku) *** *** *** *** ( ) ( ) ( ) ( ) Sukupuoli(1:nainen,0=mies) *** *** *** *** (0.0110) (0.0110) (0.0110) (0.0110) 2.Maakunta Maakunta Maakunta (0.549) 5.Maakunta (0.550) 6.Maakunta Maakunta (0.551) 8.Maakunta Maakunta Maakunta Maakunta Maakunta Maakunta Maakunta Maakunta Maakunta Maakunta Maakunta (0.547) 19.Maakunta OSTOKUUKAUSI (0.0299) 3.OSTOKUUKAUSI ** (0.0287) 4.OSTOKUUKAUSI (0.0289) 5.OSTOKUUKAUSI (0.0285) 6.OSTOKUUKAUSI (0.0272) 7.OSTOKUUKAUSI (0.0268) 8.OSTOKUUKAUSI ** (0.0267) 9.OSTOKUUKAUSI (0.0276) 10.OSTOKUUKAUSI 0.141*** (0.0276) 11.OSTOKUUKAUSI (0.0265) 12.OSTOKUUKAUSI (0.0271) N 19,914 19,914 19,914 19,914 R

8 Taulukko 7: Tehtävä 2 täydellinen regressiotaulukko (1) (2) (3) (4) (5) ln(hinta) ln(hinta) ln(hinta) ln(hinta) ln(hinta) Asiakasmuuttuja *** *** *** *** *** (0.0113) (0.0165) (0.0172) (0.0165) (0.0165) Sukupuoli(1=nainen,0=mies) *** *** *** *** (0.0175) (0.0182) (0.0175) (0.0175) Asiakasmuuttuja*Sukupuoli * (0.0225) (0.0234) (0.0225) (0.0225) 2.OSTOKUUKAUSI (0.0300) (0.0300) (0.0312) (0.0300) (0.0300) 3.OSTOKUUKAUSI ** ** * ** ** (0.0288) (0.0288) (0.0298) (0.0288) (0.0288) 4.OSTOKUUKAUSI (0.0290) (0.0290) (0.0300) (0.0290) (0.0290) 5.OSTOKUUKAUSI (0.0286) (0.0285) (0.0296) (0.0285) (0.0285) 6.OSTOKUUKAUSI (0.0273) (0.0272) (0.0283) (0.0272) (0.0272) 7.OSTOKUUKAUSI (0.0269) (0.0268) (0.0279) (0.0268) (0.0268) 8.OSTOKUUKAUSI (0.0268) (0.0268) (0.0279) (0.0268) (0.0268) 9.OSTOKUUKAUSI (0.0277) (0.0277) (0.0287) (0.0277) (0.0277) 10.OSTOKUUKAUSI 0.154*** 0.154*** 0.149*** 0.154*** 0.154*** (0.0278) (0.0277) (0.0288) (0.0277) (0.0277) 11.OSTOKUUKAUSI (0.0266) (0.0266) (0.0276) (0.0266) (0.0266) 12.OSTOKUUKAUSI (0.0272) (0.0271) (0.0282) (0.0271) (0.0271) ASUKKAITA_1000_KUNNASSA (1.183e+09) Vakio 5.533*** 5.584*** 5.595*** *** (0.0212) (0.0232) (0.0240) (1.950e+11) (0.0232) Kuntatason kiinteät vaikutukset X X X X Postinumerotason kiinteät vaikutukset X N 19,917 19,917 19,917 19,917 19,917 R

9 Taulukko 8: Tehtävän 3 täydelliset regressiotaulukot (1) (2) (3) ln(hinta) ln(hinta) ln(hinta) 1.Neljännes *** (0.0160) (0.0119) (0.0127) 2.Neljännes ** *** *** (0.0155) (0.0115) (0.0120) 3.Neljännes *** (0.0148) (0.0110) (0.0115) 2.Laitetyyppi 0.176*** (0.0252) 3.Laitetyyppi 0.586*** (0.0707) 1.Neljännes*2.Laitetyyppi (0.0379) 1.Neljännes*3.Laitetyyppi (0.0822) 2.Neljännes*2.Laitetyyppi 0.158*** (0.0444) 2.Neljännes*3.Laitetyyppi (0.0850) 3.Neljännes*2.Laitetyyppi ** (0.0394) 3.Neljännes*3.Laitetyyppi (0.0789) 2.Laitevalmistaja *** *** (0.0791) (0.0912) 3.Laitevalmistaja 0.310*** 0.861*** (0.0693) (0.0824) 4.Laitevalmistaja * (0.0968) (0.0996) 5.Laitevalmistaja *** *** (0.100) (0.110) 6.Laitevalmistaja *** *** (0.613) (0.610) 7.Laitevalmistaja (0.264) (0.268) 8.Laitevalmistaja 0.203** 0.173* (0.0973) (0.0968) 9.Laitevalmistaja *** (0.0919) (0.102) 10.Laitevalmistaja *** 0.245*** (0.0714) (0.0847) 11.Laitevalmistaja *** *** (0.0704) (0.0835) 12.Laitevalmistaja *** (0.128) (0.136) 13.Laitevalmistaja *** (0.0725) (0.0857) 14.Laitevalmistaja *** *** (0.0780) (0.0790) 15.Laitevalmistaja *** *** (0.0714) (0.0848) 16.Laitevalmistaja ** 0.331*** (0.0967) (0.107) 17.Laitevalmistaja *** *** (0.0696) (0.0833) 18.Laitevalmistaja *** *** (0.265) (0.267) 19.Laitevalmistaja *** *** (0.0688) (0.0825) 20.Laitevalmistaja *** 0.387*** (0.0706) (0.0840) 21.Laitevalmistaja * (0.579) (0.576) 22.Laitevalmistaja *** *** (0.0979) (0.108) 23.Laitevalmistaja *** * (0.574) (0.572) Vakio 5.504*** 6.112*** 5.540*** (0.0104) (0.0689) (0.0827) N 19,917 19,917 19,917 R

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät

Lisätiedot

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Harjoitukset 2 : Monimuuttujaregressio (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 2 : Monimuuttujaregressio (Palautus 24.1.2017) Tämän harjoituskerran tarkoitus

Lisätiedot

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Harjoitus 7 : Aikasarja-analyysi (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitus 7 : Aikasarja-analyysi (Palautus 28.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Harjoitukset 6 :IV-mallit (Palautus )

Harjoitukset 6 :IV-mallit (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 6 :IV-mallit (Palautus 21.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Harjoitukset 5 : Differences-in-Differences - mallit (Palautus )

Harjoitukset 5 : Differences-in-Differences - mallit (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 5 : Differences-in-Differences - mallit (Palautus 14.3.2017) Tämän harjoituskerran

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Valinnanvapaus ja alueellinen saatavuus Kelan kuntoutuksessa. Visa Pitkänen Tutkija Kelan

Valinnanvapaus ja alueellinen saatavuus Kelan kuntoutuksessa. Visa Pitkänen Tutkija Kelan Valinnanvapaus ja alueellinen saatavuus Kelan kuntoutuksessa Visa Pitkänen Tutkija Kelan tutkimus @visapitkanen Johdanto Terveyspalveluiden tasapuolinen alueellinen saatavuus on usein tärkeä tavoite palveluiden

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1 Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n

Lisätiedot

TILASTOTIEDE KÄYTÄNNÖN TUTKIMUKSESSA, 8 10 OP Luennoi: yliopisto-opettaja Pekka Pere. Logaritmin muutos ja suhteellinen muutos

TILASTOTIEDE KÄYTÄNNÖN TUTKIMUKSESSA, 8 10 OP Luennoi: yliopisto-opettaja Pekka Pere. Logaritmin muutos ja suhteellinen muutos TILASTOTIEDE KÄYTÄNNÖN TUTKIMUKSESSA, 8 10 OP. 22.9.-11.12.2009. Luennoi: yliopisto-opettaja Pekka Pere. Aputuloksia Logaritmin muutos ja suhteellinen muutos Lähtökohta on approksimaatio log(1 + δ) δ,

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Usean selittävän muuttujan regressioanalyysi

Usean selittävän muuttujan regressioanalyysi Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Tarkastusmuistio Poliisin toimintojen yhdistäminen ja liikennevalvonnan määrä

Tarkastusmuistio Poliisin toimintojen yhdistäminen ja liikennevalvonnan määrä Tarkastusmuistio Poliisin toimintojen yhdistäminen ja liikennevalvonnan määrä Liittyy tarkastukseen: 5/2019 Poliisin liikennevalvonta Tekijä: Ville Vehkasalo Päivämäärä: 24.9.2018 Diaarinumero: 248/54/2017

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) Tavoitteet (teoria): Hahmottaa aikasarjan klassiset komponentit ideaalisessa tilanteessa. Ymmärtää viivekuvauksen vaikutus trendiin. ARCH-prosessin

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Logistinen regressioanalyysi Vastemuuttuja Y on luokiteltu muuttuja Pyritään mallittamaan havaintoyksikön todennäköisyyttä kuulua

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. TEHTÄVÄ 1 Taulukko 1 Kuvailevat tunnusluvut pääkaupunkiseudun terveystutkimuksesta vuonna 2007 (n=941) Keskiarvo (keskihajonta) Ikä

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa Oulun yliopiston matemaattisten tieteiden tutkimusyksikkö/tilastotiede 805306A JOHDATUS MONIMUUTTUJAMENETELMIIN, sl 2017 (Jari Päkkilä) Harjoitus 3, viikko 47 (19.20.11.): kotitehtävät Ratkaisuja 1. Floridan

Lisätiedot

Liite artikkeliin Intohimo tasa-arvoon

Liite artikkeliin Intohimo tasa-arvoon Liite artikkeliin Intohimo tasa-arvoon Menetelmäkuvaus Artikkelissa käytetty regressiomalli on ns. binäärinen logistinen monitasoregressiomalli. Monitasoanalyysien ideana on se, että yksilöiden vastauksiin

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen Kaksisuuntaisen varianssianalsin perusasetelma Jaetaan perusjoukko rhmiin kahden tekän A ja B suhteen

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Aikasarjamallit. Pekka Hjelt

Aikasarjamallit. Pekka Hjelt Pekka Hjelt Aikasarjamallit Aikasarja koostuu järjestyksessä olevista havainnoista, ja yleensä se on tasavälinen ja diskreetti eli havaintopisteet ovat erillisiä. Lisäksi aikasarjassa on yleensä autokorrelaatiota

Lisätiedot

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1 Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen Kaksisuuntaisen varianssianalsin perusasetelma aetaan perusoukko rhmiin kahden tekän A a B suhteen

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) Tavoitteet (teoria): Hallita multinormaalijakauman määritelmä. Ymmärtää likelihood-funktion ja todennäköisyystiheysfunktion ero. Oppia kirjoittamaan

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Todennäköisyyslaskennan kertaus Satunnaismuuttujat ja tn-jakaumat Tunnusluvut χ 2 -, F- ja t-jakauma Riippumattomuus Tilastotieteen

Lisätiedot

Haitallinen valikoituminen: Kahden tyypin malli

Haitallinen valikoituminen: Kahden tyypin malli Haitallinen valikoituminen: Kahden tyypin malli Mat-2.4142 Optimointiopin seminaari Mikko Hyvärinen 29.1.2008 Haitallinen valikoituminen kahden tyypin malli Haitallinen valikoituminen tarkoittaa että päämies

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

Pientalojen radonpitoisuuksien tilastollinen analyysi

Pientalojen radonpitoisuuksien tilastollinen analyysi Pientalojen radonpitoisuuksien tilastollinen analyysi (Valmiin työn esittely) 11.4.2011 Ohjaaja: DI Jirka Poropudas Valvoja: Prof. Raimo Hämäläinen Sisältö 1. Tausta 2. Tavoitteet 3. Menetelmät 4. Tulokset

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

4.2 Useampi selittävä muuttuja (kertausta)

4.2 Useampi selittävä muuttuja (kertausta) 14.2.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 14.2.2019 4.2 Useampi selittävä muuttuja (kertausta) Selittäjien lukumäärä k (k-ra) = + + + + Malliin liittyvät oletukset i ~ N(0, 2 ) ja i:t ovat

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa

Lisätiedot

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden 1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma

Lisätiedot

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,

Lisätiedot

Capstone: Kerrostaloasuntojen hinnanmuodostumisen tutkiminen Helsingissä ja Espoossa käyttäen hedonistista regressiota

Capstone: Kerrostaloasuntojen hinnanmuodostumisen tutkiminen Helsingissä ja Espoossa käyttäen hedonistista regressiota Capstone: Kerrostaloasuntojen hinnanmuodostumisen tutkiminen Helsingissä ja Espoossa käyttäen hedonistista regressiota Elisa Luukkonen 536671 Lauri Luukkanen 536668 Henri Rujala 489061 1 Sisällysluettelo

Lisätiedot

Digitaalinen markkinointi ja myynti Mitä DIVA meille kertoi?

Digitaalinen markkinointi ja myynti Mitä DIVA meille kertoi? Digitaalinen markkinointi ja myynti Mitä DIVA meille kertoi? Myynnin Digiloikka, 11/5/2017 Tommi Laukkanen UEF // University of Eastern Finland Asiakkaan ostopäätösprosessi TARPEEN TUNNISTAMINEN INFORMAATION

Lisätiedot

4. www-harjoitusten mallivastaukset 2017

4. www-harjoitusten mallivastaukset 2017 TU-91.1001 Kansantaloustieteen perusteet 4. www-harjoitusten mallivastaukset 2017 Tehtävä 1. Oikea vastaus: C Voitto maksimoidaan, kun MR=MC. Kyseisellä myyntimäärällä Q(m) voittomarginaali yhden tuotteen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33.

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33. Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

Tutkielmien arvosanat Helsingin yliopistossa

Tutkielmien arvosanat Helsingin yliopistossa Tutkielmien arvosanat Helsingin yliopistossa Sanni Holm Helsingin yliopisto matemaattis-luonnontieteellinen tiedekunta pro gradu -tutkielma toukokuu 2013 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

Tuhat Suomalaista Mainonnan neuvottelukunta Joulukuu SFS ISO20252 Sertifioitu

Tuhat Suomalaista Mainonnan neuvottelukunta Joulukuu SFS ISO20252 Sertifioitu Tuhat Suomalaista Mainonnan neuvottelukunta Joulukuu 1 SFS ISO22 Sertifioitu Tutkimuksen toteutus Tuhat suomalaista 12/1 IRO Research Oy:n Tuhat suomalaista tutkimuksen tiedonkeruu tehtiin internetissä

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

SEM1, työpaja 2 (12.10.2011)

SEM1, työpaja 2 (12.10.2011) SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):

Lisätiedot

Facebookin käyttäjien iän, sukupuolen ja asuinpaikan vaikutus. matkailumotivaatioihin ja aktiviteetteihin Juho Pesonen

Facebookin käyttäjien iän, sukupuolen ja asuinpaikan vaikutus. matkailumotivaatioihin ja aktiviteetteihin Juho Pesonen ASIAKKAAN ODOTTAMA ARVO MAASEUTUMATKAILUN SEGMENTOINNIN JA TUOTEKEHITYKSEN PERUSTANA Facebookin käyttäjien iän, sukupuolen ja asuinpaikan vaikutus matkailumotivaatioihin ja aktiviteetteihin 25.11.2011

Lisätiedot

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat: Yleistä Tilastoapu on Excelin sisällä toimiva apuohjelma, jonka avulla voit analysoida tilastoaineistoja. Tilastoapu toimii Excelin Windows-versioissa Excel 2007, Excel 2010 ja Excel 2013. Kun avaat Tilastoavun,

Lisätiedot