Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Koko: px
Aloita esitys sivulta:

Download "Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )"

Transkriptio

1 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus ) Tämän harjoituskerran tehtävät liittyvät, eksperimentteihin, aineiston muokkaamiseen ja monimuuttujaregressioon. Empiirisissä tehtävissä aineistona käytämme edelleen Elisan myyntiaineistoa. Aineisto ja sen kuvaus löytyvät kurssin Mycourses-sivulta. Tehtävien tekoon kannattaa varata kunnolla aikaa, koska Statan käytön aloittaminen voi viedä huomattavan paljon aikaa. Regressiomallin tuloksia raportoitaessa anna selkeä tulkinta sille paljonko selitettävä muuttuja muuttuu, kun selittävä muuttuja kasvaa yhden yksikön verran. Tämän lisäksi muista tulkita estimoidun parametrin tilastollista merkitsevyyttä. Tehtävät voi tehdä 1-2 opiskelijan ryhmissä. Jokainen palauttaa vastauksensa Mycourses-sivuston kautta. Liittäkää käyttämänne Stata-koodi kommentoituna jokaisen tehtävän loppuun. 1. Eksperimentin suunnittelu (a) Kuinka Elisa tutkisi ideaalisessa(ilman taloudellisia rajoitteita) tilanteessa laitemyynnin ja mainonnan välistä suhdetta eksperimentin avulla. Kuvaile lyhyesti mitä Elisa voisi oppia eksperimentin avulla laitteiden myynnistä eri myyntikanavissa. Miten määrittelet eksperimenttisi koeja kontrolliryhmät? Ideaalisessa tapauksessa laitemyynnin ja mainonnan suhdetta tutkittaisiin satunnaistetun kokeen avulla. Satunnaistetun kokeen voisi toteuttaa esimerkiksi niin, että mainoskampanjaan osallistuvat myymälät arvotaan(satunnaistetaan). Satunnaistamisen seurauksena tutkimuksen koe-ja kontrolliryhmät ovat havaittavien ominaisuuksien suhteen samankaltaisia. Koeryhmänä toimivat kampanjaan arvotut myymälät ja kontrolliryhmänä toimii kampanjan ulkopuoliset myymälät. Eksperimentin taloudellisten rajoitteiden puuttuessa eksperimentti voidaan toteuttaa kaikkialla Suomessa. Eksperimentin avulla Elisa pystyy esimerkiksi selvittämään kuinka paljon laitteiden myynti lisääntyy mainonnan seurauksena. Samalla voidaan selvittää mikä vaikutus mainonnalla on erilaisten myyntikanavien kautta myytyihin laitteisiin. (b) Onko ehdottamasi tutkimusasetelman toteuttaminen taloudellisesti ja eettisesti mahdollista? Perustele vastaustasi Kokomaan laajuisen eksperimentin toteuttaminen voi tulla liian kalliiksi ja hankalaksi järjestää. Tästä syystä yksittäisen yrityksen vuosittainen markkinointibudjetti ei välttämättä riitä kokomaan kattavaan eksperimenttiin. Mainonnan vaikutusta laitemyyntiin tutkittaessa tutkimuseettiset seikat eivät aseta suuria rajoitteta eksperimentin toteuttamiselle. Esimerkiksi ihmisen terveyteen ja hyvinvointiin liittyvissä eksperimenteissä tutkimuseettiset kysymykset korostuvat. (c) Kuinka Elisa tutkisi laitemyynnin ja mainonnan välistä suhdetta, jos käytössä olevat resurssit ovat rajalliset. Miten määrittelet tässä tapauksessa koe-ja kontrolliryhmät. a)-kohdan eksperimentin voisi toteuttaa esimerkiksi tietyllä maantieteellisellä alueella. Tällöin vertailu perustuu siihen, että verrataan kampanja-aluetta kampanjan ulkopuolisiin alueisiin. Tällöin koeryhmä on eksperimenttiin valikoitu alue ja kontrolliryhmänä toimii maantieteellinen alue, jossa kampanjaa ei toteutettu. (d) Miten a) ja c)-kohdan asetelmat eroavat toisistaan tutkimusasetelmien uskottavuuden suhteen? Molemmat asetelmat voivat tarjota uskottavan estimaatin mainonnan vaikutuksesta laitemyyntiin. C-kohdan eksperimentin kohdalla on tärkeää, että tutkimuksen koe-ja kontrolliryhmät ovat havaittavilta ominaisuuksiltaan samankaltaisia. Jos on mahdollista havaita, että ryhmät ovat samankaltaisia, niin se lisää tutkimuksen uskottavuutta. Jos koe-ja kontrolliryhmät eroavat merkittävästi havaittavien ominaisuuksien perusteella, niin silloin nousee esiin huolet siitä, että havaitsemattomat tekijät vaikuttavat systemaattisesti eksperimentin tuloksiin. 1

2 2. Aineiston kuvailu kuntatason aineistolla (a) Tarkoituksena on luoda aineisto, missä jokaisesta kunnasta on vain yksi havainto. Muodosta aineisto niin, että aineisto sisältää seuraavat kuntatason muuttujat: ostettujen laitteiden kokonaismäärä, asukasluku, laitteiden kokonaismyynti(kappaleina ja euroina), perintään menneiden laitteiden kokonaismäärä jokaisessa kunnassa, kunnan postinumeroiden keskimääräinen mediaanitulo, ostajan keskimääräinen ikä ja naisten suhteellinen osuus kunnan laiteostajista. Voit käyttää esimerkiksi Statan collapse-komentoa aineiston muokkauksessa. Collapsekomennon dokumentaatio tarjoaa apua aineiston muokkaamiseen. Huomioi, että collapse-komento poistaa alkuperäisen aineiston Statan muistista. Tähän tehtävään riittää vastaukseksi koodi, mikä tuottaa kuntatason aineiston. Do-tiedostossa koodit aineiston muokkaukseen. (b) Piirrä hajontakuviot asukasluvun ja myytyjen laitteiden kokonaismäärän välille. Piirrä lisäksi hajontakuvio asukasluvun ja perintään menneiden laitteiden välillä. Suorita myös vastaavat regressiot. Miten tulkitset hajontakuvioita ja regressioiden tuloksia? Kuva 1: Hajontakuviot asukasluvun, myytyjen laitteiden ja perintään menneiden ostojen välillä Kuva 1 pitää sisällään hajontakuviot asukasluvun, myytyjen laitteiden ja perintään menneiden ostojen välillä. Kuviosta näkyy selvästi, että myytyjen laitteiden lukumäärä kasvaa kunnan asukasluvun kasvaessa. Asukasluku on vahvasti korreloitunut myytyjen myytyjen laitteiden ja perintään menneiden ostojen lukumäärän kanssa. Hajontakuviot myös näyttävät, että Helsinki poikkeaa muista Suomen kunnista myynnin perusteella. 2

3 Taulukko 1: Regressiot asukasluvun, myytyjen laitteiden ja perintään menneiden ostojen välillä (1) (2) (3) (4) Myydyt_laitteet(kpl) Myydyt_laitteet(kpl) Perintään menneet(kpl) Perintään menneet(kpl) Asukasluku 4.571*** 4.286*** 0.322*** 0.273*** (0.0510) (0.0718) ( ) ( ) Vakio *** *** *** *** (2.543) (2.548) (0.244) (0.216) Helsinki pois X X N R Taulukko 1 pitää sisällään regressiot missä selitetään myytyjen laitteiden ja perintään menneiden ostojen lukumääriä kunnan asukasluvulla asukkaan lisäys asukasluvussa nostaa myytyjen laitteiden lukumäärää noin 4.6 laitteella. Perintään menneiden laitteiden tapauksessa 1000 asukkaan kasvu asukasluvussa lisää perintään menneitä ostoja kappaleen verran. Kaikissa regressioissa tulokset ovat tilastollisesti merkitseviä 1%-tasolla ja selitysaste on yli 90%. Korkeasta selitysasteesta huolimatta mallit ovat huonoja, koska malleista puuttuu laitteiden kysyntään liittyviä selittäviä muuttujia. Toisessa ja neljännessa sarakkeessa esitetään tulokset malleille, mistä on poistettu Helsinki. Yhden havainnon poistaminen johtaa siihen, että tuloksissa tapahtuu selkeä muutos ja mallin selitysvoima laskee. Varsinkiin perintään menneiden ostojen tapauksessa ero on merkittävä. On lisäksi syytä myös miettiä, onko selitettävien muuttujien ja asukasluvun välinen suhde lineaarinen. (c) Suorita regressio missä selität kunnan laitemyyntiä asiakkaan keskimääräisellä iällä, kunnan asukasluvulla, naisten suhteellisella osuudella ja postinumeron mediaanitulojen keskiarvolla. Tulkitse regression tuloksia. Mitä ongelmia postinumeron mediaanitulojen keskiarvon käyttämiseen liittyy? Taulukko 2: Kuntatason monimuuttujaregressio (1) (2) VARIABLES Myydyt_laitteet(kpl) Myydyt_laitteet(kpl) Asukasluku 4.579*** 4.284*** (0.0526) (0.0749) Keskimääräinen asiakkaan ikä (0.461) (0.442) Naisten suhteellinen osuus (13.68) (13.08) Keskimääräinen mediaanitulo ( ) ( ) Vakio (28.63) (27.40) Helsinki_poistettu X N R

4 Taulukko 2 pitää sisällään kuntatason monimuuttujaregression. Asukasluvun kerroin ei muutu paljoa taulukon 1 tuloksista. Mallin muut selittäjät eivät ole tilastollisesti merkitseviä esim 5%- tai 10%-tasolla. Taulukon 2 toinen sarake pitää sisällään tulokset mallista, mistä Helsingin havainto on poistettu. Tuloksissa on selkeitä eroja. Esimerkiksi naisten suhteellisen osuuden kerroin on yli neljä kertaa suurempi sarakkeessa 2 kuin sarakkeessa 1. Keskimääräisen mediaanitulon kerroin muuttuu negatiivisesta positiiviseksi, kun Helsinki poistetaan aineistosta. Postinumeron mediaanitulojen keskiarvon käyttäminen selittäjänä on ongelmallista muuttujan tulkinnan kannalta. (d) Testaa c)-kohdan regressiossa keskimääräisen iän ja naisten suhteellisen osuuden yhteismerkitsevyyttä. Lisäksi testaa keskimääräisen iän ja asukasluvun yhteismerkitsevyyttä. Miten tulkitset yhteismerkitsevyyksiä? Muuttujien yhteismerkitsevyys voidaan selvittää F-testin avulla. Testin idea on selvittää onko tietyllä muuttujajoukolla tilastollisesti merkitsevä vaikutus selitettävään muuttujaan sen sijaan, että testaisimme yksittäisten muuttujien tilastollista merkitsevyyttä. Kurssikirjan sivut käsittelevät yhteismerkitsevyyden testaamista yksinkertaisen esimerkin avulla. Aluksi suoritetaan regressiomalli, minkä parametrien yhteismerkitsevyyttä haluamme tutkia. Tässä tapauksessa mallimme on taulukon 2 sarake 1. Huomaamme, että ostajan keskimääräinen ikä ja naisten suhteellinen osuus eivät ole tilastollisesti merkitseviä edes 10%-tasolla. On kuitenkin mahdollista, että muuttujat ovat yhdessä merkitseviä. Asukasluku on tilastollisesti merkitsevä 1%-tasolla. Yhteismerkitsevyys-testin tulosta tulkitaan niin, että ikä ja naisten suhteellinen osuus eivät ole yhdessä merkitseviä, mutta ikä ja asukasluku ovat. Taulukko 3: Yhteismerkitsevyydet Ikä ja naisten osuus Ikä ja asukasluku F Prob > F Saavatko uudet asiakkaat parempia laitetarjouksia kuin vanhat asiakkaat? (a) Luo aluksi muuttuja, mikä erottaa vanhat asiakkaat uusista asiakkaista(1=vanha asiakas,0=uusi asiakas). Kutsutaan tätä muuttujaa asiakasmuuttujaksi. Uudet asiakkaat voi erottaa vanhoista asiakkaista asiakassuhteen pituuden avulla. Suorita regressio missä selität hinnan logaritmia asiakasmuuttujalla. Tulkitse tuloksia. 4

5 Taulukko 4: Regressiot asiakasmuuttujalla (1) (2) (3) VARIABLES ln(hinta) ln(hinta) ln(hinta) Asiakasmuuttuja(1=vanha) *** *** *** (0.0112) (0.0112) (0.0112) Sukupuoli(1=nainen) *** *** (0.0109) (0.0109) Postinumeron mediaanitulot 7.20e-06*** (1.93e-06) asukasluku *** (2.85e-05) Vakio 5.549*** 5.589*** 5.408*** ( ) (0.0105) (0.0403) N 20,000 20,000 19,914 R Taulukon 4 ensimmäisestä sarakkeesta löytyy asiakasmuuttujan kerroin. Tuloksen mukaan vanhat asiakkaat maksavat noin 13.7% vähemmän kuin uudet asiakkaat laitteestaan. Asiakasmuuttujan kerroin on tilastollisesti merkitsevä 5%-tasolla. Tulosta tulkittaessa täytyy huomioida se, että mallissa ei kontrolloida laitteen ja asiakkaan ominaisuuksia lainkaan. Virhetermi sisältää tekijöitä, jotka ovat korreloituneet asiakasmuuttujan kanssa. (b) Lisää edellisen kohdan regressioon selittäjäksi ostajan sukupuoli. Tulkitse tuloksia ja selitä lyhyesti miksi sukupuolen lisääminen vaikuttaa asiakasmuuttujan kertoimeen. Taulukon 4 toinen sarake sisältään tulokset regressioon, missä laitteen log(hintaa) selitetään asiakasmuuttujalla ja ostajan sukupuolella. Asiakasmuuttujan kerroin muuttuu hiukan verrattuna a)-kohtaan. Tuloksen mukaan naisten ostamat laitteet ovat noin 7.48 % halvemmat kuin miesten ostamat laitteet, kun kaikki muut tekijät pidetään vakiona. Sukupuolta kuvaavan muuttujan lisääminen selittäjäksi muuttaa hiukan asiakasmuuttujan kerrointa. Tämä johtuu siitä, että sukupuoli- ja asiakasmuuttuja eivät ole välttämättä täysin riippumattomia toisistaan. Tällöin ns puuttuvan muuttujan harha pienentyy, kun aiemmin virhetermissä ollut tekijä tuodaan malliin selittäjäksi. Tämä tulos on tilastollisesti merkitsevä 1%-tasolla. Tuloksia tulkitessa tulee huomioida a)-kohdassa esitetyt endogeenisuushuolet, koska virhetermi sisältää suurella todennäköisyydellä tekijöitä, jotka ovat korreloituneet asiakasmuuttujan kanssa. (c) Toista b) kohdan regressio niin, että lisäät selittäjiksi postinumeroalueen mediaanitulot ja kunnan asukasmäärän. Tulkitse tuloksia. Taulukon 4 kolmas sarake sisältää tulokset regressioon, missä laitteen log(hintaa) selitetään asiakasmuuttujalla, ostajan sukupuolella, postinumeron mediaanituloilla ja kunnan asukasluvulla. Kun asiakasmuuttujan kertoimia verrataan muihin taulukon malleihin, niin kannattaa huomioida se, että kolmannessa sarakkeessa malliin lisätään selittäviä muuttujia ja samalla havaintojen kokonaislukumäärä muuttuu. Havaintojen kokonaislukumäärä muuttuu, koska kaikista kunnista ei ole saatavilla tietoa asukasluvusta eikä postinumeron mediaanitulosta. Asukasluvulla ja postinumeron mediaanituloilla on positiivinen ja tilastollisesti merkitsevä vaikutus ostetun laitteen hintaan. Kun kunnan asukasluku kasvaa yhdellä yksiköllä(1000 asukasta), niin ostetun laitteen hinta kasvaa 0.02% kun kaikki muut tekijät pidetään vakiona. Kun postinumeron mediaanitulot kasvavat eurolla, niin ostetun laitteen hinta kasvaa alle %, kun muut tekijät pidetään vakiona. Mediaanituloille saa järkevämmän tulkinnan jos tekee uuden muuttujan mikä 5

6 kuvaa mediaanituloja tuhansina euroina. (d) Suorita c)-kohdan regressio miehille ja naisille erikseen. Tulkitse tuloksia ja pohdi lyhyesti mitkä mallista puuttuvat tekijät voivat selittää erot asiakasmuuttujan kertoimissa, kun malleja verrataan sukupuolen perusteella. Taulukko 5: Regressiot asiakasmuuttujalla sukupuolen mukaan (1) (2) ln(hinta) ln(hinta) Asiakasmuuttuja(1=vanha) *** *** (0.0167) (0.0151) Postinumeron mediaanitulot 7.92e-06*** 6.61e-06** (2.83e-06) (2.64e-06) Asukasluku *** *** (4.28e-05) (3.82e-05) Vakio 5.407*** 5.334*** (0.0583) (0.0544) Sukupuoli Mies Nainen N 9,393 10,521 R Taulukko 5 sisältää tulokset asiakasmuuttuja-regressiot, missä aineisto on jaettu sukupuolen mukaan. Nyt huomaamme, että miesten ja naisten kohdalla asiakasmuuttujan kerroin on negatiivinen ja tilastollisesti merkitsevä. Kun aineisto jaetaan sukupuolen perusteella, niin silloin ei ole enää mahdollista estimoida sukupuoli-muuttujaa. Tulosten mukaan vanhat mies asiakkaat saavat laitteita halvemmalla kuin vanhat naisasiakkaat. Asiakasmuuttujan kerrointa ei kannata kuitenkaan tulkita ns kausaalisesti, koska mallissa ei kontrolloida laitteen ja kuluttajan ominaisuuksia. Estimoidut mallit eivät huomio sitä mahdollisuutta, että miehet ja naiset ostavat erilaisia laitteita. On mahdollista, että valikoituminen havaitsemattomat selittää tulokset. 6

Harjoitukset 4 : Paneelidata (Palautus )

Harjoitukset 4 : Paneelidata (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Harjoitukset 2 : Monimuuttujaregressio (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 2 : Monimuuttujaregressio (Palautus 24.1.2017) Tämän harjoituskerran tarkoitus

Lisätiedot

Harjoitukset 5 : Differences-in-Differences - mallit (Palautus )

Harjoitukset 5 : Differences-in-Differences - mallit (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 5 : Differences-in-Differences - mallit (Palautus 14.3.2017) Tämän harjoituskerran

Lisätiedot

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Harjoitus 7 : Aikasarja-analyysi (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitus 7 : Aikasarja-analyysi (Palautus 28.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Harjoitukset 6 :IV-mallit (Palautus )

Harjoitukset 6 :IV-mallit (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 6 :IV-mallit (Palautus 21.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

Usean selittävän muuttujan regressioanalyysi

Usean selittävän muuttujan regressioanalyysi Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. TEHTÄVÄ 1 Taulukko 1 Kuvailevat tunnusluvut pääkaupunkiseudun terveystutkimuksesta vuonna 2007 (n=941) Keskiarvo (keskihajonta) Ikä

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin) 1/10 Tehtävä 1 2 3 4 5 6 7 8 9 10 Yhteensä Pisteet (tarkastaja merkitsee) Kokeessa on kymmenen tehtävää, joista jokainen on erillisellä paperilla. Jokaisen tehtävän maksimipistemäärä on 6 pistettä. Ratkaise

Lisätiedot

Segregaation eri ilmenemismuodot ja sukupuolten palkkaerot

Segregaation eri ilmenemismuodot ja sukupuolten palkkaerot Segregaation eri ilmenemismuodot ja sukupuolten palkkaerot Segregaatio ja sukupuolten väliset palkkaerot tutkimushankkeen päätösseminaari Valkoinen Sali, 25.04.2008 Reija Lilja (yhteistyössä Rita Asplundin,

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet

Lisätiedot

Anna tutki: Naisen asema työelämässä

Anna tutki: Naisen asema työelämässä Anna tutki: Naisen asema työelämässä 2 Tutkimuksen tausta ja toteutus Tavoitteena selvittää naisten asemaa työelämässä Tutkimuksen teettäjä Yhtyneet Kuvalehdet Oy / Anna-lehti, toteutus Iro Research Oy

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan

Lisätiedot

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset) LIITE Vinkkejä lopputyön raportin laadintaan Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset) 1. Johdanto Kerro johdannossa lukijalle, mitä jatkossa

Lisätiedot

Esimerkki 1: auringonkukan kasvun kuvailu

Esimerkki 1: auringonkukan kasvun kuvailu GeoGebran LASKENTATAULUKKO Esimerkki 1: auringonkukan kasvun kuvailu Auringonkukka (Helianthus annuus) on yksivuotinen kasvi, jonka varren pituus voi aurinkoisina kesinä hyvissä kasvuolosuhteissa Suomessakin

Lisätiedot

Vanhuuseläkkeelle jäännin vaikutukset terveyteen Suomessa

Vanhuuseläkkeelle jäännin vaikutukset terveyteen Suomessa Vanhuuseläkkeelle jäännin vaikutukset terveyteen Suomessa tutkimusneuvonantaja Tarmo Valkonen Etla Miksi tutkitaan? Eläkkeelle siirtymisen terveysvaikutuksista tiedetään Suomessa vähän, vaikka vanhuuseläkeiän

Lisätiedot

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45. Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien

Lisätiedot

Facebookin käyttäjien iän, sukupuolen ja asuinpaikan vaikutus. matkailumotivaatioihin ja aktiviteetteihin Juho Pesonen

Facebookin käyttäjien iän, sukupuolen ja asuinpaikan vaikutus. matkailumotivaatioihin ja aktiviteetteihin Juho Pesonen ASIAKKAAN ODOTTAMA ARVO MAASEUTUMATKAILUN SEGMENTOINNIN JA TUOTEKEHITYKSEN PERUSTANA Facebookin käyttäjien iän, sukupuolen ja asuinpaikan vaikutus matkailumotivaatioihin ja aktiviteetteihin 25.11.2011

Lisätiedot

Jos Q = kysytty määrä, Q = kysytyn määrän muutos, P = hinta ja P = hinnan muutos, niin hintajousto on Q/Q P/P

Jos Q = kysytty määrä, Q = kysytyn määrän muutos, P = hinta ja P = hinnan muutos, niin hintajousto on Q/Q P/P Osa 5. Joustoista Kysynnän hintajousto (price elasticity of demand) mittaa, miten kysynnän määrä reagoi hinnan muutokseen = kysytyn määrän suhteellinen muutos jaettuna hinnan suhteellisella muutoksella

Lisätiedot

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat: Yleistä Tilastoapu on Excelin sisällä toimiva apuohjelma, jonka avulla voit analysoida tilastoaineistoja. Tilastoapu toimii Excelin Windows-versioissa Excel 2007, Excel 2010 ja Excel 2013. Kun avaat Tilastoavun,

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) Tavoitteet (teoria): Hahmottaa aikasarjan klassiset komponentit ideaalisessa tilanteessa. Ymmärtää viivekuvauksen vaikutus trendiin. ARCH-prosessin

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

TILASTOTIEDE KÄYTÄNNÖN TUTKIMUKSESSA, 8 10 OP Luennoi: yliopisto-opettaja Pekka Pere. Logaritmin muutos ja suhteellinen muutos

TILASTOTIEDE KÄYTÄNNÖN TUTKIMUKSESSA, 8 10 OP Luennoi: yliopisto-opettaja Pekka Pere. Logaritmin muutos ja suhteellinen muutos TILASTOTIEDE KÄYTÄNNÖN TUTKIMUKSESSA, 8 10 OP. 22.9.-11.12.2009. Luennoi: yliopisto-opettaja Pekka Pere. Aputuloksia Logaritmin muutos ja suhteellinen muutos Lähtökohta on approksimaatio log(1 + δ) δ,

Lisätiedot

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33.

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33. Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Teema 5: Ristiintaulukointi

Teema 5: Ristiintaulukointi Teema 5: Ristiintaulukointi Kahden (tai useamman) muuttujan ristiintaulukointi: aineiston analysoinnin ja tulosten esittämisen perusmenetelmä usein samat tiedot esitetään sekä taulukkona että kuvana mahdollisen

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12

Lisätiedot

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

Tilastollinen päättely II, kevät 2017 Harjoitus 2A Tilastollinen päättely II, kevät 07 Harjoitus A Heikki Korpela 3. tammikuuta 07 Tehtävä. (Monisteen tehtävä.3 Olkoot Y,..., Y n Exp(λ. Kirjoita vastaava tilastollisen mallin lauseke (ytf. Muodosta sitten

Lisätiedot

SUKUPUOLI IKÄÄNTYVÄSSÄ YHTEISKUNNASSA YTI-LUENNOT 30.10.2012 HANNA OJALA KT, TUTKIJATOHTORI TUTKIJAKOLLEGIUM HANNA.L.OJALA@UTA.FI

SUKUPUOLI IKÄÄNTYVÄSSÄ YHTEISKUNNASSA YTI-LUENNOT 30.10.2012 HANNA OJALA KT, TUTKIJATOHTORI TUTKIJAKOLLEGIUM HANNA.L.OJALA@UTA.FI SUKUPUOLI IKÄÄNTYVÄSSÄ YHTEISKUNNASSA YTI-LUENNOT 30.10.2012 HANNA OJALA KT, TUTKIJATOHTORI TUTKIJAKOLLEGIUM HANNA.L.OJALA@UTA.FI Kunnes kaupunki meidät erottaa / HS 23.11.2008 2 TÄLLÄ LUENNOLLA (1) Aiheena

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Suomalaisen työn liitto (STL) - Suomalainen kuluttaja muuttuvassa ympäristössä 2014

Suomalaisen työn liitto (STL) - Suomalainen kuluttaja muuttuvassa ympäristössä 2014 Suomalaisen työn liitto (STL) - Suomalainen kuluttaja muuttuvassa ympäristössä 2014 28.08.2014 Mikko Kesä, Jan-Erik Müller, Tuomo Saarinen Innolink Research Oy Yleistä tutkimuksesta Tutkimuksen tarkoituksena

Lisätiedot

Epävarmuuden hallinta bootstrap-menetelmillä

Epävarmuuden hallinta bootstrap-menetelmillä 1/17 Epävarmuuden hallinta bootstrap-menetelmillä Esimerkkinä taloudellinen arviointi Jaakko Nevalainen Tampereen yliopisto Metodifestivaalit 2015 2/17 Sisältö 1 Johdanto 2 Tavanomainen bootstrap Bootstrap-menettelyn

Lisätiedot

Perimmäinen kysymys. Työllistämisen tukitoimien vaikuttavuuden arvioinnista. Mitkä ovat tukitoimen X vaikutukset Y:hyn? Kari Hämäläinen (VATT)

Perimmäinen kysymys. Työllistämisen tukitoimien vaikuttavuuden arvioinnista. Mitkä ovat tukitoimen X vaikutukset Y:hyn? Kari Hämäläinen (VATT) Työllistämisen tukitoimien vaikuttavuuden arvioinnista Kari Hämäläinen (VATT) VATES päivät, 5.5.2015 Perimmäinen kysymys Mitkä ovat tukitoimen X vaikutukset Y:hyn? 1 Kolme ehtoa kausaaliselle syy seuraussuhteelle

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Liite artikkeliin Intohimo tasa-arvoon

Liite artikkeliin Intohimo tasa-arvoon Liite artikkeliin Intohimo tasa-arvoon Menetelmäkuvaus Artikkelissa käytetty regressiomalli on ns. binäärinen logistinen monitasoregressiomalli. Monitasoanalyysien ideana on se, että yksilöiden vastauksiin

Lisätiedot

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa.

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa. KERTAUS Lukujono KERTAUSTEHTÄVIÄ K1. Ratkaisussa annetaan esimerkit mahdollisista säännöistä. a) Jatketaan lukujonoa: 2, 4, 6, 8, 10, 12, 14, 16, Rekursiivinen sääntö on, että lukujonon ensimmäinen jäsen

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Mitä kausaalivaikutuksista voidaan päätellä havainnoivissa tutkimuksissa?

Mitä kausaalivaikutuksista voidaan päätellä havainnoivissa tutkimuksissa? Mitä kausaalivaikutuksista voidaan päätellä havainnoivissa tutkimuksissa? Mervi Eerola Turun yliopisto Sosiaalilääketieteen päivät 3.-4.11.2014 HS 27.9.2014: Juhana Vartiainen ja Kari Hämäläinen (VATT):

Lisätiedot

Pientalojen radonpitoisuuksien tilastollinen analyysi

Pientalojen radonpitoisuuksien tilastollinen analyysi Pientalojen radonpitoisuuksien tilastollinen analyysi (Valmiin työn esittely) 11.4.2011 Ohjaaja: DI Jirka Poropudas Valvoja: Prof. Raimo Hämäläinen Sisältö 1. Tausta 2. Tavoitteet 3. Menetelmät 4. Tulokset

Lisätiedot

KASILUOKKA. Koulutusvalinnat ja sukupuoli

KASILUOKKA. Koulutusvalinnat ja sukupuoli KASILUOKKA Koulutusvalinnat ja sukupuoli Tavoite ja toteutus Tunnin tavoitteena on rohkaista nuoria tekemään koulutusvalinnat omien kykyjen ja kiinnostuksen kohteiden perusteella sukupuolen ja siihen liitettyjen

Lisätiedot

Tarkasteluja lähtötason merkityksestä opintomenestykseen. MAMK:n tekniikassa

Tarkasteluja lähtötason merkityksestä opintomenestykseen. MAMK:n tekniikassa 1 Tarkasteluja lähtötason merkityksestä opintomenestykseen MAMK:n tekniikassa 2 1. Tutkimuksen perusteita Tekniikan alalle otetaan opiskelijoita kolmesta eri lähteestä : -ammattitutkinnon suorittaneet

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

3 Kuluttajan valintateoria: työn tarjonta ja säästäminen ( Mankiw & Taylor, 2 nd ed, ch 21)

3 Kuluttajan valintateoria: työn tarjonta ja säästäminen ( Mankiw & Taylor, 2 nd ed, ch 21) 3 Kuluttajan valintateoria: työn tarjonta ja säästäminen ( Mankiw & Taylor, 2 nd ed, ch 21) 1. Työn tarjonta Kuluttajan valintateorian perusmalli soveltuu suoraan kotitalouksien työn tarjontapäätöksen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016

Lisätiedot

Onko eläkeköyhyys faktaa vai fiktiota? - Eläkkeiden tasot ja ostovoiman kehitys Juha Rantala Ekonomisti Eläketurvakeskus

Onko eläkeköyhyys faktaa vai fiktiota? - Eläkkeiden tasot ja ostovoiman kehitys Juha Rantala Ekonomisti Eläketurvakeskus Onko eläkeköyhyys faktaa vai fiktiota? - Eläkkeiden tasot ja ostovoiman kehitys Juha Rantala Ekonomisti Eläketurvakeskus Eläkeläiset ry:n seminaari, Kuntoranta 27.4.2017 Esityksen sisältö 1) Taustaa. -

Lisätiedot

Kansainvälinen naistenpäivä 8. maaliskuuta 2013. Naiset ja sukupuolten välinen epätasa-arvo kriisiaikoina

Kansainvälinen naistenpäivä 8. maaliskuuta 2013. Naiset ja sukupuolten välinen epätasa-arvo kriisiaikoina Viestinnän pääosasto YLEISEN MIELIPITEEN SEURANTAYKSIKKÖ Bryssel 26. helmikuuta 2013 Kansainvälinen naistenpäivä 8. maaliskuuta 2013 Naiset ja sukupuolten välinen epätasa-arvo kriisiaikoina Euroopan parlamentin

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

2. Tietokoneharjoitukset

2. Tietokoneharjoitukset 2. Tietokoneharjoitukset Demotehtävät 2.1 Jatkoa kotitehtävälle. a) Piirrä aineistosta pistediagrammi (KULUTUS, SAIRAST) ja siihen estimoitu regressiosuora. KULUTUS on selitettävä muuttuja. b) Määrää estimoidusta

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää

Lisätiedot

Verkostoanalyysi yritysten verkostoitumista tukevien EAKRhankkeiden arvioinnin menetelmänä. Tamás Lahdelma ja Seppo Laakso

Verkostoanalyysi yritysten verkostoitumista tukevien EAKRhankkeiden arvioinnin menetelmänä. Tamás Lahdelma ja Seppo Laakso Verkostoanalyysi yritysten verkostoitumista tukevien EAKRhankkeiden arvioinnin menetelmänä Tamás Lahdelma ja Seppo Laakso Euroopan aluekehitysrahasto-ohjelmien arviointi alueellisten osaamisympäristöjen

Lisätiedot

Tilastomenetelmien lopputyö

Tilastomenetelmien lopputyö Tarja Heikkilä Tilastomenetelmien lopputyö Lopputyössä on esimerkkejä erilaisista tilastomenetelmistä. Datatiedosto Harjoitusdata.sav on muokattu tätä harjoitusta varten, joten se ei vastaa kaikkien muuttujien

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Kuolevuusseminaari

Kuolevuusseminaari Kuolevuusseminaari 19.03.2013 K2012: Henkivakuutuksen kuolevuustutkimus Henkivakuutettujen pitkän ajan kuolevuusennuste 1 Aihealueet Taustaa Kuolevuusennuste: menetelmän valinta Kuolevuusennuste: lähtöaineiston

Lisätiedot

Tehtävät 1/10. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Tehtävät 1/10. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin) 1/10 Tehtävä 1 2 3 4 5 6 7 8 9 10 Yhteensä Pisteet (tarkastaja merkitsee) Kokeessa on kymmenen tehtävää, joista jokainen on erillisellä paperilla. Jokaisen tehtävän maksimipistemäärä on 6 pistettä. Tehtävien

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Vuoden 2005 eläkeuudistuksen

Vuoden 2005 eläkeuudistuksen Vuoden 2005 eläkeuudistuksen vaikutus eläkkeelle siirtymiseen Roope Uusitalo HECER, Helsingin yliopisto Aktuaariyhdistys 23.10. 2013 Tutkimuksen tavoite Arvioidaan vuoden 2005 uudistusten kokonaisvaikutus

Lisätiedot

Digitaalinen markkinointi ja myynti Mitä DIVA meille kertoi?

Digitaalinen markkinointi ja myynti Mitä DIVA meille kertoi? Digitaalinen markkinointi ja myynti Mitä DIVA meille kertoi? Myynnin Digiloikka, 11/5/2017 Tommi Laukkanen UEF // University of Eastern Finland Asiakkaan ostopäätösprosessi TARPEEN TUNNISTAMINEN INFORMAATION

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. marraskuuta 2007 Antti Rasila () TodB 30. marraskuuta 2007 1 / 19 1 Lineaarinen regressiomalli ja suurimman uskottavuuden menetelmä Minimin löytäminen

Lisätiedot

Suomen suosituimmat remontit järjestyksessä

Suomen suosituimmat remontit järjestyksessä Suomen suosituimmat remontit järjestyksessä Remonttien kilpailutuspalvelu urakkamaailma.fi on tilastoinut ja analysoinut tuhansien remonttitarjouspyyntöjen perusteella Suomen suosituimmat remontit. Nyt

Lisätiedot

Palkansaajien sairauspoissaolot

Palkansaajien sairauspoissaolot Palkansaajien sairauspoissaolot Kaikilla mausteilla Artikkeleita työolotutkimuksesta Julkaisuseminaari 2.6.2006 Marko Ylitalo Asetelma! Tutkimuksessa selvitettiin " omaan ilmoitukseen perustuvien sairauspoissaolopäivien

Lisätiedot

virhemarginaali eli luottamusväli on plus miinus yksi prosenttiyksikkö. Taulukosta 1 nähdään myös muiden muuttujien vakioidut palkkaerot.

virhemarginaali eli luottamusväli on plus miinus yksi prosenttiyksikkö. Taulukosta 1 nähdään myös muiden muuttujien vakioidut palkkaerot. 28 työmarkkinaedunvalvonta Teksti: Teuvo Muhonen TEKin työmarkkinatutkimus Tulospalkkiot lievässä laskussa Tulospalkkioiden osuus kokonaisvuosiansioista oli viime vuonna 7,2 prosenttia, kun se vuotta aikaisemmin

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Kotien paloturvallisuusriskien kartoitus Palovaraaineiston. Hanna Hykkyrä Tuula Hakkarainen Kati Tillander

Kotien paloturvallisuusriskien kartoitus Palovaraaineiston. Hanna Hykkyrä Tuula Hakkarainen Kati Tillander Kotien paloturvallisuusriskien kartoitus Palovaraaineiston pohjalta Hanna Hykkyrä Tuula Hakkarainen Kati Tillander Johdanto Lähtökohta: n. 4000 rakennuspaloa / vuosi yli 95 % palokuolemista asuinrakennuksissa

Lisätiedot

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1 Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,

Lisätiedot