Erikoistyö: Alkoholin kulutusmenojen ennustaminen

Koko: px
Aloita esitys sivulta:

Download "Erikoistyö: Alkoholin kulutusmenojen ennustaminen"

Transkriptio

1 Erikoistyö: Alkoholin kulutusmenojen ennustaminen Tekijä: Mikko Nordlund 49857B Ohjaaja: Ilkka Mellin Jätetty:

2 Sisällysluettelo 1. JOHDANTO MALLIEN TUTKIMINEN MALLIT VIITTEET... 5 DOKUMENTTI: ALKOHOLIN KULUTUSMENOJEN ENNUSTAMINEN...LIITE 2

3 1. Johdanto Tämä erikoistyö on osa OtaStat-projektia. OtaStat on Ilkka Mellinin johtama projekti Teknillisen korkeakoulun Systeemianalyysin laboratoriossa. OtaStat-hankkeen tavoitteena on tuottaa verkko-opetusmateriaalia todennäköisyyslaskennan ja tilastotieteen opetusta varten [1]. Materiaalia voidaan käyttää myös osana Systeemianalyysin laboratorion tavallista opetusta. Koko työ on luettavissa WWW-sivulta ja liitteenä on työn vedos, josta puuttuvat laskutoimitukset ja jonka kuvien asettelu poikkeaa WWW-sivulla olevasta versiosta. Erikoistyö liittyy ennustamiseen ja aikasarja-analyysiin. Se käsittelee alkoholin markkamääräisen kysynnän kuvaamista ja ennustamista. Työ on kirjoitettu opetusmateriaaliksi ja tämän takia siinä käsitellään useita malleja, joiden puutteita korjataan ja lopulta päädytään käyttökelpoiseen malliin. Opetustarkoitusta varten työ on tehty Microsoft Excel ohjelmalla, joka on useimpien saatavilla. Laskutoimitukset ovat työssä mukana Excel-tiedostoina ja näistä näkee, miten erilaisia tilastollisia testejä voi tehdä tavallisella taulukkolaskentaohjelmalla. Testien tekeminen on myös havainnollisempaa Excelillä, koska erilliset tilasto-ohjelmistot eivät yleensä näytä laskutoimituksia vaan tulostavat pelkästään testin tuloksen. Näin testisuureiden laskeminen voi jäädä epäselväksi. Osittaisautokorrelaatiokertoimien estimaatit on kuitenkin laskettu NCSS 2000 ohjelman avulla, koska Excelillä näiden laskeminen edellyttää joko todella monien aputermien laskemista tai Visual Basic kielellä ohjelmoimista. Hypertext Markup Language eli HTML-muodossa oleva dokumentti sekä Portable Document Format eli PDF-muodossa oleva dokumentti on tuotettu OtaStat Markup Language eli OSML-kielellä, jonka Jussi Virtanen on suunnitellut ja toteuttanut yhdessä Veli Peltolan kanssa. OSML on XML eli Extensible Markup Language pohjainen kieli. Liitteenä on PDFmuodossa olevan dokumentin tuloste. 2. Mallien tutkiminen Mallien hyvyyttä tutkitaan useasta eri näkökulmasta. Malleista tehdään erilaisia kuvia graafisen tarkastelun avuksi. Selitysaste on keskeisin tunnusluku hyvyyden vertaamisessa. Residuaalit asetetaan diagnostisten testien kohteeksi. Lopuksi malleilla laaditaan ennuste viidelle vuodelle ja tätä verrataan toteutuneeseen kulutukseen. Estimoimisen jälkeen mallien residuaalit asetetaan graafisen tarkastelun ja diagnostisten testien kohteeksi, joiden tarkoituksena on selvittää, täyttävätkö mallin jäännöstermit niin kutsutut regressiomallin standardioletukset [2]: 1. Jäännöstermien ehdollinen odotusarvo on Jäännöstermit ovat ehdollisesti homoskedastisia. 3. Jäännöstermit ovat ehdollisesti korreloimattomia. 4. Jäännöstermit ovat ehdollisesti normaalijakautuneita 3

4 Ehdollisuus tarkoittaa ehdolla X, missä X on täysiasteinen selittäjämatriisi, jonka alkiot ovat satunnaismuuttujia. Standardioletusten testaamiseen käytetyistä tilastollisista testeistä on selvitys liitteenä olevassa selostuksessa. Kaikista malleista tehtiin seuraavat kuvat: 1. Aikasarjadiagrammi havainnoista ja sovitteista. 2. Aikasarjakuva residuaaleista. 3. Aikasarjakuva toteutuneesta kulutuksesta sekä sovitteesta ja ennusteesta. 4. Q-Q kuva residuaaleista. 5. Kuva estimoiduista autokorrelaatiokertoimista. 6. Kuva estimoiduista osittaisautokorrelaatiokertoimista. Kuvatyypistä 1 nähdään miten hyvin estimoitu malli sopii havaintoihin. Parhaassa tapauksessa käyrät asettuvat päällekkäin. Systemaattiset poikkeamat puolestaan viittaavat siihen, että malli ei ole oikein spesifioitu. Aikasarjakuva residuaaleista esittää samaa asiaa, mutta tästä kuvasta systemaattiset poikkeamat ja heteroskedastisuus on helpompi tunnistaa. Kuvatyyppi 3 kertoo miten hyvin mallin avulla laskettu ennuste sopii havaintoihin. Alkoholin kulutusmenojen pitkään jatkunut kasvutrendi taittuu vuoden 1973 tienoilla ja tämän vuoksi vuosille laadittu ennuste markkamääräisestä myynnistä osuu yläkanttiin. Kuvatyyppi 4 on eräs normaalipaperi, jonka avulla voidaan tutkia jäännöstermien normaalisuutta. Kuvia estimoiduista autokorrelaatio- ja osittaisautokorrelaatiokertoimista käytettiin jäännöstermien korreloituneisuuden arvioimiseen. Kuten aikasarja-analyysissä yleensä, myös alkoholin kulutusmenoja kuvattaessa regressiomallilla törmätään autokorrelaatio-ongelmaan. Autokorrelaation ohella toinen jäännöstermeihin liittyvä ongelma on heteroskedastisuus. Usein nämä ongelmat ilmenevät samanaikaisesti. Kun havaitaan, että malli ei täytä sille asetettuja standardioletuksia, mallia korjataan. Näin päädytään lopulta malliin, jonka jäännöstermit ovat normaalisia, homoskedastisia ja korreloimattomia. Tälläistä mallia kutsutaan riittäväksi. 3. Mallit Estimoidut mallit perustuvat kansantalouden kysyntäteoriaan. Työn alussa on lyhyesti selitetty peruskäsitteitä, kuten joustokerroin ja normaalihyödyke. Kysynnän hintajoustolla mitataan, kuinka herkästi kysytty määrä reagoi hinnan muutokseen. Kysynnän hintajoustossa määrän prosentuaalinen muutos jaetaan hinnan prosentuaalisella muutoksella [3]. Jos hyödykkeen hintajousto on esimerkiksi -1.25, yhden prosentin nousu hinnassa näkyy 1.25 prosentin laskuna kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen tapauksessa kysytty määrä kasvaa hinnan laskiessa ja vastaavasti kysyntä pienenee hinnan noustessa muiden tekijöiden pysyessä ennallaan. Siten normaalihyödykkeen hintajousto on negatiivinen. Kysynnän tulojoustossa hyödykkeen kysynnän prosentuaalinen muutos jaetaan kuluttajien tulojen prosentuaalisella muutoksella. Jos hyödykkeen tulojousto on esimerkiksi 1.4, yhden prosentin nousu kuluttajien tuloissa näkyy 1.4 prosentin nousuna hyödykkeen kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen kysyntä kasvaa, kun kuluttajien tulot kasvavat ja muut 4

5 tekijät pysyvät ennallaan. Vastaavasti normaalihyödykkeen kysyntä pienenee, kun kuluttajien tulot pienenevät. Tämän takia normaalihyödykkeen tulojousto on positiivinen. Malleissa käytetään selitettävänä muuttujana alkoholin per capita kulutusmenojen logaritmia. Selittäjinä käytetään per capita kokonaiskulutusmenojen logaritmia sekä alkoholin reaalihintaindeksin logaritmia. Logaritmoinnin ansiosta regressiokertoimet voidaan tulkita tulojoustoksi ja hintajoustoksi. Ensimmäinen tasomalli osoittautuu kelvottomaksi regressiodiagnostiikan näkökulmasta, vaikka mallin selitysaste on korkea ja regressiokertoimet merkitseviä. Tasomallia vastaavan differenssimallin jäännöstermejä ei voida pitää normaalisina ja niiden homoskedastisuutta on aihetta epäillä. Toiseen malliin lisätään selittäjäksi dummy-muuttuja. Vuonna 1969 alkoholilain muutos lisäsi Alkon myymälöiden määrää huomattavasti ja alkoholin markkamääräinen kysyntä kasvoi huomattavasti. Kokonaiskulutusmenot ja alkoholin hintaindeksi eivät selitä tätä muutosta, joten malliin lisätään dummy-muuttuja. Malli ei kuitenkaan läpäise diagnostisia testejä, autokorrelaatio on edelleen ongelma. Mallia vastaava differenssimalli sen sijaan läpäisee kaikki testit. Tasomallia korjataan lisäämällä selittäjiksi viivästetty selitettävä sekä viivästetyt selittäjät. Näin saadaan kolmas malli, joka on dynaaminen toisin kuin edelliset. Havaitaan, että dummy-muuttujan ja viivästetyn dummy-muuttujan regressiokertoimet ovat itseisarvoltaan lähes yhtä suuria, mutta vastakkaismerkkisiä. Tämän vuoksi ne voidaan korvata yhdellä impulssi-dummyllä. Neljännessa mallissa dummy-muuttujat on korvattu impulssi-dummylla, joka saa arvon 1 vuonna Näin mallissa on saatu vähennettyä selittäjien määrää yhdellä edelliseen verrattuna. Malli läpäisee diagnostiset testit ja sen tuottama ennuste on myös parempi kuin edellisillä malleilla. Mallien tarkempi vertailu on liitteessä. 4. Viitteet [1] OtaStat-projektin kuvaus: viitattu [2] Mellin, Ilkka Oppimateriaalia [3] Mäkelä, Vilho Käytännön kansantaloustiede. 2. uudistettu painos. KY-Palvelu Oy. 172 s. ISBN

6 5. Liite: Alkoholin kulutusmenojen ennustaminen 6

7 Alkoholin kulutusmenojen ennustaminen Mikko Nordlund Tausta Alkoholin kulutuksella on suuri kansantaloudellinen merkitys. Alkoholitulot muodostivat vuonna 2002 noin 5.5 % valtion verotuloista[1], mutta lisääntyvä kulutus kasvattaa myös muun muassa sosiaalimenoja. Alkoholin kulutuksen muutos vaikuttaa valtion tuloihin ja menoihin sekä suorasti että epäsuorasti. Tarkoituksena on kuvata alkoholin markkamääräistä kulutusta sopivalla aikasarjamallilla. Opetustarkoituksessa havaintoaineistoon sovitetaan erilaisia malleja, joita vertaillaan sekä graafisesti että tunnuslukujen ja diagnostisten testien avulla. Malleja korjataan, jos ne eivät läpäise diagnostisia testejä. Estimoitujen mallien avulla laaditaan ennuste, jota verrataan toteutuneeseen kulutukseen. Tilastollisesti hyvä malli yleensä myös tuottaa paremman ennusteen kuin huono malli. Mallit perustuvat kansantalouden kysyntäteoriaan. Kysynnän hintajoustolla mitataan, kuinka herkästi kysytty määrä reagoi hinnan muutokseen. Kysynnän hintajoustossa määrän prosentuaalinen muutos jaetaan hinnan prosentuaalisella muutoksella [2]. Jos hyödykkeen hintajousto on esimerkiksi -1.25, yhden prosentin nousu hinnassa näkyy 1.25 prosentin laskuna kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen tapauksessa kysytty määrä kasvaa hinnan laskiessa ja vastaavasti kysyntä pienenee hinnan noustessa muiden tekijöiden pysyessä ennallaan. Siten normaalihyödykkeen hintajousto on negatiivinen. Kysynnän tulojoustossa hyödykkeen kysynnän prosentuaalinen muutos jaetaan kuluttajien tulojen prosentuaalisella muutoksella. Jos hyödykkeen tulojousto on esimerkiksi 1.4, yhden prosentin nousu kuluttajien tuloissa näkyy 1.4 prosentin nousuna hyödykkeen kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen kysyntä kasvaa, kun kuluttajien tulot kasvavat ja muut tekijät pysyvät ennallaan. Vastaavasti normaalihyödykkeen kysyntä pienenee, kun kuluttajien tulot pienenevät. Tämän takia normaalihyödykkeen tulojousto on positiivinen. Mallien estimoinnin yhteydessä kommentoidaan myös laskettujen alkoholin tulo- ja hintajouston kertoimien järkevyyttä. On syytä olettaa, että alkoholin tulojousto on positiivinen ja hintajousto negatiivinen. Malleissa alkoholin markkamääräisen myynnin oletetaan riippuvan Suomen asukasluvusta, kuluttajien kokonaiskulutusmenoista (reaaliansioista) sekä alkoholin hinnasta. Asukasluvun ja kokonaiskulutusmenojen kasvu lisäävät alkoholin kysyntää, kun taas alkoholin hinnan nousu vähentää kysyntää. Väestönkasvun 1

8 vaikutus on huomioitu siirtymällä tutkimaan per capita aikasarjoja eli vuotuiset kokonaiskulutusmenot ja alkoholin kulutusmenot on suhteutettu väestömäärään. Inflaation vaikutus on poistettu aikasarjoista siirtymällä hintaindekseihin, joissa käypät hinnat on suhteutettu kiinteisiin hintoihin. Perusvuodeksi on valittu vuosi 1975 eli vuoden 1975 alkoholin reaalihintaindeksi on 100 ja kokonaiskulutusmenojen indeksi samoin 100. Mallien selitettävän ja selittäjien muodostaminen on käsitelty jokaisen mallin yhteydessä olevassa Excel-tiedostossa. Aikasarjat alkavat vuodesta Aikasarjat ulottuvat vuoteen 1981 asti, mutta vuosien havaintoja ei käytetä mallien estimoimiseen. Mallien avulla on laskettu ennuste vuosien kulutukselle ja tätä verrataan toteutuneeseen kulutukseen. Vuonna 1969 voimaan tullut alkoholilain muutos lisäsi Alkon myymälöiden lukumäärää huomattavasti. Lakiuudistus salli myös keskioluen myynnin kaupoissa ja kahviloissa. Tämä ei kuitenkaan näy tutkittavissa alkoholin kulutusmenoissa, koska keskiolutta ei luokitella alkoholijuomaksi. Suomen alkoholipolitiikka on pyrkinyt säätelemään alkoholin kulutusta hinnanmuutosten avulla. Tämä näkyy alkoholin reaalihintaindeksissä, joka on pysynyt lähes vakiona. Alkoholin hintaa on siis korotettu likimäärin reaalihintojen nousun mukana. Käytetyt välineet Kaikki laskutoimitukset osittaisautokorrelaatiokertoimien estimaatteja lukuun ottamatta on tehty Microsoft Excel -ohjelmalla. Samoin kaikki kuvat on tehty Excelin avulla. Regressiomallit on estimoitu käyttämällä Regression-nimistä työkalua, jonka saa käyttöön asentamalla Data Analysis ToolPak -lisäosan Exceliin. Tulostuksia on jonkin verran muokattu: keskeisimmät tunnusluvut on korostettu sinisellä värillä ja luottamusvälien rajat on poistettu. Osittaisautokorrelaatiokertoimien estimaatit on laskettu Jerry Hintzen NCSS ohjelman avulla. Kertoimien laskeminen edellyttää rekursiokaavan käyttämistä ja lukuisien aputermien laskemista. Tämän vuoksi Excelillä on laskettu ainoastaan 4 ensimmäistä estimaattia ja muut kertoimet on laskettu NCSS ohjelmalla. Satunnaisten selittäjien regressiomallin standardioletukset Estimoidun mallin regressiokertoimien merkitsevyys ja korkea selitysaste eivät riitä takaamaan, että malli on käyttökelpoinen. Jäännöstermien odotusarvon pitää olla 0, jäännöstermit eivät saa korreloida keskenään ja jäännösvarianssin tulee olla vakio. Jos nämä ehdot täyttyvät, estimoidun mallin residuaalit muistuttavat nk. valkoista kohinaa ja malli on riittävä. Tämän lisäksi asetetaan jäännöstermeille normaalisuusvaatimus. Yleinen lineaarinen regressiomalli voidaan esittää matriisimuodossa seuraavasti: y = Xβ + ε 2

9 missä y on selitettävän muuttujan y havaittujen arvojen muodostama satunnainen n-vektori. X on selittäjien x 1, x 2,..., x k havaittujen arvojen muodostama n (k + 1)- matriisi, jossa 1. sarake on ykkösten muodostama vakioselittäjä. β on regressiokertoimien muodostama tuntematon ja kiinteä eli ei-satunnainen (k+1)-vektori, jossa 1. alkio vastaa ykkösten muodostamaa vakioselittäjää. ε on jäännöstermien muodostama ei-havaittu ja satunnainen n-vektori. Koska mallien selittäjät ovat satunnaisia, yleisen lineaarisen regressiomallin standardioletukset voidaan esittää matriisein seuraavassa muodossa: 1. Selittäjämatriisin X alkiot ovat satunnaismuuttujia. 2. Selittäjämatriisi X on täysiasteinen: r(x) = k Jäännöstermin ε ehdollinen odotusarvo ehdolla X on 0: E(ε X) = 0 4. Jäännöstermit ovat ehdollisesti homoskedastisia ja ehdollisesti korreloimattomia: Cov(ε X) = σ 2 I 5. Jäännöstermit ovat ehdollisesti normaalijakautuneita: (ε X) N n (0, σ 2 I) Mallien regressiodiagnostiikka keskittyy standardioletusten voimassaolon testaamiseen. Ensimmäisenä on tutkittu jäännöstermien normaalisuutta, koska se on edellytys useiden testien käyttämiselle. Toisena on tutkittu jäännöstermien korreloimattomuutta. Jäännöstermien autokorrelaatio tekee muiden testien tuloksista vain suuntaa-antavia. Viimeisenä on tutkittu jäännöstermien homoskedastisuutta. Residuaalien aritmeettinen keskiarvo on 0, koska kaikissa estimoiduissa malleissa on mukana vakioselittäjä. 3

10 Käytettävät diagnostiset testit Jarquen ja Beran testi jäännöstermien normaalisuudelle Jarquen ja Beran (esiintyy myös kirjallisuudessa nimellä Bowmanin ja Shentonin) testin avulla tutkitaan jäännöstermien normaalisuutta residuaalien avulla. Residuaaleista lasketaan tunnusluvut vinoudelle (skewness) ja huipukkuudelle (kurtosis). Normaalijakautuneilla havainnoilla kumpikin tunnusluku on 0 satunnaisvaihtelua lukuun ottamatta. JB-testisuureen suuret arvot viittaavat siihen, että jäännöstermit eivät ole normaalisia. Olkoot tutkittavan mallin residuaalit. Lasketaan tunnusluku vinoudelle: S = e 1, e 2,..., e n 1 n (e t ē) 3 n t=1 ( ) 3/2 1 n (e t ē) 2 n t=1 Lasketaan tunnusluku huipukkuudelle: K = 1 n ( 1 n n (e t ē) 4 t=1 ) 2 3 n (e t ē) 2 t=1 Jos PNS-menetelmällä estimoidussa regressiomallissa on mukana vakioselittäjä, residuaalien summa (ja aritmeettinen keskiarvo) on 0. Koska kaikissa tässä käsitellyissä malleissa on mukana vakiotermi, residuaalien keskusmomentit yhtyvät origomomentteihin, ja tunnuslukujen kaavat supistuvat alla olevaan muotoon. Tunnusluku vinoudelle, kun mallissa on vakiotermi: S = 1 n n t=1 ( 1 n n t=1 e 2 t e 3 t ) 3/2 Tunnusluku huipukkuudelle, kun mallissa on vakiotermi: K = 1 n ( 1 n n t=1 n t=1 4 e 4 t e 2 t ) 2 3

11 Testattava hypoteesi H 0 : Jäännöstermit ovat normaalisia: ε t N(0, σ 2 ) kaikille t Testisuure ja sen jakauma (S K2 ) JB = n 6 Jos H 0 pätee, JB a χ 2 (2). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Huomautus: ˆ Testi reagoi voimakkaasti poikkeaviin havaintoihin, mutta ei ole muuten erityisen voimakas (ts. hyväksymisvirhe on suuri). ˆ Jäännöstermien ei-normaalisuus tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Durbinin ja Watsonin testi Durbinin ja Watsonin testillä tutkitaan ensimmäisen kertaluvun autokorrelaation olemassaoloa jäännöstermeissä. Testisuure perustuu estimoidun mallin residuaaleihin e t. Testisuureen kriittiset rajat löytyvät taulukoituina useista alan oppikirjoista. Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε t 1 ) = 0 kaikille t Testisuure ja sen jakauma DW = T (e t e t 1 ) 2 t=2 DW -testisuure ei noudata mitään yleistä jakaumaa, mutta testisuureen kriittiset rajat löytyvät taulukoituina useista alan oppikirjoista. DW -testisuure saa arvoja avoimelta väliltä 0 4, pienet arvot viittaavat positiiviseen autokorrelaatioon ja suuret puolestaan negatiiviseen autokorrelaatioon. Testisuureen normaaliarvo korreloimattomuusoletuksen pätiessä on luvun 2 lähellä. T t=1 e 2 t 5

12 Huomautuksia: ˆ Durbinin ja Watsonin testiä ei voi käyttää, jos mallissa on viivästetty selitettävä. Tällöin voidaan kuitenkin käyttää Durbinin h-testiä. ˆ Mallin selittäjien täytyy olla kiinteitä. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. Durbinin h-testi Durbinin h-testillä tutkitaan ensimmäisen kertaluvun autokorrelaation olemassaoloa jäännöstermeissä, kun estimoidussa mallissa on selittäjänä viivästetty selitettävä. Testisuure perustuu estimoidun mallin residuaaleihin e t. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βy t 1 + γx t + ε t e t = y t ŷ t Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε t 1 ) = 0 kaikille t Testisuure ja sen jakauma h = r 1 n 1 n Var( β) missä r 1 on ensimmäisen kertaluvun autokorrelaatiokertoimen estimaatti, n on havaintojen lukumäärä ja Var( β) on viivästetyn selitettävän regressiokertoimen varianssin harhaton estimaatti. Jos H 0 pätee, h a N(0, 1). Testisuureen nollasta merkitsevästi poikkeavat arvot viittaavat jäännöstermien autokorrelaatioon. 6

13 Huomautuksia: ˆ Durbinin h-testiä ei voi käyttää, jos n Var( β) 1, koska neliöjuuren sisällä olevasta lausekkeesta tulee tällöin negatiivinen. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Durbinin h-testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Lagrangen kertojatesti autokorrelaatiolle Jäännöstermien autokorreloituneisuutta voidaan tutkia Lagrangen kertojatestillä (Lagrange multiplier, LM), joka voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla. Apuregressiomallissa tutkittavan mallin residuaaleja selitetään alkuperäisillä selittäjillä sekä residuaalien astelukua p olevalla autoregressiolla. Apuregressiomallin suuri selitysaste viittaa jäännöstermien autokorrelaatioon. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βx t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e t = γ 0 + γ 1 x t + φ 1 e t 1 + φ 2 e t φ p e t p + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε s ) = 0 kaikille t s Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (p), missä n on residuaalien lukumäärä, R 2 on apuregressiomallin selitysaste ja p on autoregression asteluku. Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. 7

14 Huomautuksia: ˆ LM-testi jäännöstermin autokorrelaatiolle saattaa reagoida myös mallin väärään funktionaaliseen muotoon. ˆ Apuregression asteluvun p valinta vaikuttaa testin tulokseen: p pitää valita suureksi, mutta ei liian suureksi. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Mallissa saa olla mukana myös viivästetty selitettävä. Boxin ja Piercen Q-testi jäännöstermien korreloimattomuudelle Jos malli on oikein määritelty, residuaalit muistuttavat valkoista kohinaa. Jäännöstermien korreloimattomuutta voidaan testata Boxin ja Piercen Q-testisuureella (esiintyy myös nimellä portmanteau-testi). Testisuureen suuret arvot viittaavat jäännöstermien autokorrelaatioon. Olkoot r 1, r 2,..., r k tutkittavan regressiomallin otosautokorrelaatiokertoimet. Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε s ) = 0 kaikille t s Testisuure ja sen jakauma Q K = n(r r r 2 K) missä K on yhteenlaskettavien autokorrelaatiokertoimien estimaattien lukumäärä ja n on havaintojen lukumäärä. Jos H 0 pätee, Q K a χ 2 (K). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Huomautuksia: ˆ Mallissa ei saa olla viivästettyä endogeenista muuttujaa. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. 8

15 Lagrangen kertojatesti homoskedastisuudelle 1 Jäännöstermien homoskedastisuutta voidaan tutkia Lagrangen kertojatestillä (Lagrange multiplier, LM), joka voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla. Apuregressiomallissa selitetään tutkittavan mallin residuaalien neliöitä alkuperäisen mallin selittäjillä, selittäjien neliöillä sekä selittäjien ristitulolla. Ristitulotermejä ei ole käytetty tässä yhteydessä selittäjinä, jos alkuperäisessä mallissa on ollut yli 3 selittäjää. Apuregressiomallin korkea selitysaste viittaa siihen, että jäännöstermit ovat heteroskedastisia. Testi esiintyy kirjallisuudessa myös nimellä Whiten testi. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + β 1 x t + β 2 z t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e 2 t = γ 0 + γ 1 x t + γ 2 z t + γ 3 x 2 t + γ 4 z 2 t + γ 5 x t z t + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit ovat homoskedastisia: Var(ε t ) = σ 2 kaikille t Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (p), missä n on residuaalien lukumäärä, R 2 on apuregressiomallin selitysaste ja p on apuregression aitojen selittäjien lukumäärä (vakioselittäjä poisluettuna). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. Huomautus: ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. 9

16 Lagrangen kertojatesti homoskedastisuudelle 2 Lagrangen kertojatesti (Lagrange multiplier, LM) jäännöstermien homoskedastisuudelle voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla, jossa selitetään tutkittavan mallin residuaalien neliöitä mallin sovitteilla. Apuregressiomallin korkea selitysaste viittaa siihen, että jäännöstermit ovat heteroskedastisia. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βx t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e 2 t = γ 0 + γ 1 ŷ t + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit ovat homoskedastisia: Var(ε t ) = σ 2 kaikille t Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (1), missä n on residuaalien lukumäärä ja R 2 on apuregressiomallin selitysaste. Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. Huomautus: ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Sarjat, selittäjät ja selitettävä Logaritmointi Mallin estimoinnissa on käytetty logaritmoituja selittäjiä sekä selitettävää. Tämä tekee suhteellisten muutosten tulkitsemisen helpommaksi. Esimerkiksi jos x 0 muuttuu p %, niin uusi arvo x 1 on 10

17 ja edelleen ( x 1 = 1 + p ) x ( log(x 1 ) = log(x 0 ) + log 1 + p ) log(x 0 ) + p Logaritmoinnin ansiosta reaalihintaindeksin sekä per capita kokonaiskulutusmenojen regressiokertoimet voidaan tulkita hinta- ja tulojoustona. Differenssien laskeminen Osa käsitellyistä regressiomalleista on nk. differenssimalleja, joissa selitetään muuttujien vuosimuutosta. Differenssioperaattorin merkkinä on käytetty D- kirjainta. Esimerkiksi muuttujan x t ensimmäinen differenssi on D x t = x t x t 1 Ensimmäisen differenssin tulkinta vastaa kahden peräkkäisen vuoden havaintojen muutosta tutkittavissa vuosisarjoissa. Aikasarjat Mallinrakennukseen on käytetty seuraavia aikasarjoja vuosilta : Vexp45 Kokonaiskulutusmenot käypällä hintatasolla [milj. mk] Qexp45 Kokonaiskulutusmenot kiinteällä vuoden 1975 hintatasolla [milj. mk] Popul Asukasluku V1c Alkoholin kulutusmenot käypällä hintatasolla [milj. mk] Q1c Alkoholin kulutusmenot kiinteällä vuoden 1975 hintatasolla [milj. mk] Lisäksi sarjoista on vuosilta havainnot, joita käytetään ennusteen ja toteutuneen kulutuksen vertailuun. Aikasarjat ovat liitteenä Excel-tiedostossa sarjat.xls. Aikasarjoista muodostettiin seuraavat apumuuttujat: V t Q t P t v t Per capita kokonaiskulutusmenot käypällä hintatasolla V t = 10 6 Vexp45/Popul [mk] Per capita kokonaiskulutusmenot kiinteällä vuoden 1975 hintatasolla Q t = 10 6 Qexp45/Popul [mk] Kokonaiskulutusmenojen implisiittinen deflaattori P t = 100 V t /Q t (1975 = 100) Per capita alkoholin kulutusmenot käypällä hintatasolla v t = 10 6 V1c/Popul [mk] 11

18 Kuva 1: Pistediagrammi alkoholin reaalihintaindeksin logaritmista log(100 p t /P t ) kokonaiskulutusmenojen logaritmia log(q t ) vastaan. q t p t Per capita alkoholin kulutusmenot kiinteällä vuoden 1975 hintatasolla q t = 10 6 Q1c/Popul [mk] Alkoholin implisiittinen hintaindeksi p t = 100 v t /q t (1975 = 100) 100 p t /P t Alkoholin reaalihintaindeksi 100 p t /P t (1975 = 100) Pistediagrammista näkyy, että alkoholin kulutusmenojen ja alkoholin reaalihintaindeksin välillä on heikko negatiivinen korrelaatio. Alkoholin kulutusmenoissa näkyy aikasarjakuvassa selvä nouseva trendi, kun taas alkoholin reaalihintaindeksi on pysynyt lähes vakiona. Sekä pistediagrammista että aikasarjakuvasta näkyy, että kokonaiskulutusmenojen ja alkoholin kulutusmenojen välillä on vahva positiivinen korrelaatio. Molemmissa sarjoissa näkyy selvä nouseva trendi. Edellä esitetyt pistediagrammit ja aikasarjat löytyvät tiedostosta pari_regr.xls. Tiedostossa on myös kuvia sarjoista. 1. malli Regressiomallin selitettävä (log-funktio on luonnollinen logaritmi): ˆ Per capita kiinteän hintatason alkoholin kulutusmenojen logaritmi log(q t ) Regressiomallissa käytettiin seuraavia selittäjiä: 12

19 Kuva 2: Aikasarja alkoholin kulutusmenojen logaritmista log(q t ) ja alkoholin reaalihintaindeksin logaritmista log(100 p t /P t ). Kuva 3: Pistediagrammi kokonaiskulutusmenojen logaritmista log(q t ) alkoholin kulutusmenojen logaritmia log(q t ) vastaan. 13

20 Kuva 4: Aikasarja alkoholin kulutusmenojen logaritmista log(q t ) ja kokonaiskulutusmenojen logaritmista log(q t ). ˆ Alkoholin reaalihintaindeksin logaritmi log(100 p t /P t ) ˆ Per capita kiinteän hintatason kokonaiskulutusmenojen logaritmi log(q t ) Estimoidaan PNS-menetelmällä regressiomalli, jossa selitetään alkoholin per capita kulutusmenojen logaritmia alkoholin reaalihintaindeksin logaritmilla sekä per capita kokonaiskulutusmenojen logaritmilla. Selitettävä ja selittäjät löytyvät Excel-taulukosta malli1_selittajat.xls. Logaritmoidun reaalihintaindeksin regressiokertoimen tulkinta vastaa pitkän aikavälin hintajoustoa. Hintatason nousu johtaa yleensä kysynnän laskuun, joten hintajousto on tyypillisesti negatiivinen. Logaritmoidun per capita kokonaiskulutusmenojen regressiokertoimen tulkinta vastaa pitkän aikavälin tulojoustoa. Tulotason nousu lisää tavallisesti kysyntää ellei kyseessä ole nk. inferiorinen hyödyke, jonka kysyntä vähentyy tulotason noustessa. Tulojousto on siis tyypillisesti positiivinen. Estimoitu malli ja tunnusluvut Estimoitu lineaarinen regressiomalli on seuraava (suluissa estimaattien keskihajonnat): log(q t ) = (2.352) (0.470) log(100 p t/p t ) (0.072) log(q t) R 2 =

21 Kuva 5: Kuva havainnoista ja sovitteista aikaa vastaan. Malli löytyy laskutoimituksineen Excel-tiedostosta malli1.xls. Mallin regressiokertoimet ovat merkitseviä vakioselittäjän kerroin pois lukien. Sekä pitkän aikavälin hintajousto 1.12 että tulojousto 1.51 ovat merkitseviä. Pitkän aikavälin hintajousto voidaan tulkita siten, että 1 %:n nousu alkoholin reaalihinnassa näkyy pitkällä aikavälillä 1.12 %:n laskuna alkoholin kulutusmenoissa muiden tekijöiden pysyessä ennallaan. Vastaavasti pitkän aikavälin tulojousto voidaan tulkita siten, että 1 %:n kasvu per capita kokonaiskulutusmenoissa näkyy 1.51 %:n kasvuna alkoholin kulutusmenoissa pitkällä aikavälillä muiden tekijöiden pysyessä ennallaan. Mallin selitysaste R 2 = on korkea. Graafinen tarkastelu Malli ei näytä sopivan havaintoihin kovin hyvin. Vaikka trendit asettuvat kohdalleen, mallin tuottamat sovitteet ovat systemaattisesti havaintoja pienempiä tai suurempia usean peräkkäisen vuoden ajan, joten malli ei ole hyvä. Malli ei kykene selittämään vuoden 1969 lainmuutoksen aiheuttamaa hyppäystä alkoholin kulutusmenoissa. Kuvassa katkoviiva kuvaa mallin avulla laskettua ennustetta. Residuaalit ovat ensin positiivisia vuosien ajan, tämän jälkeen negatiivisia vuosien ajan ja jälleen positiivisia vuosina Tämä viittaa voimakkaaseen positiiviseen ensimmäisen kertaluvun autokorrelaatioon. Itseisarvoltaan pieniä residuaaleja on vähän. Tämän antaa aihetta epäillä jäännöstermien homoskedastisuutta. Huomaa residuaalikuvassa tapahtuva muutos vuosien 1968 ja 1969 välillä (havainnot 19 ja 20). Katkoviivalla piirretty kiinteän hintatason ennuste poikkeaa selvästi havainnoista. Vuonna 1981 ennusteen ja toteutuneen kulutuksen erotus on 316 miljoonaa markkaa. Ennustevirhe on niin suuri, että mallin tuottamaa ennustetta ei voi pitää käyttökelpoisena. 15

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1 Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2004) 1 Yleinen lineaarinen malli Usean selittäjän lineaarinen regressiomalli Yleisen lineaarisen mallin matriisisesitys Yleisen

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

2. Teoriaharjoitukset

2. Teoriaharjoitukset 2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

4. Tietokoneharjoitukset

4. Tietokoneharjoitukset 4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume

Lisätiedot

4. Tietokoneharjoitukset

4. Tietokoneharjoitukset 4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli

Yhden selittäjän lineaarinen regressiomalli Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme? TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen Tilastollisen analyysin perusteet Luento 5: Sisältö Tilastotieteessä tehdään usein oletuksia havaintojen jakaumasta. Useat tilastolliset menetelmät toimivat tehottomasti tai jopa virheellisesti, jos jakaumaoletukset

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Harjoitukset 4 : Paneelidata (Palautus )

Harjoitukset 4 : Paneelidata (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Jos Q = kysytty määrä, Q = kysytyn määrän muutos, P = hinta ja P = hinnan muutos, niin hintajousto on Q/Q P/P

Jos Q = kysytty määrä, Q = kysytyn määrän muutos, P = hinta ja P = hinnan muutos, niin hintajousto on Q/Q P/P Osa 5. Joustoista Kysynnän hintajousto (price elasticity of demand) mittaa, miten kysynnän määrä reagoi hinnan muutokseen = kysytyn määrän suhteellinen muutos jaettuna hinnan suhteellisella muutoksella

Lisätiedot

Korrelaatiokertoinen määrittely 165

Korrelaatiokertoinen määrittely 165 kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) Tavoitteet (teoria): Hahmottaa aikasarjan klassiset komponentit ideaalisessa tilanteessa. Ymmärtää viivekuvauksen vaikutus trendiin. ARCH-prosessin

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

Johdatus tilastotieteeseen Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Regressiodiagnostiikka TKK (c) Ilkka Mellin (2004) 1 Regressiodiagnostiikka Yleinen lineaarinen malli ja regressiodiagnostiikka Regressiografiikka Poikkeavat havainnot Regressiokertoimien

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Harjoitus 7 : Aikasarja-analyysi (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitus 7 : Aikasarja-analyysi (Palautus 28.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Yleinen lineaarinen malli

Yleinen lineaarinen malli MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: 1 Määritelmä ja standardioletukset 2

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa.

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa. KERTAUS Lukujono KERTAUSTEHTÄVIÄ K1. Ratkaisussa annetaan esimerkit mahdollisista säännöistä. a) Jatketaan lukujonoa: 2, 4, 6, 8, 10, 12, 14, 16, Rekursiivinen sääntö on, että lukujonon ensimmäinen jäsen

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH 8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH Osa aikasarjoista kehittyy hyvin erityyppisesti erilaisissa tilanteissa. Esimerkiksi pörssikurssien epävakaus keskittyy usein lyhyisiin

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

Regressiodiagnostiikka ja regressiomallin valinta

Regressiodiagnostiikka ja regressiomallin valinta Regressiodiagnostiikka ja regressiomallin valinta MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Alkoholijuomien hinnat ja kulutus

Alkoholijuomien hinnat ja kulutus Alkoholijuomien hinnat ja kulutus VILLE VEHKASALO Virosta tulee näillä näkymin EU:n jäsen vuoden 2004 vappuna. Tämän jälkeen kuka tahansa voi tuoda omaan käyttöönsä edullista alkoholia Virosta vaikka pakettiautolla.

Lisätiedot

Johdatus regressioanalyysiin

Johdatus regressioanalyysiin Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2007) 1 Johdatus regressioanalyysiin >> Regressioanalyysin lähtökohdat ja tavoitteet

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

2. TILASTOLLINEN TESTAAMINEN...

2. TILASTOLLINEN TESTAAMINEN... !" # 1. 1. JOHDANTO... 3 2. 2. TILASTOLLINEN TESTAAMINEN... 4 2.1. T-TESTI... 4 2.2. RANDOMISAATIOTESTI... 5 3. SIMULOINTI... 6 3.1. OTOSTEN POIMINTA... 6 3.2. TESTAUS... 7 3.3. TESTIEN TULOSTEN VERTAILU...

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾. 24.11.2006 1. Oletetaan, että kaksiulotteinen satunnaismuuttuja µ noudattaa kaksiulotteista normaalijakaumaa. Oletetaan lisäksi, että satunnaismuuttujan regressiofunktio satunnaismuuttujan suhteen on ݵ

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT imat-2.104 Tilastollisen analyysin perusteet / Tehtävät Aiheet: Avainsanat: Ysisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Koonaisesiarvo,

Lisätiedot

Regressiodiagnostiikka ja regressiomallin valinta

Regressiodiagnostiikka ja regressiomallin valinta Regressiodiagnostiikka ja regressiomallin valinta MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus MS-C2128 Ennustaminen ja aikasarja-analyysi 5. harjoitukset / Tehtävät Kotitehtävät: 2 Aihe: ARMA-mallit Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tehtävä 5.1. Tarkastellaan

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Regressiomallin valinta TKK (c) Ilkka Mellin (2004) 1 Regressiomallin valinta Regressiomallin valinta: Johdanto Mallinvalintatestit Mallinvalintakriteerit Epälineaaristen riippuvuuksien

Lisätiedot

11. laskuharjoituskierros, vko 15, ratkaisut

11. laskuharjoituskierros, vko 15, ratkaisut 11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa

Lisätiedot

Aikasarjamallit. Pekka Hjelt

Aikasarjamallit. Pekka Hjelt Pekka Hjelt Aikasarjamallit Aikasarja koostuu järjestyksessä olevista havainnoista, ja yleensä se on tasavälinen ja diskreetti eli havaintopisteet ovat erillisiä. Lisäksi aikasarjassa on yleensä autokorrelaatiota

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2005) 1 Johdatus regressioanalyysiin Regressioanalyysin lähtökohdat ja tavoitteet Deterministiset mallit ja regressioanalyysi

Lisätiedot