Erikoistyö: Alkoholin kulutusmenojen ennustaminen

Koko: px
Aloita esitys sivulta:

Download "Erikoistyö: Alkoholin kulutusmenojen ennustaminen"

Transkriptio

1 Erikoistyö: Alkoholin kulutusmenojen ennustaminen Tekijä: Mikko Nordlund 49857B Ohjaaja: Ilkka Mellin Jätetty:

2 Sisällysluettelo 1. JOHDANTO MALLIEN TUTKIMINEN MALLIT VIITTEET... 5 DOKUMENTTI: ALKOHOLIN KULUTUSMENOJEN ENNUSTAMINEN...LIITE 2

3 1. Johdanto Tämä erikoistyö on osa OtaStat-projektia. OtaStat on Ilkka Mellinin johtama projekti Teknillisen korkeakoulun Systeemianalyysin laboratoriossa. OtaStat-hankkeen tavoitteena on tuottaa verkko-opetusmateriaalia todennäköisyyslaskennan ja tilastotieteen opetusta varten [1]. Materiaalia voidaan käyttää myös osana Systeemianalyysin laboratorion tavallista opetusta. Koko työ on luettavissa WWW-sivulta ja liitteenä on työn vedos, josta puuttuvat laskutoimitukset ja jonka kuvien asettelu poikkeaa WWW-sivulla olevasta versiosta. Erikoistyö liittyy ennustamiseen ja aikasarja-analyysiin. Se käsittelee alkoholin markkamääräisen kysynnän kuvaamista ja ennustamista. Työ on kirjoitettu opetusmateriaaliksi ja tämän takia siinä käsitellään useita malleja, joiden puutteita korjataan ja lopulta päädytään käyttökelpoiseen malliin. Opetustarkoitusta varten työ on tehty Microsoft Excel ohjelmalla, joka on useimpien saatavilla. Laskutoimitukset ovat työssä mukana Excel-tiedostoina ja näistä näkee, miten erilaisia tilastollisia testejä voi tehdä tavallisella taulukkolaskentaohjelmalla. Testien tekeminen on myös havainnollisempaa Excelillä, koska erilliset tilasto-ohjelmistot eivät yleensä näytä laskutoimituksia vaan tulostavat pelkästään testin tuloksen. Näin testisuureiden laskeminen voi jäädä epäselväksi. Osittaisautokorrelaatiokertoimien estimaatit on kuitenkin laskettu NCSS 2000 ohjelman avulla, koska Excelillä näiden laskeminen edellyttää joko todella monien aputermien laskemista tai Visual Basic kielellä ohjelmoimista. Hypertext Markup Language eli HTML-muodossa oleva dokumentti sekä Portable Document Format eli PDF-muodossa oleva dokumentti on tuotettu OtaStat Markup Language eli OSML-kielellä, jonka Jussi Virtanen on suunnitellut ja toteuttanut yhdessä Veli Peltolan kanssa. OSML on XML eli Extensible Markup Language pohjainen kieli. Liitteenä on PDFmuodossa olevan dokumentin tuloste. 2. Mallien tutkiminen Mallien hyvyyttä tutkitaan useasta eri näkökulmasta. Malleista tehdään erilaisia kuvia graafisen tarkastelun avuksi. Selitysaste on keskeisin tunnusluku hyvyyden vertaamisessa. Residuaalit asetetaan diagnostisten testien kohteeksi. Lopuksi malleilla laaditaan ennuste viidelle vuodelle ja tätä verrataan toteutuneeseen kulutukseen. Estimoimisen jälkeen mallien residuaalit asetetaan graafisen tarkastelun ja diagnostisten testien kohteeksi, joiden tarkoituksena on selvittää, täyttävätkö mallin jäännöstermit niin kutsutut regressiomallin standardioletukset [2]: 1. Jäännöstermien ehdollinen odotusarvo on Jäännöstermit ovat ehdollisesti homoskedastisia. 3. Jäännöstermit ovat ehdollisesti korreloimattomia. 4. Jäännöstermit ovat ehdollisesti normaalijakautuneita 3

4 Ehdollisuus tarkoittaa ehdolla X, missä X on täysiasteinen selittäjämatriisi, jonka alkiot ovat satunnaismuuttujia. Standardioletusten testaamiseen käytetyistä tilastollisista testeistä on selvitys liitteenä olevassa selostuksessa. Kaikista malleista tehtiin seuraavat kuvat: 1. Aikasarjadiagrammi havainnoista ja sovitteista. 2. Aikasarjakuva residuaaleista. 3. Aikasarjakuva toteutuneesta kulutuksesta sekä sovitteesta ja ennusteesta. 4. Q-Q kuva residuaaleista. 5. Kuva estimoiduista autokorrelaatiokertoimista. 6. Kuva estimoiduista osittaisautokorrelaatiokertoimista. Kuvatyypistä 1 nähdään miten hyvin estimoitu malli sopii havaintoihin. Parhaassa tapauksessa käyrät asettuvat päällekkäin. Systemaattiset poikkeamat puolestaan viittaavat siihen, että malli ei ole oikein spesifioitu. Aikasarjakuva residuaaleista esittää samaa asiaa, mutta tästä kuvasta systemaattiset poikkeamat ja heteroskedastisuus on helpompi tunnistaa. Kuvatyyppi 3 kertoo miten hyvin mallin avulla laskettu ennuste sopii havaintoihin. Alkoholin kulutusmenojen pitkään jatkunut kasvutrendi taittuu vuoden 1973 tienoilla ja tämän vuoksi vuosille laadittu ennuste markkamääräisestä myynnistä osuu yläkanttiin. Kuvatyyppi 4 on eräs normaalipaperi, jonka avulla voidaan tutkia jäännöstermien normaalisuutta. Kuvia estimoiduista autokorrelaatio- ja osittaisautokorrelaatiokertoimista käytettiin jäännöstermien korreloituneisuuden arvioimiseen. Kuten aikasarja-analyysissä yleensä, myös alkoholin kulutusmenoja kuvattaessa regressiomallilla törmätään autokorrelaatio-ongelmaan. Autokorrelaation ohella toinen jäännöstermeihin liittyvä ongelma on heteroskedastisuus. Usein nämä ongelmat ilmenevät samanaikaisesti. Kun havaitaan, että malli ei täytä sille asetettuja standardioletuksia, mallia korjataan. Näin päädytään lopulta malliin, jonka jäännöstermit ovat normaalisia, homoskedastisia ja korreloimattomia. Tälläistä mallia kutsutaan riittäväksi. 3. Mallit Estimoidut mallit perustuvat kansantalouden kysyntäteoriaan. Työn alussa on lyhyesti selitetty peruskäsitteitä, kuten joustokerroin ja normaalihyödyke. Kysynnän hintajoustolla mitataan, kuinka herkästi kysytty määrä reagoi hinnan muutokseen. Kysynnän hintajoustossa määrän prosentuaalinen muutos jaetaan hinnan prosentuaalisella muutoksella [3]. Jos hyödykkeen hintajousto on esimerkiksi -1.25, yhden prosentin nousu hinnassa näkyy 1.25 prosentin laskuna kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen tapauksessa kysytty määrä kasvaa hinnan laskiessa ja vastaavasti kysyntä pienenee hinnan noustessa muiden tekijöiden pysyessä ennallaan. Siten normaalihyödykkeen hintajousto on negatiivinen. Kysynnän tulojoustossa hyödykkeen kysynnän prosentuaalinen muutos jaetaan kuluttajien tulojen prosentuaalisella muutoksella. Jos hyödykkeen tulojousto on esimerkiksi 1.4, yhden prosentin nousu kuluttajien tuloissa näkyy 1.4 prosentin nousuna hyödykkeen kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen kysyntä kasvaa, kun kuluttajien tulot kasvavat ja muut 4

5 tekijät pysyvät ennallaan. Vastaavasti normaalihyödykkeen kysyntä pienenee, kun kuluttajien tulot pienenevät. Tämän takia normaalihyödykkeen tulojousto on positiivinen. Malleissa käytetään selitettävänä muuttujana alkoholin per capita kulutusmenojen logaritmia. Selittäjinä käytetään per capita kokonaiskulutusmenojen logaritmia sekä alkoholin reaalihintaindeksin logaritmia. Logaritmoinnin ansiosta regressiokertoimet voidaan tulkita tulojoustoksi ja hintajoustoksi. Ensimmäinen tasomalli osoittautuu kelvottomaksi regressiodiagnostiikan näkökulmasta, vaikka mallin selitysaste on korkea ja regressiokertoimet merkitseviä. Tasomallia vastaavan differenssimallin jäännöstermejä ei voida pitää normaalisina ja niiden homoskedastisuutta on aihetta epäillä. Toiseen malliin lisätään selittäjäksi dummy-muuttuja. Vuonna 1969 alkoholilain muutos lisäsi Alkon myymälöiden määrää huomattavasti ja alkoholin markkamääräinen kysyntä kasvoi huomattavasti. Kokonaiskulutusmenot ja alkoholin hintaindeksi eivät selitä tätä muutosta, joten malliin lisätään dummy-muuttuja. Malli ei kuitenkaan läpäise diagnostisia testejä, autokorrelaatio on edelleen ongelma. Mallia vastaava differenssimalli sen sijaan läpäisee kaikki testit. Tasomallia korjataan lisäämällä selittäjiksi viivästetty selitettävä sekä viivästetyt selittäjät. Näin saadaan kolmas malli, joka on dynaaminen toisin kuin edelliset. Havaitaan, että dummy-muuttujan ja viivästetyn dummy-muuttujan regressiokertoimet ovat itseisarvoltaan lähes yhtä suuria, mutta vastakkaismerkkisiä. Tämän vuoksi ne voidaan korvata yhdellä impulssi-dummyllä. Neljännessa mallissa dummy-muuttujat on korvattu impulssi-dummylla, joka saa arvon 1 vuonna Näin mallissa on saatu vähennettyä selittäjien määrää yhdellä edelliseen verrattuna. Malli läpäisee diagnostiset testit ja sen tuottama ennuste on myös parempi kuin edellisillä malleilla. Mallien tarkempi vertailu on liitteessä. 4. Viitteet [1] OtaStat-projektin kuvaus: viitattu [2] Mellin, Ilkka Oppimateriaalia [3] Mäkelä, Vilho Käytännön kansantaloustiede. 2. uudistettu painos. KY-Palvelu Oy. 172 s. ISBN

6 5. Liite: Alkoholin kulutusmenojen ennustaminen 6

7 Alkoholin kulutusmenojen ennustaminen Mikko Nordlund Tausta Alkoholin kulutuksella on suuri kansantaloudellinen merkitys. Alkoholitulot muodostivat vuonna 2002 noin 5.5 % valtion verotuloista[1], mutta lisääntyvä kulutus kasvattaa myös muun muassa sosiaalimenoja. Alkoholin kulutuksen muutos vaikuttaa valtion tuloihin ja menoihin sekä suorasti että epäsuorasti. Tarkoituksena on kuvata alkoholin markkamääräistä kulutusta sopivalla aikasarjamallilla. Opetustarkoituksessa havaintoaineistoon sovitetaan erilaisia malleja, joita vertaillaan sekä graafisesti että tunnuslukujen ja diagnostisten testien avulla. Malleja korjataan, jos ne eivät läpäise diagnostisia testejä. Estimoitujen mallien avulla laaditaan ennuste, jota verrataan toteutuneeseen kulutukseen. Tilastollisesti hyvä malli yleensä myös tuottaa paremman ennusteen kuin huono malli. Mallit perustuvat kansantalouden kysyntäteoriaan. Kysynnän hintajoustolla mitataan, kuinka herkästi kysytty määrä reagoi hinnan muutokseen. Kysynnän hintajoustossa määrän prosentuaalinen muutos jaetaan hinnan prosentuaalisella muutoksella [2]. Jos hyödykkeen hintajousto on esimerkiksi -1.25, yhden prosentin nousu hinnassa näkyy 1.25 prosentin laskuna kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen tapauksessa kysytty määrä kasvaa hinnan laskiessa ja vastaavasti kysyntä pienenee hinnan noustessa muiden tekijöiden pysyessä ennallaan. Siten normaalihyödykkeen hintajousto on negatiivinen. Kysynnän tulojoustossa hyödykkeen kysynnän prosentuaalinen muutos jaetaan kuluttajien tulojen prosentuaalisella muutoksella. Jos hyödykkeen tulojousto on esimerkiksi 1.4, yhden prosentin nousu kuluttajien tuloissa näkyy 1.4 prosentin nousuna hyödykkeen kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen kysyntä kasvaa, kun kuluttajien tulot kasvavat ja muut tekijät pysyvät ennallaan. Vastaavasti normaalihyödykkeen kysyntä pienenee, kun kuluttajien tulot pienenevät. Tämän takia normaalihyödykkeen tulojousto on positiivinen. Mallien estimoinnin yhteydessä kommentoidaan myös laskettujen alkoholin tulo- ja hintajouston kertoimien järkevyyttä. On syytä olettaa, että alkoholin tulojousto on positiivinen ja hintajousto negatiivinen. Malleissa alkoholin markkamääräisen myynnin oletetaan riippuvan Suomen asukasluvusta, kuluttajien kokonaiskulutusmenoista (reaaliansioista) sekä alkoholin hinnasta. Asukasluvun ja kokonaiskulutusmenojen kasvu lisäävät alkoholin kysyntää, kun taas alkoholin hinnan nousu vähentää kysyntää. Väestönkasvun 1

8 vaikutus on huomioitu siirtymällä tutkimaan per capita aikasarjoja eli vuotuiset kokonaiskulutusmenot ja alkoholin kulutusmenot on suhteutettu väestömäärään. Inflaation vaikutus on poistettu aikasarjoista siirtymällä hintaindekseihin, joissa käypät hinnat on suhteutettu kiinteisiin hintoihin. Perusvuodeksi on valittu vuosi 1975 eli vuoden 1975 alkoholin reaalihintaindeksi on 100 ja kokonaiskulutusmenojen indeksi samoin 100. Mallien selitettävän ja selittäjien muodostaminen on käsitelty jokaisen mallin yhteydessä olevassa Excel-tiedostossa. Aikasarjat alkavat vuodesta Aikasarjat ulottuvat vuoteen 1981 asti, mutta vuosien havaintoja ei käytetä mallien estimoimiseen. Mallien avulla on laskettu ennuste vuosien kulutukselle ja tätä verrataan toteutuneeseen kulutukseen. Vuonna 1969 voimaan tullut alkoholilain muutos lisäsi Alkon myymälöiden lukumäärää huomattavasti. Lakiuudistus salli myös keskioluen myynnin kaupoissa ja kahviloissa. Tämä ei kuitenkaan näy tutkittavissa alkoholin kulutusmenoissa, koska keskiolutta ei luokitella alkoholijuomaksi. Suomen alkoholipolitiikka on pyrkinyt säätelemään alkoholin kulutusta hinnanmuutosten avulla. Tämä näkyy alkoholin reaalihintaindeksissä, joka on pysynyt lähes vakiona. Alkoholin hintaa on siis korotettu likimäärin reaalihintojen nousun mukana. Käytetyt välineet Kaikki laskutoimitukset osittaisautokorrelaatiokertoimien estimaatteja lukuun ottamatta on tehty Microsoft Excel -ohjelmalla. Samoin kaikki kuvat on tehty Excelin avulla. Regressiomallit on estimoitu käyttämällä Regression-nimistä työkalua, jonka saa käyttöön asentamalla Data Analysis ToolPak -lisäosan Exceliin. Tulostuksia on jonkin verran muokattu: keskeisimmät tunnusluvut on korostettu sinisellä värillä ja luottamusvälien rajat on poistettu. Osittaisautokorrelaatiokertoimien estimaatit on laskettu Jerry Hintzen NCSS ohjelman avulla. Kertoimien laskeminen edellyttää rekursiokaavan käyttämistä ja lukuisien aputermien laskemista. Tämän vuoksi Excelillä on laskettu ainoastaan 4 ensimmäistä estimaattia ja muut kertoimet on laskettu NCSS ohjelmalla. Satunnaisten selittäjien regressiomallin standardioletukset Estimoidun mallin regressiokertoimien merkitsevyys ja korkea selitysaste eivät riitä takaamaan, että malli on käyttökelpoinen. Jäännöstermien odotusarvon pitää olla 0, jäännöstermit eivät saa korreloida keskenään ja jäännösvarianssin tulee olla vakio. Jos nämä ehdot täyttyvät, estimoidun mallin residuaalit muistuttavat nk. valkoista kohinaa ja malli on riittävä. Tämän lisäksi asetetaan jäännöstermeille normaalisuusvaatimus. Yleinen lineaarinen regressiomalli voidaan esittää matriisimuodossa seuraavasti: y = Xβ + ε 2

9 missä y on selitettävän muuttujan y havaittujen arvojen muodostama satunnainen n-vektori. X on selittäjien x 1, x 2,..., x k havaittujen arvojen muodostama n (k + 1)- matriisi, jossa 1. sarake on ykkösten muodostama vakioselittäjä. β on regressiokertoimien muodostama tuntematon ja kiinteä eli ei-satunnainen (k+1)-vektori, jossa 1. alkio vastaa ykkösten muodostamaa vakioselittäjää. ε on jäännöstermien muodostama ei-havaittu ja satunnainen n-vektori. Koska mallien selittäjät ovat satunnaisia, yleisen lineaarisen regressiomallin standardioletukset voidaan esittää matriisein seuraavassa muodossa: 1. Selittäjämatriisin X alkiot ovat satunnaismuuttujia. 2. Selittäjämatriisi X on täysiasteinen: r(x) = k Jäännöstermin ε ehdollinen odotusarvo ehdolla X on 0: E(ε X) = 0 4. Jäännöstermit ovat ehdollisesti homoskedastisia ja ehdollisesti korreloimattomia: Cov(ε X) = σ 2 I 5. Jäännöstermit ovat ehdollisesti normaalijakautuneita: (ε X) N n (0, σ 2 I) Mallien regressiodiagnostiikka keskittyy standardioletusten voimassaolon testaamiseen. Ensimmäisenä on tutkittu jäännöstermien normaalisuutta, koska se on edellytys useiden testien käyttämiselle. Toisena on tutkittu jäännöstermien korreloimattomuutta. Jäännöstermien autokorrelaatio tekee muiden testien tuloksista vain suuntaa-antavia. Viimeisenä on tutkittu jäännöstermien homoskedastisuutta. Residuaalien aritmeettinen keskiarvo on 0, koska kaikissa estimoiduissa malleissa on mukana vakioselittäjä. 3

10 Käytettävät diagnostiset testit Jarquen ja Beran testi jäännöstermien normaalisuudelle Jarquen ja Beran (esiintyy myös kirjallisuudessa nimellä Bowmanin ja Shentonin) testin avulla tutkitaan jäännöstermien normaalisuutta residuaalien avulla. Residuaaleista lasketaan tunnusluvut vinoudelle (skewness) ja huipukkuudelle (kurtosis). Normaalijakautuneilla havainnoilla kumpikin tunnusluku on 0 satunnaisvaihtelua lukuun ottamatta. JB-testisuureen suuret arvot viittaavat siihen, että jäännöstermit eivät ole normaalisia. Olkoot tutkittavan mallin residuaalit. Lasketaan tunnusluku vinoudelle: S = e 1, e 2,..., e n 1 n (e t ē) 3 n t=1 ( ) 3/2 1 n (e t ē) 2 n t=1 Lasketaan tunnusluku huipukkuudelle: K = 1 n ( 1 n n (e t ē) 4 t=1 ) 2 3 n (e t ē) 2 t=1 Jos PNS-menetelmällä estimoidussa regressiomallissa on mukana vakioselittäjä, residuaalien summa (ja aritmeettinen keskiarvo) on 0. Koska kaikissa tässä käsitellyissä malleissa on mukana vakiotermi, residuaalien keskusmomentit yhtyvät origomomentteihin, ja tunnuslukujen kaavat supistuvat alla olevaan muotoon. Tunnusluku vinoudelle, kun mallissa on vakiotermi: S = 1 n n t=1 ( 1 n n t=1 e 2 t e 3 t ) 3/2 Tunnusluku huipukkuudelle, kun mallissa on vakiotermi: K = 1 n ( 1 n n t=1 n t=1 4 e 4 t e 2 t ) 2 3

11 Testattava hypoteesi H 0 : Jäännöstermit ovat normaalisia: ε t N(0, σ 2 ) kaikille t Testisuure ja sen jakauma (S K2 ) JB = n 6 Jos H 0 pätee, JB a χ 2 (2). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Huomautus: ˆ Testi reagoi voimakkaasti poikkeaviin havaintoihin, mutta ei ole muuten erityisen voimakas (ts. hyväksymisvirhe on suuri). ˆ Jäännöstermien ei-normaalisuus tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Durbinin ja Watsonin testi Durbinin ja Watsonin testillä tutkitaan ensimmäisen kertaluvun autokorrelaation olemassaoloa jäännöstermeissä. Testisuure perustuu estimoidun mallin residuaaleihin e t. Testisuureen kriittiset rajat löytyvät taulukoituina useista alan oppikirjoista. Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε t 1 ) = 0 kaikille t Testisuure ja sen jakauma DW = T (e t e t 1 ) 2 t=2 DW -testisuure ei noudata mitään yleistä jakaumaa, mutta testisuureen kriittiset rajat löytyvät taulukoituina useista alan oppikirjoista. DW -testisuure saa arvoja avoimelta väliltä 0 4, pienet arvot viittaavat positiiviseen autokorrelaatioon ja suuret puolestaan negatiiviseen autokorrelaatioon. Testisuureen normaaliarvo korreloimattomuusoletuksen pätiessä on luvun 2 lähellä. T t=1 e 2 t 5

12 Huomautuksia: ˆ Durbinin ja Watsonin testiä ei voi käyttää, jos mallissa on viivästetty selitettävä. Tällöin voidaan kuitenkin käyttää Durbinin h-testiä. ˆ Mallin selittäjien täytyy olla kiinteitä. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. Durbinin h-testi Durbinin h-testillä tutkitaan ensimmäisen kertaluvun autokorrelaation olemassaoloa jäännöstermeissä, kun estimoidussa mallissa on selittäjänä viivästetty selitettävä. Testisuure perustuu estimoidun mallin residuaaleihin e t. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βy t 1 + γx t + ε t e t = y t ŷ t Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε t 1 ) = 0 kaikille t Testisuure ja sen jakauma h = r 1 n 1 n Var( β) missä r 1 on ensimmäisen kertaluvun autokorrelaatiokertoimen estimaatti, n on havaintojen lukumäärä ja Var( β) on viivästetyn selitettävän regressiokertoimen varianssin harhaton estimaatti. Jos H 0 pätee, h a N(0, 1). Testisuureen nollasta merkitsevästi poikkeavat arvot viittaavat jäännöstermien autokorrelaatioon. 6

13 Huomautuksia: ˆ Durbinin h-testiä ei voi käyttää, jos n Var( β) 1, koska neliöjuuren sisällä olevasta lausekkeesta tulee tällöin negatiivinen. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Durbinin h-testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Lagrangen kertojatesti autokorrelaatiolle Jäännöstermien autokorreloituneisuutta voidaan tutkia Lagrangen kertojatestillä (Lagrange multiplier, LM), joka voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla. Apuregressiomallissa tutkittavan mallin residuaaleja selitetään alkuperäisillä selittäjillä sekä residuaalien astelukua p olevalla autoregressiolla. Apuregressiomallin suuri selitysaste viittaa jäännöstermien autokorrelaatioon. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βx t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e t = γ 0 + γ 1 x t + φ 1 e t 1 + φ 2 e t φ p e t p + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε s ) = 0 kaikille t s Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (p), missä n on residuaalien lukumäärä, R 2 on apuregressiomallin selitysaste ja p on autoregression asteluku. Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. 7

14 Huomautuksia: ˆ LM-testi jäännöstermin autokorrelaatiolle saattaa reagoida myös mallin väärään funktionaaliseen muotoon. ˆ Apuregression asteluvun p valinta vaikuttaa testin tulokseen: p pitää valita suureksi, mutta ei liian suureksi. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Mallissa saa olla mukana myös viivästetty selitettävä. Boxin ja Piercen Q-testi jäännöstermien korreloimattomuudelle Jos malli on oikein määritelty, residuaalit muistuttavat valkoista kohinaa. Jäännöstermien korreloimattomuutta voidaan testata Boxin ja Piercen Q-testisuureella (esiintyy myös nimellä portmanteau-testi). Testisuureen suuret arvot viittaavat jäännöstermien autokorrelaatioon. Olkoot r 1, r 2,..., r k tutkittavan regressiomallin otosautokorrelaatiokertoimet. Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε s ) = 0 kaikille t s Testisuure ja sen jakauma Q K = n(r r r 2 K) missä K on yhteenlaskettavien autokorrelaatiokertoimien estimaattien lukumäärä ja n on havaintojen lukumäärä. Jos H 0 pätee, Q K a χ 2 (K). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Huomautuksia: ˆ Mallissa ei saa olla viivästettyä endogeenista muuttujaa. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. 8

15 Lagrangen kertojatesti homoskedastisuudelle 1 Jäännöstermien homoskedastisuutta voidaan tutkia Lagrangen kertojatestillä (Lagrange multiplier, LM), joka voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla. Apuregressiomallissa selitetään tutkittavan mallin residuaalien neliöitä alkuperäisen mallin selittäjillä, selittäjien neliöillä sekä selittäjien ristitulolla. Ristitulotermejä ei ole käytetty tässä yhteydessä selittäjinä, jos alkuperäisessä mallissa on ollut yli 3 selittäjää. Apuregressiomallin korkea selitysaste viittaa siihen, että jäännöstermit ovat heteroskedastisia. Testi esiintyy kirjallisuudessa myös nimellä Whiten testi. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + β 1 x t + β 2 z t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e 2 t = γ 0 + γ 1 x t + γ 2 z t + γ 3 x 2 t + γ 4 z 2 t + γ 5 x t z t + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit ovat homoskedastisia: Var(ε t ) = σ 2 kaikille t Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (p), missä n on residuaalien lukumäärä, R 2 on apuregressiomallin selitysaste ja p on apuregression aitojen selittäjien lukumäärä (vakioselittäjä poisluettuna). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. Huomautus: ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. 9

16 Lagrangen kertojatesti homoskedastisuudelle 2 Lagrangen kertojatesti (Lagrange multiplier, LM) jäännöstermien homoskedastisuudelle voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla, jossa selitetään tutkittavan mallin residuaalien neliöitä mallin sovitteilla. Apuregressiomallin korkea selitysaste viittaa siihen, että jäännöstermit ovat heteroskedastisia. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βx t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e 2 t = γ 0 + γ 1 ŷ t + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit ovat homoskedastisia: Var(ε t ) = σ 2 kaikille t Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (1), missä n on residuaalien lukumäärä ja R 2 on apuregressiomallin selitysaste. Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. Huomautus: ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Sarjat, selittäjät ja selitettävä Logaritmointi Mallin estimoinnissa on käytetty logaritmoituja selittäjiä sekä selitettävää. Tämä tekee suhteellisten muutosten tulkitsemisen helpommaksi. Esimerkiksi jos x 0 muuttuu p %, niin uusi arvo x 1 on 10

17 ja edelleen ( x 1 = 1 + p ) x ( log(x 1 ) = log(x 0 ) + log 1 + p ) log(x 0 ) + p Logaritmoinnin ansiosta reaalihintaindeksin sekä per capita kokonaiskulutusmenojen regressiokertoimet voidaan tulkita hinta- ja tulojoustona. Differenssien laskeminen Osa käsitellyistä regressiomalleista on nk. differenssimalleja, joissa selitetään muuttujien vuosimuutosta. Differenssioperaattorin merkkinä on käytetty D- kirjainta. Esimerkiksi muuttujan x t ensimmäinen differenssi on D x t = x t x t 1 Ensimmäisen differenssin tulkinta vastaa kahden peräkkäisen vuoden havaintojen muutosta tutkittavissa vuosisarjoissa. Aikasarjat Mallinrakennukseen on käytetty seuraavia aikasarjoja vuosilta : Vexp45 Kokonaiskulutusmenot käypällä hintatasolla [milj. mk] Qexp45 Kokonaiskulutusmenot kiinteällä vuoden 1975 hintatasolla [milj. mk] Popul Asukasluku V1c Alkoholin kulutusmenot käypällä hintatasolla [milj. mk] Q1c Alkoholin kulutusmenot kiinteällä vuoden 1975 hintatasolla [milj. mk] Lisäksi sarjoista on vuosilta havainnot, joita käytetään ennusteen ja toteutuneen kulutuksen vertailuun. Aikasarjat ovat liitteenä Excel-tiedostossa sarjat.xls. Aikasarjoista muodostettiin seuraavat apumuuttujat: V t Q t P t v t Per capita kokonaiskulutusmenot käypällä hintatasolla V t = 10 6 Vexp45/Popul [mk] Per capita kokonaiskulutusmenot kiinteällä vuoden 1975 hintatasolla Q t = 10 6 Qexp45/Popul [mk] Kokonaiskulutusmenojen implisiittinen deflaattori P t = 100 V t /Q t (1975 = 100) Per capita alkoholin kulutusmenot käypällä hintatasolla v t = 10 6 V1c/Popul [mk] 11

18 Kuva 1: Pistediagrammi alkoholin reaalihintaindeksin logaritmista log(100 p t /P t ) kokonaiskulutusmenojen logaritmia log(q t ) vastaan. q t p t Per capita alkoholin kulutusmenot kiinteällä vuoden 1975 hintatasolla q t = 10 6 Q1c/Popul [mk] Alkoholin implisiittinen hintaindeksi p t = 100 v t /q t (1975 = 100) 100 p t /P t Alkoholin reaalihintaindeksi 100 p t /P t (1975 = 100) Pistediagrammista näkyy, että alkoholin kulutusmenojen ja alkoholin reaalihintaindeksin välillä on heikko negatiivinen korrelaatio. Alkoholin kulutusmenoissa näkyy aikasarjakuvassa selvä nouseva trendi, kun taas alkoholin reaalihintaindeksi on pysynyt lähes vakiona. Sekä pistediagrammista että aikasarjakuvasta näkyy, että kokonaiskulutusmenojen ja alkoholin kulutusmenojen välillä on vahva positiivinen korrelaatio. Molemmissa sarjoissa näkyy selvä nouseva trendi. Edellä esitetyt pistediagrammit ja aikasarjat löytyvät tiedostosta pari_regr.xls. Tiedostossa on myös kuvia sarjoista. 1. malli Regressiomallin selitettävä (log-funktio on luonnollinen logaritmi): ˆ Per capita kiinteän hintatason alkoholin kulutusmenojen logaritmi log(q t ) Regressiomallissa käytettiin seuraavia selittäjiä: 12

19 Kuva 2: Aikasarja alkoholin kulutusmenojen logaritmista log(q t ) ja alkoholin reaalihintaindeksin logaritmista log(100 p t /P t ). Kuva 3: Pistediagrammi kokonaiskulutusmenojen logaritmista log(q t ) alkoholin kulutusmenojen logaritmia log(q t ) vastaan. 13

20 Kuva 4: Aikasarja alkoholin kulutusmenojen logaritmista log(q t ) ja kokonaiskulutusmenojen logaritmista log(q t ). ˆ Alkoholin reaalihintaindeksin logaritmi log(100 p t /P t ) ˆ Per capita kiinteän hintatason kokonaiskulutusmenojen logaritmi log(q t ) Estimoidaan PNS-menetelmällä regressiomalli, jossa selitetään alkoholin per capita kulutusmenojen logaritmia alkoholin reaalihintaindeksin logaritmilla sekä per capita kokonaiskulutusmenojen logaritmilla. Selitettävä ja selittäjät löytyvät Excel-taulukosta malli1_selittajat.xls. Logaritmoidun reaalihintaindeksin regressiokertoimen tulkinta vastaa pitkän aikavälin hintajoustoa. Hintatason nousu johtaa yleensä kysynnän laskuun, joten hintajousto on tyypillisesti negatiivinen. Logaritmoidun per capita kokonaiskulutusmenojen regressiokertoimen tulkinta vastaa pitkän aikavälin tulojoustoa. Tulotason nousu lisää tavallisesti kysyntää ellei kyseessä ole nk. inferiorinen hyödyke, jonka kysyntä vähentyy tulotason noustessa. Tulojousto on siis tyypillisesti positiivinen. Estimoitu malli ja tunnusluvut Estimoitu lineaarinen regressiomalli on seuraava (suluissa estimaattien keskihajonnat): log(q t ) = (2.352) (0.470) log(100 p t/p t ) (0.072) log(q t) R 2 =

21 Kuva 5: Kuva havainnoista ja sovitteista aikaa vastaan. Malli löytyy laskutoimituksineen Excel-tiedostosta malli1.xls. Mallin regressiokertoimet ovat merkitseviä vakioselittäjän kerroin pois lukien. Sekä pitkän aikavälin hintajousto 1.12 että tulojousto 1.51 ovat merkitseviä. Pitkän aikavälin hintajousto voidaan tulkita siten, että 1 %:n nousu alkoholin reaalihinnassa näkyy pitkällä aikavälillä 1.12 %:n laskuna alkoholin kulutusmenoissa muiden tekijöiden pysyessä ennallaan. Vastaavasti pitkän aikavälin tulojousto voidaan tulkita siten, että 1 %:n kasvu per capita kokonaiskulutusmenoissa näkyy 1.51 %:n kasvuna alkoholin kulutusmenoissa pitkällä aikavälillä muiden tekijöiden pysyessä ennallaan. Mallin selitysaste R 2 = on korkea. Graafinen tarkastelu Malli ei näytä sopivan havaintoihin kovin hyvin. Vaikka trendit asettuvat kohdalleen, mallin tuottamat sovitteet ovat systemaattisesti havaintoja pienempiä tai suurempia usean peräkkäisen vuoden ajan, joten malli ei ole hyvä. Malli ei kykene selittämään vuoden 1969 lainmuutoksen aiheuttamaa hyppäystä alkoholin kulutusmenoissa. Kuvassa katkoviiva kuvaa mallin avulla laskettua ennustetta. Residuaalit ovat ensin positiivisia vuosien ajan, tämän jälkeen negatiivisia vuosien ajan ja jälleen positiivisia vuosina Tämä viittaa voimakkaaseen positiiviseen ensimmäisen kertaluvun autokorrelaatioon. Itseisarvoltaan pieniä residuaaleja on vähän. Tämän antaa aihetta epäillä jäännöstermien homoskedastisuutta. Huomaa residuaalikuvassa tapahtuva muutos vuosien 1968 ja 1969 välillä (havainnot 19 ja 20). Katkoviivalla piirretty kiinteän hintatason ennuste poikkeaa selvästi havainnoista. Vuonna 1981 ennusteen ja toteutuneen kulutuksen erotus on 316 miljoonaa markkaa. Ennustevirhe on niin suuri, että mallin tuottamaa ennustetta ei voi pitää käyttökelpoisena. 15

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli

Lisätiedot

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

2. Teoriaharjoitukset

2. Teoriaharjoitukset 2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli

Yhden selittäjän lineaarinen regressiomalli Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

4. Tietokoneharjoitukset

4. Tietokoneharjoitukset 4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume

Lisätiedot

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme? TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen Tilastollisen analyysin perusteet Luento 5: Sisältö Tilastotieteessä tehdään usein oletuksia havaintojen jakaumasta. Useat tilastolliset menetelmät toimivat tehottomasti tai jopa virheellisesti, jos jakaumaoletukset

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) Tavoitteet (teoria): Hahmottaa aikasarjan klassiset komponentit ideaalisessa tilanteessa. Ymmärtää viivekuvauksen vaikutus trendiin. ARCH-prosessin

Lisätiedot

Korrelaatiokertoinen määrittely 165

Korrelaatiokertoinen määrittely 165 kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x

Lisätiedot

Harjoitukset 4 : Paneelidata (Palautus )

Harjoitukset 4 : Paneelidata (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

Jos Q = kysytty määrä, Q = kysytyn määrän muutos, P = hinta ja P = hinnan muutos, niin hintajousto on Q/Q P/P

Jos Q = kysytty määrä, Q = kysytyn määrän muutos, P = hinta ja P = hinnan muutos, niin hintajousto on Q/Q P/P Osa 5. Joustoista Kysynnän hintajousto (price elasticity of demand) mittaa, miten kysynnän määrä reagoi hinnan muutokseen = kysytyn määrän suhteellinen muutos jaettuna hinnan suhteellisella muutoksella

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Yleinen lineaarinen malli

Yleinen lineaarinen malli MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: 1 Määritelmä ja standardioletukset 2

Lisätiedot

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Harjoitus 7 : Aikasarja-analyysi (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitus 7 : Aikasarja-analyysi (Palautus 28.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2004) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2004) 2 Estimointi:

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Regressiodiagnostiikka ja regressiomallin valinta

Regressiodiagnostiikka ja regressiomallin valinta Regressiodiagnostiikka ja regressiomallin valinta MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015

Lisätiedot

Alkoholijuomien hinnat ja kulutus

Alkoholijuomien hinnat ja kulutus Alkoholijuomien hinnat ja kulutus VILLE VEHKASALO Virosta tulee näillä näkymin EU:n jäsen vuoden 2004 vappuna. Tämän jälkeen kuka tahansa voi tuoda omaan käyttöönsä edullista alkoholia Virosta vaikka pakettiautolla.

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Johdatus regressioanalyysiin

Johdatus regressioanalyysiin Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2007) 1 Johdatus regressioanalyysiin >> Regressioanalyysin lähtökohdat ja tavoitteet

Lisätiedot

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa.

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa. KERTAUS Lukujono KERTAUSTEHTÄVIÄ K1. Ratkaisussa annetaan esimerkit mahdollisista säännöistä. a) Jatketaan lukujonoa: 2, 4, 6, 8, 10, 12, 14, 16, Rekursiivinen sääntö on, että lukujonon ensimmäinen jäsen

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT imat-2.104 Tilastollisen analyysin perusteet / Tehtävät Aiheet: Avainsanat: Ysisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Koonaisesiarvo,

Lisätiedot

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Regressiomallin valinta TKK (c) Ilkka Mellin (2004) 1 Regressiomallin valinta Regressiomallin valinta: Johdanto Mallinvalintatestit Mallinvalintakriteerit Epälineaaristen riippuvuuksien

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

4 Yleinen potenssifunktio ja polynomifunktio

4 Yleinen potenssifunktio ja polynomifunktio 4 Yleinen potenssifunktio ja polynomifunktio ENNAKKOTEHTÄVÄT 1. a) Tutkitaan yhtälöiden ratkaisuja piirtämällä funktioiden f(x) = x, f(x) = x 3, f(x) = x 4 ja f(x) = x 5 kuvaajat. Näin nähdään, monessako

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2005) 1 Johdatus regressioanalyysiin Regressioanalyysin lähtökohdat ja tavoitteet Deterministiset mallit ja regressioanalyysi

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Aikasarjamallit. Pekka Hjelt

Aikasarjamallit. Pekka Hjelt Pekka Hjelt Aikasarjamallit Aikasarja koostuu järjestyksessä olevista havainnoista, ja yleensä se on tasavälinen ja diskreetti eli havaintopisteet ovat erillisiä. Lisäksi aikasarjassa on yleensä autokorrelaatiota

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 6: 1 Kalmanin suodatin Aiemmin käsitellyt

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

NELIÖJUURI. Neliöjuuren laskusääntöjä

NELIÖJUURI. Neliöjuuren laskusääntöjä NELIÖJUURI POLYNOMIFUNKTIOT JA -YHTÄLÖT, MAA2 Tarkoittaa positiivista tai nollaa Määritelmä, neliöjuuri: Luvun a R neliöjuuri, merkitään a, on se ei-negatiivinen luku, jonka neliö (eli toiseen potenssiin

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Aki Taanila AIKASARJAENNUSTAMINEN

Aki Taanila AIKASARJAENNUSTAMINEN Aki Taanila AIKASARJAENNUSTAMINEN 26.4.2011 SISÄLLYS JOHDANTO... 1 1 AIKASARJA ILMAN SYSTEMAATTISTA VAIHTELUA... 2 1.1 Liukuvan keskiarvon menetelmä... 2 1.2 Eksponentiaalinen tasoitus... 3 2 AIKASARJASSA

Lisätiedot

3. Tietokoneharjoitukset

3. Tietokoneharjoitukset 3. Tietokoneharjoitukset Aikasarjan logaritmointi Aikasarjoja analysoidaan usein logaritmisessa muodossa. Asialooginen perustelu logaritmoinnille: Muuttujan arvojen suhteelliset muutokset ovat usein tärkeämpiä

Lisätiedot

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli TKK (c) Ilkka Melli (2005) Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää

Lisätiedot

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾. 24.11.2006 1. Oletetaan, että kaksiulotteinen satunnaismuuttuja µ noudattaa kaksiulotteista normaalijakaumaa. Oletetaan lisäksi, että satunnaismuuttujan regressiofunktio satunnaismuuttujan suhteen on ݵ

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalle

ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalle ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalleihin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (2004) 1 Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen Jakaumaoletuksien

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Regressiodiagnostiikka TKK (c) Ilkka Mellin (2007) 1 Regressiodiagnostiikka >> Yleinen lineaarinen malli ja regressiodiagnostiikka

Lisätiedot

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1 Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A Mat-2.090 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Estimointi, Havaittu frekvenssi, Heterogeenisuus,

Lisätiedot