Erikoistyö: Alkoholin kulutusmenojen ennustaminen
|
|
- Kai Niemelä
- 8 vuotta sitten
- Katselukertoja:
Transkriptio
1 Erikoistyö: Alkoholin kulutusmenojen ennustaminen Tekijä: Mikko Nordlund 49857B Ohjaaja: Ilkka Mellin Jätetty:
2 Sisällysluettelo 1. JOHDANTO MALLIEN TUTKIMINEN MALLIT VIITTEET... 5 DOKUMENTTI: ALKOHOLIN KULUTUSMENOJEN ENNUSTAMINEN...LIITE 2
3 1. Johdanto Tämä erikoistyö on osa OtaStat-projektia. OtaStat on Ilkka Mellinin johtama projekti Teknillisen korkeakoulun Systeemianalyysin laboratoriossa. OtaStat-hankkeen tavoitteena on tuottaa verkko-opetusmateriaalia todennäköisyyslaskennan ja tilastotieteen opetusta varten [1]. Materiaalia voidaan käyttää myös osana Systeemianalyysin laboratorion tavallista opetusta. Koko työ on luettavissa WWW-sivulta ja liitteenä on työn vedos, josta puuttuvat laskutoimitukset ja jonka kuvien asettelu poikkeaa WWW-sivulla olevasta versiosta. Erikoistyö liittyy ennustamiseen ja aikasarja-analyysiin. Se käsittelee alkoholin markkamääräisen kysynnän kuvaamista ja ennustamista. Työ on kirjoitettu opetusmateriaaliksi ja tämän takia siinä käsitellään useita malleja, joiden puutteita korjataan ja lopulta päädytään käyttökelpoiseen malliin. Opetustarkoitusta varten työ on tehty Microsoft Excel ohjelmalla, joka on useimpien saatavilla. Laskutoimitukset ovat työssä mukana Excel-tiedostoina ja näistä näkee, miten erilaisia tilastollisia testejä voi tehdä tavallisella taulukkolaskentaohjelmalla. Testien tekeminen on myös havainnollisempaa Excelillä, koska erilliset tilasto-ohjelmistot eivät yleensä näytä laskutoimituksia vaan tulostavat pelkästään testin tuloksen. Näin testisuureiden laskeminen voi jäädä epäselväksi. Osittaisautokorrelaatiokertoimien estimaatit on kuitenkin laskettu NCSS 2000 ohjelman avulla, koska Excelillä näiden laskeminen edellyttää joko todella monien aputermien laskemista tai Visual Basic kielellä ohjelmoimista. Hypertext Markup Language eli HTML-muodossa oleva dokumentti sekä Portable Document Format eli PDF-muodossa oleva dokumentti on tuotettu OtaStat Markup Language eli OSML-kielellä, jonka Jussi Virtanen on suunnitellut ja toteuttanut yhdessä Veli Peltolan kanssa. OSML on XML eli Extensible Markup Language pohjainen kieli. Liitteenä on PDFmuodossa olevan dokumentin tuloste. 2. Mallien tutkiminen Mallien hyvyyttä tutkitaan useasta eri näkökulmasta. Malleista tehdään erilaisia kuvia graafisen tarkastelun avuksi. Selitysaste on keskeisin tunnusluku hyvyyden vertaamisessa. Residuaalit asetetaan diagnostisten testien kohteeksi. Lopuksi malleilla laaditaan ennuste viidelle vuodelle ja tätä verrataan toteutuneeseen kulutukseen. Estimoimisen jälkeen mallien residuaalit asetetaan graafisen tarkastelun ja diagnostisten testien kohteeksi, joiden tarkoituksena on selvittää, täyttävätkö mallin jäännöstermit niin kutsutut regressiomallin standardioletukset [2]: 1. Jäännöstermien ehdollinen odotusarvo on Jäännöstermit ovat ehdollisesti homoskedastisia. 3. Jäännöstermit ovat ehdollisesti korreloimattomia. 4. Jäännöstermit ovat ehdollisesti normaalijakautuneita 3
4 Ehdollisuus tarkoittaa ehdolla X, missä X on täysiasteinen selittäjämatriisi, jonka alkiot ovat satunnaismuuttujia. Standardioletusten testaamiseen käytetyistä tilastollisista testeistä on selvitys liitteenä olevassa selostuksessa. Kaikista malleista tehtiin seuraavat kuvat: 1. Aikasarjadiagrammi havainnoista ja sovitteista. 2. Aikasarjakuva residuaaleista. 3. Aikasarjakuva toteutuneesta kulutuksesta sekä sovitteesta ja ennusteesta. 4. Q-Q kuva residuaaleista. 5. Kuva estimoiduista autokorrelaatiokertoimista. 6. Kuva estimoiduista osittaisautokorrelaatiokertoimista. Kuvatyypistä 1 nähdään miten hyvin estimoitu malli sopii havaintoihin. Parhaassa tapauksessa käyrät asettuvat päällekkäin. Systemaattiset poikkeamat puolestaan viittaavat siihen, että malli ei ole oikein spesifioitu. Aikasarjakuva residuaaleista esittää samaa asiaa, mutta tästä kuvasta systemaattiset poikkeamat ja heteroskedastisuus on helpompi tunnistaa. Kuvatyyppi 3 kertoo miten hyvin mallin avulla laskettu ennuste sopii havaintoihin. Alkoholin kulutusmenojen pitkään jatkunut kasvutrendi taittuu vuoden 1973 tienoilla ja tämän vuoksi vuosille laadittu ennuste markkamääräisestä myynnistä osuu yläkanttiin. Kuvatyyppi 4 on eräs normaalipaperi, jonka avulla voidaan tutkia jäännöstermien normaalisuutta. Kuvia estimoiduista autokorrelaatio- ja osittaisautokorrelaatiokertoimista käytettiin jäännöstermien korreloituneisuuden arvioimiseen. Kuten aikasarja-analyysissä yleensä, myös alkoholin kulutusmenoja kuvattaessa regressiomallilla törmätään autokorrelaatio-ongelmaan. Autokorrelaation ohella toinen jäännöstermeihin liittyvä ongelma on heteroskedastisuus. Usein nämä ongelmat ilmenevät samanaikaisesti. Kun havaitaan, että malli ei täytä sille asetettuja standardioletuksia, mallia korjataan. Näin päädytään lopulta malliin, jonka jäännöstermit ovat normaalisia, homoskedastisia ja korreloimattomia. Tälläistä mallia kutsutaan riittäväksi. 3. Mallit Estimoidut mallit perustuvat kansantalouden kysyntäteoriaan. Työn alussa on lyhyesti selitetty peruskäsitteitä, kuten joustokerroin ja normaalihyödyke. Kysynnän hintajoustolla mitataan, kuinka herkästi kysytty määrä reagoi hinnan muutokseen. Kysynnän hintajoustossa määrän prosentuaalinen muutos jaetaan hinnan prosentuaalisella muutoksella [3]. Jos hyödykkeen hintajousto on esimerkiksi -1.25, yhden prosentin nousu hinnassa näkyy 1.25 prosentin laskuna kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen tapauksessa kysytty määrä kasvaa hinnan laskiessa ja vastaavasti kysyntä pienenee hinnan noustessa muiden tekijöiden pysyessä ennallaan. Siten normaalihyödykkeen hintajousto on negatiivinen. Kysynnän tulojoustossa hyödykkeen kysynnän prosentuaalinen muutos jaetaan kuluttajien tulojen prosentuaalisella muutoksella. Jos hyödykkeen tulojousto on esimerkiksi 1.4, yhden prosentin nousu kuluttajien tuloissa näkyy 1.4 prosentin nousuna hyödykkeen kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen kysyntä kasvaa, kun kuluttajien tulot kasvavat ja muut 4
5 tekijät pysyvät ennallaan. Vastaavasti normaalihyödykkeen kysyntä pienenee, kun kuluttajien tulot pienenevät. Tämän takia normaalihyödykkeen tulojousto on positiivinen. Malleissa käytetään selitettävänä muuttujana alkoholin per capita kulutusmenojen logaritmia. Selittäjinä käytetään per capita kokonaiskulutusmenojen logaritmia sekä alkoholin reaalihintaindeksin logaritmia. Logaritmoinnin ansiosta regressiokertoimet voidaan tulkita tulojoustoksi ja hintajoustoksi. Ensimmäinen tasomalli osoittautuu kelvottomaksi regressiodiagnostiikan näkökulmasta, vaikka mallin selitysaste on korkea ja regressiokertoimet merkitseviä. Tasomallia vastaavan differenssimallin jäännöstermejä ei voida pitää normaalisina ja niiden homoskedastisuutta on aihetta epäillä. Toiseen malliin lisätään selittäjäksi dummy-muuttuja. Vuonna 1969 alkoholilain muutos lisäsi Alkon myymälöiden määrää huomattavasti ja alkoholin markkamääräinen kysyntä kasvoi huomattavasti. Kokonaiskulutusmenot ja alkoholin hintaindeksi eivät selitä tätä muutosta, joten malliin lisätään dummy-muuttuja. Malli ei kuitenkaan läpäise diagnostisia testejä, autokorrelaatio on edelleen ongelma. Mallia vastaava differenssimalli sen sijaan läpäisee kaikki testit. Tasomallia korjataan lisäämällä selittäjiksi viivästetty selitettävä sekä viivästetyt selittäjät. Näin saadaan kolmas malli, joka on dynaaminen toisin kuin edelliset. Havaitaan, että dummy-muuttujan ja viivästetyn dummy-muuttujan regressiokertoimet ovat itseisarvoltaan lähes yhtä suuria, mutta vastakkaismerkkisiä. Tämän vuoksi ne voidaan korvata yhdellä impulssi-dummyllä. Neljännessa mallissa dummy-muuttujat on korvattu impulssi-dummylla, joka saa arvon 1 vuonna Näin mallissa on saatu vähennettyä selittäjien määrää yhdellä edelliseen verrattuna. Malli läpäisee diagnostiset testit ja sen tuottama ennuste on myös parempi kuin edellisillä malleilla. Mallien tarkempi vertailu on liitteessä. 4. Viitteet [1] OtaStat-projektin kuvaus: viitattu [2] Mellin, Ilkka Oppimateriaalia [3] Mäkelä, Vilho Käytännön kansantaloustiede. 2. uudistettu painos. KY-Palvelu Oy. 172 s. ISBN
6 5. Liite: Alkoholin kulutusmenojen ennustaminen 6
7 Alkoholin kulutusmenojen ennustaminen Mikko Nordlund Tausta Alkoholin kulutuksella on suuri kansantaloudellinen merkitys. Alkoholitulot muodostivat vuonna 2002 noin 5.5 % valtion verotuloista[1], mutta lisääntyvä kulutus kasvattaa myös muun muassa sosiaalimenoja. Alkoholin kulutuksen muutos vaikuttaa valtion tuloihin ja menoihin sekä suorasti että epäsuorasti. Tarkoituksena on kuvata alkoholin markkamääräistä kulutusta sopivalla aikasarjamallilla. Opetustarkoituksessa havaintoaineistoon sovitetaan erilaisia malleja, joita vertaillaan sekä graafisesti että tunnuslukujen ja diagnostisten testien avulla. Malleja korjataan, jos ne eivät läpäise diagnostisia testejä. Estimoitujen mallien avulla laaditaan ennuste, jota verrataan toteutuneeseen kulutukseen. Tilastollisesti hyvä malli yleensä myös tuottaa paremman ennusteen kuin huono malli. Mallit perustuvat kansantalouden kysyntäteoriaan. Kysynnän hintajoustolla mitataan, kuinka herkästi kysytty määrä reagoi hinnan muutokseen. Kysynnän hintajoustossa määrän prosentuaalinen muutos jaetaan hinnan prosentuaalisella muutoksella [2]. Jos hyödykkeen hintajousto on esimerkiksi -1.25, yhden prosentin nousu hinnassa näkyy 1.25 prosentin laskuna kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen tapauksessa kysytty määrä kasvaa hinnan laskiessa ja vastaavasti kysyntä pienenee hinnan noustessa muiden tekijöiden pysyessä ennallaan. Siten normaalihyödykkeen hintajousto on negatiivinen. Kysynnän tulojoustossa hyödykkeen kysynnän prosentuaalinen muutos jaetaan kuluttajien tulojen prosentuaalisella muutoksella. Jos hyödykkeen tulojousto on esimerkiksi 1.4, yhden prosentin nousu kuluttajien tuloissa näkyy 1.4 prosentin nousuna hyödykkeen kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen kysyntä kasvaa, kun kuluttajien tulot kasvavat ja muut tekijät pysyvät ennallaan. Vastaavasti normaalihyödykkeen kysyntä pienenee, kun kuluttajien tulot pienenevät. Tämän takia normaalihyödykkeen tulojousto on positiivinen. Mallien estimoinnin yhteydessä kommentoidaan myös laskettujen alkoholin tulo- ja hintajouston kertoimien järkevyyttä. On syytä olettaa, että alkoholin tulojousto on positiivinen ja hintajousto negatiivinen. Malleissa alkoholin markkamääräisen myynnin oletetaan riippuvan Suomen asukasluvusta, kuluttajien kokonaiskulutusmenoista (reaaliansioista) sekä alkoholin hinnasta. Asukasluvun ja kokonaiskulutusmenojen kasvu lisäävät alkoholin kysyntää, kun taas alkoholin hinnan nousu vähentää kysyntää. Väestönkasvun 1
8 vaikutus on huomioitu siirtymällä tutkimaan per capita aikasarjoja eli vuotuiset kokonaiskulutusmenot ja alkoholin kulutusmenot on suhteutettu väestömäärään. Inflaation vaikutus on poistettu aikasarjoista siirtymällä hintaindekseihin, joissa käypät hinnat on suhteutettu kiinteisiin hintoihin. Perusvuodeksi on valittu vuosi 1975 eli vuoden 1975 alkoholin reaalihintaindeksi on 100 ja kokonaiskulutusmenojen indeksi samoin 100. Mallien selitettävän ja selittäjien muodostaminen on käsitelty jokaisen mallin yhteydessä olevassa Excel-tiedostossa. Aikasarjat alkavat vuodesta Aikasarjat ulottuvat vuoteen 1981 asti, mutta vuosien havaintoja ei käytetä mallien estimoimiseen. Mallien avulla on laskettu ennuste vuosien kulutukselle ja tätä verrataan toteutuneeseen kulutukseen. Vuonna 1969 voimaan tullut alkoholilain muutos lisäsi Alkon myymälöiden lukumäärää huomattavasti. Lakiuudistus salli myös keskioluen myynnin kaupoissa ja kahviloissa. Tämä ei kuitenkaan näy tutkittavissa alkoholin kulutusmenoissa, koska keskiolutta ei luokitella alkoholijuomaksi. Suomen alkoholipolitiikka on pyrkinyt säätelemään alkoholin kulutusta hinnanmuutosten avulla. Tämä näkyy alkoholin reaalihintaindeksissä, joka on pysynyt lähes vakiona. Alkoholin hintaa on siis korotettu likimäärin reaalihintojen nousun mukana. Käytetyt välineet Kaikki laskutoimitukset osittaisautokorrelaatiokertoimien estimaatteja lukuun ottamatta on tehty Microsoft Excel -ohjelmalla. Samoin kaikki kuvat on tehty Excelin avulla. Regressiomallit on estimoitu käyttämällä Regression-nimistä työkalua, jonka saa käyttöön asentamalla Data Analysis ToolPak -lisäosan Exceliin. Tulostuksia on jonkin verran muokattu: keskeisimmät tunnusluvut on korostettu sinisellä värillä ja luottamusvälien rajat on poistettu. Osittaisautokorrelaatiokertoimien estimaatit on laskettu Jerry Hintzen NCSS ohjelman avulla. Kertoimien laskeminen edellyttää rekursiokaavan käyttämistä ja lukuisien aputermien laskemista. Tämän vuoksi Excelillä on laskettu ainoastaan 4 ensimmäistä estimaattia ja muut kertoimet on laskettu NCSS ohjelmalla. Satunnaisten selittäjien regressiomallin standardioletukset Estimoidun mallin regressiokertoimien merkitsevyys ja korkea selitysaste eivät riitä takaamaan, että malli on käyttökelpoinen. Jäännöstermien odotusarvon pitää olla 0, jäännöstermit eivät saa korreloida keskenään ja jäännösvarianssin tulee olla vakio. Jos nämä ehdot täyttyvät, estimoidun mallin residuaalit muistuttavat nk. valkoista kohinaa ja malli on riittävä. Tämän lisäksi asetetaan jäännöstermeille normaalisuusvaatimus. Yleinen lineaarinen regressiomalli voidaan esittää matriisimuodossa seuraavasti: y = Xβ + ε 2
9 missä y on selitettävän muuttujan y havaittujen arvojen muodostama satunnainen n-vektori. X on selittäjien x 1, x 2,..., x k havaittujen arvojen muodostama n (k + 1)- matriisi, jossa 1. sarake on ykkösten muodostama vakioselittäjä. β on regressiokertoimien muodostama tuntematon ja kiinteä eli ei-satunnainen (k+1)-vektori, jossa 1. alkio vastaa ykkösten muodostamaa vakioselittäjää. ε on jäännöstermien muodostama ei-havaittu ja satunnainen n-vektori. Koska mallien selittäjät ovat satunnaisia, yleisen lineaarisen regressiomallin standardioletukset voidaan esittää matriisein seuraavassa muodossa: 1. Selittäjämatriisin X alkiot ovat satunnaismuuttujia. 2. Selittäjämatriisi X on täysiasteinen: r(x) = k Jäännöstermin ε ehdollinen odotusarvo ehdolla X on 0: E(ε X) = 0 4. Jäännöstermit ovat ehdollisesti homoskedastisia ja ehdollisesti korreloimattomia: Cov(ε X) = σ 2 I 5. Jäännöstermit ovat ehdollisesti normaalijakautuneita: (ε X) N n (0, σ 2 I) Mallien regressiodiagnostiikka keskittyy standardioletusten voimassaolon testaamiseen. Ensimmäisenä on tutkittu jäännöstermien normaalisuutta, koska se on edellytys useiden testien käyttämiselle. Toisena on tutkittu jäännöstermien korreloimattomuutta. Jäännöstermien autokorrelaatio tekee muiden testien tuloksista vain suuntaa-antavia. Viimeisenä on tutkittu jäännöstermien homoskedastisuutta. Residuaalien aritmeettinen keskiarvo on 0, koska kaikissa estimoiduissa malleissa on mukana vakioselittäjä. 3
10 Käytettävät diagnostiset testit Jarquen ja Beran testi jäännöstermien normaalisuudelle Jarquen ja Beran (esiintyy myös kirjallisuudessa nimellä Bowmanin ja Shentonin) testin avulla tutkitaan jäännöstermien normaalisuutta residuaalien avulla. Residuaaleista lasketaan tunnusluvut vinoudelle (skewness) ja huipukkuudelle (kurtosis). Normaalijakautuneilla havainnoilla kumpikin tunnusluku on 0 satunnaisvaihtelua lukuun ottamatta. JB-testisuureen suuret arvot viittaavat siihen, että jäännöstermit eivät ole normaalisia. Olkoot tutkittavan mallin residuaalit. Lasketaan tunnusluku vinoudelle: S = e 1, e 2,..., e n 1 n (e t ē) 3 n t=1 ( ) 3/2 1 n (e t ē) 2 n t=1 Lasketaan tunnusluku huipukkuudelle: K = 1 n ( 1 n n (e t ē) 4 t=1 ) 2 3 n (e t ē) 2 t=1 Jos PNS-menetelmällä estimoidussa regressiomallissa on mukana vakioselittäjä, residuaalien summa (ja aritmeettinen keskiarvo) on 0. Koska kaikissa tässä käsitellyissä malleissa on mukana vakiotermi, residuaalien keskusmomentit yhtyvät origomomentteihin, ja tunnuslukujen kaavat supistuvat alla olevaan muotoon. Tunnusluku vinoudelle, kun mallissa on vakiotermi: S = 1 n n t=1 ( 1 n n t=1 e 2 t e 3 t ) 3/2 Tunnusluku huipukkuudelle, kun mallissa on vakiotermi: K = 1 n ( 1 n n t=1 n t=1 4 e 4 t e 2 t ) 2 3
11 Testattava hypoteesi H 0 : Jäännöstermit ovat normaalisia: ε t N(0, σ 2 ) kaikille t Testisuure ja sen jakauma (S K2 ) JB = n 6 Jos H 0 pätee, JB a χ 2 (2). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Huomautus: ˆ Testi reagoi voimakkaasti poikkeaviin havaintoihin, mutta ei ole muuten erityisen voimakas (ts. hyväksymisvirhe on suuri). ˆ Jäännöstermien ei-normaalisuus tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Durbinin ja Watsonin testi Durbinin ja Watsonin testillä tutkitaan ensimmäisen kertaluvun autokorrelaation olemassaoloa jäännöstermeissä. Testisuure perustuu estimoidun mallin residuaaleihin e t. Testisuureen kriittiset rajat löytyvät taulukoituina useista alan oppikirjoista. Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε t 1 ) = 0 kaikille t Testisuure ja sen jakauma DW = T (e t e t 1 ) 2 t=2 DW -testisuure ei noudata mitään yleistä jakaumaa, mutta testisuureen kriittiset rajat löytyvät taulukoituina useista alan oppikirjoista. DW -testisuure saa arvoja avoimelta väliltä 0 4, pienet arvot viittaavat positiiviseen autokorrelaatioon ja suuret puolestaan negatiiviseen autokorrelaatioon. Testisuureen normaaliarvo korreloimattomuusoletuksen pätiessä on luvun 2 lähellä. T t=1 e 2 t 5
12 Huomautuksia: ˆ Durbinin ja Watsonin testiä ei voi käyttää, jos mallissa on viivästetty selitettävä. Tällöin voidaan kuitenkin käyttää Durbinin h-testiä. ˆ Mallin selittäjien täytyy olla kiinteitä. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. Durbinin h-testi Durbinin h-testillä tutkitaan ensimmäisen kertaluvun autokorrelaation olemassaoloa jäännöstermeissä, kun estimoidussa mallissa on selittäjänä viivästetty selitettävä. Testisuure perustuu estimoidun mallin residuaaleihin e t. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βy t 1 + γx t + ε t e t = y t ŷ t Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε t 1 ) = 0 kaikille t Testisuure ja sen jakauma h = r 1 n 1 n Var( β) missä r 1 on ensimmäisen kertaluvun autokorrelaatiokertoimen estimaatti, n on havaintojen lukumäärä ja Var( β) on viivästetyn selitettävän regressiokertoimen varianssin harhaton estimaatti. Jos H 0 pätee, h a N(0, 1). Testisuureen nollasta merkitsevästi poikkeavat arvot viittaavat jäännöstermien autokorrelaatioon. 6
13 Huomautuksia: ˆ Durbinin h-testiä ei voi käyttää, jos n Var( β) 1, koska neliöjuuren sisällä olevasta lausekkeesta tulee tällöin negatiivinen. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Durbinin h-testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Lagrangen kertojatesti autokorrelaatiolle Jäännöstermien autokorreloituneisuutta voidaan tutkia Lagrangen kertojatestillä (Lagrange multiplier, LM), joka voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla. Apuregressiomallissa tutkittavan mallin residuaaleja selitetään alkuperäisillä selittäjillä sekä residuaalien astelukua p olevalla autoregressiolla. Apuregressiomallin suuri selitysaste viittaa jäännöstermien autokorrelaatioon. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βx t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e t = γ 0 + γ 1 x t + φ 1 e t 1 + φ 2 e t φ p e t p + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε s ) = 0 kaikille t s Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (p), missä n on residuaalien lukumäärä, R 2 on apuregressiomallin selitysaste ja p on autoregression asteluku. Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. 7
14 Huomautuksia: ˆ LM-testi jäännöstermin autokorrelaatiolle saattaa reagoida myös mallin väärään funktionaaliseen muotoon. ˆ Apuregression asteluvun p valinta vaikuttaa testin tulokseen: p pitää valita suureksi, mutta ei liian suureksi. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Mallissa saa olla mukana myös viivästetty selitettävä. Boxin ja Piercen Q-testi jäännöstermien korreloimattomuudelle Jos malli on oikein määritelty, residuaalit muistuttavat valkoista kohinaa. Jäännöstermien korreloimattomuutta voidaan testata Boxin ja Piercen Q-testisuureella (esiintyy myös nimellä portmanteau-testi). Testisuureen suuret arvot viittaavat jäännöstermien autokorrelaatioon. Olkoot r 1, r 2,..., r k tutkittavan regressiomallin otosautokorrelaatiokertoimet. Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε s ) = 0 kaikille t s Testisuure ja sen jakauma Q K = n(r r r 2 K) missä K on yhteenlaskettavien autokorrelaatiokertoimien estimaattien lukumäärä ja n on havaintojen lukumäärä. Jos H 0 pätee, Q K a χ 2 (K). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Huomautuksia: ˆ Mallissa ei saa olla viivästettyä endogeenista muuttujaa. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. 8
15 Lagrangen kertojatesti homoskedastisuudelle 1 Jäännöstermien homoskedastisuutta voidaan tutkia Lagrangen kertojatestillä (Lagrange multiplier, LM), joka voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla. Apuregressiomallissa selitetään tutkittavan mallin residuaalien neliöitä alkuperäisen mallin selittäjillä, selittäjien neliöillä sekä selittäjien ristitulolla. Ristitulotermejä ei ole käytetty tässä yhteydessä selittäjinä, jos alkuperäisessä mallissa on ollut yli 3 selittäjää. Apuregressiomallin korkea selitysaste viittaa siihen, että jäännöstermit ovat heteroskedastisia. Testi esiintyy kirjallisuudessa myös nimellä Whiten testi. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + β 1 x t + β 2 z t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e 2 t = γ 0 + γ 1 x t + γ 2 z t + γ 3 x 2 t + γ 4 z 2 t + γ 5 x t z t + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit ovat homoskedastisia: Var(ε t ) = σ 2 kaikille t Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (p), missä n on residuaalien lukumäärä, R 2 on apuregressiomallin selitysaste ja p on apuregression aitojen selittäjien lukumäärä (vakioselittäjä poisluettuna). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. Huomautus: ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. 9
16 Lagrangen kertojatesti homoskedastisuudelle 2 Lagrangen kertojatesti (Lagrange multiplier, LM) jäännöstermien homoskedastisuudelle voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla, jossa selitetään tutkittavan mallin residuaalien neliöitä mallin sovitteilla. Apuregressiomallin korkea selitysaste viittaa siihen, että jäännöstermit ovat heteroskedastisia. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βx t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e 2 t = γ 0 + γ 1 ŷ t + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit ovat homoskedastisia: Var(ε t ) = σ 2 kaikille t Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (1), missä n on residuaalien lukumäärä ja R 2 on apuregressiomallin selitysaste. Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. Huomautus: ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Sarjat, selittäjät ja selitettävä Logaritmointi Mallin estimoinnissa on käytetty logaritmoituja selittäjiä sekä selitettävää. Tämä tekee suhteellisten muutosten tulkitsemisen helpommaksi. Esimerkiksi jos x 0 muuttuu p %, niin uusi arvo x 1 on 10
17 ja edelleen ( x 1 = 1 + p ) x ( log(x 1 ) = log(x 0 ) + log 1 + p ) log(x 0 ) + p Logaritmoinnin ansiosta reaalihintaindeksin sekä per capita kokonaiskulutusmenojen regressiokertoimet voidaan tulkita hinta- ja tulojoustona. Differenssien laskeminen Osa käsitellyistä regressiomalleista on nk. differenssimalleja, joissa selitetään muuttujien vuosimuutosta. Differenssioperaattorin merkkinä on käytetty D- kirjainta. Esimerkiksi muuttujan x t ensimmäinen differenssi on D x t = x t x t 1 Ensimmäisen differenssin tulkinta vastaa kahden peräkkäisen vuoden havaintojen muutosta tutkittavissa vuosisarjoissa. Aikasarjat Mallinrakennukseen on käytetty seuraavia aikasarjoja vuosilta : Vexp45 Kokonaiskulutusmenot käypällä hintatasolla [milj. mk] Qexp45 Kokonaiskulutusmenot kiinteällä vuoden 1975 hintatasolla [milj. mk] Popul Asukasluku V1c Alkoholin kulutusmenot käypällä hintatasolla [milj. mk] Q1c Alkoholin kulutusmenot kiinteällä vuoden 1975 hintatasolla [milj. mk] Lisäksi sarjoista on vuosilta havainnot, joita käytetään ennusteen ja toteutuneen kulutuksen vertailuun. Aikasarjat ovat liitteenä Excel-tiedostossa sarjat.xls. Aikasarjoista muodostettiin seuraavat apumuuttujat: V t Q t P t v t Per capita kokonaiskulutusmenot käypällä hintatasolla V t = 10 6 Vexp45/Popul [mk] Per capita kokonaiskulutusmenot kiinteällä vuoden 1975 hintatasolla Q t = 10 6 Qexp45/Popul [mk] Kokonaiskulutusmenojen implisiittinen deflaattori P t = 100 V t /Q t (1975 = 100) Per capita alkoholin kulutusmenot käypällä hintatasolla v t = 10 6 V1c/Popul [mk] 11
18 Kuva 1: Pistediagrammi alkoholin reaalihintaindeksin logaritmista log(100 p t /P t ) kokonaiskulutusmenojen logaritmia log(q t ) vastaan. q t p t Per capita alkoholin kulutusmenot kiinteällä vuoden 1975 hintatasolla q t = 10 6 Q1c/Popul [mk] Alkoholin implisiittinen hintaindeksi p t = 100 v t /q t (1975 = 100) 100 p t /P t Alkoholin reaalihintaindeksi 100 p t /P t (1975 = 100) Pistediagrammista näkyy, että alkoholin kulutusmenojen ja alkoholin reaalihintaindeksin välillä on heikko negatiivinen korrelaatio. Alkoholin kulutusmenoissa näkyy aikasarjakuvassa selvä nouseva trendi, kun taas alkoholin reaalihintaindeksi on pysynyt lähes vakiona. Sekä pistediagrammista että aikasarjakuvasta näkyy, että kokonaiskulutusmenojen ja alkoholin kulutusmenojen välillä on vahva positiivinen korrelaatio. Molemmissa sarjoissa näkyy selvä nouseva trendi. Edellä esitetyt pistediagrammit ja aikasarjat löytyvät tiedostosta pari_regr.xls. Tiedostossa on myös kuvia sarjoista. 1. malli Regressiomallin selitettävä (log-funktio on luonnollinen logaritmi): ˆ Per capita kiinteän hintatason alkoholin kulutusmenojen logaritmi log(q t ) Regressiomallissa käytettiin seuraavia selittäjiä: 12
19 Kuva 2: Aikasarja alkoholin kulutusmenojen logaritmista log(q t ) ja alkoholin reaalihintaindeksin logaritmista log(100 p t /P t ). Kuva 3: Pistediagrammi kokonaiskulutusmenojen logaritmista log(q t ) alkoholin kulutusmenojen logaritmia log(q t ) vastaan. 13
20 Kuva 4: Aikasarja alkoholin kulutusmenojen logaritmista log(q t ) ja kokonaiskulutusmenojen logaritmista log(q t ). ˆ Alkoholin reaalihintaindeksin logaritmi log(100 p t /P t ) ˆ Per capita kiinteän hintatason kokonaiskulutusmenojen logaritmi log(q t ) Estimoidaan PNS-menetelmällä regressiomalli, jossa selitetään alkoholin per capita kulutusmenojen logaritmia alkoholin reaalihintaindeksin logaritmilla sekä per capita kokonaiskulutusmenojen logaritmilla. Selitettävä ja selittäjät löytyvät Excel-taulukosta malli1_selittajat.xls. Logaritmoidun reaalihintaindeksin regressiokertoimen tulkinta vastaa pitkän aikavälin hintajoustoa. Hintatason nousu johtaa yleensä kysynnän laskuun, joten hintajousto on tyypillisesti negatiivinen. Logaritmoidun per capita kokonaiskulutusmenojen regressiokertoimen tulkinta vastaa pitkän aikavälin tulojoustoa. Tulotason nousu lisää tavallisesti kysyntää ellei kyseessä ole nk. inferiorinen hyödyke, jonka kysyntä vähentyy tulotason noustessa. Tulojousto on siis tyypillisesti positiivinen. Estimoitu malli ja tunnusluvut Estimoitu lineaarinen regressiomalli on seuraava (suluissa estimaattien keskihajonnat): log(q t ) = (2.352) (0.470) log(100 p t/p t ) (0.072) log(q t) R 2 =
21 Kuva 5: Kuva havainnoista ja sovitteista aikaa vastaan. Malli löytyy laskutoimituksineen Excel-tiedostosta malli1.xls. Mallin regressiokertoimet ovat merkitseviä vakioselittäjän kerroin pois lukien. Sekä pitkän aikavälin hintajousto 1.12 että tulojousto 1.51 ovat merkitseviä. Pitkän aikavälin hintajousto voidaan tulkita siten, että 1 %:n nousu alkoholin reaalihinnassa näkyy pitkällä aikavälillä 1.12 %:n laskuna alkoholin kulutusmenoissa muiden tekijöiden pysyessä ennallaan. Vastaavasti pitkän aikavälin tulojousto voidaan tulkita siten, että 1 %:n kasvu per capita kokonaiskulutusmenoissa näkyy 1.51 %:n kasvuna alkoholin kulutusmenoissa pitkällä aikavälillä muiden tekijöiden pysyessä ennallaan. Mallin selitysaste R 2 = on korkea. Graafinen tarkastelu Malli ei näytä sopivan havaintoihin kovin hyvin. Vaikka trendit asettuvat kohdalleen, mallin tuottamat sovitteet ovat systemaattisesti havaintoja pienempiä tai suurempia usean peräkkäisen vuoden ajan, joten malli ei ole hyvä. Malli ei kykene selittämään vuoden 1969 lainmuutoksen aiheuttamaa hyppäystä alkoholin kulutusmenoissa. Kuvassa katkoviiva kuvaa mallin avulla laskettua ennustetta. Residuaalit ovat ensin positiivisia vuosien ajan, tämän jälkeen negatiivisia vuosien ajan ja jälleen positiivisia vuosina Tämä viittaa voimakkaaseen positiiviseen ensimmäisen kertaluvun autokorrelaatioon. Itseisarvoltaan pieniä residuaaleja on vähän. Tämän antaa aihetta epäillä jäännöstermien homoskedastisuutta. Huomaa residuaalikuvassa tapahtuva muutos vuosien 1968 ja 1969 välillä (havainnot 19 ja 20). Katkoviivalla piirretty kiinteän hintatason ennuste poikkeaa selvästi havainnoista. Vuonna 1981 ennusteen ja toteutuneen kulutuksen erotus on 316 miljoonaa markkaa. Ennustevirhe on niin suuri, että mallin tuottamaa ennustetta ei voi pitää käyttökelpoisena. 15
Regressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotYhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1
Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
LisätiedotTilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
LisätiedotJohdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2004) 1 Yleinen lineaarinen malli Usean selittäjän lineaarinen regressiomalli Yleisen lineaarisen mallin matriisisesitys Yleisen
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
LisätiedotIlkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli
LisätiedotJohdatus regressioanalyysiin. Heliövaara 1
Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen
LisätiedotDynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
LisätiedotIdentifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
LisätiedotErityiskysymyksiä yleisen lineaarisen mallin soveltamisessa
Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5
MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
Lisätiedot2. Teoriaharjoitukset
2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.
LisätiedotAki Taanila YHDEN SELITTÄJÄN REGRESSIO
Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...
LisätiedotTA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET
TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen
Lisätiedotχ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut
Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
Lisätiedot4. Tietokoneharjoitukset
4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume
Lisätiedot4. Tietokoneharjoitukset
4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume
LisätiedotYhden selittäjän lineaarinen regressiomalli
Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli
LisätiedotMoniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
LisätiedotTestit laatueroasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten
LisätiedotMoniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?
TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä
LisätiedotIlkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
LisätiedotMat Sovellettu todennäköisyyslasku A
TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
LisätiedotTilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen
Tilastollisen analyysin perusteet Luento 5: Sisältö Tilastotieteessä tehdään usein oletuksia havaintojen jakaumasta. Useat tilastolliset menetelmät toimivat tehottomasti tai jopa virheellisesti, jos jakaumaoletukset
LisätiedotJohdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle
LisätiedotJohdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka
Lisätiedot1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi
Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,
LisätiedotHarjoitukset 4 : Paneelidata (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotJos Q = kysytty määrä, Q = kysytyn määrän muutos, P = hinta ja P = hinnan muutos, niin hintajousto on Q/Q P/P
Osa 5. Joustoista Kysynnän hintajousto (price elasticity of demand) mittaa, miten kysynnän määrä reagoi hinnan muutokseen = kysytyn määrän suhteellinen muutos jaettuna hinnan suhteellisella muutoksella
LisätiedotKorrelaatiokertoinen määrittely 165
kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotTestit järjestysasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) Tavoitteet (teoria): Hahmottaa aikasarjan klassiset komponentit ideaalisessa tilanteessa. Ymmärtää viivekuvauksen vaikutus trendiin. ARCH-prosessin
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotTilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä
Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme
Lisätiedot1. Tutkitaan tavallista kahden selittäjän regressiomallia
TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa
LisätiedotTilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
LisätiedotSisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13
LisätiedotJohdatus tilastotieteeseen Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Regressiodiagnostiikka TKK (c) Ilkka Mellin (2004) 1 Regressiodiagnostiikka Yleinen lineaarinen malli ja regressiodiagnostiikka Regressiografiikka Poikkeavat havainnot Regressiokertoimien
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
LisätiedotOdotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
LisätiedotHarjoitus 7 : Aikasarja-analyysi (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitus 7 : Aikasarja-analyysi (Palautus 28.3.2017) Tämän harjoituskerran tarkoitus on perehtyä
LisätiedotYleinen lineaarinen malli
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: 1 Määritelmä ja standardioletukset 2
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +
LisätiedotMAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa.
KERTAUS Lukujono KERTAUSTEHTÄVIÄ K1. Ratkaisussa annetaan esimerkit mahdollisista säännöistä. a) Jatketaan lukujonoa: 2, 4, 6, 8, 10, 12, 14, 16, Rekursiivinen sääntö on, että lukujonon ensimmäinen jäsen
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
LisätiedotHarjoitukset 3 : Monimuuttujaregressio 2 (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät
LisätiedotIdentifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
Lisätiedot8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH
8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH Osa aikasarjoista kehittyy hyvin erityyppisesti erilaisissa tilanteissa. Esimerkiksi pörssikurssien epävakaus keskittyy usein lyhyisiin
Lisätiedot1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset
TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept
LisätiedotRegressiodiagnostiikka ja regressiomallin valinta
Regressiodiagnostiikka ja regressiomallin valinta MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
LisätiedotAlkoholijuomien hinnat ja kulutus
Alkoholijuomien hinnat ja kulutus VILLE VEHKASALO Virosta tulee näillä näkymin EU:n jäsen vuoden 2004 vappuna. Tämän jälkeen kuka tahansa voi tuoda omaan käyttöönsä edullista alkoholia Virosta vaikka pakettiautolla.
LisätiedotJohdatus regressioanalyysiin
Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2007) 1 Johdatus regressioanalyysiin >> Regressioanalyysin lähtökohdat ja tavoitteet
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman
LisätiedotJos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan
17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
LisätiedotJos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
Lisätiedot2. TILASTOLLINEN TESTAAMINEN...
!" # 1. 1. JOHDANTO... 3 2. 2. TILASTOLLINEN TESTAAMINEN... 4 2.1. T-TESTI... 4 2.2. RANDOMISAATIOTESTI... 5 3. SIMULOINTI... 6 3.1. OTOSTEN POIMINTA... 6 3.2. TESTAUS... 7 3.3. TESTIEN TULOSTEN VERTAILU...
LisätiedotAalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,
Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotKoska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.
24.11.2006 1. Oletetaan, että kaksiulotteinen satunnaismuuttuja µ noudattaa kaksiulotteista normaalijakaumaa. Oletetaan lisäksi, että satunnaismuuttujan regressiofunktio satunnaismuuttujan suhteen on ݵ
Lisätiedot1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT
imat-2.104 Tilastollisen analyysin perusteet / Tehtävät Aiheet: Avainsanat: Ysisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Koonaisesiarvo,
LisätiedotRegressiodiagnostiikka ja regressiomallin valinta
Regressiodiagnostiikka ja regressiomallin valinta MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
LisätiedotViikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus
MS-C2128 Ennustaminen ja aikasarja-analyysi 5. harjoitukset / Tehtävät Kotitehtävät: 2 Aihe: ARMA-mallit Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tehtävä 5.1. Tarkastellaan
LisätiedotSisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9
LisätiedotJohdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Regressiomallin valinta TKK (c) Ilkka Mellin (2004) 1 Regressiomallin valinta Regressiomallin valinta: Johdanto Mallinvalintatestit Mallinvalintakriteerit Epälineaaristen riippuvuuksien
Lisätiedot11. laskuharjoituskierros, vko 15, ratkaisut
11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa
LisätiedotAikasarjamallit. Pekka Hjelt
Pekka Hjelt Aikasarjamallit Aikasarja koostuu järjestyksessä olevista havainnoista, ja yleensä se on tasavälinen ja diskreetti eli havaintopisteet ovat erillisiä. Lisäksi aikasarjassa on yleensä autokorrelaatiota
Lisätiedot1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
LisätiedotJohdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2005) 1 Johdatus regressioanalyysiin Regressioanalyysin lähtökohdat ja tavoitteet Deterministiset mallit ja regressioanalyysi
Lisätiedot