Erikoistyö: Alkoholin kulutusmenojen ennustaminen

Koko: px
Aloita esitys sivulta:

Download "Erikoistyö: Alkoholin kulutusmenojen ennustaminen"

Transkriptio

1 Erikoistyö: Alkoholin kulutusmenojen ennustaminen Tekijä: Mikko Nordlund 49857B Ohjaaja: Ilkka Mellin Jätetty:

2 Sisällysluettelo 1. JOHDANTO MALLIEN TUTKIMINEN MALLIT VIITTEET... 5 DOKUMENTTI: ALKOHOLIN KULUTUSMENOJEN ENNUSTAMINEN...LIITE 2

3 1. Johdanto Tämä erikoistyö on osa OtaStat-projektia. OtaStat on Ilkka Mellinin johtama projekti Teknillisen korkeakoulun Systeemianalyysin laboratoriossa. OtaStat-hankkeen tavoitteena on tuottaa verkko-opetusmateriaalia todennäköisyyslaskennan ja tilastotieteen opetusta varten [1]. Materiaalia voidaan käyttää myös osana Systeemianalyysin laboratorion tavallista opetusta. Koko työ on luettavissa WWW-sivulta ja liitteenä on työn vedos, josta puuttuvat laskutoimitukset ja jonka kuvien asettelu poikkeaa WWW-sivulla olevasta versiosta. Erikoistyö liittyy ennustamiseen ja aikasarja-analyysiin. Se käsittelee alkoholin markkamääräisen kysynnän kuvaamista ja ennustamista. Työ on kirjoitettu opetusmateriaaliksi ja tämän takia siinä käsitellään useita malleja, joiden puutteita korjataan ja lopulta päädytään käyttökelpoiseen malliin. Opetustarkoitusta varten työ on tehty Microsoft Excel ohjelmalla, joka on useimpien saatavilla. Laskutoimitukset ovat työssä mukana Excel-tiedostoina ja näistä näkee, miten erilaisia tilastollisia testejä voi tehdä tavallisella taulukkolaskentaohjelmalla. Testien tekeminen on myös havainnollisempaa Excelillä, koska erilliset tilasto-ohjelmistot eivät yleensä näytä laskutoimituksia vaan tulostavat pelkästään testin tuloksen. Näin testisuureiden laskeminen voi jäädä epäselväksi. Osittaisautokorrelaatiokertoimien estimaatit on kuitenkin laskettu NCSS 2000 ohjelman avulla, koska Excelillä näiden laskeminen edellyttää joko todella monien aputermien laskemista tai Visual Basic kielellä ohjelmoimista. Hypertext Markup Language eli HTML-muodossa oleva dokumentti sekä Portable Document Format eli PDF-muodossa oleva dokumentti on tuotettu OtaStat Markup Language eli OSML-kielellä, jonka Jussi Virtanen on suunnitellut ja toteuttanut yhdessä Veli Peltolan kanssa. OSML on XML eli Extensible Markup Language pohjainen kieli. Liitteenä on PDFmuodossa olevan dokumentin tuloste. 2. Mallien tutkiminen Mallien hyvyyttä tutkitaan useasta eri näkökulmasta. Malleista tehdään erilaisia kuvia graafisen tarkastelun avuksi. Selitysaste on keskeisin tunnusluku hyvyyden vertaamisessa. Residuaalit asetetaan diagnostisten testien kohteeksi. Lopuksi malleilla laaditaan ennuste viidelle vuodelle ja tätä verrataan toteutuneeseen kulutukseen. Estimoimisen jälkeen mallien residuaalit asetetaan graafisen tarkastelun ja diagnostisten testien kohteeksi, joiden tarkoituksena on selvittää, täyttävätkö mallin jäännöstermit niin kutsutut regressiomallin standardioletukset [2]: 1. Jäännöstermien ehdollinen odotusarvo on Jäännöstermit ovat ehdollisesti homoskedastisia. 3. Jäännöstermit ovat ehdollisesti korreloimattomia. 4. Jäännöstermit ovat ehdollisesti normaalijakautuneita 3

4 Ehdollisuus tarkoittaa ehdolla X, missä X on täysiasteinen selittäjämatriisi, jonka alkiot ovat satunnaismuuttujia. Standardioletusten testaamiseen käytetyistä tilastollisista testeistä on selvitys liitteenä olevassa selostuksessa. Kaikista malleista tehtiin seuraavat kuvat: 1. Aikasarjadiagrammi havainnoista ja sovitteista. 2. Aikasarjakuva residuaaleista. 3. Aikasarjakuva toteutuneesta kulutuksesta sekä sovitteesta ja ennusteesta. 4. Q-Q kuva residuaaleista. 5. Kuva estimoiduista autokorrelaatiokertoimista. 6. Kuva estimoiduista osittaisautokorrelaatiokertoimista. Kuvatyypistä 1 nähdään miten hyvin estimoitu malli sopii havaintoihin. Parhaassa tapauksessa käyrät asettuvat päällekkäin. Systemaattiset poikkeamat puolestaan viittaavat siihen, että malli ei ole oikein spesifioitu. Aikasarjakuva residuaaleista esittää samaa asiaa, mutta tästä kuvasta systemaattiset poikkeamat ja heteroskedastisuus on helpompi tunnistaa. Kuvatyyppi 3 kertoo miten hyvin mallin avulla laskettu ennuste sopii havaintoihin. Alkoholin kulutusmenojen pitkään jatkunut kasvutrendi taittuu vuoden 1973 tienoilla ja tämän vuoksi vuosille laadittu ennuste markkamääräisestä myynnistä osuu yläkanttiin. Kuvatyyppi 4 on eräs normaalipaperi, jonka avulla voidaan tutkia jäännöstermien normaalisuutta. Kuvia estimoiduista autokorrelaatio- ja osittaisautokorrelaatiokertoimista käytettiin jäännöstermien korreloituneisuuden arvioimiseen. Kuten aikasarja-analyysissä yleensä, myös alkoholin kulutusmenoja kuvattaessa regressiomallilla törmätään autokorrelaatio-ongelmaan. Autokorrelaation ohella toinen jäännöstermeihin liittyvä ongelma on heteroskedastisuus. Usein nämä ongelmat ilmenevät samanaikaisesti. Kun havaitaan, että malli ei täytä sille asetettuja standardioletuksia, mallia korjataan. Näin päädytään lopulta malliin, jonka jäännöstermit ovat normaalisia, homoskedastisia ja korreloimattomia. Tälläistä mallia kutsutaan riittäväksi. 3. Mallit Estimoidut mallit perustuvat kansantalouden kysyntäteoriaan. Työn alussa on lyhyesti selitetty peruskäsitteitä, kuten joustokerroin ja normaalihyödyke. Kysynnän hintajoustolla mitataan, kuinka herkästi kysytty määrä reagoi hinnan muutokseen. Kysynnän hintajoustossa määrän prosentuaalinen muutos jaetaan hinnan prosentuaalisella muutoksella [3]. Jos hyödykkeen hintajousto on esimerkiksi -1.25, yhden prosentin nousu hinnassa näkyy 1.25 prosentin laskuna kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen tapauksessa kysytty määrä kasvaa hinnan laskiessa ja vastaavasti kysyntä pienenee hinnan noustessa muiden tekijöiden pysyessä ennallaan. Siten normaalihyödykkeen hintajousto on negatiivinen. Kysynnän tulojoustossa hyödykkeen kysynnän prosentuaalinen muutos jaetaan kuluttajien tulojen prosentuaalisella muutoksella. Jos hyödykkeen tulojousto on esimerkiksi 1.4, yhden prosentin nousu kuluttajien tuloissa näkyy 1.4 prosentin nousuna hyödykkeen kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen kysyntä kasvaa, kun kuluttajien tulot kasvavat ja muut 4

5 tekijät pysyvät ennallaan. Vastaavasti normaalihyödykkeen kysyntä pienenee, kun kuluttajien tulot pienenevät. Tämän takia normaalihyödykkeen tulojousto on positiivinen. Malleissa käytetään selitettävänä muuttujana alkoholin per capita kulutusmenojen logaritmia. Selittäjinä käytetään per capita kokonaiskulutusmenojen logaritmia sekä alkoholin reaalihintaindeksin logaritmia. Logaritmoinnin ansiosta regressiokertoimet voidaan tulkita tulojoustoksi ja hintajoustoksi. Ensimmäinen tasomalli osoittautuu kelvottomaksi regressiodiagnostiikan näkökulmasta, vaikka mallin selitysaste on korkea ja regressiokertoimet merkitseviä. Tasomallia vastaavan differenssimallin jäännöstermejä ei voida pitää normaalisina ja niiden homoskedastisuutta on aihetta epäillä. Toiseen malliin lisätään selittäjäksi dummy-muuttuja. Vuonna 1969 alkoholilain muutos lisäsi Alkon myymälöiden määrää huomattavasti ja alkoholin markkamääräinen kysyntä kasvoi huomattavasti. Kokonaiskulutusmenot ja alkoholin hintaindeksi eivät selitä tätä muutosta, joten malliin lisätään dummy-muuttuja. Malli ei kuitenkaan läpäise diagnostisia testejä, autokorrelaatio on edelleen ongelma. Mallia vastaava differenssimalli sen sijaan läpäisee kaikki testit. Tasomallia korjataan lisäämällä selittäjiksi viivästetty selitettävä sekä viivästetyt selittäjät. Näin saadaan kolmas malli, joka on dynaaminen toisin kuin edelliset. Havaitaan, että dummy-muuttujan ja viivästetyn dummy-muuttujan regressiokertoimet ovat itseisarvoltaan lähes yhtä suuria, mutta vastakkaismerkkisiä. Tämän vuoksi ne voidaan korvata yhdellä impulssi-dummyllä. Neljännessa mallissa dummy-muuttujat on korvattu impulssi-dummylla, joka saa arvon 1 vuonna Näin mallissa on saatu vähennettyä selittäjien määrää yhdellä edelliseen verrattuna. Malli läpäisee diagnostiset testit ja sen tuottama ennuste on myös parempi kuin edellisillä malleilla. Mallien tarkempi vertailu on liitteessä. 4. Viitteet [1] OtaStat-projektin kuvaus: viitattu [2] Mellin, Ilkka Oppimateriaalia [3] Mäkelä, Vilho Käytännön kansantaloustiede. 2. uudistettu painos. KY-Palvelu Oy. 172 s. ISBN

6 5. Liite: Alkoholin kulutusmenojen ennustaminen 6

7 Alkoholin kulutusmenojen ennustaminen Mikko Nordlund Tausta Alkoholin kulutuksella on suuri kansantaloudellinen merkitys. Alkoholitulot muodostivat vuonna 2002 noin 5.5 % valtion verotuloista[1], mutta lisääntyvä kulutus kasvattaa myös muun muassa sosiaalimenoja. Alkoholin kulutuksen muutos vaikuttaa valtion tuloihin ja menoihin sekä suorasti että epäsuorasti. Tarkoituksena on kuvata alkoholin markkamääräistä kulutusta sopivalla aikasarjamallilla. Opetustarkoituksessa havaintoaineistoon sovitetaan erilaisia malleja, joita vertaillaan sekä graafisesti että tunnuslukujen ja diagnostisten testien avulla. Malleja korjataan, jos ne eivät läpäise diagnostisia testejä. Estimoitujen mallien avulla laaditaan ennuste, jota verrataan toteutuneeseen kulutukseen. Tilastollisesti hyvä malli yleensä myös tuottaa paremman ennusteen kuin huono malli. Mallit perustuvat kansantalouden kysyntäteoriaan. Kysynnän hintajoustolla mitataan, kuinka herkästi kysytty määrä reagoi hinnan muutokseen. Kysynnän hintajoustossa määrän prosentuaalinen muutos jaetaan hinnan prosentuaalisella muutoksella [2]. Jos hyödykkeen hintajousto on esimerkiksi -1.25, yhden prosentin nousu hinnassa näkyy 1.25 prosentin laskuna kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen tapauksessa kysytty määrä kasvaa hinnan laskiessa ja vastaavasti kysyntä pienenee hinnan noustessa muiden tekijöiden pysyessä ennallaan. Siten normaalihyödykkeen hintajousto on negatiivinen. Kysynnän tulojoustossa hyödykkeen kysynnän prosentuaalinen muutos jaetaan kuluttajien tulojen prosentuaalisella muutoksella. Jos hyödykkeen tulojousto on esimerkiksi 1.4, yhden prosentin nousu kuluttajien tuloissa näkyy 1.4 prosentin nousuna hyödykkeen kysytyssä määrässä muiden tekijöiden pysyessä ennallaan. Normaalihyödykkeen kysyntä kasvaa, kun kuluttajien tulot kasvavat ja muut tekijät pysyvät ennallaan. Vastaavasti normaalihyödykkeen kysyntä pienenee, kun kuluttajien tulot pienenevät. Tämän takia normaalihyödykkeen tulojousto on positiivinen. Mallien estimoinnin yhteydessä kommentoidaan myös laskettujen alkoholin tulo- ja hintajouston kertoimien järkevyyttä. On syytä olettaa, että alkoholin tulojousto on positiivinen ja hintajousto negatiivinen. Malleissa alkoholin markkamääräisen myynnin oletetaan riippuvan Suomen asukasluvusta, kuluttajien kokonaiskulutusmenoista (reaaliansioista) sekä alkoholin hinnasta. Asukasluvun ja kokonaiskulutusmenojen kasvu lisäävät alkoholin kysyntää, kun taas alkoholin hinnan nousu vähentää kysyntää. Väestönkasvun 1

8 vaikutus on huomioitu siirtymällä tutkimaan per capita aikasarjoja eli vuotuiset kokonaiskulutusmenot ja alkoholin kulutusmenot on suhteutettu väestömäärään. Inflaation vaikutus on poistettu aikasarjoista siirtymällä hintaindekseihin, joissa käypät hinnat on suhteutettu kiinteisiin hintoihin. Perusvuodeksi on valittu vuosi 1975 eli vuoden 1975 alkoholin reaalihintaindeksi on 100 ja kokonaiskulutusmenojen indeksi samoin 100. Mallien selitettävän ja selittäjien muodostaminen on käsitelty jokaisen mallin yhteydessä olevassa Excel-tiedostossa. Aikasarjat alkavat vuodesta Aikasarjat ulottuvat vuoteen 1981 asti, mutta vuosien havaintoja ei käytetä mallien estimoimiseen. Mallien avulla on laskettu ennuste vuosien kulutukselle ja tätä verrataan toteutuneeseen kulutukseen. Vuonna 1969 voimaan tullut alkoholilain muutos lisäsi Alkon myymälöiden lukumäärää huomattavasti. Lakiuudistus salli myös keskioluen myynnin kaupoissa ja kahviloissa. Tämä ei kuitenkaan näy tutkittavissa alkoholin kulutusmenoissa, koska keskiolutta ei luokitella alkoholijuomaksi. Suomen alkoholipolitiikka on pyrkinyt säätelemään alkoholin kulutusta hinnanmuutosten avulla. Tämä näkyy alkoholin reaalihintaindeksissä, joka on pysynyt lähes vakiona. Alkoholin hintaa on siis korotettu likimäärin reaalihintojen nousun mukana. Käytetyt välineet Kaikki laskutoimitukset osittaisautokorrelaatiokertoimien estimaatteja lukuun ottamatta on tehty Microsoft Excel -ohjelmalla. Samoin kaikki kuvat on tehty Excelin avulla. Regressiomallit on estimoitu käyttämällä Regression-nimistä työkalua, jonka saa käyttöön asentamalla Data Analysis ToolPak -lisäosan Exceliin. Tulostuksia on jonkin verran muokattu: keskeisimmät tunnusluvut on korostettu sinisellä värillä ja luottamusvälien rajat on poistettu. Osittaisautokorrelaatiokertoimien estimaatit on laskettu Jerry Hintzen NCSS ohjelman avulla. Kertoimien laskeminen edellyttää rekursiokaavan käyttämistä ja lukuisien aputermien laskemista. Tämän vuoksi Excelillä on laskettu ainoastaan 4 ensimmäistä estimaattia ja muut kertoimet on laskettu NCSS ohjelmalla. Satunnaisten selittäjien regressiomallin standardioletukset Estimoidun mallin regressiokertoimien merkitsevyys ja korkea selitysaste eivät riitä takaamaan, että malli on käyttökelpoinen. Jäännöstermien odotusarvon pitää olla 0, jäännöstermit eivät saa korreloida keskenään ja jäännösvarianssin tulee olla vakio. Jos nämä ehdot täyttyvät, estimoidun mallin residuaalit muistuttavat nk. valkoista kohinaa ja malli on riittävä. Tämän lisäksi asetetaan jäännöstermeille normaalisuusvaatimus. Yleinen lineaarinen regressiomalli voidaan esittää matriisimuodossa seuraavasti: y = Xβ + ε 2

9 missä y on selitettävän muuttujan y havaittujen arvojen muodostama satunnainen n-vektori. X on selittäjien x 1, x 2,..., x k havaittujen arvojen muodostama n (k + 1)- matriisi, jossa 1. sarake on ykkösten muodostama vakioselittäjä. β on regressiokertoimien muodostama tuntematon ja kiinteä eli ei-satunnainen (k+1)-vektori, jossa 1. alkio vastaa ykkösten muodostamaa vakioselittäjää. ε on jäännöstermien muodostama ei-havaittu ja satunnainen n-vektori. Koska mallien selittäjät ovat satunnaisia, yleisen lineaarisen regressiomallin standardioletukset voidaan esittää matriisein seuraavassa muodossa: 1. Selittäjämatriisin X alkiot ovat satunnaismuuttujia. 2. Selittäjämatriisi X on täysiasteinen: r(x) = k Jäännöstermin ε ehdollinen odotusarvo ehdolla X on 0: E(ε X) = 0 4. Jäännöstermit ovat ehdollisesti homoskedastisia ja ehdollisesti korreloimattomia: Cov(ε X) = σ 2 I 5. Jäännöstermit ovat ehdollisesti normaalijakautuneita: (ε X) N n (0, σ 2 I) Mallien regressiodiagnostiikka keskittyy standardioletusten voimassaolon testaamiseen. Ensimmäisenä on tutkittu jäännöstermien normaalisuutta, koska se on edellytys useiden testien käyttämiselle. Toisena on tutkittu jäännöstermien korreloimattomuutta. Jäännöstermien autokorrelaatio tekee muiden testien tuloksista vain suuntaa-antavia. Viimeisenä on tutkittu jäännöstermien homoskedastisuutta. Residuaalien aritmeettinen keskiarvo on 0, koska kaikissa estimoiduissa malleissa on mukana vakioselittäjä. 3

10 Käytettävät diagnostiset testit Jarquen ja Beran testi jäännöstermien normaalisuudelle Jarquen ja Beran (esiintyy myös kirjallisuudessa nimellä Bowmanin ja Shentonin) testin avulla tutkitaan jäännöstermien normaalisuutta residuaalien avulla. Residuaaleista lasketaan tunnusluvut vinoudelle (skewness) ja huipukkuudelle (kurtosis). Normaalijakautuneilla havainnoilla kumpikin tunnusluku on 0 satunnaisvaihtelua lukuun ottamatta. JB-testisuureen suuret arvot viittaavat siihen, että jäännöstermit eivät ole normaalisia. Olkoot tutkittavan mallin residuaalit. Lasketaan tunnusluku vinoudelle: S = e 1, e 2,..., e n 1 n (e t ē) 3 n t=1 ( ) 3/2 1 n (e t ē) 2 n t=1 Lasketaan tunnusluku huipukkuudelle: K = 1 n ( 1 n n (e t ē) 4 t=1 ) 2 3 n (e t ē) 2 t=1 Jos PNS-menetelmällä estimoidussa regressiomallissa on mukana vakioselittäjä, residuaalien summa (ja aritmeettinen keskiarvo) on 0. Koska kaikissa tässä käsitellyissä malleissa on mukana vakiotermi, residuaalien keskusmomentit yhtyvät origomomentteihin, ja tunnuslukujen kaavat supistuvat alla olevaan muotoon. Tunnusluku vinoudelle, kun mallissa on vakiotermi: S = 1 n n t=1 ( 1 n n t=1 e 2 t e 3 t ) 3/2 Tunnusluku huipukkuudelle, kun mallissa on vakiotermi: K = 1 n ( 1 n n t=1 n t=1 4 e 4 t e 2 t ) 2 3

11 Testattava hypoteesi H 0 : Jäännöstermit ovat normaalisia: ε t N(0, σ 2 ) kaikille t Testisuure ja sen jakauma (S K2 ) JB = n 6 Jos H 0 pätee, JB a χ 2 (2). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Huomautus: ˆ Testi reagoi voimakkaasti poikkeaviin havaintoihin, mutta ei ole muuten erityisen voimakas (ts. hyväksymisvirhe on suuri). ˆ Jäännöstermien ei-normaalisuus tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Durbinin ja Watsonin testi Durbinin ja Watsonin testillä tutkitaan ensimmäisen kertaluvun autokorrelaation olemassaoloa jäännöstermeissä. Testisuure perustuu estimoidun mallin residuaaleihin e t. Testisuureen kriittiset rajat löytyvät taulukoituina useista alan oppikirjoista. Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε t 1 ) = 0 kaikille t Testisuure ja sen jakauma DW = T (e t e t 1 ) 2 t=2 DW -testisuure ei noudata mitään yleistä jakaumaa, mutta testisuureen kriittiset rajat löytyvät taulukoituina useista alan oppikirjoista. DW -testisuure saa arvoja avoimelta väliltä 0 4, pienet arvot viittaavat positiiviseen autokorrelaatioon ja suuret puolestaan negatiiviseen autokorrelaatioon. Testisuureen normaaliarvo korreloimattomuusoletuksen pätiessä on luvun 2 lähellä. T t=1 e 2 t 5

12 Huomautuksia: ˆ Durbinin ja Watsonin testiä ei voi käyttää, jos mallissa on viivästetty selitettävä. Tällöin voidaan kuitenkin käyttää Durbinin h-testiä. ˆ Mallin selittäjien täytyy olla kiinteitä. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. Durbinin h-testi Durbinin h-testillä tutkitaan ensimmäisen kertaluvun autokorrelaation olemassaoloa jäännöstermeissä, kun estimoidussa mallissa on selittäjänä viivästetty selitettävä. Testisuure perustuu estimoidun mallin residuaaleihin e t. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βy t 1 + γx t + ε t e t = y t ŷ t Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε t 1 ) = 0 kaikille t Testisuure ja sen jakauma h = r 1 n 1 n Var( β) missä r 1 on ensimmäisen kertaluvun autokorrelaatiokertoimen estimaatti, n on havaintojen lukumäärä ja Var( β) on viivästetyn selitettävän regressiokertoimen varianssin harhaton estimaatti. Jos H 0 pätee, h a N(0, 1). Testisuureen nollasta merkitsevästi poikkeavat arvot viittaavat jäännöstermien autokorrelaatioon. 6

13 Huomautuksia: ˆ Durbinin h-testiä ei voi käyttää, jos n Var( β) 1, koska neliöjuuren sisällä olevasta lausekkeesta tulee tällöin negatiivinen. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Durbinin h-testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Lagrangen kertojatesti autokorrelaatiolle Jäännöstermien autokorreloituneisuutta voidaan tutkia Lagrangen kertojatestillä (Lagrange multiplier, LM), joka voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla. Apuregressiomallissa tutkittavan mallin residuaaleja selitetään alkuperäisillä selittäjillä sekä residuaalien astelukua p olevalla autoregressiolla. Apuregressiomallin suuri selitysaste viittaa jäännöstermien autokorrelaatioon. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βx t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e t = γ 0 + γ 1 x t + φ 1 e t 1 + φ 2 e t φ p e t p + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε s ) = 0 kaikille t s Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (p), missä n on residuaalien lukumäärä, R 2 on apuregressiomallin selitysaste ja p on autoregression asteluku. Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. 7

14 Huomautuksia: ˆ LM-testi jäännöstermin autokorrelaatiolle saattaa reagoida myös mallin väärään funktionaaliseen muotoon. ˆ Apuregression asteluvun p valinta vaikuttaa testin tulokseen: p pitää valita suureksi, mutta ei liian suureksi. ˆ Jäännöstermien korrelaatio tekee muista tässä käsiteltävistä testeistä vain suuntaa-antavia. ˆ Mallissa saa olla mukana myös viivästetty selitettävä. Boxin ja Piercen Q-testi jäännöstermien korreloimattomuudelle Jos malli on oikein määritelty, residuaalit muistuttavat valkoista kohinaa. Jäännöstermien korreloimattomuutta voidaan testata Boxin ja Piercen Q-testisuureella (esiintyy myös nimellä portmanteau-testi). Testisuureen suuret arvot viittaavat jäännöstermien autokorrelaatioon. Olkoot r 1, r 2,..., r k tutkittavan regressiomallin otosautokorrelaatiokertoimet. Testattava hypoteesi H 0 : Jäännöstermit eivät ole autokorreloituneita: Cor(ε t, ε s ) = 0 kaikille t s Testisuure ja sen jakauma Q K = n(r r r 2 K) missä K on yhteenlaskettavien autokorrelaatiokertoimien estimaattien lukumäärä ja n on havaintojen lukumäärä. Jos H 0 pätee, Q K a χ 2 (K). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Huomautuksia: ˆ Mallissa ei saa olla viivästettyä endogeenista muuttujaa. ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. 8

15 Lagrangen kertojatesti homoskedastisuudelle 1 Jäännöstermien homoskedastisuutta voidaan tutkia Lagrangen kertojatestillä (Lagrange multiplier, LM), joka voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla. Apuregressiomallissa selitetään tutkittavan mallin residuaalien neliöitä alkuperäisen mallin selittäjillä, selittäjien neliöillä sekä selittäjien ristitulolla. Ristitulotermejä ei ole käytetty tässä yhteydessä selittäjinä, jos alkuperäisessä mallissa on ollut yli 3 selittäjää. Apuregressiomallin korkea selitysaste viittaa siihen, että jäännöstermit ovat heteroskedastisia. Testi esiintyy kirjallisuudessa myös nimellä Whiten testi. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + β 1 x t + β 2 z t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e 2 t = γ 0 + γ 1 x t + γ 2 z t + γ 3 x 2 t + γ 4 z 2 t + γ 5 x t z t + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit ovat homoskedastisia: Var(ε t ) = σ 2 kaikille t Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (p), missä n on residuaalien lukumäärä, R 2 on apuregressiomallin selitysaste ja p on apuregression aitojen selittäjien lukumäärä (vakioselittäjä poisluettuna). Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. Huomautus: ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. 9

16 Lagrangen kertojatesti homoskedastisuudelle 2 Lagrangen kertojatesti (Lagrange multiplier, LM) jäännöstermien homoskedastisuudelle voidaan tehdä PNS-menetelmällä estimoidun apuregression avulla, jossa selitetään tutkittavan mallin residuaalien neliöitä mallin sovitteilla. Apuregressiomallin korkea selitysaste viittaa siihen, että jäännöstermit ovat heteroskedastisia. Olkoon tutkittava malli Estimoidun mallin residuaalit ovat y t = α + βx t + ε t e t = y t ŷ t Estimoidaan PNS-menetelmällä apuregressiomalli e 2 t = γ 0 + γ 1 ŷ t + δ t δ t on jäännöstermi Testattava hypoteesi H 0 : Jäännöstermit ovat homoskedastisia: Var(ε t ) = σ 2 kaikille t Testisuure ja sen jakauma nr 2 Jos H 0 pätee, nr 2 a χ 2 (1), missä n on residuaalien lukumäärä ja R 2 on apuregressiomallin selitysaste. Testisuureen suuret arvot viittaavat siihen, että H 0 ei päde. Joskus testisuureena käytetään apuregressiomallia testaavaa F -testisuuretta. Huomautus: ˆ Testi saattaa reagoida myös mallin väärään funktionaaliseen muotoon. Sarjat, selittäjät ja selitettävä Logaritmointi Mallin estimoinnissa on käytetty logaritmoituja selittäjiä sekä selitettävää. Tämä tekee suhteellisten muutosten tulkitsemisen helpommaksi. Esimerkiksi jos x 0 muuttuu p %, niin uusi arvo x 1 on 10

17 ja edelleen ( x 1 = 1 + p ) x ( log(x 1 ) = log(x 0 ) + log 1 + p ) log(x 0 ) + p Logaritmoinnin ansiosta reaalihintaindeksin sekä per capita kokonaiskulutusmenojen regressiokertoimet voidaan tulkita hinta- ja tulojoustona. Differenssien laskeminen Osa käsitellyistä regressiomalleista on nk. differenssimalleja, joissa selitetään muuttujien vuosimuutosta. Differenssioperaattorin merkkinä on käytetty D- kirjainta. Esimerkiksi muuttujan x t ensimmäinen differenssi on D x t = x t x t 1 Ensimmäisen differenssin tulkinta vastaa kahden peräkkäisen vuoden havaintojen muutosta tutkittavissa vuosisarjoissa. Aikasarjat Mallinrakennukseen on käytetty seuraavia aikasarjoja vuosilta : Vexp45 Kokonaiskulutusmenot käypällä hintatasolla [milj. mk] Qexp45 Kokonaiskulutusmenot kiinteällä vuoden 1975 hintatasolla [milj. mk] Popul Asukasluku V1c Alkoholin kulutusmenot käypällä hintatasolla [milj. mk] Q1c Alkoholin kulutusmenot kiinteällä vuoden 1975 hintatasolla [milj. mk] Lisäksi sarjoista on vuosilta havainnot, joita käytetään ennusteen ja toteutuneen kulutuksen vertailuun. Aikasarjat ovat liitteenä Excel-tiedostossa sarjat.xls. Aikasarjoista muodostettiin seuraavat apumuuttujat: V t Q t P t v t Per capita kokonaiskulutusmenot käypällä hintatasolla V t = 10 6 Vexp45/Popul [mk] Per capita kokonaiskulutusmenot kiinteällä vuoden 1975 hintatasolla Q t = 10 6 Qexp45/Popul [mk] Kokonaiskulutusmenojen implisiittinen deflaattori P t = 100 V t /Q t (1975 = 100) Per capita alkoholin kulutusmenot käypällä hintatasolla v t = 10 6 V1c/Popul [mk] 11

18 Kuva 1: Pistediagrammi alkoholin reaalihintaindeksin logaritmista log(100 p t /P t ) kokonaiskulutusmenojen logaritmia log(q t ) vastaan. q t p t Per capita alkoholin kulutusmenot kiinteällä vuoden 1975 hintatasolla q t = 10 6 Q1c/Popul [mk] Alkoholin implisiittinen hintaindeksi p t = 100 v t /q t (1975 = 100) 100 p t /P t Alkoholin reaalihintaindeksi 100 p t /P t (1975 = 100) Pistediagrammista näkyy, että alkoholin kulutusmenojen ja alkoholin reaalihintaindeksin välillä on heikko negatiivinen korrelaatio. Alkoholin kulutusmenoissa näkyy aikasarjakuvassa selvä nouseva trendi, kun taas alkoholin reaalihintaindeksi on pysynyt lähes vakiona. Sekä pistediagrammista että aikasarjakuvasta näkyy, että kokonaiskulutusmenojen ja alkoholin kulutusmenojen välillä on vahva positiivinen korrelaatio. Molemmissa sarjoissa näkyy selvä nouseva trendi. Edellä esitetyt pistediagrammit ja aikasarjat löytyvät tiedostosta pari_regr.xls. Tiedostossa on myös kuvia sarjoista. 1. malli Regressiomallin selitettävä (log-funktio on luonnollinen logaritmi): ˆ Per capita kiinteän hintatason alkoholin kulutusmenojen logaritmi log(q t ) Regressiomallissa käytettiin seuraavia selittäjiä: 12

19 Kuva 2: Aikasarja alkoholin kulutusmenojen logaritmista log(q t ) ja alkoholin reaalihintaindeksin logaritmista log(100 p t /P t ). Kuva 3: Pistediagrammi kokonaiskulutusmenojen logaritmista log(q t ) alkoholin kulutusmenojen logaritmia log(q t ) vastaan. 13

20 Kuva 4: Aikasarja alkoholin kulutusmenojen logaritmista log(q t ) ja kokonaiskulutusmenojen logaritmista log(q t ). ˆ Alkoholin reaalihintaindeksin logaritmi log(100 p t /P t ) ˆ Per capita kiinteän hintatason kokonaiskulutusmenojen logaritmi log(q t ) Estimoidaan PNS-menetelmällä regressiomalli, jossa selitetään alkoholin per capita kulutusmenojen logaritmia alkoholin reaalihintaindeksin logaritmilla sekä per capita kokonaiskulutusmenojen logaritmilla. Selitettävä ja selittäjät löytyvät Excel-taulukosta malli1_selittajat.xls. Logaritmoidun reaalihintaindeksin regressiokertoimen tulkinta vastaa pitkän aikavälin hintajoustoa. Hintatason nousu johtaa yleensä kysynnän laskuun, joten hintajousto on tyypillisesti negatiivinen. Logaritmoidun per capita kokonaiskulutusmenojen regressiokertoimen tulkinta vastaa pitkän aikavälin tulojoustoa. Tulotason nousu lisää tavallisesti kysyntää ellei kyseessä ole nk. inferiorinen hyödyke, jonka kysyntä vähentyy tulotason noustessa. Tulojousto on siis tyypillisesti positiivinen. Estimoitu malli ja tunnusluvut Estimoitu lineaarinen regressiomalli on seuraava (suluissa estimaattien keskihajonnat): log(q t ) = (2.352) (0.470) log(100 p t/p t ) (0.072) log(q t) R 2 =

21 Kuva 5: Kuva havainnoista ja sovitteista aikaa vastaan. Malli löytyy laskutoimituksineen Excel-tiedostosta malli1.xls. Mallin regressiokertoimet ovat merkitseviä vakioselittäjän kerroin pois lukien. Sekä pitkän aikavälin hintajousto 1.12 että tulojousto 1.51 ovat merkitseviä. Pitkän aikavälin hintajousto voidaan tulkita siten, että 1 %:n nousu alkoholin reaalihinnassa näkyy pitkällä aikavälillä 1.12 %:n laskuna alkoholin kulutusmenoissa muiden tekijöiden pysyessä ennallaan. Vastaavasti pitkän aikavälin tulojousto voidaan tulkita siten, että 1 %:n kasvu per capita kokonaiskulutusmenoissa näkyy 1.51 %:n kasvuna alkoholin kulutusmenoissa pitkällä aikavälillä muiden tekijöiden pysyessä ennallaan. Mallin selitysaste R 2 = on korkea. Graafinen tarkastelu Malli ei näytä sopivan havaintoihin kovin hyvin. Vaikka trendit asettuvat kohdalleen, mallin tuottamat sovitteet ovat systemaattisesti havaintoja pienempiä tai suurempia usean peräkkäisen vuoden ajan, joten malli ei ole hyvä. Malli ei kykene selittämään vuoden 1969 lainmuutoksen aiheuttamaa hyppäystä alkoholin kulutusmenoissa. Kuvassa katkoviiva kuvaa mallin avulla laskettua ennustetta. Residuaalit ovat ensin positiivisia vuosien ajan, tämän jälkeen negatiivisia vuosien ajan ja jälleen positiivisia vuosina Tämä viittaa voimakkaaseen positiiviseen ensimmäisen kertaluvun autokorrelaatioon. Itseisarvoltaan pieniä residuaaleja on vähän. Tämän antaa aihetta epäillä jäännöstermien homoskedastisuutta. Huomaa residuaalikuvassa tapahtuva muutos vuosien 1968 ja 1969 välillä (havainnot 19 ja 20). Katkoviivalla piirretty kiinteän hintatason ennuste poikkeaa selvästi havainnoista. Vuonna 1981 ennusteen ja toteutuneen kulutuksen erotus on 316 miljoonaa markkaa. Ennustevirhe on niin suuri, että mallin tuottamaa ennustetta ei voi pitää käyttökelpoisena. 15

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli

Lisätiedot

Aikasarja-analyysiä taloudellisilla aineistoilla

Aikasarja-analyysiä taloudellisilla aineistoilla Aikasarja-analyysiä taloudellisilla aineistoilla Leena Kalliovirta, Luonnonvarakeskus Leena.kalliovirta@luke.fi Kurssi Tilastotiede tutuksi HY matematiikan ja tilastotieteen laitos 1 Leena Kalliovirta

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa.

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa. KERTAUS Lukujono KERTAUSTEHTÄVIÄ K1. Ratkaisussa annetaan esimerkit mahdollisista säännöistä. a) Jatketaan lukujonoa: 2, 4, 6, 8, 10, 12, 14, 16, Rekursiivinen sääntö on, että lukujonon ensimmäinen jäsen

Lisätiedot

Jos Q = kysytty määrä, Q = kysytyn määrän muutos, P = hinta ja P = hinnan muutos, niin hintajousto on Q/Q P/P

Jos Q = kysytty määrä, Q = kysytyn määrän muutos, P = hinta ja P = hinnan muutos, niin hintajousto on Q/Q P/P Osa 5. Joustoista Kysynnän hintajousto (price elasticity of demand) mittaa, miten kysynnän määrä reagoi hinnan muutokseen = kysytyn määrän suhteellinen muutos jaettuna hinnan suhteellisella muutoksella

Lisätiedot

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen Tilastollisen analyysin perusteet Luento 5: Sisältö Tilastotieteessä tehdään usein oletuksia havaintojen jakaumasta. Useat tilastolliset menetelmät toimivat tehottomasti tai jopa virheellisesti, jos jakaumaoletukset

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Korrelaatiokertoinen määrittely 165

Korrelaatiokertoinen määrittely 165 kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

NELIÖJUURI. Neliöjuuren laskusääntöjä

NELIÖJUURI. Neliöjuuren laskusääntöjä NELIÖJUURI POLYNOMIFUNKTIOT JA -YHTÄLÖT, MAA2 Tarkoittaa positiivista tai nollaa Määritelmä, neliöjuuri: Luvun a R neliöjuuri, merkitään a, on se ei-negatiivinen luku, jonka neliö (eli toiseen potenssiin

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT imat-2.104 Tilastollisen analyysin perusteet / Tehtävät Aiheet: Avainsanat: Ysisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Koonaisesiarvo,

Lisätiedot

Yleinen lineaarinen malli

Yleinen lineaarinen malli MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: 1 Määritelmä ja standardioletukset 2

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Johdatus regressioanalyysiin

Johdatus regressioanalyysiin Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2007) 1 Johdatus regressioanalyysiin >> Regressioanalyysin lähtökohdat ja tavoitteet

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu

Lisätiedot

Alkoholijuomien hinnat ja kulutus

Alkoholijuomien hinnat ja kulutus Alkoholijuomien hinnat ja kulutus VILLE VEHKASALO Virosta tulee näillä näkymin EU:n jäsen vuoden 2004 vappuna. Tämän jälkeen kuka tahansa voi tuoda omaan käyttöönsä edullista alkoholia Virosta vaikka pakettiautolla.

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A Mat-2.090 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Estimointi, Havaittu frekvenssi, Heterogeenisuus,

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30. FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

KANSANTALOUSTIETEEN PÄÄSYKOE : Mallivastaukset

KANSANTALOUSTIETEEN PÄÄSYKOE : Mallivastaukset KANSANTALOUSTIETEEN PÄÄSYKOE.6.016: Mallivastaukset Sivunumerot mallivastauksissa viittaavat pääsykoekirjan [Matti Pohjola, Taloustieteen oppikirja, 014] sivuihin. (1) (a) Julkisten menojen kerroin (suljetun

Lisätiedot

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2005) 1 Johdatus regressioanalyysiin Regressioanalyysin lähtökohdat ja tavoitteet Deterministiset mallit ja regressioanalyysi

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Regressiomallin valinta TKK (c) Ilkka Mellin (2004) 1 Regressiomallin valinta Regressiomallin valinta: Johdanto Mallinvalintatestit Mallinvalintakriteerit Epälineaaristen riippuvuuksien

Lisätiedot

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1 Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (2004) 1 Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen Jakaumaoletuksien

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

Matematiikan tukikurssi, kurssikerta 3

Matematiikan tukikurssi, kurssikerta 3 Matematiikan tukikurssi, kurssikerta 3 1 Epäyhtälöitä Aivan aluksi lienee syytä esittää luvun itseisarvon määritelmä: { x kun x 0 x = x kun x < 0 Siispä esimerkiksi 10 = 10 ja 10 = 10. Seuraavaksi listaus

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 9 1 Implisiittinen derivointi Tarkastellaan nyt yhtälöä F(x, y) = c, jossa x ja y ovat muuttujia ja c on vakio Esimerkki tällaisesta yhtälöstä on x 2 y 5 + 5xy = 14

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

Instructor: hannele wallenius Course: Kansantaloustieteen perusteet 2016

Instructor: hannele wallenius Course: Kansantaloustieteen perusteet 2016 tudent: ate: Instructor: hannele wallenius Course: Kansantaloustieteen perusteet 016 Assignment: 016 www 1. Millä seuraavista tuotteista on itseisarvoltaan pienin kysynnän hintajousto? A. Viini B. Elokuvat

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Harha mallin arvioinnissa

Harha mallin arvioinnissa Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö

Lisätiedot

1 MATEMAATTISIA VÄLINEITÄ TALOUSELÄMÄN ONGELMIIN Algebran perusteita 8 Potenssit Juuret 15 Tuntematon ja muuttuja 20 Lausekkeen käsittely 24

1 MATEMAATTISIA VÄLINEITÄ TALOUSELÄMÄN ONGELMIIN Algebran perusteita 8 Potenssit Juuret 15 Tuntematon ja muuttuja 20 Lausekkeen käsittely 24 SISÄLTÖ 1 MATEMAATTISIA VÄLINEITÄ TALOUSELÄMÄN ONGELMIIN 7 1.1 Algebran perusteita 8 Potenssit Juuret 15 Tuntematon ja muuttuja 20 Lausekkeen käsittely 24 1.2 Yhtälöitä 29 Epäyhtälö 30 Yhtälöpari 32 Toisen

Lisätiedot

Normaalijakaumasta johdettuja jakaumia

Normaalijakaumasta johdettuja jakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2007) 1 Normaalijakaumasta johdettuja jakaumia >> Johdanto χ 2 -jakauma F-jakauma

Lisätiedot

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

STOKASTISET PROSESSIT

STOKASTISET PROSESSIT TEORIA STOKASTISET PROSESSIT Satunnaisuutta sisältävän tapahtumasarjan kulkua koskevaa havaintosarjaa sanotaan aikasarjaksi. Sana korostaa empiirisen, kokeellisesti havaitun tiedon luonnetta. Aikasarjan

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3 Mat-.9 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Verkot todennäköisyyslaskennassa Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut Kertymäfunktio, Momentit, Odotusarvo,

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli TKK (c) Ilkka Melli (2005) Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää

Lisätiedot

Sekalaiset tehtävät, 11. syyskuuta 2005, sivu 1 / 13. Tehtäviä

Sekalaiset tehtävät, 11. syyskuuta 2005, sivu 1 / 13. Tehtäviä Sekalaiset tehtävät, 11. syyskuuta 005, sivu 1 / 13 Tehtäviä Tehtävä 1. Johda toiseen asteen yhtälön ax + bx + c = 0, a 0 ratkaisukaava. Tehtävä. Määrittele joukon A R pienin yläraja sup A ja suurin alaraja

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Regressiodiagnostiikka TKK (c) Ilkka Mellin (2007) 1 Regressiodiagnostiikka >> Yleinen lineaarinen malli ja regressiodiagnostiikka

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko, Tehtävä 1 : 1 a) Olkoon G heikosti yhtenäinen suunnattu verkko, jossa on yhteensä n solmua. Määritelmän nojalla verkko G S on yhtenäinen, jolloin verkoksi T voidaan valita jokin verkon G S virittävä alipuu.

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 4 Jatkuvuus Jatkuvan funktion määritelmä Tarkastellaan funktiota f x) jossakin tietyssä pisteessä x 0. Tämä funktio on tässä pisteessä joko jatkuva tai epäjatkuva. Jatkuvuuden

Lisätiedot

S Laskennallinen Neurotiede

S Laskennallinen Neurotiede S-114.3812 Laskennallinen Neurotiede Laskuharjoitus 3 8.12.2006 Heikki Hyyti 60451P Tehtävä 2 Tehtävässä 2 piti tehdä 100 hermosolun assosiatiivinen Hopfield-muistiverkko. Verkko on rakennettu Matlab-ohjelmaan

Lisätiedot

Lohkoasetelmat. Heliövaara 1

Lohkoasetelmat. Heliövaara 1 Lohkoasetelmat Heliövaara 1 Kiusatekijä Kaikissa kokeissa, kokeen tuloksiin voi vaikuttaa vaihtelu joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla mahdollisesti on vaikutusta vastemuuttujan arvoon,

Lisätiedot

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat. MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016 Antti Rasila

Lisätiedot

Skenaariot suurpetokantojen verotuksen suunnittelussa

Skenaariot suurpetokantojen verotuksen suunnittelussa Skenaariot suurpetokantojen verotuksen suunnittelussa Katja Holmala Riistapäivät 19.1.2016 Esityksen rakenne Tausta Mallit ilveksen populaatiokehityksestä Malli 1: populaatiomalli Malli 2: skenaario- eli

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiomallin valinta. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiomallin valinta. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Regressiomallin valinta TKK (c) Ilkka Mellin (2007) 1 Regressiomallin valinta >> Regressiomallin valinta: Johdanto Mallinvalintatestit

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

4.0.2 Kuinka hyvä ennuste on?

4.0.2 Kuinka hyvä ennuste on? Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki

Lisätiedot

2 Osittaisderivaattojen sovelluksia

2 Osittaisderivaattojen sovelluksia 2 Osittaisderivaattojen sovelluksia 2.1 Ääriarvot Yhden muuttujan funktiolla f(x) on lokaali maksimiarvo (lokaali minimiarvo) pisteessä a, jos f(x) f(a) (f(x) f(a)) kaikilla x:n arvoilla riittävän lähellä

Lisätiedot

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos: 8 Kanta Tässä luvussa tarkastellaan aliavaruuden virittäjävektoreita, jotka muodostavat lineaarisesti riippumattoman jonon. Merkintöjen helpottamiseksi oletetaan luvussa koko ajan, että W on vektoreiden

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet Tilastotieteen jatkokurssi Sosiaalitieteiden laitos Harjoitus 5 (viikko 9) Ratkaisuehdotuksia (Laura Tuohilampi). Jatkoa HT 4.5:teen. Määrää E(X) ja D (X). E(X) = 5X p i x i =0.8 0+0.39 +0.4 +0.4 3+0.04

Lisätiedot

9. laskuharjoituskierros, vko 12-13, ratkaisut

9. laskuharjoituskierros, vko 12-13, ratkaisut 9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t

Lisätiedot

LAUSEKKEET JA NIIDEN MUUNTAMINEN

LAUSEKKEET JA NIIDEN MUUNTAMINEN LAUSEKKEET JA NIIDEN MUUNTAMINEN 1 LUKULAUSEKKEITA Ratkaise seuraava tehtävä: Retkeilijät ajoivat kahden tunnin ajan polkupyörällä maantietä pitkin 16 km/h nopeudella, ja sitten vielä kävelivät metsäpolkua

Lisätiedot

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Kuusinen/Heliövaara 1 Lohkoasetelmat Kuusinen/Heliövaara 1 Kiusatekijä Kaikissa kokeissa kokeen tuloksiin voi vaikuttaa vaihtelu, joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla on mahdollisesti vaikutusta vastemuuttujan

Lisätiedot

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien

Lisätiedot

Determinantti. Määritelmä

Determinantti. Määritelmä Determinantti Määritelmä Oletetaan, että A on n n-neliömatriisi Merkitään normaaliin tapaan matriisin A alkioita lyhyesti a ij = A(i, j) (a) Jos n = 1, niin det(a) = a 11 (b) Muussa tapauksessa n det(a)

Lisätiedot

Yhtälönratkaisusta. Johanna Rämö, Helsingin yliopisto. 22. syyskuuta 2014

Yhtälönratkaisusta. Johanna Rämö, Helsingin yliopisto. 22. syyskuuta 2014 Yhtälönratkaisusta Johanna Rämö, Helsingin yliopisto 22. syyskuuta 2014 Yhtälönratkaisu on koulusta tuttua, mutta usein sitä tehdään mekaanisesti sen kummempia ajattelematta. Jotta pystytään ratkaisemaan

Lisätiedot

Tämän luvun tarkoituksena on antaa perustaidot kompleksiluvuilla laskemiseen sekä niiden geometriseen tulkintaan. { (a, b) a, b œ R }

Tämän luvun tarkoituksena on antaa perustaidot kompleksiluvuilla laskemiseen sekä niiden geometriseen tulkintaan. { (a, b) a, b œ R } 7 Kompleksiluvut Tämän luvun tarkoituksena on antaa perustaidot kompleksiluvuilla laskemiseen sekä niiden geometriseen tulkintaan. 7.1 Kompleksilukujen määritelmä Määritelmä 7.1.1. Kompleksilukujen joukko

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot