MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017
Aikataulu ja suoritustapa (Katso MyCourses) Luennot 24h, 30.10. 5.12.2017 () maanantaisin sali C (y205) ja keskiviikkoisin sali D (y122) 12:15-14:00 (viimeinen luento ti 5.12. sali D) Harjoitukset 24h, 30.10. 8.12.2017 Teoria (Marko Voutilainen): maanantaisin 14:15-16:00 (M1 ja U8), ATK (Sami Helander): ryhmä 1 to 12:15-14:00 (U344) ryhmä 2 to 14:15-16:00 (U344) ryhmä 3 pe 12:15-14:00 (U344) Kotitehtävät: 1-2 teoria- ja 1-2 tietokonetehtävää viikoittain Tentti 5 tehtävää, joista yhden voi korvata kotitehtäväpisteillä Harjoituksista maksimi on 6 pistettä yhteensä. Läsnäolosta (teoria tai ATK) saa 1.5-pistettä ja tehdyistä kotitehtävistä (teoria tai ATK) 1.5-pistettä. Tenttitehtävistä maksimi on 6 pistettä / tehtävä. Mukana saa olla A4-kokoinen muistilappu ja laskin
Esitiedot Stokastiikka Moniulotteiset jakaumat ja niiden tunnusluvut: Odotusarvo, varianssi, kovarianssi, korrelaatio Tilastollinen testaus Hypoteesi, testisuure, p-arvo, tulkinta Estimointi Estimaattori, estimaatti Estimaattorin harhattomuus, tehokkuus, tarkentuvuus Matriisilaskentaa, sarjoja
Harjoituksissa käytetään R-ohjelmointia Ilmainen avoimen lähdekoodin ohjelmisto tilastoanalyysiin Suosio vahvassa kasvussa sekä akateemisessa tutkimuksessa että yrityksissä.
Harjoituksissa käytetään R-ohjelmointia
Sisältö Viikko 1 Yleinen lineaarinen malli. Viikko 2 Regressiodiagnostiikka ja regressiomallin valinta. Viikko 3 Stationaariset stokastiset prosessit ja ARMA-malli. Viikko 4 ARMA-mallin ominaisuudet sekä rakentaminen. Viikko 5 Ennustaminen ARMA malleilla ja Kalmanin suodatin. Viikko 6 Dynaamiset regressiomallit, vierailijaluento sekä kertausta.
Osaamistavoitteet Kurssin suoritettuaan osallistuja tuntee yleiseen lineaariseen regressiomalliin, dynaamisen regressiomalliin sekä ARIMA-malleihin liittyvää teoriaa. osaa analysoida ja ennustaa aikasarjoja yllä mainittujen mallien avulla. osaa suorittaa regressiodiagnostiikkaa testatakseen mallin sopivuutta.
Työmäärä toteutustavoittain Valtaosa kurssin työmäärästä muodostuu itsenäisestä opiskelusta. Luennot - kontaktiopetus (6 x 4) 24 h Luennot - itsenäinen työskentely (6 x 3) 18 h Laskuharjoitukset - kontaktiopetus (6 x 2) 12 h Laskuharjoitukset - itsenäinen työskentely (6 x 4) 24 h Tietokoneharjoitukset - kontaktiopetus (6 x 2) 12 h Tietokoneharjoitukset - itsenäinen työskentely (6 x 4) 24 h Tenttiin valmistautuminen 18 h Tentti 3 h Yht 135 h 1 op vastaa 27 h kokonaistyöskentelyä -> 5 op on 135 h työtä.
Aikasarja-analyysin sovelluskohteita Kansanterveyden tutkimus Rahoitusriskien hallinta Talouspolitiikan päätöksenteko Tuotannon suunnittelu
Syövän yleisyys Lähde: http://www.cancer.fi/syoparekisteri/tilastot/grafiikkaasyovan-yleisyydesta (19.10.2015)
Tenor basis vs cross currency basis Swap spread (bp) 100 50 0 50 2007 2008 2009 2010 2011 2012 2013 Date
Ennustaminen Ennustaminen on erittäin vaikeaa Mikään malli ei kuvaa todellisuutta täydellisesti Oikein valittu malli auttaa tulevaisuutta koskevien päätösten tekemisessä, mutta ennustamiseen liittyy aina paljon epävarmuutta Malli valitaan aineiston ja kontekstitietämyksen perusteella
Eri mallien ominaisuudet on tunnettava, että kuhunkin tilanteeseen sopivan mallin valitseminen onnistuu. Tällä kurssilla käsitellään perusmalleja yleisessä muodossa, mutta käytännön tilanteissa käytetään usein tarkoitukseen sopiviksi muokattuja tai niitä varten kehitettyjä malleja.
Esityksessä käytetyt kuvat http://www.cancer.fi/syoparekisteri/tilastot/grafiikkaa-syovanyleisyydesta
Kirjallisuutta: 1. Brockwell / Davis (1991), Time Series: Theory and Methods 2. Hamilton (1994), Time Series Analysis 3. Harvey, A.C. (1993), Time Series Models. Philip Allan. 4. Tsay (2014), Multivariate Time Series Analysis with R and financial applications