Stationaariset stokastiset prosessit ja ARMA-mallit

Samankaltaiset tiedostot
ARMA mallien ominaisuudet ja rakentaminen

Ilkka Mellin Aikasarja-analyysi Stationaariset stokastiset prosessit

Dynaamiset regressiomallit

ARMA mallien ominaisuudet ja rakentaminen

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

Ilkka Mellin Aikasarja-analyysi ARMA-mallit

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä

3. Teoriaharjoitukset

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari

6.5.2 Tapering-menetelmä

MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä

6.2.3 Spektrikertymäfunktio

Vastaavasti voidaan määritellä korkeamman kertaluvun autoregressiiviset prosessit.

Ennustaminen ARMA malleilla ja Kalmanin suodin

STOKASTISET PROSESSIT

ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalle

4.0.2 Kuinka hyvä ennuste on?

Dynaamiset regressiomallit

Ilkka Mellin Aikasarja-analyysi Aikasarjat

Ilkka Mellin Aikasarja-analyysi. Dynaamiset regressiomallit. TKK (c) Ilkka Mellin (2006) 1

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

6.1 Autokovarianssifunktion karakterisaatio aikatasossa

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Signaalimallit: sisältö

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Regressioanalyysi. Kuusinen/Heliövaara 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

9. Tila-avaruusmallit

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

3. Tietokoneharjoitukset

Regressioanalyysi. Vilkkumaa / Kuusinen 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

ARMA mallien rakentaminen, Kalmanin suodatin

Väliestimointi (jatkoa) Heliövaara 1

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

Harjoitus 2: Matlab - Statistical Toolbox

Tilastotieteen aihehakemisto

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Osa 2: Otokset, otosjakaumat ja estimointi

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Tilastollinen aineisto Luottamusväli

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

805306A Johdatus monimuuttujamenetelmiin, 5 op

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus. Intelin osakekurssi. (Pörssi-) päivä n = 20 Intel_Volume. Auringonpilkkujen määrä

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

4. Tietokoneharjoitukset

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastomatematiikka Kevät 2008

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

4. Tietokoneharjoitukset

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Johdatus regressioanalyysiin

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

30A02000 Tilastotieteen perusteet

TEKNILLINEN KORKEAKOULU Systeemianalyysin laboratorio. Mat Systeemien Identifiointi. 4. harjoitus

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Aikasarjamallit. Pekka Hjelt

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus regressioanalyysiin. Heliövaara 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Nämä ovat siis minimivaatimukset, enemmänkin saa ja suositellaan

Auringonpilkkujen jaksollisuus

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

11 Raja-arvolauseita ja approksimaatioita

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Transkriptio:

Stationaariset stokastiset prosessit ja ARMA-mallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015

Johdanto Pystyäksemme mallintamaan hankalasti käyttäytyviä reaalimailman aikasarjoja... Swap spread (bp) 100 50 0 50 2007 2008 2009 2010 2011 2012 2013 Date

Johdanto...meidän on tunnettava nätisti käyttäytyviä teoreettisia stokastisia prosesseja ja niiden ominaisuuksia. x 1 0 1 2 3 0 200 400 600 800 1000 t

x 6 0 6 0 200 400 600 800 1000 t x 10 10 0 200 400 600 800 1000 t

Viikko 3: Stationaariset stokastiset prosessit ja ARMA-mallit 1 Stationaariset stokastiset prosessit 1 Määritelmä 2 Autokorrelaatiofunktio 3 Osittaisautokorrelaatiofunktio 4 Viive- ja differenssioperaattorit 5 Integroituvuus eli differenssistationaarisuus 6 Spektri 2 ARMA-mallit 1 Puhtaasti stokastinen prosessi 2 Erilaiset SARMA mallit

Sisältö 1 Stationaariset stokastiset prosessit 2 ARMA-mallit

Stokastiset prosessit Stokastinen prosessi (x t ) t T on satunnaismuuttujien x t, t T järjestetty jono, jossa aikaindeksi t T määrää satunnaismuuttujien x t järjestyksen jonossa Satunnaismuuttujien x t yhteisjakauma määrää täysin stokastisen prosessin käyttäytymisen. Käsittelemme diskreettiaikaisia (diskreettejä) stokastisia prosesseja, missä aikaindeksit ovat kokonaislukuja, eli T Z := {..., 2, 1, 0, 1, 2,...}. Jatkuva-aikaisten stokastisten prosessien (esim T = positiiviset reaaliluvut) emme tässä juurikaan tarvitse.

Aikasarja stokastisena prosessina Havaittu aikasarja tulkitaan tilastollisessa aikasarja-analyysissa aina jonkin stokastisen prosessin realisaatioksi. Vrt. Tilastotieteessä havainnot tulkitaan satunnaismuuttujien realisaatioksi ja satunnaismuuttujien jakauma on tilastollinen malli. Aikasarja-analyysin tehtävät: (i) Tunnistaa aikasarja-aineistoon sopiva stokastinen prosessi. (ii) Estimoida aikasarjan mallintamiseen käytettävän prosessin parametrit ja testata parametreja koskevia hypoteeseja. (iii) Konstruoida ennusteita prosessin (aikasarjan) tulevalle käyttäytymiselle.

Stokastista prosessia kuvaavat tunnusluvut Stokastista prosessia voidaan kuvailla siihen kuuluvien satunnaismuuttujien x t, t T tunnusluvuilla: Odotusarvo: E[x t ] = µ t, t T Varianssi: var(x t ) = E[(x t µ t ) 2 ] = D 2 (x t ) = σ 2 t, t T Kovarianssi cov(x t, x s ) = E[(x t µ t )(x s µ s )] = γ ts, t, s T.

Stokastisen prosessin stationaarisuus Stokastinen prosessi (x t ) t T on stationaarinen jos: (I) Odotusarvo ei riipu ajasta: E(x t ) = µ, kaikilla t T (II) Varianssi on äärellinen, eikä riipu ajasta: var(x t ) = σ 2 <, kaikilla t T (III) Satunnaismuuttujien x t ja x s välinen kovarianssi ei riipu ajanhetkistä, vaan ainoastaan aikojen t ja s erotuksesta: cov(x t, x s ) = γ t s, kaikilla t, s T Ylläolevasta käytetään myös nimitystä heikosti stationaarinen prosessi, mutta tällä kurssilla sitä kutsutaan stationaariseksi. Prosessi (x t ) t T on vahvasti stationaarinen, jos satunnaismuuttujat x t ovat samoin jakautuneita.

Stationaaristen stokastisten prosessien ominaisuudet Stationaarisen prosessin (x t ) t T määritelmästä seuraa, että sen realisaatiossa ei saa näkyä 1 Trendiä 2 Varianssin (systemaattista) vaihtelua 3 Determinististä kausivaihtelua 4 Sisäisen riippuvuusrakenteen, kuten rytmin (systemaattista) vaihtelua.

Stationaariset stokastiset prosessit aikasarjojen malleina Vaikka stationaarisuuden ehdot ovat rajoittavia, niin stationaariset prosessit muodostavat erittäin käyttökelpoisen malliluokan aikasarjoille: Jotkut käytännössä kohdattavat aikasarjat ovat stationaarisia ja monia epästationaarisia aikasarjoja voidaan mallintaa prosesseilla, jotka voidaan stationarisoida yksinkertaisin matemaattisin operaatioin (differentointi, logaritmointi) Stationaaristen stokastisten prosessien teoreettiset ominaisuudet tunnetaan hyvin estimointi- ja testiteoria on hyvin strukturoitu ja (suhteellisen) helposti sovellettavissa. Stationaarisille aikasarjoille on onnistuttu kehittämään järjestelmällisiä mallinrakennusmenetelmiä

Autokovarianssi: Määritelmä Stationaarisen stokastisen prosessin k. autokovarianssi, k = 0, 1,..., K on γ k := γ t (t k) = cov(x t, x t k ) = E[(x t µ)(x t k µ)], t T. Erityisesti γ 0 = var(x t ) = σ 2, t T. Stationaarisen prosessin (x t ) t T autokovarianssifunktio on autokovarianssien on funktio, γ : Z R, γ(k) = γ k kaikilla k Z. Myös epästationaariselle prosessille voidaan määritellä autokovarianssifunktio (kts. esim. Brockwell, Davis (1991)).

Autokorrelaatio: Määritelmä Stationaarisen stok. prosessin k. autokorrelaatiokerroin: ρ k = γ k γ 0, k Z. Autokorrelaatiokerroin ρ k mittaa stationaarisen stokastisen prosessin (x t ) t T aikavälin k päässä toisistaan olevien satunnaismuuttujien x t ja x t k lineaarisen riippuvuuden voimakkuutta: (i) ρ 0 = 1 (ii) ρ k = ρ k kaikille k Z (iii) ρ k 1 kaikille k Z. Autokorrelaatiofunktio (akf) on funktio ρ : Z [ 1, 1], ρ(k) = ρ k, kaikilla k Z.

Osittaisautokorrelaatio: Määritelmä Stationaarisen prosessin k. osittaisautokorrelaatiokerroin: φ k = cor ( ) x t, x t k x t 1,..., x t k+1, t T, k Z Ei määritelty epästationaarisille prosesseille, ei riipu t:stä. On satunnaismuuttujien x t ja x t k ehdollinen korrelaatio, kun ehtomuuttujina ovat ajanhetkien t ja t k väliin jäävät satunnaismuuttujat x t 1,..., x t k+1 Mittaa satunnaismuuttujien x t ja x t k korrelaatiota, kun korrelaatiosta on eliminoitu satunnaismuuttujien x t 1,..., x t k+1 vaikutus (i) φ 0 = 1 (ii) φ k = φ k kaikilla k Z (iii) φ k 1 kaikilla k Z. Osittaisautokorrelaatiofunktio (oakf) on φ : Z [ 1, 1], φ(k) = φ k, kaikilla k Z.

Auto- ja osittaisautokorrelaatiokertoimien yhteys: Yulen ja Walkerin yhtälöt 1 ρ 1 ρ 2 ρ k 1 ρ 1 1 ρ 1 ρ k 2 ρ 2 ρ 1 1 ρ k 3....... ρ k 1 ρ k 2 ρ k 3 1 α k1 α k2 α k3. α kk ρ 1 ρ 2 = ρ 3,. missä ρ k on k. autokorrelaatiokerroin. k. osittaisautokorrelaatiokerroin φ k saadaan kertoimen α kk ratkaisuna k. yhtälöstä: Erityisesti φ k = α kk. φ 2 = α 22 = ρ 2 ρ 2 1 1 ρ 2. 1 ρ k

Viive ja differenssi: Määritelmät Olkoon x t, t T diskreetti stokastinen prosessi. Viiveoperaattori L: Lx t = x t 1 Differenssioperaattori D: Dx t = x t x t 1 Huom Differenssioperaattori D voidaan määritellä viive-operaattorin L avulla myös kaavalla D = 1 L, koska Dx t = (1 L)x t = x t Lx t = x t x t 1.

Korkeammat viipeet ja differenssit, Kausidifferenssi p. viive: L p x t = x t p, missä L p = LL L (p kpl): L p x t = L p 1 Lx t = L p 1 x t 1. p. differenssi: D p x t = (1 L) p x t, missä D p = DD D (p kpl). p. differenssille pätee D p x t = (1 L) p x t = p ( p ( 1) i i i=0 Kausidifferenssi määritellään asettamalla: jossa s on kauden pituus. Siten D s = 1 L s ) x t i. D s x t = (1 L s )x t = x t L s x t = x t x t s

Esimerkki: 2. differenssi Satunnaismuuttujan x t toinen differenssi voidaan laskea seuraavasti: Tapa 1: D 2 x t = DDx t = D(x t x t 1 ) = Dx t Dx t 1 = x t x t 1 (x t 1 x t 2 ) = x t 2x t 1 + x t 2 Tapa 2: D 2 x t = (1 L) 2 x t = ( 1 2L + L 2) x t = x t 2Lx t + L 2 x t = x t 2x t 1 + x t 2

Integroituvuus ja kausi-integroituvuus Määritelmä Diskreetti stokastinen prosessi x t, t T on integroituva eli differenssistationaarinen astetta p, jos D q x t on epästationaarinen kaikille q = 0, 1, 2,..., p 1, mutta D p x t on stationaarinen. kausi-integroituva eli differenssistationaarinen astetta p kauden pituuden s suhteen, jos D q s x t on epästationaarinen kaikille q = 0, 1, 2,..., p 1, mutta D p s x t on stationaarinen.

Trendi ja kausivaihtelu Jos stokastisen prosessin realisaatiossa nähdään sekä trendi että kausivaihtelua, saattaa stationaarisuuden saavuttamiseksi olla aiheellista tehdä sekä differensointi että kausidifferensointi. Esimerkki Jos kauden pituus s = 12 (kuukausiaikasarja), stationaarisuuden saavuttamiseksi joudutaan usein soveltamaan differentointia D 12 Dx t = DD 12 x t = (1 L)(1 L 12 )x t = ( 1 L L 12 + L 13) x t = x t x t 1 ( x t 12 x t 13 ).

Stationaarisen stokastisen prosessin spektri Jos aikasarjan analyysi perustuu korrelaatiofunktioiden tarkasteluun, sanomme, että analyysi tapahtuu aika-alueessa. Stationaarisia stokastisia prosesseja on kuitenkin usein syytä tarkastella myös ns. taajuus- eli frekvenssialueessa Taajuusalueessa stationaarista stokastisia prosesseja analysoidaan prosessin spektrin f (λ) avulla. Taajuusalueen tarkasteluja voidaan käyttää paljastamaan prosesseissa esiintyvät sykliset komponentit. Stationaarisen stokastisen prosessin autokovarianssi-funktio γ k ja spektri f (λ) sisältävät täsmälleen saman informaation.

Stationaarisen prosessin spektritiheysfunktio f (λ) on f (λ) = 1 ( ) γ 0 + 2 γ k cos(λk), λ [0, π], 2π k=1 missä γ k on prosessin k. autokovarianssi. λ: frekvenssi eli taajuus 2π/λ : aallonpituus (tai periodi, jakso) λ/2π : syklien lukumäärä aikayksikköä kohde Fakta γ k = π π π f (λ) cos(λk)dλ = 2 f (λ) cos(λk)dλ, 0 kaikilla kaikilla k = 0, 1, 2,... Erityisesti var(x t ) = γ 0 = 2 π 0 f (λ)dλ Tulkinta: Suure f (λ)dλ edustaa sellaisten syklisten komponenttien kontribuutiota prosessin varianssiin, joiden taajuus on (infinitesimaalisella) välillä [λ, dλ].

Stationaaristen stokastisten prosessien spektri: Aliasing f (λ) = 1 ( γ 0 + 2 2π k=1 ) γ k cos(λk), λ [0, π], Nähdään, että frekvenssejä λ ja λ ja frekvenssejä λ ja λ ± 2sπ, s = 1, 2,... ei voida erottaa toisistaan. Tämän ilmiön englanninkielisenä nimenä on aliasing. Riittää, että spektritiheysfunktiota tarkastellaan välillä [0, π]. Esim. Elokuvissa pyörät näyttävät pyörivän todellista nopeuttaan hitaammin ja jopa taaksepäin. Filmattaessa pyörimisliikkeestä poimitaan (ajassa otannalla) 24 havaintoa (kuvaa) sekunnissa. Samat havainnot olisi voitu saada todellista pyörimisnopeuttaan hitaammin tai jopa taakse päin pyörivästä pyörästä.

Stationaaristen stokastisten prosessien spektri: Nyquist-frekvenssi Frekvenssi λ = π on nimeltään Nyquist-frekvenssi. Syklisiä liikkeitä, joiden taajuus on Nyquist-frekvenssiä π suurempi ei voida erottaa sellaisista syklisistä liikkeistä, joiden taajuus on välillä [0, π]. Siten Nyquist-frekvenssiä λ = π vastaava periodi eli aallonpituus 2π/π = 2 on lyhin periodi, joka voidaan havaita. Seuraus: Syklisen liikkeen luonteesta ei voida saada kuvaa, ellei havaintoja kerätä vähintään 2 havaintoa/sykli. Esimerkki: Ilman lämpötilan vaihteluita vuorokauden sisällä ei voida ymmärtää, ellei lämpötilaa mitata vähintään 2 kertaa/vrk.

Stationaaristen stokastisten prosessien spektri ja sykliset komponentit Voidaan osoittaa, että syklinen komponentti, jonka periodi on s, näkyy stationaarisen stokastisen prosessin spektrissä huippuina perustaajuuden λ s = 2π/s lisäksi myös harmonisilla frekvensseillä kλ s, k = 1, 2,..., s/2, missä s 2 = max{m Z m s/2}, eli suurin kokonaisluku, joka on enintään s/2. Esimerkki Jos s = 4 (neljännesvuosiaikasarja) perustaajuutena on λ 4 = π/2 ja harmonisia frekvenssejä on vain yksi: taajuudella π Jos s = 12 (kuukausiaikasarja) perustaajuutena on λ 12 = π/6 ja harmoniset frekvenssit ovat 2π/6, 3π/6, 4π/6, 5π/6 ja π

Sisältö 1 Stationaariset stokastiset prosessit 2 ARMA-mallit

Aikasarjojen mallintaminen ARMA-prosesseina ARMA-prosessit muodostavat aikasarja-analyysin soveltamisen kannalta keskeisen stationaaristen stokastisten prosessien luokan: AR-malli = Autoregressiivinen malli (Autoregressive Model) MA-malli = Liukuvan keskiarvon malli (Moving Average Model) ARMA-malli = Autoregressiivinen liukuvan keskiarvon malli (Autoregressive Moving Average Model) SAR-malli = Kausivaihtelu-AR-malli (Seasonal AR-model) SMA-malli = Kausivaihtelu-MA-malli (Seasonal MA-model) SARMA-malli = Kausivaihtelu-ARMA-malli (Seasonal ARMA-model) ARIMA-malli = Integroitu ARMA-malli (Integrated ARMA-model) SARIMA-malli = Integroitu kausivaihtelu-arma-malli (Integrated Seasonal ARMA-model)

Puhtaasti satunnainen stokastinen prosessi Diskreetti stokastinen prosessi (ɛ t ) t T on puhtaasti satunnainen, jos (i) E[ɛ t ] = µ, t T (ii) var(ɛ t ) = σ 2, t T (iii) cov(ɛ t, ɛ s ) = 0, t s Jos puhtaasti satunnaisen prosessin odotusarvo µ = 0, niin sitä sanotaan valkoiseksi kohinaksi (White noise), (ɛ t ) t T WN(0, σ 2 ). Jos valkoisen kohinan satunnaismuuttujat ɛ t ja ɛ s, kaikilla s t ovat lisäksi riippumattomia ja samoin jakautuneita, niin merkitään (ɛ t ) t T IID(0, σ 2 )

AR(p)-malli Autoregressiivinen prosessi astetta p: x t = φ 1 x t 1 + φ 2 x t 2 +...φ p x t p + ɛ t, (ɛ t ) t T WN(0, σ 2 ). Nimi autoregressiivinen, koska se riippuu omista arvoistaan aiemmilla ajanhetkillä ja on muodoltaan samanlainen kuin lineaarinen regressiomalli: y = β 0 + β 1 x 1 + β 2 x 2 +... + β p x p + ɛ jossa Selitettävä on x t ja selittäjät x t 1, x t 2,..., x t p. Regressiokertoimet: β 0 = 0 ja β i = φ i, i = 1,..., p. Jäännöstermi on ɛ t. Esimerkki AR(1)-prosessi: x t = φ 1 x t 1 + ɛ t, (ɛ t ) t T WN(0, σ 2 )

Valkoinen kohina vs AR(1) WN 2 0 1 2 0 50 100 150 200 Time AR(1) 6 2 2 6 0 50 100 150 200 Time

MA(q)-malli Liukuvan keskiarvon prosessi astetta q. x t = ɛ t + θ 1 ɛ t 1 + θ 2 ɛ t 2 +... + θ q ɛ t q, (ɛ t ) t T WN(0, σ 2 ) Prosessin arvo riippuu valkoisen kohinan arvoista ajanhetkillä t q,..., t: se on satunnaismuuttujien ɛ t q,..., ɛ t painotettu summa Esimerkki MA(1)-prosessi: x t = ɛ t + θ 1 ɛ t 1, (ɛ t ) t T WN(0, σ 2 )

Valkoinen kohina vs MA(1) WN 2 0 1 2 0 50 100 150 200 Time MA(1) 4 0 2 4 0 50 100 150 200 Time

ARMA(p, q)-malli Autoregressiivinen liukuvan keskiarvon prosessi, jonka AR-osan aste on p ja MA-osan aste on q: x t φ 1 x t 1 φ 2 x t 2... φ p x t p = ɛ t +θ 1 ɛ t 1 +θ 2 ɛ t 2 +...+θ q ɛ t q, missä (ɛ t ) t T WN(0, σ 2 ). x t riippuu sekä satunnaismuuttujien x t 1,.., x t q että ɛ 1,..., ɛ t q painotetuista summista. Esimerkki ARMA(1,1): x t φ 1 x t 1 = ɛ t + θ 1 ɛ t 1 x t = φ 1 x t 1 + θ 1 ɛ t 1 + ɛ t ARMA(p, q)-mallia sanotaan usein sekamalliksi, kun AR(p) ja MA(q) sanotaan puhtaiksi malleiksi.

Valkoinen kohina vs ARMA(1,1) WN 2 0 1 2 0 50 100 150 200 Time MA(1) 5 0 5 10 0 50 100 150 200 Time

SAR(P) s -malli ja SMA(Q) s -malli Kausivaihtelu-AR-prosessi astetta P, jossa kauden pituus on s: x t = Φ 1 x t s +Φ 2 x t 2s +...+Φ P x t Ps +ɛ t, (ɛ t ) t T WN(0, σ 2 ). Kausivaihtelu-MA-prosessi astetta Q, jossa kauden pituus on s: x t = ɛ t +Θ 1 ɛ t s +Θ 2 ɛ t 2s +...+Θ Q ɛ t Qs, (ɛ t ) t T WN(0, σ 2 ). Esimerkki SAR(2) 12 -prosessi: SAR(1) 6 -prosessi: x t = Φ 1 x t 12 + Φ 2 x t 24 + ɛ t x t = ɛ t + Θ 1 ɛ t 6

Valkoinen kohina vs SAR(2) 12 WN 2 0 1 2 0 50 100 150 200 Time SAR(2) 12 4 0 4 0 12 36 50 60 84 100108 132 150 168 200 Time

Valkoinen kohina vs SMA(1) 6 WN 2 0 1 2 0 50 100 150 200 Time SMA(2) 6 3 0 2 0 6 18 36 5054 72 90100108 126 150 156 174 19200 Time

SARMA(P, Q) s -malli Kausivaihtelu-ARMA-prosessi, jossa kauden pituus on s, kausi-ar-osa on astetta P ja kausi-ma-osa on astetta Q: x t Φ 1 x t s... Φ P x t Ps = ɛ t + Θ 1 ɛ t s +... + Θ Q ɛ t Qs, missä (ɛ t ) t T WN(0, σ 2 ). Esimerkki SARMA(2,1) 4 : x t Φ 1 x t 4 Φ 2 x t 8 = ɛ t + Θ 1 ɛ t 4 x t = Φ 1 x t 4 + Φ 2 x t 8 + Θ 1 ɛ t 4 + ɛ t Entä jos on AR ja kausi AR-osat sekä MA ja kausi-ma osat? Tarvitaan viiveoperaattorin polynomeja, jotta merkinnät mahtuu kalvoille.

Viivepolynomit: Määritelmä Viivepolynomi astetta r on: δ r (L) = 1 + δ 1 L + δ 2 L 2 +... + δ r L r. Operaattorin L lineaarisuudesta seuraa, että Esimerkki δ r (L)x t = ( 1 + δ 1 L + δ 2 L 2 +... + δ r L r ) x t = x t + δ 1 Lx t + δ 2 L 2 x t +... + δ r L r x t = x t + δ 1 x t 1 + δ 2 x t 2 +... + δ r x t r. Jos φ(l) := 1 φ 1 L ja Φ(L) := 1 Φ 1 L 12, niin φ(l)φ(l)x t = ( 1 φ 1 L )( 1 Φ 1 L 12) = ( 1 φ 1 L Φ 1 L 12 + φ 1 Φ 1 L 13) x t = x t φ 1 x t 1 Φ 1 x t 12 + φ 1 Φ 1 x t 13.

SARMA(p, q)(p, Q) s -malli Kerrannainen kausivaihtelu-arma-prosessi, jossa kauden pituus on s: Φ s P (L)φ p(l)x t = Θ s Q (L)θ q(l)ɛ t, (ɛ t ) t T WN(0, σ 2 ), missä φ p, θ q, Φ s P ja Θs Q ovat viivepolynomit, φ p (L) = 1 φ 1 L φ 2 L 2... φ p L p θ q (L) = 1 + θ 1 L + θ 2 L 2 +... + θ q L q Φ s P (L) = 1 Φ 1L s Φ 2 L 2s... Φ P L Ps Θ s Q (L) = 1 + Θ 1L s + Θ 2 L 2s +... + Θ Q L Qs

SARMA(p, q)(p, Q) s -malli Φ s P (L)φ p(l) = Θ s Q (L)θ q(l) + ɛ t, (ɛ t ) t T WN(0, σ 2 ), Mallissa on p + P + q + Q rakenneparametria: AR-osa p astetta; parametrit: φ 1, φ 2,..., φ p Kausi-AR-osa P astetta; parametrit: Φ 1, Φ 2,..., Φ P MA-osa q astetta, parametrit: θ 1, θ 2,..., θ q Kausi-MA-osan Q astetta, parametrit: Θ 1, Θ 2,..., Θ Q

SARMA(p, q)(p, Q) s -mallin erikoistapaukset SARMA(p, q)(p, Q) s -mallin Φ s P (L)φ p(l)x t = Θ s Q (L)θ q(l)ɛ t, (ɛ t ) t T WN(0, σ 2 ) sisältää erikoistapauksenaan kaikki edellä määritellyt mallit stationaarisille stokastisille prosesseille: AR(p) MA(q) ARMA(p, q) SAR(P) s SMA(Q) s SARMA(P, Q) s

Viivepolynomin juuret Algebran peruslauseen mukaan astetta r olevalla viivepolynomilla δ r (L) = 1 + δ 1 L + δ 2 L 2 +... + δ r L r on r juurta, jotka saattavat olla kompleksisia. Jos polynomin δ r (L) juuri on kompleksiluku z = x + iy, (x, y R, i 2 = 1), niin myös z:n konjugaatti- eli liittoluku z = x iy on polynomin δ r (L) juuri. Siten polynomilla δ r (L) on aina parillinen lukumäärä kompleksisia juuria. Esimerkki Olkoon φ(l) = 1 L + 1 2 L2. Silloin polynomin φ(l) juuret L 1 = 1 + i ja L 2 = 1 i ovat yksikköympyrön ulkopuolella: L 1 2 = L 2 2 = 2.

SARMA(p, q)(p, Q) s -malli: Stationaarisuus SARMA(p, q)(p, Q) s -prosessi on stationaarinen, jos mallin AR-osan määräävien viivepolynomien φ p (L) = 1 φ 1 L φ 2 L 2... φ p L p Φ s P (L) = 1 Φ 1L s Φ 2 L 2s... Φ P L Ps juuret ovat yksikköympyrän ulkopuolella (tai niitä ei ole). Fakta SARMA prosessia ei voida tutkia käyttämällä auto- ja osittaiskorrelaatiofunktioita sekä spektriä, ellei se ole stationaarinen.

SARMA(p, q)(p, Q) s -malli: Stationaarisuus Jos SARMA(p, q)(p, Q) s -prosessi x t on stationaarinen, niin sillä on MA( )-esitys missä sarja x t = Ψ(L)ɛ t, (ɛ t ) t T WN(0, σ 2 ), Ψ(L) = φ 1 (L)Φ 1 (L)θ(L)Θ(L) = ψ i L i, (ψ 0 = 1) i=0 suppenee itseisesti ja kvadraattisesti.

SARMA(p, q)(p, Q) s -malli: Käännettävyys SARMA(p, q)(p, Q) s -prosessi on käännettävä, jos mallin MA-osan määräävien viivepolynomien θ q (L) = 1 + θ 1 L + θ 2 L 2 +... + θ q L q Θ s Q (L) = 1 + Θ 1L s + Θ 2 L 2s +... + Θ Q L Qs juuret ovat yksikköympyrän ulkopuolella. Fakta SARMA prosessin autokorrelaatio-funktio ei määrää yksikäsitteisesti prosessin MA- ja kausi-ma-osia, ellei prosessi ole käännettävä.

SARMA(p, q)(p, Q) s -malli: Käännettävyys Jos SARMA(p, q)(p, Q) s -prosessi on käännettävä, niin sillä on AR( )-esitys missä sarja Π(L)x t = ɛ t, (ɛ t ) t T WN(0, σ 2 ), Π(L) = θ 1 (L)Θ 1 (L)φ(L)Φ(L) = π i L i, (π 0 = 1) i=0 suppenee itseisesti ja kvadraattisesti.

Stationaarisuus ja käännettävyys Esimerkki 1 AR(p)-prosessi: x t = φ 1 x t 1 + φ 2 x t 2 +...φ p x t p + ɛ t, (ɛ t ) t T WN(0, σ 2 ). On stationaarinen, jos AR-polynomin juuret ovat yksikköympyrän ulkopuolella. On aina käännettävä (valmiiksi käännetyssä muodossa). 2 MA(q)-prosessi x t = ɛ t +θ 1 ɛ t 1 +θ 2 ɛ t 2 +...+θ q ɛ t q, (ɛ t ) t T WN(0, σ 2 ). On aina stationaarinen, (painotettu summa kohinasta). On käännettävä, jos MA-polynomin juuret ovat yksikköympyrän ulkopuolella.

Ensi viikolla: 1 ARMA-mallit 1 Stationaaristen ARMA mallien tunnusluvut 2 ARIMA- ja SARIMA-mallit 2 ARMA-mallien rakentaminen 1 Tunnuslukujen estimointi 2 ARMA-mallin estimointi 3 Ennustaminen ARMA-malleilla

Luentokalvot pohjautuvat osittain Mellinin ja Liesiön aiempien vuosien kalvoihin.