ARMA mallien ominaisuudet ja rakentaminen
|
|
- Kai Saaristo
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017
2 Viikko 4: 1 ARMA-mallien ominaisuudet 1 Stationaaristen ARMA mallien tunnusluvut 2 ARIMA- ja SARIMA-mallit 2 ARMA-mallien rakentaminen 1 Tunnuslukujen estimointi 2 Box-Jenkins menetelmä 3 Aikasarjojen ositus
3 Sisältö 1 ARMA-mallien ominaisuudet 2 ARMA-mallien rakentaminen
4 MA(q)-prosessin ominaisuudet x t = ɛ t + θ 1 ɛ t 1 + θ 2 ɛ t θ q ɛ t q, (ɛ t ) t T WN(0, σ 2 ) Odotusarvo µ x = E[x t ] = 0 Varianssi q σx 2 = var(x t ) = σ 2 θi 2, θ 0 = 1 i=1 Autokovarianssi γ k = cov ( x t, x t k ) = { σ 2 q k i=0 θ iθ i+k, k = 0, 1, 2,..., q 0, k > q.
5 MA(q)-prosessin ominaisuudet x t = ɛ t + θ 1 ɛ t 1 + θ 2 ɛ t θ q ɛ t q, (ɛ t ) t T WN(0, σ 2 ) Autokorrelaatio 1, k = 0 q k ρ k = i=0 θ i θ i+k q, k = 1, 2,..., q i=0 θ2 i 0, k > q AR( )-esitys (jos kääntyvä) π i x t i = ɛ t (π 0 = 1) i=0 Osittaisautokorrelaatio vaimenee exponentiaalisesti
6 MA(3) prosessi, θ 1 = 1, θ 2 = 0.5, θ 3 = 0.2 Autokorrelaatio k Osittaisautokorrelaatio k
7 Kääntyvän MA(1)-prosessin ominaisuudet x t = ɛ t + θ 1 ɛ t 1, (ɛ t ) t T WN(0, σ 2 ) Viivepolynomin θ(l) = 1 + θ 1 L juuri on yksikköympyrän ulkopuolella, joten θ 1 < 1 AR( )-esitys: ( θ 1 ) i x t i = ɛ t i=0 Autokovarianssi ja autokorrelaatio σ 2( 1 + θ1) 2, k = 0 1, k = 0 γ k = σ 2 θ θ 1, k = 1, ρ k = 1, k = 1 1+θ1 0, k > k > 1
8 MA(1) prosessi, θ 1 = 0.9 Autokorrelaatio k Osittaisautokorrelaatio k
9 Stationaarisen AR(p)-mallin ominaisuudet x t = φ 1 x t 1 + φ 2 x t φ p x t p + ɛ t, (ɛ t ) t T WN(0, σ 2 ). Sillä on MA( )-esitys x t = ψ i ɛ t i (ψ 0 = 1) i=0 Odotusarvo µ x = E[x t ] = 0 Varianssi σx 2 = var(x t ) = σ 2 Autokovarianssi ja autokorrelaatio i=0 γ k = σ 2 ψ i ψ i+k, ρ k = i=0 ψ 2 i i=0 ψ iψ i+k i=0 ψ2 i
10 Stationaarinen AR(p)-malli: Yulen ja Walkerin yhtälöt x t = φ 1 x t 1 + φ 2 x t φ p x t p + ɛ t, (ɛ t ) t T WN(0, σ 2 ). Autokorrelaatiot toteuttavat Yulen ja Walkerin yhtälöt ρ 0 = 1 ρ k = φ 1 ρ k 1 + φ 2 ρ k φ p ρ k p, k > 0, koska [ ( p )] γ k = E[x t x t k ] = E x t k φ i x t i + ɛ t i=1 = p φ i E[x t k x t i ] + E[x t k ɛ t ] = i=1 p φ i γ k i. i=1
11 AR(3) prosessi, φ 1 = 0.5, φ 2 = 0.4, φ 3 = 0.2 Autokorrelaatio k Osittaisautokorrelaatio k
12 Stationaarinen AR(1)-malli: Ominaisuudet x t = φ 1 x t 1 + ɛ t, (ɛ t ) t T WN(0, σ 2 ). MA( )-esitys x t = φ i 1 ɛ t i i=0 Odotusarvo µ x = E[x t ] = 0 Varianssi σx 2 = var(x t ) = σ 2 φ 2i 1 = σ2 1 φ 2 1 i=0 Autokovarianssi ja autokorrelaatio γ k = σ 2 i=0 φ i 1 φi+k 1 = φ k 1 σ2 x ja ρ k = φ k 1.
13 AR(1) prosessi, φ 1 = 0.9 Autokorrelaatio k Osittaisautokorrelaatio k
14 Stationaarinen AR(2)-malli: Ominaisuudet x t = φ 1 x t 1 + φ 2 x t 2 + ɛ t, (ɛ t ) t T WN(0, σ 2 ). MA( )-esitys x t = ψ i ɛ t i, i=0 ψ 0 = 1, ψ 1 φ 1 = 0, ψ i φ 1 ψ i 1 φ 2 ψ i 2 = 0, i 2. Odotusarvo µ x = E[x t ] = 0 Varianssi σx 2 = var(x t ) = σ 2 Autokovarianssi ja autokorrelaatio γ k = σ 2 i=0 i=0 ψ i ψ i+k, ρ 1 = φ 1 1 φ 2, ρ 2 = φ2 1 1 φ 2 + φ 2. ψ 2 i
15 Stationaarinen AR(2)-malli: Ominaisuudet x t = φ 1 x t 1 + φ 2 x t 2 + ɛ t, (ɛ t ) t T WN(0, σ 2 ). Koska viivepolynomin φ(l) = 1 φ 1 L φ 2 L 2 juuret ovat yksikköympyrän ulkopuolella, niin φ 1 + φ 2 < 1 φ 1 + φ 2 < 1 φ 2 < 1 Juuret ovat kompleksisia, jos φ φ 2 < 0. Tällöin autokorrelaatiofunktio on eksponentiaalisesti vaimenevan sinikäyrän rajoittama. Jos juuret ovat reaaliset, niin eksponenttifunktio(t) rajaa autokorrelaatiofunktion.
16 AR(2) prosessi, φ 1 = 0.5, φ 2 = 0.2 Autokorrelaatio k Osittaisautokorrelaatio k
17 AR(2) prosessi, φ 1 = 0.5, φ 2 = 0.4 Autokorrelaatio k Osittaisautokorrelaatio k
18 Stationaarinen ARMA(p, q)-prosessi x t φ 1 x t 1 φ 2 x t 2... φ p x t p = ɛ t +θ 1 ɛ t 1 +θ 2 ɛ t θ q ɛ t q, missä (ɛ t ) t T WN(0, σ 2 ). Stationaarisen AR(p)-prosessin Autokorrelaatiofunktio vaimenee eksponentiaalista vauhtia (geometrinen sarja) Osittaisautokorrelaatiofunktio katkeaa viiveellä p. MA(q)-prosessin Autokorrelaatiofunktio katkeaa viiveellä q Osittaisautokorrelaatiofunktio vaimenee eksponentiaalisesti. Stationaarisen ARMA(p, q)-prosessin auto- ja osittaisautokorrelaatiofunktiot vaimenevat eksponentiaalista vauhtia.
19 ARMA(2,3), φ = (0.5, 0.2), θ = ( 0.8, 0.6, 0.2) Autokorrelaatio k Osittaisautokorrelaatio k
20 Stationaarinen ARMA(p, q)-prosessi x t φ 1 x t 1 φ 2 x t 2... φ p x t p = ɛ t +θ 1 ɛ t 1 +θ 2 ɛ t θ q ɛ t q, missä (ɛ t ) t T WN(0, σ 2 ). Malli AR(p) MA(q) ARMA(p, q) Osittaisauto- korrelaatiofunktio Katkeaa viiveellä p Vaimenee eksponentiaalisesti Vaimenee eksponentiaalisesti Autokorrelaatiofunktio Vaimenee eksponentiaalisesti Katkeaa viiveellä q Vaimenee eksponentiaalisesti
21 Stationaarinen ja käännettävä ARMA(1,1)-malli x t φ 1 x t 1 = ɛ t + θ 1 ɛ t 1, (ɛ t ) t T WN ( 0, σ 2) Viivepolynomien φ(l) = 1 φ 1 L, θ(l) = 1 + θ 1 L juuret ovat yksikköympyrän ulkopuolella, jos φ 1 < 1, θ 1 < 1. MA( )-esitys x t = ψ i ɛ t i, i=0 ψ 0 = 1, ψ i = θ 1 φ i φ i 1, i > 0. Odotusarvo, varianssi ja autokovarianssi: µ x = E[x t ] = 0 σ 2 x = var(x t ) = σ 2 γ k = σ 2 ψ i ψ i+k ψi 2 i=0 i=0
22 ARMA(1,1), φ = 0.8, θ = 0.6 Autokorrelaatio k Osittaisautokorrelaatio k
23 Stationaarinen SARMA(P, Q) s -prosessi x t Φ 1 x t s... Φ P x t Ps = ɛ t +Θ 1 ɛ t s +...+Θ Q ɛ t Qs, (ɛ t ) t T WN(0, σ 2 ) SARMA(P, Q) s -prosessin auto- ja osittaisautokorrelaatio-funktiot käyttäytyvät kausiviiveillä s, 2s, 3s,... kuten vastaavan ARMA(p, q)-prosessin akf ja oakf ja saavat kausiviiveiden välissä arvon 0. Stationaarisen SAR(P) s -prosessin akf vaimenee kausiviiveillä s, 2s, 3s,... eksponentiaalista vauhtia oakf katkeaa viiveellä Ps. Stationaarisen SMA(Q) s -prosessin akf katkeaa viiveellä Qs. oakf vaimenee kausiviiveillä s, 2s, 3s,... eksponentiaalisesti. Stationaarisen SARMA(P, Q) s -prosessin auto- ja osittaisautokorrelaatiofunktiot vaimenevat kausiviiveillä s, 2s, 3s,... eksponentiaalista vauhtia
24 Stationaarinen SARMA(P, Q) s -prosessi x t Φ 1 x t s... Φ P x t Ps = ɛ t +Θ 1 ɛ t s +...+Θ Q ɛ t Qs, (ɛ t ) t T WN(0, σ 2 ) Auto- Osittaisautokorrelaatiofunktio korrelaatiofunktio Malli Vaimenee Katkeaa SAR(P) s eksponentiaalisesti viiveellä Ps Katkeaa Vaimenee SMA(Q) s viiveellä Qs eksponentiaalisesti Vaimenee Vaimenee SARMA(P, Q) s eksponentiaalisesti eksponentiaalisesti
25 Stationaarisen SARMA(p, q)(p, Q) s -malli x t Φ 1 x t s... Φ P x t Ps = ɛ t +Θ 1 ɛ t s +...+Θ Q ɛ t Qs, (ɛ t ) t T WN(0, σ 2 ) Stationaarisen SARMA(p, q)(p, Q) s -prosessin auto- ja osittaisautokorrelaatiofunktioiden käyttäytyminen on (monimutkainen) yhdistelmä vastaavien ARMA(p, q)- ja SARMA(P, Q) s -prosessien korrelaatiofunktioiden käyttäytymisestä.
26 ARMA(p, q):n spektri: Stokastisen prosessin suodatus Sanotaan, että stokastinen prosessi x t on saatu suodattamalla stokastisesta prosessista y t käyttäen lineaarista aikainvarianttia suodinta, jos x t = w j y t j j= Suotimen määrittelee painot w j, joille j= w j <. Voidaan osoittaa, että suodatetun stokastisen prosessin x t spektritiheysfunktio on f x (λ) = W (λ) 2 f y (λ), missä f y (λ) on y t :n spektritiheysfunktio ja W (λ) = w j e iλj. j= W (λ) 2 on suotimen siirtofunktio.
27 ARMA(p, q):n spektri Stationaarisella ARMA(p, q)-prosessilla x t on MA( )-esitys x t = Ψ(L)ɛ t, (ɛ t ) t T WN ( 0, σ 2), Ψ(L) = ψ j L j, ψ 0 = 1, φ(l)ψ(l) = θ(l) j=0 x t saadaan siis suodattamalla puhtaasti satunnaisesta prosessista ɛ t suotimella, jonka siirtofunktio on Ψ(e iλ ) θ(e iλ ) = φ(e iλ ) = 1 + θ 1e iλ θ q e qiλ 1 + φ 1 e iλ φ p e piλ. Näin ollen x t :n spektritiheysfunktio on f x (λ) = W (λ) 2 f ɛ (λ) = σ2 1 + θ 1 e iλ θ q e qiλ 2 2π 1 φ 1 e iλ... φ p e piλ 2 (ɛ t :n spektritiheysfunktio on vakio σ 2 /2π).
28 (Stationaaristen) prosessien spektrejä ARMA(1,1) : f (λ) = σ2 1 + θ 1 e iλ 2 2π 1 + φ 1 e iλ 2 = σ2 1 + θ θ 1 cos(λ) 2π 1 + φ 2 1 2φ 1 cos(λ) AR(p) AR(2) : f (λ) = σ2 1 2π 1 φ 1 e iλ... φ p e piλ 2 : f (λ) = σ2 1 2π 1 φ 1 e iλ φ 2 e 2iλ 2 = σ2 1 2π 1 + φ φ2 2 2φ 1(1 φ 2 ) cos(λ) 2φ 2 cos(2λ) MA(q) MA(2) : f (λ) = σ2 2π 1 + θ 1e iλ θ q e qiλ 2 : f (λ) = σ2 2π 1 + θ 1e iλ + θ 2 e qiλ 2 = σ2 ( 1 + θ 2 2π 1 + θ θ 1 (1 θ 2 ) cos(λ) + 2θ 2 cos(2λ) )
29 SARIMA(p, h, q)(p, H, Q) s Olkoon x t stokastinen prosessi, siten että (i) x t on epästationaarinen (ii) D G s D g x t on epästationaarinen, kun g < h, G < H (iii) y t = D H s D h x t on stationaarinen (iv) y t on SARMA(p, q)(p, Q) s -prosessi. Silloin stokastinen prosessi x t on integroituva astetta h ja kausi-integroituva astetta H ja sanomme, että x t on SARIMA(p, h, q)(p, H, Q) s -prosessi. Kun prosessille x t tehdään (iii)-kohdan differentointi, niin se voidaan mallintaa käyttäen SARMA(p, q)(p, Q) s -prosessia. Vastaavasti: x t on ARIMA(p, h, q)-prosessi, jos y t = D h x t on ARMA(p, q)-prosessi.
30 Sisältö 1 ARMA-mallien ominaisuudet 2 ARMA-mallien rakentaminen
31 Korrelaatiofunktioiden ja spektrin estimointi ja stationaarisuus Teoreettiset auto- ja osittaisautokorrelaatiofunktiot sekä spektritiheysfunktio on määritelty vain stationaarisille stokastisille prosesseille. Nämä funktiot voidaan ja kannattaa kuitenkin laskea myös epästationaarisista aikasarjoista eli epästationaaristen stokastisten prosessien realisaatioista. Tällöin niitä ei kuitenkaan voida tulkita minkään stationaarisen stokastisen prosessin korrelaatiofunktioiden estimaattoreina. Antavat usein hyviä vihjeitä siitä, miten aikasarja kannattaa stationarisoida.
32 Autokorrelaatioiden estimointi Olkoon x t, t = 1, 2,..., n havaittu aikasarja. (Aritmeettinen) keskiarvo: x = 1 n x t n Varianssin estimaattori: c 0 = 1 n t=1 n (x t x) 2 k. (otos)autokovarianssin estimaattori: c k = 1 n (x t x)(x t k x), k = 0, 1,..., n 1 n t=k+1 t=1 k. (otos)autokorrelaatiokertoimen estimaattori r k = c k c 0, k = 0, 1, 2,..., n 1
33 Huom Autokovarianssin estimaattorissa c k = 1 n n t=k+1 (x t x)(x t k x), k = 0, 1,..., n 1 jakajana on n, vaikka summassa on n k termiä, koska tämä takaa, että funktio c : {0, 1,..., n 1} R, c(k) = c k on positiivisesti semidefiniitti, joka on välttämätön ehto sille, että c k on stationaarisen prosessin autokovarianssifunktio. Jakajana voi olla myös n k 1, mutta silloin funktio c ei välttämättä ole positiivisesti semidefiniitti. Molemmat antavat asymptoottisesti saman tuloksen.
34 Kuinka monta autokorrelaatiota estimoida? Aikasarjasta x t, t = 1, 2,..., n, voidaan periaatteessa estimoida n 1 ensimmäistä autokovarianssia c k ja -korrelaatiota r k. Kannattaa kuitenkin huomata, että k. autokovarianssi c k = 1 n n t=k+1 (x t x)(x t k x), k = 0,..., n 1, estimoidaan vain n k havainnosta. Pitkillä viiveillä (k n 1) c k ja r k tulevat estimoiduiksi epätarkasti, koska ne lasketaan vain muutamasta havainnosta. Siten otosautokovarianssit ja -korrelaatiot voivat olla epäluotettavia, jos havaintojen määrä n < 50 ja k > n 4.
35 Osittaisautokorrelaatioiden estimointi Olkoon ˆφ k k. osittaisautokorrelaatiokertoimen estimaattori. k:nen oak-kertoimen estimaatin laskeminen: 1 Muodostetaan aineiston avulla Yule-Walkerin yhtälöt (k kpl) 1 r 1 r 2 r k 1 a k1 r 1 r 1 1 r 1 r k 2 a k2 r 2 r 2 r 1 1 r k 3 a k3 = r 3, r k 1 r k 2 r k 3 1 a kk 2 Ratkaistaan a kk yhtälöistä 3 Estimaatti: ˆφ k = a kk Esim: ˆφ 1 = a 11, ˆφ 2 = a 22 = r 2 r r 1 2 Osittaisautokorrelaatiokerrointen estimaatit ˆφ k, määräävät Otososittaisautokorrelaatiofunktion ˆφ : {0, 1,..., n 1} R, ˆφ(k) = ˆφ k kaikilla k = 0, 1,..., n 1. r k
36 Osittaisautokorrelaatioiden estimointi AR(p)-prosessille Osittaisautokorrelaatiokertoimet voidaan vaihtoehtoisesti estimoida myös regressiomalleista x t = β 1 x t 1 + β 2 x t β p x t p + ɛ t. pienimmän neliösumman menetelmällä. Tällöin k. osittaisautokorrelaatiokertoimen φ k estimaattori on parametrin (regressiokertoimen) β k PNS-estimaattori b k : ˆφ k = b k, k = 1, 2,..., p. Tämä tapa sopii suoraan vain AR(p)-prosesseille, koska MA-osa aiheuttaa sen, että kohina ei ole korreloimatonta.
37 Otosautokovarianssien stokastiset ominaisuudet Huom k. otosautokovarianssi c k on autokovarianssin γ k harhainen estimaattori, mutta c k on kuitenkin asymptoottisesti harhaton: lim E[c k] = γ k. n
38 Autokorrelaatioiden testaaminen Riippumattomien, samoin jakautuneiden satunnaismuuttujien jonon muodostaman stationaarisen stokastisen prosessin k. otosautokorrelaatio r k on asymptoottisesti normaalijakautunut: ( r k a N 0, 1 ) n Huom Tämä motivoi approksimatiiviseen testausmenettelyyn: 5 %:n merkitsevyystasolla r k kuuluu välille [ 2 n, 95 % todennäköisyydellä. ] 2 n (2 1.96). Jos IID satunnaismuuttujien muodostaman stokastisen prosessin generoimasta aikasarjasta estimoidaan 100 ensimmäistä autokorrelaatiota, niin keskimäärin niistä 5 kpl löytyvät annetun välin ulkopuolelta.
39 ARMA-mallin parametrien estimointi Olkoon x t, t = 1,..., n aikasarja, johon halutaan sovittaa ARMA(p, q)-malli x t φ 1 x t 1... φ p x t p = ɛ t + θ 1 ɛ t θ q ɛ t q, missä (ɛ t ) t T IID(0, σ 2 ) ja lisäksi ɛ t N(0, σ 2 ) kaikilla t T. Silloin satunnaismuuttujien x 1,..., x n yhteisjakauma on n-ulotteinen normaalijakauma, jonka kovarianssimatriisi riippuu (voimakkaan epälineaarisesti) ARMA(p, q)-mallin parametreista. Muodostetaan x 1,..., x n uskottavuusfunktio ja maksimoidaan uskottavuusfunktio parametrien suhteen (R: arima()), jolloin saadaan ARMA(p, q)-mallin parametrien SU-estimaattorit: ˆφ 1, ˆφ 2,..., ˆφ p, ˆθ 1, ˆθ 2,..., ˆθ q, ˆσ 2 Estimaattoreita ei saa ratkaistua suljetussa muodossa. Lisätietoja esim. Hamilton (1994), Brockwell & Davis (1991).
40 ARMA-mallin parametrien estimointi Oletetaan, että ollaan ratkaistu ARMA(p, q)-mallin parametrien SU-estimaattorit ˆφ 1, ˆφ 2,..., ˆφ p, ˆθ 1, ˆθ 2,..., ˆθ q, ˆσ 2. SU-estimaattoreiden keskivirheet saadaan käyttämällä hyväksi Fisherin informaatioita 1. SU-estimaattorit ovat asymptoottisesti normaalisia, joten parametreille saadaan luottamusvälit normaali- tai t-jakaumaan avulla merkitsevyyttä voidaan testata t-testillä. Jäännökset voidaan määrätä kaavalla e t = ˆφ(L) ˆθ(L) x t, ˆφ(L) = 1 ˆφ 1 L... ˆφ p L p, ˆθ(L) = 1 + ˆθ1 L ˆθ q L q. 1 log-uskottavuusfunktion kunkin parametrin suhteen lasketun derivaatan toinen momentti
41 Box-Jenkins mallinnuksen idea Pyritään rakentamaan malli, joka kuvaa ilmiötä riittävän hyvin mahdollisimman vähillä parametreilla. Mitä enemmän parametreja estimoidaan, sitä enemmän voidaan mennä pieleen. Monimutkaisemmat mallit saadaan sovitettua aineistoon paremmin, mutta eivät yleensä toimi hyvin ennustamisessa.
42 Box-Jenkins mallinnusstrategia Box-Jenkins menetelmä on SARIMA-mallien rakentamisstrategia, joka sisältää kolme vaihetta: 1 Mallin tunnistaminen (a) Aikasarjan stationarisoimiseksi tarvittavien differensointien kertalukujen h ja H (sekä s) valinta (SARIMA SARMA-aikasarja). Muista: h on integroituvuuden aste ja H kausi-integroituvuuden aste. (b) SARMA-mallin viivepolynomien astelukujen (p, q, P, Q) valinta arvaamalla. 2 Mallin estimointi Estimoidaan parametrit θ i, Θ i, φ i, Φ i (yht p + q + P + Q kpl), esimerkiksi suurimman uskottavuuden (SU) menetelmällä (vrt. ARMA-mallin esitimointi edellä). 3 Diagnostiset tarkastukset: Ovatko estimoidun SARMA-mallin jäännökset valkoista kohinaa? Ei Palataan vaiheeseen 1. On Malli on valmis
43 Box-Jenkins menetelmä: 1a) Mallin tunnistaminen Differensointien kertaluvut Stationaarisuuden saavuttamiseksi aikasarjoja joudutaan usein differensoimaan tai logaritmoimaan. Differensointien kertalukujen valinnan apuna käytetään aikasarjan, sen korrelaatiofunktioiden sekä spektrin kuvaajia. Aikasarjaa differensoidaan kunnes tuloksena saatavaa aikasarjaa voidaan pitää stationaarisena. Jos kuvaajat näyttävät siltä, että aikasarja voisi olla stationaarinen, aikasarjaa ei pidä differensoida. Aikasarjan stationarisoimiseksi välttämättömät differensoinnit yleensä pienentävät aikasarjan varianssia, kun taas ylidifferensoinnilla on taipumus kasvattaa aikasarjan varianssia.
44 Box-Jenkins menetelmä: 1a) Mallin tunnistaminen Stationarisoinnin työkalut Differenssi Dx t = x t x t 1 poistaa aikasarjasta deterministisen lineaarisen trendin. Vastaavasti p. differenssi D p poistaa p. asteen polynomisen trendin. Kausidifferenssi D s x t = x t x ts poistaa aikasarjasta deterministisen kausivaihtelun, jonka periodi on s. Joskus tarvitaan lisäksi aikasarjan logaritmointia y t = log(x t ) Linearisoi aikasarjassa olevan eksponentiaalisen trendin Vakioi aikasarjan tason mukana kasvavan varianssin Alkuperäinen aikasarja saadaan palautettua käänteismuunnoksella Esim. Jos y t = Dx t niin x 1 = y 1 ja x t = y 1 + y y t, t = 2, 3,..., n. Esim. x t = exp(y t ).
45 Box-Jenkins menetelmä: 1b) Mallin tunnistaminen viivepolynomien asteluvut Kun aikasarja on stationarisoitu, valitaan käytettävän SARMA-mallin viivepolynomien asteluvut Valinnan apuna käytetään aikasarjan sekä sen korrelaatiofunktioiden ja spektrin kuvaajia Astelukujen valinta viivepolynomeille on usein niin vaativa tehtävä, että tavallisesti joudutaan tyytymään siihen, että mahdollisten astelukujen lukumäärä saadaan rajatuksi. Valittuja astelukuja kokeillaan estimoimalla vastaavat mallit (ks. Kohta 2) ja lopullisen mallin valinta tehdään vertailemalla estimoitujen mallien hyvyyttä. Vertailussa otetaan huomioon sekä estimoidun mallin parametrien merkitsevyys että diagnostisten tarkistusten (ks. Kohta 3) antamat tulokset.
46 Box-Jenkins menetelmä: 1 Mallin tunnistaminen Kommentteja Kun SARIMA(p, h, q)(p, H, Q) s -malleja sovitetaan yhteiskunnallisiin (esim. taloudellisiin) aikasarjoihin, joudutaan aika harvoin käyttämään malleja, joissa differensointien kertaluvut tai viivepolynomien asteluvut eivät olisi pieniä kokonaislukuja. Usein (ei kuitenkaan aina) riittää tarkastella seuraavia vaihtoehtoja: Differensointien kertaluvut: AR-osien asteluvut: MA-osien asteluvut: h = 0, 1 tai 2; H = 0 tai 1 p = 0, 1 tai 2; P = 0 tai 1 q = 0, 1 tai 2; Q = 0 tai 1
47 Esimerkki: Satunnaiskävely X t Kuva : Satunnaiskävely.
48 Esimerkki: Satunnaiskävely ACF Lag Partial ACF Lag Kuva : Satunnaiskävelyn autokorrelaatio ja osittaisautokorrelaatio.
49 Esimerkki: Satunnaiskävely X t Kuva : Satunnaiskävely (musta) ja differensoitu satunnaiskävely (sininen).
50 Esimerkki: Satunnaiskävely ACF Lag Partial ACF Lag Kuva : Differensoidun satunnaiskävelyn autokorrelaatio ja osittaisautokorrelaatio.
51 Esimerkki: Satunnaiskävely X t Kuva : Satunnaiskävely (musta) ja kahdesti differensoitu satunnaiskävely (vihreä).
52 Esimerkki: Satunnaiskävely ACF Lag Partial ACF Lag Kuva : Kahdesti differensoidun satunnaiskävelyn autokorrelaatio ja osittaisautokorrelaatio.
53 Esimerkki: geometrinen satunnaiskävely (GRW) Y t Kuva : Geometrinen satunnaiskävely.
54 Esimerkki: geometrinen satunnaiskävely ACF Lag Partial ACF Lag Kuva : GRW:n autokorrelaatio ja osittaisautokorrelaatio.
55 Esimerkki: geometrinen satunnaiskävely Y t Kuva : GRW:n (punainen) ja differensoitu GRW (sininen).
56 Esimerkki: geometrinen satunnaiskävely ACF Lag Partial ACF Lag Kuva : Differensoidun GBM:n autokorrelaatio ja osittaisautokorrelaatio.
57 Esimerkki: geometrinen satunnaiskävely Y t Kuva : Geometrinen satunnaiskävely (punainen) ja kahdesti differensoitu GRW (vihreä).
58 Esimerkki: geometrinen satunnaiskävely ACF Lag Partial ACF Lag Kuva : Kahdesti differensoidun GRW:n autokorrelaatio ja osittaisautokorrelaatio.
59 Esimerkki: geometrinen satunnaiskävely Y t Kuva : Geometrinen satunnaiskävely (punainen) ja logaritmoitu GRW (musta).
60 Esimerkki: geometrinen satunnaiskävely ACF Lag Partial ACF Lag Kuva : Logaritmoidun GRW:n autokorrelaatio ja osittaisautokorrelaatio.
61 Esimerkki: geometrinen satunnaiskävely Y t Kuva : GRW (musta) ja differensoitu log-grw (sininen).
62 Esimerkki: geometrinen satunnaiskävely ACF Lag Partial ACF Lag Kuva : Differensoidun log-grw:n autokorrelaatio ja osittaisautokorrelaatio.
63 Box-Jenkins menetelmä: 2. Mallin estimointi SARMA-malli voidaan estimoida R:llä käyttäen jotakin siihen tarkoitettua funktiota (esim. arima()), joka määrittää annetun aikasarjan parametrit käyttäen jotakin sopivaa menetelmää (esim. suurimman uskottavuuden menetelmä).
64 Box-Jenkins menetelmä: 3. Diagnostiset tarkistukset Diagnostiset tarkistukset perustuvat estimoidun SARMA-mallin residuaalien tutkimiseen: Tutkitaan residuaalien muodostaman aikasarjan sekä sen korrelaatiofunktioiden ja spektrin kuvaajia Testataan jäännösten korreloimattomuutta Estimoitua mallia pidetään riittävänä, jos sen jäännökset ovat valkoista kohinaa. Jos malli ei ole riittävä, niin on palattava tunnistamisvaiheeseen (1)
65 Box-Jenkins menetelmä: 3. Diagnostiset tarkistukset Jäännösten korreloimattomuutta voidaan testata Ljung-Box Q-testisuureella K ri 2 Q K = n(n + 2) n i r i on jäännösten autokorrelaatio viiveellä i Saa selvästi sitä suurempia arvoja mitä voimakkaammin residuaalit ovat autokorreloituneita. Jos SARMA-mallin nollahypoteesi H 0 : ɛ t WN pätee, niin i=1 Q K a χ 2 (K m) m on estimoitujen parametrien lukumäärä SARMA-mallissa Suuret testisuureen Q K arvot johtavat nollahypoteesin hylkäämiseen. Q-testisuureen arvo ja sen jakauma rippuu mukaan otettujen autokorrelaatiokertoimien lukumäärästä K. Tavallisesti Q-testisuure on syytä laskea usealle eri K :lle.
66 Box-Jenkins menetelmä: 3. Diagnostiset tarkistukset Huom Ljung-Box menetelmällä testataan K :n ensimmäisen autokorrelaation merkitsevyyttä yhtä aikaa. K :n on oltava suurempi, kuin estimoitavien parametrien lukumäärä m. Käytännössä testin teho heikkenee, kun K kasvaa, koska testisuure noudattaa asymptoottisesti (n K :n suhteen) χ 2 (K m)-jakaumaa. Jos K on pieni, niin korkeamman asteen autokorrelaatiot jäävät testaamatta. Selkeää sääntöä K :n suuruudelle ei ole.
67 Aikasarjojen ositus Useissa aikasarjoissa voidaan nähdä seuraavia piirteitä: Trendejä eli aikasarjan tason systemaattisia muutoksia. Syklistä vaihtelua tai suhdannevaihtelua. Kausivaihtelua, Satunnaista vaihtelua. Tämä empiirinen havainto on johtanut ajatukseen, että aikasarjat kannattaisi osana tilastollista analyysia yrittää osittaa vastaaviin komponentteihin eli osiin.
68 Aikasarjan osituksen tavoitteet (i) Aikasarjan käyttäytymisen kuvailu komponenttiensa avulla. (ii) Aikasarjan analysointi komponenttiensa avulla. (iii) Kausipuhdistus eli aikasarjan tilastollisen analyysin kannalta häiritseväksi koetun kausivaihtelun eliminointi. x t Time
69 Aikasarjan ositus Decomposition of additive time series seasonal trend observed random Time
70 Aikasarjan ositus komponentteihin Aikasarjan osituksessa oletetaan, että aikasarja x t, t = 1, 2,..., n voidaan esittää seuraavien komponenttien summana tai tulona: m t = trendikomponentti c t = syklinen (tai suhdanne-) komponentti s t = kausikomponentti e t = jäännös (tai satunnais-) komponentti. Summamuoto: x t = m t + c t + s t + e t. Tulomuoto: x t = m t c t s t e t. Tulomuoto voidaan muuntaa summamuotoon: log x t = log m t + log c t + log s t + log e t.
71 Aikasarjan ositus komponentteihin Huom Suhdannevaihtelu ja kausivaihtelu eivät ole sama asia: Suhdannevaihtelu (tai syklinen vaihtelu) on vaihtelua, jonka jaksot ovat epäsäännöllisiä ja syklit voivat olla pitkiä. Esimerkiksi talouden suhdanteet (nousukausi vs. lama). Kausivaihtelu puolestaan on saman pituisissa jaksoissa säännöllisesti toistuvaa vaihtelua. Esimerkiksi joulukuusten myynti.
72 Aikasarjojen ositus: Kausipuhdistus Aikasarjan osituksen tavoitteena on usein aikasarjan kausipuhdistus. Kausipuhdistuksessa alkuperäisestä aikasarjasta x t muodostetaan uusi aikasarja y t, josta häiritseväksi koettu kausivaihtelukomponentti s t on eliminoitu: (i) Kausipuhdistus summamuodossa: y t = x t s t = m t + c t + e t (ii) Kausipuhdistus tulomuodossa: y t = x t s t = m t c t e t.
73 Aikasarjojen ositusmenetelmät Yleisesti käytettyjä ositusmenetelmiä: X12 (iteratiivinen liukuvien keskiarvojen menetelmä). X12-ARIMA (ARIMA-mallit iteratiiviseen liukuvien keskiarvojen menetelmään yhdistävä menetelmä). Aikasarjojen rakennemallit (vrt. eksp. tasoituksen yhteydessä esitetyt tila-avaruus mallit).
74 Aikasarjojen osituksen kritiikki Osituksen/kausipuhdistuksen perustelut Komponenttien ja/tai kausipuhdistetun aikasarjan analysointi olisi helpompaa kuin alkuperäisen Osituksen/kausipuhdistuksen kritiikki Aikasarjan jako trendi-, suhdanne-, kausi- ja jäännöskomponentteihin on aina enemmän tai vähemmän mielivaltaista. Komponentit eivät ole todellisia, mitattavissa olevia suureita. Ositusmenetelmien taustalla ei ole (rakennemalleja lukuun ottamatta) mitään tilastollista mallia. Osituksen onnistumista on hyvin vaikeata mitata tilastollisin kriteerein. Kausipuhdistus vääristää aikasarjojen autokorrelaatiorakenteen (sisäiset aikariippuvuudet). Kausipuhdistus vääristää aikasarjojen taajuusalueen ominaisuudet. Kausipuhdistus saattaa vääristää aikasarjojen väliset riippuvuudet.
75 Aikasarjojen osituksen käyttö Johtopäätös kritiikistä: Aikasarjojen ositusta voidaan suhteellisen järkevästi käyttää osana aikasarjojen kuvailua, mutta komponenttien käyttäminen tilastollisissa malleissa on yleensä arveluttavaa. Kausipuhdistus voidaan tilastollisessa analyysissa korvata muilla, tilastotieteen kannalta paremmin perustelluilla menetelmillä: Ajassa aggregointi Yhdistetään (summaamalla, keskiarvoistamalla) aikasarjan peräkkäisiä havaintoja uudeksi aikasarjaksi Ajassa otanta Poimitaan aikasarjasta havaintoja tasaisin aikavälein uudeksi aikasarjaksi Kausidifferensointi Kausivaihtelun huomioiminen tilastollisten mallien rakenteessa.
76 Ensi viikolla 1 Ennustamisesta 1 Ennustaminen ARMA malleilla 2 Eksponentiaalinen tasoitus 2 Kalmanin suodatin
ARMA mallien ominaisuudet ja rakentaminen
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Viikko 4: 1 ARMA-mallien ominaisuudet 1 Stationaaristen
LisätiedotARMA mallien rakentaminen, Kalmanin suodatin
ARMA mallien rakentaminen, Kalmanin suodatin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016
LisätiedotARMA mallien rakentaminen, johdatus dynaamisiin regressiomalle
ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalleihin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotStationaariset stokastiset prosessit ja ARMA-mallit
Stationaariset stokastiset prosessit ja ARMA-mallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
LisätiedotDynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
LisätiedotIlkka Mellin Aikasarja-analyysi Stationaariset stokastiset prosessit
Ilkka Mellin Aikasarja-analyysi Stationaariset stokastiset prosessit TKK (c) Ilkka Mellin (2007) 1 Stationaariset stokastiset prosessit >> Stationaariset stokastiset prosessit Integroituvuus Korrelaatiofunktioiden
LisätiedotIlkka Mellin Aikasarja-analyysi ARMA-mallit
Ilkka Mellin Aikasarja-analyysi ARMA-mallit TKK (c) Ilkka Mellin (007) 1 ARMA-mallit >> ARMA-mallit ja niiden ominaisuudet ARMA-mallien auto- ja osittaisautokorrelaatiofunktiot ARMA-mallien spektri ARMA-mallien
LisätiedotKertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Viikko 1: Yleinen lineaarinen malli 1 Määritelmä
LisätiedotKertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: Yleinen lineaarinen malli 1 Määritelmä
Lisätiedot6.5.2 Tapering-menetelmä
6.5.2 Tapering-menetelmä Määritelmä 6.7. Tapering on spektrin estimointimenetelmä, jossa estimaattori on muotoa f m (ω) = 1 m ( ) k w 2π m Γ(k)e ikω, k= m missä Γ on otosautokovarianssifunktio ja ikkunafunktio
LisätiedotEnnustaminen ARMA malleilla ja Kalmanin suodin
Ennustaminen ARMA malleilla ja Kalmanin suodin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017
Lisätiedot3. Tietokoneharjoitukset
3. Tietokoneharjoitukset Aikasarjan logaritmointi Aikasarjoja analysoidaan usein logaritmisessa muodossa. Asialooginen perustelu logaritmoinnille: Muuttujan arvojen suhteelliset muutokset ovat usein tärkeämpiä
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotMS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä
MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä Tehtävä 4.1. Ncss-ohjelmiston avulla on generoitu AR(1)-, AR(2)-, MA(1)- ja MA(2)-malleja vastaavia aikasarjoja erilaisilla parametrien arvoilla.
LisätiedotKuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t
Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Valkoinen kohina ε t 2 1 0 1 2 Voimme tehdä saman laskun myös yleiselle välille [ a, a], missä 0 < a
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
Lisätiedot4. Tietokoneharjoitukset
4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
Lisätiedot4. Tietokoneharjoitukset
4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume
Lisätiedot3. Teoriaharjoitukset
3. Teoriaharjoitukset Demotehtävät 3.1 a Olkoot u ja v satunnaumuuttujia, joilla on seuraavat ominaisuudet: E(u = E(v = 0 Var(u = Var(v = σ 2 Cov(u, v = E(uv = 0 Näytä että deterministinen prosessi. x
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
LisätiedotViikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus
MS-C2128 Ennustaminen ja aikasarja-analyysi 5. harjoitukset / Tehtävät Kotitehtävät: 2 Aihe: ARMA-mallit Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tehtävä 5.1. Tarkastellaan
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) Tavoitteet (teoria): Hahmottaa aikasarjan klassiset komponentit ideaalisessa tilanteessa. Ymmärtää viivekuvauksen vaikutus trendiin. ARCH-prosessin
LisätiedotIlkka Mellin Aikasarja-analyysi Aikasarjat
Ilkka Mellin Aikasarja-analyysi Aikasarjat TKK (c) Ilkka Mellin (2007) 1 Aikasarjat >> Aikasarjat: Johdanto Aikasarjojen esikäsittely Aikasarjojen dekomponointi TKK (c) Ilkka Mellin (2007) 2 Aikasarjat:
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet
Lisätiedot8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH
8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH Osa aikasarjoista kehittyy hyvin erityyppisesti erilaisissa tilanteissa. Esimerkiksi pörssikurssien epävakaus keskittyy usein lyhyisiin
LisätiedotDynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 6: 1 Kalmanin suodatin Aiemmin käsitellyt
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
Lisätiedot4.0.2 Kuinka hyvä ennuste on?
Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki
LisätiedotGripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta
MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,
LisätiedotAuringonpilkkujen jaksollisuus
Mat-2.108 Sovelletun matematiikan erikoistyöt 16.1.2004 Auringonpilkkujen jaksollisuus Teknillinen korkeakoulu Systeemianalyysin laboratorio Keijo Jaakola 51624B 1 1. Johdanto...3 2. Aikasarjamalleja...3
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
Lisätiedot6. Tietokoneharjoitukset
6. Tietokoneharjoitukset 6.1 Tiedostossa Const.txt on eräällä Yhdysvaltalaisella asuinalueella aloitettujen rakennusurakoiden määrä kuukausittain, aikavälillä 1966-1974. Urakoiden määrä on skaalattu asuinalueen
Lisätiedot6.2.3 Spektrikertymäfunktio
ja prosessin (I + θl + + θl q )ε t spektritiheysfunktio on Lemman 6. ja Esimerkin 6.4 nojalla σ π 1 + θ 1e iω + + θ q e iqω. Koska viivepolynomien avulla määritellyt prosessit yhtyvät, niin myös niiden
LisätiedotSTOKASTISET PROSESSIT
TEORIA STOKASTISET PROSESSIT Satunnaisuutta sisältävän tapahtumasarjan kulkua koskevaa havaintosarjaa sanotaan aikasarjaksi. Sana korostaa empiirisen, kokeellisesti havaitun tiedon luonnetta. Aikasarjan
LisätiedotIdentifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
LisätiedotYhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1
Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n
LisätiedotMaximum likelihood-estimointi Alkeet
Maximum likelihood-estimointi Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Maximum likelihood-estimointi p.1/20 Maximum Likelihood-estimointi satunnaismuuttujan X
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
LisätiedotTilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Normaaliapproksimaatio Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotJohdatus regressioanalyysiin. Heliövaara 1
Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen
Lisätiedot3.6 Su-estimaattorien asymptotiikka
3.6 Su-estimaattorien asymptotiikka su-estimaattorit ovat usein olleet puutteellisia : ne ovat usein harhaisia ja eikä ne välttämättä ole täystehokkaita asymptoottisilta ominaisuuksiltaan ne ovat yleensä
LisätiedotMS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely
MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Aikataulu ja suoritustapa (Katso MyCourses) Luennot
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Satunnaismuuttujien summa ja keskihajonta Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotHarjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
Lisätiedot9. laskuharjoituskierros, vko 12-13, ratkaisut
9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t
LisätiedotOdotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotVastaavasti voidaan määritellä korkeamman kertaluvun autoregressiiviset prosessit.
Autokovarianssi: (kun τ 0) Γ t (τ) = E[(X t µ t )(X t τ µ t τ )] ( ) ( = E[ φ k ε t k φ j ε t τ j )] = = j=0 φ j+k E[ε t k ε t τ j ] k,j=0 φ j+k σ 2 δ k,τ+j k,j=0 = σ 2 φ j+k δ k,τ+j = = k,j=0 φ τ+2j I
LisätiedotMS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely
MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Aikataulu ja suoritustapa (Katso MyCourses) Luennot
LisätiedotJos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
LisätiedotIlkka Mellin Aikasarja-analyysi Suurimman uskottavuuden menetelmä
Ilkka Mellin Aikasarja-analyysi Suurimman uskottavuuden menetelmä TKK (c) Ilkka Mellin (2007) 1 Suurimman uskottavuuden menetelmä >> Suurimman uskottavuuden estimointimenetelmä Tarkentuvuus Asymptoottinen
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotMoniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
Lisätiedot2. Teoriaharjoitukset
2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu
Lisätiedot5.7 Uskottavuusfunktioon perustuvia testejä II
5.7 Uskottavuusfunktioon perustuvia testejä II Tässä pykälässä pohditaan edellä tarkasteltujen kolmen testisuureen yleistystä malleihin, joiden parametri on useampiulotteinen, ja testausasetelmiin, joissa
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Frekventistiset vs. bayeslaiset menetelmät Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotAalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,
Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten
LisätiedotMoniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?
TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä
LisätiedotTiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus. Intelin osakekurssi. (Pörssi-) päivä n = 20 Intel_Volume. Auringonpilkkujen määrä
MS-C2128 Ennustaminen ja aikasarja-analyysi 4. harjoitukset / Tehtävät Kotitehtävät: 3, 5 Aihe: ARMA-mallit Tehtävä 4.1. Tutustu seuraaviin aikasarjoihin: Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) Tavoitteet (teoria): Hallita multinormaalijakauman määritelmä. Ymmärtää likelihood-funktion ja todennäköisyystiheysfunktion ero. Oppia kirjoittamaan
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
LisätiedotTilastollinen päättely II, kevät 2017 Harjoitus 2A
Tilastollinen päättely II, kevät 07 Harjoitus A Heikki Korpela 3. tammikuuta 07 Tehtävä. (Monisteen tehtävä.3 Olkoot Y,..., Y n Exp(λ. Kirjoita vastaava tilastollisen mallin lauseke (ytf. Muodosta sitten
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.
LisätiedotIlkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
LisätiedotARMA(p, q)-prosessin tapauksessa maksimikohdan määrääminen on moniulotteinen epälineaarinen optimointiongelma.
missä µ = c φ ja C j,k = Γj k) = σ 2 φj k φ 2. ARMAp, q)-prosessin tapauksessa maksimikohdan määrääminen on moniulotteinen epälineaarinen optimointiongelma. Käytännösssä optimointi tehdään numeerisesti
LisätiedotLause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.
Määritelmä 4.3. Estimaattoria X(Y ) nimitetään lineaariseksi projektioksi, jos X on lineaarinen kuvaus ja E[(X X(Y )) Y] 0 }{{} virhetermi Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Lisätiedot6.1 Autokovarianssifunktion karakterisaatio aikatasossa
6. Spektraalianalyysi Tällä kurssilla on käyty läpi eräitä stationääristen aikasarjojen ominaispiirteitä, kuten aikasarjaa mallintavan stokastisen prosessin X t odotusarvo E[X t ] ja autokovarianssifunktio
LisätiedotJohdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
LisätiedotParametrin estimointi ja bootstrap-otanta
Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
LisätiedotJohdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2004) 1 Yleinen lineaarinen malli Usean selittäjän lineaarinen regressiomalli Yleisen lineaarisen mallin matriisisesitys Yleisen
LisätiedotTodennäköisyyden ominaisuuksia
Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset
LisätiedotARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon
TAMPEREEN YLIOPISTO Pro gradu -tutkielma Laura Lizana Bister ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon Informaatiotieteiden laitos Matematiikka Syyskuu 2011 Tampereen yliopisto Informaatiotieteiden
LisätiedotIdentifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotKoska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.
24.11.2006 1. Oletetaan, että kaksiulotteinen satunnaismuuttuja µ noudattaa kaksiulotteista normaalijakaumaa. Oletetaan lisäksi, että satunnaismuuttujan regressiofunktio satunnaismuuttujan suhteen on ݵ
LisätiedotIlkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio
Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
Lisätiedot