805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet (R): AR-mallin estimointi Yule-Walker-menetelmällä. Ljung-Box-testisuureen käyttö. Diskreetti Fourier-muunnos. Esitiedot: Kompleksilukujen perusominaisuudet. 1. Olkoon Γ : Z C heikosti stationäärisen kompleksiarvoisen stokastisen prosessin autokovarianssifunktio. a) Näytä, että Γ(τ) = Γ( τ), τ = 0, 1, 2,.... b) Näytä, että Γ on ei-negatiivisesti definitti eli m k,j=1 kaikilla z k, z j C ja m N. z k Γ(k j)z j 0 2. Mikä on stokastisen prosessin X t = 2 + ε t 0.7ε t 3, missä valkoinen kohina ε t N(0, 1) ja t Z, spektritiheysfunktio? 3. Stokastisen prosessin autokovarianssifunktiota aiotaan mallintaa funktiolla a kun k = 0 Γ(k) = b kun k = ±5 0 muulloin. Kannattaako vakioille a, b R asettaa jotakin rajoituksia? 1
R 1. Tarkista, onko R-paketti nimeltä astsa asennettu syöttämällä library() 2. Jos paketti astsa ei ole listalla, asenna se syöttämällä install.packages( astsa ) 3. Ota käyttöön R-paketti astsa syöttämällä library("astsa") 4. Tarkista, että ladattujen datasettien joukosssa on datasetti nimeltä cmort. Kertausta: Komento data() näyttää kaikki ladatut datasetit. Taustaa: Aikasarja cmort sisältää sydänperäisiin sairauksiin kuolleiden keskimääräisen viikottaisen lukumäärän Los Angelesin seudulla vuosina 1970-1979. 5. Tarkista, onko datasetti nimeltä cmort aikasarja-luokan ts olio. Taustaa: Komento class(b) näyttää, mikä on olion b luokka. 6. Kokeile Yule-Walker-estimointimenetelmää aikasarjalle cmort syöttämällä ar malli<-ar(cmort,method=c("yule-walker"),order.max=2) Taustaa: komento ar(b, method=c("yule-walker"), order.max=p) estimoi Yule-Walker-menetelmällä AR(p)-mallin X t = c + φ 1 X t 1 + + φ p X t p + ε t, parametrit (φ 1,..., φ p ), kun mallin aste p=p ja aikasarjasta on saatu havainto b. Komento palauttaa ar-luokan olion. 2
7. Tarkastele ar-luokan olion ar malli osien nimiä komennolla names(ar malli) Taulukko 1: ar-luokan olion ar malli osien tulkinta ar malli$ar (φ 1, φ 2 ) ar malli$resid Estimoidun mallin residuaalit ar malli$var.pred Prediktiovarianssi 8. Tarkastele estimoidun mallin residuaaleja ar malli$resid 9. Kuinka monella indeksillä residuaalin arvo puuttuu? Miksi? Taustaa: R käyttää symbolia NA kun kyseinen luku puuttuu. Kertausta: Yule-Walker-menetelmällä estimoidun AR(2)-prosessin residuaalit ovat prosessin (X t µ) φ 1 (X t 1 µ) φ 2 (X t 2 µ) }{{} prediktio (1) arvoja, kun X t saa havaittuja arvoja. Estimaatit φ k on laskettu Yule- Walker-menetelmällä ja µ on havaitun aikasarjan keskiarvo. 10. Määritä prediktiovarianssilla standartoidut residuaalit. Taustaa: Standardoinnissa ajatuksena on jakaa satunnaismuuttuja Z, jonka varianssi on σ 2, standardipoikkeamalla σ, jolloin standartoidun satunnaismuuttujan Z/σ varianssi on yksi. 11. Tutustu Ljung-Box testisuureen syntaksiin syöttämällä?box.test Kertausta: Ljung-Box-testi testaa standardoitujen residuaalien riippumattomuutta. Estimoitu malli sopii dataan hyvin, jos residuaalit ovat lähes riippumattomia. 12. Laske Ljung-Box-testisuureen arvo aikasarjan cmort AR-mallin standartoiduille residuaaleille, lagin arvolla 15. 3
Taustaa: Ljung-Box-testisuureen voi laskea residuaaleille komennolla LB <- Box.test(as.numeric(ar malli$resid[3:508]), lag = h, type = c("ljung-box"), fitdf = 2) missä fitdf=2 on mallin aste, h on käyttäjän valitsema testissä käytettävien lagien lukumäärä (<< aikasarjan pituus). Taulukko 2: Ljung-Box testin tulkinta LB$p.value Testin p-arvo Jos p-arvo > 0.05 ei esiinny tilastollisesti merkittävää riippuvuutta Jos p-arvo < 0.05 niin tilastollisesti merkittävää riippuvuutta esiintyy. 13. Piirrä prediktiovarianssilla standardoitujen residuaalien ns. QQkuvio syöttämällä qqnorm(ar malli$resid/sqrt(ar malli$var.pred)) Taustaa: Residuaalien tulisi olla riippumattomia ja normaalisti jakautuneita, jotta estimoitu malli kuvaa aikasarjaa hyvin. Residuaalien jakauman normaalisuuden tarkasteluun löytyy visuaalinen työkalu ns. QQ-kuvio (eng. quantile-quantile plot), jossa residuaalien jakaumaa verrataan normaalijakaumaan. Normaalijakautuneille residuaaleille QQ-kuvio on suora y = x. Poikkeamat suoralta vihjaavat siihen, että residuaalien jakaume ei ole normaali. 4
Harjoitustyö 4 (Palautus 4.12 mennessä) Yleiset ohjeet: Tee vaaditut tehtävät ja laadi raportti. Raportti on lyhyt johdonmukainen selvitys tehtävästä (max 2 sivua) ja se voi sisältää esim. taustaa tehtävälle, pohdintoja, johtopäätöksiä tai yhteenvedon esimerkkiajojen tuloksista. Raportin saa kirjoittaa myös käsin. Opettaja voi tarvittaessa pyytää raporttiin lisämateriaalia. Laskennallinen tehtävä toteutetaan R-ohjelmistolla. Opettajalle palautetaan selkeästi kommentoitu koodi. Harjoitustyötä saa tehdä yhteistyössä muiden kanssa. Opiskelijan on kuitenkin pystyttävä tarvittaessa osoittamaan oman osaamisensa taso. R-koodi ja raportti on palautettava määräaikaan mennessä opettajalle (sari.lasanen@oulu.fi). Harjoitustöitä on yhteensä 6 kappaletta. Yhdestä harjoitustyöstä voi saada joko 0 tai 4 pistettä. 1. Estimoi AR(1)-mallin parametrit Yule-Walker menetelmällä aikasarjalle cmort. 2. Piirrä prediktiovarianssilla standardoitujen residuaalien QQ-kuvio. 3. Laske Ljung-Box-testisuure lagin arvoilla 5,10 ja 15. 5