805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

Samankaltaiset tiedostot
805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 5 (2016)

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

6.2.3 Spektrikertymäfunktio

6.1 Autokovarianssifunktion karakterisaatio aikatasossa

Sovellettu todennäköisyyslaskenta B

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Harjoitus 2: Matlab - Statistical Toolbox

Vastaavasti voidaan määritellä korkeamman kertaluvun autoregressiiviset prosessit.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Identifiointiprosessi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

4. Tietokoneharjoitukset

9. Tila-avaruusmallit

4. Tietokoneharjoitukset

Sovellettu todennäköisyyslaskenta B

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1

STOKASTISET PROSESSIT

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

tilastotieteen kertaus

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

Testejä suhdeasteikollisille muuttujille

ARMA mallien ominaisuudet ja rakentaminen

Regressioanalyysi. Kuusinen/Heliövaara 1

pisteet Frekvenssi frekvenssi Yhteensä

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Väliestimointi (jatkoa) Heliövaara 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Harjoitus 7: NCSS - Tilastollinen analyysi

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

6.5.2 Tapering-menetelmä

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

4.0.2 Kuinka hyvä ennuste on?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Johdatus regressioanalyysiin. Heliövaara 1

Normaalijakaumasta johdettuja jakaumia

Harjoitus 7 : Aikasarja-analyysi (Palautus )

9. laskuharjoituskierros, vko 12-13, ratkaisut

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä

ARMA mallien ominaisuudet ja rakentaminen

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

Sovellettu todennäköisyyslaskenta B

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

3. Teoriaharjoitukset

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Harjoitukset 4 : Paneelidata (Palautus )

Sovellettu todennäköisyyslaskenta B

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Satunnaismuuttujien muunnokset ja niiden jakaumat

Ilkka Mellin Aikasarja-analyysi Stationaariset stokastiset prosessit

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

ARMA(p, q)-prosessin tapauksessa maksimikohdan määrääminen on moniulotteinen epälineaarinen optimointiongelma.

Identifiointiprosessi

11 Raja-arvolauseita ja approksimaatioita

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Sovellettu todennäköisyyslaskenta B

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Transkriptio:

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet (R): AR-mallin estimointi Yule-Walker-menetelmällä. Ljung-Box-testisuureen käyttö. Diskreetti Fourier-muunnos. Esitiedot: Kompleksilukujen perusominaisuudet. 1. Olkoon Γ : Z C heikosti stationäärisen kompleksiarvoisen stokastisen prosessin autokovarianssifunktio. a) Näytä, että Γ(τ) = Γ( τ), τ = 0, 1, 2,.... b) Näytä, että Γ on ei-negatiivisesti definitti eli m k,j=1 kaikilla z k, z j C ja m N. z k Γ(k j)z j 0 2. Mikä on stokastisen prosessin X t = 2 + ε t 0.7ε t 3, missä valkoinen kohina ε t N(0, 1) ja t Z, spektritiheysfunktio? 3. Stokastisen prosessin autokovarianssifunktiota aiotaan mallintaa funktiolla a kun k = 0 Γ(k) = b kun k = ±5 0 muulloin. Kannattaako vakioille a, b R asettaa jotakin rajoituksia? 1

R 1. Tarkista, onko R-paketti nimeltä astsa asennettu syöttämällä library() 2. Jos paketti astsa ei ole listalla, asenna se syöttämällä install.packages( astsa ) 3. Ota käyttöön R-paketti astsa syöttämällä library("astsa") 4. Tarkista, että ladattujen datasettien joukosssa on datasetti nimeltä cmort. Kertausta: Komento data() näyttää kaikki ladatut datasetit. Taustaa: Aikasarja cmort sisältää sydänperäisiin sairauksiin kuolleiden keskimääräisen viikottaisen lukumäärän Los Angelesin seudulla vuosina 1970-1979. 5. Tarkista, onko datasetti nimeltä cmort aikasarja-luokan ts olio. Taustaa: Komento class(b) näyttää, mikä on olion b luokka. 6. Kokeile Yule-Walker-estimointimenetelmää aikasarjalle cmort syöttämällä ar malli<-ar(cmort,method=c("yule-walker"),order.max=2) Taustaa: komento ar(b, method=c("yule-walker"), order.max=p) estimoi Yule-Walker-menetelmällä AR(p)-mallin X t = c + φ 1 X t 1 + + φ p X t p + ε t, parametrit (φ 1,..., φ p ), kun mallin aste p=p ja aikasarjasta on saatu havainto b. Komento palauttaa ar-luokan olion. 2

7. Tarkastele ar-luokan olion ar malli osien nimiä komennolla names(ar malli) Taulukko 1: ar-luokan olion ar malli osien tulkinta ar malli$ar (φ 1, φ 2 ) ar malli$resid Estimoidun mallin residuaalit ar malli$var.pred Prediktiovarianssi 8. Tarkastele estimoidun mallin residuaaleja ar malli$resid 9. Kuinka monella indeksillä residuaalin arvo puuttuu? Miksi? Taustaa: R käyttää symbolia NA kun kyseinen luku puuttuu. Kertausta: Yule-Walker-menetelmällä estimoidun AR(2)-prosessin residuaalit ovat prosessin (X t µ) φ 1 (X t 1 µ) φ 2 (X t 2 µ) }{{} prediktio (1) arvoja, kun X t saa havaittuja arvoja. Estimaatit φ k on laskettu Yule- Walker-menetelmällä ja µ on havaitun aikasarjan keskiarvo. 10. Määritä prediktiovarianssilla standartoidut residuaalit. Taustaa: Standardoinnissa ajatuksena on jakaa satunnaismuuttuja Z, jonka varianssi on σ 2, standardipoikkeamalla σ, jolloin standartoidun satunnaismuuttujan Z/σ varianssi on yksi. 11. Tutustu Ljung-Box testisuureen syntaksiin syöttämällä?box.test Kertausta: Ljung-Box-testi testaa standardoitujen residuaalien riippumattomuutta. Estimoitu malli sopii dataan hyvin, jos residuaalit ovat lähes riippumattomia. 12. Laske Ljung-Box-testisuureen arvo aikasarjan cmort AR-mallin standartoiduille residuaaleille, lagin arvolla 15. 3

Taustaa: Ljung-Box-testisuureen voi laskea residuaaleille komennolla LB <- Box.test(as.numeric(ar malli$resid[3:508]), lag = h, type = c("ljung-box"), fitdf = 2) missä fitdf=2 on mallin aste, h on käyttäjän valitsema testissä käytettävien lagien lukumäärä (<< aikasarjan pituus). Taulukko 2: Ljung-Box testin tulkinta LB$p.value Testin p-arvo Jos p-arvo > 0.05 ei esiinny tilastollisesti merkittävää riippuvuutta Jos p-arvo < 0.05 niin tilastollisesti merkittävää riippuvuutta esiintyy. 13. Piirrä prediktiovarianssilla standardoitujen residuaalien ns. QQkuvio syöttämällä qqnorm(ar malli$resid/sqrt(ar malli$var.pred)) Taustaa: Residuaalien tulisi olla riippumattomia ja normaalisti jakautuneita, jotta estimoitu malli kuvaa aikasarjaa hyvin. Residuaalien jakauman normaalisuuden tarkasteluun löytyy visuaalinen työkalu ns. QQ-kuvio (eng. quantile-quantile plot), jossa residuaalien jakaumaa verrataan normaalijakaumaan. Normaalijakautuneille residuaaleille QQ-kuvio on suora y = x. Poikkeamat suoralta vihjaavat siihen, että residuaalien jakaume ei ole normaali. 4

Harjoitustyö 4 (Palautus 4.12 mennessä) Yleiset ohjeet: Tee vaaditut tehtävät ja laadi raportti. Raportti on lyhyt johdonmukainen selvitys tehtävästä (max 2 sivua) ja se voi sisältää esim. taustaa tehtävälle, pohdintoja, johtopäätöksiä tai yhteenvedon esimerkkiajojen tuloksista. Raportin saa kirjoittaa myös käsin. Opettaja voi tarvittaessa pyytää raporttiin lisämateriaalia. Laskennallinen tehtävä toteutetaan R-ohjelmistolla. Opettajalle palautetaan selkeästi kommentoitu koodi. Harjoitustyötä saa tehdä yhteistyössä muiden kanssa. Opiskelijan on kuitenkin pystyttävä tarvittaessa osoittamaan oman osaamisensa taso. R-koodi ja raportti on palautettava määräaikaan mennessä opettajalle (sari.lasanen@oulu.fi). Harjoitustöitä on yhteensä 6 kappaletta. Yhdestä harjoitustyöstä voi saada joko 0 tai 4 pistettä. 1. Estimoi AR(1)-mallin parametrit Yule-Walker menetelmällä aikasarjalle cmort. 2. Piirrä prediktiovarianssilla standardoitujen residuaalien QQ-kuvio. 3. Laske Ljung-Box-testisuure lagin arvoilla 5,10 ja 15. 5