ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon

Koko: px
Aloita esitys sivulta:

Download "ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon"

Transkriptio

1 TAMPEREEN YLIOPISTO Pro gradu -tutkielma Laura Lizana Bister ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon Informaatiotieteiden laitos Matematiikka Syyskuu 2011

2 Tampereen yliopisto Informaatiotieteiden yksikkö LIZANA BISTER, LAURA: ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon Pro gradu -tutkielma, 48 s., 3 liites. Matematiikka Syyskuu 2011 Tiivistelmä Tutkielmassa käsitellään stokastisia malleja, joita voidaan käyttää esimerkiksi osakkeiden tulevien arvojen ennustamiseen. Malleja on useita erilaisia ja tässä tutkielmassa keskitytään ARIMA- ja GARCH-malleihin, jotka muodostuvat useammasta eri osasta. Tutkielmassa tutustutaan mallien ymmärtämisen kannalta tärkeisiin käsitteisiin. Tutkielman alussa on luku, johon on koottu erilaisia määritelmiä ja tietoja, joita tarvitaan tutkielman edetessä. Ensimmäiseksi tutustutaan ARIMA-malliin, joka on lineaarinen malli. ARIMAmallissa varianssit pysyvät vakiona. Satunnaisuutta malliin tuo lähinnä valkoinen kohina. Tarkastellaan aineistoon sopivan ARIMA-mallin valitsemista ja valitun mallin sovittamista aineistoon. Toiseksi tutustutaan GARCHmalliin, joka on epälineaarinen malli. GARCH-mallissa otetaan huomioon volatiliteetti, eli niin sanottu vaihtelu tai heilahtelu. GARCH-mallin voi rakentaa ARIMA-mallin päälle. GARCH-mallissa varianssit vaihtelevat, ne muuttuvat havaintoarvon ja edellisen varianssin arvon mukaan. GARCH-mallit soveltuvat hyvin osakkeiden volatiliteetin ennustamiseen. Lisäksi käsitellään aineistoon sopivan GARCH-mallin valitsemista. Kolmanneksi etsitään sopiva malli Nokian osakeaineistoon. Etsintä aloitetaan ARIMA-mallista, joka sisällytetään GARCH-malliin. Saatu malli sovitetaan aineistoon ja valitun mallin avulla ennustetaan osakkeen tulevia arvoja. Lisäksi osakkeelle määritellään Value at Risk -luku, joka kertoo suurimmasta mahdollisesta menetyksestä epätavallisessa tilanteessa. 2

3 Sisältö 1 Johdanto 4 2 Esitietoja Stationaarisuus Korrelaatio ja autokorrelaatiofunktio Valkoinen kohina Satunnaiskulku Informaatiokriteerit Uskottavuus ARIMA-malli Autoregressiivinen malli AR Liukuvan keskiarvon malli MA Autoregressiivinen liukuvan keskiarvon malli ARMA Autoregressiivinen integroitu liukuvan keskiarvon malli ARIMA ARIMA-mallin sovittaminen aineistoon GARCH-malli Volatiliteetti Autoregressiivinen ehdollinen heteroskedastinen malli ARCH Yleinen autoregressiivinen ehdollinen heteroskedastinen malli GARCH Integroitu yleinen autoregressiivinen ehdollinen heteroskedastinen malli IGARCH GARCH-mallin sovittaminen aineistoon Osakeaineisto Mallin määrittäminen Value at Risk Osakkeen Value at Risk -luvun määrittäminen Yhteenveto 47 Viitteet 48 Liite 49 3

4 1 Johdanto Tämän tutkielman luvussa 2 käsitellään niitä esitietoja, joita tarvitaan tutkielman lukemiseen. Aikasarja-analyysissä keskeisimpiä käsitteitä ovat stationaarisuus ja riippuvuus. Luvussa 2 esitellään määritelmiä, joihin aikasarjamallit perustuvat. Määritelmät ovat tärkeitä aikasarjojen ymmärtämisen ja toimivuuden kannalta. Tutkielman luvussa 3 tutkitaan ARIMA-mallin muodostumista. Ensimmäiseksi esitellään AR- ja MA-mallit, joista voidaan koota ARMA-malli. ARMA-mallia integroimalla saadaan ARIMA-malli. ARIMA-mallin avulla voidaan tutkia lineaaristen aikasarjojen käyttäytymistä. Luvussa 3.5 esitellään kuinka ARIMA-malli sovitetaan aineistoon. Vasta luvussa 3.5 perehdytään tarkemmin aineistoon, mallin valintaan ja mallin sopivuuden tarkasteluun residuaalien avulla. Luvussa 4 tarkastellaan GARCH-mallia, joka on epälineaarinen malli. Aluksi esitellään ARCH-malli, jonka yleistys on GARCH-malli. Luvussa 4.5 etsitään ARCH-vaikutuksia ja esitellään kuinka GARCH-malli sovitetaan aineistoon. Luvussa 5 tarkastellaan Nokian osakkeen arvoa. Osakkeen arvosta koostetaan aineisto, johon sijoitetaan ensin ARIMA- ja sitten GARCH-malli. Saadun mallin avulla ennustetaan osakkeen tulevia arvoja. Lisäksi määritellään osakkeelle Value at Risk -luku. Tutkielman lukijalta edellytetään perustiedot matematiikasta ja tilastotieteestä. Matematiikan osalta peruskäsitteitä ovat esimerkiksi yksikköjuuri ja differointi. Tilastotieteen peruskäsitteisiin luetaan muun muassa odotusarvo ja varianssi. Lukijan oletetaan tuntevan matematiikan ja tilastotieteen yleisesti käytössä olevat merkintätavat. Tutkielmassa käytetään esimerkkeihin R-ohjelmistosta löytyviä aineistoja austres ja lynx. Aineistot esitellään liitteessä. Aineistoja muokataan ja käsitellään malleille soveltuvaan muotoon vasta luvuissa 3.5 ja 4.5. Ennen sitä aineistoihin sovitetaan malleja esimerkinomaisesti. Tutkielmassa aineistojen käsittelyyn käytetään R-ohjelmistoa. Tutkielman päälähteet ovat Shumwayn ja Stofferin kirja Time Series Analysis and Its Applications With R Examples ja Tsayn kirja Analysis of Financial Time Series. Keskeisessä osassa on myös Koskelan, Ronkaisen ja Puustellin julkaisu Equity and interest rate models in long-term insurance simulations. 2 Esitietoja Tässä luvussa esitellään aikasarja-analyysissa useasti käytettyjä määritelmiä. Näitä määritelmiä ja tietoja tarvitaan tutkielman lukemisessa. Määritelmät on annettu vain yleisluontoisesti. Tutkielmassa käytetään merkintää x t. Tämä merkintä voi tarkoittaa sekä 4

5 aikasarjaa, että sen yksittäistä havaintoa. Kun kyseessä on yksittäinen havainto, niin kyseinen havainto voi olla satunnaismuuttuja tai sen toteuma. Asianyhteydestä ilmenee kumpi. 2.1 Stationaarisuus Aikasarjan x t sanotaan olevan vahvasti stationaarinen jos havaintojen (x t1, x t2, x t3,..., x tk ) yhteisjakauma on sama kuin havaintojen (x t1 +h, x t2 +h, x t3 +h,..., x tk +h) yhteisjakauma kaikille k = 1, 2,..., kaikille ajanhetkille t 1,..., t k ja kaikille siirtymille h = 0, ±1, ±2,.... Vahvasti stationaarinen aikasarja siis pysyy muuttumattomana ajan muutoksien suhteen. Aikasarjan x t sanotaan olevan heikosti stationaarinen, jos sekä muuttujan x t keskiarvo että muuttujien x t ja x t h välinen kovarianssi, ovat ajan suhteen muuttumattomia, missä luku h on mielivaltainen kokonaisluku. Sarja x t on siis heikosti stationaarinen, jos odotusarvo E(x t ) = µ on vakio ja Cov(x t, x t h ) = γ h on riippuva vain luvusta h. Aikasarjojen oletetaan usein olevan heikosti stationaarisia. Tämä sallii tehdä ennusteita tulevista havainnoista. Vahvaa stationaarisuutta on vaikea todentaa empiirisesti.[6, s. 30] Tässä tutkielmassa heikosta stationaarisuudesta puhutaan stationaarisuutena. Erikseen mainitaan, jos stationaarisuus merkitsee vahvaa stationaarisuutta. 2.2 Korrelaatio ja autokorrelaatiofunktio Korrelaatio mittaa satunnaismuuttujien välistä lineaarista riippuvuutta. Muuttujien u ja v välistä lineaarista riippuvuutta merkitään korrelaatiokertoimen avulla ρ u,v. Korrelaatiokerroin saa arvoja väliltä [ 1, 1]. Lisäksi ρ u,v = ρ v,u. Jos muuttujien välinen korrelaatiokerroin saa arvon 0, niin muuttujat ovat lineaarisesti riippumattomat. [6, s. 30] Määritelmä 2.1. (ks. [6, s. 30]) Kahden satunnaismuuttujan u ja v välinen korrelaatiokerroin määritellään kaavalla ρ u,v = Cov(u, v) V ar(u)v ar(v) = E[(u µ u)(v µ v )] E(u µ u ) 2 E(v µ v ), 2 missä µ u ja µ v ovat muuttujien u ja v odotusarvot. Varianssien oletetaan olevan olemassa. Oletetaan, että x t on heikosti stationaarinen aikasarja. Tällöin havaintojen x t ja x t h välistä lineaarista riippuvuutta tarkasteltaessa yleistetään korrelaatio autokorrelaatioksi. Havaintojen x t ja x t h välistä korrelaatiokerrointa merkitään ρ h. Heikon stationaarisuuden vuoksi funktio ρ h riippuu vain suureesta h. [6, s. 31] 5

6 Määritelmä 2.2. (ks. [6, s. 31]) Autokorrelaatiofunktio ACF (autocorrelation function) määritellään kaavalla ρ h = Cov(x t, x t h ) V ar(x t )V ar(x t h ) = Cov(x t, x t h) V ar(x t ) = γ h γ 0, missä ρ h on korrelaatiokerroin, joka mittaa muuttujien x t ja x t h välistä riippuvuutta. Selvästi ρ 0 = 1, ρ h = ρ h ja 1 ρ h 1. Määritelmässä oletetaan, että aikasarja x t on heikosti stationaarinen. Edellä on myös käytetty heikosta stationaarisuudesta seuraavaa ominaisuutta, että V ar(x t ) = V ar(x t h ). Määritelmä 2.3. (ks. [5, s. 107]) Osittaisautokorrelaatiofunktiota PACF (partial autocorrelation function) merkitään parametrillä φ hh, kun h = 1, 2,... ja siinä oletetaan, että aikasarja x t on heikosti stationaarinen. PACF määritellään kaavoilla φ 11 = Corr(x 1, x 0 ) = ρ(1) ja φ hh = Corr(x h x h 1 h, x 0 x h 1 0 ), kun h 2. Kaavassa merkintä Corr(u, v) tarkoittaa korrelaatiokerrointa ρ u,v, x h 1 h = E(x h x 1,..., x h 1 ) ja x h 1 0 = E(x 0 x 1,..., x h 1 ). Nyt sekä x h x h 1 h, että x 0 x h 1 0 ovat riippumattomia sarjan (x 1, x 2,..., x h 1 ) kanssa. Stationaarisuuden seurauksena parametri φ hh on ehdollinen korrelaatio muuttujien x t ja x t h välillä. 2.3 Valkoinen kohina Sarjaa w t kutsutaan valkoiseksi kohinaksi (white noise) jos w t koostuu samoin jakautuneista satunnaismuuttujista, joilla on odotusarvo 0 ja äärellinen varianssi. Merkitään w t WN. Lisäksi jos w t koostuu riippumattomista muuttujista ja se on jakautunut odotusarvonaan 0 ja varianssina σ 2, niin merkitään w t iid(0, σ 2 ). Tätä sarjaa kutsutaan valkoiseksi riippumattomaksi kohinaksi. Jos w t on normaalijakautunut odotusarvonaan 0 ja varianssina σ 2, niin sarjaa kutsutaan normaaliseksi valkoiseksi kohinaksi. Merkitään w t iidn(0, σ 2 ). [5, s. 12] Esimerkki 2.1. Kuva 1 on normaalisesta valkoisesta kohinasta. Siinä on 500 havaintoa prosessista iidn(0, 1). 2.4 Satunnaiskulku Mallia, jolla voidaan analysoida suuntausta, kutsutaan satunnaiskuluksi (Random walk). Malli koostuu muuttujan x t edellisestä arvosta ja valkoisesta kohinasta. Siitä johtuukin nimi satunnaiskulku. Jos malliin otetaan mukaan 6

7 w Time trendi, niin malli on muotoa Kuva 1: Normaalinen valkoinen kohina. x t = δ + x t 1 + w t, missä t = 1, 2,..., alkuehto on x 0 = 0 ja w t on valkoista kohinaa. Vakiota δ kutsutaan trendiksi (drift). Tällöin mallia kutsutaan satunnaiskuluksi trendillä. Jos δ = 0, niin kyseessä on normaali satunnaiskulku. [5, s ] Satunnaiskulkumalli on hyvin tunnettu esimerkki epästationaarisesta yksikköjuurisesta aikasarjasta [6, s. 72]. Esimerkki 2.2. Kuvassa 2 on satunnaiskulku ilman trendiä. Siinä on 200 havaintoa prosessista iidn(0, 1). 2.5 Informaatiokriteerit Mallien soveltuvuutta aineistoon voidaan tarkastella erilaisten informaatiokriteerien avulla. Akaiken informaatiokriteerin, AIC (Akaike s Information Criterion), tarkoituksena on löytää tasapaino mallin sovitusvirheen ja parametrien lukumäärän välillä. [5, s. 53] Määritelmä 2.4. (ks. [5, s. 53]) Akaiken informaatiokriteeri määritellään kaavalla AIC = ln(ˆσ k) 2 + n + 2k, n missä ˆσ k 2 = RSS k, RSS n k on residuaalien neliöiden summa, k on parametrien lukumäärä mallissa ja n on havaintojen lukumäärä. 7

8 x Time Kuva 2: Satunnaiskulku ilman trendiä. Akaiken informaatiokriteerin saama pienin arvo määrittelee parhaimman mallin aineistolle, toisin sanoen parhaimman mallin asteluvut. Akaiken informaatiokriteeri voi kuitenkin käyttää liikaa parametrejä. Tämän virheen välttämiseksi on kehitetty Korjattu Akaiken informaatiokriteeri, AICC (Akaike s Information Criterion Bias Corrected). (Katso N. Sugiuran teos Further analysis of the data by Akaikes s information criterion and the finite corrections (1978)) [5, s ] Määritelmä 2.5. (ks. [5, s. 54]) Korjattu Akaiken informaatiokriteeri määritellään kaavalla AICC = ln(ˆσ k) 2 + n + k n k 2, missä ˆσ k 2 = RSS k, k on parametrien lukumäärä mallissa ja n on havaintojen n lukumäärä. Korjatun Akaiken informaatiokriteerin on todettu olevan ylivertainen pienempiä aineistoja tarkasteltaessa. Lisäksi on kehitetty Schwarzin informaatiokriteeri, SIC (Schwarz s Information Criterion), joka onnistuu antamaan hyviä astelukuja malleille suurista aineistoista. Schwarzin informaatiokriteeriä kutsutaan myös Bayes-informaatiokriteeriksi, BIC (Bayesian Information Criterion). [5, s. 54] Määritelmä 2.6. (ks. [5, s. 54]) Schwarzin informaatiokriteeri määritellään kaavalla SIC = ln(ˆσ k) 2 + k ln n n, missä ˆσ k 2 = RSS k, k on parametrien lukumäärä mallissa ja n on havaintojen n lukumäärä. 8

9 Tutkielmassa käytetään jatkossa lyhennettä BIC viitattaessa määritelmään Uskottavuus Oletetaan, että x t on kausaalinen ARMA(p, q)-prosessi (katso luku 3.3 ja määritelmä 3.7), jossa w t iidn(0, σ 2 w). Olkoon lisäksi β = (µ, φ 1,..., φ p, θ 1,..., θ q ) parametreistä muodostettu (p + q + 1)-vektori. Mallin uskottavuusfunktio on missä L(β, σ 2 w) = (2πσ 2 w) n/2 (r 0 1(β)r 1 2(β) r n 1 n Tässä sekä x t 1 t n S(β) = ( (x t x t 1 t (β)) 2 ). t=1 rt t 1 (β) ovat vektorin β funktioita, x t 1 (β)) 1/2 exp ( S(β) ), 2σw 2, että rt t 1 t = E(x t x 1,..., = V ar(x t x 1,..., x t 1 ). [5, s. 128] Mallin uskottavuutta käy- x t 1 ) ja rt t 1 tetään esimerkiksi määrittelemään AIC-, AICC- ja BIC-luvut. 3 ARIMA-malli Autoregressiivinen integroitu liukuvan keskiarvon malli, ARIMA(p, d, q), koostuu useasta eri vaiheesta ja mallista. Aluksi määritellään autoregressiivinen malli, AR(p), ja liukuvan keskiarvon malli, MA(q). Näistä malleista yhdistämällä saadaan autoregressiivinen liukuvan keskiarvon malli, ARMA(p, q). Integroimalla ARMA(p, q)-malli saadaan ARIMA(p, d, q)-malli, missä luku d on integroimiskertojen lukumäärä ja luvut p ja q ovat AR- ja MA-mallien asteluvut. ARMA-malleissa muuttujat ovat lineaarisesti riippuvia menneistä arvoistaan ja valkoisesta kohinasta. ARMA-mallit muodostavat hyvin kattavan ja käyttökelpoisen osan lineaarisista aikasarjamalleista. [1, s. 19] ARMA-mallit perustuvat oletukselle, että varianssit pysyvät vakioina [5, s. 280]. 3.1 Autoregressiivinen malli AR Autoregressiivisten mallien (autoregressive model) perusoletuksena on, että sarjan x t nykyinen arvo voidaan selittää muodostamalla funktio arvon x t menneistä arvoista x t 1, x t 2,..., x t p, missä p määrittää kuinka monta edellistä askelta tarvitaan, jotta voidaan ennustaa nykyinen arvo x t. Autoregressiivisissä malleissa muuttuja x t voidaan esittää selittäjien lineaarikombinaation ja virhetermin summana. [5, s. 85] 9

10 Määritelmä 3.1. (ks. [5, s ]) Yleinen autoregressiivinen astetta p oleva mallin yhtälö on muotoa x t = φ 1 x t 1 + φ 2 x t φ p x t p + w t, missä x t on stationaarinen, p on ei-negatiivinen kokonaisluku, kertoimet φ 1, φ 2,..., φ p, (φ p 0), ovat vakioita, muuttujat x t i (i = 1,..., p) ovat muuttajan x t edelliset arvot ja w t iidn(0, σ 2 ). Tässä mallin yhtälössä oletetaan, että muuttujan x t odotusarvo on 0. Merkitään AR(p). Huomataan, että jos muuttujan x t odotusarvo on erisuuri kuin 0, niin voidaan korvataan x t muuttujalla x t µ. Tällöin x t µ = φ 1 (x t 1 µ) + φ 2 (x t 2 µ) + + φ p (x t p µ) + w t tai vaihtoehtoisesti x t = φ 0 + φ 1 x t 1 + φ 2 x t φ p x t p + w t, missä φ 0 = µ(1 φ 1 φ p ). Määritelmä 3.2. (ks. [5, s. 86]) Autoregressiivinen operaattori määritellään φ(b) = 1 φ 1 B φ 2 B 2 φ p B p. Esimerkki 3.1. Yksinkertainen autoregressiivinen malli AR(1) on muotoa x t = φ 1 x t 1 + w t, missä φ 1 on vakio, muuttuja x t 1 on muuttajan x t edellinen arvo ja w t iidn(0, σ 2 ). [5, s ] Yksinkertainen autoregressiivinen malli AR(1) muistuttaa yksinkertaista lineaarista regressiomallia, missä x t on selitettävä ja x t 1 on selittävä muuttuja [6, s. 37]. Esimerkki 3.2. Tarkastellaan austres-aineistoa Australian asukasmäärästä (katso liite). Asukasmäärä näyttää olevan lineaarisesti riippuva, joten ARmalli soveltuu hyvin aineistoon. Tehdään aineistosta ensin stationaarinen differoimalla aineisto. Sovittamalla malli aineistoon saadaan AR(4)-malli, missä kertoimien arvot ovat φ 1 = 0, 4058, φ 2 = 0, 0302, φ 3 = 0, 1519, φ 4 = 0, Tällöin AR(4)-mallin yhtälö on muotoa x t = 10, , 4058 x t 1 +0, 0302 x t 2 +0, 1519 x t 3 +0, 2025 x t 4 +w t, missä vakiotermi φ 0 = 10, lasketaan vähentämällä luvusta 1 muuttujien x t 1,..., x t 4 kertoimet φ 1,..., φ 4 ja kertomalla saatu luku R-ohjelmassa 10

11 lasketulla vakiotermillä (odotusarvolla) 52, Tässä w t iidn(0, 90, 98). Kuvassa 3 on simuloitu Australian asukasmäärä AR(4)-mallin avulla. Verrataan mallin antamia arvoja todellisiin arvoihin. Lasketaan siis ensimmäisten neljän havainnon jälkeen mallin avulla seuraavien havaintojen arviot. Merkitään näitä mallin antamia havaintoarvioita muuttujalla a. Valitaan tarkastelun kohteeksi vuosien 1973, 1983, 1993 toiset vuosineljännekset. Palautetaan samalla differoitu aineisto takaisin alkuperäiseen muotoon. Tällöin a = 10, , 4058 a t 1 + 0, 0302 a t 2 + 0, 1519 a t 3 + 0, 2025 a t 4 + w t = 13580, 58 a = 10, , 4058 a t 1 + 0, 0302 a t 2 + 0, 1519 a t 3 + 0, 2025 a t 4 + w t = 16324, 43 a = 10, , 4058 a t 1 + 0, 0302 a t 2 + 0, 1519 a t 3 + 0, 2025 a t 4 + w t = 18387, 69 Todelliset arvot ovat: x = 13504, 5, x = 15393, 5 ja x = 17661, 5. Tässä tapauksessa malli AR(4) kuvaa melko hyvin asukasmäärän muutosta. Pidemmällä aikavälillä mallin antaa liian suuria arvoja. asukasmäärä Time Kuva 3: Australian asukasmäärä simuloituna AR(4)-mallilla. Huomautus. Monissa tutkielman esimerkeissä verrataan mallin antamia arvoja todellisiin arvoihin. Nämä havaintoarviot lasketaan aineiston ensimmäisen havainnon (ensimmäisten havaintojen) avulla. Ensimmäiseen havaintoon lisätään mallin antaman kaavan luvut ja muuttuja w t, joka valitaan satunnaisesti. Tutkielman esimerkeissä merkitään mallin antamia havaintoarvioita muuttujalla a. Näissä esimerkeissä verrataan aineiston todellisia arvoja mallin antamiin arvioihin mallin havainnollistamiseksi. Mallin sopivuutta tutkiessa tulee tarkastella residuaaleja. Niitä tutkitaan vasta luvussa

12 Esimerkki 3.3. Tarkastellaan lynx-aineistoa ilvesten pyydystämisestä (katso liite). Sarjassa on havaittavissa säännöllinen kausivaihtelu. Sijoitetaan ARmalli aineistoon R-ohjelmassa. Saadaan AR(8)-malli, missä kertoimien arvot ovat φ 1 = 1, 0554, φ 2 = 0, 6298, φ 3 = 0, 2105, φ 4 = 0, 1438, φ 5 = 0, 0200, φ 6 = 0, 0373, φ 7 = 0, 2342, φ 8 = 0, Tällöin AR(8)-mallin yhtälö on muotoa x t = 618, , 0554 x t 1 0, 6298 x t 2 + 0, 2105 x t 3 0, 1438 x t 4 0, 0200 x t 5 + 0, 0373 x t 6 0, 2342 x t 7 + 0, 3322 x t 8 + w t, missä vakiotermi on 618, 5879 ja w t iidn(0, ). Verrataan mallin antamia arvoja todellisiin arvoihin. Valitaan tarkastelun kohteeksi vuodet 1834 ja Tällöin a 1834 = 618, , 0554 a , 6298 a , 2105 a , 1438 a , 0200 a , 0373 a , 2342 a , 3322 a w t = 993 a 1934 = 618, , 0554 a , 6298 a , 2105 a , 1438 a , 0200 a , 0373 a , 2342 a , 3322 a w t = 2088 Todelliset arvot ovat x 1834 = 279 ja x 1934 = AR(8) malli ei sovi hyvin aineistoon, joten mallin tuottamat ennustukset eivät ole kovin tarkkoja ja luotettavia. Kuvassa 4 on simuloituna AR(8)-mallin kuvaaja. ilvesten_määrä Time Kuva 4: Ilvesten määrä simuloituna AR(8)-mallilla. 12

13 3.2 Liukuvan keskiarvon malli MA Vaihtoehtona autoregressiomallille on olemassa liukuvan keskiarvon malli. Astetta q olevan liukuvan keskiarvon malli MA(q) (moving average model) olettaa, että lineaarikombinaatio valkoisesta kohinasta w t selittää muuttujan x t. Liukuvan keskiarvon malli on stationaarinen kaikilla parametrien θ 1, θ 2,..., θ q arvoilla. [5, s ] Määritelmä 3.3. (ks. [5, s. 90]) Yleinen liukuvan keskiarvon astetta q oleva malli on muotoa x t = w t + θ 1 w t 1 + θ 2 w t θ q w t q, missä asteluku q kuvaa viiveitä liukuvassa keskiarvossa ja θ 1, θ 2,..., θ q, (θ q 0), ovat parametrejä ja w t iidn(0, σ 2 ). Merkitään MA(q). Määritelmä 3.4. (ks. [5, s. 91]) Liukuvan keskiarvon operaattori määritellään θ(b) = 1 + θ 1 B + θ 2 B θ q B q. Esimerkki 3.4. Yksinkertainen liukuvan keskiarvon malli MA(1) on muotoa x t = w t + θw t 1, missä θ on parametri ja w t iidn(0, σ 2 ). [5, s. 91] Esimerkki 3.5. Sovitetaan aineistoon lynx MA-malli asteella 1, missä kerroin on θ 1 = 0, Mallin kaava tulee muotoon x t = 1538, w t + 0, 7934 w t 1, missä w t iidn(0, ) ja luku 1538, 018 on aineiston odotusarvo. Kuvassa 5 on simuloitu MA(1)-mallin kuvaaja, jossa ensimmäinen havainto on saatu lynx-aineistosta ja sen perusteella laskettu muiden havaintojen arviot. Verrataan mallin antamia arvoja todellisiin arvoihin. Tarkastellaan edelleen vuosia 1834 ja Tällöin a 1834 = 1538, w t + 0, 7934 w t 1 = 1515, 217 a 1934 = 1538, w t + 0, 7934 w t 1 = 1553, 808. Todelliset arvot ovat x 1834 = 279 ja x 1934 = Selvästi yksinkertainen MA(1)-malli ei sovi aineistoon. Mallissa ilvesten määrä heittelehtii vain keskiarvon ympärillä ja malli ei huomioi aineistossa olevia suuria heittelyjä. Esimerkki 3.6. Sovitetaan differoituun austres-aineistoon MA(2)-malli, missä kertoimet ovat θ 1 = 0, 5331, θ 2 = 0,

14 ilvesten_määrä Time Kuva 5: MA(1)-mallin avulla simuloitu ilvesten määrä. Mallin kaava tulee tällöin muotoon x t = 52, w t + 0, 5331 w t 1 + 0, 2272 w t 2, missä muuttuja w t on jakautunut w t iidn(0, 111, 5) ja luku 52, 1064 on aineiston odotusarvo. Kuvassa 6 on simuloitu austres-aineistoon sijoitetun MA(2)-mallin kuvaaja. Verrataan mallin antamia arvoja todellisiin arvoihin. Tarkastelun kohteena ovat vuosien 1973, 1983 ja 1993 toiset vuosineljännekset. Palautetaan jälleen differoitu aineisto alkuperäiseen muotoon. Tällöin a = 52, w t + 0, 5331 w t 1 + 0, 2272 w t 2 = 13559, 36 a = 52, w t + 0, 5331 w t 1 + 0, 2272 w t 2 = 15681, 71 a = 52, w t + 0, 5331 w t 1 + 0, 2272 w t 2 = 17706, 40 Todelliset arvot ovat x = 13504, 5, x = 15393, 5 ja x = 17661, 5. MA(2)-malli kuvaa hyvin asukasmäärän muutosta. 3.3 Autoregressiivinen liukuvan keskiarvon malli AR- MA Puhtaasti autoregressiiviset mallit AR(p) ja puhtaasti liukuvan keskiarvon mallit MA(q) voivat käydä hankaliksi mallien asteiden kasvaessa. Ongelman 14

15 asukasmäärä Time Kuva 6: MA(2)-mallin avulla simuloitu asukasmäärä. poistamiseksi on kehitetty autoregressiivinen liukuvan keskiarvon malli AR- MA (autoregressive moving average model). Autoregressiivinen liukuvan keskiarvon malli niin sanotusti yhdistää autoregressio mallin ja liukuvan keskiarvon. Merkitään ARMA(p, q). [6, s. 64] Määritelmä 3.5. (ks. [5, s. 93]) Aikasarja x t on ARMA(p, q) jos se on stationaarinen ja x t = φ 1 x t 1 + φ 2 x t φ p x t p + w t + θ 1 w t 1 + θ 2 w t θ q w t q, missä φ p 0, θ q 0 ja σ 2 w > 0. Edelleen oletetaan, että w t on normaalinen valkoisen kohinan prosessi w t iidn(0, σ 2 ). Parametrejä p ja q kutsutaan ARMA-mallin asteiksi. Jos sarjan x t keskiarvo on erisuuri kuin nolla, niin yhtälö tulee muotoon x t = φ 0 +φ 1 x t 1 +φ 2 x t 2 + +φ p x t p +w t +θ 1 w t 1 +θ 2 w t 2 + +θ q w t q, missä φ 0 = µ(1 φ 1 φ p ). Huomataan, että jos aste q = 0, niin autoregressiivinen liukuvan keskiarvon malli, ARMA(p, q), palautuu autoregressio malliksi, AR(p). Vastaavasti jos aste p = 0, niin autoregressiivinen liukuvan keskiarvon malli, ARMA(p, q), palautuu liukuvan keskiarvon malliksi, MA(q). [5, s. 93] Esimerkki 3.7. Yksinkertainen autoregressiivinen liukuvan keskiarvon malli ARMA(1, 1) on muotoa x t = φ 1 x t 1 + w t + θ 1 w t 1, missä φ 1 ja θ 1 ovat parametrejä ja w t iidn(0, σ 2 ). [5, s ] 15

16 Esimerkki 3.8. Sovitetaan ARMA(4, 2)-malli differoituun aineistoon austres. Mallin parametreiksi tulee φ 1 = 0, 4765, φ 2 = 0, 7073, φ 3 = 0, 4494, φ 4 = 0, 3020, θ 1 = 0, 0192, θ 2 = 0, Mallin yhtälö tulee muotoon x t = 24, φ 1 x t 1 + φ 2 x t 2 + φ 3 x t 3 + φ 4 x t 4 + w t + θ 1 w t 1 + θ 2 w t 2 = 24, , 4765 x t 1 0, 7073 x t 2 + 0, 4494 x t 3 + 0, 3020 x t 4 + w t 0, 0192 w t 1 + 0, 9904 w t 2, missä w t iidn(0, 76, 64). Mallin vakiotermi on 24, Verrataan mallin antamia arvoja todellisiin arvoihin. Valitaan edelleen tarkastelun kohteeksi vuosien 1973, 1983, 1993 toiset vuosineljännekset. Palautetaan jälleen differoitu aineisto alkuperäiseen muotoon. Tällöin a = 24, , 4765 a t 1 0, 7073 a t 2 + 0, 4494 a t 3 + 0, 3020 a t 4 + w t 0, 0192 w t 1 + 0, 9904 w t 2 = 13506, 18 a = 24, , 4765 a t 1 0, 7073 a t 2 + 0, 4494 a t 3 + 0, 3020 a t 4 + w t 0, 0192 w t 1 + 0, 9904 w t 2 = 15509, 22 a = 24, , 4765 a t 1 0, 7073 a t 2 + 0, 4494 a t 3 + 0, 3020 a t 4 + w t 0, 0192 w t 1 + 0, 9904 w t 2 = 17468, 02. Kuten esimerkissä 3.2 kerrottiin, niin aineiston todelliset arvot ovat x = 13504, 5, x = 15393, 5 ja x = 17661, 5. Tässä tapauksessa malli ARMA(4, 2) kuvaa tarkasti aineistoa. Kuvassa 7 on simuloituna ARMA(8, 2)- mallin kuvaaja. asukasmäärä Time Kuva 7: Australian asukasmäärä simuloituna ARMA(4,2)-mallin mukaisesti. 16

17 ARMA-mallin yleinen määritelmä pitää sisällään joitakin ongelmia. Parametroinnin redundanttisuus johtaa tarpeettoman monimutkaiseen esitysmuotoon. AR-mallia muutettaessa stationaariseksi voidaan päätyä stationaariseen AR-malliin, jonka arvot riippuvat tulevista arvoista. MA-mallit eivät välttämättä ole yksikäsitteisiä. Näiden ongelmien välttämiseksi annetaan seuraavaksi määritelmiä mallien parametreille. [5, s. 94] Määritelmä 3.6. (ks. [5, s. 94]) AR- ja MA-mallien polynomit määritellään seuraavasti φ(z) = 1 φ 1 z φ p z p, φ p 0 ja θ(z) = 1 + θ 1 z + + θ q z q, θ q 0, missä z on kompleksiluku. Parametrit φ ja θ määritellään kuten aikaisemmin. Huomautetaan, että ARMA(p, q)-mallin tulee aina olla yksinkertaisimmassa muodossaan. Oletetaan siis, että parametreillä φ(z) ja θ(z) ei ole yhteisiä tekijöitä. Tällöin vältytään parametrien redundanttisuudelta. [5, s. 95] Määritelmä 3.7. (ks. [5, s. 95]) ARMA(p, q)-mallin, missä φ(b)x t = θ(b)w t, sanotaan olevan kausaalinen, jos aikasarja x t (missä t on kokonaisluku) voidaan kirjoittaa yksipuolisena lineaarisena prosessina x t = ψ j w t j = ψ(b)w t, j=0 missä ψ(b) = j=0 ψ j B j ja j=0 ψ j <. Asetetaan ψ 0 = 1. Huomautus. ARMA(p, q)-malli on kausaalinen jos ja vain jos φ(z) 0 kaikilla z 1. Summan ψ(b) kertoimet ψ j voidaan määrittää ratkaisemalla ψ(z) = j=0 ψ j z j = θ(z), z 1. φ(z) Toisin sanoen ARMA-prosessi on kausaalinen vain jos polynomin φ(z) juuret sijaitsevat yksikköympyrän ulkopuolella. Tällöin siis φ(z) = 0 vain, kun z > 1. [5, s. 95] 17

18 Määritelmä 3.8. (ks. [5, s. 95]) ARMA(p, q)-mallin, missä φ(b)x t = θ(b)w t, sanotaan olevan kääntyvä, jos aikasarja x t (missä t on kokonaisluku) voidaan kirjoittaa muodossa π(b)x t = π j x t j = w t, missä π(b) = j=0 π j B j ja j=0 π j <. Asetetaan π 0 = 1. j=0 Huomautus. ARMA(p, q)-malli on kääntyvä jos ja vain jos θ(z) 0 kaikilla z 1. Summan π(b) kertoimet π j voidaan määrittää ratkaisemalla π(z) = j=0 π j z j = φ(z), z 1. θ(z) Toisin sanoen ARMA-prosessi on kääntyvä vain jos polynomin θ(z) juuret sijaitsevat yksikköympyrän ulkopuolella. Tällöin siis θ(z) = 0 vain, kun z > 1. [5, s. 96] Esimerkki 3.9. Sovitetaan ARMA(8, 2)-malli aineistoon lynx. Mallin parametreiksi tulevat φ 1 = 1, 0554, φ 2 = 0, 6298, φ 3 = 0, 2105, φ 4 = 0, 1438, φ 5 = 0, 0200, φ 6 = 0, 0373, φ 7 = 0, 2342, φ 8 = 0, 3322, θ 1 = 0, 1160, θ 2 = 0, Mallin yhtälö tulee muotoon x t = 508, , 5054 x t 1 1, 4156 x t 2 + 0, 8427 x t 3 0, 4534 x t 4 + 0, 1416 x t 5 0, 0501 x t 6 0, 1502 x t 7 + 0, 2573 x t 8 + w t 0, 4912 w t 1 + 0, 3407 w t 2, missä w t iidn(0, ). Mallin vakiotermi on 508, Verrataan mallin antamia arvoja todellisiin arvoihin. Tarkastellaan edelleen vuosia 1834 ja Tällöin a 1834 = 508, , 5054 a , 4156 a , 8427 a , 4534 a , 1416 a , 0501 a , 1502 a , 2573 a w t 0, 4912 w t 1 + 0, 3407 w t 2 = 2203 a 1934 = 508, , 5054 a , 4156 a , 8427 a , 4534 a , 1416 a , 0501 a , 1502 a , 2573 a w t 0, 4912 w t 1 + 0, 3407 w t 2 = Todelliset arvot ovat x 1834 = 279 ja x 1934 = Kuvassa 8 on simuloituna ARMA(8, 2)-mallin kuvaaja. Malli ei sovellu hyvin aineistoon. 18

19 ilvesten_määrä Time Kuva 8: Ilvesten määrä simuloituna ARMA(8,2)-mallilla. 3.4 Autoregressiivinen integroitu liukuvan keskiarvon malli ARIMA Oletetaan, että autoregressiivisen mallin, AR, polynomilla on nollakohtana 1. Tällöin autoregressiivinen liukuvan keskiarvon malli, ARMA, laajentuu ja siitä tulee autoregressiivinen integroitu liukuvan keskiarvon malli (autoregressive integrated moving average model), ARIMA. Epästationaarisesta aikasarjasta voidaan saada stationaarinen aikasarja differoimalla. Jos aikasarja sisältää moninkertaisia yksikköjuuria, niin siitä saadaan stationaarinen differoimalla monta kertaa. [6, s ] Määritelmä 3.9. (ks. [5, s. 142]) Prosessia x t kutsutaan ARIMA(p, d, q) jos d x t = (1 B) d x t, on ARMA(p, q). Merkintä tarkoittaa differointioperaattoria ja B viiveoperaattoria. Yleisesti malli voidaan kirjoittaa muotoon φ(b)(1 B) d x t = θ(b)w t. Jos E( d x t ) = µ malli voidaan kirjoittaa muotoon missä φ 0 = µ(1 φ 1 φ p ). φ(b)(1 B) d x t = φ 0 + θ(b)w t, ARIMA(p, d, q)-mallissa muuttuja d tarkoittaa differointien lukumäärää. Esimerkki Tarkastellaan ARMA(4, 0)-mallia (toisien sanoen AR(4)- mallia) sijoitettuna austres-aineistoon (katso esimerkki 3.2). Nyt aineisto ei 19

20 ole stationaarinen. Tehdään siitä stationaarinen differoimalla. Tällöin saadaan ARIMA(4, 1, 0)-malli, jossa autoregressiivisen mallin aste on 4, liukuvan keskiarvon aste 10, ja differoimisaste on 1. ARIMA(4, 1, 0)-mallin yhtälö on nyt muotoa x t = 10, , 4058 x t 1 + 0, 0302 x t 2 + 0, 1519 x t 3 + 0, 2025 x t 4 + w t, missä w t iidn(0, 90, 98). Tarkastellaan ARIMA(4, 1, 0)-mallin kausaalisuutta. Mallin polynomi määritellään seuraavasti φ(z) = 1 φ 1 z φ 2 z 2 φ 3 z 3 φ 4 z 4 = 1 0, 4058 z 0, 0302 z 2 0, 1519 z 3 0, 2025 z 4. Piirretään polynomin juuret yksikköympyrän kanssa samaan kuvaan. Kuvas- Im(polyroot(c(1, , , , ))) Re(polyroot(c(1, , , , ))) Kuva 9: Polynomin 1 0, 4058 z 0, 0302 z 2 0, 1519 z 3 0, 2025 z 4 juuret piirrettynä yksikköympyrän kanssa samaan kuvaan. ta 9 näkyy, että polynomin juuret ovat yksikköympyrän ulkopuolella, joten 20

21 prosessi on kausaalinen. [5, s. 95] Nyt ARIMA(4, 1, 0)-malli on kausaalinen ARMA(4, 0)-malli [2, s. 45]. 3.5 ARIMA-mallin sovittaminen aineistoon Aikasarja sijoittaminen ARIMA-malliin vaatii muutamia perusasioita. Niitä ovat aineiston tutkiminen ja mahdollisesti myös muuttaminen malliin soveltuvaan muotoon. Aineiston riippuvuus ja sen soveltuminen malliin tulee tutkia. Parametrien estimointi ja virhemääritykset tulee tehdä ennen kuin voidaan tarkastella valitun mallin sopivuutta aineiston käsittelyyn. [5, s. 143] Tarkastellaan austres-aineiston soveltuvuutta ARIMA-malliin. 1. Ensimmäisenä aineisto täytyy muuttaa ARIMA-malliin soveltuvaksi. Piirretään austres-aineiston kuvaaja. Kuvasta näkyy, että asukasmäärä kasvaa lineaarisesti. Mahdolliset trendit tai kausiluontoiset vaihtelut tulee tarkistaa. Tässä aineistossa on selvästi nouseva trendi. Poistetaan trendi differoimalla aineisto. Tällöin aikasarja on stationaarinen. Aineiston saisi tehtyä stationaariseksi myös esimerkiksi logaritmoimalla, mutta tämän aineiston tapauksessa pelkkä logaritmointi ei riitä.[3, s ] 2. Toiseksi lasketaan aineistosta tarvittavat tiedot, jotta voidaan määrittää mallin asteet p ja q. Katsotaan ensiksi aineiston ACF- ja PACFkuvaajat. [1, s. 71] ACF-kuvaajassa viimeiset merkittävät hypyt ovat kohdissa lag=1 ja lag=2 ja PACF-kuvaajassa kohdassa lag=1. Tästä voidaan päätellä mallin ARMA(1, 1) tai ARMA(1, 2) soveltuvan hyvin muokattuun aineistoon. 3. Kolmanneksi aineistoon sovitetaan erilaisia malleja ja tarkastellaan niistä saatuja tuloksia. Lasketaan eri parametrien p ja q arvoilla AIC-, AICC- ja BIC-luvut. Seuraavan taulukon luvut on laskettu kaavoilla: AIC= 2 log(l) + 2 m, AICC= 2 log(l) + 2 m n/(n m 1) ja BIC= 2 log(l) + m log(n), missä L on mallin uskottavuus, m mallissa käytettyjen parametrien määrä ja n on aineiston koko. [1, s. 72] 21

22 austres Time diff(austres) Time Kuva 10: Australian asukasmäärän kuvaaja (yllä) ja differoidun asukasmäärän kuvaaja (alla). p q m AIC AICC BIC , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

23 Series ale ACF Lag Series ale Partial ACF Lag Kuva 11: Differoidun austres-aineiston ACF ja PACF. Taulukosta nähdään, että pienimmät AIC-, AICC- ja BIC-luvut saadaan kun p = 1 ja q = 1, joten valitaan ARMA(1, 1)-malli. Mallin yhtälö tulee muotoon x t = φ 0 + φ 1 x t 1 + θ 1 w t 1 + w t = 5, , 8864 x t 1 0, 5136 w t 1 + w t, missä φ 0 on vakiotermi ja w t iidn(0, 96, 11). 4. Neljänneksi analysoidaan valitun mallin residuaalit. Kuvasta 12 näkyy, että standardoidut residuaalit näyttävät riippuvilta ja niissä on ainakin yksi poikkeuksellisen pieni arvo. Jotta mallin voisi olettaa sopivan hyvin aineistoon, niin standardoitujen residuaalien pitäisi käyttäytyä valkoisen kohinan tavoin odotusarvonaan 0 ja varianssinaan 1 [1, s. 73]. Tarkistetaan vielä standardoitujen residuaalien ACF ja PACF. 23

24 standardoidut_residuaalit Time Kuva 12: Differoituun austres-aineistoon sovitetun ARMA(1, 1)-mallin standardoidut residuaalit. Kuvasta 13 näkyy, että korrelaatiota ei ole standardoitujen residuaalien välillä. Jatketaan siis ARMA(1, 1)-mallin tarkastelua. Kuvasta 14 näkyy, että molempien polynomien juuret ovat yksikköympyrän ulkopuolella. Tällöin ARMA(1,1)-malli on sekä kausaalinen että kääntyvä. Esimerkki Lasketaan edellä saadun ARMA(1, 1)-mallin antamia arvoja differoidusta aineistosta austres. Mallin yhtälö oli x t = φ 0 + φ 1 x t 1 + θ 1 w t 1 + w t = 5, , 8864 x t 1 0, 5136 w t 1 + w t, missä w t iidn(0, 96, 11). Verrataan mallin antamia arvoja todellisiin arvoihin. Tarkastellaan edelleen vuosia 1973, 1983, 1993 ja niiden ensimmäisiä ja toisia vuosineljänneksiä. Tällöin a diff = 5, , 8864 a diff , 5136 w t 1 + w t = 72, a diff = 5, , 8864 a diff , 5136 w t 1 + w t = 86, a diff = 5, , 8864 a diff , 5136 w t 1 + w t = 83, Tulee huomata, että aineisto austres differoitiin, jolloin aineisto muuttui hieman. Palautetaan lasketut arvot alkuperäiseen muotoon. a = 13385, 92 a = 15267, 72 a = 16577, 33 24

25 Series standardoidut_residuaalit ACF Lag Series standardoidut_residuaalit Partial ACF Lag Kuva 13: Differoituun austres-aineistoon sovitetun ARMA(1, 1)-mallin standardoitujen residuaalien ACF ja PACF. Todelliset arvot ovat: x = 13504, 5, x = 15393, 5 ja x = 17661, 5. Tässä tapauksessa ARMA(1, 1)-malli kuvaa hyvin asukasmäärän muutosta. Lyhyellä aikavälillä mallin antama arvio on tarkka ja luotettava. Pitkällä aikavälillä arvion luotettavuus huononee. Tällä mallilla voisi ennustaa aineiston tulevia arvoja suuntaa-antavasti, mutta ei täysin tarkasti. 4 GARCH-malli Autoregressiivinen ehdollinen heteroskedastinen malli, ARCH(m) (autoregressive conditional heteroscedastic model) ja yleistetty autoregressiivinen ehdollinen heteroskedastinen malli, GARCH(s, m) (generalized autoregressive conditional heteroscedastic model), on kehitetty volatiliteetin muutoksien mallintamiseen. Nämä mallit perustuvat tuoton tarkkailemiselle. Tällä tuotolla on yleensä muuttuva varianssi. [5, s. 280] Siitä johtuukin mallille nimi hete- 25

26 Im(polyroot(c(1, ))) Im(polyroot(c(1, ))) Re(polyroot(c(1, ))) Re(polyroot(c(1, ))) Kuva 14: Differoituun austres aineistoon sovitetun ARMA(1, 1)-malli on sekä kausaalinen, että invertoituva. roskedastinen, mikä merkitsee erivarianssista. ARCH- ja GARCH-mallit ovat yhden muuttujan volatiliteettimalleja [6, s. 110]. 4.1 Volatiliteetti Tässä tutkielmassa volatiliteetillä tarkoitetaan tuoton ehdollista keskihajontaa. Volatiliteetillä tarkoitetaan siis tuoton vaihtelua. Volatiliteetin mallintamisella voidaan parantaa parametrien arvioimisen tehokkuutta ja tarkkuutta aikavälien ennustamisessa. Osakkeiden tuottoja ajateltaessa volatiliteettiä ei voi suoraan havainnoida päivittäisestä aineistosta, koska aineisto sisältää vain yhden havainnon keskihajonnasta. Volatiliteetillä on kuitenkin tunnusomaisia piirteitä tuottojen kannalta. Volatiliteetti esiintyy ryppäinä. Joinakin aikajaksoina se on voi olla korkeampi ja joinakin matalampi. Volatiliteetti kehittyy ajan kanssa jatkuvalla tavalla. Suuret heittelyt volatiliteetissä ovat harvinaisia. Volatiliteetti ei hajaannu äärettömyyteen. Se vaihtelee jollakin tietyllä määrätyllä välillä. Tästä johtuen volatiliteetti on usein stationaarinen. Volatiliteetti reagoi erilailla suuriin vaihteluihin hinnoissa. Tästä puhutaan vipuvaikutuksena. 26

27 Nämä tunnusomaiset piirteet ovat keskeisessä osassa volatiliteettimalleja kehitettäessä. [6, s ] 4.2 Autoregressiivinen ehdollinen heteroskedastinen malli ARCH Autoregressiivisellä ehdollisella heteroskedastisellä mallilla on kaksi perusoletusta. Ensinnäkin, että tuotto y t ei ole sarjallisesti korreloituva, mutta on riippuva. Toiseksi tuoton y t riippuvuus voidaan kuvata sen aiemmista arvoista kootulla yksinkertaisella neliöllisellä funktiolla. [6, s ] Huomautus. (vrt. [6, s. 3-5]) Tässä tutkielmassa muuttujalla y t tarkoitetaan osakkeen nettotuottoa. Nettotuotto tarkoittaa siis pelkkää tuottoa. Osakkeen bruttotuottoa merkitään 1 + y t. Bruttotuotolla tarkoitetaan osakkeen arvoa ja siinä tapahtunutta muutosta (kasvua). Määritelmä 4.1. (vrt. [5, s. 280]) Olkoon x t osakkeen arvo ajanhetkellä t. Tällöin osakkeen tuotto voidaan laskea kaavalla y t = x t x t 1 x t 1. Määritelmä 4.2. (vrt. [6, s. 5]) Merkitään logaritmistä bruttotuottoa muuttujalla Y t. Määritellään muuttuja Y t kaavalla Y t = ln (1 + y t ) = ln x t x t 1 = ln x t ln x t 1, missä merkintä 1+y t tarkoittaa siis bruttotuottoa. Logaritmisellä bruttotuotolla tarkoitetaan jatkuvasti lisättyä tuottoa. Jatkossa lyhennetään logaritminen bruttotuotto ja viitataan vain logtuottoon. Log-tuotoilla Y t on tiettyjä etuja nettotuottoihin y t nähden. Ajatellaan esimerkiksi monien ajanjaksojen tuottoja. Kirjoitetaan Y t [k] = ln (1 + y t [k]) = ln [(1 + y t )(1 + y t 1 ) (1 + y t k+1 )] = ln (1 + y t ) + ln (1 + y t 1 ) + + ln (1 + y t k+1 ) = Y t + Y t Y t k+1. Merkintä y t [k] tarkoittaa tuottoa tietyllä aikavälillä, y t [k] = xt x t k x t k. Monien ajanjaksojen log-tuotto on siis yksinkertaisesti yksien ajanjaksojen logtuottojen summa. Lisäksi log-tuottojen tilastolliset ominaisuudet ovat helposti käsiteltäviä. [6, s. 5] 27

28 Määritelmä 4.3. (vrt. [6, s. 116]) Yleinen astetta m oleva ARCH-malli on muotoa y t = σ t ǫ t σ 2 t = α 0 + α 1 y 2 t α m y 2 t m, missä ǫ t iidn(0, 1) ja kertoimille α pätee, että α 0 > 0 ja α i 0 kaikille i > 0. Huomataan, että tuoton y t ehdoton keskiarvo on 0. Siis E(y t ) = E[E(y t F t 1 )] = E[σ t E(ǫ t )] = 0, missä F t 1 on ajanhetkellä t 1 ollut tietomäärä eli F t 1 = {y t 1, y t 2,... }, tuoton y t ehdoton varianssi saadaan kaavalla V ar(y t ) = E(y 2 t ) = E[E(y 2 t F t 1 )] = E(α 0 + α 1 y 2 t 1) = α 0 + α 1 E(y 2 t 1). Nyt kuitenkin y t on stationaarinen, jolloin E(y t ) = 0 ja V ar(y t ) = V ar(y t 1 ) = E(y 2 t 1). Täten V ar(y t ) = α 0 + α 1 V ar(y t ). Edelleen V ar(y t ) = α 0 1 α 1. Lisäksi vaaditaan, että 0 α 1 < 1. [6, s ] Esimerkki 4.1. Yksinkertainen ARCH(1)-malli tuotolle on y t = σ t ǫ t σ 2 t = α 0 + α 1 y 2 t 1, missä ǫ t on normaalista valkoista kohinaa eli ǫ t iidn(0, 1). Lisäksi määritellään, että α 1 ei saa olla negatiivinen, muutoin siitä voi seurata σ 2 t negatiivisuus. [5, s. 281] Huomataan, että ARCH(1)-mallit palautuvat valkoisen kohinan prosesseiksi, joilla on muuttuva ehdollinen varianssi ja tämä ehdollinen varianssi riippuu edellisistä tuotoista. Lisäksi voidaan päätellä: Jos 0 α 1 < 1, niin prosessi y t on itsessään valkoinen kohina. Tällöin sen ehdoton jakauma on symmetrisesti jakautunut luvun 0 ympärille. Jos 3α 2 1 < 1, niin muuttujan y t neliö, y 2 t, on kausaalinen AR(1)-malli. Jos taas 3α ja α 1 < 1, niin y 2 t on vahvasti stationaarinen ja sillä on ääretön varianssi. [5, s ] 28

29 Esimerkki 4.2. Tarkastellaan jälleen austres-aineistoa Australian asukasmäärästä. Aineisto logaritmoidaan ensin ja sitten differoidaan. Nyt muuttuja Y merkitsee suhteellista kasvunopeutta. Kuvassa 15 näkyvät muokatun aineiston kuvaaja sekä ACF- ja PACF-kuvaajat. PACF-kuvaajan mukaan AR(3)-malli voisi sopia hyvin aineistoon. Sovitetaan muokattuun aineistoon AR(3)-malli, jonka yhtälö on nyt muotoa Y t = 0, , 5403 Y t 1 0, 4664 Y t 2 0, 2567 Y t 3 + w t, missä w t iidn(0, 0, 04518). asukasmäärän_tuotto Time Series asukasmäärän_tuotto ACF Lag Series asukasmäärän_tuotto Partial ACF Lag Kuva 15: Logaritmoitu ja differoitu austres-aineisto Y t (kuvaaja yllä) ja muuttujan Y t ACF-kuvaaja (keskellä) ja PACF-kuvaaja (alla). Lisätään nyt AR(3)-malliin ARCH-vaikutus. (Luvussa 4.5 käsitellään miten aineistosta tutkitaan onko ARCH-vaikutuksia olemassa.) Tällöin AR(3)- 29

30 ARCH(1)-malli on muotoa Y t = 0, , Y t 1 0, Y t 2 0, Y t 3 + σ t ǫ t σ 2 t = 0, , (σ t 1 ǫ t 1 ) 2, missä ǫ t on normaalista valkoista kohinaa eli ǫ t iidn(0, 1). Verrataan mallin antamia arvoja todellisiin arvoihin. Valitaan tarkastelun kohteeksi vuosien 1973, 1983, 1993 toiset vuosineljännekset. Aineiston muokkauksen takia saadut arvot joudutaan palauttamaan alkuperäiseen muotoon käänteisillä toimenpiteillä. Tällöin saadut arvot ovat: a = 13640, 41 a = 15827, 15 a = 17525, 39. Todelliset arvot ovat x = 13504, 5, x = 15393, 5 ja x = 17661, 5. Tässä tapauksessa malli AR(3)-ARCH(1) kuvaa melko hyvin asukasmäärän muutosta lyhyellä aikavälillä, mutta pitkällä aikavälillä malli antaa liian pieniä arvoja. ARCH-mallilla on joitakin heikkouksia, kuten volatiliteetti riippuu tuottojen neliöistä. Tästä seuraa, että positiivisilla ja negatiivisillä heilahteluilla on sama vaikutus volatiliteettiin. Tämä ei kuitenkaan päde todellisuudessa. ARCH-mallit ennustavat helposti liikaa volatiliteettiä. Tämä johtuu mallien hitaasta reagoinnista tuottoihin kohdistuneisiin suuriin heilahteluihin. [6, s. 119] 4.3 Yleinen autoregressiivinen ehdollinen heteroskedastinen malli GARCH ARCH-mallia voidaan laajentaa lisäämällä kaavaan edellisen ajanhetken varianssi, σ 2 t 1, jolla on oma kerroin β. Tällöin mallista tulee yleinen autoregressiivinen ehdollinen heteroskedastinen malli, GARCH. Määritelmä 4.4. (vrt. [6, s. 132]) Yleinen GARCH(s, m)-malli on muotoa y t = σ t ǫ t m s σt 2 = α 0 + α i yt i 2 + β j σt j, 2 i=1 j=1 30

31 missä ǫ t iidn(0, 1), kertoimille α ja β pätee, että α 0 > 0, α i 0, β j 0 ja max(m,s) i=1 (α i + β i ) < 1. Oletetaan lisäksi, että α i = 0, kun i > m ja β j = 0, kun j > s. Esimerkki 4.3. Yksinkertainen GARCH(1, 1)-malli tuotolle on y t = σ t ǫ t σ 2 t = α 0 + α 1 y 2 t 1 + β 1 σ 2 t 1, missä ǫ t iidn(0, 1). Lisäksi määritellään, että α 1 + β 1 < 1. [5, s. 286] Esimerkki 4.4. Jatketaan esimerkin 4.2 tilanteesta. Sovitetaan AR(3)-malli GARCH(1, 1)-malliin. Tällöin AR(3)-GARCH(1, 1)-malli on muotoa Y t = 0, , Y t 1 0, Y t 2 0, Y t 3 + σ t ǫ t σ 2 t = 0, , (σ t 1 ǫ t 1 ) 2 + 0, σ 2 t 1, missä ǫ t iidn(0, 1). Verrataan jälleen vuosien 1973, 1983, 1993 toisia vuosineljänneksiä. Tällöin saadut arvot ovat a = 13579, 23 a = 15003, 58 a = 15959, 90. Todelliset arvot ovat x = 13504, 5, x = 15393, 5 ja x = 17661, 5. Tässä tapauksessa malli AR(3)-ARCH(1) kuvaa paremmin asukasmäärän muutosta kuin AR(3)-GARCH(1, 1). 4.4 Integroitu yleinen autoregressiivinen ehdollinen heteroskedastinen malli IGARCH Jos GARCH-esityksen AR-mallin polynomi saa arvon 1 ominaisarvokseen, niin yleinen autoregressiivinen ehdollinen heteroskedastinen malli laajentuu ja siitä tulee integroitu yleinen autoregressiivinen ehdollinen heteroskedastinen malli, IGARCH. [6, s. 141] Määritellään seuraavaksi vain IGARCH(1, 1)-malli. Määritelmä 4.5. (vrt. [6, s. 141]) Yksinkertainen IGARCH(1, 1)-malli on muotoa y t = σ t ǫ t σ 2 t = α 0 + (1 β 1 )y 2 t 1 + β 1 σ 2 t 1, missä ǫ t iidn(0, 1), kertoimelle β pätee, että 1 > β 1 > 0. Tällöin siis α 1 + β 1 = 1. 31

32 4.5 GARCH-mallin sovittaminen aineistoon Aikasarja sijoittaminen GARCH-malliin vaatii muutamia perusasioita. Ensiksi pitää muokata aineisto mallille soveltuvaan muotoon. Pitää määrittää keskiarvoyhtälö sekä mahdollisesti ARMA-malli, jolla poistetaan lineaarinen riippuvuus. Sitten voidaan testata mahdollisia ARCH-vaikutuksia. Jos vaikutuksia löytyy voidaan määrittää varsinainen ARCH-malli. [6, s. 113] Tarkastellaan lynx aineiston soveltuvuutta ensin ARMA-malliin ja sitten katsotaan onko olemassa ARCH-vaikutuksia. 1. Ensimmäisenä aineistosta selvitetään keskiarvoyhtälö testaamalla sarjan riippuvuutta[1, s. 77]. Tarkastellaan aineiston lynx ACF- ja PACFkuvaajia. Muunnetaan ensin aineistoa siten, että siitä tulee logaritmistä ilvesten määrän kasvua näyttävä aineisto. Siis muutetaan aineisto ensin määritelmän 4.1 mukaiseksi ja sitten muokataan saatu aineisto määritelmän 4.2 mukaiseksi. Kuvassa 16 näkyy, että muodostettu logaritminen bruttotuotto Y t on sarjallisesti riippuvainen. Differoidaan saatu Y t, jolloin sarjallinen riippuvuus katoaa. Tarkastellaan vielä, differoidun muuttujan Y t, merkitään DY t, ACF- ja PACF-kuvaajia. Kuvasta 17 näkyy, että sarjallista riippuvuutta ei aineistossa enää ole. Pienimmät AIC-, AICC- ja BIC-luvut saadaan kun p = 8 ja q = 3, joten valitaan ARMA(8, 3)-malli. Mallin yhtälö tulee muotoon DY t = 0, , 8449 DY t 1 1, 2394 DY t 2 + 0, 3761 DY t 3 0, 5746 DY t DY t 5 0, 4152 DY t 6 0, 1439 DY t 7 0, 2011 DY t 8 1, 5905 w t 1 + 1, 3993 w t 2 0, 8088 w t 3 + w t, missä 0, on vakiotermi ja w t iidn(0, 0, ). Saatua yhtälöä kutsutaan keskiarvoyhtälöksi, jonka avulla ARCH-mallin määrittämistä jatketaan. 2. Toiseksi tarkastellaan keskiarvoyhtälön residuaaleja. Residuaaleista etsitään ARCH-vaikutuksia.[1, s ] Standardoidaan ensimmäiseksi ARMA(8, 3)-mallin residuaalit. Kuvassa 18 on standardoitujen residuaalien kuvaaja, joka näyttää paria suurempaa piikkiä lukuun ottamatta tasaiselta. Katsotaan vielä standardoitujen residuaalien ACF-kuvaaja. Kuvasta 19 voidaan päätellä, että autokorrelaatiota ei residuaalien välillä näytä olevan. Varmistetaan asia vielä Ljung-Box-testillä, josta saadaan p-arvoksi 0, 9215, joka vahvistaa päätelmän. Nyt siis standardoitujen residuaalien välillä ei ole autokorrelaatiota. Tarkastellaan seuraavaksi neliöön korotettuja standardoituja residuaaleja. Jos neliöön korotettuja standardoitujen residuaalien välillä löytyy autokorrelaatiota voidaan olettaa, että residuaaleista löytyy ARCH-vaikutuksia. Vaikutuksia voidaan etsiä jälleen Ljung-Box-testillä. Testistä saadaan p- arvoksi 0, 0844, jolloin voidaan olettaa, että ARCH-vaikutuksia ei ole. 32

33 Y Time diff(y) Time Kuva 16: Logaritmoitu ja differoitu aineisto lynx Y t (yllä) ja differoitu Y t (alla) [6, s ]. Myös kuvan 20 kuvaajista voi nähdä, että viittauksia ARCH-vaikutuksiin ei ole. Vaikka residuaaleista ei ARCH-vaikutuksia löytynyt, niin jatketaan kuitenkin ARCH-mallin rakennusta ARMA(8, 3)- mallin pohjalta esimerkkiluontoisesti. 3. Kolmanneksi määritellään volatiliteettimalli. Tämä malli määritellään vain jos ARCH-vaikutukset ovat tilastollisesti merkittäviä.[1, s ] Tässä aineistossa tilastolliset vaikutukset eivät ole suuria, mutta määritellään volatiliteetti kuitenkin. Yhdistetään nyt siis volatiliteettimalli ja keskiarvoyhtälö eli ARMA(8, 3)-mallista saatu yhtälö, jolloin saadaan yhtälöistä yhteisarvio. Määritellään AIC-, AICC- ja BIC-lukuja pienillä asteilla. 33

34 Series diff(y) ACF Lag Series diff(y^2) ACF Lag Series diff(y) Partial ACF Lag Kuva 17: Differoidun muuttujan Y t ACF-kuvaaja (yllä) ja PACF-kuvaaja (alla), sekä toiseen korotetun differoidun muuttujan Y t ACF-kuvaaja (keskellä). s m lkm AIC AICC BIC , , , , , , , , , , , , , , , , , , , , ,6029 Taulukosta nähdään, että parhaiten aineistoon soveltuu GARCH(0, 0) ja GARCH(1, 1). Valitaan näistä GARCH(0, 0), jolloin aineistoon sopii parhaiten ARMA(8, 3)-malli, ilman ARCH-vaikutuksien lisäämistä, 34

35 standardoidut_residuaalit Time Kuva 18: ARMA(8, 3) mallin standardoidut residuaalit. mikä jo todettiin edellisessä kohdassa. 4. Neljänneksi tulee tarkastaa valitun mallin soveltuvuus. Keskiarvoyhtälön oikeellisuus voidaan tarkistaa tarkkailemalla mallin standardoituja residuaaleja. Lisäksi volatiliteetti yhtälön kelpoisuutta voidaan tarkistella standardoitujen neliöön korotettujen residuaalien avulla. [1, s ] Tässä kohdassa tulee tarkistaa ARMA(8, 3)-GARCH(0, 0)-mallin residuaalit. Residuaalien tulee käyttäytyä valkoisen kohinan tavalla. Residuaalien ACF- ja PACF-kuvaajista ei tule näkyä autokorrelaatiota residuaalien välillä. Autokorrelaation olemassa olon voi vielä varmistaa Ljung-Box-testillä. Tässä esimerkkiaineistossa tätä vaihetta ei suoriteta, koska ARCH-vaikutuksia ei ole ja ARMA(8, 3)-mallin tarkastelut on tehty jo kohdassa 2. [1, s ] 5 Osakeaineisto Tutkielmassa tutustutaan Nokian osakkeisiin. Osakkeen arvosta koostetaan aineisto, jota aluksi muokataan haluttuun muotoon [4, s. 1]. Seuraavaksi aineistoon sovitetaan ARIMA-malli ja sen jälkeen GARCH-malli. Saadun mallin perusteella ennustetaan osakkeen tulevia arvoja. Lisäksi perehdytään Value at Risk -lukuun. 5.1 Mallin määrittäminen Tutkielmaan on koottu aineisto Nokian osakkeen arvosta ajalta [4, s. 1]. Havaintoja aikavälillä on yhteensä 2540 kappaletta. Ku- 35

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH 8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH Osa aikasarjoista kehittyy hyvin erityyppisesti erilaisissa tilanteissa. Esimerkiksi pörssikurssien epävakaus keskittyy usein lyhyisiin

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen

Lisätiedot

STOKASTISET PROSESSIT

STOKASTISET PROSESSIT TEORIA STOKASTISET PROSESSIT Satunnaisuutta sisältävän tapahtumasarjan kulkua koskevaa havaintosarjaa sanotaan aikasarjaksi. Sana korostaa empiirisen, kokeellisesti havaitun tiedon luonnetta. Aikasarjan

Lisätiedot

4. Tietokoneharjoitukset

4. Tietokoneharjoitukset 4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

4. Tietokoneharjoitukset

4. Tietokoneharjoitukset 4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume

Lisätiedot

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Valkoinen kohina ε t 2 1 0 1 2 Voimme tehdä saman laskun myös yleiselle välille [ a, a], missä 0 < a

Lisätiedot

6.5.2 Tapering-menetelmä

6.5.2 Tapering-menetelmä 6.5.2 Tapering-menetelmä Määritelmä 6.7. Tapering on spektrin estimointimenetelmä, jossa estimaattori on muotoa f m (ω) = 1 m ( ) k w 2π m Γ(k)e ikω, k= m missä Γ on otosautokovarianssifunktio ja ikkunafunktio

Lisätiedot

Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus. Intelin osakekurssi. (Pörssi-) päivä n = 20 Intel_Volume. Auringonpilkkujen määrä

Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus. Intelin osakekurssi. (Pörssi-) päivä n = 20 Intel_Volume. Auringonpilkkujen määrä MS-C2128 Ennustaminen ja aikasarja-analyysi 4. harjoitukset / Tehtävät Kotitehtävät: 3, 5 Aihe: ARMA-mallit Tehtävä 4.1. Tutustu seuraaviin aikasarjoihin: Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 6: 1 Kalmanin suodatin Aiemmin käsitellyt

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Vastaavasti voidaan määritellä korkeamman kertaluvun autoregressiiviset prosessit.

Vastaavasti voidaan määritellä korkeamman kertaluvun autoregressiiviset prosessit. Autokovarianssi: (kun τ 0) Γ t (τ) = E[(X t µ t )(X t τ µ t τ )] ( ) ( = E[ φ k ε t k φ j ε t τ j )] = = j=0 φ j+k E[ε t k ε t τ j ] k,j=0 φ j+k σ 2 δ k,τ+j k,j=0 = σ 2 φ j+k δ k,τ+j = = k,j=0 φ τ+2j I

Lisätiedot

3. Teoriaharjoitukset

3. Teoriaharjoitukset 3. Teoriaharjoitukset Demotehtävät 3.1 a Olkoot u ja v satunnaumuuttujia, joilla on seuraavat ominaisuudet: E(u = E(v = 0 Var(u = Var(v = σ 2 Cov(u, v = E(uv = 0 Näytä että deterministinen prosessi. x

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

3. Tietokoneharjoitukset

3. Tietokoneharjoitukset 3. Tietokoneharjoitukset Aikasarjan logaritmointi Aikasarjoja analysoidaan usein logaritmisessa muodossa. Asialooginen perustelu logaritmoinnille: Muuttujan arvojen suhteelliset muutokset ovat usein tärkeämpiä

Lisätiedot

Ilkka Keskiväli Kiinan energiankäytön aikasarja-analysointi

Ilkka Keskiväli Kiinan energiankäytön aikasarja-analysointi PRO GRADU -TUTKIELMA Ilkka Keskiväli Kiinan energiankäytön aikasarja-analysointi TAMPEREEN YLIOPISTO Informaatiotieteiden yksikkö Tilastotiede Joulukuu 2012 2 Tampereen yliopisto Informaatiotieteiden yksikkö

Lisätiedot

4.0.2 Kuinka hyvä ennuste on?

4.0.2 Kuinka hyvä ennuste on? Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki

Lisätiedot

Ilkka Mellin Aikasarja-analyysi ARMA-mallit

Ilkka Mellin Aikasarja-analyysi ARMA-mallit Ilkka Mellin Aikasarja-analyysi ARMA-mallit TKK (c) Ilkka Mellin (007) 1 ARMA-mallit >> ARMA-mallit ja niiden ominaisuudet ARMA-mallien auto- ja osittaisautokorrelaatiofunktiot ARMA-mallien spektri ARMA-mallien

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Aikasarjamallit. Pekka Hjelt

Aikasarjamallit. Pekka Hjelt Pekka Hjelt Aikasarjamallit Aikasarja koostuu järjestyksessä olevista havainnoista, ja yleensä se on tasavälinen ja diskreetti eli havaintopisteet ovat erillisiä. Lisäksi aikasarjassa on yleensä autokorrelaatiota

Lisätiedot

9. Tila-avaruusmallit

9. Tila-avaruusmallit 9. Tila-avaruusmallit Aikasarjan stokastinen malli ja aikasarjasta tehdyt havainnot voidaan esittää joustavassa ja monipuolisessa muodossa ns. tila-avaruusmallina. Useat aikasarjat edustavat dynaamisia

Lisätiedot

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Harjoitus 7 : Aikasarja-analyysi (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitus 7 : Aikasarja-analyysi (Palautus 28.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat: Mat-.9 Sovellettu todennäköisyyslasku A Mat-.9 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Moniulotteiset jakaumat Diskreetti jakauma, Ehdollinen jakauma, Ehdollinen odotusarvo, Jatkuva

Lisätiedot

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus MS-C2128 Ennustaminen ja aikasarja-analyysi 5. harjoitukset / Tehtävät Kotitehtävät: 2 Aihe: ARMA-mallit Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tehtävä 5.1. Tarkastellaan

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Ennustaminen ARMA malleilla ja Kalmanin suodin

Ennustaminen ARMA malleilla ja Kalmanin suodin Ennustaminen ARMA malleilla ja Kalmanin suodin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017

Lisätiedot

Stationaariset stokastiset prosessit ja ARMA-mallit

Stationaariset stokastiset prosessit ja ARMA-mallit Stationaariset stokastiset prosessit ja ARMA-mallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä

Lisätiedot

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme? TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) Tavoitteet (teoria): Hallita multinormaalijakauman määritelmä. Ymmärtää likelihood-funktion ja todennäköisyystiheysfunktion ero. Oppia kirjoittamaan

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1 Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n

Lisätiedot

MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä

MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä Tehtävä 4.1. Ncss-ohjelmiston avulla on generoitu AR(1)-, AR(2)-, MA(1)- ja MA(2)-malleja vastaavia aikasarjoja erilaisilla parametrien arvoilla.

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

ARMA mallien ominaisuudet ja rakentaminen

ARMA mallien ominaisuudet ja rakentaminen MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Viikko 4: 1 ARMA-mallien ominaisuudet 1 Stationaaristen

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

Järjestyslukuihin perustuva eksponentiaalinen tasoitus ja volatiliteetin ennustaminen

Järjestyslukuihin perustuva eksponentiaalinen tasoitus ja volatiliteetin ennustaminen Tilastotieteen pro gradu -tutkielma Järjestyslukuihin perustuva eksponentiaalinen tasoitus ja volatiliteetin ennustaminen Ari Väisänen Jyväskylän yliopisto Matematiikan ja tilastotieteen laitos 14.6.2009

Lisätiedot

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61 3.3. Satunnaismuuttujien ominaisuuksia 61 Odotusarvo Määritelmä 3.5 (Odotusarvo) Olkoon X diskreetti satunnaismuuttuja, jonka arvojoukko on S ja todennäköisyysfunktio f X (x). Silloin X:n odotusarvo on

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) Tavoitteet (teoria): Hahmottaa aikasarjan klassiset komponentit ideaalisessa tilanteessa. Ymmärtää viivekuvauksen vaikutus trendiin. ARCH-prosessin

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus 1 / 51 Lineaarikombinaatio Johdattelua seuraavaan asiaan (ei tarkkoja määritelmiä): Millaisen kuvan muodostaa joukko {λv λ R, v R 3 }? Millaisen

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista 6 Epäyhtälöitä Epäyhtälöt ovat yksi matemaatikon voimakkaimmista työvälineistä. Yhtälö a = b kertoo sen, että kaksi ehkä näennäisesti erilaista asiaa ovat samoja. Epäyhtälö a b saattaa antaa keinon analysoida

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Ominaisarvot ja ominaisvektorit 140 / 170

Ominaisarvot ja ominaisvektorit 140 / 170 Ominaisarvot ja ominaisvektorit 140 / 170 Seuraavissa luvuissa matriisit ja vektori ajatellaan kompleksisiksi, ts. kertojakuntana oletetaan olevan aina kompleksilukujoukko C Huomaa, että reaalilukujoukko

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio. Määritelmä 4.3. Estimaattoria X(Y ) nimitetään lineaariseksi projektioksi, jos X on lineaarinen kuvaus ja E[(X X(Y )) Y] 0 }{{} virhetermi Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 018 Harjoitus B Ratkaisuehdotuksia Tehtäväsarja I 1 (Monisteen tehtävä 14) Olkoon f Y (y; θ) tilastollinen malli, jonka

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL Mallin arviointi ja valinta Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL Sisältö Otoksen ennustevirheen estimointi AIC - Akaiken informaatiokriteeri mallin valintaan Parametrimäärän

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Aiheet: Satunnaisvektorit ja moniulotteiset jakaumat Tilastollinen riippuvuus ja lineaarinen korrelaatio Satunnaisvektorit ja moniulotteiset

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012 Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Insinöörimatematiikka D

Insinöörimatematiikka D Insinöörimatematiikka D M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Matematiikan ja tilastotieteen laitos Turun yliopisto 2015 M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Luentokalvot

Lisätiedot

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1, Todennäköisyyslaskenta, 2. kurssikoe 7.2.22 Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu.. Satunnaismuuttujien X ja Y yhteistiheysfunktio on

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

TKK @ Ilkka Mellin (2008) 1/5

TKK @ Ilkka Mellin (2008) 1/5 Mat-1.2620 Sovellettu todennäköisyyslaskenta B / Tehtävät Demo-tehtävät: 1, 3, 6, 7 Pistetehtävät: 2, 4, 5, 9 Ylimääräiset tehtävät: 8, 10, 11 Aiheet: Moniulotteiset jakaumat Avainsanat: Diskreetti jakauma,

Lisätiedot

3.6 Su-estimaattorien asymptotiikka

3.6 Su-estimaattorien asymptotiikka 3.6 Su-estimaattorien asymptotiikka su-estimaattorit ovat usein olleet puutteellisia : ne ovat usein harhaisia ja eikä ne välttämättä ole täystehokkaita asymptoottisilta ominaisuuksiltaan ne ovat yleensä

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. marraskuuta 2007 Antti Rasila () TodB 30. marraskuuta 2007 1 / 19 1 Lineaarinen regressiomalli ja suurimman uskottavuuden menetelmä Minimin löytäminen

Lisätiedot

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1 Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 1, Kevät 2018

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 1, Kevät 2018 BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 1, Kevät 2018 1. (a) Tunnemme vektorit a = [ 5 1 1 ] ja b = [ 2 0 1 ]. Laske (i) kummankin vektorin pituus (eli itseisarvo, eli normi); (ii) vektorien

Lisätiedot

Inversio-ongelmien laskennallinen peruskurssi Luento 2

Inversio-ongelmien laskennallinen peruskurssi Luento 2 Inversio-ongelmien laskennallinen peruskurssi Luento 2 Kevät 2012 1 Lineaarinen inversio-ongelma Määritelmä 1.1. Yleinen (reaaliarvoinen) lineaarinen inversio-ongelma voidaan esittää muodossa m = Ax +

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

2.2.1 Ratkaiseminen arvausta sovittamalla

2.2.1 Ratkaiseminen arvausta sovittamalla 2.2.1 Ratkaiseminen arvausta sovittamalla Esimerkki: lomitusjärjestäminen (edellä) Yleistys: Ratkaistava T (1) c T (n) g(t (1),..., T (n 1), n) missä g on n ensimmäisen parametrin suhteen kasvava. (Ratkaisu

Lisätiedot

Moniulotteiset satunnaismuuttujat ja jakaumat

Moniulotteiset satunnaismuuttujat ja jakaumat Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat KE (2014) 1 Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat >> Kaksiulotteiset

Lisätiedot

Johdatus regressioanalyysiin

Johdatus regressioanalyysiin Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2007) 1 Johdatus regressioanalyysiin >> Regressioanalyysin lähtökohdat ja tavoitteet

Lisätiedot

Johdatus tn-laskentaan perjantai 17.2.2012

Johdatus tn-laskentaan perjantai 17.2.2012 Johdatus tn-laskentaan perjantai 17.2.2012 Kahden diskreetin muuttujan yhteisjakauma On olemassa myös monen muuttujan yhteisjakauma, ja jatkuvien muuttujien yhteisjakauma (jota ei käsitellä tällä kurssilla;

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

6. Tietokoneharjoitukset

6. Tietokoneharjoitukset 6. Tietokoneharjoitukset 6.1 Tiedostossa Const.txt on eräällä Yhdysvaltalaisella asuinalueella aloitettujen rakennusurakoiden määrä kuukausittain, aikavälillä 1966-1974. Urakoiden määrä on skaalattu asuinalueen

Lisätiedot

6.2.3 Spektrikertymäfunktio

6.2.3 Spektrikertymäfunktio ja prosessin (I + θl + + θl q )ε t spektritiheysfunktio on Lemman 6. ja Esimerkin 6.4 nojalla σ π 1 + θ 1e iω + + θ q e iqω. Koska viivepolynomien avulla määritellyt prosessit yhtyvät, niin myös niiden

Lisätiedot

13. Ratkaisu. Kirjoitetaan tehtävän DY hieman eri muodossa: = 1 + y x + ( y ) 2 (y )

13. Ratkaisu. Kirjoitetaan tehtävän DY hieman eri muodossa: = 1 + y x + ( y ) 2 (y ) MATEMATIIKAN JA TILASTOTIETEEN LAITOS Differentiaaliyhtälöt, kesä 00 Tehtävät 3-8 / Ratkaisuehdotuksia (RT).6.00 3. Ratkaisu. Kirjoitetaan tehtävän DY hieman eri muodossa: y = + y + y = + y + ( y ) (y

Lisätiedot

1 Komparatiivinen statiikka ja implisiittifunktiolause

1 Komparatiivinen statiikka ja implisiittifunktiolause Taloustieteen matemaattiset menetelmät 27 materiaali 4 Komparatiivinen statiikka ja implisiittifunktiolause. Johdanto Jo opiskeltu antaa nyt valmiu tutkia taloudellisia malleja Kiinnostava malli voi olla

Lisätiedot

Harha mallin arvioinnissa

Harha mallin arvioinnissa Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö

Lisätiedot

Numeeriset menetelmät TIEA381. Luento 6. Kirsi Valjus. Jyväskylän yliopisto. Luento 6 () Numeeriset menetelmät / 33

Numeeriset menetelmät TIEA381. Luento 6. Kirsi Valjus. Jyväskylän yliopisto. Luento 6 () Numeeriset menetelmät / 33 Numeeriset menetelmät TIEA381 Luento 6 Kirsi Valjus Jyväskylän yliopisto Luento 6 () Numeeriset menetelmät 4.4.2013 1 / 33 Luennon 6 sisältö Interpolointi ja approksimointi Polynomi-interpolaatio: Vandermonden

Lisätiedot

, tuottoprosentti r = X 1 X 0

, tuottoprosentti r = X 1 X 0 Ostat osakkeen hintaan ja myyt sen vuoden myöhemmin hintaan X 1. Kokonaistuotto on tällöin R = X 1, tuottoprosentti r = X 1 ja pätee R = 1 + r. Lyhyeksimyymisellä tarkoitetaan, että voit myydä osakkeen

Lisätiedot

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4. HY / Matematiikan ja tilastotieteen laitos Todennäköisyyslaskenta II, syksy 206 Kurssikoe 28.0.206 Ratkaisuehdotuksia. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden

Lisätiedot

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018 BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018 Tehtävä 8 on tällä kertaa pakollinen. Aloittakaapa siitä. 1. Kun tässä tehtävässä sanotaan sopii mahdollisimman hyvin, sillä tarkoitetaan

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on 13 Pistetulo Avaruuksissa R 2 ja R 3 on totuttu puhumaan vektorien pituuksista ja vektoreiden välisistä kulmista. Kuten tavallista, näiden käsitteiden yleistäminen korkeampiulotteisiin avaruuksiin ei onnistu

Lisätiedot