ja prosessin (I + θl + + θl q )ε t spektritiheysfunktio on Lemman 6. ja Esimerkin 6.4 nojalla σ π 1 + θ 1e iω + + θ q e iqω. Koska viivepolynomien avulla määritellyt prosessit yhtyvät, niin myös niiden spektritiheysfunktiot yhtyvät 1 φ 1 e iω φ p e ipω f(ω) = σ π 1 + θ 1e iω + + θ q e iqω.. Yhtäsuuruuden pätiessä voimme jakaa puolittain AR-polynomilla, jolloin saamme f(ω) = σ 1 + θ 1 e iω + + θ q e iqω π 1 φ 1 e iω φ p e ipω aina, kun polynomin p(z) = 1 p k=1 φ kz k nollakohdat eivät ole yksikköympyrän kehällä. 6..3 Spektrikertymäfunktio Spektritiheysfunktiota f yleisempi käsite on spektrikertymäfunktio F (eng. spectral distribution function). Kun spektritiheysfunktio on olemassa, spektrikertymäfunktio F (ω) = ω π f(ω )dω. Muutoin spektrikertymäfunkto F määritellään Riemann-Stieltjes-integraalin avulla. Γ(k) = π π e ikω df (ω) Esimerkki 6.7. Kaikilla stationäärisillä stokastisilla prosesseilla ei ole spektritiheysfunktiota. Tarkastellaan esimerkiksi prosessia X t = A cos(ω 0 t) + B sin(ω 0 t), missä A, B N(0, 1) ovat riippumattomia. Silloin ja E[X t ] = cos(ω 0 t)e[a] + sin(ω 0 t)e[b] = 0 E[X t X t τ ] = E[(A cos(ω 0 t) + B sin(ω 0 t))(a cos(ω 0 (t tτ)) + B sin(ω 0 (t τ)))] = cos(ω 0 t) cos(ω 0 (t τ)) + sin(ω 0 t) sin(ω 0 (t τ)) = cos (ω 0 t) cos(ω 0 τ) + cos(ω 0 t) sin(ω 0 t) sin(ω 0 τ) + sin (ω 0 t) cos(ω 0 τ) sin(ω 0 t) cos(ω 0 t) sin(ω 0 τ) = cos(ω 0 τ) 6
Itseisesti summautuvien autokovarianssifunktioiden spektritiheysfunktiot f( )e ik d = (k) f( )= 1 k= (k)e ik Itseisesti summautuvat autokovarianssifunktiot e ik df ( )= (k) df ( )=f( )d Spektrikertymäunktiot = kaikki ei-vähenevät oikealta jatkuvat rajoitetetut ei-negatiiviset funktiot, joille F ( )=0 Autokovarianssifunktiot Kuva 6.3: Spektrikertymäfunktioiden ja autokovarianssifunktioiden yhteys. (Fourier-sarjojen ominaisuudet, jotka pätevät itseisesti suppeneville autokovarianssifunktioille, eivät päde kaikille autokovarianssifunktioille). Nyt k= cos(ω 0k) =, sillä cos(ω 1 0 t) dt =. Kuitenkin autokovarianssifunktio on muotoa Γ(k) = π π e ikω df (ω) missä spektrikertymäfunktio 0 kun ω < ω 0 F (ω) = 0.5 kun ω 0 ω ω 0 1 kun ω > ω 0. Spektrin jakauma on tällöin keskittynyt arvoihin ω = ±ω 0.. 6.3 Spektrin yhteys kausivaihteluun Määritelmä 6.3. Sanotaan, että aikasarjalla on kausivaihtelua (eng. seasonal variation), jos aikasarjassa on toistuva rakenne säännöllisin aikavälein (jonka nimitys on periodi). 63
Esimerkki 6.8. Yksinkertainen esimerkki kausivaihtelua sisältävästä aikasarjasta voidaan muodostaa sini-funktion avulla. Koska sin(t) on π-jaksollinen, skaalataan funktion argumentti t. Asetetaan ( ) π x t = sin m t, jolloin aikasarjan x t periodi eli jaksonpituus on m ajanhetkeä. Lukua π nimitetään usein m taajuudeksi. Kausivaihtelulla on nimenomaan säännöllinen aikaväli. Termin selventämiseksi tutustutaan myös toiseen käsitteeseen. Määritelmä 6.4. Sanotaan, että aikasarjalla on syklistä vaihtelua (eng. cyclic variation), jos aikasarjassa on epäsäännöllisillä aikaväleillä toistuva rakenne. Lämpötila C 0 5 10 15 190 195 1930 1935 1940 Vuosi Kuva 6.4: Kuukauden keskilämpötila Nottingham Castlessa sisältää kausivaihtelua, jonka periodi on vuosi. Esimerkissä 6.7 tarkasteltiin stokastista prosessia X t = A cos(ω 0 t) + B sin(ω 0 t), jolla on selvästi π ω 0 -periodista kausivaihtelua. Prosessin X t spektrin jakauman todettiin olevan keskittynyt arvoihin ±ω 0. Tarkastellaan seuraavaksi yleisempää esimerkkiä ja pyritään varmentamaan Esimerkissä 6.7 havaittu yhteys spektrin ja kausivaihtelun välillä. Olkoon Esimerkki 6.9. Olkoon X t = N A r cos(ω r t) + B r sin(ω r t), r=1 missä satunnaismuuttujat A r, B r ovat nollakeskiarvoisia, riippumattomia ja σ r = E[A r] = E[B r ]. Oletetaan lisäksi, että 0 < ω 1 < < ω N < π. 64
ilvesten lkm 0 000 5000 180 1840 1860 1880 1900 190 Aika Kuva 6.5: Tilasto vuosittain pyydystettyjen ilveksien lukumäärästä Kanadassa 181-1934. Tilastossa näkyy syklistä vaihtelua n. 10 vuoden välein. Aikasarjan arvo 1.0 0.5 0.0 0.5 1.0 0 10 0 30 40 50 60 70 Aika Kuva 6.6: Näyte prosessista X t, kun N =, σ 1 = 9, σ = 1, ω 1 = π/4, ω = π/6. Ensimmäisen komponentin periodi on π/(π/4) = 8 ja toisen komonentin periodi on π/(π/6) = 1. Samoin kuin Esimerkissä 6.7, nähdään että prosessin X t autokovarianssifunktio on Γ(k) = N σr cos(kω r ) r=1 ja sen spektrikertymäfunktio F (ω) = σ F r (ω), missä 0 kun ω < ω r F r (ω) = 0.5 kun ω r ω ω 0 1 kun ω > ω r. r=1. 65
Spektrikertymäfunktio 0 4 6 8 10 3 1 0 1 3 taajuus Kuva 6.7: Prosessin X t, kun σ 1 = 9, σ = 1, ω 1 = π/4, ω = π/6 spektrikertymäfunktio. Spektri on keskittynyt vahvasti taajuuksiin ω 1 = π/4. Edellä olevassa esimerkissä on äärellisen monen sini- ja kosiniaallon satunnaiskertoiminen lineaarinen yhdiste. On selvää, että esimerkissä käsitellään erikoistapausta, jonka perusteella spektrin ja kausivaihtelun yhteyttä ei saisi suoraan yleistää kaikille heikosti sationäärisille stokastisille prosesseille. Stokastisten prosessien syvällinen tulos stationääristen prosessien spektraaliesitys 4 kuitenkin kertoo, että äärellisten yhdisteiden raja-arvojen avulla (N ) voidaan esittää kaikki heikosti stationääriset stokastiset prosessit, joiden odotusarvo on nolla! Mikäli prosessilla on spektraaliesityksessään vahva komponentti jollakin taajuudella ω 0 on prosessin spektri keskittynyt lähelle taajuuksia ±ω 0. Yhteenvetona spektritiheysfunktion tapauksesta todetaan, että Spektritiheysfunktio f(ω) = 1 π k= Γ(k)e ikω on toinen tapa tarkastella riittävän säännöllisen heikosti stationäärisen stokastisen prosessin toisia momentteja autokovarianssifunktiota Γ. Mitä tasaisempi spektritiheysfunktio on, sitä vähemmän prosessissa on rakennetta. Jos spektritiheysfunktio on vakio, niin stokastinen prosessi on korreloimatonta valkoista kohinaa (Harjoitustehtävä) Mitä enemmän spektritiheysfunktion massa keskittyy jonkin taajuuden ympärille, sitä selkeämpi kausivaihtelu prosessilla on. (Jos spektritiheysfunktiossa on korkeat kapeat piikit taajuuksien ±ω 0 kohdalla, niin prosessin näytteillä on selkeää kausivaihtelua, jonka periodi on π/ω 0 ). 4 määritellään stokastisten integraalien avulla:. 66
6.4 Periodogrammi Edellä näimme, että spektrin muoto näyttää, mitä taajuuksia stokastisessa prosessissa on. Seuraavaksi ryhdytään tarkastelemaan prosessien näytteitä. Tällöin esimerkiksi spektritiheysfunktion määritelmässä esiintyvä sarja f(ω) = 1 π k= Γ(k)e ikω on typistettävä (eng. truncate). Vektorin (x 1,..., x n ) diskreetti Fourier-muunnos on α k = 1 n missä on käytetty lyhennysmerkintää πk it 1 x t e n = n ω k := πk n. x t e itω k, Merkitään lisäksi [a] luvan a kokonaisosaa. Esim. [.4] = ja [ 3.6] = 3. Määritelmä 6.5. Havaintovektorin (a 1,..., a n ) periodogrammi on I n (ω k ) = 1 a n t e itω k, missä k = [ n 1],..., [ n] ja ω k = πk. n Lause 6.5. Kun 0 k { [ ] [ n 1,..., n ]}, niin otosvektorin (a1,..., a n ) periodogrammi voidaan kirjoittaa muodossa I n (ω k ) = n 1 t= n+1 Γ(t)e itω k, missä Γ on vektorin (a 1,..., a n ) otosautokovarianssifunktio eli Γ(t) = 1 n (a j a)(a j t a), 0 t < n 1. j=t+1 Todistus. Merkitään havaintovektorin a keskiarvoa luvulla m. I n (ω k ) = 1 a t e itω k n = 1 (a t m + m)e itω k n = 1 n (a t m)(a t m)e i(t t )ω k + n t,t =1 67 (a t m)me i(t t ) + 1 n m t,t =1 e itω k
Nyt geometrisen sarjan osasummat e itω k = e itπ/n = e itπ/n e i(n+1)π/n 1 e iπ/n = e itπ/n (1 e iπ ) = 0 1 e iπ/n häviävät, joten periodogrammin lausekkeeseen jää termit I n (ω k ) = 1 (a t m)(a t m)e i(t t )ω k. n t,t =1 Vaihdetaan summausindeksien t, t tilalle s = t t ja t. Summausindeksin s = t t vaihdon jälkeen saamme ( n 1 ) 1 I n (ω k ) = (a t s m)(a t m) e iω ks n s= n+1 +s n 1 = Γ(s)e iωks. s= n+1 Huomautus 6.4.1. Eräs estimaattori spektritiheysfunktiolle on f(ω k ) = 1 π I n(ω k ), joka voidaan laajentaa kaikille ω [ π, π] esimerkiksi lineaarisella interpolaatiolla. Seuraava lause näyttää, että Huomautuksen 6.4.1 estimaattorilla on suuri virhevarianssi, vaikka käytössä olisi hyvin korkeaulotteinen havaintovektori. Kyseinen estimaattori ei ole tästä syystä ideaalinen spektritiheysfunktion estimaattori. Lause 6.6. Olkoot X 1,..., X n havaintoja prosessista X t = h k ε t k, k= missä ε t on riippumatonta valkoista kohinaa, jonka varianssi on σ ja jono (h k ) l 1. Silloin havaintovektorin (X 1,..., X n ) periodogrammi I n (ω k ) = πf(ω k ) ξ k 1 + ξ k + R n (ω k ), missä f on prosessin X t spektritiheysfunktio, kun n ja ξ k 1 = σ n max 1 k [ n 1 ] E[ R n (ω k )] 0 ε t cos(ω k t), ξ k = j=1 σ n ε t sin(ω k t) jokaisella k = 1,..., [ n 1 ]. Lisäksi satunnaisvektorien ξ j jakauma lähestyy normaalijakautunutta valkoista kohinaa, jonka varianssi on 1, kun n. 68 j=1