Koska Box Jenkins-malleja on käsitelty kurssilla Mat-2.3128 Ennustaminen ja aikasarjaanalyysi, ei työohjeessa esitellä ARIMA-mallien perusasioita.



Samankaltaiset tiedostot
Laboratoriotyö 2: Sähkönkulutuksen ennustaminen ja hankinnan optimointi

Työ 2: 1) Sähkönkulutuksen ennustaminen SARIMAX-mallin avulla 2) Sähkön hankinnan optimointi

Laboratoriotyö 2: Sähkönkulutuksen ennustaminen ja hankinnan optimointi

4. Tietokoneharjoitukset

Työvoiman tarpeen ennustaminen SARIMA-aikasarjamallilla

4. Tietokoneharjoitukset

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

Identifiointiprosessi

Auringonpilkkujen jaksollisuus

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus

Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus. Intelin osakekurssi. (Pörssi-) päivä n = 20 Intel_Volume. Auringonpilkkujen määrä

Harjoitus 7: NCSS - Tilastollinen analyysi

Aikasarjamallit. Pekka Hjelt

Dynaamiset regressiomallit

BL20A0400 Sähkömarkkinat. Valtakunnallinen sähkötaseiden hallinta ja selvitys Jarmo Partanen

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

Laskuharjoitus 9, tehtävä 6

Männyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto

Ilkka Mellin Aikasarja-analyysi ARMA-mallit

Identifiointiprosessi

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

3. Tietokoneharjoitukset

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

LIITE 1 VIRHEEN ARVIOINNISTA

Matriisit ovat matlabin perustietotyyppejä. Yksinkertaisimmillaan voimme esitellä ja tallentaa 1x1 vektorin seuraavasti: >> a = 9.81 a = 9.

LIITE 1 VIRHEEN ARVIOINNISTA

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Harjoitukset 4 : Paneelidata (Palautus )

Harjoitus 9: Excel - Tilastollinen analyysi

6. Tietokoneharjoitukset

BL20A0400 Sähkömarkkinat. Valtakunnallinen sähkötaseiden hallinta ja selvitys Jarmo Partanen

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Kysyntäjousto Fingridin näkökulmasta. Tasevastaavailtapäivä Helsinki Jonne Jäppinen

LIITE 1 VIRHEEN ARVIOINNISTA

MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

LÄMMITYSENERGIA- JA KUSTANNUSANALYYSI 2014 AS OY PUUTARHAKATU 11-13

pitkittäisaineistoissa

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

SAS-ohjelmiston perusteet 2010

EMS Light Nordic -seurantatyökalu

805306A Johdatus monimuuttujamenetelmiin, 5 op

STOKASTISET PROSESSIT

TASAVIRTAPIIRI - VASTAUSLOMAKE

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

Säätösähkömarkkinat uusien haasteiden edessä

Harjoitus 7 : Aikasarja-analyysi (Palautus )

ARMA mallien ominaisuudet ja rakentaminen

Harjoitustyö 3. Heiluri-vaunusysteemin parametrien estimointi

pitkittäisaineistoissa

Tilastotieteessä aikasarja tarkoittaa yleensä sarjaa, jossa peräkkäisten havaintojen aikaväli on aina sama.

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Dynaamiset regressiomallit

Prof. Marko Terviö Assist. Jan Jääskeläinen

Kysynnän ennustaminen muuttuvassa maailmassa

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Erikoistyö: Alkoholin kulutusmenojen ennustaminen

TAMPEREEN TEKNILLINEN YLIOPISTO Digitaali- ja tietokonetekniikan laitos. Harjoitustyö 4: Cache, osa 2

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Luku 3 Sähkömarkkinat

Diskriminanttianalyysi I

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Kerta 2. Kerta 2 Kerta 3 Kerta 4 Kerta Toteuta Pythonilla seuraava ohjelma:

Testit laatueroasteikollisille muuttujille

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari

Sähköjärjestelmän toiminta talven huippukulutustilanteessa

Tilastolliset mallit hakkuukoneen katkonnan ohjauksessa. Tapio Nummi Tampereen yliopisto

Suomen ElFi Oy:n ja Suomen Sähkönkäyttäjät ry:n esitys talousvaliokunnalle

Fingrid Markkinatoimikunta Kulutuksen jouston aktivoiminen sähkömarkkinalle. Suomen ElFi Oy

Luku 26 Tuotannontekijämarkkinat. Tuotannontekijämarkkinat ovat tärkeä osa taloutta. Esimerkiksi

9. laskuharjoituskierros, vko 12-13, ratkaisut

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

9. Tila-avaruusmallit

Rahoitusriskit ja johdannaiset Luentokurssi kevät 2011 Lehtori Matti Estola

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Oletko Bull, Bear vai Chicken?

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Testejä suhdeasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

Markkinointisuunnitelma 1(5) Markkinointisuunnitelma

ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

Väliestimointi (jatkoa) Heliövaara 1

Joustavuuden lisääminen sähkömarkkinoilla. Sähkömarkkinapäivä Jonne Jäppinen, kehityspäällikkö, Fingrid Oyj

NBS MUUTOKSET Sähkönmyyjälle ja Tasevastaavalle. Tom Backman

Uuden sähkömarkkinamallin kuvaus ja vaikutusten analysointi. Selvitys Teknologiateollisuus ry:lle

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Sovellettu todennäköisyyslaskenta B

S Laskennallinen Neurotiede

Mitä on konvoluutio? Tutustu kuvankäsittelyyn

805324A (805679S) Aikasarja-analyysi Harjoitus 5 (2016)

Transkriptio:

Mat-2.3132 Systeemianalyysilaboratorio I Laboratoriotyö 2: Aikasarja-analyysi Aikasarja on joukko peräkkäisiä, toisistaan riippuvia havaintoja. Aikasarja-analyysin tavoitteena on kuvata, selittää, ennustaa ja mahdollisesti ohjata aikasarjan tuottanutta prosessia. Ehkä suosituin lähestymistapa aikasarja-analyysiin on Box-Jenkins -menetelmä, jossa tarkastellaan erästä lineaaristen stokastisten mallien luokkaa. Työssä rakennetaan kyseisellä menetelmällä sähkön kulutukselle malli. Mallilla ennustetaan seuraavan vuorokauden sähkön kulutusta. Sähkön hankinta optimoidaan ennusteeseen perustuen. 1 Box-Jenkins-malleista Koska Box Jenkins-malleja on käsitelty kurssilla Mat-2.3128 Ennustaminen ja aikasarjaanalyysi, ei työohjeessa esitellä ARIMA-mallien perusasioita. 1.1 SARIMA-mallit Mikäli datassa on kausivaihteluja, siirrytään Seasonal ARIMA- eli SARIMA-malleihin. Kausivaihteluita sisältävässä mallissa käytetään kausivaihtelun pituisen viiveen päästä otettuja suureen ja kohinan arvoja selittämään tämänhetkistä suureen arvoa. ARIMA-malli voidaan ymmärtää kausivaihtelumallin erikoistapaukseksi, jossa kausivaihtelun pituus on yksi. Käytetään ARIMA(p,d,q)-mallille seuraavaa notaatiota: Φ p (B) d z t = Θ q (B)a t, (1) missä z t on mallitettava suure, a t on valkoista kohinaa, viiveoperaattori Bz t = z t 1, = (1 B) ja polynomit Φ p (B) = (1 φ 1,1 B φ 1,2 B 2... φ 1,p B p ) ja Θ q (B) = (1 θ 1,1 B θ 1,2 B 2... θ 1,q B q ) sisältävät mallin parametrit. Data määrää kertaluvut p, d ja q. Yleensä d = 1. Käytännössä mallin AR- ja MA-osiin otetaan tilastollisesti merkitsevät parametrit, ellei ole erityistä syytä muuhun. On tietysti mahdollista, että jokin parametreistä p,d tai q on nolla, jolloin aito ARIMA-malli redusoituu ARMA-, ARI- tai IMA-malliksi. Mikäli kausivaihtelun pituus on s, käytetään ARIMA(P,D,Q)-mallia Φ P (B s ) D s z t = Θ Q (B s )a t, (2) missä viiveoperaattori B s z t = z t s, operaattori s = (1 B s ) ja polynomit Φ P (B s ) = (1 φ s,1 B s φ s,2 B 2s... φ s,p B Ps ) ja Θ Q (B s ) = (1 θ s,1 B s θ s,2 B 2s... θ s,q B Qs ) sisältävät mallin parametrit. On syytä huomata, että varsinkin jos viive s on pitkä datan kokonaispituuteen nähden, ei edes ole mahdollista käyttää kertaluvuille P, D ja Q suuria

arvoja, vaan käytännössä usein P=D=Q=1. Voi myös käydä niin, että P tai Q saa arvon nolla, jos viiveen s päässä olevat suureen tai kohinan arvot eivät ole merkittäviä selittäjiä. Jos datassa on useita kausivaihteluita, päädytään multiplikatiiviseen ARIMA(p,d,q) x (P,D,Q)-malliin eli kausivaihtelut jaksoilla 1 ja s johtavat malliin Φ p (B)Φ P (B s ) d D s z t = Θ q (B)Θ Q (B s )a t (3) missä merkinnät kuten edellä. Tässäkin on mahdollista, että jokin tai jotkin parametreistä p, d, q, P ja Q ovat nollia ja usein d=1 ja P ja Q ovat pieniä, ainakin jos viive on pitkä. Yleisesti kausivaihtelu viiveillä s 1, s 2,..., s i, johtaa multiplikatiiviseen malliin jossa on differoinnit viiveillä s 1, s 2,..., s i, AR-osassa polynomit Φ p1 (B s 1 ), Φ p2 (B s 2 ),..., Φ pi (B s i ) ja MA-osassa polynomit Θ q1 (B s 1 ), Θ q2 (B s 2 ),..., Θ qi (B s i ). Esimerkiksi seuraavassa mallissa on kaksi kausivaihtelua, viikkovaihtelu ja vuosivaihtelu, (1 φ 7,1 B 7 φ 7,2 B 14 φ 7,3 B 21 ) 7 365 z t = (1 θ 7,1 B 7 θ 7,2 B 14 )a t. (4) Siis s 1 =7, p 1 =3, d 1 =1, q 1 =2, s 2 =365, p 2 =0, d 2 =1, q 2 =0. 1.2 Mallien identifiointi Tarkasteltavan ilmiön kuvaamiseen käytettävän SARIMA-mallien luokan valinnan jälkeen tehtävänä on määrittää mahdollisten kausivaihteluiden pituudet ja kertaluvut sekä kertaluvut p, d ja q. Lineaarisesti kasvava tai vähenevä trendi poistetaan differoimalla aikasarjaa. Käytännössä differointien kanssa on kuitenkin syytä olla varovainen, sillä signaali kohina-suhde saattaa differoitaessa olennaisesti heikentyä, varsinkin kohinaisessa datassa. Mikäli kuitenkin AR(1)-parametrin φ 1 estimaatti mallissa (1 φ 1 B)z t = a(t) on hyvin lähellä ykköstä (> 0.9), differointia voidaan yleensä pitää perusteltuna. Kausivaihtelun tunnistamisessa käytetään hyväksi a priori -tietämystä mallitettavasta prosessista. Usein esiintyviä jaksoja ovat vuorokausivaihtelu, viikkovaihtelu ja vuosivaihtelu. Kausivaihtelumallien käyttöä on harkittava erityisen huolellisesti silloin, kun kausivaihtelun pituus on suuri aikasarjan pituuteen nähden, sillä differointi pitkällä viiveellä syö dataa. Myös s -operaation järkevyyttä voi testata sovittamalla dataan vastaava (1 φ s B s )-malli ja katsomalla kuinka lähellä parametrin φ s estimaatti on ykköstä. Matemaattisista identifioinnin apuvälineistä tärkeimmät ovat autokorrelaatio, osittaisautokorrelaatio ja käänteinen autokorrelaatio. Ne kaikki kuvaavat suureen korrelaatioominaisuuksia itsensä suhteen eripituisilla viiveillä. Autokorrelaatio r k on suureen kovarianssi itsensä kanssa viiveellä k jaettuna r 0 :lla eli varianssilla: r k = E[(z t µ)(z t+k µ)] (5) σz 2 Vaimeneva autokorrelaatio viittaa AR-osaan ja yksittäiset piikit MA-osaan. Jos yksittäisiä, vaimenevia piikkejä esiintyy viiveen s välein, kysymys on luultavasti kausivaihtelusta.

Osittaisautokorrelaatiot saadaan autokorrelaatioista ratkaisemalla ns. Yule-Walkerin yhtälöt ( Pindyck & Rubinfeld 3. painos (PR3) kaava (16.46) sivulla 484, 4. painos (PR4) kaavat 17.39 ja 17.40, s. 531.). Osittaisautokorrelaatio viiveellä p kuvaa sitä, kuinka p ajanhetkeä taaksepäin oleva suureen arvo selittää tämänhetkistä suureen arvoa, kun muiden viiveiden selittävä osuus on poistettu. Selvästi nollasta poikkeavat osittaisautokorrelaatiot viiveeseen p 1 asti viittaavat siihen, että AR-osan kertaluku on ainakin p 1. Yksittäiset nollasta poikkeavat osittaisautokorrelaatiot puolestaan voivat liittyä kausivaihteluun ja johtaa multiplikatiiviseen malliin. Käänteinen autokorrelaatio on nk. duaalimallin autokorrelaatio. Alkuperäiselle primaalimallille Φ(B)w t = Θ(B)a t voidaan siis muodostaa duaalimalli Θ(B)z t = Φ(B)a t, jonka autokorrelaatiofunktioita tarkastellaan. Jos primaalimalli on puhdas AR(p)-prosessi, duaalimalli on puhdas MA-prosessi eli käänteiseesä autokorrelaatiofunktiossa nähdään yksittäinen piikki viiveellä p. Jos taas primaalimalli on puhdas MA-prosessi, duaalimalli on puhdas AR-prosessi ja käänteiset autokorrelaatiot vaimenevat. Jos primaalissa on mukana sekä AR- että MA-osa, myös duaalimalli on aito ARMA-malli, jonka käänteiseen autokorrelaatioon ilmestyvät sekä AR-osan generoimat yksittäiset piikit että MA-osan vaimenevat piikit. Duaalimallia on käsitelty esim. SAS-manuaalin sivulla 115. 1.3 Mallin diagnostiset tarkistukset Mallin testaus on olennainen osa mallitusprosessia. Mallin käyttötarkoitus vaikuttaa siihen, millainen testaus on järkevää. Jos mallia on tarkoitus käyttää ennustamiseen tutkitaan ex post ja mahdollisuuksien mukaan myös ex ante -ennustuksien hyvyyttä. Mallin hyvyyden arvioimiseen voidaan käyttää myös erilaisia tilastollisia testejä. On syytä aina tarkistaa, onko mallin generoima kohina riittävän satunnaista ja korreloimatonta. Residuaalien autokorrelaatiofunktion visuaalinen tarkastelu kertoo kohinan valkoisuudesta. Lisäksi käytetään nk. Portmanteau-testiä sen testaamiseksi, ovatko kohinan autokorrelaatiot riittävällä tarkkuudella nollia. (testisuure on esitetty PR3:n kaavassa (17.16)sivulla 505 ja PR4:n kaavassa (18.16) sivulla 555. Portmanteau-testissä lasketaan testisuureen arvoja eri K:lla.) 1.4 Aikasarjamallin rakentaminen Box-Jenkinsin menetelmällä 1. Identifioidaan kertaluvut. 2. Estimoidaan parametrit. 3. Suoritetaan diagnostiset tarkistukset. Jos malli ei ole hyvä, palataan kohtaan 1. 4. Käytetään mallia ennustamiseen, säätöön jne. Jos malli ei ole hyvä, palataan kohtaan 1 tai harkitaan jonkin muun malliluokan tai menetelmän käyttöönottoa.

2 Yrityksen sähkön hankinta Sähkömarkkinoiden vapautuminen on pohjoismaissa edennyt nopeammin kuin missään muissa maassa. Norjassa kaikki sähkönkäyttäjät ovat voineet valita sähköntoimittajansa vuodesta 1991 lähtien. Ruotsissa ja Suomessa sähkömarkkinat avautuivat vuosien 1995 ja 1996 aikana. Tällä hetkellä jokainen suomalainen ja ruotsalainen voi valita sähköntoimittajansa. Ehtona on kuitenkin, että asiakkaalle on asennettu tunneittaiset sähkön kulutukset rekisteröivä mittalaite. Tällaiset tuntikeruulaitteet ovat vielä suhteellisen kalliita (n. 3000 mk). Jos asiakkaan sähkölasku on suhteellisen pieni, ei sähkön myyjien kilpailuttamisella aikaansaatu kustannussäästö ole riittävän suuri korvaamaan kalliin keruulaitteen hankintakuluja. Jotta kaikki sähkön käyttäjät voisivat kilpailuttaa energian hankintansa, käytetään pienten sähkönkäyttäjien sähkökaupassa ns. tyyppikulutuskäyriä, jolloin kalliilta mittari-investoinnilta vältytään. Ennen sähkömarkkinoiden vapautumista asiakas ei voinut optimoida sähkön hankintaansa. Nykyään monet suuret sähkön käyttäjät hankkivat sähkönsä useista eri lähteistä. Vapailla markkinoilla yrityksille on entistä tärkeämpää kyetä ennustamaan sähkön kysyntä ja tuleva hintakehitys. Riskejä minimoidaan erilaisilla sopimuksilla. Laboratoriotyön kohdassa 3.23 esitellään tyypillisiä sähkökaupan sopimuksia. Suomalaisilla sähkömarkkinoilla energiaa voidaan ostaa suomalaisesta sähköpörssi ELEX:stä, pohjoismaisesta sähköpörssi NordPool:ista, riippumattomilta sähkömeklareilta ja pienemmistä markkinapaikoista (esim. Voimatori Oy). Useimmat yritykset asioivat suoraan sähköpörssi ELEX:ssä, mutta sen sijaan NordPoolissa varsinkin pienemmät yritykset käyvät kauppaa meklarien välityksellä. Jokaisen sähkön käyttäjän (asiakas, sähkön myyjä, verkkoyhtiö jne.) pitää ilmoittaa viranomaisille taho, joka viime kädessä vastaa omilla resursseillaan kunkin sähkön käyttötunnin kysynnän ja tarjonnan tasapainosta. Kunkin asiakkaan ennakkohankintojen ja käyttötuntien toteutuneen kulutuksen välisen erotuksen toimittaa asiakkaalle hänen valitsemansa ns. avoin toimittaja, joka yleensä on sähkön myyntiyhtiö. Sähkön myyntiyhtiöiden taseesta vastaavaa sähköntuottajaa kutsutaan nimellä säätövastaava. Suomen kokonaissähkötaseen tasapainottamiseen tarvittavan säätösähkön markkinapaikkana on Suomen Kantaverkko Oy. Myös Kantaverkossa hintataso määräytyy kysynnän ja tarjonnan mukaan siten, että kukin tuottaja tai markkinaosapuoli, jolla on ylimääräistä kapasiteettia tarjoaa kantaverkolle tuotantoresurssejaan erilaisina kokonaisuuksina sopimaksi katsomallaan hinnalla ja Kantaverkko Oy hankkii sähköä aina halvimmista lähteistä. 3 Laboratoriotyö Tässä työssä käytetään aikasarjamallinnusta erään yrityksen sähkönkulutuksen mallintamiseen. Muodostetulla mallilla ennustetaan seuraavan vuorokauden kulutus ja ennusteeseen perustuen optimoidaan sähkönhankinta.

3.1 Esiselostustehtävä Tarkastellaan prosesseja (i) w t = (1 θb)(1 ΘB s )a t, s 3 (ii) (1 ΦB s )w t = (1 θb)(1 ΘB s )a t, s 3 missä w t = s z t. Millä viiveen k arvoilla prosessin autokorrelaatiofunktio r k = γ k /γ 0, missä γ k = E[w t w t+k ] saa nollasta poikkeavia arvoja? Perustele vastauksesi tarkastelemalla autokovarianssin γ k lauseketta. Piirrä autokorrelaatiofunktiot, kun s=24, θ = 0.8, Θ = 0.3, Φ = 0.5. Esiselostustehtävän ymmärtäminen on avuksi varsinaista työtä tehdessä, mutta voit kuitenkin aloittaa varsinaisen työn tekemisen yhtä aikaa esiselostustehtävän kanssa. Katso kurssin kotisivuilta, milloin esiselostustehtävä pitää viimeistään palauttaa. 3.2 Työtehtävät 1. Analysoi marras-joulukuulta 1997 mitattua yrityksen sähkönkulutusdataa. Päämääränäsi on löytää yrityksen sähkönkulutukselle hyvä SARIMAX-malli (SARIMAX = Seasonal ARIMA with external variable), missä mahdollisena ulkoisena selittäjänä on lämpötila. Tarkastele alkuperäistä aikasarjaa ja sen autokorrelaatio-, ristikorrelaatio- ja muita funktioita. Tutki aikasarjan stationaarisuutta ja kausivaihteluita. Esitä perustelut valitsemillesi differoinnille ja kausivaihteluiden pituuksille. Tutki differoidun aikasarjan korrelaatiofunktioita. Valitse AR- ja MA-osien kertaluvut käyttäen apuna korrelaatiofunktioita. Kokeile erilaisia vaihtoehtoja ja mieti syitä mallien ennustuskyvyn hyvyyteen. Perustele kaikissa vaiheissa tekemäsi ratkaisut. Koska lämpötilasignaali on jatkuvasti herättävä noin kertalukua yksi, lämpötilariippuvuus mallitetaan lineaarisena αt ulko. Pohdi kuitenkin, vaikuttaako ulkolämpötila viiveellä ja mistä mahdollinen viive voi johtua. Tutki, onko aikasarja oleellisesti nollakeskiarvoista vai tarvitaanko vakiotermi. Vertaa mallin antamia ex post -ennusteita toteutuneeseen kulutukseen. Analysoi poikkeamia ja tarkastele keskivirhettä. Käytä diagnostisia testejä (t-testi, χ 2 -testi) sekä korrelaatiofunktioita sen selvittämiseen, ovatko residuaalit valkoista kohinaa eli onko kaikki datan informaatio saatu mallitettua. 2. Tee valitsemallasi mallilla ennuste havaintojen jälkeisen vuorokauden (pe 5.12.1997) sähkön kulutukselle. Kukin pari palauttaa ennustamansa sähkönkulutuksen ja sen 95 % luottamusvälit Excel-tiedostona (ennexx.xls, missä XX on työparin numero) sähköpostitse assistentille. Assistentti vertaa kunkin ryhmän ennustamaa sähkönkulutusta toteutuneeseen kulutukseen sekä laskemalla neliöllisen virheen että graafisesti. Kuvat ennustetusta versus todellisesta sähkönkulutuksesta ja lasketut neliövirheet ilmestyvät kurssin

www-sivulle. Tässä malli perustuu usean viikon ehjään (ei puuttuvia havaintoja) dataan, mikä käytännössä on harvinaista, ja mallilla ennustetaan yksi vuorokausi eteenpäin. Mitä olisi otettava huomioon, jos mallilla haluttaisiin ennustaa pidemmälle tulevaisuuteen? Mihin olisi erityisesti kiinnitettävä huomiota, jos haluttaisiin ennustaa sähkönkulutusta lauantaille 6.12.1997? Esitä ehdotuksesi siitä, millaisia vaihtoehtoisia lähestymistapoja voitaisiin soveltaa sähkönkulutuksen ennustamiseen. 3. Laadi strategia kyseisen yrityksen sähköenergianhankinnalle 5.12.1997 klo 00.00-24.00. Olet siis yrityksesi energiajohtaja. Eletään torstaita 4.12.1997. Kello on tasan 12 ja olet juuri palannut ruokatunniltasi Eteläranta 10:stä. Koska sähköpörssi sulkeutuu klo 16, seuraavan päivän sähkönhankintastrategia on ilmoitettava kaikille sähkömarkkinaosapuolille seuraavan neljän tunnin kuluessa. Sinun on hankittava kullekin sähkön käyttötunnille tarvittava määrä sähköä mahdollisimman halpaan hintaan. Yrityksesi toimitusjohtaja on sitonut henkilökohtaiset optiosi vuoden energiahankinnan onnistumiseen. Useissa sopimuksissa erotetaan päiväaika ja yöaika. Päiväaika käsittää (arkisin ma-pe) tunnit 7.00-22.00 ja loppu on yöaikaa. Kaikissa hinnoissa on mukana siirtokustannukset eli tarvitsemasi sähkö toimitetaan mainittuun hintaan Suomen kantaverkkoon. Yrityksesi on mukana sähköpörssi ELEX:ssä, josta voit aina hankkia tarvitsemasi määrän sähköä. Huomaat ELEX:n päätteeltä, että seuraavana päivänä ELEX:ssä käydään paljon pieniä kauppoja ja hintatasosta ollaan yksimielisiä. Niinpä ELEX:n tunneittaiset hinnat 5.12.1997 voidaan olettaa jo kiinteiksi, kunhan myynti/ostotehosi ovat alle 100 MW tunnissa. Taulukossa 1 on esitetty ELEX:n tunneittaiset sähkön hinnat. Ostettaessa hintoihin on lisättävä ELEX:n välityspreemio, joka on 0,02 p/kwh. ELEX:iin myytäessä hinnoista on vähennettävä sama preemio.

Aikaleima Hinta [p/kwh] 5.12.1997 0.00 12,4 5.12.1997 1.00 12,0 5.12.1997 2.00 11,7 5.12.1997 3.00 11,7 5.12.1997 4.00 11,6 5.12.1997 5.00 11,9 5.12.1997 6.00 13,4 5.12.1997 7.00 19,5 5.12.1997 8.00 22,3 5.12.1997 9.00 22,2 5.12.1997 10.00 21,9 5.12.1997 11.00 21,3 5.12.1997 12.00 19,8 5.12.1997 13.00 17,8 5.12.1997 14.00 17,1 5.12.1997 15.00 18,2 5.12.1997 16.00 19,0 5.12.1997 17.00 19,2 5.12.1997 18.00 18,9 5.12.1997 19.00 18,8 5.12.1997 20.00 19,0 5.12.1997 21.00 18,1 5.12.1997 22.00 14,9 5.12.1997 23.00 14,4 Taulukko 1. ELEX:in tuntihinnat Yrityksesi käy kauppaa pohjoismaisessa NordPoolissa meklarin välityksellä. Meklari tarjoaa sinulle seuraavaksi päiväksi blokkituotetta, jossa ostat kunakin päivän tuntina määrän x p (t) ja kunakin yön tuntina määrän x y (t). (Huomaa, että päivätunnit Norjan aikaa klo 7.00-22.00 vastaavat Suomen ajassa tunteja klo 8.00-23.00.) Päivähinta on 260 NOK/MWh ja yöhinta 169 NOK/MWh. Maksimissaan voit ostaa 50 MWh kunakin tuntina, joten maksimaalinen päiväosto on 750 MWh ja maksimaalinen yöosto on 450 MWh. Meklari ei osta sinulta sähköä. Mikäli päädyt ostamaan meklarilta sähköä, yrityksesi on maksettava sähkön hinnan lisäksi meklarisopimuksen sopimuspreemio, joka on kiinteät 10000 NOK riippumatta ostamasi sähkön määrästä. Dow Jones:n energiapäätteeltä saat NOK/FIM kurssin 1 NOK = 0.7298 FIM. Yrityksesi on suojannut Pohjoismaiset kassavirtansa ostamalla joukon OM:n valuuttajohdannaisia, joten Norjan kaupoissa ei ole valuuttariskiä. Yritykselläsi on myös kiinteä sopimus sähkönmyyntiyhtiö SVK:n kanssa. SVK:n sopimukseen on neuvoteltu seuraavat hinnat ja määrät. Perushintaa sovelletaan, kun ostat vähemmän kuin 40 MWh tunnissa. 40 MWh:n ylimenevästä osasta maksat huippuhintaa. Maksimaalinen ostoteho 70 MW tunnissa. Yöllä perushinta on 11,6 p/kwh ja huippuhinta 12,0 p/kwh. Päivällä perushinta on 20,0 p/kwh ja huippuhinta 20,3 p/kwh. Optimoi sähkönhankintasi Excelin Solverilla tai muulla vastaavalla optimointityökalulla.

Kun olet optimoinut hankintasi vastaamaan ennustamaasi kysyntää, täytä tunneittaiset ELEX:n ostosi ja myyntisi sekä tunneittaiset ostosi meklarilta ja SVK:ltä. Ilmoitus tehdään sähkömarkkinoiden ennakkoilmoituslomakkeella (Excel-pohja edixx.xls). Lähetä tiedosto sähköpostitse assistentille, joka välittää tiedot avoimelle toimittajallesi. Ennakkohankintasi ja kunkin käyttötunnin toteutuneen kulutuksesi välisen erotuksen tasaajaksi olet valinnut Assivoima Oy:n. Jos olet hankkinut sähköä enemmän kuin yrityksesi tarvitsee 5.12.1997, Assivoima Oy ostaa ylimääräisen sähkön takaisin päiväaikaan hintaan ELEX:n tuntihinta - 4% ja yöaikaan hintaan ELEX:n tuntihinta - 3%. Vastaavasti jos olet hankkinut sähköä liian vähän, Assivoima Oy myy sinulle sähköä päiväaikaan hintaan ELEX:n tuntihinta + 5% ja yöaikaan hintaa ELEX:n tuntihinta + 4%. Jos et määräaikaan mennessä tilaa sähköä muilta toimittajilta, joudut maksamaan sähköstäsi yllämainitut hinnat. Avoimelta toimittajalta ostettava sähkö on siis kalliimpaa kuin etukäteen tilattu sähkö, mutta toisaalta saat keskimäärin ostohintaa huonomman hinnan myydessäsi ylijäävää sähköä eli joudut punnitsemaan vastakkain toisaalta sitä, että etukäteen ostamasi sähkö ei riitä ja toisaalta sitä, että olet etukäteen hankkinut liikaa sähköä, joista kummastakin koituu ylimääräisiä kustannuksia. Pohdi, millaista riskiasennetta valitsemasi sähkönhankintastrategia kuvastaa. Assistentti laskee kunkin työparin sähkönhankintastrategian kustannukset, kun otetaan huomioon, että sähköä on hankittava toteutuneen kulutuksen verran. Puuttuva sähkö siis ostetaan kantaverkosta ja ylijäävä sähkö myydään kantaverkkoon. Kunkin ryhmän strategian sähkönhankintakustannukset ilmestyvät kurssin www-sivulle. 3.3 Työselostus Jokainen ryhmä palauttaa esitehtävän ratkaisun ja työselostuksen kirjallisena SAL-käytävällä olevaan lokerikkoon sekä sähkönkulutuksen ennusteen (ennexx.xls) ja sähkönhankintastrategian (edixx.xls) sähköpostitse assistentille. Työselostuksen tulee sisältää vähintään: 1. kansilehti 2. sisällysluettelo 3. johdanto 4. aikasarjan analyysi aikasarjan ja sen korrelaatiofunktioiden analyysi perustelut differoinneille perustelut mallin parametrien valinnoille selostus siitä, millaisia malleja kokeilitte, mitä jätitte pois ja mihin lopulta päädyitte

diagnostisen testauksen suorittaminen valitulle mallille ja perustelut sille, miksi valittu malli on parempi kuin muut kuvia, jotka tukevat tekemiänne ratkaisuja seuraavan vuorokauden ennustettu kulutus 5. sähkönhankintasuunnitelma ja selvitys siitä, miten kyseiseen suunnitelmaan on päädytty sekä perustelut, miksi ratkaisu on optimaalinen 6. kommentit ja parannusehdotukset 7. liitteet oleelliset kuvat ja muut oleelliset SAS-tulostukset (ellei halua upottaa tekstin joukkoon) SAS-ohjelman listaus/listaukset, josta käy ilmi ryhmän itse tekemä osuus 3.4 Käytännön järjestelyt Kurssin aikataulu ja käytäännön järjestelyt on esitelty kurssin www-sivuilla. Sivuilla ilmoitetaan myös kaikista aikataulu- ym. viime hetken muutoksista ja annetaan tarvittaessa vinkkejä työn vaikeimpiin osiin. Käy tarkistamassa sivut säännöllisesti! Materiaali Työohjekansion voi lainata SAL-käytävältä kopiointia varten. Kansio on tarkoitettu pikalainaan. Kansion sisältö: Box & Jenkins -pruju (Seasonal Models) SAS-manuaalin ARIMA-osuus Ruusunen, J., Tietokonetuettu aikasarja-analyysi, Systeemianalyysin laboratorio, Teknillinen korkeakoulu, raportti B6, 1985, (prujuversio kansiossa) Lisämateriaali, josta voi olla hyötyä: Pindyck & Rubinfeld, erityisesti luku 19 Mat-2.128 Ennustaminen ja aikasarja-analyysi -kurssin laskuharjoitukset ja luentomonisteet SAS-oppaat www:ssä 3.4.1 Tietokone, ohjelmistot ja tiedostot SAS on monipuolinen tilastollisen analyysin ohjelmisto. Tässä työssä käytetään SAS/ETCohjelmapaketin ARIMA-aliohjelmaa. SAS-ohjelma pyörii CSC:n corona.csc.fi-tietokoneessa. Kullakin työparilla on oma käyttäjätunnus coronaan.

Tiedostot Sähkönkulutuksen mallitukseen kukin pari tarvitsee tiedostot sahko08.sas ja nov08.dat. Ennustus kirjataan tiedostoon ennexx.xls ja sähkönhankintastrategia tiedostoon edixx-.xls, jotka palautetaan sähköpostitse. Kaikki em. tiedostot löytyvät kurssin www-sivulta. Tiedostossa nov08.dat on 816 sähkönkulutusmittausta aikajaksolta 1.11.-4.12.1997 ja 840 ulkolämpötilaa aikajaksolta 1.11.-5.12.1997. Tarkoituksena on siis ennustaa sähkönkulutus pe 5.12.1997, jonka lämpötilatiedot löytyvät tiedostosta. Tiedot ovat tiedostossa riveittäin järjestyksessä sähkönkulutus ja lämpötila. Havainnot ovat tunnin välein. Tiedostossa sahko08.sas on mallin rakentamisessa tarvittavan SAS-ohjelman pohja, jolla käsitellään kulutustietoja ja piirretään kuvia. Voit muunnella pohjaa tarpeen mukaan. Osa komennoista on pantu kommentteihin, joita merkitään SAS:issa seuraavasti: /* tämä on kommentti */. Poista käskyjä kommenteista jos ja kun tarvitset niitä. Huomaa, että kommentit eivät voi olla sisäkkäin. Excel-tiedostoissa enne.xls ja edi.xls on kummassakin keltainen ruutu, johon kukin työpari täydentää työparin numeron kahdella numerolla, siis pari 3 kirjoittaa 03. Enne.xlstiedostoon täydennetään myös parin nimet ja opintokirjan numerot. Tiedostot tallennetaan nimillä ennexx.xls ja edixx.xls, jossa XX on parin nimi. EnneXX.xls-tiedostoon täydennetään parin ennuste luottamusväleineen ja edixx.xls-tiedostoon sähkönhankintastrategia. SAS-ohjelmia voi editoida käyttämällä SAS:in program editoria. Useimpien ihmisten mielestä näppärämpi tapa on käyttää Emacsia. Editorin Locals-valikosta löytyvä Submitkomento ajaa ohjelman. SAS-ohjelmiston käytössä voi turvautua erilliseen ohjeeseen sekä SAS:in omaan hypertext-helppiin. Tekstitulostukset saa tallennettua File-valikon Savekäskyllä. Kuvat saa talletettua käyttämällä File-valikon Export-käskyä. On myös mahdollista käyttää xv:tä (kuvankaappausohjelma) tai tallettaa kuvat SAS-manuaalin kuvaamalla tavalla, mutta Export-komennolla saat talletettua kuvan suoraan sen kokoisena kuin se näkyy ruudulla, joten Export-komento lienee kätevin. Corona on CSC:n tietokone eikä se tunne koulun printtereitä, joten tulostettavat tiedostot täytyy siirtää ftp:llä työasemaan ja tulostaa sieltä lpr -komennolla. SAS-ikkunoita ei suljeta Close Window-komennolla, vaan ohjelmasta poistutaan valitsemalla Exit File-valikosta. SAS-ohjelma koostuu tietojen luvusta ja niiden käsittelystä. Luettu data ryhmitellään muuttujiksi, joista jokaisesta on useita havaintoja. Muuttujat ryhmitellään edelleen joukoiksi (Data set). Jos esimerkiksi on mitattu sähkönkulutus ja lämpötila tunnin välein vuoden ajalta, saadaan kolme muuttujaa: Aika (=mittaushetki), Sahko (=sähkön kulutus) ja Lampo (=mitattu lämpötila). Yhdessä nämä kolme muuttujaa muodostavat joukon nimeltä Kulutus. Kun muuttujat on määritelty ja luettu muistiin, niitä käsitellään aliohjelmilla (PROC), joista tässä työssä käytetään ARIMA-aliohjelmaa ja SAS-GRAPH:in piirtorutiineja. ARIMA-aliohjelmalla voi mallittaa ja ennustaa aikasarjoja. Myös kausivaihtelua sisältävät mallit (seasonal models) ovat mahdollisia. ARIMA-aliohjelma voisi näyttää vaikka tällaiselta: PROC ARIMA DATA=kulutus;

IDENTIFY VAR=sahko(1) CROSSCORR=lampo(1) NLAG=170 OUTCOV=cors NOPRINT; ESTIMATE P=(1)(168) Q=(1,2) NOCONSTANT INPUT=(36$lampo) MAXIT = 600; FORECAST BACK=24 LEAD=24 id=h OUT=ennus; RUN; Tässä siis estimoidaan mallin (1 φ 1 B)(1 φ 168 B 168 ) 1 sahko t = α 1 1 lampo t 36 + (1 θ 1 B θ 2 B 2 )a t parametrit ja ennustetaan viimeiset 24 havaintoa. Katso ARIMA-manuaalin sivulta 100 SAS-ohjelman käyttämä notaatio aikasarjamallille. ARIMA-ohjelmassa on kolme käskyä: IDENTIFY, ESTIMATE ja FORECAST, joiden on esiinnyttävä aina tässä järjestyksessä. IDENTIFY-käskyllä (s. 110 SAS-manuaalissa) differoidaan aikasarja ja lasketaan autokorrelaatiot, käänteiset autokorrelaatiot ja osittaisautokorrelaatiot. IDENTIFY-käskyyn liittyviä optioita: VAR=sahko(1) määrittelee käsiteltävän muuttujan ja differoinnit eli tässä differoidaan muuttujaa sahko yhden jaksolla kerran NLAG kertoo kuinka pitkällä viiveellä korrelaatiofunktiot lasketaan CROSSCORR kertoo minkä (ulkoisen) muuttujan kanssa ristikorrelaatiot lasketaan NOPRINT estää korrelaatiofunktioiden tulostumisen OUTCOV-joukko cors sisältää muuttujat LAG = viiveen arvot CORR = auto- ja ristikorrelaatiot INVCORR = käänteiset autokorrelaatiot PARTCORR = osittaisautokorrelaatiot ESTIMATE-käsky (s. 103 SAS-manuaalissa) määrittää halutun ARMA-mallin, jota sovelletaan (differoituun) aikasarjaan. ESTIMATE-käskyn parametreistä P määrittää ARosan ja Q MA-osan parametrit. ESTIMATE-käskyyn voidaan lisätä ulkoinen muuttuja INPUT-optiolla. Huomaa ero seuraavien merkintöjen välillä P=2 AR-malli (1 Φ 1 B Φ 2 B 2 )z t P=(2) AR-malli (1 Φ 2 B 2 )z t Q=(1,24) MA-malli (1 θ 1 B θ 24 B 24 )a t

Q=(1)(24) MA-malli (1 θ 1 B)(1 θ 24 B 24 )a t Jaksottaiset mallit voi siis esittää varsin helposti ja yksinkertaisesti. Määrittely IDENTIFY VAR = sahko(1,1,24) ESTIMATE Q=(1,2)(24) vastaa ARIMA(0,1,1)x(0,2,2)-mallia muuttujalle sahko. FORECAST-käskyllä (s. 108 SAS-manuaalissa) ennustetaan mallia käyttäen aikasarjaa eteenpäin halutusta kohdasta. Määre BACK kertoo kuinka monta havaintoa aikasarjan lopusta taaksepäin halutaan ennusteen alkavan. LEAD kertoo, montako havaintoa ennustetaan. BACK-optiolla tehdään siis ex post -ennusteita ja ellei BACK-optiota määritellä saadaan ex ante -ennuste. Esimerkissä tuotetaan aikasarjan lopusta alkava 24 tunnin pituinen ennuste. OUT-optiolla määritellyssä Ennus -nimisessä muuttujajoukossa on muuttujat FORECAST =ennustetut arvot sahko = oikeat arvot RESIDUAL = oikean ja ennustetun arvon erotukset L95 ja U95 = ennusteen 95 % luottamusvälit SAS näyttää eri korrelaatiofunktioiden numeeriset arvot ja luottamusvälit, estimoidut parametrit, niiden hajonnat ja t-arvot ja keskinäisen korrelaation, pyydetyn ennusteen sekä χ 2 -testisuureen residuaalien valkoisuuden testaamiseksi.