Ilkka Keskiväli Kiinan energiankäytön aikasarja-analysointi

Koko: px
Aloita esitys sivulta:

Download "Ilkka Keskiväli Kiinan energiankäytön aikasarja-analysointi"

Transkriptio

1 PRO GRADU -TUTKIELMA Ilkka Keskiväli Kiinan energiankäytön aikasarja-analysointi TAMPEREEN YLIOPISTO Informaatiotieteiden yksikkö Tilastotiede Joulukuu 2012

2 2

3 Tampereen yliopisto Informaatiotieteiden yksikkö KESKIVÄLI, ILKKA: Kiinan energiankäytön aikasarja-analysointi Pro gradu -tutkielma, 55 s. Tilastotiede Joulukuu 2012 Tiivistelmä Kiinan energiankäyttö on suurena tekijänä maailmanlaajuisessa ilmastonmuutoksessa. Kiina on ollut pitkään noin 10 %:n talouskasvussa, joka on samalla tarkoittanut myös energiankäytön huomattavaa kasvua. Tässä tutkielmassa ennustetaan aikasarja-analysointia käyttäen Kiinan energiankäyttöä, bruttokansantuotetta ja väkilukua. Aikasarja-analyysin malleista käytössä on ARIMA- ja VARmalli. Tutkielmassa testataan myös, onko kokonaisenergiankäyttö yhteisintegroitunut teollisuuden energiankäytön tai bruttokansantuotteen kanssa. Ennusteet tehdään 20 vuodeksi eteenpäin ja niitä verrataan muista lähteistä löytyneisiin ennustuksiin. Väkiluvun ennuste on jotakuinkin yhtä suuri kuin vertailussa käytetyt, mutta energiankäytön ja bruttokansantuotteen ennusteet eroavat merkittävästi International Energy Agencyn ja United States Department of Agriculturen ennusteista. Aikasarja-analyysin mallinnuksessa ja ennustuksessa käytetään ainoastaan historiatietoja, joten prosessi sarjan taustalla jää käsittelemättä ja näin ollen ennustukset eivät välttämättä ole luotettavia. Väkiluvun tapauksessa ennustaminen toimii menneiden arvojen perusteella, mutta energiankäyttöön ja bruttokansantuotteeseen vaikuttaa moni muukin asia, kuten uusiutumattomien energianlähteiden rajallisuus. Yhteisintegroituvuutta ei ole tutkittujen sarjojen välillä. Asiasanat yhteisintegroituvuus, energiankäyttö, ARIMA, VAR 3

4 Esipuhe Kiitokset Arto Luomalle tutkielmani ohjauksesta ja koko informaatiotieteen yksikön väelle, jotka ovat mahdollistaneet opintojeni ripeän edistymisen. Kiitokset myös työpaikalleni Tulevaisuuden tutkimuskeskukselle ja eritoten professori Jyrki Luukkaselle, joka mahdollisti tutkielman tekemisen harjoitteluni ohessa. Erityiskiitokset kuuluvat avovaimolleni, joka on jaksanut pyörittää talouttamme, kun olen ollut viikoittain opiskelupaikkakunnalla. Tampereella Ilkka Keskiväli 4

5 Sisältö 1 Johdanto Aineisto Kiinan energiankäyttö Kiinan bruttokansantuote Kiinan väkiluku Aikasarja-analyysin käsitteitä Aikasarja Stationaarisuus Auto- ja osittaisautokorrelaatio Valkoinen kohina ARIMA-malli Testisuureet Laajennettu Dickey-Fuller-testi Phillips-Perron-testi KPSS-testi Box-Cox-muunnoksen parametrin testaus Box-Ljung-testi Käännepistetesti Järjestystesti VAR-malli Yhteisintegroitunut VAR-malli Yhteisintegroituvuus Johansenin testi Mallintaminen Mallin identifiointi Stationaarisuus Valkoinen kohina

6 4.2 ARIMA-mallin estimointi ACF ja PACF Muita parametrien määritystapoja Mallin diagnostinen tarkastelu Mallin testaaminen Moniulotteinen mallintaminen Yhteisintegroituvuuden testaaminen Teollisuuden ja kokonaisenergiankäytön yhteisintegroituvuus Kokonaisenergiankäytön ja BKT:n yhteisintegroituvuus Ennustaminen Yksiulotteinen ennustaminen Moniulotteinen ennustaminen Ennusteiden vertailua BKT ja väkiluku Kokonaisenergiankäyttö Yhteenveto Lähteet

7 1 Johdanto Kiinan energiankäyttö on suuri haaste niin Kiinalle itselleen kuin koko maapallolle. Energiaa kuluu yhä enenevässä määrin eri tarpeisiin, kuten teollisuuteen, asumiseen ja liikenteeseen. Tässä tutkielmassa tutustutaan Kiinan energiankäyttöön aikasarja-analysoinnin avulla. Tutkielma tehdään osana Turun yliopiston erillislaitoksen, Tulevaisuuden tutkimuskeskuksen, CHEC-projektia (China and European Union in the context of global climate change: Analysis of changing economic structures and related policies). Projektissa perehdytään maailmanlaajuiseen ilmastonmuutokseen ja siihen, miten tähän vaikuttavat Kiinan ja EU:n muuttuva taloustilanne sekä politiikka. Energiankäytöllä ja sen ennustamisella on tässä suuri merkitys, koska etenkin Kiinassa suuri osa energiasta tuotetaan uusiutumattomilla ja saastuttavilla tavoilla. CHEC-projektin yhteistyökumppanimme Kiinasta, Chinese Academy of Social Sciences (CASS), pyrkii rakentamaan malleja ja ennustamaan tulevaa energiankäyttöä, ilmastonmuutosta ja niihin liittyviä asioita. Kumppanimme toimivat läheisessä yhteistyössä Kiinan hallituksen kanssa, jolle he raportoivat tuloksista, ja näiden perusteella hallitus tekee tulevaisuutta koskevia päätöksiä. Yhteisessä projektissamme pyrin mallintamaan aikasarjojen avulla Kiinan energiankäyttöä ja ennustamaan, miten se tulevina vuosina mahdollisesti muuttuu. Luvussa 1 johdatellaan lukija aihealueeseen. Luku 2 sisältää aineiston esittelyn ja luvussa 3 esitellään käytettyjä tutkimusmenetelmiä. Mallintamiseen keskitytään luvussa 4 ja luvussa 5 testataan, ovatko tietyt aikasarjat yhteisintegroituneita. Luvussa 6 ennustetaan Kiinan energiankäyttöä usein eri tavoin. Luku 7 sisältää yhteenvedon. 7

8 2 Aineisto Tutkielman aineistona käytetään Kiinan energiankäyttöä eri talousaloilla, Kiinan bruttokansantuotetta ja Kiinan väkilukua vuosina Kiinan energiankäytön aikasarjat on saatu järjestön International Energy Agency (IEA 2011) tietokannasta. Kiinan bruttokansantuote on peräisin ministeriön United States Department of Agriculture (USDA 2012) tietokannasta. Kiinan väkiluku on saatu järjestön Food and Agriculture Organization of the United Nations (FAO 2012) tietokannasta. Aikasarjoja on yhteensä yhdeksän ja niiden arvot ovat vuosittaisia. Aikasarjoista seitsemän liittyy energiankäyttöön: kokonaisenergiankäyttö, teollisuuden energiankäyttö, liikenteen energiankäyttö, asumisen energiankäyttö, palveluiden energiankäyttö, maa- ja metsätalouden energiankäyttö ja muu energiankäyttö. Kaksi muuta aikasarjaa ovat BKT ja väkiluku. Seuraavissa kappaleissa esittelen näitä aikasarjoja. 2.1 Kiinan energiankäyttö Kuviossa 1 on aikasarja Kiinan energiankäytöstä vuosina Kuviossa on eritelty suurimmat kohteet, joihin energiaa käytetään. Teollisuus on Kiinan suurin energiankäyttökohde ja etenkin viime vuosien aikana teollisuuden energiankäyttö on kasvanut voimakkaasti. Toiseksi eniten energiaa menee asumiseen, jonka kulutus ei ole paljon muuttunut noin 40 viime vuoden aikana. Kolmanneksi eniten energiaa Kiinassa kuluu liikenteeseen, joka on etenkin viime vuosien autoistumisen takia kasvanut huomattavasti. Loput energiasta kuluu palveluihin, maa- ja metsätalouteen sekä muuhun määrittelemättömään käyttöön. Vuonna 2009 Kiinan energiankulutus oli yli ekvivalenttia öljykilotonnia (ktoe). 8

9 Kilotonnia öljyä Muut Palvelut Maa- ja metsätalous Liikenne Asuminen Teollisuus Aika Kuvio 1. Kiinan energiankäytön aikasarjakuvaaja, jossa on eritelty suurimmat energiankäytön kohteet. Kuviossa 2 on esitetty Kiinan energiankäyttöä suhteessa vuoden 1971 tilanteeseen. Kuvaajista nähdään, kuinka etenkin palveluiden ja liikenteen energiankäyttö on kasvanut huomattavasti, jopa yli 10-kertaiseksi. Toisaalta asumisen energiankäyttö ei ole kaksinkertaistunut vuodesta 1971 vuoteen 2009 mennessä. Tästä syystä kokonaisenergiankäyttö on jotakuinkin nelinkertaistunut vuosien aikana. 9

10 Prosenttia vuoden 1971 arvosta 2500 % 2000 % 1500 % 1000 % Muut Palvelut Liikenne Teollisuus Yhteensä Maa- ja metsätalous Asuminen 500 % 0 % Aika Kuvio 2. Kiinan energiankäyttö prosentteina suhteessa vuoteen Kiinan bruttokansantuote Kuviossa 3 on Kiinan todellinen (reaalinen) bruttokansantuote, BKT, vuosina Todellisessa bruttokansantuotteessa inflaation vaikutus on otettu huomioon ja se sopii näin ollen hyvin aikasarja-analysointiin. Kiinassa bruttokansantuote on ollut tasaisesti vuosittaisessa noin 10 %:n nousussa jo pitkään. Bruttokansantuote on laskenut vain kerran vuosien aikana. Tämä tapahtui vuonna 1976, jolloin laskua tuli 1,6 %. 10

11 Miljardia dollaria Aika Kuvio 3. Kiinan todellinen bruttokansantuote vuosina Kiinan väkiluku Kiinan väkiluvun aikasarjakuvaaja vuosilta on kuviossa 4. Kiinassa on tällä hetkellä eniten asukkaita kaikista maailman valtioista, yli 1,3 miljardia. Kiinan vuonna 1979 käyttöön ottaman yhden lapsen politiikan aikaansaama syntyvyyden lasku on kuitenkin nähtävissä kuvaajasta: väkiluvun kasvu hidastuu kaiken aikaa. Tämä aiheuttaa sen, että väkiluvussa mitattuna Intia nousee Kiinan ohi muutaman kymmenen vuoden aikana. On arvioitu, että vuoden 2030 tienoilla Kiinan väkiluku alkaa tasoittua ja tämän jälkeen mahdollisesti jopa hieman laskea (Chen & Liu 2009 s. 10). 11

12 Tuhatta ihmistä Aika Kuvio 4. Kiinan väkiluku vuosina

13 3 Aikasarja-analyysin käsitteitä Tässä kappaleessa käsitellään muutamia aikasarja-analyysin peruskäsitteitä. Seuraavissa alaluvuissa selviää, mitä aikasarjat ovat ja minkälaisia ominaisuuksia aikasarjalla on oltava, jotta sitä voidaan analysoida. Lisäksi esitellään muutamia määritteitä ja malleja, joita käytetään analysoinnissa. 3.1 Aikasarja Aikasarjaksi kutsutaan havaintojonoa y t, jossa muuttujan y arvoja kirjataan peräkkäin ajanhetkinä t. Aikasarjoja voi olla jatkuvia tai diskreettejä. Diskreetissä tapauksessa peräkkäisten havaintojen väli on useimmiten yhtä pitkä koko aikasarjan osalta. Se voi olla muun muassa tunnin, päivän tai vuoden pituinen. Tässä tutkielmassa havaintojen väli on vuosi, eli joka vuosi on otettu yksi havainto. Aikasarjasta voidaan erottaa erilaisia komponentteja, joita ovat trendi, kausivaihtelu, syklinen vaihtelu ja satunnainen vaihtelu. (Brockwell & Davis 2002) 3.2 Stationaarisuus Jotta aikasarjaa voidaan mallintaa autoregressiivisen liukuvan keskiarvon prosessin avulla, pitää aikasarjan olla vähintään heikosti stationaarinen. Stationaarisella sarjalla tarkoitetaan sarjaa, jolla ei ole trendiä, kausivaihtelua tai varianssin muutosta ajan suhteen ja sen autokorrelaatiorakenne pysyy samanlaisena ajan kuluessa. Jos aikasarja on epästationaarinen, kuten kaikki aikasarjat, joita tässä tutkielmassa analysoidaan, pitää sitä käsitellä ennen varsinaista mallinnusta. Differoimalla saadaan poistettua aikasarjasta trendiä ja kausivaihtelua, kun taas logaritmoimalla saadaan poistettua eksponentiaalista trendiä ja varianssin kasvua. Differoimalla voidaan kuvata aikasarjan muutosta ajanhetkestä toiseen; tässä tutkielmassa differenssi kuvaa vuosimuutosta. (Cryer & Chan 2008) 3.3 Auto- ja osittaisautokorrelaatio Määritellään prosessin k. autokorrelaatiokerroin (1), jossa osoittaja on prosessin k. autokovarianssi ja nimittäjä on prosessin varianssi. Autokorrelaatiokerroin mittaa k aikavälin etäisyydellä olevien havaintojen välistä lineaarista riippuvuutta. 13

14 Määritellään prosessin k. osittaisautokorrelaatiokerroin (2), joka on satunnaismuuttujien ehdollinen korrelaatio, ehtomuuttujien ollessa. Osittaisautokorrelaatiokerroin mittaa k aikavälin etäisyydellä olevien havaintojen korrelaatiota, kun näiden väliin jäävien havaintojen vaikutus on eliminoitu. Autokorrelaatiofunktiosta käytetään jatkossa lyhennettä ACF (autocorrelation function) ja osittaisautokorrelaatiofunktiosta käytetään lyhennettä PACF (partial autocorrelation function). 3.4 Valkoinen kohina Jotta aikasarjaa voidaan kutsua valkoiseksi kohinaksi, täytyy havaintojen odotusarvon olla nolla ja varianssin, ja havaintojen täytyy olla riippumattomia toisistaan. Valkoinen kohina on tunnetuin stationaarinen prosessi. Valkoisen kohinan esiintymistä testataan useamman kerran aikasarja-analysoinnin edetessä. Jotta analysointi kannattaa aloittaa, analysoitava sarja ei saa olla valkoista kohinaa. Toisaalta taas aikasarjan mallin residuaalien täytyy muistuttaa valkoista kohinaa, jotta mallia voidaan pitää riittävänä. 3.5 ARIMA-malli Useimmiten aikasarjoissa on jonkinlainen trendi tai kausikomponentti, jolloin ne ovat epästationaarisia. Trendi ja kausikomponentti voidaan useimmiten poistaa differoimalla. Epästationaarista aikasarjaa voidaan kuvailla ARIMA(p,d,q)-mallilla, missä parametri d tarkoittaa differointien määrää. ARIMA(p,d,q)-malli rakentuu kolmesta osasta: AR(p)-, I(d)- ja MA(q)-prosessista. Stokastinen prosessi (3), missä on valkoista kohinaa, on autoregressiivinen (AR) prosessi. Tämä on lineaarinen regressiomalli, jossa x t on mallin selitettävä muuttuja, x t-1, x t-2,, x t-p ovat mallin selittävät muuttujat, ovat mallin regressiokertoimet ja on virhetermi. Stokastista prosessia 14

15 (4) kutsutaan liukuvan keskiarvon prosessiksi (MA). Nimitys tulee siitä, kun ajanhetkellä t prosessin arvo on painotettu summa satunnaismuuttujan arvoista viiveillä t-1, t-2,, t-q, missä kertoimet muodostavat summan painorakenteen. Edellä mainitut prosessit yhdistämällä saadaan (5), mitä kutsutaan autoregressiiviseksi liukuvan keskiarvon prosessiksi eli ARMA(p,q)-prosessiksi. 3.6 Testisuureet Tässä kappaleessa esitellään muutamia testisuureita, joita käytetään myöhemmin tutkielmassa. Testeillä selvitetään muun muassa aikasarjojen ja niiden residuaalien stationaarisuutta ja sitä, ovatko ne valkoista kohinaa Laajennettu Dickey-Fuller-testi Tarkastellaan ensimmäisen asteen autoregressiivistä mallia eli AR(1)-mallia (6), jossa virhetermin oletetaan olevan valkoista kohinaa. Jos, prosessilla sanotaan olevan yksikköjuuri. Laajennetussa Dickey-Fuller-testissä nollahypoteesi (H 0 ) on, että prosessilla on yksikköjuuri. Jos on ainakin yksi yksikköjuuri, aikasarja on epästationaarinen. Vaihtoehtoinen hypoteesi (H 1 ) tarkoittaa stationaarisuutta. Astetta p olevan autoregressiivisen prosessin yhtälö on (7), joka voidaan kirjoittaa myös muotoon (8), 15

16 missä. Hypoteesi H 0 on ja. Hypoteesi H 1 on, joten testi on yksisuuntainen. Estimaatti :lle saadaan pienimmän neliösumman menetelmällä ja se noudattaa likimain Dickey-Fuller-jakaumaa, kun H 0 on tosi ja havaintojen lukumäärä riittävän suuri. (Tsay 2005) Phillips-Perron-testi Phillips-Perron-testissä H 0 on, että yksikköjuuri on olemassa. Testistä käytetään versiota, jossa vaihtoehtoinen hypoteesi tarkoittaa stationaarisuutta. Phillips-Perron-testi on yleistys Dickey-Fullertestistä. Phillips-Perron-testi eroaa laajennetusta Dickey-Fuller-testistä pääosin niin, miten ne käsittelevät autokorrelaatiota ja heteroskedastisuutta. Phillips-Perron-testi on luonteeltaan epäparametrinen ja sallii yleisemmän riippuvuusrakenteen kuin laajennettu Dickey-Fuller-testi. (Phillips & Perron 1988) KPSS-testi KPSS-testin nimi tulee testin kehittäjien nimien mukaan: Kwiatkowski, Phillips, Scmidt ja Shin. Aikasarja ilmaistaan testissä deterministisen trendin, satunnaiskävelyn ja satunnaisvirheen summana (9), missä on satunnaiskävely, on IID(0, )-prosessi (jono riippumattomia ja samanlailla jakautuneita satunnaismuuttujia, joiden odotusarvo on nolla ja varianssi ), on deterministinen trendi ja on stationaarinen virheprosessi. KPSS-testi on tyypiltään pistemäärätesti (Lagrangen kerrointesti) ja siitä on kaksi versiota, trendija tasostationaarinen. Hypoteesin H 0 vallitessa trendistationaarinen sarja on stationaarinen deterministisen trendin ympärillä, kun taas tasostationaarinen sarja on stationaarinen kiinteän tason ympärillä. Testeissä H 0 tarkoittaa, että. Vaihtoehtoinen hypoteesi on. Tasostationaarisessa KPSS-testissä oletetaan lisäksi, että. (Kwiatkowski et al. 1992) Box-Cox-muunnoksen parametrin testaus Box-Cox-muunn ksen p met i λ id n test t, j tt s d n sel itettyä, t itseek ik s j logaritmoida. Mikäli parametrin arvon luottamusvälille osuu yksi, muunnosta ei välttämättä tarvitse 16

17 tehdä. Jos luottamusvälille osuu nolla, aikasarja kannattaa logaritmoida, jotta siitä tulee stationaarinen (Oksanen 2003 s. 66) Box-Ljung-testi Otosautokorrelaation tutkimiseen voidaan käyttää yhtä testisuuretta (10), missä on j. otosautokorrelaatio. Testisuure noudattaa likimain -jakaumaa h vapausasteella, kun aikasarja on valkoista kohinaa. Testisuureen avulla tehtävää testiä kutsutaan Box-Ljung-testiksi. Testissä H 0 on, että tarkasteltava sarja on valkoista kohinaa. (Brockwell & Davis 2002) Käännepistetesti Käännepistetesti testaa kuinka paljon käännekohtia (huippuja ja aallonpohjia) sarja sisältää. Testillä testataan siis, onko peräkkäisillä havainnoilla autokorrelaatiota. Jos saatavilla on havainnot y 1,,y n, niin käännepistetesti määritellään seuraavasti: ajanhetkellä i on käännepiste, jos y i-1 <y i ja y i >y i+1 tai y i-1 >y i ja y i <y i+1. IID-sarjassa pisteessä i käännepisteen todennäköisyys on 2/3. Kun käännepisteiden määrä n-mittaisessa sarjassa on T, saadaan T:n odotusarvoksi (11). Voidaan myös osoittaa, että (12). Kun n on suuri, T noudattaa likimain jakaumaa kohinaa. (Brockwell & Davis 2002), kun tarkasteltava sarja on valkoista Järjestystesti Järjestystestissä H 0 on, että tarkasteltava sarja on valkoista kohinaa. Testissä nimen mukaisesti testataan, minkälaisessa järjestyksessä aikasarjan arvot ovat. Sen avulla voidaan tutkia, onko sarjassa trendiä. Merkitään P:llä sellaisten parien (y i, y j ) määrää, että y j > y i ja j > i. Parien suurin lukumäärä 17

18 on n(n-1)/2. Jos sarja on valkoista kohinaa, todennäköisyys, että y j > y i on ½, joten P:n odotusarvo on (13). Voidaan myös osoittaa, että P:n varianssi on (14). Suurilla n arvoilla P noudattaa likimain jakaumaa. (Brockwell & Davis 2002) 3.7 VAR-malli Vektoriautoregressiivinen prosessi on yleistys yksiulotteisesta autoregressiivisestä prosessista. Moniulotteisessa tapauksessa otetaan lähtökohdaksi malli (15), jossa ovat -matriiseja ja on n-virhevektori. VAR(p)-mallin voidaan ajatella olevan siis usean lineaarisen regressiomallin systeemi, jossa selittävät muuttujat ovat selitettävien viivästettyjä arvoja. 3.8 Yhteisintegroitunut VAR-malli Kirjoitetaan. Jos kaikki determinantin nollakohdat ovat yksikköympyrän ulkopuolella, niin x t on stationaarinen. Stationaarisen sarjan sanotaan olevan I(0)- prosessi, eli se ei ole integroitu. Virhekorjattu malli (ECM) VAR(p)-prosessille x t on (16), missä, ja. Lauseke on virheenkorjaustermi, jolla on suuri merkitys yhteisintegroituvuuden tutkimisessa. Matriisit ECM-esityksestä seuraavasti: voidaan palauttaa 18

19 missä. (17), (18),, Jos x t sisältää yksikköjuuren, niin, joten. Seuraavat kolme tapausta ovat tutkimisen arvoisia: 1. R nk(π) = 0. Tämä me kitsee, että ja x t ei ole yhteisintegroitunut. ECM supistuu muotoon (19), joten seuraa VAR(p-1)-mallia deterministisellä trendillä. 2. Rank(Π) = k. Tämä merkitsee, että ja x t ei sisällä yksikköjuurta. ECM malli ei ole informatiivinen < R nk(π) = m < k. Tässä tapauksessa (20), missä α j β t sellaisia k x m matriiseja, että Rank(α) = R nk(β) = m. ECM kirjoitetaan tällöin muodossa (21). Tämä tarkoittaa, että x t on yhteisintegroitunut lineaarisesti riippumattomien yhteisintegroituvuusvektoreiden lukumäärän ollessa m, ja x t :llä on yksikköjuurta, jotka antavat yhteistä stokastista x t :n trendiä. (Tsay 2005) 3.9 Yhteisintegroituvuus Jotta kaksi tai useampia aikasarjoja olisivat yhteisintegroituneita, täytyy niiden olla epästationaarisia ja niiden lineaarikombinaation olla stationaarinen. Sanotaan x t :n ja y t :n olevan yhteisintegroituneit, j s n lem ss sell inen ki α ( 0), että (22) 19

20 on stationaarinen prosessi (Sørensen 1997). Yhteisintegroituvuutta voidaan kuvata dynaamisena tasapainona, eli kun aika t kasvaa, niin sarjat eivät voi etääntyä mielivaltaisen kauas toisistaan Johansenin testi J h nsenin testi pe ustuu m t iisin Π tutkimiseen. Voidaan sanoa, että R nk(π) E M:ssä n yhtä suuri kuin yhteisintegroituvuusvektoreiden lukumäärä. Johansenin testi sisältää kaksi testisuuretta, trace-testisuu een (λ trace ) ja maksimiominaisarvo-testisuu een (λ max ) ja sillä voidaan testata kahden tai useamman aikasarjan välistä yhteisintegroituvuutta. Määritellään kaksi monimuuttujaista lineaarista regressioyhtälöä (23) (24), missä ja ovat residuaalit. Määritellään otoskovarianssimatriisit: (25) (26) (27) Määritellään trace-testisuure (28), missä ovat yhtälön (29) n r pienimmät ominaisarvot. Testissä H 0 on, että Rank(Π) = r ja vaihtoehtoinen hypoteesi on, että Rank(Π) >. Mää itellään λ max -testisuure (30), missä T on havaintojen lukumäärä. Testissä H 0 on, että Rank(Π) = r ja vaihtoehtoinen hypoteesi on, että Rank(Π) = r + 1. (Johansen 1991) 20

21 4 Mallintaminen Aikasarjojen mallintamisessa käytetään yleisesti Boxin ja Jenkinsin menetelmää (Box & Jenkins 1976). Menetelmä sisältää kolme vaihetta: 1. mallin identifiointi, 2. mallin estimointi, 3. diagnostiset tarkastelut. Mallin identifiointiin sisältyy aikasarjan stationaarisuuden toteaminen ja tarvittaessa logaritmointi ja differointi, jotta aikasarja saadaan muutettua stationaariseksi. Stationaariseksi saatettu aikasarja ei myöskään saa olla valkoista kohinaa, mikä täytyy testata ennen mallin estimoinnin suorittamista. Mallin identifiointiin liittyy myös mallin valinta, eli onko malli muotoa AR, MA vai mahdollisesti ARIMA. Työkaluina toimivat muun muassa ACF:n ja PACF:n kuvaajat. Mallin valinta voidaan suorittaa myös informaatiokriteerin perusteella. Tässä työssä käytetään Akaiken informaatiokriteeriä, AIC:ia. Välttämättä paras malli ei ole se, jolla on pienin informaatiokriteerin arvo, mutta malli voidaan valita joukosta malleja, joilla on pienimmät AIC:n arvot. Mallin estimoinnissa selvitetään parhaat parametrit mallille, tässä tapauksessa ARIMA-mallille. Tilasto-ohjelmistot sisältävät eri estimointimenetelmiä. Mallin diagnostiset tarkastelut perustuvat mallin residuaalien tutkimiseen. Mallin residuaalien täytyy muistuttaa valkoista kohinaa, jotta voidaan olettaa mallin olevan riittävä. Jäännössarjan testaamiseen voidaan käyttää monia samoja tapoja kuin itse aikasarjan testaamiseen, muun muassa Box- Ljung-testiä. Valkoisuuden testaamiseksi voidaan myös tarkastella residuaaleja erilaisten kuvaajien avulla. Residuaalien normaalisuutta testataan Shapiro-Wilk-testillä. Mikäli valittu malli ei läpäise testejä ja tarkasteluja, jatketaan jälleen alusta mallin identifioinnista. Diagnostisten tarkastelujen jälkeen voidaan vielä testata mallin toimivuutta ennustamalla aikasarjan alkuosan avulla loppuosaa ja vertaamalla ennustetta ja jo toteutuneita arvoja keskenään. Moniulotteisessa mallinnuksessa käytetään vektoriautoregressiivistä prosessia, VAR. Pyritään siis rakentamaan malli useammalle kuin yhdelle aikasarjalle samanaikaisesti. Tässä tutkielmassa malli tehdään kahdelle aikasarjalle, kokonaisenergiankäytölle ja BKT:lle. Muuten mallinnuksessa toimitaan samaan tapaan kuin yksiulotteisessa mallinnuksessa. Työkalut näihin toimiin ovat kuitenkin erilaiset, koska useimmat yksiulotteisen mallinnuksen työkalut eivät toimi moniulotteisen mallinnuksen tapauksessa. 21

22 4.1 Mallin identifiointi Stationaarisuus Jotta aikasarjaa voisi mallintaa, pitää sen olla stationaarinen. Kuviosta 5 voidaan nähdä, että mikään yhdeksästä aikasarjasta ei ole stationaarinen. Jotta asialle saadaan lisävarmistusta, stationaarisuutta voidaan myös testata. Tällaisia testejä ovat muun muassa laajennettu Dickey-Fuller-yksikköjuuritesti, Phillips-Perron-testi ja KPSS-testi eli Kwiatkowski Phillips Schmidt Shin-testi, josta käytetään versiota, jossa testataan tasostationaarisuutta. Taulukossa 1 on kaikkien näiden testien p-arvot, joista nähdään, että aikasarjat eivät tosiaan ole stationaarisia. Dickey-Fuller-testin perusteella voisi sanoa, että maa- ja metsätalouden aikasarja olisi stationaarinen, mutta kaksi muuta testiä antavat eri tuloksen. Taulukko 1. Stationaarisuutta testaavien Dickey-Fuller, Phillips-Perron ja KPSS-testien p-arvot. Dickey-Fuller-testi Phillips-Perron-testi KPSS-testi Kokonaisenergiankäyttö 0,88 >0,99 <0,01 Teollisuus 0,68 >0,99 <0,01 Liikenne >0,99 >0,99 <0,01 Asuminen 0,42 0,79 <0,01 Palvelut >0,99 >0,99 <0,01 Maa- ja metsätalous <0,01 0,10 <0,01 Muut >0,99 >0,99 <0,01 BKT >0,99 >0,99 <0,01 Väkiluku >0,99 >0,99 <0,01 22

23 Kuvio 5. Kaikkien yhdeksän aikasarjan kuvaajat. Aikasarja voidaan muuttaa stationaariseksi esimerkiksi logaritmoimalla, differoimalla tai logaritmoimalla ja differoimalla. Logaritmoinnin tarve voidaan havaita, kun testataan Box- Cox-muunnoksen parametria. Taulukossa 2 on kaikkien aikasarjojen Box-Cox-muunnoksen parametrien luottamusvälit. Kaikille muuttujille ei saatu laskettua muunnoksen parametrien luottamusvälejä, mutta viidellä aikasarjalla nolla löytyy luottamusväliltä. Tehdään kuitenkin päätös, että logaritmoidaan kaikki aikasarjat väkilukua lukuun ottamatta, vaikka kaikista ei saatu tulosta ja palvelujen luottamusväli on -0,6-0,1. Väkilukua ei logaritmoida, koska se ei kasva eksponentiaalisesti. 23

24 Taulukko 2. Box-Cox parametrin luottamusvälit. Box-Cox parametrin luottamusväli Kokonaisenergiankäyttö -1,3 0,0 Teollisuus -0,5 0,5 Liikenne ei tulosta Asuminen -1,5 1,5 Palvelut -0,6-0,1 Maa- ja metsätalous -1,5 0,1 Muut -0,2 0,0 BKT ei tulosta Väkiluku ei tulosta Pelkällä logaritmoinnilla ei vielä saavutettu missään aikasarjassa stationaarisuutta. Seuraavaksi testataan kuinka monta kertaa aikasarjat pitää differoida, jotta niistä tulee stationaarisia. Taulukossa 3 on kaikkien aikasarjojen stationaarisuustestien p-arvot yksinkertaisen ja kaksinkertaisen differoimisen jälkeen. Siitä nähdään ainakin yhden testin perusteella, että yksinkertainen differointi riittää kaikkien aikasarjojen tapauksessa saattamaan aikasarjat stationaariseen tilaan, tarkemmin differenssistationaariseen tilaan paitsi väkiluvun tapauksessa. Väkiluku täytyy differoida vähintään kahteen kertaan, jotta se saadaan stationaariseen tilaan. Valitaan tässä vaiheessa muista aikasarjoista siis yksinkertainen differointi ja laajennetaan mallinrakentamisessa tarvittaessa kaksinkertaiseen differoimiseen. Kuviossa 6 on vielä kaikkien aikasarjojen kuvaajat mahdollisen logaritmoinnin ja yksinkertaisten tai kaksinkertaisten differointien jälkeen. Nyt myös kuvaajat näyttävät stationäärisemmiltä kuin kuviossa 5. Taulukko 3. Laajennetun Dickey-Fuller, Phillips-Perron ja KPSS-testien p-arvot mahdollisen logaritmoinnin ja yksinkertaisen sekä kaksinkertaisen differoinnin jälkeen. Logaritmointi ja differointi Logaritmointi ja 2x differointi ADF PP KPSS ADF PP KPSS Kokonaisenergiankäyttö 0,16 0,08 >0,10 0,06 <0,01 >0,10 Teollisuus 0,10 0,02 >0,10 0,04 <0,01 >0,10 Liikenne 0,05 <0,01 >0,10 <0,01 <0,01 >0,10 Asuminen 0,74 0,02 >0,10 0,05 <0,01 >0,10 Palvelut 0,33 <0,01 >0,10 <0,01 <0,01 >0,10 Maa- ja metsätalous <0,01 <0,01 >0,10 0,01 <0,01 >0,10 Muut 0,47 <0,01 >0,10 <0,01 <0,01 >0,10 BKT 0,25 <0,01 0,04 <0,01 <0,01 >0,10 Väkiluku (ei logaritmia) 0,19 0,70 <0,01 0,03 0,63 >0,10 24

25 ktoe ktoe ktoe ktoe ktoe ktoe ktoe miljardia dollaria asukasta Kokonaisenergiankäyttö BKT Väkiluku Aika Aika Aika Teollisuus Liikenne Asuminen Aika Aika Aika Palvelut Maa- ja metsätalous Muut Aika Aika Aika Kuvio 6. Aikasarjojen kuvaajat logaritmointien ja yksinkertaisten differointien jälkeen (väkiluku 2x) Valkoinen kohina Jotta aikasarjan mallintamista kannattaa jatkaa, sarja ei saa olla valkoista kohinaa. Valkoista kohinaa voidaan testata usealla erilaisella testillä. Käytetään tässä kolmea testiä: käännepistetesti, järjestystesti ja Box-Ljung-testi (viivepituudella 3). Taulukkoon 4 on listattu näiden kaikkien arvot, kun aikasarjat ovat logaritmoitu ja differoitu. Kaikissa näissä testeissä H 0 -hypoteesi tarkoittaa sitä, että sarja on valkoista kohinaa. Päätetään, että jos yksikin testi hylkää H 0 -hypoteesin, voidaan mal- 25

26 lintamista jatkaa. Tämä toteutuu kaikkien muiden aikasarjojen kohdalla paitsi liikenteen, palveluiden ja muun energiankäytön kohdalla. Taulukko 4. Valkoista kohinaa testaavien testien p-arvot mahdollisen logaritmoinnin ja yksinkertaisen ja kaksinkertaisen differoinnin jälkeen. Käännepiste Järjestys Box-Ljung Kokonaisenergiankäyttö 1x 0,1148 0,4893 0,0027 Teollisuus 1x 0,1148 0,6239 0,0331 Liikenne 1x 0,4304 0,6782 0,6058 Asuminen 1x 0,4304 0,5546 0,0366 Palvelut 1x 0,4304 0,1220 0,5582 Maa- ja metsätalous 1x 0,0487 0,1482 0,1315 Muut 1x 0,4304 0,8112 0,7809 BKT 1x 0,0058 0,0214 0,4285 Väkiluku 2x 8,8x ,2189 3,3x ARIMA-mallin estimointi ACF ja PACF ARIMA(p,d,q)-mallin parametreja voidaan päätellä autokorrelaation ja osittaisautokorrelaation avulla. Kuviossa 7 on kaikkien logaritmoitujen ja differoitujen aikasarjojen otosautokorrelaatiot ja otososittaisautokorrelaatiot. Parametria p voidaan arvioida PACF:n kuvaajasta: Kun viive asettuu rajojen sisäpuolelle arvolla p+1, voidaan olettaa, että AR(p)-malli olisi sopiva. Parametria q voidaan toisaalta arvioida ACF:n kuvaajasta: Kun viive asettuu rajojen sisään arvolla q+1, voidaan olettaa, että MA(q)-malli olisi sopiva. 26

27 Partial ACF Partial ACF Partial ACF ACF ACF ACF Partial ACF Partial ACF Partial ACF ACF ACF ACF Partial ACF Partial ACF Partial ACF ACF ACF ACF Kokonaisenergiankäyttö BKT Väkiluku Lag Lag Lag Lag Lag Lag Teollisuus Liikenne Asuminen Lag Lag Lag Lag Lag Lag Palvelut Maa- ja metsätalous Muut Lag Lag Lag Lag Lag Lag Kuvio 7. Kaikkien aikasarjojen otosautokorrelaatiot ja otososittaisautokorrelaatiot. Taulukossa 5 on ACF:n ja PACF:n perusteella arvioidut parametrit kaikille aikasarjoille. Taulukossa on lisäksi myös parametri d, joka tulee differointien määrästä. 27

28 Taulukko 5. Aikasarjojen parametrien arvioidut arvot ACF:n ja PACF:n perusteella. AR(p) I(d) MA(q) Kokonaisenergiankäyttö Teollisuus Liikenne Asuminen Palvelut Maa- ja metsätalous Muut BKT Väkiluku Muita parametrien määritystapoja Parametrien määrittämiseksi on myös muita keinoja, joita löytyy esimerkiksi R-ohjelmistosta. Tällaisia ovat muun muassa funktiot armasubsets ja eacf. Lopullinen mallinvalinta voidaan kuitenkin tehdä mallien AIC:n ja residuaalien tarkastelujen perusteella. Useamman mallin kokeilu ja vertailu on nykyään helppoa tietokoneohjelmistoilla. Taulukkoon 6 on koottu AIC:n perusteella valitut ARIMA-mallien parametrit. Näistä kokonaisenergiankäyttö, asuminen, palvelut, maa- ja metsätalous ja muut ovat täysin samat kuin ACF:n ja PACF:n avulla arvioidut parametrit. Kuuden muun aikasarjan parametrit eroavat enemmän tai vähemmän aiemmin arvioiduista. Taulukko 6. Aikasarjojen sekamallien (ARIMA) parametrien arvot valittuna AIC:n perusteella. AR(p) I(d) MA(q) Kokonaisenergiankäyttö Teollisuus Liikenne Asuminen Palvelut Maa- ja metsätalous Muut BKT Väkiluku

29 4.3 Mallin diagnostinen tarkastelu Jotta voidaan sanoa, että mallinnus olisi valmis, täytyy mallin residuaalien olla likimain riippumatonta valkoista kohinaa. Tämä voidaan todeta tarkastelemalla residuaalien histogrammeja, kvantiilikvantiili kuvaajia ja tekemällä testejä residuaaleille. Tällaisia testejä ovat muun muassa Shapiro- Wilk-testi, jolla testataan residuaalien normaalisuutta ja jo aiemmin mainittu Box-Ljung-testi. Shapiro-Wilk-testin H 0 -hypoteesi on, että aikasarja on normaalisti jakautunut ja Box-Ljung-testin H 0 -hypoteesi on, että aikasarja on valkoista kohinaa. Taulukossa 7 on näiden testien p-arvot, jotka kertovat, että kaikkien mallien residuaalit todellakin ovat valkoista kohinaa. Kaikkien mallien kohdalla residuaalit eivät kuitenkaan olleet normaalisti jakautuneet. Tärkeämpää on kuitenkin, että aikasarjojen jäännössarjat läpäisevät Box-Ljung-testin viivepituudella 10. Taulukko 7. ARIMA-mallien residuaaleille tehtyjen testien (Shapiro-Wilk ja Box-Ljung) p-arvoja. Shapiro-Wilk Box-Ljung Kokonaisenergiankäyttö 0,467 0,858 Teollisuus 0,431 0,845 Liikenne 0,038 0,660 Asuminen 0,138 0,896 Palvelut 0,298 0,558 Maa- ja metsätalous 8,239x10-6 0,132 Muut 0,0002 0,781 BKT 0,012 0,786 Väkiluku 0,0004 0,196 Piirretään vielä muutamien aikasarjojen osalta AIC:n mielessä parhaiden mallien residuaalien histogrammit ja kvantiili-kvantiili-kuviot. Asumisen energiankäytön ARIMA(1,1,0)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio ovat kuviossa 8. Histogrammi näyttäisi olevan hieman vasemmalle vino, mutta kuitenkin suhteellisen normaalisti jakautunut, kuten myös Shapiro-Wilkin testi kertoo. Vaikka Box-Ljung-testi sanoo residuaalien olevan valkoista kohinaa, kuvioiden epämääräisyyden takia testataan, jos kaksinkertaisesti differoitu aikasarja toimisi paremmin mallinnuksessa. Kun aikasarja on differoitu toistamiseen, pitää valita ARIMA-mallin parametrit uudestaan AIC:n perusteella. Parhaaksi malliksi valikoituu ARIMA(0,2,1)-malli. Shapiro-Wilk-testisuureeksi saadaan 0,4527, joten voidaan sanoa residuaalien olevan normaalisti jakautunut. Box-Ljung-testisuureeksi saadaan 0,9769, joten 29

30 mallin residuaalit ovat valkoista kohinaa. Nyt myös kuvion 9 kuviot ovat paremman näköiset kuin ARIMA(1,1,0)-mallin tapauksessa, joten ARIMA(0,2,1)-mallia pidetään riittävänä. Kuvio 8. Asumisen energiankäytön ARIMA(1,1,0)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuvio 9. Asumisen energiankäytön ARIMA(0,2,1)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuviossa 10 on maa- ja metsätalouden energiankäytön ARIMA(0,1,0)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuvaajista nähdään, että residuaalit eivät ole normaaliset, jota tukee myös Shapiro-Wilk-testin tulos (8,239x10-6 ). Box-Ljung-testi kuitenkin antaa sellaisen tulok- 30

31 sen, että residuaaleja voidaan pitää valkoisena kohinana. Kvantiili-kvantiili -kuvio ei ole riittävän hyvän näköinen, joten kokeillaan differoida aikasarja toistamiseen. Kuvio 10. Maa- ja metsätalouden energiankäytön ARIMA(0,1,0)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kun aikasarja differoidaan toistamiseen, pitää ARIMA-mallin parametrit valita uudestaan AIC:n perusteella. Parhaaksi malliksi valikoituu ARIMA(0,2,1)-malli. Shapiro-Wilk-testisuureeksi saadaan 3,222x10-5, joten voidaan sanoa, että mallin residuaalit eivät ole edelleenkään normaalisti jakautuneet. Box-Ljung-testisuureeksi saadaan 0,02799, joten 1 %:n riskitasolla ei hylätä hypoteesia, että residuaalit ovat valkoista kohinaa. Kuvion 11 kuviot ovat paremman näköiset kuin ARIMA(0,1,0)-mallin tapauksessa, joten ARIMA(0,2,1)-mallia voidaan pitää riittävänä. 31

32 Kuvio 11. Maa- ja metsätalouden energiankäytön ARIMA(0,2,1)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuviossa 12 on väkiluvun ARIMA(0,3,2)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuvioista nähdään, että residuaalit eivät ole täysin normaalisti jakautuneet. Box-Ljung-testi antaa kuitenkin viitteitä siitä, että residuaalit olisivat valkoista kohinaa. Piirretään vielä residuaalit ajan suhteen (kuvio 13). Residuaalit ovat suhteellisen satunnaisia, paitsi jonkin verran vähemmän vaihtelua esiintyy sarjan loppupäässä. Voidaan kuitenkin pitää ARIMA(0,3,2)-mallia riittävänä. Kuvio 12. Väkiluvun ARIMA(0,3,2)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. 32

33 Kuvio 13. Väkiluvun ARIMA(0,3,2)-mallin residuaalit ajan suhteen. Kolmen parhaan AIC:n malleja testattiin aiemmin mainituilla testeillä ja nämä kaikki läpäisivät testit. Näitä kaikkia kolmea mallia testataan seuraavassa kappaleessa, jonka jälkeen tehdään lopulliset mallien valinnat. 4.4 Mallin testaaminen Malleja voidaan testata ottamalla alkuosa aikasarjasta ja ennustamalla loppuosaa ja vertaamalla sitä todellisiin arvoihin. Aikasarjojen pituudet ovat 39 vuotta, joten otetaan siitä erikseen ensimmäiset 34 vuotta ja ennustetaan seuraavaa viittä vuotta ja verrataan sitä toteutuneisiin arvoihin. Tehdään tämä kolmen parhaan AIC:n arvon saaneella mallilla. Näiden kolmen mallin AIC:n arvot olivat kaikissa tapauksissa kahden yksikön sisällä, joten näistä kolmesta minkä tahansa mallin valinta on perusteltua. Mikäli parhaan AIC:n arvon saanut malli ei ennusta tarpeeksi hyvin kuvaajan perusteella jo toteutuneita arvoja, valitaan lopulliseksi malliksi parhaiten näistä kolmesta suoriutunut malli. Taulukossa 8 on lopulta valittujen ARIMA-mallien parametrit. AIC:n perusteella valituista vaihtui ainoastaan teollisuuden parametrit, koska tässä tapauksessa ennustus oli merkittävästi parempi muulla kuin parhaan AIC:n saaneella mallilla (kuvio 14). 33

34 Kuvio 14. Teollisuuden ARIMA(1,1,0) ja ARIMA(2,1,2)-mallien ennusteet, punaisella paksulla katkoviivalla (1,1,0) ja sinisellä ohuella katkoviivalla (2,1,2), ja 95 % ennustevälit pisteviivoilla vuosille Mustalla yhtenäisellä viivalla on toteutuneet arvot. Taulukko 8. Lopulliset ARIMA-mallien parametrit. AR(p) I(d) MA(q) Kokonaisenergiankäyttö Teollisuus Liikenne Asuminen Palvelut Maa- ja metsätalous Muut BKT Väkiluku

35 4.5 Moniulotteinen mallintaminen Aikasarjan mallintamista voidaan tehdä myös moniulotteisesti, jolloin käytössä on siis useampia kuin yksi aikasarja. Mallinnetaan Kiinan kokonaisenergiankäyttöä ja BKT:ta käyttämällä R-ohjelmiston kirjastoa vars, jossa on funktio VAR. Käytetään mallinnuksessa logaritmoituja ja yhden kerran differoituja aikasarjoja, koska aikasarjojen täytyy olla stationaarisia ennen mallin sovitusta. VAR(p)-mallin paras viivepituus p saadaan valittua VARselect-funktiolla. VARselect antaa neljän eri kriteerin perusteella ehdotuksen viivepituuden arvoksi. Nämä kriteerit ovat AIC, Hannan-Quinn (HQ), Schwarz (SC), joka on sama kuin BIC ja Forecast Prediction Error (FPE). Kriteerien valitsemat viivepituuksien arvot ovat taulukossa 9. Valitaan viivepituudeksi 1, jota käytetään mallin tekemiseen VAR-funktiolla. VAR-funktion kanssa voidaan käyttää predict-funktiota, jolla ennustaminen onnistuu kätevästi. Vars-paketista löytyy serial.test-testi, joka on moniulotteinen Portmonteautesti. Testi testaa ovatko mallin residuaalit valkoista kohinaa. P-arvoksi saadaan 0,893, joten residuaalit ovat valkoista kohinaa ja malli voidaan hyväksyä. Taulukko 9. VARselect-funktion antamat viivepituuden p arvot eri kriteerien perusteella moniulotteiselle VAR(p)- mallille. Kriteeri AIC HQ SC (BIC) FPE Parametrien arvo

36 5 Yhteisintegroituvuuden testaaminen 5.1 Teollisuuden ja kokonaisenergiankäytön yhteisintegroituvuus Pyritään selvittämään, onko kokonaisenergiankäytöllä ja teollisuuden energiankäytöllä yhteyttä toisiinsa. Voidaan siis kysyä, seuraako teollisuuden energiankäyttö kokonaisenergiankäyttöä samassa suhteessa ajan t kasvaessa. Jotta näihin kysymyksiin voisi vastata kyllä, pitää näiden aikasarjojen olla keskenään yhteisintegroituneita. Kuvion 15 perusteella näillä kahdella aikasarjalla voisi olettaa olevan jonkinlainen yhteys, koska ne selvästi ovat yhdenmuotoiset. Kuvio 15. Mustalla viivalla kokonaisenergiankäytön aikasarja ja punaisella viivalla teollisuuden energiankäytön aikasarja vuosina Testataan Johansenin menetelmällä, onko olemassa yhteisintegroituvuusvektoria ja kuinka monta niitä on. Aikasarjat logaritmoidaan ennen yhteisintegroituvuustestien tekemistä. Taulukossa 10 on testien tulokset. Nähdään, että yhteisintegroituvuusvektoria ei ole olemassa, koska H 0 -hypoteesit 36

37 hyväksytään kummassakin tapauksessa. Tämä tarkoittaa sitä, että kokonaisenergiankäyttö ja teollisuuden energiankäyttö eivät ole yhteisintegroituneita. Taulukko 10. Johansenin testin tulokset: hypoteesit, testisuureet ja luottamusrajat. H 0 -hypoteesi H 1 -hypoteesi Testisuure Luottamusrajat λ max 90 % 95 % 99 % r = 0 r = 1 8,57 12,91 14,90 19,19 r = 1 r = 2 0,57 6,50 8,18 11,65 λ trace r <= 0 r > 0 9,14 15,66 17,95 23,52 r <= 1 r > 1 0,57 6,50 8,18 11, Kokonaisenergiankäytön ja BKT:n yhteisintegroituvuus Selvitetään seuraavaksi onko kokonaisenergiankäytöllä ja BKT:lla yhteyttä toisiinsa. Onko siis olemassa yhteisintegroituvuusvektoria. Kuviossa 16 on aikasarjat ja kummallakin on selvästi kasvava trendi ajan suhteen. Testataan, onko olemassa yhteisintegroituvuusvektoria ja kuinka monta niitä mahdollisesti on. Aikasarjat logaritmoidaan ennen yhteisintegroituvuustestien tekemistä. Taulukossa 11 on Johansenin menetelmän testitulokset. Nähdään, että yhteisintegroituvuusvektoria ei ole olemassa, koska H 0 -hypoteesit hyväksytään kummassakin tapauksessa. Tämä tarkoittaa sitä, että kokonaisenergiankäyttö ja bruttokansantuote eivät ole yhteisintegroituneita. Taulukko 11. Johansenin testin tulokset: hypoteesit, testisuureet ja luottamusrajat. H 0 -hypoteesi H 1 -hypoteesi Testisuure Luottamusrajat λ max 90 % 95 % 99 % r = 0 r = 1 5,73 12,91 14,90 19,19 r = 1 r = 2 2,24 6,50 8,18 11,65 λ trace r <= 0 r > 0 7,96 15,66 17,95 23,52 r <= 1 r > 1 2,24 6,50 8,18 11,65 37

38 Kilotonnia öljyä Miljardia dollaria , Kokonaisenergiankäyttö BKT 3500, , , , , , ,00 0 0,00 Vuosi Kuvio 16. Kokonaisenergiankäytön ja bruttokansantuotteen kuvaajat vuosilta

39 6 Ennustaminen Tässä luvussa tehdään ennusteita Kiinan energiankäytöstä, väkiluvusta ja BKT:sta. Ennusteet perustuvat kappaleessa 4 valittuihin malleihin. Kappaleessa myös vertaillaan näitä ennusteita keskenään ja muista lähteistä löydettyihin ennusteisiin. 6.1 Yksiulotteinen ennustaminen Ennustetaan kaikkia yhdeksää aikasarjaa ensin yksiulotteisesti. Jokaisesta aikasarjasta piirretään samaan kuvaajaan jo toteutuneet arvot, ennusteet ja 95 %:n ennustevälit. Nämä kuvaajat ovat kuvioissa Kuvio 17. Kokonaisenergiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. 39

40 Kiinan energiankäyttö on ollut tasaisessa nousussa vuodesta 1971 lähtien muutamia notkahduksia lukuun ottamatta ja saman trendin voidaan odottaa jatkuvan. Ennusteen mukaan Kiinan energiankäyttö tulee nousemaan seuraavien 20 vuoden aikana noin kaksinkertaiseksi nykyisestä. Ennustevälit kuitenkin laajenevat, joten ennusteen epävarmuus kasvaa ajan myötä. Kuvio 18. Teollisuuden energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Teollisuuden energiankäyttö on kasvanut lähes samanlaisella trendillä kuin kokonaisenergiankäyttö vuodesta 1971 lähtien. Ennusteen mukaan teollisuuden energiankäyttö tulee kasvamaan noin kaksinkertaiseksi 20 seuraavan vuoden aikana. Ennustevälit kuitenkin kasvavat huomattavasti ajan myötä, jolloin myös ennusteen epävarmuus kasvaa. 40

41 Kuvio 19. Liikenteen energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Kiina on perinteisesti ollut polkupyörien ja mopojen luvattu maa, mutta viimeisten vuosien aikana yksityisautoilu on kasvattanut suosiotaan. Tämän voi todeta myös kuviosta 20, jossa on kuvattu liikenteen energiankäyttöä, joka on yli kymmenkertaistunut vuodesta 1971 lähtien. Ennusteen mukaan sama trendi tulee myös jatkumaan; seuraavien 20 vuoden aikana energiankäyttö tulee kasvamaan noin kolminkertaiseksi. Ennustevälien perusteella energiankäyttö kasvaa 2-5-kertaiseksi. 41

42 Kuvio 20. Asumisen energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Asumisen energiankäyttö ei ole juurikaan kasvanut henkilöä kohden vuodesta 1971 lähtien. Kokonaisuudessaan asumisen energiankäyttö on kuitenkin kasvanut noin kaksinkertaiseksi ja seuraavien 20 vuoden aikana kasvua tulee lisää noin 50 % nykyiseen energiankäyttöön nähden. 42

43 Kuvio 21. Palveluiden energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Kiinan kehitys ja talouskasvu on samalla myös kasvattanut huomattavasti palveluiden energiankäyttöä. Vuodesta 1971 lähtien palveluiden energiankäyttö on kasvanut lähes 15-kertaiseksi. Tulevaisuudessakin palveluiden energiankäyttö tulee kasvamaan, seuraavan 20 vuoden aikana noin 3-4- kertaiseksi. 43

44 Kuvio 22. Maa- ja metsätalouden energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Kiinan maa- ja metsätalouden energiankäyttö on noin kolminkertaistunut vuodesta 1971 lähtien. Kasvu on selvästi hillitympää kuin monen muun alan energiankäytön kohdalla. Ennusteen mukaan energiankäyttö tulee kasvamaan noin 30 % seuraavan 20 vuoden aikana. Ennustevälit kuitenkin kasvavat huomattavasti ajan suhteen, joten ennusteen epävarmuus myös kasvaa samalla. 44

45 Kuvio 23. Muun energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Vuonna 1971 ei ollut juurikaan muuta energiankäyttöä kuin mitkä on aiemmin mainittu. Muu energiankäyttö on kuitenkin kasvanut huimasti 25-kertaiseksi 39 vuodessa. Ennusteen mukaan kasvu jatkuu edelleen ja seuraavan 20 vuoden energiankäyttö kasvaa noin nelinkertaiseksi. 45

46 Kuvio 24. Väkiluvun ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää ennusteen lisäksi toteutuneet arvot mustalla viivalla ja 95 % ennustevälit. Kiina on väkiluvultaan maailman suurin valtio. Vuodesta 1971 lähtien Kiinan väkiluku on kasvanut noin 800 miljoonasta hieman alle 1,4 miljardiin. Kasvua on kuitenkin alkanut tyrehdyttää yhden lapsen politiikka, joka aloitettiin vuonna Ennusteen mukaan Kiinan väkiluvun nousee 20 vuoden aikana noin 1,45 miljardiin henkilöön. 46

47 Kuvio 25. Bruttokansantuotteen ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Kiinan bruttokansantuote on ollut pitkään noin 10 %:n kasvussa vuosittain. Bruttokansantuote on kasvanut lähes 30-kertaiseksi vuodesta 1971 vuoteen 2009 mennessä. Tulevaisuudessa BKT jatkaa kasvuaan ja seuraavan 20 vuoden aikana kasvu on yli viisinkertaista. 6.2 Moniulotteinen ennustaminen Moniulotteinen malli tehtiin Kiinan kokonaisenergiankäytöstä ja BKT:sta. Malliksi valikoitui logaritmoiduille ja kerran differoiduille sarjoille VAR(1)-malli. Kuvioissa 26 ja 27 on toteutuneet arvot, ennuste seuraavaksi 20 vuodeksi ja 95 % ennustevälit. Kokonaisenergiankäyttö jatkaa tasaista nousua, päätyen vuonna ,57 miljoonaan kilotonniin öljyä. BKT-käyrän nähdään jatkavan tiivistä 47

48 nousuaan ja ennuste vuodelle 2029 on 31,8 biljoonaa dollaria. Kummankin ennustevälit kuitenkin kasvavat huomattavasti ajan suhteen, joten näiden ennusteiden käyttö näin pitkällä aikavälillä ei ole järkevää. Kuvio 26. Kokonaisenergiankäytön toteutuneet arvot ja moniulotteisella mallinnuksella saatu ennuste seuraavalle 20 vuodelle. 48

49 Kuvio 27. BKT:n toteutuneet arvot ja moniulotteisella mallinnuksella saatu ennuste seuraavalle 20 vuodelle. 6.3 Ennusteiden vertailua BKT ja väkiluku Kiinan bruttokansantuotteen odotetaan jatkavan tasaista kasvuaan tulevaisuudessa. Viime vuosien aikana kasvu on ollut noin 10 %:n luokkaa, ja vuoteen 2030 mennessä kasvun ennustetaan jatkavan kasvuaan noin 7 %:n vuosivauhdilla. Vuonna 2029 BKT:n ennustetaan olevan 15,3 biljoonaa dollaria (USDA). Yksiulotteinen ennusteeni Kiinan BKT:sta vuonna 2029 on jonkin verran suurempi kuin USDA:n arvio, noin 19,6 biljoonaa dollaria. USDA:n arvio osuu kuitenkin 95 %:n ennustevälille, joka on 12,5 30,7 biljoonaa dollaria. Moniulotteinen ennusteeni Kiinan BKT:sta vuonna 2029 on 31,8 biljoonaa dollaria, joka on huomattavasti suurempi kuin USDA:n arvio. USDA:n arvio osuu 49

50 myös tämän ennustevälille, joka on 9,9 102,1 biljoonaa dollaria. Ennusteväli on kuitenkin huomattavan suuri, joten ennusteen epävarmuus on myös erittäin suuri. Kuviossa 28 on yksiulotteisen ja moniulotteisen mallin perusteella tehdyt ennusteet. Kuvio 28. Punaisilla paksuilla katkoviivoilla on yksiulotteinen BKT:n ennuste ja 95 % ennustevälit, sinisillä pisteviivoilla on moniulotteinen BKT:n ennuste ja 95 % ennustevälit ja mustalla on toteutuneet BKT:n arvot. Kiinan väkiluvun ennustetaan kasvavan vuoteen 2030 asti, jonka jälkeen väkiluku tasoittuu ja alkaa laskea viimeistään vuoden 2050 tienoilla. Vuoteen 2030 mennessä väkiluvun odotetaan olevan noin 1,45 miljardia (Chen & Liu 2009 s. 10). FAO:n ennuste vuodelle 2029 on noin 1,43 miljardia. Tässä tutkielmassa ennustettu väkiluku vuonna 2029 on noin 1,45 miljardia, joka on erittäin lähellä Chen ja Liun (2009) ja FAO:n ennusteita. 95 %:n ennustevälit ovat 1,06 1,83 miljardia. 50

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen

Lisätiedot

ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon

ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon TAMPEREEN YLIOPISTO Pro gradu -tutkielma Laura Lizana Bister ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon Informaatiotieteiden laitos Matematiikka Syyskuu 2011 Tampereen yliopisto Informaatiotieteiden

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH 8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH Osa aikasarjoista kehittyy hyvin erityyppisesti erilaisissa tilanteissa. Esimerkiksi pörssikurssien epävakaus keskittyy usein lyhyisiin

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) Tavoitteet (teoria): Hahmottaa aikasarjan klassiset komponentit ideaalisessa tilanteessa. Ymmärtää viivekuvauksen vaikutus trendiin. ARCH-prosessin

Lisätiedot

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Harjoitus 7 : Aikasarja-analyysi (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitus 7 : Aikasarja-analyysi (Palautus 28.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

STOKASTISET PROSESSIT

STOKASTISET PROSESSIT TEORIA STOKASTISET PROSESSIT Satunnaisuutta sisältävän tapahtumasarjan kulkua koskevaa havaintosarjaa sanotaan aikasarjaksi. Sana korostaa empiirisen, kokeellisesti havaitun tiedon luonnetta. Aikasarjan

Lisätiedot

Ilkka Mellin Aikasarja-analyysi ARMA-mallit

Ilkka Mellin Aikasarja-analyysi ARMA-mallit Ilkka Mellin Aikasarja-analyysi ARMA-mallit TKK (c) Ilkka Mellin (007) 1 ARMA-mallit >> ARMA-mallit ja niiden ominaisuudet ARMA-mallien auto- ja osittaisautokorrelaatiofunktiot ARMA-mallien spektri ARMA-mallien

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

4. Tietokoneharjoitukset

4. Tietokoneharjoitukset 4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume

Lisätiedot

Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus. Intelin osakekurssi. (Pörssi-) päivä n = 20 Intel_Volume. Auringonpilkkujen määrä

Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus. Intelin osakekurssi. (Pörssi-) päivä n = 20 Intel_Volume. Auringonpilkkujen määrä MS-C2128 Ennustaminen ja aikasarja-analyysi 4. harjoitukset / Tehtävät Kotitehtävät: 3, 5 Aihe: ARMA-mallit Tehtävä 4.1. Tutustu seuraaviin aikasarjoihin: Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan

Lisätiedot

3. Tietokoneharjoitukset

3. Tietokoneharjoitukset 3. Tietokoneharjoitukset Aikasarjan logaritmointi Aikasarjoja analysoidaan usein logaritmisessa muodossa. Asialooginen perustelu logaritmoinnille: Muuttujan arvojen suhteelliset muutokset ovat usein tärkeämpiä

Lisätiedot

Aikasarjamallit. Pekka Hjelt

Aikasarjamallit. Pekka Hjelt Pekka Hjelt Aikasarjamallit Aikasarja koostuu järjestyksessä olevista havainnoista, ja yleensä se on tasavälinen ja diskreetti eli havaintopisteet ovat erillisiä. Lisäksi aikasarjassa on yleensä autokorrelaatiota

Lisätiedot

4. Tietokoneharjoitukset

4. Tietokoneharjoitukset 4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus MS-C2128 Ennustaminen ja aikasarja-analyysi 5. harjoitukset / Tehtävät Kotitehtävät: 2 Aihe: ARMA-mallit Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tehtävä 5.1. Tarkastellaan

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet

Lisätiedot

Ennustaminen ARMA malleilla ja Kalmanin suodin

Ennustaminen ARMA malleilla ja Kalmanin suodin Ennustaminen ARMA malleilla ja Kalmanin suodin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

6.5.2 Tapering-menetelmä

6.5.2 Tapering-menetelmä 6.5.2 Tapering-menetelmä Määritelmä 6.7. Tapering on spektrin estimointimenetelmä, jossa estimaattori on muotoa f m (ω) = 1 m ( ) k w 2π m Γ(k)e ikω, k= m missä Γ on otosautokovarianssifunktio ja ikkunafunktio

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) Tavoitteet (teoria): Hallita multinormaalijakauman määritelmä. Ymmärtää likelihood-funktion ja todennäköisyystiheysfunktion ero. Oppia kirjoittamaan

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Valkoinen kohina ε t 2 1 0 1 2 Voimme tehdä saman laskun myös yleiselle välille [ a, a], missä 0 < a

Lisätiedot

Tilastotieteen aihehakemisto

Tilastotieteen aihehakemisto Tilastotieteen aihehakemisto hakusana ARIMA ARMA autokorrelaatio autokovarianssi autoregressiivinen malli Bayes-verkot, alkeet TILS350 Bayes-tilastotiede 2 Bayes-verkot, kausaalitulkinta bootstrap, alkeet

Lisätiedot

Auringonpilkkujen jaksollisuus

Auringonpilkkujen jaksollisuus Mat-2.108 Sovelletun matematiikan erikoistyöt 16.1.2004 Auringonpilkkujen jaksollisuus Teknillinen korkeakoulu Systeemianalyysin laboratorio Keijo Jaakola 51624B 1 1. Johdanto...3 2. Aikasarjamalleja...3

Lisätiedot

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto Kytkentäanalyysin teoriaa Pyritään selvittämään tiettyyn ominaisuuteen vaikuttavien eenien paikka enomissa Perustavoite: löytää markkerilokus jonka alleelit ja tutkittava ominaisuus (esim. sairaus) periytyvät

Lisätiedot

4.0.2 Kuinka hyvä ennuste on?

4.0.2 Kuinka hyvä ennuste on? Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki

Lisätiedot

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL Mallin arviointi ja valinta Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL Sisältö Otoksen ennustevirheen estimointi AIC - Akaiken informaatiokriteeri mallin valintaan Parametrimäärän

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: Yleinen lineaarinen malli 1 Määritelmä

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

ARMA mallien ominaisuudet ja rakentaminen

ARMA mallien ominaisuudet ja rakentaminen MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Viikko 4: 1 ARMA-mallien ominaisuudet 1 Stationaaristen

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Männyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto 9.6.2003

Männyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto 9.6.2003 Männyn laaturajojen integrointi runkokäyrän ennustamisessa Laura Koskela Tampereen yliopisto 9.6.2003 Johdantoa Pohjoismaisen käytännön mukaan rungot katkaistaan tukeiksi jo metsässä. Katkonnan ohjauksessa

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

9. Tila-avaruusmallit

9. Tila-avaruusmallit 9. Tila-avaruusmallit Aikasarjan stokastinen malli ja aikasarjasta tehdyt havainnot voidaan esittää joustavassa ja monipuolisessa muodossa ns. tila-avaruusmallina. Useat aikasarjat edustavat dynaamisia

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

S-114.3812 Laskennallinen Neurotiede

S-114.3812 Laskennallinen Neurotiede S-114.381 Laskennallinen Neurotiede Projektityö 30.1.007 Heikki Hyyti 60451P Tehtävä 1: Virityskäyrästön laskeminen Luokitellaan neuroni ensin sen mukaan, miten se vastaa sinimuotoisiin syötteisiin. Syöte

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Viikko 1: Yleinen lineaarinen malli 1 Määritelmä

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Vastaavasti voidaan määritellä korkeamman kertaluvun autoregressiiviset prosessit.

Vastaavasti voidaan määritellä korkeamman kertaluvun autoregressiiviset prosessit. Autokovarianssi: (kun τ 0) Γ t (τ) = E[(X t µ t )(X t τ µ t τ )] ( ) ( = E[ φ k ε t k φ j ε t τ j )] = = j=0 φ j+k E[ε t k ε t τ j ] k,j=0 φ j+k σ 2 δ k,τ+j k,j=0 = σ 2 φ j+k δ k,τ+j = = k,j=0 φ τ+2j I

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalle

ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalle ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalleihin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Identifiointiprosessi II

Identifiointiprosessi II Identifiointiprosessi II Kertaus: informaatiokriteerit ja selittäjien testaaminen Mallin validointi Filosofisia mallinnusnäkökulmia Informaatiokriteerit Hyvyyskriteerin optimiarvo vs. parametrien lukumäärä

Lisätiedot

Stationaariset stokastiset prosessit ja ARMA-mallit

Stationaariset stokastiset prosessit ja ARMA-mallit Stationaariset stokastiset prosessit ja ARMA-mallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Työvoiman tarpeen ennustaminen SARIMA-aikasarjamallilla

Työvoiman tarpeen ennustaminen SARIMA-aikasarjamallilla Aalto-yliopisto Perustieteiden korkeakoulu Teknillisen fysiikan ja matematiikan tutkinto-ohjelma Työvoiman tarpeen ennustaminen SARIMA-aikasarjamallilla Kandidaatintyö 27.5.2015 Touko Väänänen Työn saa

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 6: 1 Kalmanin suodatin Aiemmin käsitellyt

Lisätiedot

Moniulotteiset aikasarjat

Moniulotteiset aikasarjat Moniulotteiset aikasarjat Pentti Saikkonen Syksy 2011 Päivitetty versio 17.1.2016 Sisältö 1. Johdanto 1 1.1. Taustaa 1 1.2. Stokastinen prosessi 2 2. Stationaariset prosessit 4 2.1. Määritelmiä 4 2.2.

Lisätiedot

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme? TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä

Lisätiedot

Aki Taanila AIKASARJAENNUSTAMINEN

Aki Taanila AIKASARJAENNUSTAMINEN Aki Taanila AIKASARJAENNUSTAMINEN 26.4.2011 SISÄLLYS JOHDANTO... 1 1 AIKASARJA ILMAN SYSTEMAATTISTA VAIHTELUA... 2 1.1 Liukuvan keskiarvon menetelmä... 2 1.2 Eksponentiaalinen tasoitus... 3 2 AIKASARJASSA

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä

MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä Tehtävä 4.1. Ncss-ohjelmiston avulla on generoitu AR(1)-, AR(2)-, MA(1)- ja MA(2)-malleja vastaavia aikasarjoja erilaisilla parametrien arvoilla.

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Korrelaatiokertoinen määrittely 165

Korrelaatiokertoinen määrittely 165 kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. 9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2

Lisätiedot

6.2.3 Spektrikertymäfunktio

6.2.3 Spektrikertymäfunktio ja prosessin (I + θl + + θl q )ε t spektritiheysfunktio on Lemman 6. ja Esimerkin 6.4 nojalla σ π 1 + θ 1e iω + + θ q e iqω. Koska viivepolynomien avulla määritellyt prosessit yhtyvät, niin myös niiden

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto...2. 2 Aineiston kuvaus...3. 3 Riippuvuustarkastelut...4

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto...2. 2 Aineiston kuvaus...3. 3 Riippuvuustarkastelut...4 TILTP1 Tilastotieteen johdantokurssin harjoitustyö Tampereen yliopisto 5.11.2007 Perttu Kaijansinkko (84813) perttu.kaijansinkko@uta.fi Pääaine matematiikka/tilastotiede Tarkastaja Tarja Siren 1 Johdanto...2

Lisätiedot

Dynaamisten systeemien identifiointi 1/2

Dynaamisten systeemien identifiointi 1/2 Dynaamisten systeemien identifiointi 1/2 Mallin rakentaminen mittausten avulla Epäparametriset menetelmät: tuloksena malli, joka ei perustu parametreille impulssi-, askel- tai taajusvaste siirtofunktion

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Ilkka Mellin Aikasarja-analyysi Aikasarjat

Ilkka Mellin Aikasarja-analyysi Aikasarjat Ilkka Mellin Aikasarja-analyysi Aikasarjat TKK (c) Ilkka Mellin (2007) 1 Aikasarjat >> Aikasarjat: Johdanto Aikasarjojen esikäsittely Aikasarjojen dekomponointi TKK (c) Ilkka Mellin (2007) 2 Aikasarjat:

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Tilastotieteessä aikasarja tarkoittaa yleensä sarjaa, jossa peräkkäisten havaintojen aikaväli on aina sama.

Tilastotieteessä aikasarja tarkoittaa yleensä sarjaa, jossa peräkkäisten havaintojen aikaväli on aina sama. Aikasarjat Tilastotieteessä aikasarja tarkoittaa yleensä sarjaa, jossa peräkkäisten havaintojen aikaväli on aina sama. Aikasarja on laajassa mielessä stationäärinen (wide sense stationary, WSS), jos odotusarvo

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

ARMA mallien ominaisuudet ja rakentaminen

ARMA mallien ominaisuudet ja rakentaminen MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Viikko 4: 1 ARMA-mallien ominaisuudet 1 Stationaaristen

Lisätiedot