Ilkka Keskiväli Kiinan energiankäytön aikasarja-analysointi



Samankaltaiset tiedostot
Dynaamiset regressiomallit

ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Testejä suhdeasteikollisille muuttujille

STOKASTISET PROSESSIT

Ilkka Mellin Aikasarja-analyysi ARMA-mallit

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

4. Tietokoneharjoitukset

Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus. Intelin osakekurssi. (Pörssi-) päivä n = 20 Intel_Volume. Auringonpilkkujen määrä

3. Tietokoneharjoitukset

Aikasarjamallit. Pekka Hjelt

4. Tietokoneharjoitukset

Regressioanalyysi. Vilkkumaa / Kuusinen 1

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

Ennustaminen ARMA malleilla ja Kalmanin suodin

Mat Tilastollisen analyysin perusteet, kevät 2007

6.5.2 Tapering-menetelmä

Sovellettu todennäköisyyslaskenta B

Yleistetyistä lineaarisista malleista

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

Identifiointiprosessi

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

Tilastotieteen aihehakemisto

Auringonpilkkujen jaksollisuus

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

4.0.2 Kuinka hyvä ennuste on?

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL

Identifiointiprosessi

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Testit järjestysasteikollisille muuttujille

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä

Väliestimointi (jatkoa) Heliövaara 1

ARMA mallien ominaisuudet ja rakentaminen

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Männyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto

Regressioanalyysi. Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

9. Tila-avaruusmallit

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Otoskoko 107 kpl. a) 27 b) 2654

S Laskennallinen Neurotiede

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Vastaavasti voidaan määritellä korkeamman kertaluvun autoregressiiviset prosessit.

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalle

Sovellettu todennäköisyyslaskenta B

Identifiointiprosessi II

Stationaariset stokastiset prosessit ja ARMA-mallit

Työvoiman tarpeen ennustaminen SARIMA-aikasarjamallilla

Sovellettu todennäköisyyslaskenta B

Dynaamiset regressiomallit

Moniulotteiset aikasarjat

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Aki Taanila AIKASARJAENNUSTAMINEN

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Moniulotteisia todennäköisyysjakaumia

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Korrelaatiokertoinen määrittely 165

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

6.2.3 Spektrikertymäfunktio

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

Dynaamisten systeemien identifiointi 1/2

Testit laatueroasteikollisille muuttujille

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Aikasarja-analyysi Aikasarjat

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Tilastotieteessä aikasarja tarkoittaa yleensä sarjaa, jossa peräkkäisten havaintojen aikaväli on aina sama.

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

ARMA mallien ominaisuudet ja rakentaminen

Transkriptio:

PRO GRADU -TUTKIELMA Ilkka Keskiväli Kiinan energiankäytön aikasarja-analysointi TAMPEREEN YLIOPISTO Informaatiotieteiden yksikkö Tilastotiede Joulukuu 2012

2

Tampereen yliopisto Informaatiotieteiden yksikkö KESKIVÄLI, ILKKA: Kiinan energiankäytön aikasarja-analysointi Pro gradu -tutkielma, 55 s. Tilastotiede Joulukuu 2012 Tiivistelmä Kiinan energiankäyttö on suurena tekijänä maailmanlaajuisessa ilmastonmuutoksessa. Kiina on ollut pitkään noin 10 %:n talouskasvussa, joka on samalla tarkoittanut myös energiankäytön huomattavaa kasvua. Tässä tutkielmassa ennustetaan aikasarja-analysointia käyttäen Kiinan energiankäyttöä, bruttokansantuotetta ja väkilukua. Aikasarja-analyysin malleista käytössä on ARIMA- ja VARmalli. Tutkielmassa testataan myös, onko kokonaisenergiankäyttö yhteisintegroitunut teollisuuden energiankäytön tai bruttokansantuotteen kanssa. Ennusteet tehdään 20 vuodeksi eteenpäin ja niitä verrataan muista lähteistä löytyneisiin ennustuksiin. Väkiluvun ennuste on jotakuinkin yhtä suuri kuin vertailussa käytetyt, mutta energiankäytön ja bruttokansantuotteen ennusteet eroavat merkittävästi International Energy Agencyn ja United States Department of Agriculturen ennusteista. Aikasarja-analyysin mallinnuksessa ja ennustuksessa käytetään ainoastaan historiatietoja, joten prosessi sarjan taustalla jää käsittelemättä ja näin ollen ennustukset eivät välttämättä ole luotettavia. Väkiluvun tapauksessa ennustaminen toimii menneiden arvojen perusteella, mutta energiankäyttöön ja bruttokansantuotteeseen vaikuttaa moni muukin asia, kuten uusiutumattomien energianlähteiden rajallisuus. Yhteisintegroituvuutta ei ole tutkittujen sarjojen välillä. Asiasanat yhteisintegroituvuus, energiankäyttö, ARIMA, VAR 3

Esipuhe Kiitokset Arto Luomalle tutkielmani ohjauksesta ja koko informaatiotieteen yksikön väelle, jotka ovat mahdollistaneet opintojeni ripeän edistymisen. Kiitokset myös työpaikalleni Tulevaisuuden tutkimuskeskukselle ja eritoten professori Jyrki Luukkaselle, joka mahdollisti tutkielman tekemisen harjoitteluni ohessa. Erityiskiitokset kuuluvat avovaimolleni, joka on jaksanut pyörittää talouttamme, kun olen ollut viikoittain opiskelupaikkakunnalla. Tampereella 12.12.2012 Ilkka Keskiväli 4

Sisältö 1 Johdanto... 7 2 Aineisto... 8 2.1 Kiinan energiankäyttö... 8 2.2 Kiinan bruttokansantuote... 10 2.3 Kiinan väkiluku... 11 3 Aikasarja-analyysin käsitteitä... 13 3.1 Aikasarja... 13 3.2 Stationaarisuus... 13 3.3 Auto- ja osittaisautokorrelaatio... 13 3.4 Valkoinen kohina... 14 3.5 ARIMA-malli... 14 3.6 Testisuureet... 15 3.6.1 Laajennettu Dickey-Fuller-testi... 15 3.6.2 Phillips-Perron-testi... 16 3.6.3 KPSS-testi... 16 3.6.4 Box-Cox-muunnoksen parametrin testaus... 16 3.6.5 Box-Ljung-testi... 17 3.6.6 Käännepistetesti... 17 3.6.7 Järjestystesti... 17 3.7 VAR-malli... 18 3.8 Yhteisintegroitunut VAR-malli... 18 3.9 Yhteisintegroituvuus... 19 3.10 Johansenin testi... 20 4 Mallintaminen... 21 4.1 Mallin identifiointi... 22 4.1.1 Stationaarisuus... 22 4.1.2 Valkoinen kohina... 25 5

4.2 ARIMA-mallin estimointi... 26 4.2.1 ACF ja PACF... 26 4.2.2 Muita parametrien määritystapoja... 28 4.3 Mallin diagnostinen tarkastelu... 29 4.4 Mallin testaaminen... 33 4.5 Moniulotteinen mallintaminen... 35 5 Yhteisintegroituvuuden testaaminen... 36 5.1 Teollisuuden ja kokonaisenergiankäytön yhteisintegroituvuus... 36 5.2 Kokonaisenergiankäytön ja BKT:n yhteisintegroituvuus... 37 6 Ennustaminen... 39 6.1 Yksiulotteinen ennustaminen... 39 6.2 Moniulotteinen ennustaminen... 47 6.3 Ennusteiden vertailua... 49 6.3.1 BKT ja väkiluku... 49 6.3.2 Kokonaisenergiankäyttö... 51 7 Yhteenveto... 53 Lähteet... 54 6

1 Johdanto Kiinan energiankäyttö on suuri haaste niin Kiinalle itselleen kuin koko maapallolle. Energiaa kuluu yhä enenevässä määrin eri tarpeisiin, kuten teollisuuteen, asumiseen ja liikenteeseen. Tässä tutkielmassa tutustutaan Kiinan energiankäyttöön aikasarja-analysoinnin avulla. Tutkielma tehdään osana Turun yliopiston erillislaitoksen, Tulevaisuuden tutkimuskeskuksen, CHEC-projektia (China and European Union in the context of global climate change: Analysis of changing economic structures and related policies). Projektissa perehdytään maailmanlaajuiseen ilmastonmuutokseen ja siihen, miten tähän vaikuttavat Kiinan ja EU:n muuttuva taloustilanne sekä politiikka. Energiankäytöllä ja sen ennustamisella on tässä suuri merkitys, koska etenkin Kiinassa suuri osa energiasta tuotetaan uusiutumattomilla ja saastuttavilla tavoilla. CHEC-projektin yhteistyökumppanimme Kiinasta, Chinese Academy of Social Sciences (CASS), pyrkii rakentamaan malleja ja ennustamaan tulevaa energiankäyttöä, ilmastonmuutosta ja niihin liittyviä asioita. Kumppanimme toimivat läheisessä yhteistyössä Kiinan hallituksen kanssa, jolle he raportoivat tuloksista, ja näiden perusteella hallitus tekee tulevaisuutta koskevia päätöksiä. Yhteisessä projektissamme pyrin mallintamaan aikasarjojen avulla Kiinan energiankäyttöä ja ennustamaan, miten se tulevina vuosina mahdollisesti muuttuu. Luvussa 1 johdatellaan lukija aihealueeseen. Luku 2 sisältää aineiston esittelyn ja luvussa 3 esitellään käytettyjä tutkimusmenetelmiä. Mallintamiseen keskitytään luvussa 4 ja luvussa 5 testataan, ovatko tietyt aikasarjat yhteisintegroituneita. Luvussa 6 ennustetaan Kiinan energiankäyttöä usein eri tavoin. Luku 7 sisältää yhteenvedon. 7

2 Aineisto Tutkielman aineistona käytetään Kiinan energiankäyttöä eri talousaloilla, Kiinan bruttokansantuotetta ja Kiinan väkilukua vuosina 1971-2009. Kiinan energiankäytön aikasarjat on saatu järjestön International Energy Agency (IEA 2011) tietokannasta. Kiinan bruttokansantuote on peräisin ministeriön United States Department of Agriculture (USDA 2012) tietokannasta. Kiinan väkiluku on saatu järjestön Food and Agriculture Organization of the United Nations (FAO 2012) tietokannasta. Aikasarjoja on yhteensä yhdeksän ja niiden arvot ovat vuosittaisia. Aikasarjoista seitsemän liittyy energiankäyttöön: kokonaisenergiankäyttö, teollisuuden energiankäyttö, liikenteen energiankäyttö, asumisen energiankäyttö, palveluiden energiankäyttö, maa- ja metsätalouden energiankäyttö ja muu energiankäyttö. Kaksi muuta aikasarjaa ovat BKT ja väkiluku. Seuraavissa kappaleissa esittelen näitä aikasarjoja. 2.1 Kiinan energiankäyttö Kuviossa 1 on aikasarja Kiinan energiankäytöstä vuosina 1971-2009. Kuviossa on eritelty suurimmat kohteet, joihin energiaa käytetään. Teollisuus on Kiinan suurin energiankäyttökohde ja etenkin viime vuosien aikana teollisuuden energiankäyttö on kasvanut voimakkaasti. Toiseksi eniten energiaa menee asumiseen, jonka kulutus ei ole paljon muuttunut noin 40 viime vuoden aikana. Kolmanneksi eniten energiaa Kiinassa kuluu liikenteeseen, joka on etenkin viime vuosien autoistumisen takia kasvanut huomattavasti. Loput energiasta kuluu palveluihin, maa- ja metsätalouteen sekä muuhun määrittelemättömään käyttöön. Vuonna 2009 Kiinan energiankulutus oli yli 1400000 ekvivalenttia öljykilotonnia (ktoe). 8

1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Kilotonnia öljyä 1600000 1400000 1200000 1000000 800000 600000 Muut Palvelut Maa- ja metsätalous Liikenne Asuminen Teollisuus 400000 200000 0 Aika Kuvio 1. Kiinan energiankäytön aikasarjakuvaaja, jossa on eritelty suurimmat energiankäytön kohteet. Kuviossa 2 on esitetty Kiinan energiankäyttöä suhteessa vuoden 1971 tilanteeseen. Kuvaajista nähdään, kuinka etenkin palveluiden ja liikenteen energiankäyttö on kasvanut huomattavasti, jopa yli 10-kertaiseksi. Toisaalta asumisen energiankäyttö ei ole kaksinkertaistunut vuodesta 1971 vuoteen 2009 mennessä. Tästä syystä kokonaisenergiankäyttö on jotakuinkin nelinkertaistunut vuosien 1971-2009 aikana. 9

1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Prosenttia vuoden 1971 arvosta 2500 % 2000 % 1500 % 1000 % Muut Palvelut Liikenne Teollisuus Yhteensä Maa- ja metsätalous Asuminen 500 % 0 % Aika Kuvio 2. Kiinan energiankäyttö prosentteina suhteessa vuoteen 1971. 2.2 Kiinan bruttokansantuote Kuviossa 3 on Kiinan todellinen (reaalinen) bruttokansantuote, BKT, vuosina 1971-2009. Todellisessa bruttokansantuotteessa inflaation vaikutus on otettu huomioon ja se sopii näin ollen hyvin aikasarja-analysointiin. Kiinassa bruttokansantuote on ollut tasaisesti vuosittaisessa noin 10 %:n nousussa jo pitkään. Bruttokansantuote on laskenut vain kerran vuosien 1971-2009 aikana. Tämä tapahtui vuonna 1976, jolloin laskua tuli 1,6 %. 10

1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Miljardia dollaria 4000 3500 3000 2500 2000 1500 1000 500 0 Aika Kuvio 3. Kiinan todellinen bruttokansantuote vuosina 1971-2009. 2.3 Kiinan väkiluku Kiinan väkiluvun aikasarjakuvaaja vuosilta 1971-2009 on kuviossa 4. Kiinassa on tällä hetkellä eniten asukkaita kaikista maailman valtioista, yli 1,3 miljardia. Kiinan vuonna 1979 käyttöön ottaman yhden lapsen politiikan aikaansaama syntyvyyden lasku on kuitenkin nähtävissä kuvaajasta: väkiluvun kasvu hidastuu kaiken aikaa. Tämä aiheuttaa sen, että väkiluvussa mitattuna Intia nousee Kiinan ohi muutaman kymmenen vuoden aikana. On arvioitu, että vuoden 2030 tienoilla Kiinan väkiluku alkaa tasoittua ja tämän jälkeen mahdollisesti jopa hieman laskea (Chen & Liu 2009 s. 10). 11

1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Tuhatta ihmistä 1 600 000 1 400 000 1 200 000 1 000 000 800 000 600 000 400 000 200 000 0 Aika Kuvio 4. Kiinan väkiluku vuosina 1971-2009. 12

3 Aikasarja-analyysin käsitteitä Tässä kappaleessa käsitellään muutamia aikasarja-analyysin peruskäsitteitä. Seuraavissa alaluvuissa selviää, mitä aikasarjat ovat ja minkälaisia ominaisuuksia aikasarjalla on oltava, jotta sitä voidaan analysoida. Lisäksi esitellään muutamia määritteitä ja malleja, joita käytetään analysoinnissa. 3.1 Aikasarja Aikasarjaksi kutsutaan havaintojonoa y t, jossa muuttujan y arvoja kirjataan peräkkäin ajanhetkinä t. Aikasarjoja voi olla jatkuvia tai diskreettejä. Diskreetissä tapauksessa peräkkäisten havaintojen väli on useimmiten yhtä pitkä koko aikasarjan osalta. Se voi olla muun muassa tunnin, päivän tai vuoden pituinen. Tässä tutkielmassa havaintojen väli on vuosi, eli joka vuosi on otettu yksi havainto. Aikasarjasta voidaan erottaa erilaisia komponentteja, joita ovat trendi, kausivaihtelu, syklinen vaihtelu ja satunnainen vaihtelu. (Brockwell & Davis 2002) 3.2 Stationaarisuus Jotta aikasarjaa voidaan mallintaa autoregressiivisen liukuvan keskiarvon prosessin avulla, pitää aikasarjan olla vähintään heikosti stationaarinen. Stationaarisella sarjalla tarkoitetaan sarjaa, jolla ei ole trendiä, kausivaihtelua tai varianssin muutosta ajan suhteen ja sen autokorrelaatiorakenne pysyy samanlaisena ajan kuluessa. Jos aikasarja on epästationaarinen, kuten kaikki aikasarjat, joita tässä tutkielmassa analysoidaan, pitää sitä käsitellä ennen varsinaista mallinnusta. Differoimalla saadaan poistettua aikasarjasta trendiä ja kausivaihtelua, kun taas logaritmoimalla saadaan poistettua eksponentiaalista trendiä ja varianssin kasvua. Differoimalla voidaan kuvata aikasarjan muutosta ajanhetkestä toiseen; tässä tutkielmassa differenssi kuvaa vuosimuutosta. (Cryer & Chan 2008) 3.3 Auto- ja osittaisautokorrelaatio Määritellään prosessin k. autokorrelaatiokerroin (1), jossa osoittaja on prosessin k. autokovarianssi ja nimittäjä on prosessin varianssi. Autokorrelaatiokerroin mittaa k aikavälin etäisyydellä olevien havaintojen välistä lineaarista riippuvuutta. 13

Määritellään prosessin k. osittaisautokorrelaatiokerroin (2), joka on satunnaismuuttujien ehdollinen korrelaatio, ehtomuuttujien ollessa. Osittaisautokorrelaatiokerroin mittaa k aikavälin etäisyydellä olevien havaintojen korrelaatiota, kun näiden väliin jäävien havaintojen vaikutus on eliminoitu. Autokorrelaatiofunktiosta käytetään jatkossa lyhennettä ACF (autocorrelation function) ja osittaisautokorrelaatiofunktiosta käytetään lyhennettä PACF (partial autocorrelation function). 3.4 Valkoinen kohina Jotta aikasarjaa voidaan kutsua valkoiseksi kohinaksi, täytyy havaintojen odotusarvon olla nolla ja varianssin, ja havaintojen täytyy olla riippumattomia toisistaan. Valkoinen kohina on tunnetuin stationaarinen prosessi. Valkoisen kohinan esiintymistä testataan useamman kerran aikasarja-analysoinnin edetessä. Jotta analysointi kannattaa aloittaa, analysoitava sarja ei saa olla valkoista kohinaa. Toisaalta taas aikasarjan mallin residuaalien täytyy muistuttaa valkoista kohinaa, jotta mallia voidaan pitää riittävänä. 3.5 ARIMA-malli Useimmiten aikasarjoissa on jonkinlainen trendi tai kausikomponentti, jolloin ne ovat epästationaarisia. Trendi ja kausikomponentti voidaan useimmiten poistaa differoimalla. Epästationaarista aikasarjaa voidaan kuvailla ARIMA(p,d,q)-mallilla, missä parametri d tarkoittaa differointien määrää. ARIMA(p,d,q)-malli rakentuu kolmesta osasta: AR(p)-, I(d)- ja MA(q)-prosessista. Stokastinen prosessi (3), missä on valkoista kohinaa, on autoregressiivinen (AR) prosessi. Tämä on lineaarinen regressiomalli, jossa x t on mallin selitettävä muuttuja, x t-1, x t-2,, x t-p ovat mallin selittävät muuttujat, ovat mallin regressiokertoimet ja on virhetermi. Stokastista prosessia 14

(4) kutsutaan liukuvan keskiarvon prosessiksi (MA). Nimitys tulee siitä, kun ajanhetkellä t prosessin arvo on painotettu summa satunnaismuuttujan arvoista viiveillä t-1, t-2,, t-q, missä kertoimet muodostavat summan painorakenteen. Edellä mainitut prosessit yhdistämällä saadaan (5), mitä kutsutaan autoregressiiviseksi liukuvan keskiarvon prosessiksi eli ARMA(p,q)-prosessiksi. 3.6 Testisuureet Tässä kappaleessa esitellään muutamia testisuureita, joita käytetään myöhemmin tutkielmassa. Testeillä selvitetään muun muassa aikasarjojen ja niiden residuaalien stationaarisuutta ja sitä, ovatko ne valkoista kohinaa. 3.6.1 Laajennettu Dickey-Fuller-testi Tarkastellaan ensimmäisen asteen autoregressiivistä mallia eli AR(1)-mallia (6), jossa virhetermin oletetaan olevan valkoista kohinaa. Jos, prosessilla sanotaan olevan yksikköjuuri. Laajennetussa Dickey-Fuller-testissä nollahypoteesi (H 0 ) on, että prosessilla on yksikköjuuri. Jos on ainakin yksi yksikköjuuri, aikasarja on epästationaarinen. Vaihtoehtoinen hypoteesi (H 1 ) tarkoittaa stationaarisuutta. Astetta p olevan autoregressiivisen prosessin yhtälö on (7), joka voidaan kirjoittaa myös muotoon (8), 15

missä. Hypoteesi H 0 on ja. Hypoteesi H 1 on, joten testi on yksisuuntainen. Estimaatti :lle saadaan pienimmän neliösumman menetelmällä ja se noudattaa likimain Dickey-Fuller-jakaumaa, kun H 0 on tosi ja havaintojen lukumäärä riittävän suuri. (Tsay 2005) 3.6.2 Phillips-Perron-testi Phillips-Perron-testissä H 0 on, että yksikköjuuri on olemassa. Testistä käytetään versiota, jossa vaihtoehtoinen hypoteesi tarkoittaa stationaarisuutta. Phillips-Perron-testi on yleistys Dickey-Fullertestistä. Phillips-Perron-testi eroaa laajennetusta Dickey-Fuller-testistä pääosin niin, miten ne käsittelevät autokorrelaatiota ja heteroskedastisuutta. Phillips-Perron-testi on luonteeltaan epäparametrinen ja sallii yleisemmän riippuvuusrakenteen kuin laajennettu Dickey-Fuller-testi. (Phillips & Perron 1988) 3.6.3 KPSS-testi KPSS-testin nimi tulee testin kehittäjien nimien mukaan: Kwiatkowski, Phillips, Scmidt ja Shin. Aikasarja ilmaistaan testissä deterministisen trendin, satunnaiskävelyn ja satunnaisvirheen summana (9), missä on satunnaiskävely, on IID(0, )-prosessi (jono riippumattomia ja samanlailla jakautuneita satunnaismuuttujia, joiden odotusarvo on nolla ja varianssi ), on deterministinen trendi ja on stationaarinen virheprosessi. KPSS-testi on tyypiltään pistemäärätesti (Lagrangen kerrointesti) ja siitä on kaksi versiota, trendija tasostationaarinen. Hypoteesin H 0 vallitessa trendistationaarinen sarja on stationaarinen deterministisen trendin ympärillä, kun taas tasostationaarinen sarja on stationaarinen kiinteän tason ympärillä. Testeissä H 0 tarkoittaa, että. Vaihtoehtoinen hypoteesi on. Tasostationaarisessa KPSS-testissä oletetaan lisäksi, että. (Kwiatkowski et al. 1992) 3.6.4 Box-Cox-muunnoksen parametrin testaus Box-Cox-muunn ksen p met i λ id n test t, j tt s d n sel itettyä, t itseek ik s j logaritmoida. Mikäli parametrin arvon luottamusvälille osuu yksi, muunnosta ei välttämättä tarvitse 16

tehdä. Jos luottamusvälille osuu nolla, aikasarja kannattaa logaritmoida, jotta siitä tulee stationaarinen (Oksanen 2003 s. 66). 3.6.5 Box-Ljung-testi Otosautokorrelaation tutkimiseen voidaan käyttää yhtä testisuuretta (10), missä on j. otosautokorrelaatio. Testisuure noudattaa likimain -jakaumaa h vapausasteella, kun aikasarja on valkoista kohinaa. Testisuureen avulla tehtävää testiä kutsutaan Box-Ljung-testiksi. Testissä H 0 on, että tarkasteltava sarja on valkoista kohinaa. (Brockwell & Davis 2002) 3.6.6 Käännepistetesti Käännepistetesti testaa kuinka paljon käännekohtia (huippuja ja aallonpohjia) sarja sisältää. Testillä testataan siis, onko peräkkäisillä havainnoilla autokorrelaatiota. Jos saatavilla on havainnot y 1,,y n, niin käännepistetesti määritellään seuraavasti: ajanhetkellä i on käännepiste, jos y i-1 <y i ja y i >y i+1 tai y i-1 >y i ja y i <y i+1. IID-sarjassa pisteessä i käännepisteen todennäköisyys on 2/3. Kun käännepisteiden määrä n-mittaisessa sarjassa on T, saadaan T:n odotusarvoksi (11). Voidaan myös osoittaa, että (12). Kun n on suuri, T noudattaa likimain jakaumaa kohinaa. (Brockwell & Davis 2002), kun tarkasteltava sarja on valkoista 3.6.7 Järjestystesti Järjestystestissä H 0 on, että tarkasteltava sarja on valkoista kohinaa. Testissä nimen mukaisesti testataan, minkälaisessa järjestyksessä aikasarjan arvot ovat. Sen avulla voidaan tutkia, onko sarjassa trendiä. Merkitään P:llä sellaisten parien (y i, y j ) määrää, että y j > y i ja j > i. Parien suurin lukumäärä 17

on n(n-1)/2. Jos sarja on valkoista kohinaa, todennäköisyys, että y j > y i on ½, joten P:n odotusarvo on (13). Voidaan myös osoittaa, että P:n varianssi on (14). Suurilla n arvoilla P noudattaa likimain jakaumaa. (Brockwell & Davis 2002) 3.7 VAR-malli Vektoriautoregressiivinen prosessi on yleistys yksiulotteisesta autoregressiivisestä prosessista. Moniulotteisessa tapauksessa otetaan lähtökohdaksi malli (15), jossa ovat -matriiseja ja on n-virhevektori. VAR(p)-mallin voidaan ajatella olevan siis usean lineaarisen regressiomallin systeemi, jossa selittävät muuttujat ovat selitettävien viivästettyjä arvoja. 3.8 Yhteisintegroitunut VAR-malli Kirjoitetaan. Jos kaikki determinantin nollakohdat ovat yksikköympyrän ulkopuolella, niin x t on stationaarinen. Stationaarisen sarjan sanotaan olevan I(0)- prosessi, eli se ei ole integroitu. Virhekorjattu malli (ECM) VAR(p)-prosessille x t on (16), missä, ja. Lauseke on virheenkorjaustermi, jolla on suuri merkitys yhteisintegroituvuuden tutkimisessa. Matriisit ECM-esityksestä seuraavasti: voidaan palauttaa 18

missä. (17), (18),, Jos x t sisältää yksikköjuuren, niin, joten. Seuraavat kolme tapausta ovat tutkimisen arvoisia: 1. R nk(π) = 0. Tämä me kitsee, että ja x t ei ole yhteisintegroitunut. ECM supistuu muotoon (19), joten seuraa VAR(p-1)-mallia deterministisellä trendillä. 2. Rank(Π) = k. Tämä merkitsee, että ja x t ei sisällä yksikköjuurta. ECM malli ei ole informatiivinen. 3. 0 < R nk(π) = m < k. Tässä tapauksessa (20), missä α j β t sellaisia k x m matriiseja, että Rank(α) = R nk(β) = m. ECM kirjoitetaan tällöin muodossa (21). Tämä tarkoittaa, että x t on yhteisintegroitunut lineaarisesti riippumattomien yhteisintegroituvuusvektoreiden lukumäärän ollessa m, ja x t :llä on yksikköjuurta, jotka antavat yhteistä stokastista x t :n trendiä. (Tsay 2005) 3.9 Yhteisintegroituvuus Jotta kaksi tai useampia aikasarjoja olisivat yhteisintegroituneita, täytyy niiden olla epästationaarisia ja niiden lineaarikombinaation olla stationaarinen. Sanotaan x t :n ja y t :n olevan yhteisintegroituneit, j s n lem ss sell inen ki α ( 0), että (22) 19

on stationaarinen prosessi (Sørensen 1997). Yhteisintegroituvuutta voidaan kuvata dynaamisena tasapainona, eli kun aika t kasvaa, niin sarjat eivät voi etääntyä mielivaltaisen kauas toisistaan. 3.10 Johansenin testi J h nsenin testi pe ustuu m t iisin Π tutkimiseen. Voidaan sanoa, että R nk(π) E M:ssä n yhtä suuri kuin yhteisintegroituvuusvektoreiden lukumäärä. Johansenin testi sisältää kaksi testisuuretta, trace-testisuu een (λ trace ) ja maksimiominaisarvo-testisuu een (λ max ) ja sillä voidaan testata kahden tai useamman aikasarjan välistä yhteisintegroituvuutta. Määritellään kaksi monimuuttujaista lineaarista regressioyhtälöä (23) (24), missä ja ovat residuaalit. Määritellään otoskovarianssimatriisit: (25) (26) (27) Määritellään trace-testisuure (28), missä ovat yhtälön (29) n r pienimmät ominaisarvot. Testissä H 0 on, että Rank(Π) = r ja vaihtoehtoinen hypoteesi on, että Rank(Π) >. Mää itellään λ max -testisuure (30), missä T on havaintojen lukumäärä. Testissä H 0 on, että Rank(Π) = r ja vaihtoehtoinen hypoteesi on, että Rank(Π) = r + 1. (Johansen 1991) 20

4 Mallintaminen Aikasarjojen mallintamisessa käytetään yleisesti Boxin ja Jenkinsin menetelmää (Box & Jenkins 1976). Menetelmä sisältää kolme vaihetta: 1. mallin identifiointi, 2. mallin estimointi, 3. diagnostiset tarkastelut. Mallin identifiointiin sisältyy aikasarjan stationaarisuuden toteaminen ja tarvittaessa logaritmointi ja differointi, jotta aikasarja saadaan muutettua stationaariseksi. Stationaariseksi saatettu aikasarja ei myöskään saa olla valkoista kohinaa, mikä täytyy testata ennen mallin estimoinnin suorittamista. Mallin identifiointiin liittyy myös mallin valinta, eli onko malli muotoa AR, MA vai mahdollisesti ARIMA. Työkaluina toimivat muun muassa ACF:n ja PACF:n kuvaajat. Mallin valinta voidaan suorittaa myös informaatiokriteerin perusteella. Tässä työssä käytetään Akaiken informaatiokriteeriä, AIC:ia. Välttämättä paras malli ei ole se, jolla on pienin informaatiokriteerin arvo, mutta malli voidaan valita joukosta malleja, joilla on pienimmät AIC:n arvot. Mallin estimoinnissa selvitetään parhaat parametrit mallille, tässä tapauksessa ARIMA-mallille. Tilasto-ohjelmistot sisältävät eri estimointimenetelmiä. Mallin diagnostiset tarkastelut perustuvat mallin residuaalien tutkimiseen. Mallin residuaalien täytyy muistuttaa valkoista kohinaa, jotta voidaan olettaa mallin olevan riittävä. Jäännössarjan testaamiseen voidaan käyttää monia samoja tapoja kuin itse aikasarjan testaamiseen, muun muassa Box- Ljung-testiä. Valkoisuuden testaamiseksi voidaan myös tarkastella residuaaleja erilaisten kuvaajien avulla. Residuaalien normaalisuutta testataan Shapiro-Wilk-testillä. Mikäli valittu malli ei läpäise testejä ja tarkasteluja, jatketaan jälleen alusta mallin identifioinnista. Diagnostisten tarkastelujen jälkeen voidaan vielä testata mallin toimivuutta ennustamalla aikasarjan alkuosan avulla loppuosaa ja vertaamalla ennustetta ja jo toteutuneita arvoja keskenään. Moniulotteisessa mallinnuksessa käytetään vektoriautoregressiivistä prosessia, VAR. Pyritään siis rakentamaan malli useammalle kuin yhdelle aikasarjalle samanaikaisesti. Tässä tutkielmassa malli tehdään kahdelle aikasarjalle, kokonaisenergiankäytölle ja BKT:lle. Muuten mallinnuksessa toimitaan samaan tapaan kuin yksiulotteisessa mallinnuksessa. Työkalut näihin toimiin ovat kuitenkin erilaiset, koska useimmat yksiulotteisen mallinnuksen työkalut eivät toimi moniulotteisen mallinnuksen tapauksessa. 21

4.1 Mallin identifiointi 4.1.1 Stationaarisuus Jotta aikasarjaa voisi mallintaa, pitää sen olla stationaarinen. Kuviosta 5 voidaan nähdä, että mikään yhdeksästä aikasarjasta ei ole stationaarinen. Jotta asialle saadaan lisävarmistusta, stationaarisuutta voidaan myös testata. Tällaisia testejä ovat muun muassa laajennettu Dickey-Fuller-yksikköjuuritesti, Phillips-Perron-testi ja KPSS-testi eli Kwiatkowski Phillips Schmidt Shin-testi, josta käytetään versiota, jossa testataan tasostationaarisuutta. Taulukossa 1 on kaikkien näiden testien p-arvot, joista nähdään, että aikasarjat eivät tosiaan ole stationaarisia. Dickey-Fuller-testin perusteella voisi sanoa, että maa- ja metsätalouden aikasarja olisi stationaarinen, mutta kaksi muuta testiä antavat eri tuloksen. Taulukko 1. Stationaarisuutta testaavien Dickey-Fuller, Phillips-Perron ja KPSS-testien p-arvot. Dickey-Fuller-testi Phillips-Perron-testi KPSS-testi Kokonaisenergiankäyttö 0,88 >0,99 <0,01 Teollisuus 0,68 >0,99 <0,01 Liikenne >0,99 >0,99 <0,01 Asuminen 0,42 0,79 <0,01 Palvelut >0,99 >0,99 <0,01 Maa- ja metsätalous <0,01 0,10 <0,01 Muut >0,99 >0,99 <0,01 BKT >0,99 >0,99 <0,01 Väkiluku >0,99 >0,99 <0,01 22

Kuvio 5. Kaikkien yhdeksän aikasarjan kuvaajat. Aikasarja voidaan muuttaa stationaariseksi esimerkiksi logaritmoimalla, differoimalla tai logaritmoimalla ja differoimalla. Logaritmoinnin tarve voidaan havaita, kun testataan Box- Cox-muunnoksen parametria. Taulukossa 2 on kaikkien aikasarjojen Box-Cox-muunnoksen parametrien luottamusvälit. Kaikille muuttujille ei saatu laskettua muunnoksen parametrien luottamusvälejä, mutta viidellä aikasarjalla nolla löytyy luottamusväliltä. Tehdään kuitenkin päätös, että logaritmoidaan kaikki aikasarjat väkilukua lukuun ottamatta, vaikka kaikista ei saatu tulosta ja palvelujen luottamusväli on -0,6-0,1. Väkilukua ei logaritmoida, koska se ei kasva eksponentiaalisesti. 23

Taulukko 2. Box-Cox parametrin luottamusvälit. Box-Cox parametrin luottamusväli Kokonaisenergiankäyttö -1,3 0,0 Teollisuus -0,5 0,5 Liikenne ei tulosta Asuminen -1,5 1,5 Palvelut -0,6-0,1 Maa- ja metsätalous -1,5 0,1 Muut -0,2 0,0 BKT ei tulosta Väkiluku ei tulosta Pelkällä logaritmoinnilla ei vielä saavutettu missään aikasarjassa stationaarisuutta. Seuraavaksi testataan kuinka monta kertaa aikasarjat pitää differoida, jotta niistä tulee stationaarisia. Taulukossa 3 on kaikkien aikasarjojen stationaarisuustestien p-arvot yksinkertaisen ja kaksinkertaisen differoimisen jälkeen. Siitä nähdään ainakin yhden testin perusteella, että yksinkertainen differointi riittää kaikkien aikasarjojen tapauksessa saattamaan aikasarjat stationaariseen tilaan, tarkemmin differenssistationaariseen tilaan paitsi väkiluvun tapauksessa. Väkiluku täytyy differoida vähintään kahteen kertaan, jotta se saadaan stationaariseen tilaan. Valitaan tässä vaiheessa muista aikasarjoista siis yksinkertainen differointi ja laajennetaan mallinrakentamisessa tarvittaessa kaksinkertaiseen differoimiseen. Kuviossa 6 on vielä kaikkien aikasarjojen kuvaajat mahdollisen logaritmoinnin ja yksinkertaisten tai kaksinkertaisten differointien jälkeen. Nyt myös kuvaajat näyttävät stationäärisemmiltä kuin kuviossa 5. Taulukko 3. Laajennetun Dickey-Fuller, Phillips-Perron ja KPSS-testien p-arvot mahdollisen logaritmoinnin ja yksinkertaisen sekä kaksinkertaisen differoinnin jälkeen. Logaritmointi ja differointi Logaritmointi ja 2x differointi ADF PP KPSS ADF PP KPSS Kokonaisenergiankäyttö 0,16 0,08 >0,10 0,06 <0,01 >0,10 Teollisuus 0,10 0,02 >0,10 0,04 <0,01 >0,10 Liikenne 0,05 <0,01 >0,10 <0,01 <0,01 >0,10 Asuminen 0,74 0,02 >0,10 0,05 <0,01 >0,10 Palvelut 0,33 <0,01 >0,10 <0,01 <0,01 >0,10 Maa- ja metsätalous <0,01 <0,01 >0,10 0,01 <0,01 >0,10 Muut 0,47 <0,01 >0,10 <0,01 <0,01 >0,10 BKT 0,25 <0,01 0,04 <0,01 <0,01 >0,10 Väkiluku (ei logaritmia) 0,19 0,70 <0,01 0,03 0,63 >0,10 24

ktoe -0.10 0.05 0.20 ktoe -0.2 0.0 ktoe -0.1 0.1 0.3 ktoe -0.10 0.00 0.10 ktoe -0.05 0.05 0.15 ktoe -0.04 0.00 0.04 ktoe 0.00 0.05 0.10 miljardia dollaria 0.00 0.05 0.10 asukasta -1500-500 500 Kokonaisenergiankäyttö BKT Väkiluku 1980 1990 2000 2010 Aika 1980 1990 2000 2010 Aika 1975 1985 1995 2005 Aika Teollisuus Liikenne Asuminen 1980 1990 2000 2010 Aika 1980 1990 2000 2010 Aika 1980 1990 2000 2010 Aika Palvelut Maa- ja metsätalous Muut 1980 1990 2000 2010 Aika 1980 1990 2000 2010 Aika 1980 1990 2000 2010 Aika Kuvio 6. Aikasarjojen kuvaajat logaritmointien ja yksinkertaisten differointien jälkeen (väkiluku 2x). 4.1.2 Valkoinen kohina Jotta aikasarjan mallintamista kannattaa jatkaa, sarja ei saa olla valkoista kohinaa. Valkoista kohinaa voidaan testata usealla erilaisella testillä. Käytetään tässä kolmea testiä: käännepistetesti, järjestystesti ja Box-Ljung-testi (viivepituudella 3). Taulukkoon 4 on listattu näiden kaikkien arvot, kun aikasarjat ovat logaritmoitu ja differoitu. Kaikissa näissä testeissä H 0 -hypoteesi tarkoittaa sitä, että sarja on valkoista kohinaa. Päätetään, että jos yksikin testi hylkää H 0 -hypoteesin, voidaan mal- 25

lintamista jatkaa. Tämä toteutuu kaikkien muiden aikasarjojen kohdalla paitsi liikenteen, palveluiden ja muun energiankäytön kohdalla. Taulukko 4. Valkoista kohinaa testaavien testien p-arvot mahdollisen logaritmoinnin ja yksinkertaisen ja kaksinkertaisen differoinnin jälkeen. Käännepiste Järjestys Box-Ljung Kokonaisenergiankäyttö 1x 0,1148 0,4893 0,0027 Teollisuus 1x 0,1148 0,6239 0,0331 Liikenne 1x 0,4304 0,6782 0,6058 Asuminen 1x 0,4304 0,5546 0,0366 Palvelut 1x 0,4304 0,1220 0,5582 Maa- ja metsätalous 1x 0,0487 0,1482 0,1315 Muut 1x 0,4304 0,8112 0,7809 BKT 1x 0,0058 0,0214 0,4285 Väkiluku 2x 8,8x10-10 0,2189 3,3x10-16 4.2 ARIMA-mallin estimointi 4.2.1 ACF ja PACF ARIMA(p,d,q)-mallin parametreja voidaan päätellä autokorrelaation ja osittaisautokorrelaation avulla. Kuviossa 7 on kaikkien logaritmoitujen ja differoitujen aikasarjojen otosautokorrelaatiot ja otososittaisautokorrelaatiot. Parametria p voidaan arvioida PACF:n kuvaajasta: Kun viive asettuu rajojen sisäpuolelle arvolla p+1, voidaan olettaa, että AR(p)-malli olisi sopiva. Parametria q voidaan toisaalta arvioida ACF:n kuvaajasta: Kun viive asettuu rajojen sisään arvolla q+1, voidaan olettaa, että MA(q)-malli olisi sopiva. 26

Partial ACF -0.3-0.1 0.1 0.3 Partial ACF -0.3-0.1 0.1 0.3 Partial ACF -0.3-0.1 0.1 0.3 ACF -0.3-0.1 0.1 0.3 ACF -0.3-0.1 0.1 0.3 ACF -0.3-0.1 0.1 0.3 Partial ACF -0.2 0.0 0.2 0.4 Partial ACF -0.3-0.1 0.1 0.3 Partial ACF -0.2 0.0 0.2 0.4 ACF -0.2 0.0 0.2 0.4 ACF -0.3-0.1 0.1 0.3 ACF -0.2 0.0 0.2 0.4 Partial ACF -0.2 0.2 0.6 Partial ACF -0.3-0.1 0.1 0.3 Partial ACF -0.5 0.0 0.5 ACF -0.2 0.2 0.6 ACF -0.3-0.1 0.1 0.3 ACF -0.4 0.0 0.4 0.8 Kokonaisenergiankäyttö BKT Väkiluku 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag Teollisuus Liikenne Asuminen 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag Palvelut Maa- ja metsätalous Muut 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag 2 4 6 8 10 12 14 Lag Kuvio 7. Kaikkien aikasarjojen otosautokorrelaatiot ja otososittaisautokorrelaatiot. Taulukossa 5 on ACF:n ja PACF:n perusteella arvioidut parametrit kaikille aikasarjoille. Taulukossa on lisäksi myös parametri d, joka tulee differointien määrästä. 27

Taulukko 5. Aikasarjojen parametrien arvioidut arvot ACF:n ja PACF:n perusteella. AR(p) I(d) MA(q) Kokonaisenergiankäyttö 1 1 0 Teollisuus 1 1 0 Liikenne 0 1 0 Asuminen 1 1 0 Palvelut 0 1 0 Maa- ja metsätalous 0 1 0 Muut 0 1 0 BKT 1 1 0 Väkiluku 3 2 0 4.2.2 Muita parametrien määritystapoja Parametrien määrittämiseksi on myös muita keinoja, joita löytyy esimerkiksi R-ohjelmistosta. Tällaisia ovat muun muassa funktiot armasubsets ja eacf. Lopullinen mallinvalinta voidaan kuitenkin tehdä mallien AIC:n ja residuaalien tarkastelujen perusteella. Useamman mallin kokeilu ja vertailu on nykyään helppoa tietokoneohjelmistoilla. Taulukkoon 6 on koottu AIC:n perusteella valitut ARIMA-mallien parametrit. Näistä kokonaisenergiankäyttö, asuminen, palvelut, maa- ja metsätalous ja muut ovat täysin samat kuin ACF:n ja PACF:n avulla arvioidut parametrit. Kuuden muun aikasarjan parametrit eroavat enemmän tai vähemmän aiemmin arvioiduista. Taulukko 6. Aikasarjojen sekamallien (ARIMA) parametrien arvot valittuna AIC:n perusteella. AR(p) I(d) MA(q) Kokonaisenergiankäyttö 1 1 0 Teollisuus 2 1 2 Liikenne 2 1 2 Asuminen 1 1 0 Palvelut 0 1 0 Maa- ja metsätalous 0 1 0 Muut 0 1 0 BKT 1 1 1 Väkiluku 0 3 2 28

4.3 Mallin diagnostinen tarkastelu Jotta voidaan sanoa, että mallinnus olisi valmis, täytyy mallin residuaalien olla likimain riippumatonta valkoista kohinaa. Tämä voidaan todeta tarkastelemalla residuaalien histogrammeja, kvantiilikvantiili kuvaajia ja tekemällä testejä residuaaleille. Tällaisia testejä ovat muun muassa Shapiro- Wilk-testi, jolla testataan residuaalien normaalisuutta ja jo aiemmin mainittu Box-Ljung-testi. Shapiro-Wilk-testin H 0 -hypoteesi on, että aikasarja on normaalisti jakautunut ja Box-Ljung-testin H 0 -hypoteesi on, että aikasarja on valkoista kohinaa. Taulukossa 7 on näiden testien p-arvot, jotka kertovat, että kaikkien mallien residuaalit todellakin ovat valkoista kohinaa. Kaikkien mallien kohdalla residuaalit eivät kuitenkaan olleet normaalisti jakautuneet. Tärkeämpää on kuitenkin, että aikasarjojen jäännössarjat läpäisevät Box-Ljung-testin viivepituudella 10. Taulukko 7. ARIMA-mallien residuaaleille tehtyjen testien (Shapiro-Wilk ja Box-Ljung) p-arvoja. Shapiro-Wilk Box-Ljung Kokonaisenergiankäyttö 0,467 0,858 Teollisuus 0,431 0,845 Liikenne 0,038 0,660 Asuminen 0,138 0,896 Palvelut 0,298 0,558 Maa- ja metsätalous 8,239x10-6 0,132 Muut 0,0002 0,781 BKT 0,012 0,786 Väkiluku 0,0004 0,196 Piirretään vielä muutamien aikasarjojen osalta AIC:n mielessä parhaiden mallien residuaalien histogrammit ja kvantiili-kvantiili-kuviot. Asumisen energiankäytön ARIMA(1,1,0)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio ovat kuviossa 8. Histogrammi näyttäisi olevan hieman vasemmalle vino, mutta kuitenkin suhteellisen normaalisti jakautunut, kuten myös Shapiro-Wilkin testi kertoo. Vaikka Box-Ljung-testi sanoo residuaalien olevan valkoista kohinaa, kuvioiden epämääräisyyden takia testataan, jos kaksinkertaisesti differoitu aikasarja toimisi paremmin mallinnuksessa. Kun aikasarja on differoitu toistamiseen, pitää valita ARIMA-mallin parametrit uudestaan AIC:n perusteella. Parhaaksi malliksi valikoituu ARIMA(0,2,1)-malli. Shapiro-Wilk-testisuureeksi saadaan 0,4527, joten voidaan sanoa residuaalien olevan normaalisti jakautunut. Box-Ljung-testisuureeksi saadaan 0,9769, joten 29

mallin residuaalit ovat valkoista kohinaa. Nyt myös kuvion 9 kuviot ovat paremman näköiset kuin ARIMA(1,1,0)-mallin tapauksessa, joten ARIMA(0,2,1)-mallia pidetään riittävänä. Kuvio 8. Asumisen energiankäytön ARIMA(1,1,0)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuvio 9. Asumisen energiankäytön ARIMA(0,2,1)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuviossa 10 on maa- ja metsätalouden energiankäytön ARIMA(0,1,0)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuvaajista nähdään, että residuaalit eivät ole normaaliset, jota tukee myös Shapiro-Wilk-testin tulos (8,239x10-6 ). Box-Ljung-testi kuitenkin antaa sellaisen tulok- 30

sen, että residuaaleja voidaan pitää valkoisena kohinana. Kvantiili-kvantiili -kuvio ei ole riittävän hyvän näköinen, joten kokeillaan differoida aikasarja toistamiseen. Kuvio 10. Maa- ja metsätalouden energiankäytön ARIMA(0,1,0)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kun aikasarja differoidaan toistamiseen, pitää ARIMA-mallin parametrit valita uudestaan AIC:n perusteella. Parhaaksi malliksi valikoituu ARIMA(0,2,1)-malli. Shapiro-Wilk-testisuureeksi saadaan 3,222x10-5, joten voidaan sanoa, että mallin residuaalit eivät ole edelleenkään normaalisti jakautuneet. Box-Ljung-testisuureeksi saadaan 0,02799, joten 1 %:n riskitasolla ei hylätä hypoteesia, että residuaalit ovat valkoista kohinaa. Kuvion 11 kuviot ovat paremman näköiset kuin ARIMA(0,1,0)-mallin tapauksessa, joten ARIMA(0,2,1)-mallia voidaan pitää riittävänä. 31

Kuvio 11. Maa- ja metsätalouden energiankäytön ARIMA(0,2,1)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuviossa 12 on väkiluvun ARIMA(0,3,2)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. Kuvioista nähdään, että residuaalit eivät ole täysin normaalisti jakautuneet. Box-Ljung-testi antaa kuitenkin viitteitä siitä, että residuaalit olisivat valkoista kohinaa. Piirretään vielä residuaalit ajan suhteen (kuvio 13). Residuaalit ovat suhteellisen satunnaisia, paitsi jonkin verran vähemmän vaihtelua esiintyy sarjan loppupäässä. Voidaan kuitenkin pitää ARIMA(0,3,2)-mallia riittävänä. Kuvio 12. Väkiluvun ARIMA(0,3,2)-mallin residuaalien histogrammi ja kvantiili-kvantiili-kuvio. 32

Kuvio 13. Väkiluvun ARIMA(0,3,2)-mallin residuaalit ajan suhteen. Kolmen parhaan AIC:n malleja testattiin aiemmin mainituilla testeillä ja nämä kaikki läpäisivät testit. Näitä kaikkia kolmea mallia testataan seuraavassa kappaleessa, jonka jälkeen tehdään lopulliset mallien valinnat. 4.4 Mallin testaaminen Malleja voidaan testata ottamalla alkuosa aikasarjasta ja ennustamalla loppuosaa ja vertaamalla sitä todellisiin arvoihin. Aikasarjojen pituudet ovat 39 vuotta, joten otetaan siitä erikseen ensimmäiset 34 vuotta ja ennustetaan seuraavaa viittä vuotta ja verrataan sitä toteutuneisiin arvoihin. Tehdään tämä kolmen parhaan AIC:n arvon saaneella mallilla. Näiden kolmen mallin AIC:n arvot olivat kaikissa tapauksissa kahden yksikön sisällä, joten näistä kolmesta minkä tahansa mallin valinta on perusteltua. Mikäli parhaan AIC:n arvon saanut malli ei ennusta tarpeeksi hyvin kuvaajan perusteella jo toteutuneita arvoja, valitaan lopulliseksi malliksi parhaiten näistä kolmesta suoriutunut malli. Taulukossa 8 on lopulta valittujen ARIMA-mallien parametrit. AIC:n perusteella valituista vaihtui ainoastaan teollisuuden parametrit, koska tässä tapauksessa ennustus oli merkittävästi parempi muulla kuin parhaan AIC:n saaneella mallilla (kuvio 14). 33

Kuvio 14. Teollisuuden ARIMA(1,1,0) ja ARIMA(2,1,2)-mallien ennusteet, punaisella paksulla katkoviivalla (1,1,0) ja sinisellä ohuella katkoviivalla (2,1,2), ja 95 % ennustevälit pisteviivoilla vuosille 2005-2009. Mustalla yhtenäisellä viivalla on toteutuneet arvot. Taulukko 8. Lopulliset ARIMA-mallien parametrit. AR(p) I(d) MA(q) Kokonaisenergiankäyttö 1 1 0 Teollisuus 1 1 0 Liikenne 2 1 2 Asuminen 0 2 1 Palvelut 0 1 0 Maa- ja metsätalous 0 2 1 Muut 0 1 0 BKT 1 1 1 Väkiluku 0 3 2 34

4.5 Moniulotteinen mallintaminen Aikasarjan mallintamista voidaan tehdä myös moniulotteisesti, jolloin käytössä on siis useampia kuin yksi aikasarja. Mallinnetaan Kiinan kokonaisenergiankäyttöä ja BKT:ta käyttämällä R-ohjelmiston kirjastoa vars, jossa on funktio VAR. Käytetään mallinnuksessa logaritmoituja ja yhden kerran differoituja aikasarjoja, koska aikasarjojen täytyy olla stationaarisia ennen mallin sovitusta. VAR(p)-mallin paras viivepituus p saadaan valittua VARselect-funktiolla. VARselect antaa neljän eri kriteerin perusteella ehdotuksen viivepituuden arvoksi. Nämä kriteerit ovat AIC, Hannan-Quinn (HQ), Schwarz (SC), joka on sama kuin BIC ja Forecast Prediction Error (FPE). Kriteerien valitsemat viivepituuksien arvot ovat taulukossa 9. Valitaan viivepituudeksi 1, jota käytetään mallin tekemiseen VAR-funktiolla. VAR-funktion kanssa voidaan käyttää predict-funktiota, jolla ennustaminen onnistuu kätevästi. Vars-paketista löytyy serial.test-testi, joka on moniulotteinen Portmonteautesti. Testi testaa ovatko mallin residuaalit valkoista kohinaa. P-arvoksi saadaan 0,893, joten residuaalit ovat valkoista kohinaa ja malli voidaan hyväksyä. Taulukko 9. VARselect-funktion antamat viivepituuden p arvot eri kriteerien perusteella moniulotteiselle VAR(p)- mallille. Kriteeri AIC HQ SC (BIC) FPE Parametrien arvo 2 1 1 2 35

5 Yhteisintegroituvuuden testaaminen 5.1 Teollisuuden ja kokonaisenergiankäytön yhteisintegroituvuus Pyritään selvittämään, onko kokonaisenergiankäytöllä ja teollisuuden energiankäytöllä yhteyttä toisiinsa. Voidaan siis kysyä, seuraako teollisuuden energiankäyttö kokonaisenergiankäyttöä samassa suhteessa ajan t kasvaessa. Jotta näihin kysymyksiin voisi vastata kyllä, pitää näiden aikasarjojen olla keskenään yhteisintegroituneita. Kuvion 15 perusteella näillä kahdella aikasarjalla voisi olettaa olevan jonkinlainen yhteys, koska ne selvästi ovat yhdenmuotoiset. Kuvio 15. Mustalla viivalla kokonaisenergiankäytön aikasarja ja punaisella viivalla teollisuuden energiankäytön aikasarja vuosina 1971-2009. Testataan Johansenin menetelmällä, onko olemassa yhteisintegroituvuusvektoria ja kuinka monta niitä on. Aikasarjat logaritmoidaan ennen yhteisintegroituvuustestien tekemistä. Taulukossa 10 on testien tulokset. Nähdään, että yhteisintegroituvuusvektoria ei ole olemassa, koska H 0 -hypoteesit 36

hyväksytään kummassakin tapauksessa. Tämä tarkoittaa sitä, että kokonaisenergiankäyttö ja teollisuuden energiankäyttö eivät ole yhteisintegroituneita. Taulukko 10. Johansenin testin tulokset: hypoteesit, testisuureet ja luottamusrajat. H 0 -hypoteesi H 1 -hypoteesi Testisuure Luottamusrajat λ max 90 % 95 % 99 % r = 0 r = 1 8,57 12,91 14,90 19,19 r = 1 r = 2 0,57 6,50 8,18 11,65 λ trace r <= 0 r > 0 9,14 15,66 17,95 23,52 r <= 1 r > 1 0,57 6,50 8,18 11,65 5.2 Kokonaisenergiankäytön ja BKT:n yhteisintegroituvuus Selvitetään seuraavaksi onko kokonaisenergiankäytöllä ja BKT:lla yhteyttä toisiinsa. Onko siis olemassa yhteisintegroituvuusvektoria. Kuviossa 16 on aikasarjat ja kummallakin on selvästi kasvava trendi ajan suhteen. Testataan, onko olemassa yhteisintegroituvuusvektoria ja kuinka monta niitä mahdollisesti on. Aikasarjat logaritmoidaan ennen yhteisintegroituvuustestien tekemistä. Taulukossa 11 on Johansenin menetelmän testitulokset. Nähdään, että yhteisintegroituvuusvektoria ei ole olemassa, koska H 0 -hypoteesit hyväksytään kummassakin tapauksessa. Tämä tarkoittaa sitä, että kokonaisenergiankäyttö ja bruttokansantuote eivät ole yhteisintegroituneita. Taulukko 11. Johansenin testin tulokset: hypoteesit, testisuureet ja luottamusrajat. H 0 -hypoteesi H 1 -hypoteesi Testisuure Luottamusrajat λ max 90 % 95 % 99 % r = 0 r = 1 5,73 12,91 14,90 19,19 r = 1 r = 2 2,24 6,50 8,18 11,65 λ trace r <= 0 r > 0 7,96 15,66 17,95 23,52 r <= 1 r > 1 2,24 6,50 8,18 11,65 37

1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Kilotonnia öljyä Miljardia dollaria 1600000 4000,00 1400000 Kokonaisenergiankäyttö BKT 3500,00 1200000 3000,00 1000000 2500,00 800000 2000,00 600000 1500,00 400000 1000,00 200000 500,00 0 0,00 Vuosi Kuvio 16. Kokonaisenergiankäytön ja bruttokansantuotteen kuvaajat vuosilta 1971-2009. 38

6 Ennustaminen Tässä luvussa tehdään ennusteita Kiinan energiankäytöstä, väkiluvusta ja BKT:sta. Ennusteet perustuvat kappaleessa 4 valittuihin malleihin. Kappaleessa myös vertaillaan näitä ennusteita keskenään ja muista lähteistä löydettyihin ennusteisiin. 6.1 Yksiulotteinen ennustaminen Ennustetaan kaikkia yhdeksää aikasarjaa ensin yksiulotteisesti. Jokaisesta aikasarjasta piirretään samaan kuvaajaan jo toteutuneet arvot, ennusteet ja 95 %:n ennustevälit. Nämä kuvaajat ovat kuvioissa 17-25. Kuvio 17. Kokonaisenergiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. 39

Kiinan energiankäyttö on ollut tasaisessa nousussa vuodesta 1971 lähtien muutamia notkahduksia lukuun ottamatta ja saman trendin voidaan odottaa jatkuvan. Ennusteen mukaan Kiinan energiankäyttö tulee nousemaan seuraavien 20 vuoden aikana noin kaksinkertaiseksi nykyisestä. Ennustevälit kuitenkin laajenevat, joten ennusteen epävarmuus kasvaa ajan myötä. Kuvio 18. Teollisuuden energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Teollisuuden energiankäyttö on kasvanut lähes samanlaisella trendillä kuin kokonaisenergiankäyttö vuodesta 1971 lähtien. Ennusteen mukaan teollisuuden energiankäyttö tulee kasvamaan noin kaksinkertaiseksi 20 seuraavan vuoden aikana. Ennustevälit kuitenkin kasvavat huomattavasti ajan myötä, jolloin myös ennusteen epävarmuus kasvaa. 40

Kuvio 19. Liikenteen energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Kiina on perinteisesti ollut polkupyörien ja mopojen luvattu maa, mutta viimeisten vuosien aikana yksityisautoilu on kasvattanut suosiotaan. Tämän voi todeta myös kuviosta 20, jossa on kuvattu liikenteen energiankäyttöä, joka on yli kymmenkertaistunut vuodesta 1971 lähtien. Ennusteen mukaan sama trendi tulee myös jatkumaan; seuraavien 20 vuoden aikana energiankäyttö tulee kasvamaan noin kolminkertaiseksi. Ennustevälien perusteella energiankäyttö kasvaa 2-5-kertaiseksi. 41

Kuvio 20. Asumisen energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Asumisen energiankäyttö ei ole juurikaan kasvanut henkilöä kohden vuodesta 1971 lähtien. Kokonaisuudessaan asumisen energiankäyttö on kuitenkin kasvanut noin kaksinkertaiseksi ja seuraavien 20 vuoden aikana kasvua tulee lisää noin 50 % nykyiseen energiankäyttöön nähden. 42

Kuvio 21. Palveluiden energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Kiinan kehitys ja talouskasvu on samalla myös kasvattanut huomattavasti palveluiden energiankäyttöä. Vuodesta 1971 lähtien palveluiden energiankäyttö on kasvanut lähes 15-kertaiseksi. Tulevaisuudessakin palveluiden energiankäyttö tulee kasvamaan, seuraavan 20 vuoden aikana noin 3-4- kertaiseksi. 43

Kuvio 22. Maa- ja metsätalouden energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Kiinan maa- ja metsätalouden energiankäyttö on noin kolminkertaistunut vuodesta 1971 lähtien. Kasvu on selvästi hillitympää kuin monen muun alan energiankäytön kohdalla. Ennusteen mukaan energiankäyttö tulee kasvamaan noin 30 % seuraavan 20 vuoden aikana. Ennustevälit kuitenkin kasvavat huomattavasti ajan suhteen, joten ennusteen epävarmuus myös kasvaa samalla. 44

Kuvio 23. Muun energiankäytön ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Vuonna 1971 ei ollut juurikaan muuta energiankäyttöä kuin mitkä on aiemmin mainittu. Muu energiankäyttö on kuitenkin kasvanut huimasti 25-kertaiseksi 39 vuodessa. Ennusteen mukaan kasvu jatkuu edelleen ja seuraavan 20 vuoden energiankäyttö kasvaa noin nelinkertaiseksi. 45

Kuvio 24. Väkiluvun ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää ennusteen lisäksi toteutuneet arvot mustalla viivalla ja 95 % ennustevälit. Kiina on väkiluvultaan maailman suurin valtio. Vuodesta 1971 lähtien Kiinan väkiluku on kasvanut noin 800 miljoonasta hieman alle 1,4 miljardiin. Kasvua on kuitenkin alkanut tyrehdyttää yhden lapsen politiikka, joka aloitettiin vuonna 1979. Ennusteen mukaan Kiinan väkiluvun nousee 20 vuoden aikana noin 1,45 miljardiin henkilöön. 46

Kuvio 25. Bruttokansantuotteen ennuste seuraavalle 20 vuodelle. Kuvaaja sisältää myös toteutuneet arvot ja 95 % ennustevälit. Kiinan bruttokansantuote on ollut pitkään noin 10 %:n kasvussa vuosittain. Bruttokansantuote on kasvanut lähes 30-kertaiseksi vuodesta 1971 vuoteen 2009 mennessä. Tulevaisuudessa BKT jatkaa kasvuaan ja seuraavan 20 vuoden aikana kasvu on yli viisinkertaista. 6.2 Moniulotteinen ennustaminen Moniulotteinen malli tehtiin Kiinan kokonaisenergiankäytöstä ja BKT:sta. Malliksi valikoitui logaritmoiduille ja kerran differoiduille sarjoille VAR(1)-malli. Kuvioissa 26 ja 27 on toteutuneet arvot, ennuste seuraavaksi 20 vuodeksi ja 95 % ennustevälit. Kokonaisenergiankäyttö jatkaa tasaista nousua, päätyen vuonna 2029 4,57 miljoonaan kilotonniin öljyä. BKT-käyrän nähdään jatkavan tiivistä 47

nousuaan ja ennuste vuodelle 2029 on 31,8 biljoonaa dollaria. Kummankin ennustevälit kuitenkin kasvavat huomattavasti ajan suhteen, joten näiden ennusteiden käyttö näin pitkällä aikavälillä ei ole järkevää. Kuvio 26. Kokonaisenergiankäytön toteutuneet arvot ja moniulotteisella mallinnuksella saatu ennuste seuraavalle 20 vuodelle. 48

Kuvio 27. BKT:n toteutuneet arvot ja moniulotteisella mallinnuksella saatu ennuste seuraavalle 20 vuodelle. 6.3 Ennusteiden vertailua 6.3.1 BKT ja väkiluku Kiinan bruttokansantuotteen odotetaan jatkavan tasaista kasvuaan tulevaisuudessa. Viime vuosien aikana kasvu on ollut noin 10 %:n luokkaa, ja vuoteen 2030 mennessä kasvun ennustetaan jatkavan kasvuaan noin 7 %:n vuosivauhdilla. Vuonna 2029 BKT:n ennustetaan olevan 15,3 biljoonaa dollaria (USDA). Yksiulotteinen ennusteeni Kiinan BKT:sta vuonna 2029 on jonkin verran suurempi kuin USDA:n arvio, noin 19,6 biljoonaa dollaria. USDA:n arvio osuu kuitenkin 95 %:n ennustevälille, joka on 12,5 30,7 biljoonaa dollaria. Moniulotteinen ennusteeni Kiinan BKT:sta vuonna 2029 on 31,8 biljoonaa dollaria, joka on huomattavasti suurempi kuin USDA:n arvio. USDA:n arvio osuu 49

myös tämän ennustevälille, joka on 9,9 102,1 biljoonaa dollaria. Ennusteväli on kuitenkin huomattavan suuri, joten ennusteen epävarmuus on myös erittäin suuri. Kuviossa 28 on yksiulotteisen ja moniulotteisen mallin perusteella tehdyt ennusteet. Kuvio 28. Punaisilla paksuilla katkoviivoilla on yksiulotteinen BKT:n ennuste ja 95 % ennustevälit, sinisillä pisteviivoilla on moniulotteinen BKT:n ennuste ja 95 % ennustevälit ja mustalla on toteutuneet BKT:n arvot. Kiinan väkiluvun ennustetaan kasvavan vuoteen 2030 asti, jonka jälkeen väkiluku tasoittuu ja alkaa laskea viimeistään vuoden 2050 tienoilla. Vuoteen 2030 mennessä väkiluvun odotetaan olevan noin 1,45 miljardia (Chen & Liu 2009 s. 10). FAO:n ennuste vuodelle 2029 on noin 1,43 miljardia. Tässä tutkielmassa ennustettu väkiluku vuonna 2029 on noin 1,45 miljardia, joka on erittäin lähellä Chen ja Liun (2009) ja FAO:n ennusteita. 95 %:n ennustevälit ovat 1,06 1,83 miljardia. 50