Auringonpilkkujen jaksollisuus
|
|
- Jaana Hukkanen
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Mat Sovelletun matematiikan erikoistyöt Auringonpilkkujen jaksollisuus Teknillinen korkeakoulu Systeemianalyysin laboratorio Keijo Jaakola 51624B 1
2 1. Johdanto Aikasarjamalleja ARIMA-malli SARIMA-malli SARIMAX-malli Aikasarjamallin rakentaminen ja valitseminen Boxin ja Jenkinsin menetelmä Aikasarjamallin valitseminen Data Auringonpilkkudatan analysointi Analysoinnissa käytettävä ohjelmisto Tutkittavan aikasarjan valinta Mallin valinta ja estimointi Diagnostiset testit Mallien arviointi kuvaajien ja ennusteiden avulla Pohdinta ja yhteenveto Viitteet...14 Liitteet
3 1. Johdanto Auringon epätasainen pyörimisliike ja ylemmän pintakerroksen virtaukset ilmeisesti vaikuttavat erittäin voimakkaiden magneettikenttien muodostumiseen tietyille alueille Auringon pinnalla. Nämä kohdat ovat ympäristöään viileämpiä voimakkaan paikallisen magneettikentän vaikutuksesta. Viileät kohdat näkyvät ympäristöään tummempina auringonpilkkuina. Auringonpilkkujen lämpötila on noin 3800 K, mikä on noin 1000 K ympäristöään alempi. Tyypillisen auringonpilkun läpimitta on noin km ja elinikä vaihtelee koosta riippuen muutamasta päivästä jopa kuukausiin. Aurinko on sitä aktiivisempi, mitä enemmän auringonpilkkuja on. Maapallolla Auringon aktiivisuus näkyy revontulina ja magneettisina myrskyinä jolloin saattaa esiintyä häiriöitä mm. radioliikenteessä ja voimalinjoissa. Auringonpilkkujen määrää on rekisteröity vuodesta 1610 alkaen. Vuonna 1843 saksalainen Heinrich Schwabe keksi, että auringonpilkkujen määrä vaihtelee jaksollisesti 11 vuoden välein [1]. Joskus auringonpilkut katoavat lähes kokonaan vuosikymmeniksi. Viimeksi tällainen ajanjakso oli 1800-luvun alussa. Tässä työssä on tarkoitus tutkia auringonpilkkujen lukumäärää aikasarja-analyysin keinoin ja muodostaa mahdollisimman hyvä SARIMA-malli. Mallin rakentamisessa käytetään NCSS 2001-ohjelmistoa. 2. Aikasarjamalleja 2.1. ARIMA-malli ARIMA malli koostuu AR- ja MA-osasta (AR=autoregression, MA=moving average). AR-prosessin arvo ajanhetkellä t riippuu prosessin edellisistä arvoista ja jäännöstermistä a t (valkoista kohinaa). MA-prosessin arvo ajanhetkellä t riippuu jäännöstermin arvosta ajanhetkellä t ja sitä ennen. Käytetään ARIMA(p,d,q)-mallille seuraavaa notaatiota: d Φ ( B ) z = Θ ( B) a, (1) p t q t missä z t on mallitettava suure, a t on valkoista kohinaa, viiveoperaattori Bz t = z t-1, p differensointi = (1-B) ja viivepolynomit Φ B) = (1 φ B... φ B ) ja p ( 1,1 1, p q Θ B) = (1 θ B... θ B ) sisältävät mallin parametrit. Data määrää kertaluvut q ( 1,1 1, q p, d ja q. AR- ja MA-osiin otetaan tilastollisesti merkitsevät parametrit, ellei ole erityistä syytä muuhun SARIMA-malli SARIMA-mallilla mallitetaan kausivaihtelua. ARIMA-malli voidaan ymmärtää SARIMA-mallin erikoistapaukseksi, jossa kausivaihtelun pituus on yksi. Mikäli kausivaihtelun pituus on s, käytetään ARIMA(p,d,q,P,D,Q)-mallia 3
4 Φ ( Θ a, (2) P s d D s B ) Φ p ( B) s zt = ΘQ ( B ) q ( B) missä z t on mallitettava suure, a t on valkoista kohinaa, viiveoperaattori B s z t = z t-s, differensointi = (1-B), kausidifferensointi = (1-B s ) ja viivepolynomit s s Ps p Φ B ) = (1 φ B... φ B ), Φ B) = (1 φ B... φ B ), P ( s,1 s, P s t p ( 1,1 1, p s s Qs q Θ B ) = (1 θ B... θ B ) ja Θ B) = (1 θ B... θ B ) sisältävät Q ( s,1 s, Q q ( 1,1 1, q mallin parametrit. Data määrää kertaluvut p, d, q, P, D ja Q. Jos kauden pituus on suuri datan kokonaispituuteen nähden, kertaluvuille P, D ja Q ei ole mahdollista käyttää suuria arvoja, vaan usein P = D = Q = 1. AR- ja MA-osiin otetaan tilastollisesti merkitsevät parametrit, ellei ole erityistä syytä muuhun SARIMAX-malli SARIMAX-malli (Seasonal ARIMA with external variable) on SARIMA-malli, jossa on ulkoinen selittäjä. Malli on muuten sama kuin (2), mutta siihen tulee oikealle puolelle ulkoinen selittäjä x t differensiointien ja viiveiden kanssa. 3. Aikasarjamallin rakentaminen ja valitseminen Aikasarjamallin rakentaminen on aina syytä aloittaa piirtämällä tarkasteltava aikasarja. Kuvion avulla saadaan käsitys aikasarjan pääpiirteistä: trendin, kausivaihtelun, äkillisten muutosten, yms. esiintymisestä ja siitä vaikuttaako aikasarja stationaariselta. Aikasarjamallin rakentamisessa käytetään yleisesti Boxin ja Jenkinsin menetelmää Boxin ja Jenkinsin menetelmä Boxin ja Jenkinsin menetelmä koostuu kolmesta työvaiheesta: 1. Mallin identifiointi 2. Mallin estimointi 3. Diagnostiset tarkistukset Mallin identifiointi Ensimmäinen tehtävä on määrittää onko aikasarja stationaarinen, koska ARMA-mallit ovat stationaaristen aikasarjojen malleja. Aikasarja on stationaarinen, jos i) odotusarvo ja varianssi eivät riipu ajanhetkestä ja ii) Autokovarianssi riippuu vain ajanhetkien välistä, ei ajanhetkestä itsestään. Aikasarjan stationaarisuutta voi tutkia mm. seuraavilla tavoilla: 1) Tutkimalla aikasarjan kuvaa. Aikasarjassa ei saa näkyä -kehityksellisiä piirteitä (trendi) -kausivaihtelua 4
5 -sisäisten riippuvuusrakenteiden muutoksia 2) Tutkimalla autokorrelaatio- (akf) ja osittaisautokorrelaatiofunktioita (oakf). Stationaarisen ARMA-mallin akf ja oakf vaimenevat aina vähintään eksponentiaalista vauhtia. 3) Erilaisilla testeillä, esim. yksikköjuuritesti. Jos aikasarja ei ole stationaarinen, niin se saadaan stationaariseksi differensioimalla. Differensiointien kertalukujen valinta tehdään edellä olevien tutkimusten perusteella, esimerkiksi jos aikasarjassa on lineaarinen trendi, kertaluku on yksi ja jos aikasarjassa on 11 vuoden jakso niin kertaluku on 11. Differensiointien kanssa on syytä olla varovainen, sillä signaali-kohina-suhde saattaa differensioitaessa olennaisesti heikentyä, varsinkin kohinaisessa datassa. Seuraavaksi valitaan viivepolynomien asteluvut. Valinta tehdään akf:n ja oakf:n perusteella. Taulukosta 1 nähdään ARMA(p,q)-mallien korrelaatiofunktioiden ominaisuudet. Taulukko 1. ARMA(p,q)-mallien korrelaatiofunktioiden ominaisuudet Malli Autokorrelaatiofunktio Osittaisautokorrelaatiofunktio AR(p) Vaimenee eksponentiaalisesti Katkos viipeellä p MA(q) Katkos viipeellä q Vaimenee eksponentiaalisesti ARMA(p,q) Vaimenee eksponentiaalisesti Vaimenee eksponentiaalisesti SARMA-mallien akf ja oakf käyttäytyvät kausiviipeillä s, 2s, 3s, kuten vastaavien ARMA-mallien akf ja oakf Mallin estimointi ARMA-mallin estimoinnissa käytetään pääasiassa epälineaarista pienimmän neliösumman tai suurimman uskottavuuden menetelmää. Kun parametrit on estimoitu, tarkastetaan niiden merkitsevyys. Parametrien, jotka eivät ole merkitseviä, poisjättämistä tulee harkita tapauskohtaisesti Diagnostiset tarkistukset Diagnostiset tarkistukset perustuvat mallin residuaalien tutkimiseen. Malli on riittävä selittämään aikasarjan käyttäytymisen, jos residuaalit muistuttavat valkoista kohinaa. Residuaalien ominaisuuksia voidaan tutkia samalla tavalla kuin aikasarjaa itseään. Residuaalien valkoisuutta voi tutkia mm. seuraavilla tavoilla. 1) Tutkimalla residuaalisarjan kuvaa. Residuaalien pitäisi olla riittävän satunnaisia ja korreloimattomia. Residuaalit voidaan plotata sovitteen (fit) funktiona. 2) Tutkimalla residuaalisarjan autokorrelaatio- ja osittaisautokorrelaatiofunktioita. 3) Erilaisilla testeillä, esim. Boxin ja Piercen Q-testisuure (Portmanteau-testi). Residuaalien korreloimattomuutta voidaan testata Boxin ja Piercen Q-testisuureella 5
6 2 2 2 Q = n( r + r r ), (3) K 1 2 K missä n on havaintojen lukumäärä ja r i on residuaalien autokorrelaatio viiveellä i. on selvästi sitä suurempi mitä enemmän residuaalit ovat autokorreloituneita. Jos 2 nollahypoteesi residuaalien korreloimattomuudesta pätee, testisuure QK ~ χ K m, missä m = estimoitujen parametrien lukumäärä spesifioidussa SARMA-mallissa. Suuret testisuureen arvot johtavat nollahypoteesin hylkäämiseen. Q K Jos residuaalit eivät ole valkoista kohinaa, mennään takaisin vaiheeseen 1 mallin identifiointi. Jos residuaalit ovat valkoista kohinaa, malli on riittävä ja mallia voidaan käyttää ennustamiseen, säätöön jne. Jos malli ei tuota riittävän hyviä tuloksia, voidaan harkita jonkin muun malliluokan tai menetelmän käyttöönottoa Aikasarjamallin valitseminen Mallia rakentaessa on hyvä kuljettaa mukana useampia malleja ja tehdä valinta näiden kesken vasta lopuksi. Eri mallien paremmuutta voidaan tutkia erilaisin mallinvalintakriteerein kuten AIC (Akaike Information Criterion) ja SBC (SBC=BIC=Scwartz Bayesian criterion). SBC sakottaa AIC:tä enemmän lisäparametreista. Näin ollen SBC:n valitsema malli on AIC:tä vähäparametrisempi. Aikasarjan valinnassa voi käyttää muitakin informaatiokriteereitä, kuten HQC (Hannan-Quinn criterion) ja FPE (Final Prediction Error criterion). Näiden ohella mallinvalinnan apuna kannattaa käyttää riittävyystarkasteluja ja esimerkiksi mallin ennustuskyvyn tutkimista. Jotta valittu malli olisi riittävä eivät mallin residuaalit saisi poiketa merkitsevästi valkoisesta kohinasta. Mallit joiden residuaalit eivät ole valkoista kohinaa hylätään. Muiden mallien välillä valinta tehdään tärkeiksi valittujen kriteerien perusteella. Ennustuskykyä voidaan mitata katkaisemalla aikasarja ennen loppua ja estimoimalla parametrit katkaistun sarjan avulla. Sitten vain ennustetaan ja verrataan ennusteita tiedossa oleviin arvoihin. Ennusteita kannattaa tehdä aikasarjan eri kohdissa, sillä malli voi ennustaa sattumalta oikein yksittäisen pätkän. 4. Data Auringonpilkkudata on viitteestä [2] otettuja suhteellisia auringonpilkkulukuja vuosien tammikuilta. Suhteellinen auringonpilkkuluku R lasketaan Wolfin kaavalla R = k(f + 10g), (4) missä g on havaittavien pilkkuryhmien lukumäärä, f on yksittäisten pilkkujen lukumäärä ja k on havaitsijan ja teleskoopin tehokkuuteen liittyvä kerroin. Auringonpilkkuluku saadaan yhdistämällä eri puolilla maailmaa sijaitsevien yli 50 tarkkailuaseman havainnot. Kuukausittainen auringonpilkkuluku on saatu ottamalla keskiarvo kuukauden joka päivä lasketuista auringonpilkkuluvuista. 6
7 5. Auringonpilkkudatan analysointi 5.1. Analysoinnissa käytettävä ohjelmisto TKK:n koneilla on vain muutama tilastolliseen analysointiin soveltuva ohjelmisto: Excel, Statistix ja NCSS Tässä työssä on käytetty NCSS 2001 ohjelmistoa, missä on laajimmat aikasarja-analyysi toiminnot näistä kolmesta. NCSS 2001 on kuitenkin varsin puutteellinen ohjelma aikasarjamallinnukseen, eikä siinä ole juuri minkäänlaisia testejä. Esimerkiksi aikasarjan stationaarisuutta testaavia testejä ei ole ollenkaan, joten stationaarisuus päätellään tässä työssä kuvaajan avulla. Mallin hyvyyttä tutkittaessa ohjelmisto laskee vain Boxin ja Piercen Q-testisuureen (kaava 3, tunnetaan myös nimellä Portmanteau testi) 5.2 Tutkittavan aikasarjan valinta Aikasarjan kuvaaja on piirretty kuvaan 1. Kuvaan on piirretty myös aikasarjan autokorrelaatiofunktio (akf) ja osittaisautokorrelaatiofunktio (oakf). 7
8 Auringonpilkkuluku vuosi Autocorrelations of C2 (0,0,11,1,0) Partial Autocorrelations of C2 (0,0,11,1,0) 1,0 1,0 Autoc orrelations 0,5 0,0-0,5 Partial Autocorrelations 0,5 0,0-0,5-1,0 0,0 12,8 25,5 38,3 51,0 Time -1,0 0,0 12,8 25,5 38,3 51,0 Time Kuva 1. Suhteellinen auringonpilkkuluku vuosien tammikuilta, akf ja oakf. Kuvasta 1 nähdään, että aikasarjassa on jaksollista vaihtelua. Yleisesti tunnetaan, että auringonpilkkujen määrä vaihtelee keskimäärin 11 vuoden jaksoissa. Kuvasta nähdään, että jakson pituus kuitenkin vaihtelee paljon ollen pisimmillään 15 vuotta ( ). Tämä vaihtelu vaikeuttaa merkittävästi SARIMA-mallin sovittamista. Kuvasta nähdään myös, että jakson pituus vaihtelee paljon varsinkin alkupään havainnoissa (n. 80 ensimmäistä havaintoa). Tarkastellaan vaihtoehtoisena mallina mallia, jossa SARIMA-malli sovitetaan havaintoihin vuosilta (80 ensimmäistä havaintoa jätetty pois). 8
9 Aikasarja ei ole stationaarinen, koska siinä esiintyy kausivaihtelua. Tämä nähdään myös akf:n kuvaajasta (kuva 1), mikä ei vaimene vähintään eksponentiaalisesti, kuten stationaarisilla aikasarjoilla pitäisi. Differentioimalla jakson pituudella, saadaan jaksollinen vaihtelu poistettua. Kuvassa 2 on aikasarja differentioituna kauden pituudella (11 vuotta) ja differentioidun aikasarjan akf ja oakf. Kausidifferentioitu aikasarja (D11) v uosi Autocorrelations of C2 (0,1,11,1,0) Partial Autocorrelations of C2 (0,1,11,1,0) 1,0 1,0 Autoc orrelations 0,5 0,0-0,5 Partial Autoc orrelations 0,5 0,0-0,5-1,0-1,0 0,0 12,8 25,5 38,3 51,0 0,0 12,8 25,5 38,3 51,0 Time Time Kuva 2. Kausidifferentioitu aikasarja ja sen akf ja oakf. 9
10 Kausidifferentioidun aikasarjan kuvaaja näyttää stationaariselta. Myös akf:n ja oakf:n kuvaajat tukevat ajatusta, että kausidifferentioitu aikasarja olisi stationaarinen; molemmat funktiot vähenevät eksponentiaalisesti. Valitaan kausidifferentioitu aikasarja tutkittavaksi aikasarjaksi. 5.3 Mallin valinta ja estimointi Auringonpilkkujen lukumäärää ei voida selittää millään maapallon ilmiöllä, joten malliin ei tule ulkoista selittäjää. Mallin parametrit valitaan akf:n ja oakf:n avulla. Piikit akf:ssa tarkoittavat MA-osia, ja piikit oakf:ssa tarkoittavat vastaavasti AR-osia. Kuvasta 2 nähdään, että molemmissa kuvaajissa on piikki kohdassa 1 eli malliin tulee AR1- ja MA1-osa. Malli on tällöin ARIMA(1,0,1,0,11,0) (kaava 2). Taulukossa 2 on NCSS 2001:n tulostus parametrien estimaateista ja merkitsevyyksistä. Taulukko 2. ARIMA(1,0,1,0,11,0)-mallin parametrien estimaatit, keskivirheet ja merkitsevyys (kaikki havainnot mukana, v ). Model Estimation Section Parameter Parameter Standard Prob Name Estimate Error T-Value Level AR(1) 0, , ,0749 0, MA(1) -0,268 0, ,2758 0, Sekä AR- että MA-osa ovat merkitseviä (P<0,05), joten ne voidaan pitää mallissa. Vaihtoehtoisessa mallissa on mukana havainnot vuosilta Katkaistun aikasarjan akf ja oakf ovat lähes samanlaiset kuin katkaisemattoman aikasarjankin, joten malliin tulee AR1- ja MA1-osa. Sovittamalla ARIMA(1,0,1,0,11,0) malli havaintoihin vuosilta , saadaan taulukon 3 mukaiset tulokset. Taulukko 3. ARIMA(1,0,1,0,11,0)-mallin parametrien estimaatit, keskivirheet ja merkitsevyys (mukana havainnot v ). Model Estimation Section Parameter Parameter Standard Prob Name Estimate Error T-Value Level AR(1) 0, , ,4125 0, MA(1) -0, , ,5159 0, Kumpikaan termi ei ole merkitsevä. Poistetaan mallista suuremman P-arvon omaava termi eli AR-osa. Taulukossa 4 on tulokset mallista ARIMA(0,0,1,0,11,0). Taulukko 3. ARIMA(0,0,1,0,11,0)-mallin parametrien estimaatit, keskivirheet ja merkitsevyys (mukana havainnot v ). Model Estimation Section Parameter Parameter Standard Prob Name Estimate Error T-Value Level MA(1) -0, ,38E-02-6,
11 MA1-osa on merkitsevä. Valitaan tarkasteltavaksi mallit ARIMA(1,0,1,0,11,0) ja ARIMA(0,0,1,0,11,0), joista ensimmäinen on kaikille havainnoille ja jälkimmäinen havainnoille vuosilta Diagnostiset testit Malli on riittävä selittämään aikasarjan käyttäytymisen, jos residuaalit muistuttavat valkoista kohinaa. NCSS 2001:ssä ainoa testi residuaalien korreloimattomuudelle on Boxin ja Piercen Q-testi. ARIMA(1,0,1,0,11,0)-mallille testi antoi 6:lla eri viiveellä tulokseksi, että malli on riittävä ja 40:llä eri viiveellä, että malli ei ole riittävä. ARIMA(0,0,1,0,11,0)-mallille vastaavat luvut olivat 40 ja 7. Ohjelman tulostukset ovat liitteessä 1. Aikasarjan alkupäässä esiintyvä jakson pituuden vaihtelu aiheuttaa sen, että ARMA(1,0,1,0,11,0)-malli ei ole riittävä. Katkaistuun aikasarjaan sovitettu ARIMA(0,0,1,0,11,0)-malli sen sijaan on riittävä. Residuaalien korreloimattomuus tosin hylättiin 7:llä viiveellä, mutta niissäkin hylkääminen tapahtui niukasti (P-arvot 0,02-0,499). 5.5 Mallien arviointi kuvaajien ja ennusteiden avulla Auringonpilkkudataa oli kirjassa [2] vuoteen 1983 asti. Internetistä löytyy aurinkopilkkulukuja aina vuoteen 2003 [3]. Tämän datan avulla voidaan tutkia mallien ennustuskyky. Kuvaan 3 on piirretty aikasarja, ARMA(1,0,1,0,11,0)-mallin sovite ja sen antama ennustus. Kuvaan 4 on piirretty vastaavat asiat ARIMA(0,0,1,0,11,0)-mallille. Molemmilla malleilla sovitteisiin tuli muutama lievästi negatiivinen arvo. Näille pisteille annettiin arvoksi nolla. 11
12 aikasarja, sovite ja ennuste aikasarja sovite Kuva 3. Aikasarja, ARMA(1,0,1,0,11,0)-mallin sovite ja sen antama ennustus aikasarja, sovite ja ennuste v uosi aikasarja sovite Kuva 4. Aikasarja, ARMA(0,0,1,0,11,0)-mallin sovite ja sen antama ennustus 12
13 Kuvista nähdään, että molempien mallien sovite kulkee melko lähellä oikeaa dataa. ARMA(0,0,1,0,11,0)-mallilla sovite kulkee hieman lähempänä oikeaa dataa kuin ARMA(1,0,1,0,11,0)-mallilla saatu sovite, minkä voisi päätellä myös Boxin ja Piercen Q-testin avulla. Mallit ennustavat arvot vuosille ARMA(0,0,1,0,11,0)-mallin antama ennuste on hiukan lähempänä oikeaa dataa (keskineliövirhe=2726) kuin ARMA(1,0,1,0,11,0)-mallin ennuste (keskineliövirhe=2714). 6. Pohdinta ja yhteenveto Ensi silmäyksellä auringonpilkkuaikasarjan kuvaaja näyttää säännöllisesti aaltoilevalta helposti ennustettavissa olevalta aikasarjalta. ARIMA-mallin sovituksen kannalta jakson pituuden vaihtelu kuitenkin tuo ongelmia. Jakson pituus vaihtelee välillä 8-15 vuotta, joten differensiointi kertaluvulla 11 on hiukan kyseenalaista. Suurin osa jaksoista kuitenkin on 11 vuotta pitkiä ja jakson pituus vaihtelee lähinnä aikasarjan alussa. Tästä johtuen ARIMA-malli sovitettiin myös aikasarjaan, josta alkupään havainnot oli jätetty pois. Näin saatu ARIMA-malli onkin riittävä. Väistämättä herää kysymys miksi jakson pituus vaihtelee aikasarjan alussa. Auringossa on kenties voinut tapahtua pieniä muutoksia 1700-luvun lopussa, jotka ovat aiheuttaneet jakson pituuden muutoksen. Ensimmäisenä kuitenkin tulee mieleen, että käytössä olleet mittalaitteet eivät varmaan noihin aikoihin olleet kovin kehittyneitä. Noita asioita voisi olla hyvä tutkia tarkemmin, mutta jotta työmäärä pysyisi kohtuullisena, se jätetään tässä työssä tekemättä. Mallin valinta tehtiin Boxin ja Piercen Q-testin avulla, koska se on ainoa testi, jonka NCSS 2001-ohjelmisto tekee. Pelkästään Boxin ja Piercen Q-testiin mallin valintaa ei kuitenkaan kannata perustaa, koska testin mukaan esimerkiksi ARIMA(4,1,5,2,11,1) on erittäin hyvä malli, vaikkakin vain osa termeistä on merkitseviä. ARIMA-malli saadaan tietysti sopimaan havaintoihin sitä paremmin mitä enemmän termejä otetaan, mutta mallin pitäisi olla mahdollisimman vähäparametrinen eikä merkityksettömiä muuttujia saisi olla. Boxin ja Piercen Q-testi ei rankaise parametrien lukumäärästä toisin kuin esimerkiksi jotkin informaatiokriteerit (esim. AIC ja SBC). Tässä työssä mukaan otettavat termit valittiin akf:n ja oakf:n avulla, jolloin malli pysyi vähäparametrisena. Tällaisia aikasarja-analyysejä olisi hyvä tehdä jollain vähän kehittyneemmällä ohjelmistolla, jossa olisi enemmän testejä. Esimerkiksi SASohjelmisto on monipuolinen ohjelmisto, josta löytyy mm. testejä stationaarisuudelle ja informaatiokriteerien laskeminen. Parhaimmaksi malliksi valittiin ARMA(0,0,1,0,11,0)-malli, joka sovitettiin havaintoihin vuosilta Koko sarjaan ei mikään ARIMA-malli sopinut kovin hyvin. Voisikin olla paikallaan yrittää sovittaa havaintoihin jotain epälineaarista mallia. 13
14 7. Viitteet [1] [2] Andrews, D.F., (Herzberg, A.M.), Data: a collection of problems from many fields for the student and research worker. s [3] Liitteet 1) NCSS 2001:n tulostus mallille ARIMA(1,0,1,0,11,0) (mukana havainnot vuosilta ): Autocorrelation Plot Section 1,0 Autocorrelations of Residuals Autocorrelations 0,5 0,0-0,5-1,0 0,0 12,3 24,5 36,8 49,0 Lag Portmanteau Test Section C2-MEAN Portmanteau Prob Lag DF Test Value Level Decision (0.05) 3 1 0,08 0, Adequate Model 4 2 2,56 0, Adequate Model 5 3 5,92 0, Adequate Model 6 4 6,51 0, Adequate Model 7 5 7,20 0, Adequate Model ,34 0, Adequate Model ,45 0, Inadequate Model ,13 0, Inadequate Model ,74 0, Inadequate Model ,80 0, Inadequate Model ,30 0, Inadequate Model ,21 0, Inadequate Model ,07 0, Inadequate Model ,07 0, Inadequate Model ,14 0, Inadequate Model ,49 0, Inadequate Model ,74 0, Inadequate Model 14
15 ,25 0, Inadequate Model ,26 0, Inadequate Model ,88 0, Inadequate Model ,92 0, Inadequate Model ,94 0, Inadequate Model ,27 0, Inadequate Model ,75 0, Inadequate Model ,02 0, Inadequate Model ,50 0, Inadequate Model ,81 0, Inadequate Model ,83 0, Inadequate Model ,09 0, Inadequate Model ,70 0, Inadequate Model ,27 0, Inadequate Model ,27 0, Inadequate Model ,58 0, Inadequate Model ,08 0, Inadequate Model ,08 0, Inadequate Model ,07 0, Inadequate Model ,81 0, Inadequate Model ,09 0, Inadequate Model ,43 0, Inadequate Model ,45 0, Inadequate Model ,73 0, Inadequate Model ,13 0, Inadequate Model ,92 0, Inadequate Model ,41 0, Inadequate Model ,79 0, Inadequate Model ,50 0, Inadequate Model NCSS 2001:n tulostus mallille ARIMA(0,0,1,0,11,0) (mukana havainnot vuosilta ): Autocorrelation Plot Section 1,0 Autocorrelations of Residuals Autocorrelations 0,5 0,0-0,5-1,0 0,0 12,3 24,5 36,8 49,0 Lag Portmanteau Test Section C5-MEAN Portmanteau Prob Lag DF Test Value Level Decision (0.05) 2 1 1,70 0, Adequate Model 3 2 1,96 0, Adequate Model 4 3 5,68 0, Adequate Model 5 4 6,12 0, Adequate Model 15
16 6 5 6,39 0, Adequate Model 7 6 6,67 0, Adequate Model 8 7 9,53 0, Adequate Model 9 8 9,55 0, Adequate Model ,47 0, Adequate Model ,24 0, Adequate Model ,28 0, Adequate Model ,55 0, Adequate Model ,04 0, Adequate Model ,52 0, Adequate Model ,90 0, Adequate Model ,45 0, Adequate Model ,81 0, Adequate Model ,85 0, Adequate Model ,57 0, Adequate Model ,21 0, Adequate Model ,52 0, Adequate Model ,49 0, Inadequate Model ,82 0, Inadequate Model ,35 0, Inadequate Model ,77 0, Inadequate Model ,87 0, Inadequate Model ,13 0, Inadequate Model ,27 0, Adequate Model ,76 0, Adequate Model ,45 0, Adequate Model ,31 0, Adequate Model ,90 0, Adequate Model ,65 0, Inadequate Model ,68 0, Adequate Model ,99 0, Adequate Model ,15 0, Adequate Model ,68 0, Adequate Model ,79 0, Adequate Model ,47 0, Adequate Model ,39 0, Adequate Model ,48 0, Adequate Model ,69 0, Adequate Model ,78 0, Adequate Model ,82 0, Adequate Model ,91 0, Adequate Model ,95 0, Adequate Model ,95 0, Adequate Model 16
Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus
MS-C2128 Ennustaminen ja aikasarja-analyysi 5. harjoitukset / Tehtävät Kotitehtävät: 2 Aihe: ARMA-mallit Viikon 5 harjoituksissa käytämme samoja aikasarjoja kuin viikolla 4. Tehtävä 5.1. Tarkastellaan
Lisätiedot4. Tietokoneharjoitukset
4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume
Lisätiedot4. Tietokoneharjoitukset
4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume
LisätiedotDynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
LisätiedotARMA mallien ominaisuudet ja rakentaminen
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Viikko 4: 1 ARMA-mallien ominaisuudet 1 Stationaaristen
LisätiedotMS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä
MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä Tehtävä 4.1. Ncss-ohjelmiston avulla on generoitu AR(1)-, AR(2)-, MA(1)- ja MA(2)-malleja vastaavia aikasarjoja erilaisilla parametrien arvoilla.
LisätiedotARMA mallien ominaisuudet ja rakentaminen
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Viikko 4: 1 ARMA-mallien ominaisuudet 1 Stationaaristen
LisätiedotHarjoitus 7 : Aikasarja-analyysi (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitus 7 : Aikasarja-analyysi (Palautus 28.3.2017) Tämän harjoituskerran tarkoitus on perehtyä
LisätiedotIlkka Mellin Aikasarja-analyysi ARMA-mallit
Ilkka Mellin Aikasarja-analyysi ARMA-mallit TKK (c) Ilkka Mellin (007) 1 ARMA-mallit >> ARMA-mallit ja niiden ominaisuudet ARMA-mallien auto- ja osittaisautokorrelaatiofunktiot ARMA-mallien spektri ARMA-mallien
Lisätiedot3. Tietokoneharjoitukset
3. Tietokoneharjoitukset Aikasarjan logaritmointi Aikasarjoja analysoidaan usein logaritmisessa muodossa. Asialooginen perustelu logaritmoinnille: Muuttujan arvojen suhteelliset muutokset ovat usein tärkeämpiä
LisätiedotStationaariset stokastiset prosessit ja ARMA-mallit
Stationaariset stokastiset prosessit ja ARMA-mallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016) Tavoitteet (teoria): Hahmottaa aikasarjan klassiset komponentit ideaalisessa tilanteessa. Ymmärtää viivekuvauksen vaikutus trendiin. ARCH-prosessin
LisätiedotARMA mallien rakentaminen, johdatus dynaamisiin regressiomalle
ARMA mallien rakentaminen, johdatus dynaamisiin regressiomalleihin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotIdentifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
LisätiedotTyö 2: 1) Sähkönkulutuksen ennustaminen SARIMAX-mallin avulla 2) Sähkön hankinnan optimointi
Ma-2.3132 Syseemianalyysilaboraorio I Työ 2: 1) Sähkönkuluuksen ennusaminen SARIMAX-mallin avulla 2) Sähkön hankinnan opimoini 1 yö 2 Aikasarjamalli erään yriyksen sähkönkuluukselle SARIMAX-malli: kausivaihelu,
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) Tavoitteet (teoria): Hallita multinormaalijakauman määritelmä. Ymmärtää likelihood-funktion ja todennäköisyystiheysfunktion ero. Oppia kirjoittamaan
LisätiedotARMA mallien rakentaminen, Kalmanin suodatin
ARMA mallien rakentaminen, Kalmanin suodatin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016
Lisätiedot8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH
8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH Osa aikasarjoista kehittyy hyvin erityyppisesti erilaisissa tilanteissa. Esimerkiksi pörssikurssien epävakaus keskittyy usein lyhyisiin
LisätiedotAikasarjamallit. Pekka Hjelt
Pekka Hjelt Aikasarjamallit Aikasarja koostuu järjestyksessä olevista havainnoista, ja yleensä se on tasavälinen ja diskreetti eli havaintopisteet ovat erillisiä. Lisäksi aikasarjassa on yleensä autokorrelaatiota
LisätiedotTyövoiman tarpeen ennustaminen SARIMA-aikasarjamallilla
Aalto-yliopisto Perustieteiden korkeakoulu Teknillisen fysiikan ja matematiikan tutkinto-ohjelma Työvoiman tarpeen ennustaminen SARIMA-aikasarjamallilla Kandidaatintyö 27.5.2015 Touko Väänänen Työn saa
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotKertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: Yleinen lineaarinen malli 1 Määritelmä
LisätiedotSTOKASTISET PROSESSIT
TEORIA STOKASTISET PROSESSIT Satunnaisuutta sisältävän tapahtumasarjan kulkua koskevaa havaintosarjaa sanotaan aikasarjaksi. Sana korostaa empiirisen, kokeellisesti havaitun tiedon luonnetta. Aikasarjan
LisätiedotTiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan pituus. Intelin osakekurssi. (Pörssi-) päivä n = 20 Intel_Volume. Auringonpilkkujen määrä
MS-C2128 Ennustaminen ja aikasarja-analyysi 4. harjoitukset / Tehtävät Kotitehtävät: 3, 5 Aihe: ARMA-mallit Tehtävä 4.1. Tutustu seuraaviin aikasarjoihin: Tiedosto Muuttuja Kuvaus Havaintoväli Aikasarjan
LisätiedotIlkka Keskiväli Kiinan energiankäytön aikasarja-analysointi
PRO GRADU -TUTKIELMA Ilkka Keskiväli Kiinan energiankäytön aikasarja-analysointi TAMPEREEN YLIOPISTO Informaatiotieteiden yksikkö Tilastotiede Joulukuu 2012 2 Tampereen yliopisto Informaatiotieteiden yksikkö
LisätiedotKertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Viikko 1: Yleinen lineaarinen malli 1 Määritelmä
LisätiedotIdentifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotVastaavasti voidaan määritellä korkeamman kertaluvun autoregressiiviset prosessit.
Autokovarianssi: (kun τ 0) Γ t (τ) = E[(X t µ t )(X t τ µ t τ )] ( ) ( = E[ φ k ε t k φ j ε t τ j )] = = j=0 φ j+k E[ε t k ε t τ j ] k,j=0 φ j+k σ 2 δ k,τ+j k,j=0 = σ 2 φ j+k δ k,τ+j = = k,j=0 φ τ+2j I
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet
LisätiedotARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon
TAMPEREEN YLIOPISTO Pro gradu -tutkielma Laura Lizana Bister ARIMA- ja GARCH-mallit sekä mallin sovittaminen osakeaineistoon Informaatiotieteiden laitos Matematiikka Syyskuu 2011 Tampereen yliopisto Informaatiotieteiden
LisätiedotLaboratoriotyö 2: Sähkönkulutuksen ennustaminen ja hankinnan optimointi
MS-C2132 Systeemianalyysilaboratorio I Laboratoriotyö 2: Sähkönkulutuksen ennustaminen ja hankinnan optimointi Aikasarja on joukko peräkkäisiä, toisistaan riippuvia havaintoja. Aikasarja-analyysin tavoitteena
LisätiedotMS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely
MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Aikataulu ja suoritustapa (Katso MyCourses) Luennot
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
LisätiedotKuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t
Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Valkoinen kohina ε t 2 1 0 1 2 Voimme tehdä saman laskun myös yleiselle välille [ a, a], missä 0 < a
LisätiedotIdentifiointiprosessi II
Identifiointiprosessi II Kertaus: informaatiokriteerit ja selittäjien testaaminen Mallin validointi Filosofisia mallinnusnäkökulmia Informaatiokriteerit Hyvyyskriteerin optimiarvo vs. parametrien lukumäärä
LisätiedotErikoistyö: Alkoholin kulutusmenojen ennustaminen
Erikoistyö: Alkoholin kulutusmenojen ennustaminen Tekijä: Mikko Nordlund 49857B mikko.nordlund@hut.fi Ohjaaja: Ilkka Mellin Jätetty: 11.12.2003 Sisällysluettelo 1. JOHDANTO... 3 2. MALLIEN TUTKIMINEN...
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
Lisätiedotxi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
Lisätiedot6.5.2 Tapering-menetelmä
6.5.2 Tapering-menetelmä Määritelmä 6.7. Tapering on spektrin estimointimenetelmä, jossa estimaattori on muotoa f m (ω) = 1 m ( ) k w 2π m Γ(k)e ikω, k= m missä Γ on otosautokovarianssifunktio ja ikkunafunktio
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
LisätiedotLaskuharjoitus 9, tehtävä 6
Aalto-yliopiston perustieteiden korkeakoulu Jouni Pousi Systeemianalyysin laboratorio Mat-2.4129 Systeemien identifiointi Laskuharjoitus 9, tehtävä 6 Tämä ohje sisältää vaihtoehtoisen tavan laskuharjoituksen
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotTestaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.
Mat-.103 Koesuunnittelu ja tilastolliset mallit Harjoitus 8, kevät 004 Esimerkkiratkaisut. 1. Myrkyllistä ainetta oli kaadettu jokeen, joka johtaa suurelle kalastusalueelle. Tie- ja vesirakennusinsinöörit
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
LisätiedotVARIANSSIANALYYSI ANALYSIS OF VARIANCE
VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.
LisätiedotIlkka Mellin Aikasarja-analyysi Stationaariset stokastiset prosessit
Ilkka Mellin Aikasarja-analyysi Stationaariset stokastiset prosessit TKK (c) Ilkka Mellin (2007) 1 Stationaariset stokastiset prosessit >> Stationaariset stokastiset prosessit Integroituvuus Korrelaatiofunktioiden
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
LisätiedotLaboratoriotyö 2: Sähkönkulutuksen ennustaminen ja hankinnan optimointi
MS-C2132 Systeemianalyysilaboratorio I Laboratoriotyö 2: Sähkönkulutuksen ennustaminen ja hankinnan optimointi Aikasarja on joukko peräkkäisiä, toisistaan riippuvia havaintoja. Aikasarja-analyysin tavoitteena
LisätiedotKoska Box Jenkins-malleja on käsitelty kurssilla Mat-2.3128 Ennustaminen ja aikasarjaanalyysi, ei työohjeessa esitellä ARIMA-mallien perusasioita.
Mat-2.3132 Systeemianalyysilaboratorio I Laboratoriotyö 2: Aikasarja-analyysi Aikasarja on joukko peräkkäisiä, toisistaan riippuvia havaintoja. Aikasarja-analyysin tavoitteena on kuvata, selittää, ennustaa
LisätiedotOdotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
LisätiedotEnnustaminen ARMA malleilla ja Kalmanin suodin
Ennustaminen ARMA malleilla ja Kalmanin suodin MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
Lisätiedot1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
Lisätiedot3. Teoriaharjoitukset
3. Teoriaharjoitukset Demotehtävät 3.1 a Olkoot u ja v satunnaumuuttujia, joilla on seuraavat ominaisuudet: E(u = E(v = 0 Var(u = Var(v = σ 2 Cov(u, v = E(uv = 0 Näytä että deterministinen prosessi. x
LisätiedotDynaamisten systeemien identifiointi 1/2
Dynaamisten systeemien identifiointi 1/2 Mallin rakentaminen mittausten avulla Epäparametriset menetelmät: tuloksena malli, joka ei perustu parametreille impulssi-, askel- tai taajusvaste siirtofunktion
Lisätiedot6. Tietokoneharjoitukset
6. Tietokoneharjoitukset 6.1 Tiedostossa Const.txt on eräällä Yhdysvaltalaisella asuinalueella aloitettujen rakennusurakoiden määrä kuukausittain, aikavälillä 1966-1974. Urakoiden määrä on skaalattu asuinalueen
LisätiedotTA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET
TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen
LisätiedotTilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
LisätiedotJos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
LisätiedotMS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely
MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Aikataulu ja suoritustapa (Katso MyCourses) Luennot
LisätiedotTilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotEstimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio
17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla
LisätiedotAalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,
Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten
LisätiedotMS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely
MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Aikataulu ja suoritustapa (Katso MyCourses) Luennot
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
Lisätiedot4.0.2 Kuinka hyvä ennuste on?
Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki
LisätiedotAki Taanila YHDEN SELITTÄJÄN REGRESSIO
Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...
LisätiedotAvaruussää ja Auringon aktiivisuusjakso: Aurinko oikuttelee
Avaruussää ja Auringon aktiivisuusjakso: Aurinko oikuttelee Reko Hynönen Teoreettisen fysiikan syventävien opintojen seminaari / Kevät 2012 26.4.2012 1 Ekskursio avaruussäähän 1. Auringonpilkkusykli 2.
LisätiedotSisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9
LisätiedotGripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta
MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,
Lisätiedot¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.
10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn
LisätiedotAki Taanila AIKASARJAENNUSTAMINEN
Aki Taanila AIKASARJAENNUSTAMINEN 26.4.2011 SISÄLLYS JOHDANTO... 1 1 AIKASARJA ILMAN SYSTEMAATTISTA VAIHTELUA... 2 1.1 Liukuvan keskiarvon menetelmä... 2 1.2 Eksponentiaalinen tasoitus... 3 2 AIKASARJASSA
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
LisätiedotHAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
Lisätiedot2. Tietokoneharjoitukset
2. Tietokoneharjoitukset Demotehtävät 2.1 Jatkoa kotitehtävälle. a) Piirrä aineistosta pistediagrammi (KULUTUS, SAIRAST) ja siihen estimoitu regressiosuora. KULUTUS on selitettävä muuttuja. b) Määrää estimoidusta
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
Lisätiedot2. TILASTOLLINEN TESTAAMINEN...
!" # 1. 1. JOHDANTO... 3 2. 2. TILASTOLLINEN TESTAAMINEN... 4 2.1. T-TESTI... 4 2.2. RANDOMISAATIOTESTI... 5 3. SIMULOINTI... 6 3.1. OTOSTEN POIMINTA... 6 3.2. TESTAUS... 7 3.3. TESTIEN TULOSTEN VERTAILU...
LisätiedotMTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)
21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.
LisätiedotVALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
LisätiedotTIE- JA VESIRAKENNUSHALLITUS TUTKIMUSKESKUS INSINÖÖRITOIMISTO PENTTI POLVINEN KY TVH HELSINKI ii / / / - 1)
2400 / - 1) ii / / Tammi Helmi Maalis Huhti Touko KesA HelnA Elo Syys Loka Marras Joulu LIIKENNEONNETTOMUUKSIEN AIKASARJA- ENNUSTE VUODELLE 1989 TIE- JA VESIRAKENNUSHALLITUS TUTKIMUSKESKUS INSINÖÖRITOIMISTO
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotKeskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)
Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista
LisätiedotHarha mallin arvioinnissa
Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Lisätiedot