Monimuuttujamallit ja multinormaalijakauma

Samankaltaiset tiedostot
Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollinen aineisto Luottamusväli

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

10 Moniulotteinen normaalijakauma

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

tilastotieteen kertaus

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Maximum likelihood-estimointi Alkeet

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

3.6 Su-estimaattorien asymptotiikka

Mat Tilastollisen analyysin perusteet, kevät 2007

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

031021P Tilastomatematiikka (5 op) viikko 4

Regressioanalyysi. Vilkkumaa / Kuusinen 1

10 Moniulotteinen normaalijakauma

Estimointi. Vilkkumaa / Kuusinen 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Regressioanalyysi. Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

2. Uskottavuus ja informaatio

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden ominaisuuksia

Satunnaismuuttujat Satunnaismuuttuja kuvaa kokeen tuloksen reaaliakselille Satunnaismuuttuja on siis funktio X(s) joka saa reaalisia arvoja Koe s

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

805306A Johdatus monimuuttujamenetelmiin, 5 op

Väliestimointi (jatkoa) Heliövaara 1

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Satunnaismuuttujien muunnokset ja niiden jakaumat

Matemaattisten tieteiden kandiohjelma / MTL Todennäköisyyslaskenta IIb Kurssikoe (kesto 2h 30 min)

Identifiointiprosessi

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Batch means -menetelmä

Tilastomatematiikka Kevät 2008

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Kopulafunktiot. Joonas Ollila 12. lokakuuta 2011

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Mat Tilastollisen analyysin perusteet, kevät 2007

Testit laatueroasteikollisille muuttujille

Generointi yksinkertaisista diskreeteistä jakaumista

2. Keskiarvojen vartailua

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Sallitut apuvälineet: kirjoitusvälineet, laskin sekä käsinkirjoitettu, A4-kokoinen lunttilappu ja MAOL taulukkokirjaa

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen päättelyn perusteet

805306A Johdatus monimuuttujamenetelmiin, 5 op

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

Moniulotteiset satunnaismuuttujat ja jakaumat

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

6. laskuharjoitusten vastaukset (viikot 10 11)

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Testejä suhdeasteikollisille muuttujille

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

HAVAITUT JA ODOTETUT FREKVENSSIT

2. Multinormaalijakauma

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

ARMA mallien ominaisuudet ja rakentaminen

11 Raja-arvolauseita ja approksimaatioita

4.2.2 Uskottavuusfunktio f Y (y 0 X = x)

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Transkriptio:

Monimuuttujamallit ja multinormaalijakauma Esitys 4 2.9.20 Antti Toppila Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki oikeuet piätetään.

Johanto Talouellisten riskitekijöien välillä on riippuvuuksia Esim. saman alan osakkeet Riippuvuuksia voiaan hyöyntää Riskin hajauttaminen Ennustetarkuuen parantaminen Datan täyentäminen Tarvitaan matemaattisia työkaluja riippuvuuksien mallintamiseen Tn B hinta alas A hinta alas A hinta ylös 0,4 0, 0,5 B hinta 0, 0,4 0,5 ylös 0,5 0,5

Monimuuttujamallit Stokastisissa malleissa rippuvuuet mallinnetaan yhteisjakaumalla Muuttujat =,..., Yhteiskertymäfunktio F P Marginaalijakauma F x ( ) T ( x) = F ( x,..., x ) = ( x) = P( x,..., x ) ( ) = P( x) = F(,...,, x,,..., ) Moniulotteinen marginaalijakauma muuttujille F ( x) = P( x ) ' i i ' Tiheysjakaumat f näien erivaattoja Olemassa jos F absoluuttisesti jatkuva i F i x ' x ( x x ) L f ( u u ) u L =,..., u,...,

Eholliset jakaumat ( ) T Olkoon = T, T 2 Muuttujien 2 ehollinen tiheysjakauma kun = on F 2 f ( x x ) 2 = ( x2, x ) ( x ) ja tätä vastaava kertymäfunktio ( x x ) 2 2 f f ( x, K, x, u, K, u ) x xk + x f k k + = L u + u k + = u = Muutujat riippumattomia jos F( x) f Lu ( ) k x ( x ) F ( x ) x = F 2 2

Jakaumien tunnuslukuja Ootusarvo Kovarianssimatriisi [ ] = ( E[ ], E[ ]) T E, cov K Kuvaa muttujien lineaarista riippuvuutta Diagonaalilla muuttujien varianssit Muut alkiot pareittaiset kovarianssit Korreloimattomille muuttujille ( ) = Σ = { σ } = E E( ) ij σ = 0 ij ( )( E( )) T ) = cov (, ) Korrelaatiomatriisi ρ = kovarianssimatriisin skaalattu versio ρ ij Alkiot välillä [-,] ( ) P σ ij täysin korreloituneet - vastakkaisesti korreloituneet i j

Jakauman karakteristinen funktio T Karakteristinen funktio on Φ t = E exp it, t R, missä i on imaginääriyksikkö ( ) ( ( ) E( Pyöritään satunnainen määrä kierroksia kompleksitason yksikköympyrällä ) Kyseessä satunnaismuuttujan jakauman Fourier-muunnos Jokainen karakteristinen funktio määrittää yksikäsitteisen kertymäfunktion ja päinvastoin Karakteristinen funktio on aina olemassa, myös kun tiheysfunktio ei ole Karakteristinen funktio ja kertymäfunktio ekvivalentit

Kovarianssin ja korrelaation estimointi (/3) Käytännössä satunnaismuuttujien jakaumat ja parametrit tuntemattomia estimaatit jakaumaparametreille Oletetaan että meillä on n havaintoa,..., n R tuntemattomasta jakaumasta jonka ootusarvo on µ ja äärellinen kovarianssimatriisi Σ Otoskeskiarvo = n n i i= Otoskovarianssi S = n n ( i )( i ) i= T

Kovarianssin ja korrelaation estimointi (2/3) Estimaattori on harhaton jos sen ootusarvo on sama kuin estimoitavan suureen Harhattomuus ei ota kantaa estimaattorin varianssiin Joskus järkevää valita harhainen estimaattori, jolla pieni varianssi Usein oleellista estimaattorin ootusarvoisen ennustusvirheen pienuus ja robustisuus atan poikkeamiin (outlier) Oletetaan että kaikki havainnot ovat samoin ja riippumattomasti jakautuneet (ii) Otoskeskiarvo harhaton estimaattori ootusarvolle Otoskovarianssi ei ole harhaton estimaattori kovarianssille n Harhaton estimaattori kovarianssille on S = S u n+

Kovarianssin ja korrelaation estimointi (3/3) Estimaattoreien muut ominaisuuet riippuvat tuntemattoman jakauman ominaisuuksista Esim. Normaalijakautuneille muuttujille on otoskeskiarvo paitsi harhaton myös suurimman toennäköisyyen (maximum likelihoo) omaava estimaattori ootusarvolle Otoskeskiarvo ja kovarianssi ovat stanariestimaattorit ootusarvolle ja kovarianssille Toisinaan oletetaan liiankin suoraviivaisesti että nämä estimaattorit ovat parhaiten soveltuvia kaikkiin tilanteisiin Vaihtoehtoisia estimaattoreita mm. aiemmassa Optimointiopin seminaarissa (Data Mining, Syksy 200)

Multinormaalijakauma ( ) T =,..., on multinormaalijakautunut jos = µ + AZ k missä A R µ R ja = Z ii N(0,) satunnaismuuttujia Ootusarvo Kovarianssi E ( ) T Z,..., [ ] = µ T ( ) = Σ = AA cov Positiivisemiefiniitti matriisi Karakteristinen funktio ( t) = exp 2 Käsittelemme jatkossa vain epäsingulaarisia jakaumia täysi ranki Z k T T ( it µ t Σt) t R Φ, Σ BiDensPlot(func=mnorm,mu= c(0,0),sigma=equicorr(2,-0.7))

Multinormaalijakauman ominaisuuksia Tiheysfunktion tasa-arvokäyrät elipsoieja Tiheysfunktio f ( x) = ( 2π ) exp{ }, / 2 / 2 2 µ Σ T ( x µ ) Σ ( x ) Olkoon ja Y multinormaalijakautuneita +Y on multinormaalijakautunut T 2 ( µ ) Σ ( µ ) on χ -jakautunut Σ on Σ eterminatti :n kaikki marginaalijakaumat ovat multinormaalijakautuneita :n kaikki eholliset jakaumat ovat multinormaalijakautuneita Jos ja Y riippumattomia, nouattaa +Y multinormaalijakaumaa, jonka ootusarvo/kovarianssi on :n ja Y:n ootusarvon/kovarianssin summa

Datan käsittely QRMlib paketilla (/2)?komento etsii komennon aputieoston library(qrmlib): lataa paketti help(package= QRMlib ): kaikki QRM-paketin aputieostot listattuna (funktiot, aikasarjat, jne.) ata(nimi) lataa työtilaan nimi-atan mk.returns(aikasarja, type= log ) tekee logaritmiset voitot aikasarjasta winow(aikasarja, from= 993-0-0, to= 2000-2-3 ) palauttaa typistetyn aikasarjan

Datan käsittely QRMlib paketilla (2/2) aggregatemonthlyseries(aikasarja, FUNC=colSums) summa voitot kuukausittaisiksi Vastaavasti viikoittainen ja kvarttaalittainen ata attributes(objekti) listaa tyhjentävästi objektin ominaisuuet names(attributes(objekti)) kertoo ominasuuksien nimet Aikasarjoilla olemassa mm. Data ominaisuus objekti@ominaisuus antaa pelkästään objektin ominaisuuen (esim. aikasarja@data antaa aikasarjan Datan) Huom. listan alkiot lista$alkionnimi (tai lista[[]])

Normaalisuusoletuksen testaus Piirretään teoreettiset ja havaitut kvanttiilit vastakkain (Quantile- Quantile-plot) Havainnot suoralla jos jakauma normaalinen Teoreettinen jakauma atan stanariestimaattoreilla Olemassa myös useita Vinous (skewness) ja huipukkuus (kurtosis) testejä Esim. shapiro.test(ata) Ks. S2-NormalTests.R ata(dj) Ret.DJ<-mk.returns(DJ) monthlyts<aggregatemonthlyseries(ret.dj) QQplot(monthlyTS[, AP ]@Data) qqline(monthlyts[, AP ]@Data) Huomaa ero qqline QQplot

Multinormaalisuuen testaus QQplot voiaan laajentaa monimuuttujamallille Esim. kirjassa ata D 2 i = T ( ) S ( ) i χ 2 Pitäisi olla noin jakautunut Havaintojen ja teoreettisen jakauman kvantiilien pitäisi asettua suoralle Myös vinous- ja huipukkuustestit olemassa Paketissa Mahalanobiksen ja Marian testit i jointnormaltest(monthlyts[,c( A P, EK )]@Data) MariaTest(monthlyTS[,c( AP, EK )]@Data)

Dow Jones 30 osakkeien normaalisuus (Kirjan esimerkki 3.3) Tutkittiin 0 kpl Dow Jones 30 ineksin osakkeen (logaritmisten) tuottojen yhteisjakauman multinormaalisuutta (ks. S2-NormalTests.R) Päivittäinen, viikottainen, kuukausittainen ja kvartaalinen ata Havaittiin että marginaalijakaumien normaalisuus- ja yhteisjakauman multinormaalisuusoletus oli pääosin hylättävä muille paitsi kvartaalittaiselle atalle Kirjan mukaan myöhemmin havaitaan että syynä on Yhteisjakauman ja marginaalijakaumien häntätoennäköisyyksillä liian pienet painot paksummat hännät Multinormaalijakauma on elliptisesti symmetrinen

Päivittäinen Viikottainen 2 D i Y-akseleilla eri atoilla lasketut kvanttiilit Kvartaalittainen Kuukausittainen

Esimerkin 3.3 Marian testitulokset n Daily 2020 Weekly 46 Monthly 96 Quarterly 32 Vinous 9.3 9.9 2.0 50.0 p 0.00 0.00 0.00 0.02 Huipukkuus 242.45 77.04 42.65 20.83 p 0.00 0.00 0.00 0.44 Marian testi hylkää empiiristen jakaumien vinouet ja huipukkuuet pl. Kvartaalittaisen huipukkuuen

Kotitehtävä Osoita käyttäen karakteristista funktiota, että satunnaisvektori = ( ) T, K, on multinormaalijakautunut jos ja vain jos a T on normaalijakautunut kaikilla a R \ { 0} Vihje: osoita ensin että Φ T a ( t) = Φ ( τ ), t R, τ = at R Käyttäen QRMlib-pakettia, muoosta DJ osakkeien AP ja DIS kvartaaliset logaritmiset tuotot vuosina 993-2000. Sovita multinormaali-jakauma (fit.normfunktio) ja piirrä tiheysfunktio. Testaa riskitekijöien normaalisuutta käyttäen QQplotia sekä yhteisjakauman multinormaalisuutta Marian ja Mahalanobiksen testeillä