Monimuuttujamallit ja multinormaalijakauma Esitys 4 2.9.20 Antti Toppila Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki oikeuet piätetään.
Johanto Talouellisten riskitekijöien välillä on riippuvuuksia Esim. saman alan osakkeet Riippuvuuksia voiaan hyöyntää Riskin hajauttaminen Ennustetarkuuen parantaminen Datan täyentäminen Tarvitaan matemaattisia työkaluja riippuvuuksien mallintamiseen Tn B hinta alas A hinta alas A hinta ylös 0,4 0, 0,5 B hinta 0, 0,4 0,5 ylös 0,5 0,5
Monimuuttujamallit Stokastisissa malleissa rippuvuuet mallinnetaan yhteisjakaumalla Muuttujat =,..., Yhteiskertymäfunktio F P Marginaalijakauma F x ( ) T ( x) = F ( x,..., x ) = ( x) = P( x,..., x ) ( ) = P( x) = F(,...,, x,,..., ) Moniulotteinen marginaalijakauma muuttujille F ( x) = P( x ) ' i i ' Tiheysjakaumat f näien erivaattoja Olemassa jos F absoluuttisesti jatkuva i F i x ' x ( x x ) L f ( u u ) u L =,..., u,...,
Eholliset jakaumat ( ) T Olkoon = T, T 2 Muuttujien 2 ehollinen tiheysjakauma kun = on F 2 f ( x x ) 2 = ( x2, x ) ( x ) ja tätä vastaava kertymäfunktio ( x x ) 2 2 f f ( x, K, x, u, K, u ) x xk + x f k k + = L u + u k + = u = Muutujat riippumattomia jos F( x) f Lu ( ) k x ( x ) F ( x ) x = F 2 2
Jakaumien tunnuslukuja Ootusarvo Kovarianssimatriisi [ ] = ( E[ ], E[ ]) T E, cov K Kuvaa muttujien lineaarista riippuvuutta Diagonaalilla muuttujien varianssit Muut alkiot pareittaiset kovarianssit Korreloimattomille muuttujille ( ) = Σ = { σ } = E E( ) ij σ = 0 ij ( )( E( )) T ) = cov (, ) Korrelaatiomatriisi ρ = kovarianssimatriisin skaalattu versio ρ ij Alkiot välillä [-,] ( ) P σ ij täysin korreloituneet - vastakkaisesti korreloituneet i j
Jakauman karakteristinen funktio T Karakteristinen funktio on Φ t = E exp it, t R, missä i on imaginääriyksikkö ( ) ( ( ) E( Pyöritään satunnainen määrä kierroksia kompleksitason yksikköympyrällä ) Kyseessä satunnaismuuttujan jakauman Fourier-muunnos Jokainen karakteristinen funktio määrittää yksikäsitteisen kertymäfunktion ja päinvastoin Karakteristinen funktio on aina olemassa, myös kun tiheysfunktio ei ole Karakteristinen funktio ja kertymäfunktio ekvivalentit
Kovarianssin ja korrelaation estimointi (/3) Käytännössä satunnaismuuttujien jakaumat ja parametrit tuntemattomia estimaatit jakaumaparametreille Oletetaan että meillä on n havaintoa,..., n R tuntemattomasta jakaumasta jonka ootusarvo on µ ja äärellinen kovarianssimatriisi Σ Otoskeskiarvo = n n i i= Otoskovarianssi S = n n ( i )( i ) i= T
Kovarianssin ja korrelaation estimointi (2/3) Estimaattori on harhaton jos sen ootusarvo on sama kuin estimoitavan suureen Harhattomuus ei ota kantaa estimaattorin varianssiin Joskus järkevää valita harhainen estimaattori, jolla pieni varianssi Usein oleellista estimaattorin ootusarvoisen ennustusvirheen pienuus ja robustisuus atan poikkeamiin (outlier) Oletetaan että kaikki havainnot ovat samoin ja riippumattomasti jakautuneet (ii) Otoskeskiarvo harhaton estimaattori ootusarvolle Otoskovarianssi ei ole harhaton estimaattori kovarianssille n Harhaton estimaattori kovarianssille on S = S u n+
Kovarianssin ja korrelaation estimointi (3/3) Estimaattoreien muut ominaisuuet riippuvat tuntemattoman jakauman ominaisuuksista Esim. Normaalijakautuneille muuttujille on otoskeskiarvo paitsi harhaton myös suurimman toennäköisyyen (maximum likelihoo) omaava estimaattori ootusarvolle Otoskeskiarvo ja kovarianssi ovat stanariestimaattorit ootusarvolle ja kovarianssille Toisinaan oletetaan liiankin suoraviivaisesti että nämä estimaattorit ovat parhaiten soveltuvia kaikkiin tilanteisiin Vaihtoehtoisia estimaattoreita mm. aiemmassa Optimointiopin seminaarissa (Data Mining, Syksy 200)
Multinormaalijakauma ( ) T =,..., on multinormaalijakautunut jos = µ + AZ k missä A R µ R ja = Z ii N(0,) satunnaismuuttujia Ootusarvo Kovarianssi E ( ) T Z,..., [ ] = µ T ( ) = Σ = AA cov Positiivisemiefiniitti matriisi Karakteristinen funktio ( t) = exp 2 Käsittelemme jatkossa vain epäsingulaarisia jakaumia täysi ranki Z k T T ( it µ t Σt) t R Φ, Σ BiDensPlot(func=mnorm,mu= c(0,0),sigma=equicorr(2,-0.7))
Multinormaalijakauman ominaisuuksia Tiheysfunktion tasa-arvokäyrät elipsoieja Tiheysfunktio f ( x) = ( 2π ) exp{ }, / 2 / 2 2 µ Σ T ( x µ ) Σ ( x ) Olkoon ja Y multinormaalijakautuneita +Y on multinormaalijakautunut T 2 ( µ ) Σ ( µ ) on χ -jakautunut Σ on Σ eterminatti :n kaikki marginaalijakaumat ovat multinormaalijakautuneita :n kaikki eholliset jakaumat ovat multinormaalijakautuneita Jos ja Y riippumattomia, nouattaa +Y multinormaalijakaumaa, jonka ootusarvo/kovarianssi on :n ja Y:n ootusarvon/kovarianssin summa
Datan käsittely QRMlib paketilla (/2)?komento etsii komennon aputieoston library(qrmlib): lataa paketti help(package= QRMlib ): kaikki QRM-paketin aputieostot listattuna (funktiot, aikasarjat, jne.) ata(nimi) lataa työtilaan nimi-atan mk.returns(aikasarja, type= log ) tekee logaritmiset voitot aikasarjasta winow(aikasarja, from= 993-0-0, to= 2000-2-3 ) palauttaa typistetyn aikasarjan
Datan käsittely QRMlib paketilla (2/2) aggregatemonthlyseries(aikasarja, FUNC=colSums) summa voitot kuukausittaisiksi Vastaavasti viikoittainen ja kvarttaalittainen ata attributes(objekti) listaa tyhjentävästi objektin ominaisuuet names(attributes(objekti)) kertoo ominasuuksien nimet Aikasarjoilla olemassa mm. Data ominaisuus objekti@ominaisuus antaa pelkästään objektin ominaisuuen (esim. aikasarja@data antaa aikasarjan Datan) Huom. listan alkiot lista$alkionnimi (tai lista[[]])
Normaalisuusoletuksen testaus Piirretään teoreettiset ja havaitut kvanttiilit vastakkain (Quantile- Quantile-plot) Havainnot suoralla jos jakauma normaalinen Teoreettinen jakauma atan stanariestimaattoreilla Olemassa myös useita Vinous (skewness) ja huipukkuus (kurtosis) testejä Esim. shapiro.test(ata) Ks. S2-NormalTests.R ata(dj) Ret.DJ<-mk.returns(DJ) monthlyts<aggregatemonthlyseries(ret.dj) QQplot(monthlyTS[, AP ]@Data) qqline(monthlyts[, AP ]@Data) Huomaa ero qqline QQplot
Multinormaalisuuen testaus QQplot voiaan laajentaa monimuuttujamallille Esim. kirjassa ata D 2 i = T ( ) S ( ) i χ 2 Pitäisi olla noin jakautunut Havaintojen ja teoreettisen jakauman kvantiilien pitäisi asettua suoralle Myös vinous- ja huipukkuustestit olemassa Paketissa Mahalanobiksen ja Marian testit i jointnormaltest(monthlyts[,c( A P, EK )]@Data) MariaTest(monthlyTS[,c( AP, EK )]@Data)
Dow Jones 30 osakkeien normaalisuus (Kirjan esimerkki 3.3) Tutkittiin 0 kpl Dow Jones 30 ineksin osakkeen (logaritmisten) tuottojen yhteisjakauman multinormaalisuutta (ks. S2-NormalTests.R) Päivittäinen, viikottainen, kuukausittainen ja kvartaalinen ata Havaittiin että marginaalijakaumien normaalisuus- ja yhteisjakauman multinormaalisuusoletus oli pääosin hylättävä muille paitsi kvartaalittaiselle atalle Kirjan mukaan myöhemmin havaitaan että syynä on Yhteisjakauman ja marginaalijakaumien häntätoennäköisyyksillä liian pienet painot paksummat hännät Multinormaalijakauma on elliptisesti symmetrinen
Päivittäinen Viikottainen 2 D i Y-akseleilla eri atoilla lasketut kvanttiilit Kvartaalittainen Kuukausittainen
Esimerkin 3.3 Marian testitulokset n Daily 2020 Weekly 46 Monthly 96 Quarterly 32 Vinous 9.3 9.9 2.0 50.0 p 0.00 0.00 0.00 0.02 Huipukkuus 242.45 77.04 42.65 20.83 p 0.00 0.00 0.00 0.44 Marian testi hylkää empiiristen jakaumien vinouet ja huipukkuuet pl. Kvartaalittaisen huipukkuuen
Kotitehtävä Osoita käyttäen karakteristista funktiota, että satunnaisvektori = ( ) T, K, on multinormaalijakautunut jos ja vain jos a T on normaalijakautunut kaikilla a R \ { 0} Vihje: osoita ensin että Φ T a ( t) = Φ ( τ ), t R, τ = at R Käyttäen QRMlib-pakettia, muoosta DJ osakkeien AP ja DIS kvartaaliset logaritmiset tuotot vuosina 993-2000. Sovita multinormaali-jakauma (fit.normfunktio) ja piirrä tiheysfunktio. Testaa riskitekijöien normaalisuutta käyttäen QQplotia sekä yhteisjakauman multinormaalisuutta Marian ja Mahalanobiksen testeillä