Luottoluokitusten siirtymätodennäköisyyksien estimointi ja kalibrointi

Samankaltaiset tiedostot
Luottoluokitusten siirtymätodennäköisyyksien estimointi ja kalibrointi

Optimaalisen tarkastusvälin määrittäminen suun terveydenhuollossa

Rahastosalkun faktorimallin rakentaminen

Tieverkon kunnon stokastinen ennustemalli ja sen soveltaminen riskienhallintaan

Harjoitus 2: Matlab - Statistical Toolbox

805306A Johdatus monimuuttujamenetelmiin, 5 op

Tehokkaiden strategioiden identifiointi vakuutusyhtiön taseesta

Luottoluokitusten siirtymätodennäköisyyksien estimointi ja kalibrointi

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Osa 2: Otokset, otosjakaumat ja estimointi

Projektisuunnitelma Korrelaatioiden ja varianssin estimointi kiinteistöportfolion tuotolle

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

pitkittäisaineistoissa

Sovellettu todennäköisyyslaskenta B

Tehokkaiden strategioiden identifiointi vakuutusyhtiön taseesta

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tieverkon kunnon stokastinen ennustemalli ja sen soveltaminen riskienhallintaan

1. Projektin status. 1.1 Tavoitteiden päivitys. 1.2 Tulokset Mallinnus

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Dynaaminen allokaatio ja riskibudjetointi sijoitusstrategioissa

Estimointi. Vilkkumaa / Kuusinen 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Korko-optioiden volatiliteettirakenteen estimointi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

11. laskuharjoituskierros, vko 15, ratkaisut

pitkittäisaineistoissa

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Mat Tilastollisen analyysin perusteet, kevät 2007

Vapaapäivien optimointi

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Kuljetustoimintojen resurssointi häiriötilanteissa Projektisuunnitelma

Mat Operaatiotutkimuksen projektityöseminaari. Dynaaminen kimppakyytijärjestelmä Uudellamaalla. Väliraportti

Mat Tilastollisen analyysin perusteet, kevät 2007

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Yleistetyistä lineaarisista malleista

tilastotieteen kertaus

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Junien peruuntumistodennäköisyyksien hyödyntäminen veturinkuljettajien työvuoroluetteloiden suunnittelussa Väliraportti

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Verkkopelipalvelujen reaaliaikainen hinnoittelu

2009 Mat Operaatiotutkimuksen Projektityöseminaari L

4. Tietokoneharjoitukset

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Laskuharjoitus 9, tehtävä 6

Tilastollinen aineisto Luottamusväli

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

4. Tietokoneharjoitukset

6. laskuharjoitusten vastaukset (viikot 10 11)

Projektisuunnitelma: Jokisysteemin vesivoimatuotannon simulointi

MS-E2177 Operaatiotutkimuksen projektityöseminaari 2016

Sovellettu todennäköisyyslaskenta B

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Mallipohjainen klusterointi

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Korko optioiden volatiliteettirakenteen estimointi

Tilastotieteen aihehakemisto

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Huutokauppamekanismien arviointi infrastruktuurin korjausinvestointien hankinnassa

9. Tila-avaruusmallit

Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Dynaamiset regressiomallit

Maximum likelihood-estimointi Alkeet

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

SGN-4200 Digitaalinen Audio Harjoitustyö-info

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Männyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto

5.6.3 Matematiikan lyhyt oppimäärä

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Gaussiset prosessit derivaattahavainnoilla regressio-ongelmassa (valmiin työn esittely)

Asiakasarvon määrittäminen päivittäistavarakaupassa

Todennäköisyyden ominaisuuksia

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Identifiointiprosessi

Lääkintähelikopterikaluston mallintaminen

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Harjoitus 7: NCSS - Tilastollinen analyysi

Menetelmä Markowitzin mallin parametrien estimointiin (valmiin työn esittely)

1. Tilastollinen malli??

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE

Mat Operaatiotutkimuksen projektityöseminaari Viestiverkon toimintaluotettavuuden arviointi Väliraportti

Tulosrahoitusmittaristo ennen ja nyt mittariston ominaisuudet

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

Transkriptio:

Aalto-yliopisto Mat-2.4177 Operaatiotutkimuksen projektityöseminaari Kevät 2012 Luottoluokitusten siirtymätodennäköisyyksien estimointi ja kalibrointi Väliraportti 12.4.2012 Janne Kunnas (projektipäällikkö) Tuomas Nikoskinen Joonas Parjanne Raul Kleinberg Mikko Kotilainen

1. Projektin eteneminen Projekti on edennyt hyvin suunnitelman mukaan. Erona alkuperäiseen suunnitelmaan on se, että kirjallisuuskatsaus ei ole vielä valmis, mutta sovellettavien mallien osalta ollaan aikataulusta edellä. Transitiomatriisin kalibrointi on suoritettu suhdannemallilla ja tulosten analysointi valmistunee aikataulusta kaksi viikkoa etuajassa. Tulosten analysoinnin osalta on varauduttava suunniteltua suurempaan työmäärään, koska käytettyjen mallien, suhdannemalli ja sekoitemalli, tulosten vertailu voi olla hankalaa, perustelut esitetty kappaleessa 4 Riskit. Suurin osa jäljellä olevista tehtävistä on loppuraportin kirjoittamista. 1.1. Työnjako Projektiryhmä on jaettu kahteen eri ryhmään. Ensimmäisessä ryhmässä on Janne, Joonas ja Mikko, jotka ovat kehittäneet suhdannemallia. Suhdannemalli on tässä vaiheessa projektia validointivaiheessa ja jäljellä on mallin kehittämisen osalta enää lopullisen transitiomatriisin vertailu sekoitemallin tuottaman transitiomatriisin kanssa. Sekoitemalliryhmään kuuluu Tuomas ja Raul. Loppuraportin vastuualueet ja arvioidut työmäärät on esitelty taulukossa 1. Taulukko 1. Projektin tehtävien jako loppuraportin osalta. TEHTÄVÄ TEKIJÄT TYÖMÄÄRÄ (sivua) Johdanto Raul 1 Ongelman määrittely Tuomas 2 Kirjallisuuskatsaus Mikko, Janne, Joonas 3 1.2. Aikataulu Menetelmät Tuomas, Raul, Janne, Joonas 4 Mallin valinta Joonas 2 Datan analysointi Tuomas, Raul 5 Estimointi suhdannemallilla Janne, Joonas 4 Estimointi sekoitemallilla Tuomas, Raul 4 Tulokset Joonas 2 Pohdinnat Kaikki 2 Projektin päivitetty aikataulu on esitetty taulukossa 2. Taulukon oikeassa reunassa oleva tyhjä viikko on jätetty pelivaraa varten. Tarkoitus olisi saada projekti valmiiksi viikolla 18. Loppuraportin palautuksen takaraja on viikolla 19. Suorittamattomia tehtäviä ovat vielä kirjallisuuskatsaus, tulosten Kunnas, Kleinberg, Kotilainen, Parjanne, Nikoskinen 1

analysointi sekä loppuraportin kirjoittaminen. Näistä tehtävistä kaikki on aloitettu jo sekä vastuualueet jaettu jokaiselle ryhmän jäsenelle. Taulukko 2. Projektin aikataulu ja suoritetut tehtävät. TEHTÄVÄ Työn suunnittelu Lähdemateriaalin keräys Lähdemateriaalin läpikäyminen HELMIKUU MAALISKUU HUHTIKUU TOUKO SUUNNITELMA VÄLIRAPORTTI LOPPURAPORTTI Projektisuunnitelma Mallivaihtoehtojen tutkiminen Mallien valinta Kirjallisuuskatsaus Transitiomatriisin estimointi Mallien validointi Väliraportti Transitiomatriisin kalibrointi Tulosten analysointi Loppuraportti 2. Suhdannemalli Olemme toteuttaneet Matlabilla toimintasuunnitelman mukaisesti mallin, joka huomioi suhdannevaihteluiden vaikutuksen luottoluokitusten transitiotodennäköisyyksien estimoinnissa. Mallissa liitetään kuhunkin luottoluokitukseen i standardinormaalijakaumaa noudattava satunnaismuuttuja, luottopistemäärä seuraavana vuonna (kuva 1). Tämän mielekkyyttä voidaan tarkastella sovittamalla normaalijakauma transitiomatriisin riviin i. Jakauma voidaan osittaa eri luottoluokituksiin j siirtymistä vastaaviin osiin, joiden todennäköisyydet ovat transitiomatriisin alkiot pp iiii. Kuva 1. Tulevan luottopistemäärän normaalijakauma ja eri luokkiin siirtymistä vastaavat osat luokalle BBB. Usein suhdannevaihtelujen vaikutuksen arvioimiseksi Kunnas, Kleinberg, Kotilainen, Parjanne, Nikoskinen 2

tarkastellaan keskinkertaisia luottoluokkia, joihin suhdannevaihtelut usein vaikuttavat selvemmin kuin korkeisiin luottoluokkiiin. Myös normaalijakaumaoletus toimii parhaiten keskinkertaisille luottoluokille. Suhdannealli kuvaa, kuinka maksuhäiriöön johtavan luottopistemäärän kynnysarvo riippuu edeltävän ajanhetken makrotaloudellisista tilastoluvuista ja saa transitiotodennäköisyydet heilahtelemaan suhdannevaihteluiden mukana. Olemme yllä kuvattua mallia käyttäen laskeneet ennusteen vuoden 2012 transitiotodennäköisyysmatriisille. Käytimme regressiomallissa selittävinä muuttujina Tilastokeskuksen kuluttajahintaindeksi- ja työttömyysastelukuja, sillä näitä käyttäen saatiin regressiomallille korkein selitysaste. Merkittävin haaste suhdannemalliin liittyen on vähäisella datalla pärjääminen. Datan vähäisyyden vuoksi mallimme selitysaste uhkaa jäädä alhaiseksi. Yritämme selvittää mahdollisuuksia saada toimeksiantajalta lisää dataa tai keksiä järkeviä tapoja hyödyntää ulkopuolista dataa kuten Tilastokeskuksen konkurssidataa 1994-2011. Mallin verifioimiseksi voidaan esimerkiksi ennustaa 2011 transitiomatriisi sitä aiemmasta datasta huomioiden suhdannevaihtelu ja verrata ennustetta toteutuneeseen. Tällöin datan vähäisyys kuitenkin korostuu entisestään. Mallia tulisi lisäksi verrata myös kehittämäämme sekoitetemalliin. Lisäksi tulisi suorittaa herkkyysanalyysi suhdannemallin estimoinnissa käytetyille parametrelle. 3. Sovitemalli 3.2. Mallin konstruoinnin eteneminen Projektisuunnitelmassa sovitemallin lähtökohdaksi asetettiin todennäköisyysjakauman sovittaminen suoraan aiheenasettajan aineistosta laskettujen luottoluokitusten siirtymäfrekvensseihin. Kuvassa 2 on esitetty pääpiirteittäin kuinka sovitemallin konstruointi on edennyt lähtötilanteesta sekoitemallin löytämiseen. Kuva 2. Sovitemallin konstruoinnin eteneminen. Kunnas, Kleinberg, Kotilainen, Parjanne, Nikoskinen 3

Ensimmäinen kokeiluluontoinen idea oli sovittaa yhteisjakauma siirtymäfrekvensseihin kokeillen sekä parametrisia että ei-parametrisia malleja. Ongelmaksi tässä lähestymistavassa muodostui havaintojen vähyys sekä niiden jakautumien pieneen määrään diskreettejä pisteitä (luottoluokitusluokat). Yhteisjakaumaan pohjautuvasta lähestymistavasta päätettiin luopua siihen liittyvien ongelmien ja haasteiden vuoksi. Luonnollinen seuraavana askel oli ehdollistaa siirtymätodennäköisyysjakaumat luottoluokituskohtaisiksi, jolloin kunkin luokan siirtymille estimoidaan oma yksiulotteinen todennäköisyysjakauma. Näiden jakaumien haluttiin muistuttavan kvalitatiivisilta ominaisuuksiltaan tarkasteltavaa aineistoa sekä olevan samasta jakaumaperheestä. Visuaalisen tarkastelun perusteella todettiin, että normaali- ja t-jakauma täyttävät sovitettaville jakaumille asetetut kriteerit, jos tavanomaisten koko reaaliakselin yli määritettyjen jakauman sijaan käytetään nk. typistettyä jakaumaa, joka on rajoitettu annetulle intervallille (jolla luottoluokat on määritelty). Lisäksi, koska molemmat sovitettavat jakaumat ovat jatkuvia ja havainnot diskreettejä, päätettiin estimoinnin robustisuuden vuoksi hajauttaa havaintoja. Typistettyjen jakaumien avulla saatiin estimoitua varsin järkevänoloisia siirtymäjakaumia. Estimaateissa oli kauttaaltaan kuitenkin ongelmana, että todennäköisyys, jolla siirtymää ei tapahtunut ( pysytään samassa luokassa ), oli aivan liian pieni. Tämä ilmiö selittyy ennen kaikkea sillä, että aineisto koostuu havainnoista, jotka on kerätty melko volatiilin periodin aikana, jolloin havaintoja luokituksen muuttumisesta on suhteessa enemmän kuin havaintoja sen pysymisestä samana. Huipukkuusongelman pienentämiseksi päätettiin hyödyntää ulkopuolisen luottoluokittajan (Fitch) tarjoamaa pitkältä aikaväliltä estimoitua keskimääräistä transitiomatriisia, jonka implikoimat luokittaiset transitiotodennäkäköisyys-jakaumat ovat huipukkaita. Hakemalla painotettu keskiarvo näistä huipukkaista jakaumista ja lasketuista estimaateista saadaan muodostettua sekamalli, joka yhdistää pitkän aikavälin keskiarvon ja viimeisimmät havainnot luottoluokitustransitioista lyhyeltä aikaväliltä. 3.3. Sekoitemalli Sekoitemallin perusideana on mallintaa luottoluokitusten siirtymätodennäköisyyksiä ehdollisten luokituskohtaisten todennäköisyysjakaumien avulla. Kullekin luokalle i estimoidaan todennäköisyysjakauma, joka antaa siirtymä-todennäköisyydet eri luottoluokkien välillä sekä todennäköisyyden siirtyä maksuhäiriöluokkaan. Nämä todennäköisyysjakaumat muodostetaan luokkakohtaisina sekoitemalleina, joissa aiheenasettajan aineistosta estimoidut jakaumat yhdistetään ulkopuolisen luottoluokittajan (Fitch) aineistosta estimoituihin vastaavan luokan jakaumiin. Aiheenasettajan aineistosta luokkakohtaisiksi todennäköisyysjakaumiksi siirtymille estimoidaan typistetty normaali- ja t-jakauma. Näistä Kunnas, Kleinberg, Kotilainen, Parjanne, Nikoskinen 4

jakaumatyypeistä valitaan lopulta validoinnin perusteella aineistoa paremmin kuvaava jakauma. Koska molemmat tarkasteltavat jakaumat ovat jatkuvia, hajautamme hieman luokkakohtaisia diskreettejä havaintoja, jotta havaintopisteitä saadaan enemmän estimointia varten. Hajautuksen vaikutusta estimointiin tullaan tarkastelemaan tarkemmin validoinnin yhteydessä. Lopullinen diskreetti transitiojakauma muodostetaan jatkuvasta jakaumasta kertymäfunktion avulla. Ulkopuolisen luokittajan aineisto koostuu pelkästään frekventisesti lasketuista transitiotodennäköisyyksistä luokkien välillä (ei sisällä informaatiota havaintomääristä). Tämän vuoksi diskreetteinä transitiojakaumina käytetään suoraan transitiomatriisin rivejä. 3.4. Nykytila ja tulevaisuus Sovitemallin lopulliseksi muodoksi on valittu yllä kuvattu sekoitemalli. Tämä malli on kokonaisuudessaan toteutettu ja työskentely painottuu sillä saatujen tulosten analysointiin, validointiin ja vertailuun suhdannemallin kanssa. Lopullisen mallinvalinnan kannalta on ratkaistavana vielä muutamia relevantteja kysymyksiä Valitaanko sekoitemallissa käytettäväksi jakaumaksi typistetty normaalijakauma vai typistetty t-jakauma? Saadaanko datan hajauttamisella lisäarvoa sekoitemalliin? Mitä painokerrointa käytetään sekoitemallin komponenttien yhdistämisessä ja miten painokerroin tulisi valita? 4. Riskit Projektisuunnitelmassa arviomme, että datan laatu sekä estimointimallien sovellettavuus saattavat osoittautua suurella todennäköisyydellä haasteellisiksi. Suhdannevaihtelun osalta data on riittämätön. Tämän ongelman olemme ratkaisseet käyttämällä suhdanneindikaattorin implementoinnissa Tilastokeskuksen tarjoamaa makrodataa. Malleista bayesialainen osoittautui sen verran haasteelliseksi, että sen käsittelyssä tyydytään vain mallin esittelyyn, eikä sitä sovelleta aiheen asettajan aineistoon. Päivitetyt riskit on esitetty taulukossa 3. Uutena tunnistettuna riskinä on kahden eri mallien tuottamien transitiomatriisien vertailtavuus. Koska estimointimallit, sekoitemalli ja suhdannemalli, ovat lähtökohtaisesti menetelmiltään hyvin erilaiset, on niiden tuottamien tulosten vertailu keskenään vaikeaa. Loppuraportissa tarkoituksena on vertailla mallien tuottamia transitiomatriiseja yksinkertaisen Markov-mallin avulla estimoituun transitiomatriisiin. Kunnas, Kleinberg, Kotilainen, Parjanne, Nikoskinen 5

Taulukko 3. Projektin riskit. RISKI TODENNÄKÖISYYS VAIKUTUS TOIMENPITEET Datan laatu korkea korkea -Käytetään dataa myös ulkoisista lähteistä: Fitch, Moody's, Tilastokeskus Työmäärä osoittautuu liian suureksi -Vähennetään sovellettavien mallien määrää Lopputulos ei tyydytä aiheenasettajaa -Esitetään tulokset mahdollisimman yksinkertaisesti Mallien soveltaminen osoittautuu ennakoitua haasteellisemmaksi korkea -Jätetään varhaisessa vaiheessa tarkastelun ulkopuolelle haasteellisemmat mallit Mallien tuottamien tulosten vertailu hankalaa korkea Kunnas, Kleinberg, Kotilainen, Parjanne, Nikoskinen 6