KiEL-kuolevuuden arviointi

Samankaltaiset tiedostot
Kuolevuusseminaari

Luento 2. Yksiparametrisia malleja. Binomi-malli. Posteriorijakauman esittämisestä. Informatiivisista priorijakaumista. Konjugaattipriori.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Kuolevuus Eläketurvakeskuksen pitkän aikavälin laskelmissa. Heikki Tikanmäki

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Bayes-mallinnus siltana teorian ja empiirisen evidenssin välillä

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

805306A Johdatus monimuuttujamenetelmiin, 5 op

TyEL-kuolevuusperusteesta

Bayesilainen päätöksenteko / Bayesian decision theory

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden ominaisuuksia

Estimointi. Vilkkumaa / Kuusinen 1

Bayesiläinen tilastollinen vaihtelu

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Väliestimointi (jatkoa) Heliövaara 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

pitkittäisaineistoissa

Monte Carlo -menetelmä optioiden hinnoittelussa (valmiin työn esittely)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.

Parametrin estimointi ja bootstrap-otanta

Tilastotieteen aihehakemisto

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Bayesiläisiä menetelmiä vakuutusyhtiöiden riskienhallinnassa

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

VÄESTÖENNUSTE

Pikajohdatus bayesilaiseen tilastoanalyysiin ja monimuuttuja-analyysiin

Tentin materiaali. Sivia: luvut 1,2, , ,5. MacKay: luku 30. Gelman, 1995: Inference and monitoring convergence

Tilastollinen päättely, 10 op, 4 ov

Mat Tilastollisen analyysin perusteet, kevät 2007

Osa 2: Otokset, otosjakaumat ja estimointi

Gaussiset prosessit derivaattahavainnoilla regressio-ongelmassa (valmiin työn esittely)

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Binomi Jacob Bernoulli ( ), Bayes ( ) Normaali de Moivre ( ), Laplace ( ), Gauss ( )

Sovellettu todennäköisyyslaskenta B

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Diskriminanttianalyysi I

DEMOGRAFIA. Arto Luoma Tampereen yliopisto, Suomi. Syksy Demografia, syksy 2015 Tampereen yliopisto 1 / 39

9. laskuharjoituskierros, vko 12-13, ratkaisut

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Mat Sovellettu todennäköisyyslasku A

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

Tutkimustiedonhallinnan peruskurssi

1. Tilastollinen malli??

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

- voidaan käyttä lisämään tieteellistä ymmärrystä ilmiöstä. - joidenkin havaittavien suureiden vaikutus voi olla paljon suurempi kuin toisten

Mitä on bayesilainen päättely?

Harjoitus 2: Matlab - Statistical Toolbox

2. Uskottavuus ja informaatio

pitkittäisaineistoissa

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

TyEL-kuolevuuden ennustamisesta SHV-työ, joulukuu LähiTapiola-ryhmä / Tuomas Hakkarainen

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Matemaatikot ja tilastotieteilijät

Tilastokeskuksen väestöennuste Kuolevuuslaskelmat. Markus Rapo, Tilastokeskus

Yleistetyistä lineaarisista malleista

VÄESTÖENNUSTE

6. laskuharjoitusten vastaukset (viikot 10 11)

Sovellettu todennäköisyyslaskenta B

tilastotieteen kertaus

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

VANTAAN VÄESTÖENNUSTE 2015 RUOTSINKIELINEN VÄESTÖ. Koko kaupungin ennuste Osa-alue-ennuste

Väestöjaotteluun perustuva ennustemalli sairauspäiväraha ja vuoden 2017 eläkeuudistuksen vaikutusten tarkastelu

Mat Tilastollisen analyysin perusteet, kevät 2007

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

Luottamusvälit. Normaalijakauma johnkin kohtaan

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Sovellettu todennäköisyyslaskenta B

Väestön ja eläkemenojen kehitys ilman suuria ikäluokkia

D ( ) E( ) E( ) 2.917

4.0.2 Kuinka hyvä ennuste on?

Työajanodotteet ja niiden erot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Epidemiologia riskien arvioinnissa

P (A)P (B A). P (B) P (A B) = P (A = 0)P (B = 1 A = 0) P (B = 1) P (A = 1)P (B = 1 A = 1) P (B = 1)

Roope Uusitalo Työeläkepäivä

KUOLEVUUSPERUSTEJAOKSEN LOPPURAPORTTI

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Teema 8: Parametrien estimointi ja luottamusvälit

Transkriptio:

KiEL-kuolevuuden arviointi Kuolevuustason arviointi pienelle populaatiolle Aktuaariyhdistyksen kuolevuusseminaari 26.5.2015 Risto Louhi

Kuolevuusselvityksen tausta KiEL-eläkemenoa ennustettaessa pitkän tähtäimen deterministisessä ennustemallinnuksessa käytetään joiltain osin suoraan VaEL:n siirtymätodennäköisyyksiä, näin oli aikaisemmin myös kuolevuuden osalta. Vuonna 2013 asiakkaan tilintarkastajan asiantuntija esitti auditoinnin yhteydessä kysymyksen siitä, tulisiko eläkemenon KiEL-mallinnuksessa käyttää mahdollisesti erillistä kuolevuutta. Asiakas pyysi meiltä myöhemmin selvityksen KiEL-kuolevuudesta. Selvitys tehtiin syksyllä 2013 ja päivitettiin lisädatalla syksyllä 2014.

Selvityksen tavoitteet, käytössä oleva data ja odotettavissa olevat ongelmat Tässä selvityksessä tavoitteena on: 1. Tutkia onko KiEL-eläkemenoa mallinnettaessa syytä siirtyä VaEL-kuolevuustodennäköisyyksistä erillisiin KiELkuolevuustodennäköisyyksiin. 2. Mikäli tällainen siirtyminen näyttää perustellulta, niin lisätavoitteena on pyrkiä arviomaan KiELlukumääräkuolevuuden taso. KiEL:n suhteellisen pienestä koosta johtuvasta satunnaishuojunnasta ja havaintojen puutteesta on odotettavissa ongelmia. Lähtötietoina on ETK:n toimittamat lakikohtaiset ikäluokittaiset kuolleet ja keskiväkiluvut

Havainnot KiEL-kuolevuudesta

Vuoden 2013 keskiväkiluku

Vuonna 2013 kuolleet

Havaitut kuolemanvaaraluvut 2008-2013, miehet

Havaitut kuolemanvaaraluvut 2008-2013, naiset

Havaittu elinajanodote 18, 50 ja 63- vuotiaina

Epävarmuus havaintojen merkityksestä

Epävarmuus epävarmuudesta Analyysia varten pitää kvantifioida myös havaintoihin liittyvä epävarmuus. Hyvin nuorten ja erittäin vanhojen ikien havainnoissa on erittäin paljon pienestä otoskoosta johtuvaa satunnaisvaihtelua. Tätä halutaan hiukan karsia, mutta kuitenkin niin, että niiden ikäluokkien osalta, joissa otoskoko on suurempi painavat varsinaiset havainnot riittävästi. Välineeksi Baysiläinen data-analyysi.

Epävarmuuden mallintaminen Melko luonnollinen mallinnus on, että sukupuolittain s, ikäluokittain x ja vuosittain v on olemassa jokin todellinen keskikuolevuus θ s,x,v ja saadut havainnot d s,x,v kuolleiden määrästä seuraavat binomijakaumaa: d s,x,v ~ Bin(n s,x,v, θ s,x,v ), missä n s,x,v on altistuneiden lukumäärä ( keskiväkiluku). Sovelletaan Bayesin kaavaa P A B = P B A P(A) P(B)

Etukäteistiedon huomiointi: priorijakauma Erityisesti P A B ~P B A P A Sovellettuna tilanteeseemme: P(θ s,x,v = z d s,x,v ~P d s,x,v θ s,x,v = z P θ s,x,v = z Tällä kaavalla voimme laskea (suhteelliset) todennäköisyydet todelliselle keskikuolevuudelle θ s,x,v. Tarvitaan vain jokin järkevä priorijakauma P θ s,x,v = z. Luonnollinen valinta eläkelakikohtaiseksi keskikuolevuuden prioriksi (=paras arvaus ilman mitään tutkittavaan lakiin liittyviä havaintoja) ovat väestön keskikuolevuusluvut.

Priorista posterioriin Valitaan siis prioriksi kunkin vuoden väestödataa myötäilevä oletus, mutta tarpeeksi pienellä informaatiopainolla (priori otoskoko 25) jotta väestötasoa kohti tasoittava vaikutus on merkittävää vain erittäin pienillä ikäluokilla Näillä oletuksilla osoittautuu, että taustalla oleva todellinen keskikuolevuus on beta-jakautunut: θ s,x,v ~ Beta(d s,x,v + α, n s,x,v d s,x,v + β), jossa α + β=25 ja α α+β = m väestö.

Alea jacta est! Simuloidaan otokset edellä johdetusta kuolemanvaaralukujen posteriori-jakaumasta ikäluokittain Monte Carlomenetelmällä, eli annetaan koneen heittää arpaa! Valitaan n=10000. Joudumme siis generoimaan (lakien lkm x sukupuolet x ikaluokat x vuodet x n) 40 miljoonaa satunnaislukua. Näiden avulla voimme edelleen laskea jakaumat elinajanodotteille jne.

Tietoa epävarmuudesta Bayesiläinen analyysi KiEL-kuolevuudesta ja sen eroista VaEL-kuolevuuteen

Simuloidut keskikuolevuudet 2008 2013, mediaani ja 95%-luottamusväli, 50-99 vuotiaat miehet

Simuloidut keskikuolevuudet 2008 2013, mediaani ja 95%-luottamusväli, 50-99 vuotiaat naiset

Simuloituihin kuolemanvaaralukuihin perustuva teoreettinen elinajanodote (18-, 50- ja 63-vuotiaana): odotusarvo ja 95%- luottamusväli

Todennäköisyys että jäljellä oleva teoreettinen elinaika on KiEL-piirissä suurempi kuin VaEL-piirissä 18-, 50-, ja 63-vuotiaana

KiEL vs. VaEL, jäljellä oleva elinaika 18-, 50-, ja 63- vuotiaana, teoreettisten odotesimulaatioiden mediaani ja 95%-luottamusväli

Lukumääräkuolevuuden arviointi Konstruoidaan vuoden 2013 KiEL-kuolevuuden piste-estimaatti

Havaitut KiEL-kuolemanvaarat vuonna 2013

Väestön kuolemanvaaraluvut avuksi

Simuloitujen kuolemanvaarojen odotusarvot vuonna 2013, KiEL

Lee-Carter apuun! Kuolevuuden tason hahmottamiseksi täytyy löytää jokin keino hyödyntää aikaisempina vuosina saatua informaatiota. Tämä vaatii tietysti ylimääräisiä oletuksia vuosien välisistä yhteyksistä. Tavoite on, että tehdyt oletukset olisivat kuitenkin luonnollisia ja perusteltavissa. Otetaan apuun väestöennusteiden nykystandardi: Lee-Carter. Eli sovitetaan väestön keskikuolevuuksiin 1986-2013 seuraava malli: ln m x,t = a x + b x k t + e x,t

Väestödatan Lee-Carter ikäriippuvuus, parametrit a x ja b x

Lee-Carter sovitteen aikariippuvuus k t

Aikahyppelyä Käyttämällä väestön aikariippuvuuskerrointa k t ja ikäluokittaista herkkyyskerrointa b x voimme nyt siirtää havaintojamme eri vuosien välillä. Oletamme siis implisiittisesti, että väestössä havaitut trendit kuolevuuden kehityksestä vaikuttavat myös lakikohtaisten kuolevuuksien taustalla. Kompensoimme kuitenkin siirtämisen tuomaa epätarkkuutta pienentämällä menneiden vuosien havaintojen posteriorijakaumien otoskokoa siirrettyjen vuosien määrän funktiona.

Lee Carter menetelmän mukaisella aikariippuvaisuuskertoimella (k t ) vuoteen 2013 siirretyt ikäluokittaiset KiEL-posteriorijakaumat: alkuperäinen vuosi, odotusarvo ja informaatiokadolla modifioitu otoskoko. Miehet (1) ja naiset (2). Vuotuiseksi informaatiokadoksi on oletettu 7 %

Yhdistetään eri vuosilta saadut siirretyt keskikuolevuusjakaumat ikäluokittain ja lasketaan yhdistettyjen jakaumien odotusarvot

Siirrettyjen ja yhdistettyjen kuolemanvaarajakaumien odotusarvoihin sovitettu spliniapproksimaatio

Validointi: KiEL-kuolevuussovite 2013 ja tätä vastaava havaittavan KiEL-keskikuolevuuden mediaani ja 95%-luottamusväli vuoden 2013 KiEL-altistumin, sekä todella havaittu KiEL-keskikuolevuus 2013

Elinajanodotteet (18-, 50- ja 63-vuotiaana) vuonna 2013: havainnot, simulaatiot ja sovite

Moneta longa, vita brevis? Rahakuolevuuden ja lukumääräkuolevuuden eroista

Kappalekuolevuus vs rahakuolevuus Tulotaso ja kuolevuus korreloivat tunnetusti käänteisesti (rahaefekti). Monissa sovelluksissa käytetäänkin kappalekuolevuuden sijasta raha(sto)kuolevuutta. Käytettäessä kappalekuolevuutta eläkemenoennusteissa tulee rahaefekti ottaa erikseen huomioon.

VaEL-piirissä havaittu elinajanodote 62-vuotiaana

Havaittu kuolemanvaara vs kohortin eloonjääneiden eläkkeiden/karttumien keskisuuruus suhteessa koko kohortin eläkkeisiin

Sovitetaan lineaarinen malli rahaefektidataan

Kiitos 2001-2013! Lakikohtaiset kuolevuustiedot 2001-2013: ETK/Sergei Lahti. Väestön kuolevuustiedot 1986-2013: Tilastokeskus. VaEL-rahakuolevuustietojen raakadata on peräisin Kevan rekistereistä ja ETK:n eläkkeiden perintätiedostosta. R-ohjelmisto: Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.r-project.org/. Kuvat laadittin R:n ggplot2-paketilla: H. Wickham. ggplot2: elegant graphics for data analysis. Springer New York, 2009. Lee-Carter sovite ja sileät splini aproksimaatiot laaditttiin R:n demography paketilla: Rob J Hyndman with contributions from Heather Booth, Leonie Tickle, John Maindonald, Simon Wood and R Core Team. (2014). demography: Forecasting mortality, fertility, migration and population data. R package version 1.17. http://cran.rproject.org/package=demography Valokuvat: noppakuva (CC2.0 lisenssi): Mattia Merlo.