Maantieteellisen alueen huomioiminen vahinkovakuutustuotteiden hinnoittelussa



Samankaltaiset tiedostot
Maantieteellisen alueen huomioiminen vahinkovakuutustuotteiden hinnoittelussa

805306A Johdatus monimuuttujamenetelmiin, 5 op

pitkittäisaineistoissa

pitkittäisaineistoissa

Yleistetyistä lineaarisista malleista

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Matemaatikkona vakuutusyhtiössä. Sari Ropponen Suomen Aktuaariyhdistyksen kuukausikokous Kumpulan kampus

Vakuutusmatematiikan sovellukset a) miksi lineaariset mallit eivät välttämättä sovi käytettäväksi vakuutusalalla

Vakuutusyhtiö Mopokone Oyj:llä on seuraavat maksettujen korvausten tilastot koskien mopedivakuutuksia, jotka ovat voimassa kalenterivuoden kerrallaan:

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MATEMAATIKKONA VAKUUTUSYHTIÖSSÄ. Sari Ropponen Suomen Aktuaariyhdistyksen kokous Helsingin Yliopisto, Kumpulan kampus

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

Vahinkovakuutusasiakkaiden tuotepysyvyyden mallintaminen. SHV-työ. Anne Setämaa-Kärkkäinen

Mat Tilastollisen analyysin perusteet, kevät 2007

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Harjoitus 9: Excel - Tilastollinen analyysi

Muutama ajatus vahinkovakuutustuotteiden hinnoittelusta SAY-Kuukausikokous Janne Kaippio

Tilastotieteen aihehakemisto

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Korvausvastuun ennustejakauma bootstrap-menetelmän avulla

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Load

Sopimusteoria: Salanie luku 3.2

Mat Sovellettu todennäköisyyslasku 5. harjoitukset/ratkaisut. Jatkuvat jakaumat

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk

Kertausluento. Tilastollinen päättely II - 2. kurssikoe

Ajoneuvovakuutusten hinnoittelu tilastollisista lähtökohdista

1. Tilastollinen malli??

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Hierarkkiset koeasetelmat. Heliövaara 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät Ratkaisuehdotuksia

MTTTP5, luento Luottamusväli, määritelmä

Tilastolliset mallit hakkuukoneen katkonnan ohjauksessa. Tapio Nummi Tampereen yliopisto

Johdatus geospatiaaliseen tutkimukseen

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Vahinkojen selvittelykuluvaraus vahinkovakuutuksessa

HAVAITUT JA ODOTETUT FREKVENSSIT

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

Logistinen regressio, separoivat hypertasot

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Identifiointiprosessi

Toimialan ja yritysten uudistuminen

805306A Johdatus monimuuttujamenetelmiin, 5 op

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen

Sovellettu todennäköisyyslaskenta B

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Harjoitus 7: NCSS - Tilastollinen analyysi

5 Osa 5: Ohjelmointikielen perusteita

Osa 2: Otokset, otosjakaumat ja estimointi

Epävarmuus ja riskinarviointi: tiedon paloja, näytön synteesiä

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä

Regressioanalyysi. Kuusinen/Heliövaara 1

4.2 Useampi selittävä muuttuja (kertausta)

Lineaariset luokittelumallit: regressio ja erotteluanalyysi

Ajalliset muunnokset eksploratiivisen paikkatietoanalyysin työkaluna. Salla Multimäki

Hoitotyön henkilöstövoimavarojen hallinnan mallintaminen kansallisesti yhtenäisillä tunnusluvuilla

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Spatiaalinen metsää kuvaava malli ja sen soveltaminen metsäninventointiin

TILASTOLLINEN LAADUNVALVONTA

805306A Johdatus monimuuttujamenetelmiin, 5 op

Sovellettu todennäköisyyslaskenta B

Ennustaminen ARMA malleilla ja Kalmanin suodin

Vertailutietoa nuorten kotivakuutuksista

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Elämänlaatu. Minna-Liisa Luoma,tutkimuspäällikkö Esityksen nimi / Tekijä 1

Bayesiläinen tilastollinen vaihtelu

4.0.2 Kuinka hyvä ennuste on?

Männyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Yleistetyn lineaarisen mallin perusteita

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Mat Tilastollisen analyysin perusteet, kevät 2007

Kandidaatintutkielman aineistonhankinta ja analyysi

Harha mallin arvioinnissa

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Tosi elävä virtuaalimalli Mika Karaila Tutkimuspäällikkö Valmet Automation

Elämänkatsomustieto. Arto Vaahtokari Helsingin yliopiston Viikin normaalikoulu Sari Muhonen

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Transkriptio:

Maantieteellisen alueen huomioiminen vahinkovakuutustuotteiden hinnoittelussa SHV-harjoitustyö (suppea) Teija Talvensaari Suomen Aktuaariyhdistyksen kuukausikokous 27.10.2014

Esityksen sisältö Johdanto Vahinkovakuutusten hinnoittelusta Yleistetyt lineaariset mallit lyhyesti Esimerkki vahinkotiheysmallista Spatiaalinen analyysi ja tasoitusmenetelmät Esimerkki kotivakuutuksen aluehinnoittelusta Yhteenveto

Johdanto 1/2 Vahinkovakuutusten hinnoittelussa hyödynnetään tilastollisia menetelmiä ja yhtiön omaa dataa vakuutuksista ja vahingoista Vakuutuksen riskimaksu vastaa odotettavissa olevaa, keskimääräistä vahingosta aiheutuvaa tappiota Yleistettyjen lineaaristen mallien avulla tutkitaan, miten vahinkotiheys ja keskivahinko riippuvat eri selittävistä tekijöistä Maantieteellinen sijainti on yleisesti käytetty tekijä vahinkovakuutustuotteiden hinnoittelussa Maantieteellisenä yksikkönä voidaan käyttää esimerkiksi postinumeroa tai kuntaa

Johdanto 2/2 Aluetekijän käyttäminen mallissa sellaisenaan ongelmallista Yksittäisiä postinumeroita liikaa ja dataa yksittäiseltä alueelta vähän Aineistoon voidaan sovittaa ensin malli ilman aluetekijää ja sen jälkeen hyödyntää mallin antamia jäännöstermejä eli residuaaleja Residuaaleihin voidaan soveltaa spatiaalisia tasoitusmenetelmiä Pyritään poistamaan satunnaiskohinaa, niin että jäljelle jäisi vain aluetekijästä johtuvaa vaihtelua Alueet saadaan luokiteltua ja aluetekijä voidaan sisällyttää malliin muiden tekijöiden kanssa

Yleistetyistä lineaarisista malleista Laajasti käytössä vahinkovakuutusten hinnoittelussa Klassisten lineaaristen mallien laajennus Ei normaalijakaumaoletusta, vaan vastemuuttujan jakaumat oletetaan kuuluvan samaan eksponenttiperheeseen Tiheysfunktiot ovat muotoa ;, =exp ( ) + (, ) Sisältää muun muassa Poisson- ja Gamma-jakaumat Linkkifunktio kuvaa vastemuuttujan odotusarvot selittävien muuttujien arvojen lineaariseksi ennusteeksi = =, E =

Yleistetyt lineaariset mallit -esimerkki vahinkotiheysmallista Kotivakuutuksen irtaimiston rikkoutumisvahinkoaineisto Vahinkotiheydelle sovitetaan multiplikatiivinen Poisson-malli linkkifunktiona log-linkkifunktio =log ( ) Tariffitekijöinä mallissa kohteen pinta-ala, vakuutuksenottajan ikä ja kohteen tyyppi (koti-irtaimisto, vapaa-ajan asunnon irtaimisto), pinta-ala ja ikä luokiteltuna sopiviin luokkiin Mallinnus tehty Emblem-hinnoitteluohjelmistolla (Towers Watson)

Vahinkotiheysmalli mallin antamat kertoimet Vakuutuksenottajan ikä 2,5 Rescaled Predicted Values - ikäluokka 16% 2,0 1,5 1,0 0,5 14% 12% 10% 8% 6% 4% 2% Weight (%) Model Prediction at Base levels Model Prediction + 2 Standard Errors Model Prediction - 2 Standard Errors Esim. 30-vuotias vakuutuksenottaja, koti-irtaimisto 60 m 2 vahinkotiheys= 1,96 % 2,15 1,07 1,00=4,51 % 0,0 0% 01_alle_30 02_30-32 03_33-35 04_36-38 05_39-41 06_42-44 07_45-47 08_48-50 09_51-53 10_54-56 11_57-59 12_60-62 13_63-65 14_66-68 15_69-71 16_72-74 17_75-77 18_78-80 19_yli_80 Pinta-ala Kohdetyyppi 3,0 2,5 2,0 1,5 1,0 0,5 0,0 Rescaled Predicted Values - pinta-alaluokka 20% 15% 10% 5% 0% 1,2 1,0 0,8 0,6 0,4 0,2 0,0 Rescaled Predicted Values - kohdetyyppi Koti-irtaimisto Vapaa-ajan asunnon irtaimisto 200% 180% 160% 140% 120% 100% 80% 60% 40% 20% 0% 01_alle_30 02_30-39 03_40-49 04_50-59 05_60-69 06_70-79 07_80-89 08_90-99 09_100-109 10_110-119 11_120-129 12_130-139 13_140-149 14_150-159 15_160-169 16_170-179 17_180-189 18_190-199 19_yli_199

Spatiaalinen analyysi Spatiaalisen tilastotieteen menetelmiä voidaan hyödyntää paikkatiedon analysoinnissa Spatiaaliset tasoitusmenetelmät perustuvat oletukseen, että vierekkäisillä alueilla voidaan olettaa olevan samanlaiset riskitasot, jos luotettavaa tietoa ei ole käytössä Tasoitusmenetelmiä olemassa useita, esim. Painotettu etäisyyteen perustuva menetelmä (weighted-distance smoothing) Vierekkäisyyteen perustuva menetelmä (adjacency-based smoothing) Spatiaalisen tasoituksen ideana on poistaa jäännöstermeistä satunnaiskohinaa, niin että jäljelle jäisi vain aluetekijästä johtuvaa vaihtelua

Spatiaaliset tasoitusmenetelmät Vierekkäisyyteen perustuva tasoitus (adjacency-based smoothing) Perustuu Bayesin todennäköisyysteoriaan Maantieteellisen havaintoyksikön informaatiota painotetaan naapurihavaintoyksiköiden informaatiolla Vahinkojen lukumäärän uskottavuusfunktio: ~Poisson vakuutusvuodet ( ) Aluevaikutuksen priorijakauma: ~N,

Esimerkki kotivakuutuksen aluehinnoittelusta Vahinkotiheysmalli kotivakuutuksen rikkoutumisvahinkoaineistolle Maantieteellisenä yksikkönä käytetään postinumeroa Ulkoisena datana väkilukuaineisto Alkuperäisestä aineistosta otetaan mukaan 70 prosentin satunnaisotos analysoitavaksi ja loput 30 prosenttia jätetään testiaineistoksi mallin sopivuustarkasteluja varten Residuaaleihin sovelletaan vierekkäisyyteen perustuvaa tasoitusta Analyysit tehty Classifier-ohjelmistolla (Towers Watson)

Mallin antamat residuaalit ryhmiteltynä 10 luokkaan

Tasoitetut residuaalit tasoitusparametrin arvoilla 60-110

Vahinkotiheysmalli, aluetekijän vaikutus Vahinkotiheydelle sovitetaan uudelleen malli, jossa aiempien tekijöiden lisäksi mukana luokiteltu aluetekijä 2,0 Rescaled Predicted Values - alue 1,8 20% 1,6 1,4 15% 1,2 1,0 0,8 0,6 10% 5% Weight (%) Model Prediction at Base levels Model Prediction + 2 Standard Errors Model Prediction - 2 Standard Errors 0,4 0,2 1 2 3 4 5 6 7 8 9 10 0%

Ennusteiden vertaaminen testiaineiston havaittuihin arvoihin Alkuperäisestä aineistosta jätetty 30 % analyysien ulkopuolelle testiaineistoksi Claim frequency 0,055 0,050 0,045 0,040 0,035 0,030 0,025 0,020 Std Fitted vs Std Observed (out of analysis) 100000 80000 60000 40000 20000 Weight Primary: Weight Secondary: Std Weight Std Fitted Observed - Out of analysis 0,015 1 2 3 4 5 6 7 8 9 10 Std Fitted Band 0

Yhteenveto Aluetekijä on nykyään laajasti käytössä vahinkovakuutuksen hinnoittelussa Voidaan käyttää erilaisia menetelmiä maantieteellisen riskin analysoimiseksi ja alueellisten luokkien muodostamiseksi Spatiaalisissa tasoitusmenetelmissä hyödynnetään ympäröivien alueiden informaatiota, kun yksittäisistä alueista ei ole tarpeeksi dataa Sopivan tasoitusparametrin valinnalla keskeinen merkitys Tulosten validointi erityisen tärkeää ennen johtopäätösten tekemistä