Mikrosimulointimallin kehittämisprojekti Jukka Mattila VATT-seminaari 31.5.2012
Esityksen sisältö I. Mikrosimulointi? II. Projektin tarkoitus III. Aikataulu ja edistyminen IV. Uuden mallin ominaisuudet V. Palvelukonsepti VI. Käytännön esimerkkejä 2
Mikrosimulointi Menetelmä tulonsiirtojen ja verojen taloudellisten vaikutusten arvioinnille Malli kokoaa lainsäädännön parametreiksi ja laskukaavoiksi, joita sovelletaan pohja-aineiston otoshenkilöiden ominaisuuksiin laskemalla verot ja etuudet näille uudestaan Malleja käytetään mm. julkisen sektorin verotulojen arvioimiseen, kansalaisten ja kotitalouksien taloudellisen aseman tarkasteluun sekä tuloerojen ja kannustinvaikutusten tutkimiseen. Suomalaisia malleja ovat mm. TUJA-, SOMA-, JUTTA-, HVS- ja KOTO-mallit 3
Mikrosimuloinnin tarve ja käyttäjätahot Valtiovalta Lainsäädäntötyössä etuus- ja verojärjestelmien budjetti- ja tulonjakovaikutusten arviointi Ennusteet Lakimuutoksilla tavoiteltujen vaikutusten toteutumisen seuranta Tutkimustoiminnan tarpeet Esim. tuloerojen tutkiminen Etujärjestöt ja puolueet Politiikkavaihtoehtojen arviointi 4
Mallityypit Fiktiiviset mallit Fiktiivinen, ei havaittu data Esimerkkilaskelmat Staattiset mallit Deterministinen oletuksiltaan Ei sisällä käyttäytymisvaikutuksia Lähtökohdiltaan teoreettisesti ja ideologisesti neutraali Lyhyen aikavälin tarkastelu (reformin välittömät vaikutukset) Dynaamiset mallit Käyttäytymisvaikutukset Väestön rakennemuutokset Pitkän aikavälin tarkastelu 5
Esimerkkejä mallien käytöstä (1/2) Esimerkkilaskelmilla voidaan kuvata tulonsiirto- ja verojärjestelmän toimintaa Miten peruspäivärahan korotus vaikuttaa verotukseen, asumistukeen ja toimeentulotukeen? Millä puolison tulotasolla työmarkkinatuen tarveharkinta poistaa työmarkkinatuen? Mikä on marginaaliveroaste eri tulotasoilla? Miten lapsilisän reaaliarvo on kehittynyt? Kuinka täysi kansaneläke on muuttunut? 6
Esimerkkejä mallien käytöstä (2/2) Aineistosimuloinnin avulla voidaan arvioida mm. Reformin budjettikustannuksia (tai säästöjä) valtiovallalle Reformin vaikutuksia eri väestöryhmiin tai esim. eri tulotasoilla (hyötyjät/häviäjät analyysi) Reformin tulonjakovaikutuksia (tulo-osuudet, köyhyysasteet, gini-kerroin, köyhyysvaje...) Kannustinvaikutukset Efektiiviset marginaaliveroasteet Tulo- tai työttömyysloukut Eläkkeelle siirtymisen kannustimet tai esteet jne. Muita erityistarkasteluja Esim. etuuksien alikäytön laajuus 7
Projektin tarkoitus ja tavoitellut hyödyt Tilastokeskuksen projekti on osa laajempaa VM:n asettamaa mikrosimuloinnin kehittämishanketta, jonka tavoitteena on uuden integroidun ja kehittyneemmän mallin rakentaminen ja sen ylläpidon keskittäminen Tilastokeskukseen Keskitetty malli rationalisoi päivitys- ja ylläpitotyötä ja helpottaa kehittämistyötä Uuden mallin luominen alusta pitäen mahdollistaa nykyisiä malleja kehittyneemmän rakenteen Malliin rakennettava käyttöliittymä pienentää käyttöönottokynnystä ja laajentaa mallin sovellusmahdollisuuksia Projektissa parannetaan mikrosimulointimallin laskentatarkkuutta väestöä paremmin edustavan pohja-aineiston avulla 8
Projektin tehtävät Mallin kehittäminen I. Mallin ohjelmakoodin tuottaminen II. Mallin käyttöliittymän suunnittelu ja toteutus III. Mallin käyttöohjeiden tuottaminen Aineistotehtävät ja etäkäyttö I. Malliaineistojen muodostaminen II. Mallin etäkäyttöympäristön suunnittelu ja toteutus Työn organisointi I. Lainsäädännön seurannan vastuiden määrittely II. Kehittämisvaiheen jälkeisen säännöllisen toiminnan organisointi (ml. palvelut ja hinnoittelu) 9
Projektin organisointi Tilastokeskus Kokonaisvastuu projektista Mallikoodin kehittäminen Käyttöliittymän suunnittelu ja toteutus Etäkäyttöjärjestelmän suunnittelu ja toteutus Aineistojen kehittäminen KELA Merkittävä panos mallikoodin kehittämistyöhön Valtiovarainministeriön mikrosimulointi-työryhmä Myös mm. STM, THL, VATT antavat asiantuntija-apua hankkeen edistämiseen 10
Aikataulu 1. Malliversio Huhtikuu 2012 Ensimmäinen työasemalta käytettävä versio mallista on puhtaasti SASpohjainen ja se hyödyntää tulonjaon palveluaineistoa. Jaettu testausta varten vain pilottikäyttäjille (nykyisten mikrosimulointimallien käyttäjiä mm. ministeriöistä ja tutkimuslaitoksista) 2. Malliversio Joulukuu 2012 Etäkäytätettävä, rekisteriaineistoa hyödyntävä käyttöliittymällä varustettu mikrosimulointimalli. 11
Projektin edistyminen 1. pilottiversio mallista valmis Laajempi rekisteriaineisto on jo TK:n sisäisessä käytössä Käyttöliittymän ohjelmointi on aloitettu ja 1. versio testattavana Etäkäyttöympäristö on suunniteltu ja ICT-hankintojen kilpailutus käynnistetty 12
Kehittäminen jatkuu 2012 1. malliversion testaus Aineistot Rekisteriaineiston viimeistely ja ajantasaistus Käyttöliittymä ja etäkäyttö Käyttöliittymän ohjelmointi Etäkäyttöjärjestelmän suunnittelu ja toteutus Mallin hinnoittelun ja palvelukonseptin suunnittelu Käyttöliittymällä varustetun malliversion pilotointi ja käyttöönotto 13
Uuden mallin tekniikka ja toimintaympäristö Koodin ohjelmointiväline: Base SAS Käyttöliittymä: SAS EG Mallin toimintaympäristö Tutkijan työasema (pienempi otosaineisto) TK:n etäkäyttöjärjestelmä, jossa oma palvelin mikrosimulointimallia varten (laaja rekisteriaineisto) 14
Joitakin mallin ominaisuuksia Staattinen mikrosimulointimalli reformien välittömien vaikutusten arviointiin Sisältää erilliset osiot esimerkkilaskelmille ja aineistosimuloinnille Lainsäädäntö ohjelmoitu myös pitkälle taaksepäin Malliaineistot aina hetkestä t-2 ajankohtaan t+4 asti (esim. 2010-2016) Tulonsiirtojen mallinnus pääosin kalenterikuukauden tasolla verotus ja asumistuet kalenterivuositasolla Kaikki osamallit (lainsäädäntölohkot) voidaan ajaa erikseen tai osana päämallia Monipuoliset muokattavissa olevat valmistulosteet Mallia ohjataan käyttöliittymän kautta, joka sisältää mm. valmiit valikkopohjaiset taulukointi- ja graafiset työkalut tulosten analysointiin 15
Lainsäädäntölohkot / osamallit henkilöverotus sairausvakuutuksen päivärahat ja vanhempainpäivärahat työttömyysturva kansaneläkkeet ja niihin liittyvät etuudet lasten kotihoidon tuki lapsilisät, äitiysavustus ja elatustuet (kunnalliset) lasten päivähoitomaksut opintotuki yleinen asumistuki eläkkeensaajien asumistuki toimeentulotuki PÄÄMALLI (kokoaa osamallien tulokset yhteisvaikutusten arvioimiseksi) 16
Aineistot Tulonjaon palveluaineisto Vuosittain tuotettava kotitalous- ja henkilötason tutkimusaineisto Tiedot kerätään haastattelemalla ja hallinnollisista rekistereistä Otos n. 27 000 henkilöä Käytössä työasemaversiossa Laaja rekisteriaineisto Puhtaasti rekisteripohjainen aineisto Osa tiedoista imputoitu / estimoitu (mm. asumiskustannukset) Otos n. 800 000 henkilöä Vain etäkäytössä 17
Muutamia malliaineistojen piirteitä (v. 2009) Otokseen kuuluvien lukumääriä (n) Nykyinen malliaineisto Uusi rekisteriaineisto Kotitalouksia 10 989 396 817 Henkilöitä 27 009 801 127 Yksinhuoltajataloudet 596 25 318 Lapseneläkkeen saajat 110 3 758 Puhdas pääomatulo valtionverotuksessa yli 100 000 40 772 Puhdas ansiotulo valtionverotuksessa yli 100 000 267 4 787 Olli Kannas 01/06/2012 18
Ajantasaistus Ajantasaistetut aineistot tilastovuodesta + 5-6-vuotta eteenpäin Mikrosimuloinnissa käytettävät aineistot ajantasaistetaan perusvuodesta myös tuleville vuosille. Perusvuoden tiedot saatetaan sekä kuluvan vuoden tasolle että ennustetaan aineistoa myös tuleville vuosille. Aineistojen ajantasaistus perustuu tilastovuoden jälkeisten tulojen ja menojen kehitykseen (indeksitarkistukset ja muokkausohjelmat) sekä yhteiskunnan rakenteelliseen muutokseen (otosyksiköiden painokertoimien muuttaminen). 19
Mallin rakenne 1. Mikroaineistot 2. Parametritiedostot 3. SAS-mallikoodi Ohjaustiedosto Apumakrot Lakimakrot Aineistosimulointiohjelmat Esimerkkilaskentaohjelmat 4. Tulosaineistot 5. Dokumentointi KÄYTTÖLIITTYMÄ 20
Simulointiohjelman kulku Alku Makrojen tallennus Datan poiminta Simulointi Tulokset Loppu Apumakrot Lakimakrot Summataulukot Pohjadata Startdata Parametritaulukot Olli Kannas 01/06/2012 21
Parametritiedostot Parametrit tarkoittavat tässä yhteydessä lainsäädännön erilaisia euromääriä (tai markkamääriä) sekä muita lainsäädännössä olevia erilaisia vakioita ja kertoimia, mm. asumistuen pinta-alarajoja. Parametritiedostot sisältävät lainsäädännön vakioita lainsäädäntölohkosta riippuen joko kuukausi- tai vuositasolla. Parametreja on taulukoitu usealta vuodelta myös takautuvasti. Parametritaulukot sisältävät muun muassa: etuuksien ja verojen euromäärät matemaattiset parametrit etuuksien saantioikeuksiin liittyviä parametrejä (ikärajat, etuuspäivien rajoitukset jne.) indeksit 22
Tulokset Simuloidut (henkilötason) mikroaineistot Summataulukot Tuotetaan oikeasta datasta (aineistosimulointi) Vertailu alkuperäiseen dataan (ns. kontrollitulosteet) Mahdollista valita kotitalous- tai henkilötason tulokset Mahdollisuus valita luokitteleva(t) muuttuja(t) ja laskettavat tunnusluvut Tulonjakoindikaattorit Käytössä vain päämallissa Simuloinnin jälkeen käytettävissä olevat tulot lasketaan uudelleen 23
Dokumentaatio Mallin kattava dokumentaatio on keskeisessä roolissa, jotta malli olisi helposti omaksuttavissa ja käytettävissä sen laajasta ja kompleksisesta tietosisällöstä huolimatta. Mallin sisältämä dokumentaatio: Mallikoodissa oleva dokumentointi ( kommentit ) Osamallien kuvaukset (keskeinen lainsäädäntö, käytettävät makrot, muuttujat ja parametrit) Parametrit ja niiden kuvaukset Aineistojen ja ajantasaistusmallien kuvaukset Käyttöliittymän dokumentaatio Mallin käsikirja 24
Käyttöliittymä: versio 1
Käyttöliittymä: versio 2
Mitä lisäarvoa uusi malli tuo? Keskitetty malli rationalisoi päivitys- ja ylläpitotyötä ja helpottaa kehittämistyötä Yksikielinen malli SAS-ympäristö tarjoaa tehokkaat analysointivälineet Suhteellisen nopea malli Luultavasti aikaisempaa tarkempi malli: koodattaessa tehty paljon testejä ja vertailuja nykyisiin malleihin Käyttöliittymä helpottaa mallin käyttöä Mallin rakenteen, muuttujien, taulukoiden ym. nimien standardisointi ja kattava dokumentaatio ovat avuksi mallin hahmottamisessa Kvantitatiivinen kehityshyppy Laajan rekisteridatan käyttöönotolla saavutetaan pohjoismainen taso staattisessa simuloinnissa 27
Mallityön luonteesta Mallin mittakaava SAS-ohjelmia: 53 Koodirivejä: n. 30 000 Parametritaulukoita: 19, joissa parametrejä 562 ja soluja 40 260 Yleisesti mikrosimulointimalleihin liittyvä kompleksisuus Aineiston laajuus Lainsäädännön monimutkaisuus ja tahoisuus Tulosten analysointi (käsitteet ja määritelmät) Vaativampi käyttö edellyttää SAS-makrokielen hallitsemista 28
Palvelukonsepti Mallin kehittämisestä, ylläpidosta ja jakelusta vastaa tällä hetkellä kolmen henkilön tiimi Tilastokeskuksen tutkijapalveluissa Normaalin teknisen tuen lisäksi toteutetaan erilaisia toimeksiantoja ja erityisselvityksiä Milloin? 2013/Q1 Kenelle? Tilastolain puitteissa yhteiskuntaoloja koskevia tieteellisiä tutkimuksia ja tilastollisia selvityksiä varten Mitä se maksaa? Hinnoittelumalli on vielä auki PALVELUKOKONAISUUS JA HINNOITTELU TÄSMENTYVÄT PROJEKTIN AIKANA 29
KIITOS! Lisätietoja: olli.kannas@tilastokeskus.fi, p. 09 1734 376 jukka.mattila@tilastokeskus.fi, p. 09 1734 2475