SAS-ratkaisut Tilastokeskuksen sosiaalietuuksien ja tuloverojen mikrosimulointimallissa Olli Kannas, Tilastokeskus SAS Forum Helsinki 2012 11.10.2012
Esityksen sisältö Mitä on mikrosimulointi? Hankkeen esittely Tehtävät ja tavoitteet Aikataulu Malli esittely Perusominaisuudet Aineistot ja parametrit SAS-mallikoodi Käyttöliittymä-demo 2
Mikrosimulointi Menetelmä tulonsiirtojen ja verojen taloudellisten vaikutusten arvioinnille Malli kokoaa lainsäädännön parametreiksi ja laskukaavoiksi, joita sovelletaan pohja-aineiston otoshenkilöiden ominaisuuksiin laskemalla verot ja etuudet näille uudestaan Malleja käytetään mm. julkisen sektorin verotulojen arvioimiseen, kansalaisten ja kotitalouksien taloudellisen aseman tarkasteluun sekä tuloerojen ja kannustinvaikutusten tutkimiseen. Käyttäjätahoja mm. valtionhallinto, etujärjestöt ja puolueet, tutkimustoiminta... Suomalaisia malleja ovat mm. TUJA-, SOMA-, JUTTA-, HVS- ja KOTO-mallit 3
Esimerkkejä mallien käytöstä Esimerkkilaskelmilla voidaan kuvata tulonsiirto- ja verojärjestelmän toimintaa Miten peruspäivärahan korotus vaikuttaa verotukseen, asumistukeen ja toimeentulotukeen? Millä puolison tulotasolla työmarkkinatuen tarveharkinta poistaa työmarkkinatuen? Mikä on marginaaliveroaste eri tulotasoilla? Aineistosimuloinnin avulla voidaan arvioida mm. reformin budjettikustannuksia (tai säästöjä) valtiovallalle reformin vaikutuksia eri väestöryhmiin tai esim. eri tulotasoilla reformin tulonjakovaikutuksia kannustinvaikutuksia 4
Projektin tarkoitus ja tavoitellut hyödyt Uuden integroidun ja kehittyneemmän mallin rakentaminen ja sen ylläpidon keskittäminen Tilastokeskukseen Keskitetty malli rationalisoi päivitys- ja ylläpitotyötä ja helpottaa kehittämistyötä Uuden mallin luominen alusta pitäen mahdollistaa nykyisiä malleja kehittyneemmän rakenteen Malliin rakennettava käyttöliittymä pienentää käyttöönottokynnystä ja laajentaa mallin sovellusmahdollisuuksia Projektissa parannetaan mikrosimulointimallin laskentatarkkuutta väestöä paremmin edustavan pohja-aineiston avulla 5
Aikataulu 1. Malliversio Huhtikuu 2012 Ensimmäinen työasemalta käytettävä versio mallista on puhtaasti SASpohjainen ja se hyödyntää tulonjaon palveluaineistoa. Jaettu testausta varten vain pilottikäyttäjille (nykyisten mikrosimulointimallien käyttäjiä mm. ministeriöistä ja tutkimuslaitoksista) 2. Malliversio Joulukuu 2012 Etäkäytätettävä, rekisteriaineistoa hyödyntävä käyttöliittymällä varustettu mikrosimulointimalli. 6
Uuden mallin tekniikka ja toimintaympäristö Koodin ohjelmointiväline: Base SAS Käyttöliittymä: SAS EG Add-Ins Mallin mittakaava SAS-ohjelmia: 54 Koodirivejä: ~35 000 Parametritaulukoita: 19, joissa parametreja ~600 ja soluja ~40 000 Mallin toimintaympäristö Tutkijan työasema (pienempi otosaineisto) TK:n etäkäyttöjärjestelmä, jossa oma palvelin mikrosimulointimallia varten (laaja rekisteriaineisto) 7
Lainsäädäntölohkot / osamallit henkilöverotus sairausvakuutuksen päivärahat ja vanhempainpäivärahat työttömyysturva kansaneläkkeet ja niihin liittyvät etuudet lasten kotihoidon tuki lapsilisät, äitiysavustus ja elatustuet (kunnalliset) lasten päivähoitomaksut opintotuki yleinen asumistuki eläkkeensaajien asumistuki toimeentulotuki PÄÄMALLI (kokoaa osamallien tulokset yhteisvaikutusten arvioimiseksi) 8
Mallin rakenne 1. Mikroaineistot 2. Parametritiedostot 3. SAS-mallikoodi Ohjaustiedosto Apumakrot Lakimakrot Aineistosimulointiohjelmat Esimerkkilaskentaohjelmat 4. Tulosaineistot 5. Dokumentointi KÄYTTÖLIITTYMÄ 9
1. Mikroaineistot Tulonjaon palveluaineisto Vuosittain tuotettava kotitalous- ja henkilötason tutkimusaineisto Tiedot kerätään haastattelemalla ja hallinnollisista rekistereistä Otos n. 27 000 henkilöä Käytössä työasemaversiossa Laaja rekisteriaineisto Puhtaasti rekisteripohjainen aineisto Osa tiedoista imputoitu / estimoitu (mm. asumiskustannukset) Otos n. 800 000 henkilöä Vain etäkäytössä 10
2. Parametritiedostot Parametrit tarkoittavat tässä yhteydessä lainsäädännön erilaisia euromääriä (tai markkamääriä) sekä muita lainsäädännössä olevia erilaisia vakioita ja kertoimia, mm. asumistuen pinta-alarajoja. Parametritiedostot sisältävät lainsäädännön vakioita lainsäädäntölohkosta riippuen joko kuukausi- tai vuositasolla. Parametreja on taulukoitu usealta vuodelta myös takautuvasti. Parametritaulukot sisältävät muun muassa: etuuksien ja verojen euromäärät matemaattiset parametrit etuuksien saantioikeuksiin liittyviä parametrejä (ikärajat, etuuspäivien rajoitukset jne.) indeksit 11
3. SAS-mallikoodi 1. Mallin ohjaustiedosto 2. Lakimakrotiedostot etuus- ja verolainsäädännöstä 3. Apumakrotiedostot parametrien hakua ja simulointia varten 4. Simulointitiedostot - Simulointia ohjaavat makromuuttujat - Datan poiminta ja muokkaus (optio) - Simulointi - Tulostaulukot 5. Esimerkkilaskennan simulointitiedostot - Varastoidut valmiit esimerkkipohjat - Esimerkkilaskentaa ohjaavat makromuuttujat - Fiktiivisen datan generointi - Simulointi - Tuloksena simuloitu esimerkkiaineisto 12
Simulointiohjelman kulku Alku Makrojen tallennus Datan poiminta Simulointi Tulokset Loppu Apumakrot Lakimakrot Summataulukot Pohjadata Startdata Parametritaulukot 13
4. Tulostaulukot Simuloidut (henkilötason) mikroaineistot Joko fiktiivistä tai oikeaa dataa Mahdollista vaikuttaa aineiston laajuuteen (muuttujien lukumäärä) Summataulukot Tuotetaan oikeasta datasta (aineistosimulointi) Vertailu alkuperäiseen dataan (ns. kontrollitulosteet) Mahdollista valita kotitalous- tai henkilötason tulokset Mahdollisuus valita taulukoitavat muuttujat ja laskettavat tunnusluvut Tulonjakoindikaattorit Köyhyysrajat, -asteet ja vajeet eri väestöryhmissä Köyhien lukumäärät eri väestöryhmissä Tuloeroja mittaavia tunnuslukuja 14