Tilastokeskuksen tutkijapalvelut Antti Katainen
Sisällys Tutkijapalvelut Tutkijapalvelun kehittäminen 2010-2011 Mikroaineistojen etäkäyttöjärjestelmät
Tutkijapalvelut Laajat ja monipuoliset mikroaineistot ovat arvokkaita yhteiskunta- ja taloustieteellisessä tutkimuksessa Tilastoaineistoja voidaan luovuttaa yhteiskuntaoloja koskeviin tieteellisiin tutkimuksiin ja tilastollisiin selvityksiin Henkilöotoksia voidaan luovuttaa talosta ulos vain tunnistamattomassa muodossa Yritysaineistoja käytetään valvotusti tutkimuslaboratoriossa / etäkäyttöpalvelussa. Yritysten suora tunnistaminen on estetty Käyttölupia myönnetään noin 100 kpl/vuosi, tutkimuslaboratoriossa hankkeita ollut noin 30 kpl/vuosi
Tutkijapalvelut -toiminto on perustettu syksyllä 2010 Toiminnon tehtävät: Palvella tutkijoita ja tutkimushankkeita tuottamalla yksikkökohtaisia aineistoja otosaineistoina, tutkimuslaboratoriossa käytettäväksi ja etäkäyttöön. Osallistua tutkimushankkeisiin ja tehdä tutkimusta Koordinoida Yritysten rakenteet -yksikön maksullista tietopalvelutoimintaa Kehittää tilastokeskuksen etäkäyttöjärjestelmää yhdessä Tietotekniikka-yksikön kanssa Selkiyttää tutkijapalveluprosessia sekä tutkijoiden että aineistotoimittajien suuntaan
Tutkijapalvelun vakioaineistot, nykytilanne YRITYSAINEISTOT Yritysrekisterin konserni-, yritys- ja toimipaikkatason aineistot: perustiedot yrityksistä (mm. liikevaihto, henkilöstö, toimiala, konsernisuhteet) Tilinpäätösaineistopaneeli: yritysten tuloslaskelma- ja tasetiedot, tilinpäätöstunnusluvut Teollisuustilaston toimipaikkapaneeli: teollisuuden tuotantotiedot Hyödyketilastot: arvo- ja määrätiedot toimipaikoittain tuotteille ja raaka-aineille T&K-paneeli: yritysten tutkimus- ja tuotekehitystoiminta Innovaatioaineistot: yritysten innovaatiotoiminta Patenttiaineistot: yritysten patentit ICT-paneelit: tietotekniikan ja internetin käyttö yrityksissä Yritystukitietokanta: yritystuet
HENKILÖAINEISTOT Yhdistetty työnantaja-työntekijä-aineisto, ns. FLEED-aineisto Sisältää laajasti työikäisen väestön taustatietoja ja linkit työnantajiin Totaali-FLEED käytössä ainoastaan TK:n henkilökunnan kautta Aineistosta muodostettu tutkijakäyttöön soveltuva FLEED-otos FLEED-aineiston pohjalta aggregoidut tiedot yritys- ja toimipaikkatason henkilökunnan ominaisuuksista ja palkoista (mm. toimipaikan henkilöstön palkat, työkokemus, koulutus, ikä) sekä työpaikka- ja työntekijävirrat Palkkarakenneaineisto On yhdistetty työnantaja-työntekijä-aineisto, joka sisältää yksityiskohtaisia tietoja palkansaajien tunti- ja kuukausiansioista sekä taustatietoja työnantajasta. Aineistosta muodostetaan tutkimuskäyttöön soveltuva otos.
Mahdollisia uusia aineistoja Henkilötason koulutus-, perhe-, kotitalous- ja asumistiedot Väestölaskennan pitkittäisaineiston otos Tulonjaon palveluaineisto Työolo-, kulutus-, varallisuus- ja ajankäyttötutkimusten palveluaineistot Eurostatille toimitettavat yksikköaineistot seuraavista otostutkimuksista: Euroopan yhteisön kotitaloustiedustelu (ECHP) Euroopan unionin tulo- ja elinolotilastot (EU-SILC) työvoimatutkimus (LFS) kotitalouksien tietotekniikan käyttö (ICT) yhteisön innovaatiotutkimus (CIS) aikuiskoulutusta koskeva kyselytutkimus (AES) ja ammatillista täydennyskoulutusta koskeva kyselytutkimus (CVTS) palkkarakennetutkimus (SES) kulutustutkimus
Tutkijapalvelun kehittäminen 2010-2011 Taustaa Kehittämistarpeesta on keskusteltu monessa yhteydessä Selvitysmiehet ja tilastotoimen selvityshanke 2008-2010 Tietojen yhteiskäytön ja tutkijapalvelun kehittämisen tarve Rekisteri- ja tutkimusaineistokeskus Tutkimuslaboratorion etäkäyttöhanke 2008-2009 Tutkijapalveluille toimintastrategia Käyttölupien käsittelyn nopeuttaminen Palvelu- ja laskutuskäytäntöjen yhdenmukaistaminen
Tilastokeskuksen sisäinen Tutkijapalveluiden kehittäminen työryhmä 11/2009-3/2010 Tehtävänä oli valmistella ehdotukset: tutkimusaineistojen käyttölupamenettelyn ja tiedonluovutuskäytäntöjen parantamiseksi tutkijapalvelun organisoimiseksi tutkijapalvelun voimavarojen kohdentamiseksi tutkimusaineistojen ja tutkijapalveluiden kokoamiseksi tutkimuslaboratorioon Lisäksi asiaan on otettu kantaa monessa ryhmässä (hallitusohjelma, Eduskunnan tulevaisuusvaliokunta, ministeriöiden tulevaisuuskatsaukset) julkisen tiedon avoimuus Lisäksi julkinen paine tutkijapalvelun kehittämiseen on jälleen kasvanut
Kehittämistyön tavoitteita Asiakaslähtöinen palvelumalli Yhden luukun periaatteen edistäminen Yksikköaineistojen keskittäminen ja aineistokokonaisuuksien lisääminen Prosessin sujuvuuden ja läpinäkyvyyden parantaminen Tutkimusaineistojen luovuttamiseen ja hinnoitteluun yhtenäiset periaatteet Etäkäytön kehittäminen ja laajentaminen: 10 organisaatiota vuoden 2011 lopussa Päivittäinen toiminta uuteen tilanteeseen sopeutettuna
TUTKIJAPALVELUT = toimeksiannot, jotka koskevat rekisteri- ja tilastoaineistoista tuotettavia yksikkötason mikroaineistoja ja jotka vaativat käyttölupaa Tutkimus- ja tutkijapalvelua Tilastokeskuksessa -Tavoitetila T&M yksikkö ATK-menetelmät survey-laboratorio tutkijapalvelut tutkimuspalvelua atk-menetelmät lomakesuunnittelu tutkijapalvelua tutkimuspalvelua sisäinen asiakas, tilastoyksikkö auktorisoitu tutkimuslaitos tutkijat tilastoyksiköt tutkimuspalvelua ulkoinen asiakas, tutkija
Tähän mennessä tehtyä 1 Organisaatiomuutos yhden luukun periaate 2 henkilöä Henkilötilastot -yksiköstä 1 henkilö Hinnat ja palkat -yksiköstä Tiimiesimies rekrytoitu Näiden lisäksi 1 resurssisiirto vastuualueen sisällä ja 1 tuntityöntekijä Tutkijapalveluihin hyväksyttyjen aineistojen käyttöluvan myöntää Yritysten rakenteet -yksikön tilastojohtaja Etäkäytön laajentamisesta käydään keskustelua uusien organisaatioiden kanssa Lähinnä yliopistoja
Tähän mennessä tehtyä 2 Tutkijapalveluiden kehittäminen projekti Asetettu 1.9.2010 Määräaika 30.6.2011 Projektiryhmä koostuu tutkijapalvelut- tiimin jäsenistä + 1 henkilö YR-yksiköstä asiakas/projektihallintajärjestelmän kehittämisessä. Ohjausryhmässä omaa henkilökuntaa eri tilastoyksiköistä sekä 2 ulkopuolista tutkimuslaitosten edustajaa
Projektin tehtävät: Tutkijapalvelun kehittäminen ja jatkuvan toiminnan organisointi Prosessin sujuvuuden ja läpinäkyvyyden parantaminen Aineistokokonaisuuksien ja aineistokuvausten kehittäminen Asiakas/projektihallintajärjestelmän kehittäminen Tilastokeskuksen etäkäyttöjärjestelmän jatkokehittäminen ja valtion etäkäyttöjärjestelmän kehittämistyön seuraaminen
Tutkijapalveluiden tulevaisuus ja jatkokehittäminen Tutkijapalvelut -toiminnon kasvattaminen puuttuvalla osaamisella ja aineistoilla Helposti muokattavat ja hyvin dokumentoidut perusaineistot sekä aineistojen laajempi yhdisteltävyys Esim. tulo- ja varallisuusaineistot, haastatteluaineistot Tietojen luovutus- ja päivitysprosessin nopeutuminen Etäkäyttö ensisijaiseksi tutkimusaineistojen luovutustavaksi Parempi kontrolli aineistojen käyttöön Kansallinen rekisteritietojen etäkäyttöjärjestelmä? Tilastolain muutos? välillinen tunnistaminen mahdolliseksi
Etäkäyttöjärjestelmät Oma järjestelmä rakennettiin 2008-2009. Rakentamisen lähtökohdat: tutkijoiden tasapuolinen kohtelu mikroaineistojen käytön tehostuminen turvallinen ja valvottu ympäristö Tutkijat ottavat yhteyden työasemaltaan etäkäyttöpalvelimelle, jossa tutkijalla on käytössä Windows-työpöytä (4 palvelinta) Työpöydällä on kansiot tutkimushankkeelle (tilaa 20 GB), aineistolle, ohjeille ja tulosten siirrolle Järjestelmässä on käytössä tutkijapalveluhin hyväksytyt aineistot
Työvälineinä STATA, SPSS, R ja Acrobat reader ja tekstinkäsittelyohjelma Järjestelmästä ei pysty siirtämään tietoa ulos ja tulokset saa käyttöönsä tarkastusmenettelyn jälkeen Tietoturva Vahva tunnistaminen. Käyttäjatunnus, salasana ja GSMtunnistautuminen Palvelimet eristetty TK:n verkosta ja suojatut yhteydet rajatuista IP-osoitteista Lokitietojen keräys Tällä hetkellä maksimissaan 16-32 yhtäaikaista käyttäjää
Etäkäytön ehdot Etäkäyttöyhteyden avaus asiakkaalle Sopimus tutkimusaineistojen etäkäytöstä organisaation kanssa Selvitys tietoturva- ja tietosuojakäytännöistä Yhteyshenkilöt vastaavat tiedotuksesta ja käyttökoulutuksesta Tutkimushankesopimus Nimeää etäkäyttöön osallistuvat tutkijat Edellyttää hankekohtaista käyttölupaa Tutkijat sitoutuvat noudattamaan etäkäytön sääntöjä Etäyhteyden saa ottaa vain työpaikalta Tutkimusorganisaatiot vastaavat käyttäjistään
Oman etäkäyttöpalvelun jatkokehittäminen Kehittäminen on tällä hetkelle pienimuotoista: Uusia hankkeita ja aineistoja Sovelluspäivityksiä Käyttäjän- ja oikeuksien hallintajärjestelmä Tulosten siirron automatisointi Odotetaan ratkaisua yhteisestä etäkäyttöjärjestelmästä
Midras (rekisteritietojen) etäkäyttöjärjestelmä lähde :Midras selvityshanke Kehittämisestä vastannut OKM:n rahoittama ja CSC:n (Tieteen tietotekniikan keskus) ja Retken (Rekisteritutkimuksen tukikeskus) toteuttama selvityshanke 4/2009 12/2010 (TK mukana ohjausryhmässä) Hankkeen tehtävät: Selvittää järjestelmän toimintamallivaihtoehdot Selvittää hallinnolliset ja lainsäädölliset esteet ja muutostarpeet Suunnitella järjestelmän tietotekniset ratkaisut Arvioida järjestelmän kustannukset rakentamis- ja käyttövaiheessa Selvittää rahoitusmalleja (rahoittajaa) rakentamis- ja ylläpitovaiheelle
Midras -järjestelmän toimintamalli Etäkäyttöjärjestelmä tarjoaa palveluita kirjautuneille, käyttöluvan omaaville käyttäjille (validit tutkijat) Aineistojen omistajuus säilyy rekisterinpitäjillä, CSC hoitaa teknisen kehityksen ja ylläpidon ja ReTki tutkimuksen tuen Rekisterinpitäjät päättävät siitä, millä tavoilla ja aineistoilla he osallistuvat etäkäyttöjärjestelmään. Rakennettava pilottijärjestelmä testaa lähinnä toimintamallia ja tekniikkaa (Järjestelmässä ei ole tällä hetkellä tulosten siirtoa tai arkistointia) Kutakin aineistoa käsitellään sitä koskevien lakien mukaisesti ja kaikkien aineistojen tietosuoja ja tietoturva säilyvät vähintään aikaisemmalla tasolla
Midras-visio Tarjotaan sekä avoimia että rajattuja palveluita Etätyöpöydän oheispalveluina mm. aineistojen vakiomuotoiset metatiedot, public use -aineistoja ja lisäpalveluita (forum) Sähköinen asiointi nopeuttaa prosesseja Keskitetty sähköinen lupahakemus, josta käyttöoikeuksien myöntäminen hajautuu rekisteriorganisaatioille automaattisesti Vahva autentikointi takaa tietoturvan (pilotissa sirukortti) Vain validilla tutkijalla pääsy etätyöpöydälle ja vain aineistoihin, joihin hänellä on käyttöoikeus ja vain etätyöpöydällä Etätyöpöydällä kattava työkaluvalikoima Helppokäyttöinen haku aineistoista, aineistojen yhdistely, kattava valikoima tilasto-ohjelmistoja, omia tietokantoja Datan avaaminen ja tarjoaminen helppoa, mutta hallittua
Aineistojen välittäminen Midras -järjestelmässä
Midras -järjestelmän palvelut ja niiden julkisuus Julkinen Käyttäjätunnuksella Tutkimusluvalla Aineistokatalogi Käyttäjätuki Tiedotteet Metatietojen lähetys Metatietojen selailu Omien käyttöoikeuksien tarkkailu Tukifoorumi Lupahakemus Käyttöoikeuksien antaminen (rekisteriorganisaatio) Aineistojen lähettäminen Pseudonymisointi Etätyöpöytä Tulosten luovutuspalvelu Saatavuusaineistot Kokeiluaineistot Tallennusalue Yksikkötason aineistot Tulosten arkistointipalvelu? Analyysiohjelmistot
Midras- järjestelmän toimintamalli, muutoksia aikaisempaan Rekisteriorganisaatioiden tekemää aineistonmuodostustyötä siirtyy tutkijoille Tutkija itse tekee yhdistelyjä eri aineistoista, ja poimittujen hetulistojen ja mäppäystaulujen kierrätys rekisteriorganisaatioiden välillä vähenee Alkukohortin muodostamisen tukena saatavuusaineistoja Tutkijakohtaisista aineistoista siirrytään osittain yleisiin yhteiskäyttöisiin aineistoihin Rekisteriorganisaatio voi tuottaa valmisaineiston (tai vuosiaineiston) tai avata alkuperäisiä tietojärjestelmiään rajapintojen avulla
Etäkäyttöjärjestelmien yhdistäminen Viime keväänä perustettiin Tilastokeskuksen ja Midras - etäkäyttöjärjestelmien yhteiskehittämistä valmisteleva työryhmä VM:n asettamana Tehtävät: Selvittää Tilastokeskuksen ja Midras-projektin etäkäyttöhankkeiden yhteiskehittämismahdollisuudet Selvittää ja tehdä ehdotus etäkäyttöjärjestelmien hallintomalliksi Selvittää ja tehdä ehdotus järjestelmien toteuttamisen ja ylläpidon resursoinniksi ja rahoitukseksi Tavoitteena olisi tarjota hallinnollisten ja tilastoaineistojen tietoja tutkijoille yhtenäisen etäkäyttöjärjestelmän kautta, joka olisi osa kansallista tutkimuksen e-infrastruktuuria
Yhteisjärjestelmän ominaisuuksia olisivat mm.: Poikkihallinnollisuus (useiden eri rekisterinpitäjien aineistoja) Tuotantokelpoisuus (tietoturvallinen, tietosuojattu, moderni tietojärjestelmä tutkijoiden käytössä) Helppokäyttöisyys (esim. Windows-etätyöpöytä, jossa laaja tilastoohjelmistovalikoima tarjolla) Federointi (yhteinen käyttäjähallinta, aineistoihin liittyvä kontrolli säilyy tuottajilla) Lähtökohdat yhteisjärjestelmälle ovat suotuisat, sillä nykyiset järjestelmät ovat hyvin samankaltaisia. Hallintomalli ja rahoitus haastavin osa yhteiskehittämistä
Lisätietoja Antti Katainen 09 1734 2347 tutkijapalvelut@tilastokeskus.fi