1(21) Projektin loppuraportti Laatija Jouko Verho Päiväys Projekti Tutkimuslaboratorion etäkäyttöprojekti Projektitunnus YA21O Nro TK-04-468-08 Suoritekoodi 346 Projektin asettaja Heli Jeskanen-Sundström Aloitusaika 23.4.2008 Projektipäällikkö Jouko Verho Valmistumisaika 31.10.2009
2(21) SISÄLLYSLUETTELO 1. YHTEENVETO... 3 2. PROJEKTIN TAUSTA JA TAVOITTEET... 3 3. PROJEKTIN TULOKSET JA TAVOITTEIDEN SAAVUTTAMINEN... 4 3.1 Etäkäyttöpalvelu tutkijan näkökulmasta... 4 3.2 Etäkäyttöpalvelun hallinnointi... 5 3.3 Koekäyttö ja testaus... 6 4. JÄRJESTELMÄN KUVAUS... 8 4.1 Palvelimet... 8 4.2 Järjestelmän käyttö... 9 5. PROJEKTIN ORGANISOINTI JA RESURSOINTI... 10 5.1. Projektiorganisaatio... 10 5.2. Resurssien käyttö... 10 6. JATKOTOIMET... 11 6.1 Järjestelmän laajennus ja ylläpito... 11 6.2 Tutkimuspalvelun kehittäminen... 13 6.3 Tutkimuspalvelun rahoitus... 14 6.4 Etäkäyttöön soveltuvat tutkimusaineistot... 15 6.5 Lopuksi... 15 Liite 1: Projektin alkuperäinen asettamiskirje... 16 Liite 2: Etäkäyttöpalvelun hinnoittelusuunnitelma... 17 Liite 3: Tutkimusaineistojen etäkäyttöjärjestelmän säännöt... 18 Liite 4: Kuva etäkäyttöjärjestelmästä... 21
3(21) 1. Yhteenveto Etäkäyttöprojektin tavoitteena oli rakentaa etäkäyttöjärjestelmä Tilastokeskuksen tutkimuslaboratorion aineistoille. Järjestelmän suunnittelun lähtökohdaksi otettiin ympäristö sekä toimintamalli, joka voidaan laajentaa myös muiden Tilastokeskuksen mikroaineistojen etäkäyttöä varten. Etäkäyttöpalvelussa tutkijat pääsevät käyttämään omalta työpaikaltaan Tilastokeskuksen palvelimella olevia aineistoja. Palvelu tarjoaa turvallisen ympäristön mikroaineistojen eli yksikkötiedon luovutukselle, koska aineistojen käyttöä voidaan valvoa eikä niitä pysty siirtämään järjestelmästä ulos. Projektissa rakennettiin kevään 2009 aikana etäkäyttöjärjestelmän testiversio, joka soveltuu enintään kahdeksan yhtäaikaisen käyttäjän kevyeen käyttöön. Järjestelmässä on käyttäjien kannalta kaikki tutkimuskäyttöön tarpeelliset toiminnallisuudet, joskin esimerkiksi ohjelmistotarjonta on hieman suppea. Järjestelmän koekäyttöön osallistui neljä taloudellista tutkimuslaitosta, Koekäytöstä kerätyn palautteen pohjalta projektissa tehtiin suunnitelma järjestelmän laajennuksesta. Projektissa luotiin myös säännöt ja sopimusmalli etäkäyttöä varten sekä tehtiin palvelun hinnoittelusuunnitelma. Lisäksi projektin yhteydessä selvitettiin tutkimuspalvelutoiminnan kehittämistä sekä etäkäyttöön soveltuvia aineistoja. 2. Projektin tausta ja tavoitteet Projektin tavoitteena oli tutkimusaineistojen etäkäyttöpalvelu, jossa pääsee käyttämään Yrityksen rakenteet -yksikön tutkimuslaboratorion aineistoja. Koska etäkäyttöpalvelun käyttöönotto vaati paljon hallinnollista valmistelutyötä ja palvelun toteuttaminen vaati tutustumista teknisiin ratkaisuihin, projektin suunnitteluvaiheessa päätettiin toteuttaa vain etäkäyttöjärjestelmän testiversio, jonka pohjalta suunnitellaan tuotantoon soveltuva järjestelmä. Tilastokeskuksen tiloissa sijaitsevassa tutkimuslaboratoriossa tutkijat ovat päässeet käyttämään aineistoja, joita ei ole katsottu tietosuojasyistä muutoin voitavan luovuttaa tutkimuskäyttöön. Tämän palvelun ongelmana on ollut se, että tutkimuslaboratoriossa työskentely saattaa heikentää aikarajoitteista sekä muista kustannussyistä johtuen tutkimustyön huolellisuutta ja laatua. Lisäksi alueellisesta näkökulmasta tarkasteltuna tutkijat eivät ole olleet tasapuolisessa asemassa. Kansainvälinen kehitys on suuntautunut kohti tilastoviranomaisten aineistojen etäkäyttömahdollisuutta. Moni Euroopan tilastovirastoista ylläpitää mikroaineistojen etäkäyttöpalvelua, ja Pohjoismaista Tanskalla ja Ruotsilla on jo useamman vuoden ollut käytössä kattavasti rahoitetut etäkäyttöpalvelut. Tilastokeskus on jäämässä tästä kehityksestä selvästi jälkeen. Tilastokeskus on aktiivisesti hakenut hankkeelle ulkopuolista rahoitusta. Toistaiseksi kuitenkaan Suomen Akatemialle loppuvuodesta 2003 tehty rahoitushakemus sekä muut rahoitusneuvottelut eivät ole tuottaneet tulosta. Näin ollen hanke käynnistettiin 2008 Tilastokeskuksen omalla rahoituksella.
4(21) Tietosuojakäytännöissä olevien yhteneväisyyksien vuoksi etäkäyttöjärjestelmän suunnittelun lähtökohdaksi otettiin Tanskan ja Hollannin tilastoviranomaisten etäkäyttöjärjestelmät, joiden ratkaisumalleja hyödyntämällä pystyttiin säästämään suunnitteluun ja toteutukseen vaadittavia resursseja merkittävästi. Projektin esiselvitysvaiheessa tutustuttiin Tanskan ja Hollannin järjestelmiin, jonka jälkeen päätettiin toteutusmalli. Suunnittelutyössä on lähdetty siitä, että etäkäyttöjärjestelmä palvelee tulevaisuudessa laajasti eri alojen tutkijoita ja että järjestelmästä muodostuu ensisijainen kanava Tilastokeskuksen mikroaineistojen käytölle. Järjestelmän rinnalla on käytössä myös muita aineistojen luovutustapoja. 3. Projektin tulokset ja tavoitteiden saavuttaminen Projektissa rakennettiin etäkäyttöjärjestelmän testiversio. Järjestelmä toimii Tilastokeskuksen palvelimella ja se on mitoitettu noin kahdeksalle yhtäaikaiselle käyttäjälle. Käyttäjien kannalta järjestelmä tarjoaa kaikki tutkimustyöhön tarpeelliset ominaisuudet, joskin esimerkiksi ohjelmistotarjonta on hieman suppea. Järjestelmä on ollut koekäytössä neljän taloudellisen tutkimuslaitoksen toimesta toukokuusta 2009 alkaen. Projektissa on luotu alustavat säännöt ja sopimusmalli etäkäyttöä varten. Lisäksi projektissa on selvitetty etäkäyttöön soveltuvia tutkimusaineistoja sekä tietosuojalinjauksia, jotka ovat palvelun sisällön kannalta keskeisiä kysymyksiä. Projektissa todettiin, että tietosuojalinjauksen selvittäminen vaatii lisätyötä eikä asiaa saada projektin yhteydessä ratkaistua. 3.1 Etäkäyttöpalvelu tutkijan näkökulmasta Etäkäyttöpalvelussa tutkijat ottavat yhteyden omalta työpaikaltaan Tilastokeskuksen palvelimeen. Palvelimella tutkijalla on käytössään Windowstyöpöytä, jolla tutkija pääsee käyttämään Tilastokeskuksen yksikköaineistoja. Työskentely-ympäristön suunnittelun tavoitteena oli tehdä siitä tutkijoiden näkökulmasta mahdollisimman yksinkertainen. Koekäyttövaiheessa työskentelyvälineinä olivat STATA-, SPSS-, ja R-tilasto-ohjelmistot. Ympäristö vastaa muuten normaalia työasemaa, mutta tietojen siirto järjestelmästä tapahtuu tarkistusmenettelyn kautta. Tarkistusmenettely hankaloittaa tutkimustyötä, mutta parantaa tietosuojan valvontaa. Tiedonsiirron järjestelmästä tulee olla täysin estetty, jotta yksikkötietojen siirto voidaan estää. Viimekädessä vastuu tietosuojasta on kuitenkin etäkäyttösopimuksen mukaan tutkijalla. Jokaisen tutkimushankkeen viemisestä etäkäyttöön tehdään sopimus, jonka edellytyksenä on tietojen käyttölupa. Tutkimushankkeessa voi olla mukana yksi tai useampi tutkija. Hankkeen etäkäyttösopimuksessa edellytetään, että tutkijoiden työnantajat ovat tehneet sopimuksen etäkäyttöyhteyden avaamisesta kyseisiin tutkimusorganisaatioihin. Organisaatio valitsee yhteyshenkilöt, jotka vastaavat etäkäytön käyttäjätuesta sekä etäkäytön sääntöjen noudattamisesta sopimuksen purkamisen uhalla.
5(21) 3.2 Etäkäyttöpalvelun hallinnointi Sopimuksia tehdään ainoastaan luotettavien ja vakiintuneiden kotimaisten tieteellistä tutkimusta tekevien organisaatioiden kanssa. Tällaisia ovat muun muassa korkeakoulut ja tutkimuslaitokset. Jatkossa tavoitteena on tehdä mahdolliseksi asiakkaille omien ohjelmisto- tai laiteresurssien hankkiminen järjestelmään. Käytännössä tämä voidaan toteuttaa tekemällä sopimus laitteiden tai ohjelmalisenssien vuokrauksesta ja ylläpidosta. Järjestelyllä voitaisiin nostaa palvelutasoa asiakkaiden yksilöllisiä tarpeita vastaavaksi. Koekäyttövaiheessa palvelun käytöstä ei veloitettu. Koekäyttöön osallistuneet tutkimuslaitokset ja tutkijat sitoutuivat järjestelmän testaamiseen, kehittämiseen ja palautteen antamiseen. Koekäytön päätyttyä palvelu muuttuu maksulliseksi. Etäkäyttöpalvelun hallinnoinnissa keskeisimmät osa-alueet ovat tutkimushankkeiden käyttölupien hallinta sekä tulosten tarkistustyö. Palvelun hallinnointi on suunniteltu pitkälti Tilastokeskuksen nykyisen käyttölupakäytännön sekä tutkimuslaboratorion toimintamalliin pohjalta. Uuden tutkimushankkeen perustaminen alkaa käyttöluvan käsittelyllä. Tutkijoiden näkökulmasta käyttölupien käsittelyajat ovat toisinaan olleet ongelmallisen pitkiä. Etäkäyttöpalvelussa aineistoista on tarkoitus muodostaa soveltuvissa tapauksissa valmiita, hyvin dokumentoituja kokonaisuuksia, jotta käyttölupien käsittelyaikoja saataisiin lyhennettyä. Lisäksi aineistokuvaukset viedään verkkosivuille. Koska tutkimusorganisaatioiden etäkäyttöyhteyshenkilöt vastaavat ensisijaisesti tutkijoiden perehdyttämisestä sääntöihin ja järjestelmän käyttöön, vähenee tutkimuspalvelun käyttäjäneuvontaan tarvitsema aika. Yhteyshenkilöitä tiedotetaan järjestelmän muutoksista sekä käyttökatkoista. Uusille yhteyshenkilöille järjestetään koulutustilaisuus etäkäytön säännöistä ja ehdoista. Jokaiselle käyttäjälle tehdään erillinen käyttäjätunnus etäkäyttöjärjestelmään. Käyttöoikeuksien hallinnointiin toteutetaan hallintasovellus, joka tarjoaa yksinkertaisen käyttöliittymän käyttäjähallintaan. Tällöin käyttöoikeuksien hallinta ei vaadi järjestelmän ylläpitotaitoja ja käyttöoikeuksia voidaan ylläpitää tutkimuspalvelun toimesta. Kun tutkijat haluavat siirtää tutkimustuloksia järjestelmästä, tulokset tarkistetaan tutkimuspalvelussa ennen niiden lähettämistä tutkijalle. Tarkistustyö on sikäli vaativaa, että tarkistajan tulee ymmärtää hyvin tietosuojakysymykset sekä tutkijoiden käyttämät empiiriset tutkimusmenetelmät. Tarkistamiseen menevän työmäärän vähentämiseksi tarkistukseen soveltuvasta materiaalista on annettu yksityiskohtaiset ohjeet. Tarkistuksen apuvälineeksi on suunniteltu sovellus, joka tarkastaa että tarkistukseen tuodut tiedot ovat ohjeistuksen mukaisessa muodossa. Myöhemmässä vaiheessa on tarkoitus selvittää, voidaanko, muiden maiden mallia seuraten, siirtyä käyttämään tulosten satunnaistarkistusta kokeneiden käyttäjien kohdalla.
6(21) 3.3 Koekäyttö ja testaus Etäkäyttöpalvelun hinnoitteluun vaikuttaa merkittävästi se, mitä kustannuksia pyritään kattamaan. Liitteenä olevan hinnoittelusuunnitelman lähtökohtana on, että etäkäyttöympäristöön tehtyjä laitteisto- tai ohjelmistolisenssiinvestointeja ei pyritä kattamaan vaan maksuilla on arvioitu katettavan tutkimuspalvelun sekä teknisen ylläpidon kustannukset. Lisäksi hinnoittelusuunnitelmassa käyttäjiä pyritään ohjaamaan toimintatapoihin, jotka aiheuttavat tutkimuspalvelulle mahdollisimman vähän työtä ja kustannuksia. Uuden tutkimushankkeen perustamisesta peritään 400 perusmaksun lisäksi 600 lisämaksu, mikäli käyttölupaa haetaan aineistolle, jonka tietosuojaa pitää selvittää. Tutkijoita pyritään näin ohjaamaan käyttämään valmiita aineistokokonaisuuksia. Tutkijakohtainen aineiston muokkaus tai selvitysten tekeminen kuuluvat tutkimuspalveluun, jonka hinnat ovat Tilastokeskuksen hinnoitteluoppaan mukaisia. Etäkäyttöyhteyden avaamisesta tutkimusorganisaatioon peritään 1000, jolla katetaan hallinnointityötä, sopimusta varten tarvittavat tietoturvaselvitykset sekä koulutukseen ja muuhun tiedottamiseen liittyvää työtä. Yhteyden ylläpitomaksu on 1000 vuodessa, jolla katetaan ylläpitoon ja hallinnointiin liittyviä kuluja. Lisäksi etäyhteyden käytöstä peritään tutkimushankkeelta 50 kuukausimaksu sekä käyttäjäkohtainen 50 kuukausimaksu. Erillisillä maksuilla pyritään ottamaan huomioon, että hallinnointikuluissa on sekä tutkimushanke- että käyttäjäkohtaisia kulueriä, kuten hankkeen materiaalin säilytys sekä käyttäjän tarvitsemat palvelin- ja ohjelmistoresurssit. Tutkimushankkeille on varattu peruskäyttöön riittävä levytila ja kaksi noin 500 tulossivun tarkistuskertaa. Lisätarkistuksista, muusta materiaalin siirrosta ja lisälevytilasta veloitetaan erikseen. Jos tutkimustyössä on tauko, hankkeen voi arkistoida, josta peritään erillinen maksu. Projektissa etäkäyttöjärjestelmää testattiin kolmella osa-alueella. Testaus aloitettiin Tilastokeskuksen sisällä helmikuussa 2009, kun järjestelmän runko oli saatu toteutettua. Projektin omassa testauksessa edettiin vaiheittain järjestelmän käytettävyyden ja ulkopuolisten yhteyksien testaukseen. Huhtikuussa 2009 pyydettiin ulkopuoliselta konsultilta lausunto valmiudesta koekäytön aloitukseen. Kun tietoturva oli varmistettu, alkoi toukokuussa 2009 koekäyttö aidoilla aineistoilla tutkijoiden toimesta. Ulkopuolisen koekäytön tarkoituksena oli testata järjestelmän käytettävyyttä, etäkäyttöpalvelinten tehon riittävyyttä ja skaalautuvuutta sekä hallinnointimallin toimivuutta ja sen vaatimia resursseja. Erilaisten käyttötapausten ennakointi sisäisessä testauksessa osoittautui käytännössä hankalaksi, minkä vuoksi ulkopuolisesta palautteesta on ollut paljon hyötyä järjestelmän kehittämisessä sekä sen laajennuksen suunnittelussa. Etäkäyttöjärjestelmän ulkoisiksi koekäyttäjiksi valittiin neljä taloudellista tutkimuslaitosta (ETLA, PT, PTT ja VATT), koska ne ovat olleet merkittävin tutkimuslaboratorion asiakasryhmä. Laitokset ovat myös organisaatioina sopivan kokoisia, mikä on näkynyt joustavuutena sovittaessa hallinnollisista
7(21) asioista. Koekäyttö oli maksutonta, mutta tutkija ja tutkimuslaitokset sitoutuivat osallistumaan järjestelmän kehittämiseen ja antamaan palautetta. Koekäyttösopimus tehtiin yhdeksän tutkimushankkeen kanssa. Hankkeissa oli mukana yhteensä 19 tutkijaa, joskin tyypillisesti hankkeessa oli vain 1-2 aktiivista käyttäjää. Jo yhteyden asennusvaiheessa kävi ilmi, että käyttäjien tunnistamiseen käytetty VPN-yhteysohjelmisto aiheuttaa yhteensopivuusongelmia ja on hankala asentaa. Tämän johdosta uutta tunnistusmenetelmää ryhdyttiin selvittämään jo keväällä. Muutoin tutkijoilta saadun suullisen palautteen perusteella järjestelmä oli toimiva ja selkeä käyttää. Ongelmia aiheuttivat satunnaiset yhteysongelmat sekä levytilarajoitukset. Varsinainen koekäyttöpalaute kerättiin tutkijoilta kirjallisena syys lokakuussa palautelomakkeella, jonka sai täyttää etäkäyttöjärjestelmässä. Lomakkeella pyydettiin kommentoimaan käytettävyyttä ja resurssien riittävyyttä sekä kehitysehdotuksia. Tutkimuslaitoksilta pyydettiin yleisiä kokemuksia kokoava raportti. Tutkimuslaitosten raporttien mukaan kokemukset koekäytöstä olivat valtaosin hyvin myönteisiä. Ongelmia aiheuttivat lähinnä etäkäytön asennus- ja yhteysongelmat. Etäkäyttöä toivotaan laajennettavan mahdollisimman monelle tutkijalle ja järjestelmään toivotaan lisää aineistoja. Myös aineistojen luovutusta eli käyttölupaprosessia toivotaan nopeammaksi ja yksinkertaisemmaksi. Tutkimuslaitoksilta sekä tutkijoilta pyydettiin kommentteja palvelun hinnoittelusuunnitelmaan sekä ympärivuorokautisen päivystyksen järjestämiseen. Tutkimuslaitostasolla hinnoittelua pidettiin kohtuullisena eikä päivystystä kaivattu. Tutkijoista noin kaksi kolmannesta piti hinnoittelusuunnitelmaa kohtuullisena eikä kaivannut päivystystä. Viidesosa tutkijoista piti hintatasoa kalliina, mutta hinnoittelun rakennetta pidettiin kohtuullisen hyvänä. Palautteen mukaan kaikki kymmenen järjestelmää kommentoinutta tutkijaa pitivät sitä yleisesti hyvänä ja toimivana. Ongelmiksi mainittiin juuri yhteysongelmat sekä tulosten tarkastusprosessi. Tulosten tarkastukselta toivottiin nopeutta ja joustavuutta. Tilannetta voidaan parantaa hieman kohdentamalla tarkastukseen paremmin resursseja, mutta merkittävät muutokset toimintamallissa heikentäisivät todennäköisesti tietosuojaa. Kaikki tutkijat pitivät järjestelmää hyvänä käyttää ja merkittävänä parannuksena tutkimuslaboratorioon verrattuna. Työskentelyn aloitukseen kaipasi enemmän ohjeistusta noin viidesosa vastanneista. Järjestelmän resursseja pidettiin riittävinä työskentelyyn, mutta noin puolet vastanneista toivoi nopeampaa palvelinta ja suurempaa levytilaa. Edelleen puolet vastanneista toivoi ohjelmistotarjonnan täydennystä. Eniten toivottiin SAS-tilasto-ohjelmaa ja parempaa mahdollisuutta tekstinkäsittelyyn. Kun kysyttiin tutkijoiden maksuvalmiutta SAS:n käytöstä, maksuvalmius ei ollut selvästikään riittävä, jotta ohjelmisto voitaisiin rahoittaa käyttäjämaksuilla.
8(21) 4. Järjestelmän kuvaus Projektissa rakennettu etäkäyttöjärjestelmän testiversio on toteutettu Microsoft Windows Terminal Services (TS) -alustalle. Palvelimet on virtualisoitu Tilastokeskuksen VMware-ympäristöön, eikä järjestelmää varten ole hankittu erillisiä palvelimia. 4.1 Palvelimet Etäkäyttöjärjestelmässä on yhteensä kahdeksan virtuaalista palvelinta, joiden käyttöjärjestelmänä on Windows Server 2008 Standard (64 bit). Palvelimet on eristetty Tilastokeskuksen verkosta omaksi verkkoalueekseen. TS Gateway -palvelin vastaa järjestelmän yhteydestä ulkoverkkoon eli internettiin. Palvelimella on TS Web Access -palvelu, jonka kautta käyttäjät kirjautuvat järjestelmään. Järjestelmän tietoliikenne kulkee Tilastokeskuksen normaalia internet-yhteyttä pitkin, ja liikenne salataan käyttäjän ja järjestelmän välillä HTTPS-protokollaa käyttäen. Järjestelmän runko koostuu kahdesta TS-palvelimesta, jotka huolehtivat tilastosovellusten ajamisesta. Koska suurien aineistojen käyttö vaatii paljon muistia, on molempien palvelimien käytössä 32 GB muistia. VMware huolehtii siitä, että virtuaaliset TS-palvelimet toimivat erillisissä fyysisissä koneissa. Useamman TS-palvelimen avulla järjestelmään saadaan lisää suorituskykyä ja vikasietoisuutta. Palvelinten virtualisointi helpottaa erityisesti TS-palvelinten ylläpitoa. Järjestelmää laajennettaessa uusi TS-palvelin saadaan helposti kloonaamalla olemassa oleva palvelimesta kopio ja määrittämällä sen yksilöivät asetukset. Virtualisointi tuo myös merkittävää vikasietoisuutta järjestelmään. Virtuaaliset palvelimet on toteutettu neljän fyysisen koneen avulla, jolloin yhden koneen hajotessa siirtyvät sillä ajossa olleet virtuaalipalvelimet jollekin toimivista koneista. Molemmat TS-palvelimet sisältävät RES PowerFuse -ohjelmiston, jonka avulla käyttäjien työpöytänäkymiä sekä niihin liittyviä oikeuksia pystytään hallitsemaan joustavasti. PowerFuse käyttää SQL-tietokantaa asetusten tallentamiseen. Tietokantaan tallentuvat myös lokitiedot käyttäjän ajamista sovelluksista, käytetystä prosessoriajasta sekä muistista. Tietokantaa varten järjestelmässä on Microsoft SQL -palvelin. TS-palvelinten välisestä kuormanjaosta vastaa TS Session Broker -palvelin. Se huolehtii myös, että käyttäjä palaa yhteyden katkaisemisen jälkeen aina sille palvelimelle, jossa hänellä on istunto auki. Lisäksi palvelimella on Terminal Services -ympäristön vaatima lisenssien valvontasovellus. Active Directory -palvelin (AD) tarjoaa TS-ympäristön tarvitsemat nimi- ja hakemistopalvelut. Koska Tilastokeskus käyttää ensisijaisesti edirectorya käyttäjätietojen tallentamiseen, on AD-palvelin synkronisoitu edirectoryhakemistopalvelimeen. Käyttäjäoikeudet määritellään ensin edirectoryyn, josta ne päivittyvät AD-palvelimelle automaattisesti.
9(21) 4.2 Järjestelmän käyttö Järjestelmän tiedostopalvelin sisältää etäkäyttöön tarkoitetut aineistot sekä käyttäjien levytilat. Oikeudet tiedostoihin on määritelty AD:ssa ryhmien avulla. Kullakin tutkimushankkeella on oma ryhmänsä, johon hankkeen jäsenet kuuluvat. Lisäksi levytilan käyttöä rajoitetaan ns. quota-määrityksillä, joilla kullekin hankkeelle saadaan määriteltyä sallittu levytilan käyttö. Palvelinten päivitys ja varmuuskopiointi on liitetty osaksi Tilastokeskuksen normaaleja ylläpitorutiineja. Tiedostopalvelimen sisällöstä otetaan varmuuskopiot nauhalle joka yö. Nauhalle voidaan myös tarvittaessa arkistoida tutkimushankkeita. Käyttöjärjestelmien varmuuskopiointi tehdään VMwaren omilla työvälineillä. Kopioita otetaan ohjelmistopäivitysten ja asetusmuutosten jälkeen. Etäkäyttöjärjestelmään kirjaudutaan virtuaalityöpöytäyhteyden avulla käyttäjän omalta työasemalta. Käyttäjä tarvitsee kirjautumiseen Internet Explorer -selaimen, jolla hän siirtyy TS Web Access -palveluun. Käyttäjätunnuksen syöttämisen jälkeen järjestelmä kysyy käyttäjältä koodia, jonka hän saa ennalta sovittuun matkapuhelinnumeroon tekstiviestinä. Koodi on kertakäyttöinen ja se saapuu puhelimeen flash-viestinä, jolloin se ei tallennu puhelimeen. Perinteinen käyttäjien tunnistamismenetelmä perustuu vain tunnussalasanapariin. Menetelmän ongelmana on käyttäjien taipumus valita helppoja salasanoja tai säilyttää salasanoja muistilapuilla. Järjestelmässä on käytössä vahva tunnistaminen, jossa tunnus-salasanaparin lisäksi kirjautumiseen vaaditaan jotain mitä käyttäjällä on (esim. avainkortti, sertifikaatti tai puhelimen SIM-kortti). Koekäytön alussa vahva tunnistaminen tehtiin VPNyhteyden avulla, joka vaati käyttäjän koneelle asennetun salasanalla suojatun sertifikaatin. VPN-asiakasohjelman yhteensopivuusongelmien vuoksi koekäytön päätyttyä siirrytään tekstiviestiin perustuvaan järjestelmään. Tekstiviestitunnistuksen etuna ovat lisäksi yksinkertaisempi hallinnointi sekä alhaisemmat lisenssikulut. Kirjauduttuaan järjestelmään käyttäjä valitsee TS Web Access -palvelussa tutkimushankkeen, jonka kanssa hän alkaa työskennellä. Tämän jälkeen käyttäjälle avautuu virtuaalityöpöytäyhteys ja näkyviin tulee Windows 2008 Server -käyttöjärjestelmän riisuttu työpöytänäkymä. Kaikki tarvittavat ohjelmat ja kansiot on tehty pikakuvakkeiksi käyttäjän virtuaalityöpöydälle. Käyttäjä ei voi itse muokata tätä näkymää, eikä hänellä ole käyttöoikeutta muihin kuin työpöydällä näkyviin sovelluksiin. Tiedostojen siirto käyttäjän eri hankkeiden välillä on estetty. Jokaisella tutkimushankkeella on työskentelyhakemisto, johon hankkeessa mukana olevilla käyttäjillä on kirjoitusoikeudet. Hakemistossa käyttäjät voivat perustaa omia työskentelyhakemistoja sekä jakaa tiedostoja hankkeen muiden käyttäjien kanssa. Mikäli hankkeella on käyttölupa joihinkin perusaineistoihin, näkyvät ne käyttäjälle omassa hakemistossaan SAS-tiedostoina. Muutoin hankkeen aineistoja säilytetään työskentelykansiossa. Tarkastettavaksi tarkoitetuille tulostiedostoille on oma hakemistonsa. Lisäksi aineisto-
10(21) kuvaukset, järjestelmän käyttöohjeet sekä säännöt ovat omassa hakemistossaan. Lopettaessaan työskentelyn käyttäjä voi joko katkaista yhteyden järjestelmään tai kirjautua istunnosta ulos. Yhteyden katkaisussa avoimina olleet sovellukset eivät sulkeudu, vaan jäävät auki. Näin käyttäjä voi jättää pitkään kestäviä ajoja järjestelmään ilman, että hänen täytyisi pitää yhteyttä yllä. Lisäksi yhteys katkaistaan automaattisesti, jos käyttäjä ei tee mitään tietyn ajan kuluessa. Uloskirjautumisessa puolestaan avoinna olleet sovellukset sulkeutuvat. 5. Projektin organisointi ja resursointi 5.1. Projektiorganisaatio 5.2. Resurssien käyttö Projektiorganisaatiota uudistettiin projektipäällikön vaihduttua marraskuussa 2008. Projekti- ja ohjausryhmän muutos tehtiin 19.12.2008 asettamiskirjeellä TK-04-468-08. Alkuperäinen projektiorganisaatio on mainittu liitteenä olevassa alkuperäisessä asettamiskirjeessä. Projektiryhmän kokoonpano muutoksen jälkeen oli: projektipäällikkö Jouko Verho (YR) sekä jäsenet Eero Koljonen (SH), Janika Konnu (TI), Harri Koskinen (TI), Mika Maliranta (YR), Mika Muttonen (TI), Tuomas Paavola (YR, projektipäällikön varahenkilö) ja Tenho Vastaranta (TI). 1 Ohjausryhmän kokoonpano muutoksen jälkeen oli: puheenjohtaja Leena Storgårds (YR) ja jäsenet Sven Björkqvist (SH), Kari Djerf (TI), Riitta Harala (EL), Antti Katainen (HP), Kari Lehto (TI), Anna-Leena Reinikainen (HA), Marja Sjöblom (YR), Jari Tarkoma (HE), Tuula Viitaharju (YS) sekä sihteeri Jouko Verho (YR). Projektiryhmä kokoontui 10 kertaa vuonna 2008 ja 25 kertaa vuonna 2009. Kokousten puheenjohtajana ja sihteerinä toimi projektipäällikkö. Osasta vuoden 2008 ja kaikista vuoden 2009 kokouksista on kirjoitettu muistiot. Ohjausryhmän kokoontui kolme kertaa vuonna 2008 ja yhdeksän kertaa vuonna 2009. Ohjausryhmän kokousten pöytäkirjat, projektin väliraportti sekä muita tärkeimpiä dokumentteja on viety Tilastokeskuksen intra-sivuille. Etäkäyttöprojektin tehtävät voidaan jakaa hallinnollisiin ja teknisiin tehtäviin. Hallinnollisia tehtäviä olivat muun muassa tietosuojan ja sopimusasioiden selvittely sekä etäkäyttöön tulevien aineistojen valmistelu. Projektipäällikkö vastasi pääasiassa hallinnollisista tehtävistä ja muu projektiryhmä avusti niissä. Etäkäyttöjärjestelmän suunnittelusta, toteutuksesta ja dokumentoinnista vastasivat TI-yksikön Käyttö- ja mikrotuki -vastuualueen henkilöt. 1 Tilastokeskuksen yksiköiden lyhenteet ovat: Elinolot (EL), Hallintopalvelut (HA), Henkilötilastot (HE), Hinnat ja Palkat (HP), Pääjohtajan sihteeristö (SH), Tietotekniikka- ja menetelmäpalvelut (TI), Yritysten rakenteet (YR), Yritysten suhdanteet (YS).
11(21) Taulukossa 1 on esitetty työajanseurannan mukaan projektiin käytetty aika sekä tammikuussa 2009 tehdyn työpanosten allokoinnin mukainen suunniteltu työajan käyttö. Kirjatut tunnit olivat tammi syyskuussa 2009 kohtuullisen lähellä suunniteltua, joskin seurannan tarkkuus on lähinnä suuntaa antavaa. Taulukko 1. Projektiryhmän projektiin työajanseurannan mukaan käyttämä aika ja suunniteltu ajankäyttö päivinä. 2008 toteutunut huhti joulukuu 2009 toteutunut tammi syyskuu 2009 suunniteltu tammi syyskuu Projektipäällikkö 59 86 88 Toteutus (TI VA851) 23 88 96 Muu projektiryhmä 14 63 58 Yhteensä 108 232 242 Etäkäyttöjärjestelmän testiversio pyrittiin toteuttamaan mahdollisimman pitkälle hyödyntämällä TI-yksikön olemassa olevia laitteisto- ja ohjelmistoresursseja. Kun järjestelmää laajennetaan, se täytyy siirtää omaan ympäristöönsä. Vuoden 2008 menot olivat noin 8200, jotka syntyivät tutustumisvierailuista Hollannin ja Tanskan tilastovirastojen etäkäyttöjärjestelmiin sekä alustavista ohjelmistohankinnoista. Projektin budjetti tarkistettiin tammikuussa 2009. Taulukossa 2 on esitetty vuodelle 2009 budjetoidut, tammi toukokuussa toteutuneet sekä loppuvuodelle 2009 suunnitellut menot. Loppuvuonna on tarkoitus täydentää ohjelmistovalikoimaa sekä toteuttaa järjestelmän ulkopuolinen auditointi. Projektille budjetoidut atk-laitevarat käytetään etäkäyttöjärjestelmän levypalvelimen hankintaan. Taulukko 2. Projektille vuodelle 2009 budjetoidut, toteutuneet sekä suunnitellut menot. Menolaji Budjetoitu, Toteutunut tammi syyskuu, Suunniteltu loka joulukuu, Tilasto-ohjelmistot 23 000 6 200 16 000 Muut ohjelmistot 20 000 7 000 11 000 Atk-laitteet 18 000 18 000 Auditointi 15 000 15 000 Muu konsultointi 10 000 4 500 5 500 Yhteensä 86 000 17 700 65 500 6. Jatkotoimet 6.1 Järjestelmän laajennus ja ylläpito Etäkäyttöjärjestelmän laajennus on suunniteltu tehtävän kahdessa vaiheessa. Laajennuksen edellytyksenä on, että etäkäyttöpalvelulle saadaan riittävä rahoitus. Ensimmäisessä vaiheessa testiympäristö siirretään erilliselle palvelimelle ja sen resursseja kasvatetaan huomattavasti. Testiympäristö oli suunniteltu enintään kahdeksalle yhtäaikaiselle käyttäjälle. Laajennettu järjestelmä on suunniteltu noin 30 yhtäaikaiselle käyttäjälle, ja sen suunnittelussa on otettu huomioon käyttäjäpalautteessa mainitut puutteet muun muassa huo-
12(21) mattavasti tehokkaampien palvelinten ja suuremman levyjärjestelmän muodossa. Ensimmäisen vaiheen laajennuksen jälkeen järjestelmä pystyy palvelemaan huomattavasti nykyisiä tutkimuslaboratorion käyttäjiä laajempaa joukkoa. Arvion perusteella järjestelmässä voisi olla noin 100 käynnissä olevaa tutkimushanketta, joskin tutkijoiden aktiivisuuden arvioiminen pienimuotoisen koekäytön perusteella on epävarmaa. Tällöin järjestelmä pystyisi palvelemaan taloustieteen alan tutkimushankkeita sekä mahdollisesti myös joukkoa muiden alojen tutkimushankkeita. Ensimmäisen vaiheen laajennus voidaan toteuttaa jo alkuvuodesta 2010. Toisessa vaiheessa järjestelmää on suunniteltu laajennettavan edelleen kolminkertaiseksi, jolloin järjestelmä voisi palvella ainakin 300 käynnissä olevaa tutkimushanketta, mikä olisi jo lähellä Tanskan etäkäyttöjärjestelmän laajuutta. Tämä tarkoittaisi Tilastokeskuksen tutkimuspalvelun huomattavaa lisäystä, minkä vuoksi laajennus on suunniteltu vuodelle 2012, jotta toiminta ehditään sopeuttaa. Jälkimmäiselle laajennukselle ei ole laadittu yksityiskohtaista suunnitelmaa, vaan se perustuu ensimmäisen vaiheen laajennuksen skaalaukseen, koska useamman vuoden päähän laaditut hankintasuunnitelmat ovat väistämättä toteutushetkellä vanhentuneita. Taulukossa 3 on esitetty arvio etäkäyttöjärjestelmän ensimmäisen vaiheen laajennuksen tietotekniikkaympäristön kustannuksista. Laskelma on tehty olettaen, että laajennuksessa voidaan hyödyntää testiympäristöä varten hankittuja lisenssejä ja että vuoden 2009 loppuun suunnitellut hankinnat saadaan toteutettua suunnitellusti. Järjestelmän ylläpitokustannukset ovat noin 10 15 prosenttia laitteistojen ja ohjelmistojen hankintakustannuksesta. Taulukko 3. Kustannusarvio etäkäyttöjärjestelmän ensimmäisen vaiheen laajennuksesta. Menolaji Hankintakustannus, Laitteistot 57 000 Ohjelmistot 95 500 Yhteensä 152 500 Suunnitellun järjestelmän toteutukseen tarvitaan työaikaa noin 2 3 kuukauden verran. Lisäksi ylläpitoa helpottavista sovelluksista on tarkoitus toteuttaa vuoden 2010 puolella materiaalin siirto- ja tulosten tarkistusohjelma, joka voidaan tehdä joko talon sisällä tai teettää ulkopuolisena konsultointina. Järjestelmän ylläpitoon ja rutiininomaiseen päivitykseen työaikaa on syytä varata ensimmäisenä vuonna 2 kuukautta olettaen, että käyttäjähallinta saadaan siirrettyä täysin tutkimuspalvelun hoidettavaksi. Etäkäyttöjärjestelmän ylläpito sekä kehitystyön toteutus on mahdollista siirtää tuotantovaiheessa ulkoiselle palveluntarjoajalle. Kehitystyön suunnittelua ei voida käytännössä ulkoistaa, koska työn valvonta olisi mahdotonta. Myöskään käyttäjäoikeuksien hallintaa eikä tuloksien tarkistustyötä voida ulkoistaa, koska ne liittyvät kiinteästi käyttölupien hallinnointiin ja valvontaan sekä muuhun tutkimuspalvelun työhön.
13(21) 6.2 Tutkimuspalvelun kehittäminen Mikäli ylläpito tai kehitystyön toteutus hankitaan ulkoiselta palveluntarjoajalta, on toimintamallin etuna selkeä kustannusrakenne ja riippumattomuus Tilastokeskuksen TI-yksikön resurssitilanteesta. Tosin myös etäkäyttöjärjestelmän eriyttäminen Tilastokeskuksen muusta ympäristöstä tuo vastaavia etuja. Lisäksi kaupallinen palveluntarjoaja pystyy helpommin tarjoamaan ympärivuorokautista teknistä päivystystä, joskaan sitä ei koekäyttöpalautteen perusteella kaivattu. Etäkäyttöjärjestelmän ylläpidon ulkoistamiseen liittyy myös merkittäviä haasteita. Koska järjestelmää on tarkoitus kehittää voimakkaasti, toistaiseksi ei ole selkeää käsitystä, mille kokonaisuudelle ylläpito hankitaan. Ylläpitosopimuksen tulee olla sellainen, että se ei rajoita järjestelmän kehitystyötä ja että se mahdollistaa palveluntarjoajan vaihtamisen. Näin ollen onnistuneen ulkoistamisen edellytyksenä on huolellisesti laadittu ylläpitosopimus. Mahdollisen ulkoistamisen jälkeen palvelun toiminnan seurantaan ja sopimusehtojen noudattamiseen tulee kiinnittää erityistä huomiota. Lisäksi ulkoistamiseen liittyvät tietosuojariskit tulee arvioida huolella. Vaikka etäkäyttöjärjestelmän käyttöönotto tuo välittömän parannuksen yritysaineistoja käyttäville tutkijoille, tulisi tutkimuspalvelun toimintaa kehittää myös kokonaisvaltaisesti. Tutkimuspalvelulle tulisi luoda toimintastrategia, ja sen tavoitteena tulisi olla toiminnan laadun ja tehokkuuden parantaminen sekä tutkimusaineistojen kehittäminen. Tutkimuspalvelu on hajautettu Tilastokeskuksessa aineistoja hallinnoiviin tulosyksiköihin, joissa on katsottu olevan paras asiantuntemus aineistoista. Malli on ollut Tilastokeskuksen kannalta toimiva, mutta tutkijoiden näkökulmasta hajanaisuus on hankaloittanut aineistojen saatavuutta ja näyttäytynyt epäyhtenäisenä toimintamallina. Tätä taustaa vasten tutkimuspalvelun kehittämisen haasteina ovat mm. käyttölupapäätösten käsittelyn nopeuttaminen sekä yksinkertaistaminen, tutkimuspalvelun volyymin nostaminen, aineistojen käytön seurannan parantaminen ja palvelu- sekä laskutuskäytäntöjen yhdenmukaistaminen. Muissa maissa tutkimuspalvelu on tyypillisesti keskitetty omaan organisaatioonsa. Tutkimuspalvelun keskittäminen tehostaisi toimintaa ja helpottaisi sen seurantaa sekä kehittämistä. Käyttölupaprosessia voidaan nopeuttaa tutkimuspalvelun keskittämisen lisäksi valmistelemalla tutkijoille valmiita ja hyvin dokumentoituja aineistokokonaisuuksia. Hallinnollisesti käyttölupamenettelyä voidaan nopeuttaa keskittämällä tutkimushankekohtaiset lupapäätökset tutkimuspalvelusta vastaavalle johtajalle. Kukin tulosyksikkö tekee päätöksen hallinnoimiensa aineistojen tutkimuskäyttöön soveltuvasta tietosisällöstä, mutta ei käsittele yksittäisien tutkimushankkeiden hakemuksia. Käyttöluvista pidetään ajantasaista luetteloa, joista tulosyksiköt voivat seurata aineistojen tutkimuskäyttöä. Etäkäyttöjärjestelmä tuo uuden aineistojen luovutusmuodon perinteisien luovutusmuotojen rinnalle. Käyttölupakäytännön selkeyttämiseksi olisi etä-
14(21) 6.3 Tutkimuspalvelun rahoitus käytön tietosuojasta syytä tehdä erillinen linjaus. Koska tietosuojakäytännöstä esitetään runsaasti kritiikkiä, tulisi lupakäytännön avoimuutta pyrkiä lisäämään. Tutkimuspalvelun kehittämiseksi asetettiin marraskuussa 2009 työryhmä. Työryhmä valmistelee ehdotukset muun muassa käyttölupamenettelyn parantamiseksi sekä tutkimuspalvelun organisoimiseksi ja voimavarojen kohdentamiseksi. Tutkimuspalvelua on Tilastokeskuksessa harjoitettu maksullisena toimintana vuosien ajan, koska se ei kuulu Tilastokeskuksen ydintoimintoihin eikä sitä näin ollen voida rahoittaa budjettivaroilla. Tutkimusaineistojen kehitystyöhön olisi ehdottomasti saatava budjettirahoitusta, sillä tilastotuotantoa varten kerätyt aineistot eivät sellaisenaan sovellu tutkimuskäyttöön vaan niiden muokkaaminen vaatii huomattavasti resursseja. Nykyisen maksuperustelain mukaan kehitystyön kustannukset joudutaan perimään käyttäjiltä. Tämän vuoksi kehittämistyötä tehdään yksittäisten tutkimushankkeiden tarpeiden mukaan, mikä johtaa työn hitauteen ja tehottomuuteen. Jos kehitystyöhön saadaan rahoitusta, voidaan sitä tehostaa suunnittelemalla se riittävän pitkäjänteisesti. Lisäksi aineistojen käyttö tulee halvemmaksi, mikä lisää käyttäjien määrää. Aineistojen käytön lisäys parantaa edelleen aineistojen tuntemusta ja laatua. Tästä on hyötyä myös tilastotuotannossa, koska aineistoista saadusta palautteesta on hyötyä tilastojen laadun ja relevanssin kehittämisessä. Tilastokeskus on esittänyt useana vuonna TTS-suunnitelmassaan rahoitusta tutkimuspalvelun kehittämiseksi. Vuosien 2011 2014 TTS-suunnitelmassa todetaan seuraavaa: Tilastokeskus on rakentanut tutkijapalvelujen parantamiseksi etäyhteyden. Palvelun käytettävyys ja varsinkin sen laajentaminen edellyttävät mittavaa työmäärää aineistojen saattamiseksi sellaiseen kuntoon, että tutkijat voivat niitä etäyhteyden kautta käyttää ja sen jälkeen jatkuvan palvelukapasiteetin ylläpitoa. Toiminnan laajentaminen ei ole mahdollista peruskehyksen puitteissa. Aineistojen kuntoon saattamiseksi tarvitaan vuosina 2011 ja 2012 lisärahoitusta 400 000 euroa/vuosi ja lisää henkilötyövuosia 5 htv/vuosi. Tämän lisäksi palvelujen tuottamiseen tarvitaan vuodesta 2013 eteenpäin 1000 000 euroa/vuosi ja lisää henkilötyövuosia 10 htv/vuosi. TTS:ssä kuvatun resurssitarpeen lisäksi tulee huomioida, että palvelua laajennuksen yhteydessä ensimmäiselle toimintavuodelle kohdistuu huomattavat laitteisto- ja ohjelmistoinvestoinnit. Tutkimuspalvelutoiminnan laajentaminen ja kehittäminen vaatii resursseja, jonka vuoksi rahoituskysymys on syytä ratkaista mahdollisimman pikaisesti. Ilman lisärahoitusta palvelun kehittäminen on mahdotonta.
15(21) 6.4 Etäkäyttöön soveltuvat tutkimusaineistot Etäkäyttöjärjestelmään vietiin koekäytön aloituksen yhteydessä keväällä 2009 tutkimuslaboratorion perusaineistot. Tutkimuslaboratorion perusaineistot koostuvat laajasta joukosta yritysaineistoja ja henkilötietoja sisältävistä työntekijä-työnantaja-aineistoista (ns. FLEED-aineisto ja palkkarakenneaineisto), joista luovutetaan etäkäyttöön soveltuva otos. Perusaineistojen lisäksi monella koekäytössä mukana olleella tutkimushankkeella oli niitä varten räätälöityjä henkilötietoja sisältäviä aineistoja. Yleisesti ottaen etäkäyttöjärjestelmä soveltuu kaikkien tavanomaisten yksikköaineistojen analysointiin, jonka vuoksi sinne voidaan viedä lähes kaikki Tilastokeskuksen tutkimuskäyttöön soveltuvat aineistot. Koekäytön yhteydessä tutkijat esittivät toiveita uusien aineistojen tuomisesta etäkäyttöpalveluun. Tilastokeskuksessa on useita elinoloihin liittyviä kyselyaineistoja, joista on suoraviivaista muodostaa tutkimuskäyttöön soveltuva kokonaisuus. Näistä koekäyttöpalautteessa mainittiin erityisesti työvoimasekä työolotutkimusaineistot. Lisäksi mainittiin tulonjakoaineisto, josta pitää muodostaa etäkäyttöön soveltuva otos. Henkilötilastojen tutkimuskäyttöön soveltuvia aineistoja on koottu kattavasti Tietovarasto-tietokantaan. Osa näistä tiedoista on FLEED-aineistossa, mutta sen ulkopuolelle jää paljon tutkijoita kiinnostavia tietoja muun muassa koulutuksesta, perheistä, kotitalouksista sekä asumisesta. Tietovaraston ulkopuolisista aineistoista kiinnostusta on erityisesti väestölaskennan pitkittäisaineistoon sekä kuolemansyytietoihin. Koska nämä ovat kokonaisaineistoja, niistä pitää muodostaa tutkimuskäyttöön soveltuvat otokset. Tutkimuskäyttöön soveltuvien aineistojen kuvaukset on tehty lähtökohtaisesti tilastotuotannon tarpeisiin. Kuten muuhun aineistojen kehitystyöhön, on myös aineistokuvauksien tekemiseen tutkimuskäyttöä varten aivan liian vähän resursseja. Työtä vaikeuttaa osin myös metatiedon hajanaisuus ja puutteet. Tulevaisuudessa työssä voitaneen hyödyntää Tilastokeskuksessa kehitettyä Muuttujaeditoria tai muita vastaavia metatietolähteitä. 6.5 Lopuksi Tilastokeskuksen tuottamalla tilastotiedolla on keskeinen rooli sekä suomalaisessa päätöksenteossa että tutkimustoiminnassa. Taloustieteellisessä tutkimuksessa on yhä enenevässä määrin tarvetta mikrotason aineistoille. Tilastokeskus kerää erittäin laadukkaita aineistoja tilastojen tuottamiseen, mutta tutkimuspalvelutoimintaan on käytössä hyvin niukasti resursseja. Tämän vuoksi on päädytty tilanteeseen, jossa aineistojen käyttöön olisi hyvät tekniset ratkaisut, mutta ne jäävät resurssien puutteen vuoksi hyödyntämättä. Suomi on jäänyt huomattavasti etäkäyttöpalveluiden kehittämisessä muista Pohjoismaista, mikä on muodostunut merkittäväksi ongelmaksi suomalaisen tutkimuksen laadulle. Tämän vuoksi Tilastokeskuksen tutkimuspalvelulle tulisi turvata muiden maiden tapaan riittävä rahoitus, jotta etäkäyttöjärjestelmää ja aineistoja pystyttäisiin kehittämään.
16(21) Liite 1: Projektin alkuperäinen asettamiskirje Helsinki 23.04.2008 Nro TK- 04-468-08 Viite Asia Tutkimuslaboratorion etäkäyttöprojektin asettaminen Tilastokeskus asettaa projektin, jonka tavoitteena on rakentaa ja ottaa käyttöön online-käyttöyhteys Yrityksen rakenteet -yksikössä sijaitsevan tutkimuslaboratorion aineistoihin. Projektin keskeiset tehtävät ovat: - laatia selvitys Tilastokeskuksen tietojen luovuttamista säätelevistä säädöksistä, ohjeista ja linjauksista etäkäyttöjärjestelmän käyttöönoton näkökulmasta ja tarvittaessa tehdä esitys tarvittavista muutoksista; - päättää Tilastokeskuksessa käyttöön otettavan etäkäyttöjärjestelmän tekninen ratkaisu ja määritellä palvelun sisältö ja laatu; - selvittää palvelun aloitus- ja ylläpitokustannukset sekä kartoittaa mahdolliset palveluntarjoajat ja kilpailuttaa palvelu; - valmistella etäkäyttöjärjestelmän kautta tarjottavat tutkimusaineistot; - valmistella etäkäyttöjärjestelmän tekninen toteuttaminen Tilastokeskuksessa; - käynnistää ja koordinoida palvelun testikäyttö ja sen palautteenanto ja neuvotella ulkoisen palveluntarjoajan kanssa mahdollisista muutostöistä; - arvioida online-järjestelmän laajentamismahdollisuudet ja jatkorahoitustarve. Projektiryhmään määrätään projektipäälliköksi Villiina Hellsten (YR) ja jäseniksi Elias Einiö (YR), Jari Forsman (TI), Eero Koljonen (SH), Janika Konnu (TI), Harri Koskinen (TI), Mika Muttonen (TI), Aki Nikander (TI), Pekka Tamminen (YR, projektipäällikön varahenkilö) ja Tenho Vastaranta (TI). Projektiryhmään kutsutaan lisäksi jäseneksi Mika Maliranta (YR). Lisäksi projekti voi käyttää työsuunnitelmassa mainittuja sekä muita Tilastokeskuksen asiantuntijoita erityisosaamista vaativiin tehtäviin. Projektille asetetaan ohjausryhmä, jonka puheenjohtajana toimii Kaija Hovi (YR) ja jäseninä Sven Björkqvist (SH), Kari Djerf (TI), Riitta Harala (EL), Antti Katainen (HP), Markku Lanne (Helsingin yliopisto), Kari Lehto (TI), Marja Sjöblom (YR), Jari Tarkoma (HE), Tuula Viitaharju (YS) sekä sihteerinä Villiina Hellsten. Johtoryhmää voidaan täydentää projektin aikana. Projektin määräaika päättyy 31.10.2009. Projektin laskentakohdekoodi on YA21O. Pääjohtaja Heli Jeskanen-Sundström Tilastojohtaja Kaija Hovi
17(21) Liite 2: Etäkäyttöpalvelun hinnoittelusuunnitelma Käyttöluvat ja sopimukset Uuden käyttöluvan käsittely 400 Käyttöluvan/sopimuksen jatkaminen tai laajentaminen 100 Uuden aineistokokonaisuuden tietosuojan selvitys 600 Tutkimuspalvelu (aineiston käsittely, neuvonta, yms.) Tutkimuspalvelu /tunti 100 Tutkimuspalvelu /kuukausi 8200 Etäkäyttö Etäkäyttöyhteyden avaus organisaatioon 1000 Etäkäyttöyhteyden ylläpito organisaatioon /vuosi 1000 Tutkimushanke etäkäytössä /kuukausi 50 Etäkäyttöyhteys tutkijalle /kuukausi 50 Materiaalin siirto Tulosten ylimääräinen tarkistus /10 sivua 25 Muun materiaalin siirto sisään/ulos (tarkistus) /kerta 25 Levytilan vuokraus 1 GB /vuosi 168 1GB /kuukausi 14 Vähimmäisveloitus materiaalin arkistoinnista /vuosi 25
18(21) Liite 3: Tutkimusaineistojen etäkäyttöjärjestelmän säännöt Järjestelmään kirjautuminen Järjestelmän käyttäminen Tilastokeskuksen yksikkötason aineistojen käyttö edellyttää käyttölupaa. Tietoja saa käyttää vain päätöksessä hyväksyttyyn tarkoitukseen. Tietojen kohteita ei saa yrittää tunnistaa aineistosta. Allekirjoittamalla tutkimushanketta koskevan sopimuksen sekä salassapitositoumuksen tutkija sitoutuu siihen, ettei ilmaise eikä käytä omaksi hyödyksi tutkimuksen yhteydessä tietoonsa saamiaan, salassa pidettäviksi säädettyjä tietoja. Vaitiolovelvollisuus koskee myös tilastotuotantoon liittyviä atkohjelmistoja sekä ohjeistoja koskevia tietoja, joiden ilmitulo vaarantaa tietosuojan. Vaitiolovelvollisuus on voimassa sopimuksen päätyttyäkin. Etäyhteys tutkijan työasemalta Tilastokeskukseen toteutetaan järjestelmän koekäyttövaiheessa VPN-ratkaisuna. Järjestelmään kirjautuminen on kaksitasoinen. Tutkijan työasemaan asennetaan VPN-asiakasohjelman yksilöivä sertifikaatti, jonka järjestelmä tarkistaa kun etäyhteyttä avataan. Lisäksi järjestelmä pyytää käyttäjältä PIN-koodia ennen kuin yhteys avautuu. VPN-yhteyden avaamisen jälkeen käyttäjä kirjautuu järjestelmään hankekohtaisella käyttäjätunnuksella ja salasanalla. Käyttäjän yksilöivät tunnukset ovat henkilökohtaisia ja niitä tulee säilyttää huolellisesti. Erityisesti käyttäjätunnukset ja salasanat tulee säilyttää erillään. Etäkäytön tulee tapahtua yhteyden avaamisesta sopimuksen tehneen asiakkaan tiloista. Etäyhteyden saa ottaa vain asiakkaan määrittämistä IP-osoitteista. Tilastokeskus tarkistaa, että ne ovat käyttöehtojen mukaisia. Etätyöaseman tietoturvapäivitysten sekä virus- ja palomuurisuojauksen on oltava ajantasainen. Tutkimushankkeille varataan työkansio, jossa hankkeen materiaali säilytetään. Lukuoikeudet aineistokansioihin annetaan hankekohtaisen käyttöluvan mukaisesti. Järjestelmää tulee käyttää vain käyttöluvassa mainittuun tarkoitukseen, eikä sen toimintaa saa haitata millään tavoin. Järjestelmän käytöstä kerätään lokitietoja laskutusta, järjestelmän ylläpitoa ja valvontaa varten. 2 Järjestelmän käytöstä laskutetaan resurssien käytön mukaisesti (koekäyttö 30.10.2009 asti on ilmaista). Etäyhteys on tarkoitettu vain asiakkaan nimeämän tutkijan käyttöön. Tästä syystä etälaite on lukittava, jos sen äärestä poistutaan ja laite jää valvomatta. Järjestelmästä tulee kirjautua ulos, kun etäyhteydellä ei enää työskennellä. Tutkimusaineistoon sisältyvät yksikkötason henkilö- tai yritystiedot ovat salassa pidettäviä. Aineistoa on käsiteltävä siten, ettei suojattava tieto joudu sivullisen tietoon. Suojausta voi parantaa muun muassa työtilojen järjestelyillä sekä näytön suojauksella. 2 Rekisteriseloste TK-00-1248-08
19(21) Tutkimustuloksia tai muuta materiaalia saa siirtää järjestelmästä pois vain tarkistusmenettelyn kautta. Tiedostot viedään tarkistukseen kopioimalla ne tarkistuskansioon. Tietosuojatarkistuksen jälkeen tulokset lähetetään suojattuna sähköpostina tutkijan sopimuksessa määrittämään sähköpostiosoitteeseen. Resurssit Ylläpito Kullekin tutkimushankkeelle varataan levytilaa 4GB. Jos levytilaa tarvitsee lisää, siitä veloitetaan erikseen. Järjestelmässä käytettävissä olevat laskenta- ja ohjelmistoresurssit ovat rajalliset ja niiden saatavuus riippuu muiden kirjautuneiden käyttäjien lukumäärästä. Yksittäiselle asiakkaalle tai hankkeelle voidaan tarjota omia laskenta- ja ohjelmistoresursseja erillisen sopimuksen mukaisesti. Projektin materiaali poistetaan järjestelmästä hankeen päätyttyä, jollei säilytyksestä ole tehty erillistä sopimusta. Hankkeessa syntyneet tietoaineistot ovat Tilastokeskuksen omaisuutta. Tilastokeskus vastaa etäkäyttöjärjestelmän ylläpidosta virka-aikana. Ongelmatilanteissa yhteyshenkilönä toimii etäkäytöstä sopimuksen tehneen asiakkaan yhteyshenkilö. Tilastokeskus ei vastaa ohjelmistojen käyttötuesta. Tilastokeskuksella on oikeus sulkea järjestelmä ylläpidollisista syistä. Järjestelmään tehdään ei-kiirellisiä päivityksiä ja asennuksia päivitysaikataulun mukaisesti joka toisen viikon alussa. Aikataulun muutoksista informoidaan yhteyshenkilöitä. Tulosten tarkistusmenettely Salassapitovelvoitteen mukaan tutkijan on pidettävä huolta siitä, että järjestelmästä pois vietäviksi tarkoitetuissa tulostuksissa ja tiedostoissa ei ole yksikkötason tietoja tai mahdollisuutta niiden paljastumiseen. Tutkimustulokset tarkistetaan tietosuojan varmistamiseksi. Tuloksia tai muuta materiaalia kuten ohjelmakoodia saa tuoda tarkistettavaksi vain tekstitiedostoina. Tarkastettavaksi saa tuoda yhteensä enintään 2MB suuruisia tiedostoja eli tulostettuna noin 500 sivua. Tästä taulukointia saa olla enintään 50 sivua. Hankkeen perustamismaksuun kuuluu tulosten tarkastaminen kaksi kertaa. Tämän ylittävästä tarkastamisesta veloitetaan erikseen. Tarkistettavaksi tuotavat tulokset tulee dokumentoida selkokielisesti ja täsmällisesti. Taulukoista tulee käydä ilmi taulukoinnin kohteena olevan aineiston sisältö sekä taulukon soluissa oleva havaintojen lukumäärä. Estimointien tulostuksista tulee käydä ilmi aineiston sisältö sekä havaintojen lukumäärä. Liite A sisältää tarkemmat ohjeet taulukkomuotoisten tietojen suojaamisesta Yritysten rakenteet -yksikössä. Liite B sisältää yleisemmät ohjeet taulukkomuotoisen yritystiedon suojaamiselle. Pääsääntönä yritystietojen suojaamisessa on, että kussakin solussa tai ryhmässä on oltava aina vähintään 3 havaintoa. Lisäksi sovelletaan tarvittaessa dominanssisääntöä (erityisesti tutkimus- ja kehittämismenot). Hyödyketilastojen osalta noudatetaan ensisijaisesti tiedonantajien lukumäärän ja identiteetin salaamisen periaatetta. Henkilötietojen suojaamiselle on laadittu erilliset ohjeet (Liite C). Samat tietosuojasäännöt koskevat myös julkaistavia tutkimustuloksia.
20(21) Tulosten julkistaminen Tutkija sitoutuu julkistamaan tutkimustulokset vain sellaisessa muodossa, ettei niistä voida tunnistaa yksittäisen yrityksen tai henkilön tietoja. Valmis tutkimusjulkaisu tulee lähettää Tilastokeskukselle elektronisessa muodossa. Tilastokeskuksella on oikeus pyytää kaikki ulkopuolisille esitettävä materiaali tarkastettavaksi ennen niiden julkaisua, ja tarkastamiselle tulee varata riittävästi aikaa (tyypillisesti kaksi viikkoa). Tuloksia julkistettaessa Tilastokeskus on mainittava tiedon lähteenä. Tilastokeskuksessa 8. päivä toukokuuta 2009 Leena Storgårds Tilastojohtaja Jouko Verho Tutkimuspäällikkö
21(21) Liite 4: Kuva etäkäyttöjärjestelmästä