Tietoturvallinen käyttöympäristö hyvinvointidatalle Inka Rautiainen Biopankit, terveysalan rekisterit ja datan käyttöympäristöt - seminaari 23.10.2017
Tilastokeskuksen FIONAetäkäyttöjärjestelmä
Tietoturvallinen etäkäyttöjärjestelmä mikroaineistojen tutkimuskäyttöön Suljettu ympäristö, tietosiirrot sisään ja ulos Tilastokeskuksen tutkijapalveluiden toimesta Tulosteiden tietosuojatarkistukset Vuodesta 2015 alkaen Tilastokeskuksen teknisenä yhteistyökumppanina on CSC Tieteen tietotekniikan keskus. Fionassa käytetään Tilastokeskuksen aineistoja, yhdistettyjä aineistoja sekä ulkopuolisia valmisaineistoja (esim. TEM). 24.10.2017 Tutkijapalvelut
Tutkijoilla on etäkäyttöpalvelimella käytössään Windowstyöpöytä sekä tarvittavat kansiot ja ohjelmistot 24.10.2017 Tutkijapalvelut
Aineistojen etäkäytössä on useita etuja verrattuna fyysiseen luovutukseen Vahva aineiston tietosuojan hallinta Tutkija Heikko aineiston tietosuojan hallinta Etäkäyttö Aineistoluovutus Kokonaisaineistot Pseudonymisointi Need-to-know principle Otosaineistot Anonymisointi Tutkijan työpiste Kotoa Tutkijan tietokone Ulkomailta (EU) 24.10.2017 Tutkijapalvelut
Etäkäytön vahvuudet ja heikkoudet - Tietosuoja - Tarkat aineistot - Kokonaisaineistot mahdollisia - Edullisia ja laadukkaita valmisaineistoja nopeasti - Yhteinen työtila tutkijoille samaan aineistoon paikasta riippumatta - Laaja ohjelmapaletti, uusimmat lisenssit - Aineistot varmuuskopioidaan automaattisesti - Ylläpitokustannukset (TK) Henkilöstö Lisenssit Laitteisto Tarkistukset työläitä - Kustannukset tutkijalle - Tulosteiden tarkastus - Suorituskyky voi vaihdella kuorman mukaan - Herkempi häiriöille kuin aineistoluovutukset 24.10.2017 Tutkijapalvelut
Tilastokeskuksen tutkijapalvelut tarjoaa tutkijoille räätälöidyn kurssin Tutkimusaineistot etäkäytössä Oppitunnit: 1. Mikroaineistojen tutkimuskäyttö 2. SISU-mikrosimulointimalli 3. Tutkimusaineistojen tietosuoja 4. Hakuprosessit ja sopimuskäytännöt 5. Etäkäytön hyvät käytännöt Tilastokoulu.stat.fi 24.10.2017 Tutkijapalvelut
Isaacus-hanke ja etäkäyttöympäristön pilotti
Isaacus-esituotantohankkeet Sähköinen lupapalvelu Informaatio- ja tukiportaali Ratkaisu hyvinvointidatan kuvaamiseen yhteisillä käsitteillä aineistoeditori ja aineistokatalogi. Tietoturvallinen etäkäyttöympäristö Kaikille biopankeille yhteinen prosessi ja työkalut tutkimusaineistojen muodostamiseen. Hajallaan olevaa hyvinvointidataa tietoaltaisiin. 9 24.10.2017 Inka Rautiainen
Etä-esituotantohankkeen päätavoitteet Palveluoperaattori Esikäsittely Tiedonsiirto Etäkäyttö Tarvemäärittelyjen pohjalta pilotti Palveluoperaattorin toiminnasta Pilotointisuunnitelma yhteisesti Sitran ja muiden esituotantohankkeiden kanssa Tuotetaan valmisaineistoja Palveluoperaattorin prosessit ja ohjeistukset 10 24.10.2017 Inka Rautiainen
Esikäsittelyn ja tiedonsiirron tarvemäärittely - Siirretään sensitiivistä dataa - huomioitava tietoturva: Tiedonsiirron tekniset vaateet (SFTP) Tiedonsiirtojen erillisyys Pseudonymisointi (aineistoja ei siirretä tunnisteellisena) Tulevaisuuden visiona pyrkimys eroon tiedonsiirrosta - Varmistettava eri aineistojen yhdisteltävyys Samat pseudonyymit Tekninen harmonisointi 11 24.10.2017 Inka Rautiainen
Pseudonymisointi tarvemäärittelyssä - Kuvattu erilaiset tietopyyntöskenaariot: 1. Valmis listaus henkilötunnuksia 2. Määrittely otosjoukosta (esim. diagnoosi) 3. Määrittely otosjoukosta yhdelle tiedontuottajista, dataa myös muista lähteistä - Palveluoperaattorilla tulee olla mahdollisuus palauttaa data tunnisteelliseksi. - Palveluoperaattorin pseudonymisointiprosessia hahmoteltu yhdessä tietoallashankkeiden, BBMRIn ja FIMMin kanssa. - Pilottiin toteutettiin työkalu Palveluoperaattorille siirrettävien aineistojen pseudonymisoimiseksi. 12 24.10.2017 Inka Rautiainen
Etäkäyttöjärjestelmän tarvemäärittely - Lähtökohtana Tilastokeskuksen FIONA-etäkäyttöjärjestelmä, järjestelmäkehityksestä vastaa CSC. - Erilaisia aineistoja sekä käyttö- ja kapasiteettitarpeita. Tietoturva Kirjautuminen, Ympäristö (avoin / suljettu), Hankkeiden erillisyys, tulostarkistusmenettelyt Ominaisuudet Resurssitarpeet, käyttöjärjestelmä, analyysisovellukset. Hallinta Käyttöehdot, käyttäjähallinta, aineistojen elinkaari, sopimukset. - Lisäksi selvitetään lakiperusteet aineistojen yhdistämiseen, siirtoon ja säilyttämiseen etäkäyttöjärjestelmässä 13 24.10.2017 Inka Rautiainen
Etäkäyttöjärjestelmään valittuja ratkaisuja - Vahva kirjautuminen (Haka) - Testissä Apache Guacamole (HTML5) Selainpohjainen etäkäyttö, eroon eri client-ympäristöyhteensopivuustarpeista - Windows- ja Linux-koneet tarjolla - Resurssien tehokkaampi allokointi: jaetut ja dedikoidut koneet - Suurteholaskenta / Big data: epouta, dedikoitu kone - Repository Vähentää sovellusten lisäpakettien manuaalista asennusta - Tulosten automaattinen lähettäminen tietoturvan salliessa - REMS omien resurssien hallintaan Tietoturvaselvitykset, käyttöoikeudet, lokitus ym. Myös käyttäjälle hallintapaneeli 14 24.10.2017 Inka Rautiainen
- Demovideo etäkäyttöjärjestelmästä 15 24.10.2017 Inka Rautiainen
Pilotointisuunnitelma - Rakennettu yhdessä muiden esituotantohankkeiden ja Sitran kanssa - Aineistojen esikäsittelyn, tiedonsiirron ja etäkäyttöympäristön testausta - 4 hanketta THL Gauge: etäkäyttöjärjestelmän testausta BBMRI: aineiston kokoaminen, esikäsittely ja tiedonsiirto VSSHP, HUS, Kuopio: Synteettisen datan generointi, tiedonsiirto VSSHP (2): Esikäsittely, tiedonsiirto, etäkäyttöjärjestelmän testaus - Lisäksi tuotetaan 4 valmisaineistoa (THL, Kela, Tilastokeskus) 16 24.10.2017 Inka Rautiainen
Tulevaa - Lakiehdotus sote-tietojen sekundäärisestä käytöstä 10/2017 - Palveluoperaattorille on varattu rahoitusta ja kootaan väliaikainen ohjausryhmä - Sitralla rakennetaan liiketoimintasuunnitelmaa - Etäkäyttöympäristön osalta hallintamalli vasta rakenteilla ja tuotantoon vienti edessäpäin 17 24.10.2017 Inka Rautiainen
Kiitos! Inka Rautiainen, inka.rautiainen@stat.fi