TIEDOLLA JOHTAMISEN TULEVAISUUS TIETOALLAS JA ANALYTIIKKA Kehittämispäällikkö Sami Helin HUS-TIETOHALLINTO 23.5.2016
SISÄLTÖ 1.Tiedolla johtamisen kehityssuuntia, Gartner BI & Analytics Summit 2016 2.HUS tiedon hallinnan kehityssuunnitelmia 3.HUS tietoallas- ja analytiikkakehitys ja kokemuksia 4.Mitä seuraavaksi 2
1. TIEDOLLA JOHTAMISEN KEHITYSSUUNTIA, GARTNER BI & ANALYTICS SUMMIT 2016 23.5.2016 3
Gartner opening keynote: Analytics leadership Empowerment without anarchy All statements in this report attributable to Gartner represent HUS interpretation of data, research opinion or viewpoints published as part of a syndicated subscription service by Gartner, Inc., and have not been reviewed by Gartner. Each Gartner publication speaks as of its original publication date (and not as of the date of this presentation). The opinions expressed in Gartner publications are not representations of fact, and are subject to change without notice. 29.2.-1.3.2016 20.5.2016 4
22.5.2016 5
22.5.2016 6
23.5.2016 7
22.5.2016 8
22.5.2016 9
2. HUS TIEDON HALLINNAN KEHITYSSUUNNITELMIA 23.5.2016 10
HUS BIG DATA PLATFORM KOKONAISARKKITEHTUURI Käyttäjä- ja käytön hallinta: tutkija-, tutkimusrekisterit, sopimukset, luvat, käyttöoikeudet, pääsynhallinta, käyttölokit, suostumustenhallinta. Tietoturva. Metatietojen hallinta, lähdetietojen standartointi, master- ja referenssidatan hallinta. Tiedon lähteet Potilas, HR, talousjärjestelmät, Virtuaalisai raala, Biopankki, lääkintälaite Ulkoiset tiedot: THL, tutkijan data Eistrukturoitu data master ja referenssi data Reaaliaikainen Eräajo Stage Metadata Tietovarasto Mallinnettu, integroitu data Metadata Strukturoitu raakadata Ei-strukturoitu raakadata Kylmä data Integroitu raakadata Viestijono Prosessointi Tulokset (Kuluva päivä) Tulokset (Edellinen päivä ja sitä vanhemmat) Johdettu data Tietoallas Kaikki data: raakadata ja johdetut tiedot Reaaliaikainen tietovirta Eräajopohjainen tiedon käsittely Reaaliaikainen näkymä Hyödyntämis -kerros Aihealuekohtaiset datamartit Ulkoiset rajapinnat: viranom., palv.oper. kansalaiset, (potilas)tietojärjestel mät Tutkijat Metadata
TEHOKKAAMPI, HAJAUTETTU, TIEDON KÄYTÖN MAHDOLLISTAMINEN Dataanalyytikot Edistykselliset käyttäjät Protoilijat ja määrittelijät Peruskäyttäjät Tekniset asiantuntijat Metadata Käyttökohteen mukainen jalostettu metadata Informaatiokerros Yhteinen käsitteiden mallinnus Yhdistettyjen tietojen protoilun ja ad hoc- käytön datamalleja Yksittäisen järjestelmän protoilun ja ad hoc- käytön datamalleja Tekninen metadata & lähdejärjestelmän tietomalli Johdettu data Integroitu raakadata Raakadata, johdetut tulokset, kylmä data Lähdejärjestelmät Tehokas tiedon käyttö yhteisten määritysten kautta Data nopeammin käyttöön
ANALYTIIKAN JA ALGORITMIEN KEHITTÄMISEN SUUNNITELMIA Työkalujen ja osaamisen kehittäminen. IBM SPSS, Rule Engine ja Watson tuotteiden tuotantokäyttöönotto analytiikassa ja ennustavassa analytiikassa (Tehohoito, Terveyskylän oirenavigaatiot, harvinaisten sairauksen analytiikka ja seulonta, Pandemia analytiikka ja ennustemallit jne). Muiden analytiikkaohjelmien testaaminen ja hankinta täydentämään palvelukokonaisuutta (MS Cortana Analytics Suite, Kirontech, Nokialab jne). 13
3. HUS TIETOALLAS JA ANALYTIIKKA KEHITYS JA KOKEMUKSIA 23.5.2016 14
TIETOALLAS POC-RATKAISUN YLEISKUVA HUS:n verkkoinfrastruktuuri HUSNET-verkko Käyttöliittymät Ambari Selain-UI Talend Client Windowsetätyöpöytä SQL Server Mgt Studio Cognos UI Muut POChankkeessa käytetyt palvelut Bitbucket.org Lähdekoodirepositorio (HUS_Team) HUSPILVI1 -verkko Big Data POC -ympäristö Uranus Potilastieto -järjestelmä Azure Virtual Network -aliverkko Talend Integraatio -työkalu Cognos BI-työkalu (datamart) Code Server Koodistopalvelin Hadoop Data-allas Tietovirtojen orkestrointi Azure SQL Database Pilotti-EDW Microsoft SCOM Valvontatyökalu Azure ExpressRoute VPN-yhteys Internet Käyttäjähallinta Active Directory Käyttäjähallinta Ympäristön valvonta Värikoodien selitteet Sisäinen ympäristö, totetutettu POC:ssa Ulkoinen ympäristö Verkko- ja järjestelmäinfrastruktuuri Tiedonsiirto (ETL) Toiminnallisuus Käyttöliittymä
PILOTIN TOTEUTUSMALLI Orkestrointi (Talend Open Studio) BI (Cognos) Datamart (tähtimalli) Tietovarasto (Azure SQL Database) Integroitu raakadata (raw data vault) Johdettu data (business data vault) Datamart (tähtimalli) Tietoallas (Hive) Raaka-data Integroitu raakadata (raw data vault) Johdettu data (business data vault) Datamart (tähtimalli) Lähteet Cressida ODS Codeserver ETL (Sqoop) Synkronointi (Sqoop) / Virtualisointi Synkronointi (Cognos) / Virtualisointi ETL (SQL DB Stored Procedure)
ESIMERKKI TIETOALTAAN ROOLISTA ANALYTIIKKAHANKKEESSA Video data GE potilasmonitori GE Clinisoft Critical Care Ennustava analytiikka Tuotanto Kehitys/DL 3 Multilab Clinisoft database Teksti 1 1 3 Watson Cortana Open Source GE Gateway BT / Stream Analytics Tietoallas Ajantasaisuus Tiedon validointi, formaatti Tiedon sisältö Vaihtoehto 1 60 + 120 sekuntia Arvot mediaaneja, HL7 Laboratoriotiedot sisältyvät, samoin kertomus, ei käytetä ennustamiseen Vaihtoehto 3 2 sekuntia Ei, XML High Speed Laboratoriotiedot täydennetään suoraan ennustemalliin HL7:llä, Muut tiedot siirretään XML:llä, ei siirretä kertomustietoja 17
KOKEMUKSIA Metadatavaatimukset mukaan lähdejärjestelmäsopimuksiin Kalenteriaikaa kuluu paljon Priorisointi ja ohjausmalli kuntoon Kommunikoinnin merkitys korostuu Teknologia kehittyy koko ajan, mutta valintoja on tehtävä Kokenut kumppani mukaan Big data ympäristöjen kehittämiseen 18
4. MITÄ SEURAAVAKSI 23.5.2016 19
Integroitavat tietovarannot Kuva-arkistot PACS XDS Genomi Biopankki Mobiilisovellukset Potilaan omat mittaukset - Noona syöpäseuranta - Diabetes-seuranta - Kipupäiväkirja - EKG-seuranta Laskutus ja tietovarasto NRT Mynla ja Tietovarasto BCB Laaturekisterit Uranus / Epic Laboratorio Kuvantaminen Anestesia ja teho Leikkaussali Lääkitys Potilaat Laaturekisterit Potilastietojärjestelmät ja HealthWeb Terveyskylä HUS TIETOALLAS (HUS Datalake) Watson Kirontech Aalto yo Nokialab Cortana DuoDecim Analyyttiset algoritmit ja ennustava mallintaminen Metadata, Integrointi, Lataus Tietoaltaaseen Lääkärit Hoitajat Tutkijat Hallinto Palveluoperaattori - Metadata - Tutkimuslupa - Tiedon hallinta - Monitorointi Tutkijat Hallinto Potilaat 18.5.2016 20
APOTTI Epic tietovarannot Reporting copy Tietovarasto Hyödyntämis-kerros Clarity Metadata Integroitu raakadata Johdettu data Aihealuekohtaiset datamartit Cogito Kevät 2016 toteutettu Cressida ODS referenssi data: Codeserver Eräajo/pv Data Lake Reaaliaikainen tietovirta Viestijono Prosessointi Tulokset (Kuluva päivä) Eräajopohjainen tiedon käsittely Stage Metadata Strukturoitu raakadata Ei-strukturoitu raakadata Kylmä data Tulokset (Edellinen päivä ja sitä vanhemmat) Reaaliaikainen näkymä Ulkoiset rajapinnat: viranom., palv.oper. kansalaiset, (potilas)tietojärjestel mät Tutkijat Metadata Kevät 2016 jälkeen toteutettavat, jotka Apotti korvaa
KIITOS! Kysymyksiä? sami.helin@hus.fi 050-4033381 23.5.2016 22