ANALYTIIKKA KESKOSTEN HOIDOSSA IT-Kehitysjohtaja Mikko Rotonen HUS-TIETOHALLINTO 19.10.2016
SISÄLTÖ 1.Lyhyt oppimäärä tekoälyä 2.BigData 3.Case Hyksin lastenklinikan keskosteho 4.Mitä seuraavaksi 2
1. LYHYT OPPIMÄÄRÄ TEKOÄLYÄ 3
TEKOÄLYN TEKNIIKAT 1. Koneoppiminen (machine learning) 2. Neuroverkot (artificial neural networks) 3. Syvä neuroverkko (deep learning) 4. Ohjattu oppiminen (supervised learning) 5. Vahvistusoppiminen (reinforcement learning) 6. Ohjaamaton oppiminen (unsupervised learning) 4
2. BIG DATA 5
KUINKA PALJON TIETOA TARVITAAN JOTTA VOI HYÖDYNTÄÄ TEKÖÄLYÄ? Tiedon määrä riippuu käytettävästä tekniikasta Kuva-analytiikassa on syötetarve on 10 000 kuvaa Esim. Watson for Oncology - Perustuu 300 000 lääketieteelliseen julkaisun, 200 kirjaan ja 12 miljoonaan kirjoitettuun sivuun aiheesta, - Opettamiseen on käytetty 15 000 tuntia (=2 000 työpäivää, = 9 työvuotta) asiantuntijoiden työaikaa 6
Integroitavat tietovarannot Kuva-arkistot PACS XDS Genomi Biopankki Mobiilisovellukset Potilaan omat mittaukset - Noona syöpäseuranta - Diabetes-seuranta - EKG-seuranta Laskutus ja tietovarasto NRT Mynla ja Tietovarasto BCB Laaturekisterit Uranus / Epic Laboratorio Kuvantaminen Anestesia ja teho Leikkaussali Lääkitys Laaturekisterit Potilastietojärjestelmät ja HealthWeb Terveyskylä HUS TIETOALLAS (HUS Datalake) Metadata, Integrointi, Lataus Tietoaltaaseen Palveluoperaattori - Metadata - Tutkimuslupa - Tiedon hallinta - Monitorointi Tutkijat Watson Lääkärit Kirontech Analyyttiset 17.10.2016 Aalto yo algoritmit ja Hoitajat 7 ennustava Potilaat mallintaminen Nokialab Cortana DuoDecim Tutkijat Hallinto Hallinto Potilaat
Nro 2008->2009 2011->2012 2014->2015 2016->2017 1 Virtualization Media tablets Computing Everywhere Artificial Intelligence and Advanced Machine Learning 2 Cloud Computing Mobile-centric applications and interfaces 3 Servers: Beyond Blades Contextual and social user experience The Internet of Things (IoT) 3D Printing 4 Web Oriented Architecture The Internet of Things (IoT) Advanced, Pervasive and Invisible Analytics Intelligent Apps Intelligent Things Virtual Reality and Augmented Reality 5 Enterprise Mashups App stores and Marketplaces Context-Rich Systems Digital Twins 6 Specialized Systems Next-generation analytics Smart Machines Blockchains and Distributed Ledgers 7 Social Software & Social Networking GARTNER TOP 10 TECHNOLOGY TRENDS Big Data Cloud/Client Computing Conversational Systems 8 Unified Communications In-memory computing Software-Defined Applications and Infrastructure Mesh App and Service Architecture 9 Business Intelligence Extreme low-energy servers Web-Scale IT Digital Technology Platforms 10 Green IT Cloud computing Risk-Based Security and Selfprotection Adaptive Security Architecture Lähde: Gartner 8
Potilastietojärjestelmien kypsyystasot ja sukupolvet Cognitive / Deep learning (IBM Watson) Tekoälyä tarvitaan, jotta voidaan saavuttaa Gartnerin kypsyystasot 4 ja 5 17.10.2016 9
3. CASE HYKS LASTENKLINIKAN KESKOSTEHO 10
A. Tekninen ratkaisu Potilaan Tietojärjestelmäarkkitehtuuri elintoimintatietojen käsittelyvaihtoehdot ja niiden integraatiot ajantasaisuus ja validointi Philips potilasmonitori GE Clinisoft IBM WATSON digiconnect/ ebox GE Clinisoft database Watson database 11
B. KÄYTETTY ANALYSOINTI- JA ENNUSTETEKNIIKKA Käytetyt potilaiden elintoimintoja kuvaavat muuttujat Syke (HR) Hengitystaajuus (RESP) Happisaturaatio (SaO2) SPSS Modelerin avulla päätöspuumalli (CR&T) sovitettiin dataan, jossa sepsispositiivisten dataa päivää ennen kliinikon ottamaa veriviljelyä verrattiin satunnaistettuun otantaan sepsisnegatiivisten potilaiden datasta Malli ottaa huomioon myös muuttujien väliset riippuvuudet Data jaettiin testi- ja mallinnusosioon mallin validointia varten 12
C. Projektin löydökset - sepsiksen ennustaminen GE Clinisoftin datalla Päätöspuun avulla datasta tunnistaa korrelaatioita, jotka ennustavat sepsistä Algoritmi valitsee ja optimoi päätöspuussa näkyvät raja-arvot automaattisesti käytössä olevan datan perusteella Esimerkiksi päätöspuusta voidaan nähdä kuinka alhainen sykkeen vaihtelu (HR_VAR10) kasvattaa sepsisriski Havainto on yhtenevä alan muiden tutkimusten kanssa, joissa käytetty reaaliaikaista potilasmonitorointi dataa 13
D. Projektin löydökset - Teknisen ratkaisun kehittäminen tuotantokäyttöön Ehdotus tulevaisuuden analytiikka arkkitehtuuriksi NICU Data Sources Real-Time Stream Computing Video data IBM Infosphere Streams Millions of Events per Second / all kinds of data Complex analytics: Everything you can express via an algorithm Immediate action in real time Real-time data correlation, Anomaly Detection - Event and flow normalization - context & enrichment Hifi-signals (Audio, Monitoring data) Laboratory results Patient Monitors Ordered medication & Procedures External devices Electronic Health Records Big Data IBM BigInsights for Hadoop Historical data storage for research Integration to production and existing data sources Preservation of raw data from patient monitors Long-term, multi-pb storage New and old data sources Watson Analytics Predictive modeling Anomaly detection Research New Models and variables Text data analytics Clinisoft Legislative compliance Laboratory results EHR data Collect Store & Process Analyze 14
TIIVISTELMÄ KOKEILUSTA JA SEN TULOKSISTA JA JATKOSUUNNITELMISTA Ennustekyvykkyys todettu GE Healthcare Centricity Critical Care Clinisoft sovelluksen datalla jo medianisoidussa datassa näkyy merkkejä siitä, että sepsis voidaan ennustaa 24 h ennen kuin kliinikko tilaa verinäytteen Hoitohenkilökunnan päätöksentekoa voidaan helpottaa visualisoimalla tulokset Ennustetarkkuutta voidaan kehittää Hyödyntämällä lähes reaaliaikaista potilasmonitorointitietoa (esim. EKG, veren happisaturaatio, hengitystiheys, verenpaine) Parantamalla datan laatua (puuttuvien arvojen vähentäminen) Lisäämällä uusia muuttujia (esim. videoanalytiikan avulla määritetty fyysinen aktiivisuus) Parantamalla analytiikkaympäristön laskentatehoa Seuraavat askeleet Tieteellinen tutkimus (tutkimusluvat, infrastruktuuri yms.) näytöistä, että reaaliaikaisella datalla voidaan ennustaa sepsis. Saatava näyttöä ennustekyvystä, jonka tuloksen mukaan voidaan edetä Ennustetarkkuuden kehittäminen tieteellisen tutkimuksen kautta Käytäntöön viemisen suunnittelu Tuotantoa ja analytiikan kehittämistä tukevan ympäristön luonti Menetelmän laajentaminen muihin käyttötapauksiin 15
Video data Potilaan elintoimintatietojen siirto ja dokumentointi GE potilasmonitori GE Clinisoft Critical Care Tuotanto Kehitys/DL Ennustava analytiikka 3 Multilab Clinisoft database Teksti 1 1 3 Watson GE Gateway BT / Stream Analytics Tietoallas Ajantasaisuus Tiedon validointi, formaatti Tiedon sisältö Vaihtoehto 1 60 + 120 sekuntia Arvot mediaaneja, HL7 Laboratoriotiedot sisältyvät, samoin kertomus, ei käytetä ennustamiseen Vaihtoehto 3 2 sekuntia Ei, XML High Speed Laboratoriotiedot täydennetään suoraan ennustemalliin HL7:llä, Muut tiedot siirretään XML:llä, ei siirretä kertomustietoja 16
4. MITÄ SEURAAVAKSI 17
Seuraavan sukupolven ennustava sepsisanalytiikka vuonna 2017 Data Repositories Patient Data Lab Data Dynamic Patient Activity GE Gateway Senosr XYZ HealthCare Device XYZ Video Stream Lab Results Medicine Hist Treatments Hist Symptoms Hist Patiento Demographi cs Patient Account Info Production Feeds B I G D A T A S O U R C E S TCP UDP E D MQ G E A HTTP D A P HDFS T E R ODBC S Files C O N S U M E R IN G E S T A P P S STREAMS FILE LANDING ZONE (I/O) Streams Real-time Analytics Platform ECG Scoring Lab Scoring SIGNATURE DETECTION SEPSIS IDENTIFICATION SYSTEMIC MEMORY PATIENT PROFILE & ANALYTICS SCORING STORE BUSINESS RULES FILTERING SPSS C&DS SPSS Modeling Development only Landing, Exploration and Archive data zone PREDICTION ENGINE Demograph Medicine Treatments, Diagnos History DEV Data source samples, Modelling development, Analytic Schema, Systemic Patient Profile E D G E A D A P T E R S TCP SOURCE UDP TCP SINK MQ HTTP HDFS ODBC FILES Realtime Predictive Dashboard Medicine Treatment (A) Iterative Analytical model deployment Patient Operative Clinician (B) Real-time Patient Monitoring Streams + subscription other data streams ie Lab, Treatment Activity streams etc. (C) Real-time Treatment action by Care givers (D) Real-time Predictive Dashboard
Tiedonjalostus ja sen tasot Informaation merkitys Optimointi BigDatan tiikerin loikka Kuvaileva mallinnus Ennustava mallinnus Mikä olisi parasta mitä voisi tapahtua? Raaka data Puhdistettu data Vakioraportti Mitä tapahtui? Kuutiot ja kyselyt Miksi niin tapahtui? Mitä tulee tapahtumaan? Data Informaatio Tietämys Ymmärrys Perus järjestelmät Tietovarasto BigData 19
20