TEKOÄLY VOI PELASTAA HENKESI: CASE HUS KOKEMUKSIA BIGDATA-POHJAISESTA ENNUSTAVASTA ANALYTIIKASTA JA KEINOÄLYOHJELMISTOJEN KOEKÄYTÖSTÄ IT-Kehitysjohtaja Mikko Rotonen HUS-TIETOHALLINTO 30.3.2016
SISÄLTÖ 1.BigData terveydenhuollossa 2.Case Hyksin lastenklinikan keskosteho 3.Mitä seuraavaksi 2
1. BIG DATA 30.3.2017 3
KUINKA PALJON TIETOA TARVITAAN JOTTA VOI HYÖDYNTÄÄ TEKÖÄLYÄ? Tiedon määrä riippuu käytettävästä tekniikasta Kuva-analytiikassa on syötetarve on 10 000 kuvaa Esim. Watson for Oncology - Perustuu 300 000 lääketieteelliseen julkaisun, 200 kirjaan ja 12 miljoonaan kirjoitettuun sivuun aiheesta, - Opettamiseen on käytetty 15 000 tuntia (=2 000 työpäivää, = 9 työvuotta) asiantuntijoiden työaikaa 30.3.2017 4
Integroitavat tietovarannot Kuva-arkistot PACS XDS Genomi Biopankki Mobiilisovellukset Potilaan omat mittaukset - Noona syöpäseuranta - Diabetes-seuranta - EKG-seuranta Laskutus ja tietovarasto NRT Mynla ja Tietovarasto BCB Laaturekisterit Uranus / Epic Laboratorio Kuvantaminen Anestesia ja teho Leikkaussali Lääkitys Laaturekisterit Potilastietojärjestelmät ja HealthWeb Terveyskylä HUS TIETOALLAS (HUS Datalake) Analyyttiset algoritmit ja ennustava mallintaminen Metadata, Integrointi, Lataus Tietoaltaaseen Lääkärit Hoitajat Tutkijat Hallinto Palveluoperaattori - Metadata - Tutkimuslupa - Tiedon hallinta - Monitorointi 30.3.2017 5 Potilaat Watson Kirontech Aalto yo Nokialab Cortana DuoDecim Tutkijat Hallinto Potilaat
Potilastietojärjestelmien kypsyystasot ja sukupolvet Cognitive / Deep learning (IBM Watson) Tekoälyä tarvitaan, jotta voidaam saavuttaa Gartnerin kypsyystasot 4 ja 5 30.3.2017 6
2. CASE HYKS LASTENKLINIKAN KESKOSTEHO 30.3.2017 7
Kokeiluvaiheen tekninen ratkaisu 2015-2016 Potilaan Tietojärjestelmäarkkitehtuuri elintoimintatietojen käsittelyvaihtoehdot ja niiden integraatiot ajantasaisuus ja validointi Philips potilasmonitori GE Clinisoft IBM WATSON digiconnect/ ebox GE Clinisoft database Watson database Ajantasaisuus Tiedon validointi, formaatti Tiedon sisältö 60 + 120 sekuntia Arvot mediaaneja, HL7 Laboratoriotiedot sisältyvät, samoin kertomus, käytetään ennustamiseen 10
B. KÄYTETTY ANALYSOINTI- JA ENNUSTETEKNIIKKA Käytetyt potilaiden elintoimintoja kuvaavat muuttujat Syke (HR) Hengitystaajuus (RESP) Happisaturaatio (SaO2) SPSS Modelerin avulla päätöspuumalli (CR&T) sovitettiin dataan, jossa sepsispositiivisten dataa päivää ennen kliinikon ottamaa veriviljelyä verrattiin satunnaistettuun otantaan sepsisnegatiivisten potilaiden datasta Malli ottaa huomioon myös muuttujien väliset riippuvuudet Data jaettiin testi- ja mallinnusosioon mallin validointia varten 11
C. Projektin löydökset - sepsiksen ennustaminen GE Clinisoftin datalla Päätöspuun avulla datasta tunnistaa korrelaatioita, jotka ennustavat sepsistä Algoritmi valitsee ja optimoi päätöspuussa näkyvät raja-arvot automaattisesti käytössä olevan datan perusteella Esimerkiksi päätöspuusta voidaan nähdä kuinka alhainen sykkeen vaihtelu (HR_VAR10) kasvattaa sepsisriski Havainto on yhtenevä alan muiden tutkimusten kanssa, joissa käytetty reaaliaikaista potilasmonitorointi dataa 12
D. Projektin löydökset - Teknisen ratkaisun kehittäminen tuotantokäyttöön Ehdotus tulevaisuuden analytiikka arkkitehtuuriksi NICU Data Sources Real-Time Stream Computing Video data IBM Infosphere Streams Millions of Events per Second / all kinds of data Complex analytics: Everything you can express via an algorithm Immediate action in real time Real-time data correlation, Anomaly Detection - Event and flow normalization - context & enrichment Hifi-signals (Audio, Monitoring data) Laboratory results Patient Monitors Ordered medication & Procedures External devices Electronic Health Records Big Data IBM BigInsights for Hadoop Historical data storage for research Integration to production and existing data sources Preservation of raw data from patient monitors Long-term, multi-pb storage New and old data sources Watson Analytics Predictive modeling Anomaly detection Research New Models and variables Text data analytics Clinisoft Legislative compliance Laboratory results EHR data Collect Store & Process Analyze 13
Tuotantoversion potilaan elintoimintatietojen siirto ja dokumentointi GE potilasmonitori GE Clinisoft Critical Care Ennustava analytiikka 3 Multilab Clinisoft database Teksti 1 1 3 Watson Tuotanto Kehitys/DL Ajantasaisuus GE Gateway Tiedon validointi, formaatti BT / Stream Analytics Tiedon sisältö Tietoallas Vaihtoehto 1 60 + 120 sekuntia Arvot mediaaneja, HL7 Laboratoriotiedot sisältyvät, samoin kertomus, ei käytetä ennustamiseen Vaihtoehto 3 2 sekuntia Ei, XML High Speed Laboratoriotiedot täydennetään suoraan ennustemalliin HL7:llä, Muut tiedot siirretään XML:llä, ei siirretä kertomustietoja 30.3.2017 14
30.3.2017 15
30.3.2017 16
30.3.2017 17
30.3.2017 18
Data Repositories TUOTANTOYMPÄRISTÖN ANIMAATIOMALLI Patent Data Lab Data Dynamic Patient Activity GE Gateway Senosr XYZ HealthCare Device XYZ Video Stream Lab Results Medicine Hist Treatments Hist Symptoms Hist Patiento Demographi cs Patient Account Info Production Feeds B I G D A T A S O U R C E S TCP UDP E D MQ G E A HTTP D A P HDFS T E R ODBCS Files C O N S U M E R IN G E S T A P P S STREAMS FILE LANDING ZONE (I/O) Streams Real-time Analytics Platform ECG Scoring Lab Scoring SIGNATURE DETECTION SEPSIS IDENTIFICATION SYSTEMIC MEMORY PATIENT PROFILE & ANALYTICS SCORING STORE BUSINESS RULES FILTERING SPSS C&DS SPSS Modeling Development only Landing, Exploration and Archive data zone PREDICTION ENGINE Demograph Medicine Treatments, Diagnos History Data source samples, Modelling development, Analytic Schema, Systemic Patient Profile DEV E D G E A D A P T E R S TCP SOURCE UDP TCP SINK MQ HTTP HDFS ODBC FILES Realtime Predictive Dashboard Medicine Treatment (A) Iterative Analytical model deployment Patient Operative Clinician (B) Real-time Patient Monitoring Streams + subscription other data streams ie Lab, Treatment Activity streams etc. (C) Real-time Treatment action by Care givers (D) Real-time Predictive Dashboard
3. MITÄ SEURAAVAKSI 30.3.2017 20
Apgar 1/3/4, A-pH 6.84, Be -19.4, V-pH 6.92, Be -16.8. Meconium Aspiration Syndrome. Neonatal seizures, abnormal EEG. 30.3.2017 21
MIKSI KTG? Pyrkimyksenä ehkäistä sikiön altistumista hypoksialle, ts. huolehtia sikiön hyvinvoinnista ja parantaa vastasyntyneen ennustetta Suojella sikiötä metaboliselta asidoosilta Pyrkimys vähentää perinat mortaliteettia ja C Palsya 30.3.2017
SEVERE ASPHYXIA DUE TO DELIVERY-RELATED MALPRACTICE IN SWEDEN 1990 2005 (BERGLUND ET AL, BJOG 2007) Mukana vain syntymäasfyksiaa seuranneet vaikeat HIE:t ja kuolemat: 473 tapausta, 177 johtui huonosta hoidosta 98% (172) tapauksista asfyksian taustalla epäonnistuminen sikiön hapenpuutteen tunnistamisessa synnytyksen aikana KTG ei tulkittavissa (rekisteröinnin huono laatu), KTG patologinen >45 min ajan ennen syntymää, ei MVN:ttä vaikka KTG pitkään patologinen, oksitosiini-infuusion nopeuttaminen vaikka KTG patologinen, kohdun hyperstimulaatio Johtopäätös: kätilöiden ja obsterikkojen säännöllinen kouluttaminen sikiöntarkkailussa; sairaaloiden pakko järjestää koulutusta, henkilökunnan pakko osallistua Vai voidaanko tässä hyödyntää keinoälyä? 30.3.2017 23
KTG:N ETUJA Korkea sensitiivisyys: normaali KTG, jossa perustaso on normaali, variabiliteetti hyvä, akseleraatioita esiintyy, ja jossa ei ole hidastumia, sulkee pois sikiön metabolisen asidoosin >99 % todennäköisyydellä 30.3.2017 24
MIKSI KANNATTAA YRITTÄÄ UUSIA TEKNOLOGIOITA JA NIIDEN SUOMIA MAHDOLLISUUKSIA? 30.3.2017 25
Jos synnytyksessä vammautuneen lapsen elinkaari kustannus on yli 10 miljoona puntaa (NHS), niin sillä saisi 317 500 000 kpl 13 400 kpl 12 kpl 30.3.2017 26
TODELLINEN TAVOITE ON TIETÄMYKSEN LUONTI 30.3.2017 27
Informaation merkitys Tiedonjalostus ja sen tasot Optimointi BigDatan tiikerin loikka Kuvaileva mallinnus Ennustava mallinnus Mikä olisi parasta mitä voisi tapahtua? Raaka data Puhdistettu data Vakioraportti Mitä tapahtui? Kuutiot ja kyselyt Miksi niin tapahtui? Mitä tulee tapahtumaan? Data Informaatio Tietämys Ymmärrys Perus järjestelmät Tietovarasto BigData 28
30.3.2017 29