Olli-Pekka Ryynänen sidonnaisuudet Itä-Suomen yliopisto: yleislääketieteen professori Kuopion yliopistollinen sairaala: hallinnollinen apulaisylilääkäri (15%) Wisane oy hallituksen jäsen, tekee terveydenhuollon vaikuttavuuden mallinnuksia Bayesmenetelmillä Kuopion kaupunki, kaupunginvaltuutettu, perusturva- ja terveyslautakunnan puheenjohtaja
Ennustaminen on vaikeaa, varsinkin tulevaisuuden ennustaminen Niels Bohr Your theory is crazy, but is it crazy enough?
Lääketiede on täynnä ennustamisongelmia Onko potilas väkivaltaisuusriskissä? Päätyykö potilas eläkkeelle? Aiheuttaako lääke sivuvaikutuksia? Uusiutuuko syöpä?
Miten voimme ennustaa? Kliininen kokemus, tieto riskitekijöistä ym. Laskurit, yleensä tehty logistisilla malleilla. Ennustuskyky on useimmiten heikko. Suurin ongelma on, että ennustuskyky aineistossa A ei ole siirrettävissä aineistoon B (robustisuus). Lääkärin päätöksenteko perustuu pitkälle erilaisiin peukalosääntöihin. Ammattilaisetkaan eivät juuri pysty hallitsemaan muuttuvia tilanteita.
Kehittyneempiä menetelmiä Esimerkkeihin perustuva päättely (case-based reasoning). K-lähimmän naapurin menetelmä. Neuroverkot Bayesmenetelmät Ym. Keskitymme tähän
Historia on pitkä Thomas Bayes 1702-1761 Englantilainen pappi ja amatöörimatemaatikko Tulokset julkaistiin hänen kuolemansa jälkeen. Ideaa kehitti ranskalainen Pierre- Simon Laplace äännetään beiz, vrt. Wales -weilz
Nykyisin runsaasti sovelluksia. PubMed: hakusana "Bayesian" tuottaa noin 24300 tulosta Charlie Sheen
Mikä se siis on? Laskentamenetelmä, perustuu Bayesin yhtälöön. Lasketaan tuntemattoman todellisuuden todennäköisyyksiä. Lähdetään liikkeelle priorista ja havainnoista (aineistosta), likelihood, saadaan posteriori. Esitetään verkkomalleina. Verkkomallin voi kiinnittää tietyille arvoille ja ennustaa uutta yksittäistapausta.
Bayesverkon kaksi perustyyppiä (muitakin on) Unsupervised model, dependency model. Esitetään kaikki muuttujien väliset riippuvuudet. Sopii ilmiön etsimiseen datamassasta. Supervised model, naiivi Bayes, luokitemalli, classification model. Yksi muuttuja, jota ennustetaan muista muuttujista. Erityisesti ennustustehtävissä. Tulos voi olla yksinkertainen, tai sitten helvetillinen häkkyrä
Bayes-analyysin ominaisuuksia Hallitsee hyvin monimutkaisia syy-yhteyksiä ja ihmisajattelulle käsittämättömän kompleksisia päätöksentekotilanteita Toimii perinteistä frekventististä tilastotiedettä pienemmillä potilasaineistoilla Suppeampi edustavuusvaatimus: havaintoaineiston ei tarvitse olla edustava otos kohderyhmästä Jakaumaoletuksia ei juuri tarvita Sietää puuttuvia tai virheellisiä tietoja ja outlier-tapauksia
Mallin käyttökelpoisuus ja mallin oikeellisuus eivät välttämättä ole sama asia Malli on hyödytön, jos se on oikeassa, mutta kertoo vain sen, mikä tiedetään muutenkin Malli voi olla väärässä, mutta olla silti hyödyllinen. Esim. malli voi varoittaa komplikaatioriskistä ja ennusteen tuloksena voidaan hoitoa muuttaa komplikaation välttämiseksi.
Esimerkkejä Bayes-koneista: B-course: ilmainen, interaktiivinen ohjelma
Voit helposti kokeilla itse: Hae B-course googlettamalla Ota oma tutkimusaineistosi Excelillä, tallenna se tab delimited muotoon. Nyt B-course osaa lukea aineiston. Puhdista ensin aineistosta tarpeettomat muuttujat, muuten tulee kauhea sekamelska.
Ennustusmalli ns. naiivi Bayes PREQ Proactive Evidence for Quality Yksittäisen potilaan riskit lasketaan Bayes-verkkomallilla, ennusteet oikeita noin 75-95%:sti Tuotetaan ennusteita, jotka koskevat yksittäistä potilasta Menetelmä on ainutlaatuinen, kehitetty Itä-Suomen ja Helsingin yliopistojen yhteistyönä
Tulosten käyttömahdollisuudet prioriteettiarviointi yksiköiden laadun ja kustannusten tarkkailu, myös yksittäisten lääkäreiden tulokset yksittäisen potilaan hoitotuloksen ennakointi potilasprofilointi hoidon optimointi uusien menetelmien arviointi satunnaistetun asetelman simulointi
Bayesialab Erittäin kehittynyt Bayesohjelmisto
Kausaalimallit: sisältää intervention, voidaan korvata satunnaistettuja tutkimuksia
Frequently Asked Questions
Mitä ongelmaa tässä on? Ongelmia on ainakin seuraavat: ylisovitettu malli (overfit) robustisuus mistä saadaan priorit? miten tulos tulkitaan?
Ylisovitettu malli (overfit model) Ongelmana kaikissa ennustusmenetelmissä Ylisovitettu malli antaa liian suuren määrän ennustavia tekijöitä, ylioptimistisen käsityksen ennustuskyvystä eikä toimi toisella aineistolla Torjuntakeino: muuttujien määrän rajoittaminen
Robustisuus Mallin ongelmana on robustisuus (siis sen puute), mallin siirrettävyys toiseen paikkaan tai aikaan, seuraus ylisovituksesta Tilanne elää koko ajan, eikä kerran tehty malli ole voimassa kovin pitkää aikaa Tarvitaan jatkuvasti uutta tietoa riskitekijöistä ja sairauden ja riskitekijöiden prevalenssista (prevalenssin muutokset vaikuttavat vahvasti mallin antamaan lopputulokseen) Uusi tieto voidaan nopeasti siirtää mallin prioreihin, jolloin malli voidaan päivittää
Onko vaaraa itseään toteuttavista ennusteista? Vastaus: on. Ennustemallin käyttö vaatii tervettä harkintaa eikä harkinta ole korvattavissa ennusteita käyttämällä Vastuu on lääkärillä, ennuste tukee harkintaa Ennustetta ei pidä torjua tämän vuoksi. Ennusteita on asetettu aina. Malli tekee ennusteet läpinäkyviksi ja vakioi eri henkilöiden tekemiä ennusteita. Tietämättömyys on huonoin vaihtoehto.
Ovatko ennustetekijät kausaalisessa suhteessa päätemuuttujaan? Voi olla, tai sitten ei. PREQ ei erottele riskitekijöitä ja markkereita, ne pitää vain loogisesti päätellä. Esim. tupakointi on sepelvaltimotaudin riskitekijä ja suhde on kausaalinen. Kirjastokortin omistaminen on sepelvaltimotaudin markkeri, se ei ole kausaalisuhteessa, mutta kortittomat ovat paljon suuremassa riskissä. PREQin mallissa voi olla riskitekijöitä ja markkereita. Bayesialabilla voidaan rakentaa täyskausaalimalleja.
Voiko kone olla parempi kuin lääkäri? Meta-analyysi v 2000: 139 tutkimusta, joissa lääkäriä oli päätöksentekijänä verrattu koneeseen. Kahdeksassa tutkimuksessa oli lääkäri parempi. Kone voitti 63:ssa tutkimuksessa ja 65 tutkimusta eivät havainneet eroa. Uudempi meta-analyysi v 2006: 67 tutkimusta, kone parempi. Grove ym. Clinical versus mechanical prediction: A meta-analysis. Psychological Assessment, 2000;12(1):19-30. Stefanía Ægisdóttir, Michael J. White ym. The Meta-Analysis of Clinical Judgment Project. The counseling psychologist, 2006;34(3):341-382
Kuinka hyviä mallit ovat? Malli validoidaan joko kokonaan ulkopuolisella aineistolla, jakamalla aineisto opetus- ja testiaineistoihin, ajamalla sama aineisto mallin läpi (huono) tai muilla menetelmillä, esim. leave-one-out-cross-validation. Ennustustarkkuudet yleensä 80-90%. Riippuu datan ominaisuuksista, ei niinkään testimenetelmistä. Kliininen validaatio on tärkeämpi kuin matemaattinen!