Uskomusverkot: Lääketieteelliset sovellukset



Samankaltaiset tiedostot
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Seulontatutkimusten perusperiaatteet

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Bayesiläinen tilastollinen vaihtelu

P (A)P (B A). P (B) P (A B) = P (A = 0)P (B = 1 A = 0) P (B = 1) P (A = 1)P (B = 1 A = 1) P (B = 1)

Järvitesti Ympäristöteknologia T571SA

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Erotusdiagnostiikasta. Matti Uhari Lastentautien klinikka, Oulun yliopisto

Harvinaiset sairaudet Euroopassa

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Gaussinen vaikutuskaavio Tommi Gustafsson 45434f Tfy IV

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen päättely, 10 op, 4 ov

EUROOPPALAISET OSAAMISVERKOSTOT APUA HARVINAISIA JA VAIKEITASAIRAUKSIA SAIRASTAVILLE. Share. Care. Cure. Terveys

EUROOPPALAISET OSAAMISVERKOSTOT APUA HARVINAISIA JA VAIKEITASAIRAUKSIA SAIRASTAVILLE. Share. Care. Cure. Terveys

Dynaaminen ohjelmointi ja vaikutuskaaviot

JOHDATUS TEKOÄLYYN LUENTO 4.

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

INTERVALLIPÄÄTÖSPUUT JANNE GUSTAFSSON 45433E. Mat Optimointiopin seminaari Referaatti

Nivelreuman serologiset testit: mitä ne kertovat? LT, apulaisylilääkäri Anna-Maija Haapala TAYS Laboratoriokeskus

Postanalytiikka ja tulosten tulkinta

Dynaaminen ohjelmointi ja vaikutuskaaviot

Virtsan kemiallisen seulonnan kliininen käyttö. Dosentti Martti L.T. Lalla Osastonylilääkäri HUSLAB Kirurginen sairaala

Testejä suhdeasteikollisille muuttujille

Yhteistyötä sisältämätön peliteoria jatkuu

Luento 2. Yksiparametrisia malleja. Binomi-malli. Posteriorijakauman esittämisestä. Informatiivisista priorijakaumista. Konjugaattipriori.

Otoskoko 107 kpl. a) 27 b) 2654

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tuberkuloosin immunodiagnostiset testit. Dosentti Tamara Tuuminen, kliinisen mikrobiologian erl HY, HUSLAB Labquality

TaLO-tapaukset Virusoppi. Vastuuhenkilöt: Tapaus 1: Matti Varis Tapaus 2: Veijo Hukkanen Tapaus 3: Sisko Tauriainen Tapaus 4: Ilkka Julkunen

Yleistetyistä lineaarisista malleista

Sovellettu todennäköisyyslaskenta B

Solmu 3/2001 Solmu 3/2001. Kevään 2001 ylioppilaskirjoitusten pitkän matematiikan kokeessa oli seuraava tehtävä:

Diagnostisten testien arviointi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovelletun fysiikan laitos Marko Vauhkonen, Kuopion yliopisto, Sovelletun fysiikan laitos Slide 1

1. TILASTOLLINEN HAHMONTUNNISTUS

Mat Tilastollisen analyysin perusteet, kevät 2007

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Havaitsevan tähtitieteen peruskurssi I

Testit järjestysasteikollisille muuttujille

Aloitustunti MAA22 Starttikurssi pitkän matematiikan opiskeluun

Osa 2: Otokset, otosjakaumat ja estimointi

Bayesilainen päätöksenteko / Bayesian decision theory

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

euron ongelma yksi ratkaisu Suomesta? Sijoitus Invest 2015, Helsinki Pekka Simula, toimitusjohtaja, Herantis Pharma Oyj

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Dynaamiset regressiomallit

Väliestimointi (jatkoa) Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Lataa Kliininen neuroimmunologia. Lataa

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

ABHELSINKI UNIVERSITY OF TECHNOLOGY

4.2.2 Uskottavuusfunktio f Y (y 0 X = x)

Suuntima - oman hoidon suunnittelua yhdessä ammattilaisen kanssa. Ulla Harala

Lataa MS-tauti. Lataa. Lataa kirja ilmaiseksi suomalainen MS-tauti Lataa Luettu Kuunnella E-kirja Suomi epub, Pdf, ibook, Kindle, Txt, Doc, Mobi

Johdatus tn-laskentaan perjantai

1. Tilastollinen malli??

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilmastonmuutoksen vaikutus Suomen sisävesiin

805306A Johdatus monimuuttujamenetelmiin, 5 op

Ensitietotoiminnan ulkoisen arvioinnin tuloksia

805306A Johdatus monimuuttujamenetelmiin, 5 op

JOHDATUS TEKOÄLYYN TEEMU ROOS

Demonstraatiot Luento 7 D7/1 D7/2 D7/3

Helsingin kaupunki Esityslista 8/ (5) Sosiaali- ja terveyslautakunta Sotep/

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Clostridium difficile diagnostiikan nykyvaihe ja pulmat. Janne Aittoniemi, LT, dos, oyl Fimlab Laboratoriot Oy

S Laskennallinen systeemibiologia

Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta?

PredictAD-hanke Kohti tehokkaampaa diagnostiikkaa Alzheimerin taudissa. Jyrki Lötjönen, johtava tutkija VTT

4.3. Matemaattinen induktio

Diagnostisten testien tunnusluvut ja niiden käyttö

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Sovellettu todennäköisyyslaskenta B

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Todennäköisyyden ominaisuuksia

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Moniulotteisia todennäköisyysjakaumia

Uuden vieritestin käyttöönotto avoterveydenhuollossa

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

Geneettisen tutkimustiedon

Tilastotieteen aihehakemisto

ESPANJANVESIKOIRIEN ROTUPALAVERI 2014 / ASIALISTA

Verkot ja todennäköisyyslaskenta. Verkot ja todennäköisyyslaskenta. Verkot ja todennäköisyyslaskenta: Esitiedot

Sovellettu todennäköisyyslaskenta B

Jardiance-valmisteen (empagliflotsiini) riskienhallintasuunnitelman (RMP) yhteenveto

Keuhkoahtaumataudin varhaisdiagnostiikka ja spirometria. Esko Kurttila Keuhkosairauksien ja työterveyshuollon erikoislääkäri

Trigonometrian kaavat 1/6 Sisältö ESITIEDOT: trigonometriset funktiot

Transkriptio:

Teknillinen korkeakoulu Systeemianalyysin laboratorio Mat-2.142 Optimointiopin seminaari Referaatti Uskomusverkot: Lääketieteelliset sovellukset Sami Nousiainen 44433N Tf V

2 1. JOHDANTO 3 2. YKSINKERTAINEN ESIMERKKI USKOMUSVERKON KÄYTÖSTÄ [1] 3 2.1 Konjugaattijakauman käsite 3 2.2 Sensitiivisyys ja spesifisyys 4 2.3 Uuden potilaan testaus ja diagnosointi 4 2.4 Päätelmiä 5 3. RINTASYÖVÄN DIAGNOSOINTI [2] 6 3.1 Yleistä 6 3.2 Käytetty data ja sen saatavuus 6 3.3 Päätelmiä 6 4. MAKSASAIRAUKSIEN DIAGNOSOINTI [3] 6 4.1 Yleistä 6 4.2 Uskomusverkko 6 4.3 Päätelmiä 7 5. YLEISIÄ JOHTOPÄÄTÖKSIÄ JA POHDINTOJA 7 5.1 Uskomusverkot vs. neuroverkot 7 5.2 Uskomusverkot ja data 7 5.3 Uskomusverkot ja kliininen työskentely 7

3 1. Johdanto Konenäkö, laitteiden mekaanisten vikojen ennustaminen, ohjelmien älykkäät avustustoiminnot ja lääketieteellinen diagnosointi ovat vain muutamia esimerkkejä kohteista, joihin uskomusverkkoja on sovellettu. Uskomusverkot tai Bayesin verkot kuten niitä myös kutsutaan ovat pelkistä sattumassolmuista koostuvia vaikutuskaavioita, joita voidaan käyttää päätöksenteon tukena. Niillä voidaan mallintaa ongelman muuttujien välisiä riippuvuussuhteita ja niihin voidaan helposti sisällyttää tehtävän kannalta oleellista asiantuntijainformaatiota. Uskomusverkkojen lääketieteelliset sovellukset muodostavat sekä haastavan että mielenkiintoisen ongelmakentän. Sairaudet ja niiden diagnosointi koskettavat käytännöllisesti katsoen kaikkia ihmisiä useinmiten kuitenkin potilasperspektiivistä. Lääkärin kannalta sairauden diagnosointi on monimutkainen prosessi, jossa yhdistyvät mm. lääkärin mahdollinen käytännön kokemus, teoreettinen osaaminen, potilaan oireista antama tieto sekä testitulosten tulkinta. Bayesin verkot ovat yritys hyödyntää saatavilla olevaa informaatiota mahdollisimman tehokkaasti ja ottaa huomioon monta erilaista taustatekijää. Niillä pyritään myös tekemään diagnosoitiprosessissista kvantitavinen ja päämääränä on saada verkosta ulos jonkinlainen diagnoosin varmuutta kuvaava jakauma. Kuvassa 1 on esimerkki uskomusverkosta (pieni osa), jota on käytetty rintasyövän diagnosointiin. potilaan ikä rintasyöpä aikaisempi biopsia rakent. vääristymä Kuva 1: Osa rintasyövän diagnosointiin käytetystä uskomusverkosta 2. Yksinkertainen esimerkki uskomusverkon käytöstä [1] 2.1 Konjugaattijakauman käsite Käytännön uskomusverkkotehtävissä muuttujat ovat usein diskreettejä. Tässä käsiteltävässä yksinkertaisessa esimerkkitapauksessa eräät parametrit kuitenkin jakautuvat jatkuvasti. Joissain erikoistapauksissa, sopivasti valituilla jakaumilla, malliin liittyvien parametrien arvojen päivitys Bayesin kaavalla onnistuu hyvin helposti.

4 Jos esimerkiksi satunnaismuuttuja x riippuu parametrista p ja x noudattaa binomijakaumaa m f x p x p x p m x ( ) = ( ) 1 (1) ja lisäksi parametri p noudattaa beta-jakaumaa Γ( α + β) α 1 β 1 g( p) = p ( 1 p) (2) Γ( α) Γ( β) onnistuu parametrin p jakauman päivitys hyvin helposti lisäinformaatiota (havaintoja x:stä) saataessa seuraavasti α' = α + x, β' = β + m x. (3) Parametrin p jakauman toiseen parametriin siis yksinkertaisesti lisätään tietyn tapahtuman sattumiskertojen, x, lukumäärä ja toiseen niiden kertojen lukumäärä, m-x, jolloin tapahtumaa ei sattunut. Beta- ja binomijakauma muodostavat konjugaattijakaumaparin. Vastaavanlaisia jakaumapareja on muitakin yhden parin muodostavat mm. beta-jakauman yleistys Dirichletin jakauma ja binomijakauman yleistys multinomijakauma. 2.2 Sensitiivisyys ja spesifisyys Kaksi hyvin tärkeää lääketieteelliseen testiin liittyvää käsitettä ovat sensitiivisyys ja spesifisyys. Merkitään D:llä merkitään henkilöitä, joilla on joku tietty tauti sekä D':lla ihmisiä, joilla tätä tautia ei ole. Lisäksi tarkoittakoon E + sitä, että tarkasteltava testi antaa positiivisen tuloksen (testin mukaan henkilöllä olisi sairaus) ja E - sitä, että testi antaa negatiivisen tuloksen (testin mukaan henkilöllä ei olisi sairautta). Tällöin testin sensitiivisyys voidaan määritellä ehdollisena todennäköisyytenä π = + Pr( E D ) (4) ja spesifisyys vastaavasti ehdollisena todennäköisyytenä θ = Pr( E D '). (5) Sensitiivisyys kertoo siis sen osuuden sairaista henkilöistä, jotka saavat testinkin mukaan sairaan paperit. Sensitiivisyys taas ilmoittaa terveistä henkilöistä osuuden, joille testin tulos on negatiivinen. Hyvällä testillä kumpikin em. tunnusluku on korkea (esim. 90 %). Jos todennäköisyysarvot tippuvat kovin alhaisiksi, menettää testi merkityksensä diagnostisena apuvälineenä. 2.3 Uuden potilaan testaus ja diagnosointi Tarkastellaan tilannetta, jossa potilas saapuu lääkärin vastaanotolle epäiltyään sairastavansa jotain tiettyä tautia. Lääkärillä on käytettävissä dataa muista ko. sairaudesta kär-

5 sivistä potilaista ja heidän testituloksista (taulukko 1). Lisäksi lääkäri arvioi uuden potilaan sairastavan tautia todennäköisyydellä 0.1. Taulukko 1: Potilasdataa E + E - yht. D 60 (=x) 90 150 (= m) D' 9 141 (= y) 150 (= n) Lääkäriä kiinnostaa, miten potilaan a priori sairastamistodennäköisyys muuttuu hänet testattaessa. Tilanteesta voidaan laatia kuvan 2 kaltainen uskomusverkko. x y ~ bi( m, π) x y ~ bi( n, θ) π ~ Be( 11, ) Pr{ t = 1 δ, π, θ) = π θ θ ~ Be( 11, ) Kuva 2: Uskomusverkko tilanteesta t π, δ = 1 1 θ, δ = 0 δ δ~ ber( 01. ) Satunnaismuuttujat t jaδ voivat saada vain arvot 0 ja 1 (t = 0: testin tulos negatiivinen, t = 1: testin tulos positiivinen,δ = 0: potilas terve,δ = 1: potilas sairas). Em. uskomusverkko voidaan ratkaista helposti esim. kaaria kääntämällä, jolloin diagnostiseksi todennäköisyydeksi saadaan 01. ( x + 1) / ( m+ 2) 1/ Pr{ t = 1 x, y}, t = 1 Pr{ δ= 1 t, x, y} =. (6) 01. ( n y + 1) / ( n + 2) 1/ Pr{ t = 0 x, y}, t = 0 Sijoittamalla taulukon 1 numeroarvot kaavaan päädytään tulokseen Pr{ δ = 1 t = 1, x = 60, y = 141} = 0. 40. (7) Pr{ δ = 0 t = 0, x = 60, y = 141} = 0. 93 2.4 Päätelmiä Lukuarvot osoittavat selvästi, että a posterioritodennäköisyys taudille (0.40) poikkeaa oleellisesti lääkärin aikaisemmasta a priori arviosta (0.10). Tämä tapaus oli kuitenkin äärimmäisen yksinkertainen ja tehtävän uskomusverkkoformulaatio oli lähinnä matemaattinen kuriositeetti. Likimain vastaava metodiikka soveltuu kuitenkin myös huomattavasti hankalampiin, todellisen elämän tilanteisiin. Oleellisena erona on kuitenkin todellisessa tapauksessa satunnaismuuttujien diskretointi.

6 3. Rintasyövän diagnosointi [2] 3.1 Yleistä Rintasyöpä on eräs sairaus, johon uskomusverkkoja on sovellettu. Oleellisena motivaattorina on ollut ko. taudin yleisyys: USA:ssa 120 000 180 000 uutta tapausta ja 40 000 kuolemantapausta vuodessa. Tärkeä tekijä on myös se seikka, että 75 % mammografiakuvista on hyvin epämääräisiä, jolloin lisäinformaation käytöllä olisi ehkä mahdollista tehdä parempia päätelmiä. 3.2 Käytetty data ja sen saatavuus Rintasyövän diagnosointiin tarkoitetussa uskomusverkossa sattumasolmuina oli useita eri muuttujia. Muuttujat oli jaettu karkeasti kolmeen ryhmään: potilaan taustatiedot, fysikaaliset löydökset ja mammografialöydökset. Ensimmäiseen ryhmään kuuluu esimerkiksi potilaan ikä, toiseen potilaan tuntema kipu ja kolmanteen mammografiakuvassa mahdollisesti näkyvä epätavallinen massajakauma. Tiedot uskomusverkon priorijakaumia ja ehdollisia todennäköisyysjakaumia varten kerättiin radiologian alan lehdistä, mammografia-asiantuntijoilta sekä syöpäjärjestöltä. Oleelliseksi ongelmaksi muidostui datan niukkuus: eritoten ehdollisia todennäköisyyksiä P("oire" "syöpä") oli hyvin vaikea estimoida vähäisen datan vuoksi. Myöskin epätäsmällinen ja osittain vakiintumaton terminologia aiheutti ongelmia kvalitaviisten lausuntojen kvantisoinnissa. 3.3 Päätelmiä Rintasyövän diagnosointia oli testattu muutamilla oikeilla tapauksilla ja niistä uskomusverkkopohjainen järjestelmä suoriutuikin mallikelpoisesti. Tapaukset vaikuttivat kuitenkin ainakin osittain olevan melko triviaaleja ja jopa maallikon ratkaistavissa. Systeemistä oli myös liian vähän tietoa saatavilla konkreettista ja täsmällistä järjestelmän laadun arviointia varten. Idea vaikutti sinänsä kyllä hyvältä, mutta sen hyödyistä ja soveltuvuudesta kliiniseen käyttöön ei ollut annettu riittävästi arvioita. 4. Maksasairauksien diagnosointi [3] 4.1 Yleistä Maksasairauksien diagnosointia varten kehitettyä uskomusverkkomallia varten oli käytettävissä 570 potilaan tiedot. Jokainen näistä potilaista sairasti jotain 17:sta malliin mukaanotetusta maksasairaudesta. 4.2 Uskomusverkko Kaikki verkon satunnaismuuttujat diskretoitiin. Esimerkiksi verensokeri saattoi saada arvot matala, normaali, korkea tai hyvin korkea. Alunperin mallissa oli 119 piirrettä (satunnaismuuttujaa), mutta niiden määrä redusointiin 37:ään poistamalla asiantuntijan mielestä epäoleellisia muuttujia tai sellaisia, joista ei ollut täydellistä dataa saatavilla (esim. kaikilta potilailta ei ollut mitattu jotain arvoa). Lisäksi muuttujien väliset tilastolliset riippuvuudet otettiin huomioon.

7 4.3 Päätelmiä Tehtyä työtä oli tarkoitus ilmeisestikin jatkaa tutkimalla erilaisia alunperin jatkuvien satunnaismuuttujien diskretointeja sekä ottamalla huomioon eri sairauksien virhediagnoosin aiheuttamat kustannukset. Esimerkiksi vakavien sairauksien, kuten syövän, huomaamatta jättäminen pitäisi olla paljon harvinaisempaa kuin jonkin tavallisen sairauden. Ongelmana vaikutti tässäkin sovellusesimerkissä olevan mm. vähäinen saatavilla olevan datan määrä. 5. Yleisiä johtopäätöksiä ja pohdintoja 5.1 Uskomusverkot vs. neuroverkot Uskomusverkot kilpailevat osittain neuroverkkojen kanssa. Eritoten lääketieteellisen diagnostiikan tapauksessa, jossa asiantuntijainformaatiota on paljon saatavilla, uskomusverkot vaikuttavat paremmalta vaihtoehdolta. Niiden parametreja (jakaumia) on mahdollista muuttaa ekspertin antaman informaation perusteella ja parametreilla on myös selvä todennäköisyystulkinta. Luokitteluongelmiin käytetyt neuroverkot sen sijaan perustuvat lähes täysin "musta laatikko" -ajatteluun, jossa ollaan kiinnostuneita syötteiden antamista vasteista, mutta ei juurikaan verkon sisäisestä toiminnasta. Neuroverkon parametreilla ei olekaan yleensä mitään järkevää tulkintaa. 5.2 Uskomusverkot ja data Uskomusverkkojen menestykäs soveltaminen edellyttää suurta datamäärää, josta sattumasolmujen priorijakaumat ja ehdolliset jakaumat on mahdollista estimoida. Käsitellyissä tapauksissa dataa tuntui olevan melkoisen niukalti ja tämä heikensikin selvästi mallien käytettävyyttä. Periaatteessa potilasdataa on sairaaloissa paljon, mutta sen hyödyntäminen on vielä hyvin vähäistä. Informaation käyttämiseen liittyy luonnollisesti mm. yksityisyysongelmia, mutta ehkäpä oleellisempana tekijänä on ihmisten konservatiivisuus. 5.3 Uskomusverkot ja kliininen työskentely Varsinkin aloitteleville, kokemattomille lääkäreille tietokonepohjaisesta diagnoosityökalusta olisi varmasti hyötyä. Itsenäisesti toimivaksi "lääkäriksi" tällaisestä järjestelmästä perustui se sitten Bayesin verkkoihin tai neuroverkkoihin tuskin kuitenkaan on. Viitteet [1] Pereira: Influence Diagrams and Medical Diagnosis [2] Roberts, Kahn, Haddawy: Development of Bayesian Network for Diagnosis of Breast Cancer [3] Onisko, Druzdzel, Wasyluk: Application of Bayesian Belief Networks to Diagnosis of Liver Disorders