VOIKO TEKNOLOGIA PARANTAA TERVEYSTIEDON JA -KOMMUNIKAATION YMMÄRRETTÄVYYTTÄ?



Samankaltaiset tiedostot
MITEN LÖYTÄÄ OLENNAINEN HOITOTYÖN KIRJAUKSISTA? Ylihoitaja, TtM Tuija Lehtikunnas Tutkija, FM Hanna Suominen LOUHI-SEMINAARI

Automaattinen puheentunnistus - onko sitä olemassa? - liiketoimintaprosessien tehostaminen puheentunnistuksella

- Keskustelu symbolein. i

Mittausvirhe. Mittaustekniikan perusteet / luento 6. Mittausvirhe. Mittausepävarmuus ja siihen liittyvää terminologiaa

Tchebycheff-menetelmä ja STEM

BL20A0600 Sähkönsiirtotekniikka

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

SOTEMAKU esiselvitysraportti

- Keskustelu symbolein. i

Tavoitteet skaalaavan funktion lähestymistapa eli referenssipiste menetelmä

Mittausepävarmuus. Mittaustekniikan perusteet / luento 7. Mittausepävarmuus. Mittausepävarmuuden laskeminen. Epävarmuuslaskelma vai virhearvio?

TIES592 Monitavoiteoptimointi ja teollisten prosessien hallinta. Yliassistentti Jussi Hakanen syksy 2010

Miten löytää heikot signaalit hoitotyön kirjauksista?

Kuluttajahintojen muutokset

6. Stokastiset prosessit (2)

ABTEKNILLINEN KORKEAKOULU

Valtuustoon nähden sitovat mittarit

Kohti tehohoitotyön narratiivien tehokkaampaa hyödyntämistä luonnollisen kielen käsittelyn avulla

3.5 Generoivat funktiot ja momentit

A DEA Game I Chapters

A = B = T = Merkkijonon A osamerkkijono A[i..j]: n merkkiä pitkä merkkijono A:

Luento 6 Luotettavuus Koherentit järjestelmät

etappi.com VIESTI PAUKAHTAA LAKEURELTA

Aamukatsaus

Segmentointimenetelmien käyttökelpoisuus

3 Tilayhtälöiden numeerinen integrointi

Monte Carlo -menetelmä

ER-kaaviot. Ohjelmien analysointi. Tilakaaviot. UML-kaaviot (luokkakaavio) Tietohakemisto. UML-kaaviot (sekvenssikaavio) Kirjasto

1. Luvut 1, 10 on laitettu ympyrän kehälle. Osoita, että löytyy kolme vierekkäistä

PRS-xPxxx- ja LBB 4428/00 - tehovahvistimet

Johdatus tekoälyn taustalla olevaan matematiikkaan

Tilastotietoja lääkäreistä ja terveydenhuollosta Statistics on physicians and the health care system 2

1. Liikkuvat määreet

TULEVAISUUDEN KILPAILUKYKY VAATII OSAAVAT TEKIJÄNSÄ. Suomen Ammattiin Opiskelevien Liitto - SAKKI ry

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 7B Ratkaisuehdotuksia.

Asennus- ja käyttöohjeet. Videoterminaali

Painotetun metriikan ja NBI menetelmä

4. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

in 2/ InHelp palvelee aina kun apu on tarpeen INMICSIN ASIAKASLEHTI

Työllistääkö aktivointi?

Tilastollisen fysiikan luennot

3. Datan käsittely lyhyt katsaus

Yhdistä kodinkoneesi tulevaisuuteen. Pikaopas

Base unweighted Base weighted TK2 - TK2. Kuinka usein luette kemikaalien varoitusmerkit ja käyttöohjeet?

5. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

PPSS. Roolikäyttäytymisanalyysi Tämän raportin on tuottanut: MLP Modular Learning Processes Oy Äyritie 8 A FIN Vantaa info@mlp.

FYSA220/2 (FYS222/2) VALON POLARISAATIO

4. A priori menetelmät

Jaetut resurssit. Tosiaikajärjestelmät Luento 5: Resurssien hallinta ja prioriteetit. Mitä voi mennä pieleen? Resurssikilpailu ja estyminen

EV EKOVESSAT. Modernit kompostoivat wclaitteet. Useita wc-istuinmalleja:

LÄMPIMÄSTI TERVETULOA HYVÄÄ TEKEVIEN HERKKUJEN ÄÄREEN!

Ilkka Mellin (2008) 1/24

Ymmärrettävän tuottaminen ja tuotetun ymmärtäminen teknologia kielen ja kommunikaation tukena

Yrityksen teoria ja sopimukset

= E(Y 2 ) 1 n. = var(y 2 ) = E(Y 4 ) (E(Y 2 )) 2. Materiaalin esimerkin b) nojalla log-uskottavuusfunktio on l(θ; y) = n(y θ)2

on määritelty tarkemmin kohdassa 2.3 ja pi kohdassa 2.2.

Terveyshyötymalli (CCM) Minerva Krohn Perusterveydenhuollon kehittäjäylilääkäri

OUTER JOIN se vanha kunnon kaveri

TYÖVOIMAKOULUTUKSEN VAIKUTUS TYÖTTÖMIEN TYÖLLISTYMISEEN

Mat Lineaarinen ohjelmointi

Mat /Mat Matematiikan peruskurssi C3/KP3-I Harjoitus 2, esimerkkiratkaisut

Yhdistä kodinkoneesi tulevaisuuteen. Pikaopas

SELECT-lauseen perusmuoto

4. MARKKINOIDEN TASAPAINOTTUMINEN 4.1. Tasapainoperiaate Yritysten ja kuluttajien välinen tasapaino

SMG-1100: PIIRIANALYYSI I

Kanoniset muunnokset

2 Hoitotyön vapaamuotoinen

3.3 Hajontaluvuista. MAB5: Tunnusluvut

Painokerroin-, epsilon-rajoitusehtoja hybridimenetelmät

FDS-OHJELMAN UUSIA OMINAISUUKSIA

Teknologinen muutos ja yliopistojen tulevaisuus. Tievie-seminaari Helsinki Antti Auer


Results on the new polydrug use questions in the Finnish TDI data

Jaksolliset ja toistuvat suoritukset

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 7: Lagrangen kertojat. Pienimmän neliösumman menetelmä.

1. YLEISKATSAUS MYYNTIPAKKAUKSEN SISÄLTÖ. ZeFit USB -latausklipsi Käyttöohje. Painike

+ Uusi elinkeinosopimus tuo sujuvammat palvelut. Gasera Oy kasvaa julkisten elinkeinopalveluiden vauhdittamana

OKLS535. Opetusharjoittelu, OH3, 8 op kevät Harjoittelun tavoitteet

Hyvä asukas on täällä.

Tietojen laskentahetki λ α per ,15 0,18 per ,15 0,18 per tai myöhempi 0,20 0,18

COULOMBIN VOIMA JA SÄHKÖKENTTÄ, PISTEVARAUKSET, JATKUVAT VARAUSJAKAUMAT

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

ler-modern isaatio * d *r n ax* *neäemw & rffi rffi # Sch ind Schindler {4ssxisä tu\*vmisu a**r3 \mj**nt rei

Moderni portfolioteoria

Tietoa työnantajille 2010

AMMATTIMAISTA KIINTEISTÖPALVELUA JO 50 VUODEN AJAN

VAIKKA LAINAN TAKAISIN MAKSETTAVA MÄÄRÄ ON SEN NIMELLISARVO, SIJOITTAJA VOI MENETTÄÄ OSAN MERKINTÄHINNASTA, JOS LAINA ON MERKITTY YLIKURSSIIN

Sanaluokkajäsennystä rinnakkaisilla transduktoreilla

Pikaopas. Valmistelu ja esitäyttö

Viiteopas. 2 Kokoa ja kiinnitä uusi natronkalkkikolonni. 1 Poista vanha natronkalkki. Esitäyttö esiliitetyn letkuston avulla

POISTUMISAIKALASKELMAT PALOTILANTEISSA

Suomen metsäkeskus. Zonation ja luonnonhoidon alueellinen suunnittelu yksityismetsissä

Vesipuitedirektiivin mukainen kustannustehokkuusanalyysi maatalouden vesienhoitotoimenpiteille Excel sovelluksena

Tiedosta hyvinvointia 1 SNOMED CT. Outi Meriläinen

SU/Vakuutusmatemaattinen yksikkö (5)

Suomen ja Ruotsin metsäteollisuuden kannattavuusvertailu v No. 47. Pekka Ylä-Anttila

Palkanlaskennan vuodenvaihdemuistio 2014

Timo Tarvainen PUROSEDIMENTIIANALYYSIEN HAVAINNOLLISTAMINEN GEOSTATISTIIKAN KEINOIN. Outokumpu Oy Atk-osasto

Lisensointikuulumisia - Kustannustehokkuus Oracle lisensoinnissa

Kuluttajapalvelun rakentaminen. Omegawave Mikko Heilimo

Transkriptio:

VOIKO TEKNOLOGIA PARANTAA TERVEYSTIEDON JA -KOMMUNIKAATION YMMÄRRETTÄVYYTTÄ? Hanna Suomnen, Tapo Salakosk, Flp Gnter Turun ylopsto IKITIK-teemapävä 16.9.2009, Turku

1. Johdanto 1. Informaato- ja kelteknologa 2. Terveysteto ja kommunkaato 2. Ymmärrettävyys ja tavotettavuus 1. Ongelmat nykytlassa 2. Tukemsella saavutettavat edut 3. Teknologsa komponentteja 1. Tulktseva tedonhaku 2. Dagnosont 3. Suomen kelen ymmärtämnen 4. Komponentesta kokonasuus 1. Tedonkulun kokonasuus SISÄLTÖ 2. Iteratvnen prosess 3. Tomjoden yhtestyö Kuva: Turun ylopston vestntä 2

INFORMAATIO- JA KIELITEKNOLOGIA Menetelmä ja ratkasuja puhutun ta krjotetun kelen tunnstamseen, tuottamseen ja analysomseen Esmerkks Puheentunnstus Sanastollnen ja kelopllnen tarkstus ja yhdenmukastamnen Ssällön ohjaamnen rakenteellsest ja alueellsest Ryhmttely ja strukturodun tedon automaattnen tuottamnen Tulktseva tedonhaku Lomakkeden täyttämnen Tvstämnen 3

TERVEYSTIETO Numeernen ja luokttanen Puhuttu ja krjotettu tekst Ptkä aamuv Teholle tulua nopea fa, jota yrtetty kääntää sähkllä (x3) tuloksetta. Durees hekko, aamulla Hyödyntämnen: Vertalu Yhdstämnen 4

TERVEYSKOMMUNIKAATIO Monkelnen ja -ammatllnen ympärstö, jossa teto- ja kommunkaatotarpeet vahtelevat Henklöasakkaat: Terveyden- ja elämänhallnta Terveysasakrjat Kommunkaaton kelet Suom, ruots, englant, Turku, savo, uusmaa, Teho-osasto, ssätaudt, työterveys, Saraanhotaja, lääkär, radolog, Monammatllnen terveyspalvelujen tomttajatm: Klnnen päätöksenteko ja hallnto 5

YMMÄRRETTÄVYYS JA TAVOITETTAVUUS Terveystedon ongelmat Suur määrä Hajananen rakenne Referentaalsen monnasuus Ymmärrettävyyden ja tavotettavuuden edut Aktvovat henklöasakkata edstämään terveyttä entstäkn paremmn Omakelsyys ja yhteydet lsätetoon Nopeuttavat terveyskommunkaatota Tetotarpeet ja välttyvyys Ennaltaehkäsevät hotovrhetä Tedon saatavuus ja okeellsuus 6

TUTKIMUKSIA Lehtkunnas, Salanterä & Hupl (2002). Krjaamnen tehohototyössä. Ykslöden terveyden ja hyvnvonnn vahvstamnen er ympärstössä elämänkulun kakssa vahessa VII kansallnen hototeteen konferenss Suomnen, Lehtkunnas, Back, Karsten, Salakosk, Salanterä (2007). Applyng Language Technology to Nursng Documents: Pros and Cons wth a Focus on Ethcs. Int J Med Inform 76S2 Suomnen, Lundgrén-Lane, Perttlä, Salakosk, Salanterä (2008). Tehohodon elektronset potlasasakrjat hyödyntämätön vomavara. Valtakunnallset Lääkärpävät 2008

SUURI MÄÄRÄ 516 tehohotopotlaan asakrjat Dagnoos Hotosuuspste Tulotyypp, LOS n Kesk-arvo Mnm Maksm Tulo Pävä 348 250 8 7 s. 2100 1 516 2 516 270 480 37 130 720 1290 Hoto 3 516 690 240 1700 4 516 880 290 2000 7 382 1500 660 2800 14 99 2800 1600 4600 48 s. Kakk 516 2100 480 13000 Keskarvo 516 190 89 380 Srto 514 400 140 4 s. 1000 8

HAJANAINEN RAKENNE 516 tehohotopotlaan asakrjat Monta muotoa samasta otskosta Hemodynamkka: yl 30 erlasta versota Ovatko otskot rnnakkaset? Hengtys Hapetus, Hemodynamkka Verenkerto Sama teto er otskoden alla Hemodynamkka: ICP Tajunta: ICP Tedonkulussa ongelma Tulo Hoto Srto 9

REFERENTIAALINEN MONINAISUUS 516 tehohotopotlaan asakrjat Noradrenaln Perusmuodolla yl 60 erlasta krjotusasua Erlasa tavutusmuotoja ja johdannasa yl 350 nonadrenaln, nonadrenalna, nor, norad, noradenaln, noradenalna, noraderenalna, noraderenaln, noradernalna, nor-adr, nor.adr, noradr, noradranalan, noradranlna, noradreanln, noradreanlna, noradreln, noradreln, noradren, noradrenal, noradrenalana, noradrenal, noradrenala, noradrenalan, noradrenala, noradrenalna, noradrenalm, noradrenaln, noradrenalna, noradrenaln, noradrenalnna, noradrenaln, noradrenalne, noradrenaln, noradrenallna, noradrenalln, noradrenanl, noradrenanln, noradrenenalna, noradrenln, noradrenln, noradrenlna, noradrenln, noradrnaln, noradrnalna, noradrrenaln, noradrtenaln, norandrenalna, noraradrenalna, norarenaln, norarenalna, noratrenaln, nordarenaln, nordrenaln, nordrenaln, nordrenalna, nordrenanl, noreadr, norradenalna, norradrenaln, norradrenaln, norradrenaln, norr, norrradrenaln 10

OMAKIELISYYS JA YHTEYDET LISÄTIETOON Hotokertomus englannnkelselle potlaalle suomalaselta teho-osastolta Teholle tulua nopea fa, jota yrtetty kääntää sähkllä (x3) tuloksetta. Okoluku Yhdenmukastamnen Termseltykset Kääntämnen After the ntensve care admsson, the patent had fast fbrllato atrorum, whch clncans tred to convert usng electrcty. Regardless of three attempts, ths dd not solve the problem. 11

TIETOTARPEET JA VÄLITTYVYYS Kardolog tarvtsee tvstelmän potlaan hemodynamkasta tehohotojakson ajalta Teholle tulua nopea fa, jota yrtetty kääntää sähkllä (x3) tuloksetta. Okoluku Yhdenmukastamnen Hakutomnnot Tvstämnen Teholle tultua nopeahko FA, jota yrtetty kääntää sähköllä (x3) tuloksetta. Durees hekko, aamu LÄÄKE. Poka ja vamo kylässä. Aamulla pulss vahteleva ja avopaneet koholla. Dreenvuoto nukkaa. 12

TIEDON SAATAVUUS JA OIKEELLISUUS Saatavuus Hakutomnnot ja tvstelmen teon tukemnen Strukturonnn automatsont Otskont Tetokentten täyttö Tlastontn tarvtaan dagnooskoodt, mutta osasta asakrjosta teto puuttuu Verrokkmelpde dagnoossta päätöksenteon tueks ta mustutukseks Okeellsuus MRSA v Kysytty aheesta? Test tehty? Tulos postvnen? Mustutukset krjata Kvunarvont ja -hoto 13

TAVOITE 1: TULKITSEVA TIEDONHAKU HAKUAIHE: hengtys ARVIOINTIASTEIKKO: TODELLA RELEVANTTI MELKO RELEVANTTI HIEMAN RELEVANTTI omaset: tytär sott (kaks tytärtä) Tajunta: säpsähtelee HENGITYS ysk sllon tällön kelt. lmaa tulee. Reago muhn: puree ntub putkea + ysk. Hapenottokyky e ok --> o2 2l vkset -> sopeutuu hyvn Hemodyn. p. ^ v, myös hap. ^ v parn mn välen. ekg aamulla. 14

TUTKIMUKSIA Suomnen, Pahkkala, Hssa, Lehtkunnas, Back, Karsten, Salanterä, Salakosk (2006). Relevance Rankng of Intensve Care Nursng Narratves. Lecture Notes n Computer Scence 4251 Hssa, Pahkkala, Suomnen, Lehtkunnas, Back, Karsten, Salanterä, Salakosk (2007). Towards Automated Classfcaton of Intensve Care Nursng Narratves. Int J Med Inform 76S3 Suomnen, Lundgrén-Lane, Salanterä, Salakosk (2009). Evaluatng Pan n Intensve Care. Studes n Health Technology and Informatcs 146 Gnter, Suomnen, Pyysalo, Salakosk (2009). Combnng Hdden Markov Models and Latent Semantc Analyss for Topc Segmentaton and Labelng: Method and Clncal Applcaton. Int J Med Inform. In Prnt

LUOKITTELU Aheet: hengtys, verenkerto, kpu 3 asantuntjaa Plottanesto suomalaslta teho-osastolta Cohenn κ (95% CI) N 1 - N 2 N 1 - N 3 N 2 - N 3 Hengtys Verenkerto Kpu,73 (,68,78),89 (,85,92),88 (,82,94),67 (,62,72),81 (,77,86),79 (,73,86),82 (,82,89),87 (,83,90),76 (,69,83) 16

RLS LUOKITTELUUN JA RELEVANSSIN ARVOSTELUUN Matemaattnen optmontongelma mn 2 ( f ( x ) y ) + λ f f k( x, x ) = x, x x, x x, x 2 k, mssä Lngvstnen kästtely: Snowball stemmer suomelle Teholle tultua nopeahko teho tul nopeahko 17

AUTOMAATTINEN LUOKITTELU AUC (95% LV) Hengtys Verenkerto Kpu C(N 1 ) vs. N 1,86 (,82,90),89 (,84,93),71 (,61,80) C(N 2 ) vs. N 2,88 (,85,91),93 (,90,97),81 (,73,89) C(N 3 ) vs. N 3,87 (,84,91),91 (,86,95 ),71 (,61,80) AUC Hengtys Verenkerto Kpu N 1 N 2 N 3 N 1 N 2 N 3 N 1 N 2 N 3 C(N 1 ),86,74,72,89,93,91,71,81,72 C(N 2 ),83,88,86,88,93,91,71,81,71 C(N 3 ),84,88,87,89,93,91,67,77,71 18

RELEVANSSIN ARVIOINTI 3 2 1 0 Hengtys Hapetus Hengtyskoneet Lma Yskä Pleuradreent Verenkerto Pulss Verenpane Lämpö Ihonvär Kpu kpu särky Epäsuorat kpundkaattort E kpu Kendalln τ b 95% LV Hengtys,62 (,56,68) Verenkerto,69 (,61,76) Kpu,44 (,30,59) 19

KAPPALEIDEN AIHEET JA KAPPALEENJAOT AUTOMAATTISESTI SYÖTE 1. Tekst 0001: 2006-12-11 18:02 Ptkä aamuv Teholle tultua nopeahko FA, jota yrettty kääntää sähkölä (x3) tuloksetta 2. Aheet 1. Hengtys 2. Hemodynamkka 3. Tajunta 4. Omaset 5. Durees Muuta LINGVISTINEN KÄSITTELY + ~3500 erkostermä FnTWOL Lemmatsont Teholle teho tultua tulla nopeahko nopeahko KAPPALEIDEN JAOTTELU JA NIMEÄMINEN 135 potlasta, 3 vuoroa/potlas Kätketty Markovn mall (HMM) TULOSTE Jaotellut tekstt 0001: 2006-12-11 18:02 Ptkä aamuv Teholle tultua nopeahko FA, jota yrettty kääntää sähkölä (x3) tuloksetta. Durees hekko, aamu LÄÄKE. Dr vuoto normaal, vähänen. CPAP:lla ok hapetus ja vent. Spontaanst herellä. LÄÄKE 5mg v Poka ja vamo kylässä. 20

HMM JA LSA-HMM TEKSTI teho tulla nopeahko FA SANA LSA AIHE δ W 1 W 2 W 3 W 4 e m s s o t o d e n n ä k ö s y y d e t s 1 s 2 s 3 s 4 t r a n s t o t o d e n n ä k ö s y y d e t Schützen Word-space LSA: Sanan ja aheen samankaltasuus P(ssko, omaset) >> P(ssko, hengtys) Jatketaan samaa ahetta Suur δ suuret kappaleet: hemodynamkka Pen δ penet kappaleet: durees 21

HMM JA LSA-HMM Word seuence: w= ( w(1), K, w( T )) Topc seuence: = ( (1), K, ( T )) Words: w Topcs: j, w, j {1, K, N } {1, K, N } other = other NOT breathng NOT hemodynamcs NOT consousness NOT relatve NOT duress 6 = 6 NOT 1 NOT 2 NOT 3 NOT 4 NOT 5 Problem: ˆ = arg max P( w(1) Transton probabltes: (1)) P( j T t= 2 P( w( t) Emsson probabltes: P w ) = LSA( w, ) ˆ = arg max LSA( w(1), (1)) ( j j T t= 2 ( t)) P( ( t) δ, f j = ) = 1 δ, f j N 1 LSA( w( t), ( t)) P( ( t) ( t 1)) ( t 1)) 22

23 = = T t t t P t w t w 2 1)) ( ) ( ( )) ( ), ( LSA( (1)) (1), arg max LSA( ˆ Arvojen vertalun ongelma OMAISET omanen sottaa tytär vamo veralu poka kello mes vel ssko HEMODYNAMIIKKA hemodynamkka pulss sr rr-taso korkeahko snusrytm rr verenpane lsälyönt ok 1.000 0.947 0.916 0.889 0.877 0.859 0.821 0.820 0.785 0.777 1.000 0.910 0.819 0.785 0.784 0.784 0.768 0.716 0.673 0.672 MUUTA vatsa muu verkko hemolysotuu pata varjoanetehoste pete LÄÄKKEEstä pehmeä neulanäyte 0.683 0.682 0.676 0.673 0.637 0.635 0.630 0.618 0.618 0.614 TARVE SKAALATA LSA-ARVOT

LSA-ARVOJEN SKAALAUS LSA 1 ( = max LSA( w = w j 0.71 = other) j, ) LSA smlarty Mnmal smlarty of any word to any topc β 1 0.8 0.7 0.6 0.4 0.2 0.1 0 TOPIC: other Re-scaled LSA LSA Maxmum LSA to another topc 1 10 100 322 1000 10000 Word ndex (log scale) I( LSA = 0.41 (topc-ndependent) LSA = 0 ( = other) = mn LSA( w w = other) = 322 j m ( > α = I = other) 0.7 j, ) 24

25 + + = = = ) ( before s f, ) ( LSA ) ( LSA )) ( LSA ), )(LSA( ( ) ( before s f, ) ( LSA ) LSA ( )) ( LSA ), )(LSA( (1 ), LSA'( where 1)), ( ) ( ( )) ( ), ( LSA'( (1)) (1), arg max LSA'( ˆ I 1 2 j m m j j I I j j T t I w w I w w w t t P t w t w β β α α α LSA-KMM MENETELMÄ

HMM JA LSA-HMM MENETELMIEN VERTAILU Sanottanen tarkkuuden Accuracy KA testauksessa 0.85 ~50 vuoroa ~50 vuoroa 0.8 0.75 0.7 0.65 KMM_alkuperänen HMM orgnal KMM_alkuperänen ~25 vuoroa ~25 0.6 KMM_lemmatsotu HMM lemmatzed KMM_lemmatsotu vuoroa Ahehaku_lemmatsotu Keywords lemmatzed Ahehaku_lemmatsotu 0.55 0 2 4 6 8 10 12 14 16 Number Sanoja of opetuksessa words [thousands] [tuhansna] Lngvstnen kästtely & HMM HMM Lngvstnen kästtely & LSA-HMM Lngvstnen kästtely & avansanahaku Lngvstnen kästtely + Erlaset tetotarpeet Menetelmän valnta 26

TULOKSIA 1: TULKITSEVA TIEDONHAKU Tavote Tekststä vodaan hakea tetoa aheen perusteella ymmärtäen ja tulkten Käyttäjä määrttää ja ohjaa hakua Tulosten käyttökelposuus Laatu ja luotettavuus Nopeus ja mplementotavuus 27

TAVOITE 2: AUTOMAATTINEN DIAGNOSOINTI CLINICAL HISTORY Ths s a 7-month - old male wth wheezng. IMPRESSION Borderlne hypernflaton wth left lower lobe atelectass versus pneumona. Clncal correlaton would be helpful. Unless there s clncal nformaton supportng pneumona such as fever and cough, I favor atelectass. ICD-9-CM CODING 486 Pneumona, organsm unspecfed 518.0 Pulmonary collapse 786.07 Wheezng 45 kooda 94 yhdstelmänä 28

TUTKIMUKSIA Suomnen, Gnter, Pyysalo, Arola, Pahkkala, Salanterä, Salakosk (2008). Machne Learnng to Automate the Assgnment of Dagnoss Codes to Freetext Radology Reports: a Method Descrpton. Proceedngs of the ICML/UAI/COLT 2008 Workshop on Machne Learnng for Health-Care Applcatons Farkas, Szarvas (2008). Automatc constructon of rulebased ICD-9-CM codng systems. BMC Bonformatcs 9S3

JÄRJESTELMÄMME PIIRTEIDEN JALOSTAMINEN 45 kenotekosta esmerkkä Tokensont UMLS-kästteet ja -yläkästteet Kontekst Bnäärprteet LUOKITTELU RLS vrhe Rpper 30

UMLS-kästteet ja -yläkästteet PIIRTEIDEN JALOSTAMINEN Kenotekoset esmerkt opetuksessa 580-629 Dseases of the gentournary system 590-599 Other dseases of urnary system 593 Other dsorders of kdney and ureter 593.7 Vescoureteral reflux 593.70 Vescoureteral reflux unspecfed or wthout reflux nephropathy pneumona supermposed pneumona C0032285 respratory tract nfecton dsease caused by mcroorganzm bacteral nfecton Kontekst: negaatot ja spekulatvset lmaukset no, postve, suggestve, lkely no pneumona no respratory tract nfecton 31

KILPAILU 3 asantuntjaa F1-mkro Asantuntja - Asantuntja,673,758 Asantuntja - Gold standard,826,896 Non 150 osallstujaa, 44 valmsta järjestelmää 6 maanosaa ja yl 20 maata F1-mkro Keskarvo,766 Keskhajonta,133 Medaan,799 1.,891 2.,886 3.,877 4.,876 5.,872 Järjestelmämme opetusanestolla Komponentt F1-mkro RLS,793 Tokensont,807 UMLS-kästteet,825 UMLS-yläkästteet,834 Kontekst,847 Jatkokästtelyyn RIPPER,865 Kenotekoset esmerkt,866 32

Tavote Dagnooskooden muodostamnen tekstssällön perusteella Tlantesn, jossa koodeja e ole annettu ta päätöksenteon tueks Tulosten käyttökelposuus Laatu ja luotettavuus Nopeus ja mplementotavuus Kelspesfset resursst TULOKSIA 2: AUTOMAATTINEN DIAGNOSOINTI 33

TAVOITE 3: SUOMEN KIELEN YMMÄRTÄMINEN JÄSENTÄMINEN Jäsentämsellä selvlle sanan rool suhteessa muhn lauseen sanohn Ymmärrys lauseesta kasvaa. Se e ole enää van sanajono. Jäsentämsellä on keskenen rool lauseen merktyksen ymmärtämsessä Kuka saapu? Potlas (subjekt) Mnne? Osastolle (nomnaalmääre allatvssa) Kenellä e ollut kävelykeppejä? (potlas va osasto?) 34

TUTKIMUKSIA Havernen, Gnter, Lappala, Salakosk (2009). Parsng Clncal Fnnsh: Experments wth Rule-Based and Statstcal Dependency Parsers. Proceedngs of NODALIDA'09. Lappala, Gnter, Pyysalo, Salakosk (2009). Towards Automated Processng of Clncal Fnnsh: A Sublanguage Analyss and a Rule-Based Parser. Int J Med Inform. In Prnt 35

JÄSENTÄMINEN Mks Sanajärjestyksen normalsont Potlas saapu osastolle. Osastolle saapu potlas. Ymmärtämnen Mtä on tehty (yleensä pääverb) Ketä/Mtä (yleensä subjekt) Kenelle/Mtä (yleensä objekt) Tärkeä analysontvahe E jäsennetä jäsentämsen taka. Hyödyks esmerkks Tvstämsessä Kääntämsessä Tulktsevassa tedonhaussa

JÄSENTÄMINEN Vodaan tehdä automaattsest 1. Sääntöpohjasest ohjelmoden kakk keloppsäännöt 2. Tlastollsella koneoppmsella jäsentäen ensn rttävän suur määrä lauseta (n. 10 000) ja käyttäen ntä stten koneen opetusesmerkkenä Molemmat tavat vaatvat paljon työtä e lmasa lounata Melko hyvä tarkkuus yleskelellä Monlla kelllä yl 80% rppuvuukssta oken... Japan 90%, mutta turkk 64% Saavutettava tarkkuus: kel ja opetusaneston koko

KLIINISEN SUOMEN KIELEN JÄSENTÄMINEN Eräät ertysprteet on huomotava Paljon krjotusvrhetä Paljon pos jätettyjä lauseenjäsenä Joskus pääverb on jätetty pos jäsentmen on lsättävä null -sana Tosaalta Kelopp melko rajotettu ja lauserakenne yleensä helpohko Lauseet paljon lyhyempä kun yleskelessä (KM 7 sanaa, sanomalehttekstssä KM 10 sanaa ja Wkpedassa KM 14)

KLIINISEN SUOMEN KIELEN JÄSENTÄMINEN Lappala ym. Sääntöpohjanen jäsennn Vakeuksa valta okea jäsennys Tuottaa lauseesta non 20 jäsennystä, jotka ovat uskottava syntaktsest mutta evät semanttsest. Tällä hetkellä kesktymme jäsentämsessä tlastollseen koneoppmseen Havernen ym. 1100 annototua lausetta Tlastollseen koneoppmseen perustuva jäsennn Tarkkuus non 70% Opetusaneston peneen kokoon nähden yllättävän hyvä E kutenkaan velä rttävän hyvä sovelluksn Jatkotutkmus

TULOKSIA 3: SUOMEN KIELEN YMMÄRTÄMINEN Tavote Kelellnen ymmärtämnen Kelen rakenne ja termnologat Kelspesfsten resurssen ja menetelmen tuottamnen Lngsoft Proofreader for Health suomen kelen tarkstn klnselle tekstlle Tulosten käyttökelposuus Laatu ja luotettavuus Nopeus ja mplementotavuus Kelspesfset resursst! 40

TIETEELLINEN JA KLIININEN NÄYTTÖ TULO PROFILOINTI KOMPONENTEISTA KOKONAISUUKSIIN OIKOLUKU KIRJOITTAMISEN TUKI HUOMION KIINNITTÄMINEN HOITO A I K A TIIVISTYS TIIVISTELMÄT 41

ITERATIIVINEN PROSESSI Tarpeet Menetelmäkehtys Tarpeet Testaus ALKU: Tarvemäärttely ja vakutusten arvont adossa käyttöympärstössä VERTAILU: Teteellnen ja kaupallnen hupputeknologa LOPPUTULOS: Etua ykslölle, yrtykslle, ylopstolle ja yhteskunnalle

YTY Ykslöllstä Terveyttä yhdessä Ymmärtäen HEXAnord HEalth text Analyss network n the Nordc and Baltc countres 43