Tutkimussetelmien tilstollisist menetelmistä Jnne Pitkäniemi VTM, MS (iometry HY, Knsnterveystieteen litos 1 Kohorttitutkimuksen siruen j ltisteen välinen ssositio Tpusverrokki tutkimus Poikkileikkustutkimus Sekoittvien tekijöien hllint tilstonlyysiss 2 Lääketieteen sovelluksille erinominen iometrin kooste löytyy prof. Srnn kotisivuilt www.kttl.helsinki.fi/srn/os1.pf www.kttl.helsinki.fi/srn/os2.pf 3 1
Tilstollinen päättely sttistil inferene Tilstotieteen keskeisimpiä käyttötpoj. Päättelymeknismi, joll kerätyn otoksen (tutkimusineiston perusteell pyritään tutkittvst sist tekemään johtopäätöksiä ljemp joukko koskevksi. Tilstollisen päättelyn oslueet ovt: rviointi (estimointi j hypoteesien testminen. 4 Prospektiivinen tutkimus Altistuneit j ltistumttomi seurtn kiinnostvn tphtumn suhteen (sirus Rivit (ltisteet ovt tutkij luss kiinnittämiä, mitttuj lähtötilnteess Stunnist on kuk s kiinnostvn tphtumn (sirus 5 Kerätään ineisto prospektiivisess tutkimuksess j lsketn tulukkoon seurvt hvintojen lukumäärät Disese Totl Exposure (kiinni (kiinni totl n 6 2
SUHTEELLINEN VAARA (RR, reltive risk, risk rtio Seurnttutkimussetelmiss käytetty ltisteen j tuin välisen yhteyen mitt; ltistuneien j ltistumttomien sirstumisvrn suhe RR lsketn kvll: RR = (vr ltistuneill / (vr ltistumttomill Jos ei ero sirstumisvrss ryhmien välillä niin RR on 1. Teknisemmin : Suhteellinen riski Lsketn (estimoin isese exp osure RR isese exp osure RR 7 Esimerkki (Herrer et l. Avitmiinin syönti j lpsuusiän kuolleisuus Suniss kuoli eloss Yhteensä Exposure Vitmin A ( Pleo ( Totl 120 112 232 14 223 14 037 28 260 14 343 14 149 28 492 8 Lsketn RR:n estimtti 120/14343 RR 1.057 112/14149 Siis vitmiinin syöjien riski kuoll näyttäisi olevn 1.06kertinen pleo ryhmään verrttun Jott sn käsitys riskisuhteen vihtelust lsketn luottmusväli Eellä lsketulle riskisuhteen rviolle. Yleisesti käytetty 95%:n luottmusväli Voin lske seurvsti log(rr ± 1.96*se(log(RR Jos hlumme testt nollhypoteesi onko RR=1 tämäkin tphtuu helposti nykyisillä tilstoohjelmill 9 3
Esimerkki ineisto Rohjelmll pketti epitools komento : riskrtio((14037,112,14223,120 Outome Preitor Disese1 Disese2 Totl Expose1 14037 112 14149 Expose2 14223 120 14343 Totl 28260 232 28492 Rohjelmn komento Tulukko, trkist lukumäärät risk rtio with 95% C.I. Preitor estimte lower upper Expose1 1.000000 NA NA Expose2 1.056937 0.817843 1.365929 p.vlue twosie Preitor mip.ext fisher.ext hi.squre Expose1 NA NA NA Expose2 0.6729583 0.6927476 0.6721116 ESTIMOINTI RR j 95% luottmusväli 1.05 (0.82, 1.37 TESTAUS Nollhypoteesi: RR=1 prvo (vlitse fisher P=0.69 eli > merkitsevyystso 5% Eli nollhypoteesi ei10 hylätä Prospektiiviselle j poikkileikkustutkimuselle voin lske myös veonlyöntisuhe lskemlle kiinnostvlle tphtumn tphtumismhollisuus erikseen ltistuneille j ltistumttomille erikseen ltistuneille j ltistumttomille OR / / 11 Tpusverrokki tutkimus Etenkin tpusverrokkisetelmiss trkstelln sirstumisvr kuvvien toennäköisyyksien P semest suhett P1P. Tätä suhett nimitetään tphtumismhollisuueksi ( os. Mhollisuus os on suheluku, jok kuvst kuink monikertinen jonkin tphtumn toteutumismhollisuus on verrttun siihen, ettei tphtum tule. Esimerkiksi os=6 (6:1 voisi trkoitt, että 6 henkilöä sirstuu j yksi ei. 12 4
Kerätään ineisto tpusverrokki tutkimuksess j lsketn tulukkoon seurvt hvintojen lukumäärät Disese Totl Exposure totl (kiinni (kiinni n 13 RISTITULOSUHDE (OR, os rtio Khen kksirvoisen muuttujn välinen riippuvuuen mitt. OR=1 merkitsee, ettei ole riippuvuutt. Mitt käytetään etenkin tpus verrokki tutkimussetelmss tuin j ltisteen välistä yhteyttä rvioitess. Mhollisuus exposure isese OR exposure isese Veonlyöntisuhe Lsketn (estimoin mhollisuus ltisteseen sirill OR mhollisuus ltisteeseen terveillä OR 14 Esimerkki (Kelsey n Hry 1975 Altisteen moottorijoneuvoll jo j tphtumn ute hernite lumr Interverterl is. tpus Verrokki Yhteensä Altiste:Moot torijoneuvo ( 8 1 9 ( 47 26 73 Totl 55 27 82 15 5
Huom 1, 1 joten OR RR OR rvioi suhteellist riskiä tpusverrokki tutkimuksess 16 Esimerkki ineisto Rohjelmll pketti epitools komento osrtio.wl((26,1,47,8 Outome Preitor Disese1 Disese2 Totl Expose1 26 1 27 Expose2 47 8 55 Totl 73 9 82 $mesure os rtio with 95% C.I. Preitor estimte lower upper Expose1 1.000000 NA NA Expose2 4.425532 0.5241667 37.36470 $p.vlue twosie Preitor mip.ext fisher.ext hi.squre Expose1 NA NA NA Expose2 0.1555734 0.2592624 0.1399434 Rohjelmn komento Tulukko, trkist lukumäärät ESTIMOINTI OR j 95% luottmusväli 4.43 (0.52, 37.36 TESTAUS Nollhypoteesi: OR=1 prvo (vlitse fisher P=0.26 eli > merkitsevyystso 5% Eli nollhypoteesi ei 17 hylätä Poikkileikkustutkimus ( rosssetionl stuies Perustuvt tutkimussetelmn, joss ei ole iksuuntust, kikki mittukset suoritetn tutkimushetkellä. Asetelm käytetään pääsiss silloin, kun hlutn tutki eri sioien j ominisuuksien yleisyyttä j niien välisiä riippuvuussuhteit. Käyttö: 1. Yleiskrtoitukset 2. Vllitsevuuet ( prevlene 3. Riippuvuuet tutien ti riskitekijöien välillä 4. Seurnttutkimusten osn Kosk poikkileikkustutkimukset eivät sisällä iktekijää, ei toettujen riippuvuuksien perusteell voi päätellä mitään syyseurussuhteest. 18 6
Esimerkki lääkäreien urnout j hrjoitetun vstnoton suhe HMO Järjestestelmään (USA:n sirusvkuutusjärjestelmä Burnout No urnout Yhteensä HMO 12 43 55 Ei HMO 25 320 345 Totl 37 363 400 (kiinni 19 Lsketn Rohjelmn funktioill osrtio.wl((320,25,43,12 Outome Preitor Disese1 Disese2 Totl Expose1 320 25 345 Expose2 43 12 55 Totl 363 37 400 riskrtio.wl((320,25,43,12 $t Outome Preitor Disese1 Disese2 Totl Expose1 320 25 345 Expose2 43 12 55 Totl 363 37 400 $mesure os rtio with 95% C.I. Preitor estimte lower upper Expose1 1.000000 NA NA Expose2 3.572093 1.673278 7.62566 $mesure risk rtio with 95% C.I. Preitor estimte lower upper Expose1 1.000000 NA NA Expose2 3.010909 1.608825 5.634904 $p.vlue $p.vlue twosie twosie Preitor mip.ext fisher.ext hi.squre Preitor mip.ext fisher.ext hi.squre Expose1 NA NA NA Expose1 NA NA NA Expose2 0.002178633 0.001746602 0.0005321721 Expose2 0.002178633 0.001746602 0.0005321721 20 SEKOITTAVIEN TEKIJÖIDEN HALLINTA TILASTOANALYYSISSA 21 7
Sekoittv tekijä Assosioitunut kiinnostvn tphtumn Esim. iäkkäämpien tn. kuoll suurempi Assosioitunut ltistemuuttujn Esim. iäkkäämmillä korkempi kolesteroli Ei seur ltistemuuttujst eikä kiinnostvst tphtumst suorn 22 Sekoittv tekijä, onfouning ftor Tekijä, jok häiritsee tutkittvn suureen (x j lopputulos ti vikutusmuuttujn (y välisen yhteyen tutkimist. Jott jokin suure olisi sekoittv tekijä (z, niin z:n täytyy itsenäisesti ssosioitu sekä x:ään että y:hyn. x y z 23 Yleistetty linerinen mlliperhe Y = selitettävä muuttuj X = selittävät muuttujt (kiinnostvt riskitekijät, sekoittvt tekijät Mllin vlint Vsteen mittsteikko Mlli Jtkuv, normlinen Linerinen mlli Lukumäärä Tphtumik Poisson regressio Coxin mlli Kksiluokkinen (Kyllä, Ei Logistinen regressio 24 8
Miksi mllinnus: 1 Sekoittvien tekijöien hllint 2 Kiinnostvien tekijöien yhysvikutukset 3 Ennustminen 25 Riippuv muuttuj y (1 = kyllä, 0 = ei; y:stä käytetään yleisesti myös nimityksiä selitettävä muuttuj j etenkin lääketieteellisissä sovelluksiss vstemuuttuj. Riippumttomt muuttujt x=(x 1,, x p. Yleisesti käytettyjä nimityksiä ovt myös selittävät muuttujt, ennustvt muuttujt j kovritit. x ij :t voivt oll jtkuvi, luokiteltuj ti järjestyssteikollisi. 26 Logistinen regressio Y 1 ln( B0 B1* X1 B2* X 2... 1 Y 1 Jos mlliss vin B0 j rtkistn B0 niin sn exp( B0 Y 1 1 exp( B0 B1 voi oll kiinnostv riskitekijä B2 voi oll sekoittv tekijä jne. 27 9
Esimerkki DECODE prospektiivinen kohorttitutkimus (N=10,269 jok käsittelee sepelvltimotuti (F_CVD j lisäksi on mitttu klssisi riskitekijöitä kuten esim. verenpinetuti (HYP ti ikä mukn tulohetkellä (AGE_ENTR Riippuv muuttuj: F_CVD Selittävä muuttuj: HYP Sekoittv tekijä: AGE_ENTR 28 Lsketn ensin Sepelvltimotuin riski tulukoimll F_CVD (0=Ei, 1=Kyllä Kyllä Ei Yhteensä 299 9908 10207 Siis Riski ( sirstumistoennäköisyys on 0.0293 Eli n. 3% tässä ineistoss Lsketn sm käyttäen Logistist mlli glm(dtset$f_cvd~1,fmily=inomil Cll: glm(formul = Dtset$F_CVD ~ 1, fmily = inomil Coeffiients: (Interept => TÄSTÄ voin siis lske 3.501 exp(3.5011exp(3.501= 0.02928379 eli n. 3% 29 Riskisuhteen rviointi osrtio.wl(t $t 0 1 Totl 0 2502 455 2957 1 41 21 62 Totl 2543 476 3019 $mesure os rtio with 95% C.I. estimte lower upper 0 1.000000 NA NA 1 2.816510 1.648968 4.810726 glm(dtset$f_cvd~1dtset$hyp, fmily=inomil Cll: glm(formul = Dtset$F_CVD ~ 1 Dtset$HYP, fmily = inomil Coeffiients: (Interept Dtset$HYP 4.111 1.035 OR = exp(1.035= 2.815106 $p.vlue twosie mip.ext fisher.ext hi.squre 0 NA NA NA 1 0.0003955901 0.0003191405 7.735471e05 30 10
Sovitettu riskisuhteen estimointi glm(f_cvd~1age_entrhyp,fmily=inomil,dtset Cll: glm(formul = F_CVD ~ 1 AGE_ENTR HYP, fmily = inomil, t = Dtset Coeffiients: (Interept AGE_ENTR HYP 8.54283 0.08246 0.53488 Eli ikäsovitettu ORRR=exp(0.53488=1.71 31 summry(glm(f_cvd~1age_entrhyp,fmily=inomil,dtset Cll: glm(formul = F_CVD ~ 1 AGE_ENTR HYP, fmily = inomil, t = Dtset Devine Resiuls: Min 1Q Mein 3Q Mx 0.5265 0.2374 0.1612 0.1150 3.3889 Coeffiients: Estimte St. Error z vlue Pr(> z (Interept 8.54283 0.89535 9.541 < 2e16 *** AGE_ENTR 0.08246 0.01531 5.387 7.15e08 *** HYP 0.53488 0.28206 1.896 0.0579. Signif. oes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 32 DIAGNOSTISET TESTIT 33 11
Sensitiivisyys j spesifisyys Tuti (D Testi (T n 34 Esimerkki (Altmn: Oletetn että tutkij ignosoi mkssyöpää (testi j toislt ptologi ott näytteen jonk perusteell päätetään onko mkssyöpä vi ei (tuti. sn seurv tulukko: ptologin löyös (tuti (epänorm li (normli Mkssyöpä ignoosi mksn sknnuk seen perustuen (tässä siis testi yhteensä 231 27 258 32 54 86 263 81 344 35 Sensitiivisyys. Toennäköisyys että yksilön testin tulos on positiivinen eholl että on tuti sn kun luetn siis ensimmäiseltä srkkeelt j sitten hiemn muoollisemmin T D Esimerkki: 231/258= 0.90 j voimme toet että oottisimme 90% potilist joill on epänormli mks (ptologi, tuti niin myös ignosoin mkssyöväksi (testi. Spesifisyys. Toennäköisyys että testitulos on negtiivinen eholl että yksilöllä EI ole tuti sn kun luetn tulukon toiselt srkkeelt j sitten hiemn muoollisemmin T D 54/86=0.63 j voimme toet että 63 % niistä joill on normli mks (tuti niin ei toet tuti myöskään lääkärin ignoosiss (testi 36 12
Hlumme tietää miten testi toimii jos sovellmme testiä johonkin toiseen popultioon joll on erilinen prevlenssi. PPV T D D D T T D D T D D Tätä vrten trvitsemme tuin esiintyvyyen (prevlenssi, D=. Se on 258/344=0.75 eli 75%. T D D D T T D D T D D 0.90 * 0.75 0.88 eli 88% 0.90 * 0.75 (1 0.63 * (1 0.75 37 13