SEURANTATUTKMUKSET JA NDEN TULOSTEN ANALYYS Simo Näyhä Jari Jokelainen Kansanterveystieteen ja yleislääketieteen laitoksen jatkokoulutusmeeting 20.3.2007 SARASTAVUUDEN MTTAAMNEN Eri tapoja mitata sairastavuutta Väestössä sairaus on pitkittäinen prosessi, jossa voidaan mitata uusien tapausten ilmaantumisnopeutta -> ilmaantuvuus (sairastuvuus, insidenssi ) tietyllä hetkellä olemassaolevien tapausten määrää -> vallitsevuus (sairastavuus, prevalenssi P) 1
SARASTAVUUDEN MTTAAMNEN Mittaluvut (i) Kumulatiivinen ilmaantuvuusosuus (Cumulative incidence, C ) = Sairastuneiden osuus tiettynä seuranta-aikana Kuvaa yksilön sairastumisriskiä π Seurataan N tervettä henkilöä. D henkilöä sairastui, H henkilöä ei. Silloin C = D / N = π Sairas + - D H Tot. N SARASTAVUUDEN MTTAAMNEN Kumulatiivinen insidenssi: esimerkki Kohorttitutkimuksessa, joka alkoi v. 1950, seurattiin tehtaan 1352 työntekijää. Vuoteen 1980 mennessä kohortissa ilmaantui 78 keuhkosyöpätapausta. Sairas + - 78 1274 Tot. 1352 C = 78 / 1352 = 0.058 eli 5.8 % 2
SARASTAVUUDEN MTTAAMNEN Kumulatiivinen insidenssi: ongelmia (1) Joudutaan olettamaan, että seuranta-aika on kaikilla sama. Ei päde, jos - henkilöitä katoaa seurannassa - kuollaan väärään sairauteen (2) Sairastumisaikaa ei huomioida (=> informaatiokatoa) (3) Jos sairaus hyvin yleinen, C = 1 kaikilla - hengitystieinfektiot SARASTAVUUDEN MTTAAMNEN Mittaluvut (ii) lmaantuvuustiheys (ncidence density D, rate ) = hetkellinen sairastumistodennäköisyys Ol. h lyhyt aikaviipale π yksilön riski aikana h Silloin insidenssitiheys (λ) λ = π / h, h pieni Ei riipu seuranta-ajasta (koska pieni aikaviipale) 3
SARASTAVUUDEN MTTAAMNEN Henkilöajan arviointi: 2 tapaa (A) Yksilökohtaiset seuranta-ajat lasketaan yhteen Yksilön hetkellinen λ ei käytännössä ole arvioitavissa. Ryhmän insidenssitiheys D voidaan arvioida jakamalla ilmaantuneiden tapausten määrä henkilöajalla: D = D / hv (hv: henkilövuodet) Seur. esimerkki: D = 1 / 286 hv = 0.0035 eli 3.5 / 1000 henkilövuotta SARASTAVUUDEN MTTAAMNEN Yksilökohtainen henkilöaika (henkilövuodet, hv) töissä siirt. muualle siirt. eläkkeelle S A K sydänkoht aivohalvaus keuhkosyöpä elossa seur. päättyessä A B C D E F G H J Tutkimus alkoi K 1950 1955 1960 1965 1970 1975 1980 1985 1989 S Seuranta päättyi A Henk. aika (v) 40 40 40 25 30 15 18 29 34 15 286 Keuhkosyövän insidenssitiheys = 1 / 286 = 0.0035 eli 3.5 / 1000 hv 4
SARASTAVUUDEN MTTAAMNEN Henkilöajan arviointi: 2 tapaa (B) Keskimääräinen väkiluku (keskiväkiluku) Henkilövuosien arviona voi käyttää seuranta-ajan keskimääräistä väkilukua. Tavallisesti käytetään: - alku- ja loppuajankohdan väkilukujen keskiarvoa, tai - seuranta-ajan puolivälin väkilukua Esim. Metallivalimossa todettiin 8 vuoden aikana 53 silikoositapausta. Työntekijöitä oli jakson alussa 520, lopussa 680. nsidenssitiheys = 53 / (0.5 * (520+680) * 8 v) 0.011 / hv, tai 11 / 1000 hv SARASTAVUUDEN MTTAAMNEN Mittaluvut (iii) Odds (vedonlyöntisuhde) Ω Sairaiden lukumäärä / ei-sairaiden lukumäärä Kuvaa yksilön todennäköisyyttä sairastua verrattuna todennäköisyyteen että hän ei sairastu. Ω = D / H Vrt. π = D / N Sairas + - D H Tot. N 5
SARASTAVUUDEN MTTAAMNEN Odds, esimerkki Kohorttitutkimuksessa, joka alkoi v. 1950, seurattiin tehtaan 1352 työntekijää. Vuoteen 1980 mennessä kohortissa ilmaantui 78 keuhkosyöpätapausta. Ω = 78 / 1274 = 0.061 vrt. π = 78 / 1352 = 0.058 Sairas + - 78 1274 Tot. 1352 SARASTAVUUDEN MTTAAMNEN Riski π ja odds Ω Kun kumul. insidenssi (C (π) ) tunnetaan, voidaan aina laskea odds (Ω): Ω = π / (1 π) Ts. todennäköisyys sille että sairastuu / tod. näk. sille että ei sairastu Laske Ω, kun (a) π = 0.05 (b) π = 0.5 (c) π = 0.99 Ω = 0.053 1 99 -> 6
SARASTAVUUDEN MTTAAMNEN Riski π ja odds Ω Kohorttitutkimuksessa tapahtuu seuranta, jolloin saadaan insidentit tapaukset, ja -> saadaan myös insidenssiluvut C, D (perustuvat riskiin) Tapaus-verrokki- ja poikkileikkaustutkimuksessa ole seurantaa, jolloin ei saada insidenssiä mutta -> voidaan kuitenkin käyttää oddseja SARASTAVUUDEN MTTAAMNEN Miksi oddsia käytetään Kts. ed. laskuesimerkki Riskin π pysyttävä välillä {0,1} Monimuuttujamalleissa π voi mennä ko. välin ulkopuolelle Odds Ω saa arvoja välillä {0, } ja Log odds saa arvoja välillä {-, + } Odds / log odds matemaattisesti hyvin käyttäytyviä 7
SARASTAVUUDEN MTTAAMNEN Mittaluvut (iv) Prevalenssi (vallitsevuus) Sairaiden osuus väestöstä tietyllä hetkellä D t N t sairaiden lkm hetkellä t väestön koko hetkellä t Pisteprevalenssi P t = D t / N t Esim 1 Suomessa oli syöpärekisterin tietojen mukaan 31.12.1970 2344 keuhkosyöpää sairastavaa miestä. Miesväestön koko 31.12.1970 oli 2 219 985. P = 2344 / 2 219 985 = 1.06 / 1000 SARASTAVUUDEN MTTAAMNEN Mittaluvut (iv) Prevalenssi voidaan myös määritellä: Sairaiden osuus väestöstä tiettynä aikavälinä D t1 C t1,t2 N t1,t2 sairaiden lkm hetkellä t1 uusien sairaiden lkm aikana t1 -> t2 väestön koko aikana t1 -> t2 Periodiprevalenssi P t1,t2 = (D t1 + C t1,t2 ) / N t1,t2 Verbaalisesti: tiettynä aikavälinä olemassaolleet tapaukset 8
TUTKMUSTYYPT Kolme lähestymistapaa (i) (ii) (iii) Tehtyjä havaintoja verrataan siihen, minkä tiedetään olevan normaalia Saatetaan epäilty syy ja seuraus sellaiseen tilanteeseen, että minkään muun tekijän vaikutus ei ole mahdollinen Tehdään havaintoja olosuhteissa, joissa kokeen kaltainen tilanne (ii) on syntynyt itsestään Tapaustutkimus (Case study) Koe Epidemiologinen tutkimus TUTKMUSTYYPT Merkintöjä E D altistus (Expositio), syy peräisin työlääketieteestä sairaus (Disease, Death) syy-seuraussuhde (kausaalisuhde) riippuvuus 9
KOE Kausaalisen tutkimuksen prototyyppi: voidaan järjestää olosuhteet niin että vain yhden tekijän vaikutus näkyy (1) Kokeen muoto Contra facta koeryhmä kontrolli a c b d a+b c+d (2) Kokeen tulos T = a / (a+b) c / (c+d) Tulosmahdollisuudet T = 1, T 1 Counterfactual theory of causality David Hume 1748 *) (i) (ii) We may define a cause to be an object followed by another; and where all the objects, similar to the first, are followed by objects similar to the second. n other words, where, if the first object had not been, the second never had existed. (i) peräkkäisyys (ii) jos epäiltyä syytä ei olisi (contra facta), ei olisi seuraustakaan => KONTRAFAKTUAALTEORA *) Hume D. An nquiry Concerning Human Understanding, 1748 Lewis D. Causality. J Philos 1973; 70: 556-67 10
Kokeellisen tutkimuksen puutteet 1 - Tapahtuvat in vitro, ei in vivo 2 - Edustavuus voi olla kyseenalainen 3 - Vaarallisia altisteita ei voi kokeilla 4 - Hoitokokeet voivat keskeytyä ja tieto jää saamatta 5 - Jotkut kokeet loogisesti mahdottomia: esim. sukupuoli, veriryhmä 6 - Pitkä latenssiaika: seurannan pitäisi olla 10-20 vuotta pitkä MKS EPDEMOLOGNEN TUTKMUS? Tapahtuu in vivo Edustavuus yleensä hyvä Ei eettisiä ongelmia: ihmiset ovat jo altistusryhmissään Pitkä latenssiaika ei haittaa: pitkät seurannat mahdollisia Yleinen uskottavuus hyvä 11
KOHORTTTUTKMUS dea Tutkimusryhmät Kulku Kohortti = Haetaan tilanteita, joissa koetta muistuttava kontrafaktuaaliasetelma on syntynyt itsestään tai olemassa luonnostaan jossain väestöryhmässä Altistuneet / ei-altistuneet, tai eriasteisesti altistuneet ryhmät Seurataan eri tavalla altistuneiden sairastavuutta useita vuosia Suljettu joukko KOHORTTTUTKMUS Hypoteesi: E D tutkimuspohja = seurattavan väestön sairastavuus E _ E vaikutus tutkimus D _ D alku seuranta loppu 12
KOHORTTTUTKMUS Muita nimityksiä NMTYS MHN PERUSTUU 1 Altistuslähtöinen Alkaa altistusryhmien määrittelystä 2 Pitkittäistutkimus Tiedot hankitaan useana ajankohtana 3 Prospektiivinen Tiedot hankitaan kalenteriajassa etenevästi 4 nsidenssitutkimus Saadaan insidenssiluvut KOHORTTTUTKMUS Aikasuuntaukset E _ E vaikutus prosp. seuranta retrosp. seuranta D _ D Prospektio Retrospektio t 0 t -n t + n t 0 13
KOHORTTTUTKMUS Seuranta Prospektiivinen: etenee kalenteriajassa Nykyishavaintoinen - alkaa nykyhetkellä kohorttien määrittelyllä - päättyy tulevaisuudessa - paras suunnitellun kannalta - tuottaa tuloksia hitaasti KOHORTTTUTKMUS Seuranta Retrospektiivinen: takenee kalenteriajassa Menneishavaintoinen - tiedot hankitaan menneisyydestä - myös kohortit määritellään menneisyydessä, # vuosikymmeniä toimineet tehtaat # neuvolakortistot, sota-arkisto - päättyy esim. nykyhetkellä - kaikkia tietoja ei saatavana - tuottaa tuloksia nopeammin - loogisesti yhtä pätevä kuin prospektiivinen 14
KOHORTT Terveen työntekijän efekti Healthy worker effect (HWE) Syntyy, jos ammattikohorttia (työssäolevia) verrataan kokonaisväestöön - työssäolevan väestön sairastuvuus ja kuolleisuus 10-20 % pienempi kuin yleisen väestön - esimerkki valikoitumisharhasta - jos kohortin sairastuvuus sama kuin kokonaisväestön, voi osoittaa että sairastavuus suurentunut KOHORTT: HWE Gulfin öljynjalostamon työntekijät Wen et al. Long-term mortality study of oil refinery workers. Am J ndust Med 1986;9:171 Sota-aika: Ei HWE:tä Sairastuvuus 1 0,8 HWE normaalitaso 0,6 1930 1933 1936 1938 1941 1944 1947 1950 15
KOHORTTTUTKMUS Hyvät puolet 1 Sairastuvuusluvut saadaan suoraan 2 Altistustiedot ennen sairastumista 3 Voidaan seurata muuttuvaa altistusta 4 Voidaan tutkia useita sairauksia 5 Yleensä suuret valikoimattomat kohortit : hyvä uskottavuus, realistisuus KOHORTTTUTKMUS Huonot puolet 1 Kalleus (myös retrospektiinen seuranta) 2 Harvinaiset sairaudet: tehoton - esim. syöpä väestössä melko harvinainen - harvinaisia syöpiä ei voi tutkia 3 Osallistuminen voi vähentää altistumisia 4 Valikoituminen, esim. HWE 16
VAKUTUKSEN ARVONT Vaikutuksen voimakkuutta arvioidaan vertaamalla vertaamalla altistuneiden ja altistumattomien sairastuvuutta. kohorttitutkimuksessa voidaan verrata suoraan sairastuvuuslukuja tapaus-verrokkitutkimuksessa sairastuvuusluvut eivät ole käytettävissa, ja vaikutuksen voimakkuus arvioidaan kiertotietä VAKUTUKSEN ARVONT Kohorttitutkimus (1) Riskisuhde (Risk ratio, Rate ratio, RR ) = altistuneiden sairastuvuus / altistumattomien sairastuvuus RR = 1 / 0 1 altistuneiden insidenssi 0 altistuneiden insidenssi Riskisuhde kuvaa vaikutuksen voimakkuutta RR > 1 RR = 1 RR < 1 altiste lisää sairastuvuutta ei vaikutusta altiste vähentää sairastuvuutta 17
Kohorttitutkimus: Risk ratio RR Esim. Rikkihiili ja sepelvaltimotauti (Hernberg 1998). 686 miestä seurattiin 8 vuotta, minkä jälkeen todettiin tapaukset. D seuranta-aikana kuolleet N henkilöiden lukumäärät C kumulatiivinen insidenssi (riski π ) RR riskisuhde Rikkihiili Ei-altistuneet Altistuneet Kaikki D 9 20 29 N 343 343 686 C 0.026 0.058 0.042 RR 1.00 2.23 Kohorttitutkimus Risk ratio ja odds ratio Kohorttitutkimuksessa voidaan laskea myös Odds ja Odds ratio : Rikkihiilitutkimus Rikkihiili D H N Odds C OR RR Ei-altistuneet Altistuneet 9 20 334 323 343 343 0.027 0.062 0.026 0.058 1.00 2.30 1.00 2.23 Kaikki 29 657 686 0.044 0.042 18
RKKHL JA SEPELVALTMOTAUT Riskisuhteen (RR) ja OR:n laskeminen R-ohjelmalla Ladataan R ohjelman kotisivulta: http://www.r-project.org/ Valikosta nstall packages(s) asennetaan esimerkissä tarvittavat pakkaukset epitools, epicalc ja Epi. Tämän jälkeen ne otetaan käyttöön library( ) komennolla, esim. library(epitools). # muodostetaan edellisen dian datasta taulukko rikkihiili <- matrix( c(20,9,323, 334),2,2) rownames(rikkihiili) <- c("altistuneet","ei-altistuneet") colnames(rikkihiili) <- c("kuolleet","elossa") rikkihiili # otetaan epitools-pakkaus käyttöön: library(epitools) # Toinen tapa: library(epi) twoby2(rikkihiili) # Huom. antaa myös RR:n ja OR:n luottamusvälit sekä riskierotuksen # Kolmas tapa: riskratio - komento riskratio(rikkihiili[2:1,2:1]) # tässä matriisin alkiot luetaan eri järjrestyksessä, vrt. riskratio(rikkihiili[1:2,1:2]) tai riskratio(rikkihiili) # Kts. tarkemmin komennon lisämäärittelyistä: help(riskratio) 19
# Data voidaan myös kirjoittaa suoraan konsolille: Odds ratio from prospective/x-sectional study library(epicalc) csi(20, 323, 9, 334) 1/16 # Komento tulostaa myös riskierotuksen sekä altistuksen syyosuuden (attributable fraction) erikseen altistuneilla ja koko aineistossa. Odds of outcome 1/32 OR = 2.3 95% C = 0.98, 5.81 cci(20, 323, 9, 334) 1/64 # cci antaa OR:n ja piirtää kuvioon sekä oddsit ja OR:n non-exposed Exposure category exposed VAKUTUKSEN ARVONT Kohorttitutkimus: Rate ratio RR Esim. Whitehall study. Kuolleisuus ja tupakointi. D seuranta-aikana kuolleet PY henkilöaika (person-years) D insidenssitiheys / 1000 hv (rate) λ RR riskisuhde Tupakointi D PY D/1000 RR Ei 359 32145.4 11.2 1.00 Kyllä 484 22713.3 21.3 1.90 Kaikki 843 54858.7 15.4 20
RSKSUHTEEN LASKEMNEN: WHTEHALL-TUTKMUS library(epitools) whitehall <- matrix( c(359, 484, 32145.4, 22713.3), 2, 2) dimnames(whitehall) <- list(exposure=c("ei", "Kyllä"), Outcome=c("Kuolleet", "Pyears")) # Epitab-komennolla: epitab(whitehall, method="rateratio") # Vaihtoehtoinen tapa: rateratio(whitehall) 21