Marginaalirakennemallit epidemiologisessa tutkimuksessa. SSL seminaari / Tommi Pesonen

Samankaltaiset tiedostot
pitkittäisaineistoissa

pitkittäisaineistoissa

805306A Johdatus monimuuttujamenetelmiin, 5 op

Puuttuvan tiedon ongelmat pitkittäistutkimuksissa

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Harjoitukset 5 : Differences-in-Differences - mallit (Palautus )

Matemaatikot ja tilastotieteilijät

Harjoitus 7 : Aikasarja-analyysi (Palautus )

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollinen aineisto Luottamusväli

805306A Johdatus monimuuttujamenetelmiin, 5 op

Hirsitaloasukkaiden terveys ja

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Harjoitukset 4 : Paneelidata (Palautus )

TTY Mittausten koekenttä. Käyttö. Sijainti

Viherseinien efekti Tilastoanalyysi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tausta tutkimukselle

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

rakko ja virtsatiet (C65 68, D09.0 1, D30.1 9, D41.1)

Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA

Yleislääketieteen erikoislääkäri, päihdelääkäri Esti Laaksonen. Turun yliopisto Turun A-klinikka

Kysely syöpäpotilaiden hoidosta Tulokset FIN-P-CARF /18

Accu-Chek Compact- ja Accu-Chek Compact Plus -järjestelmien luotettavuus ja tarkkuus. Johdanto. Menetelmä

Harjoitus 2: Matlab - Statistical Toolbox

Suomen Syöpärekisteri Syöpätautien tilastollinen ja epidemiologinen tutkimuslaitos. Syöpäpotilaiden eloonjäämisluvut alueittain

Aineiston keruun suunnittelu ja toteutus. Tero Vahlberg

Sovellettu todennäköisyyslaskenta B

Text Mining. Käyttöopas

Kuinka haastavaa uusien työntekijöiden rekrytointi on ollut teidän organisaationne kohdalla viimeisen kahden vuoden aikana? /

Johdanto. I. TARKKUUS Menetelmä

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa

Tutkimusasetelmat. - Oikea asetelma oikeaan paikkaan - Vaikeakin tutkimusongelma voi olla ratkaistavissa oikealla tutkimusasetelmalla

dx=5&uilang=fi&lang=fi&lvv=2014

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen jatkokurssi syksy 2003 Välikoe

Harjoitus 7: NCSS - Tilastollinen analyysi

TAPAUS-VERROKKITUTKIMUS

Menetelmät tietosuojan toteutumisen tukena - käytännön esimerkkejä. Tilastoaineistot tutkijan työvälineenä - mahdollisuudet ja rajat 2.3.

Dynaamiset regressiomallit

5$32577, 1 (8) Kokeen aikana vaihteisto sijaitsi tasalämpöisessä hallissa.

Taajuusmittauskilpailu Hertsien herruus Mittausraportti

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Yksityisen sektorin työntekijöiden työurapolut ja toimipaikkojen liikevaihdon kehitys

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Suomenhevosten askelja hyppyominaisuuksien periytyvyys. Suomenhevosten jalostuspäivät Aino Aminoff

Sovellettu todennäköisyyslaskenta B

SISÄILMAAN LIITETTY OIREILU JA LÄÄKÄRISSÄKÄYNNIT SUOMESSA

Osafaktorikokeet. Heliövaara 1

Estimointi. Vilkkumaa / Kuusinen 1

Valinnanvapaus ja alueellinen saatavuus Kelan kuntoutuksessa. Visa Pitkänen Tutkija Kelan

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Kvantitatiiviset menetelmät

Kojemeteorologia (53695) Laskuharjoitus 1

Potilashoidon vuosikertomus HYKS Sisätaudit ja kuntoutus

Kauniaisissa parhaat kuntapalvelut

Tutkimus terveydestä, työkyvystä ja lääkehoidosta. Tutkimuksen keskeisimmät löydökset Lehdistömateriaalit

Otantajakauman käyttö päättelyssä

Suomen Luonnonsuojeluliitto. Ympäristön tila tulevaisuudessa Telebus-kysymykset. Suomen Luonnonsuojeluliitto

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Liite artikkeliin Intohimo tasa-arvoon

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

Kandidaatintutkielman aineistonhankinta ja analyysi

Hyvä skitsofrenian hoitovaste avohoidossa. Prof. Hannu Koponen Kuopion yliopisto, psykiatrian klinikka Helsinki

Noona osana potilaan syövän hoitoa

Ajalliset muunnokset eksploratiivisen paikkatietoanalyysin työkaluna. Salla Multimäki

Mittaustulosten tilastollinen käsittely

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Helsinkiläisten toimeentulotuen asiakkaiden terveyspalvelujen käyttö v. 2014

18-79 vuotiaat Painottamaton n= Painotettu (.000) N=

Kuinka mittaan lehdistötiedotteen vaikuttavuuden?

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Osa 2: Otokset, otosjakaumat ja estimointi

Määrällisen aineiston esittämistapoja. Aki Taanila

ROVANIEMEN KAATOPAIKAN GEOFYSIKAALISTEN JA GEOKEMIALLISTEN HAVAINTOJEN YHTEISISTA PIIRTEISTA

RAISION TERVEYSKESKUKSEN ASIAKASTYYTYVÄISYYSKYSELYN TULOKSET

Kvantitatiiviset menetelmät

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

KIVUNLIEVITYS: AC+H-HOITO OLI PAREMPI KUIN AC-HOITO

Ilmastonmuutoksen vaikutus Suomen sisävesiin

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Optimaalisen tarkastusvälin määrittäminen suun terveydenhuollossa

Matkapuhelinten terveysvaikutukset: Mitä epidemiologiset tutkimukset kertovat? Prof. Anssi Auvinen Tampereen yliopisto Säteilyturvakeskus

Lähijohtajuus ja työntekijän työuupumusja depressio-oireet selittävätkö johtajuuden piirteet myöhempää oireilua?

Johdatus tilastotieteeseen

SSL syysseminaari Juha Hyssälä

tilastotieteen kertaus

5.7 Uskottavuusfunktioon perustuvia testejä II

11. laskuharjoituskierros, vko 15, ratkaisut

ATH-koulutus THL ATH-koulutus / Tommi Härkänen 1

Transkriptio:

Marginaalirakennemallit epidemiologisessa tutkimuksessa SSL seminaari 30.10.2014 / Tommi Pesonen

Sisältö Johdanto Havainnoivat tutkimukset ja aikariippuvainen sekoittuminen Marginaalirakennemallit (Marginal structural models) Marginaalirakennemallit Mitä pitäisi tapahtua (SOHO tutkimus) Mitä tapahtui (Virusaineiston analyysi) Miksi näin 7.11.2014 Page 2

Havainnoivat tutkimukset ja aikariippuvainen sekoittuminen Aikariippuvaista sekoittuminen on mahdollista, jos analysoitava aineisto sisältää aikariippuvaisia kovariaatteja, jotka ovat yhteydessä sekä käsittelyyn että vasteeseen. Esimerkiksi potilaan yleiskunto voi vaikuttaa potilaan elinaikaan ja annettuun hoitoon. potilaat joiden yleiskunto heikkenee saattavat saada selkeästi enemmän jotain tiettyä lääkitystä. Tällaisessa tilanteessa hyväkin lääkitys saattaa vaikuttaa antavan huonoja tuloksia 7.11.2014 Page 3

Marginaalirakennemallit Marginal Structural Models Marginaalirakennemallit poistavat aikariippuvaisten sekoittavien tekijöiden aiheuttamaa harhaa painottamalla havaintoja aineistosta muodostettavilla IPT-painoilla (Inverse probability of treatment) Marginaalirakennemallien käyttö on lisääntynyt tasaisesti vuodesta 1997 lähtien, jolloin James M. Robins esitteli ne ensimmäisen kerran (Robins 1998). 7.11.2014 Page 4

Marginaalirakennemallit Menetelmillä, jotka eivät huomioi aikariippuvaista sekoittumista, saadut estimaatit voivat olla voimakkaasti harhaisia Marginaalirakennemallissa hyödynnetään IPT-painoja pyritään muodostamaan aineistosta pseudopopulaatio, Satunnaistetun koejärjestelyn tapaan tasapainossa sekoittavien tekijöiden suhteen. soveltamalla tyypillistä tilanteeseen sopivaa analyysimenetelmää havaitun aineiston sijasta siitä luotuun pseudopopulaatioon, poistetaan estimaateista harhaa Korjaa estimaatteja, mutta kasvattaa luottamusvälejä 7.11.2014 Page 5

Pseudopopulaation muodostamisessa otetaan huomioon yksilöiden potentiaaliset tapahtumat Esimerkkinä kaksivaiheinen aineisto, jota on kerätty alkupisteessä t 0 ja ajanhetkillä t 1 sekä t 2 Vaste Y havaitaan seurannan lopussa. Pseudopopulaatio 7.11.2014 Page 6

IPT-painot Marginaalirakennemalleissa IPT-painoilla painotetaan havaintoja niiden käsittelyhistorian todennäköisyyden käänteisluvulla. 1 IPT-paino: w u = P(A t L t ) Vakautettu IPT-paino: w s = P(A t) P(A t L t ) Vakautetut IPT-painot ovat huomattavasti vähemmän vaihtelevia, mutta säilyttävät silti tarvittavat vakauttamattomien IPT-painojen ominaisuudet. 7.11.2014 Page 7

MRM estimointi MRM estimointi neljässä vaiheessa (I) (II) (III) Sovita malli käsittelyille Käytä mallia estimoimaan käsittelyiden todennäköisyydet Painota havaintoja IPT-painoilla (IV) Sovita malli vasteelle painotetuilla havainnoilla 7.11.2014 Page 8

Mitä pitäisi tapahtua (SOHO) SOHO-tutkimuksessa oli seurattu avohoidossa olevien skitsofreniapotilaiden terveydentilaa. Pitkittäinen kolmen vuoden aineisto yli kymmenestätuhannesta potilaasta Tutkimukseen rekrytoidut potilaat olivat joko aloittamassa lääkehoidon tai vaihtamassa nykyistä lääkitystään toiseksi. Potilaiden tiedot kerättiin aikapisteissä, jotka olivat lähtötilanne, 3 kuukautta, 6 kuukautta ja tämän jälkeen kuuden kuukauden välein aina kolmeen vuoteen asti lähtötilanteesta. Kiinnostavin mittauksen kohde oli lääkärin arvioima skitsofrenian kliininen vakavuus, joka määritettiin arvioimalla mittaushetkellä potilaan oireiden vakavuutta. arvo yhden ja seitsemän välillä, jossa terve saa arvon yksi ja äärimmäisen sairas arvon seitsemän. Potilaat saattoivat vaihtaa lääkitystään minä hetkenä hyvänsä ja silti säilyä tutkimuksessa. Suarez D et al. Marginal structural models might overcome confounding when analyzing multiple treatment effects in observational studies. Journal of Clinical Epidemiology 2008; 61, 525 530. 7.11.2014 Page 9

Analyysi (SOHO) Vasteena käytettiin dikotomista tietoa sairauden remissiotilasta (0 = Remissiokriteerejä ei saavutettu, 1 = Sairaus remissiotilassa). Sairauden määriteltiin olevan remissiossa, jos kliininen vakavuustaso oli saanut arvon kolme tai vähemmän kuuden kuukauden ajan. Analyysiin oli sisällytetty vain potilaat, joilla oli korkeintaan yksi puuttuva käynti (N=6516). Mallissa hyödynnettiin runsaasti mitattuja kovariaatteja lähtötilanteen sosiodemografisista sekä kliinisistä tekijöistä. Näiden lisäksi tekijöiksi asetettiin seurantajakso ja jakson alussa käytetty lääkitys. Lopullinen malli muodostettiin poistamalla runsaasti tekijöitä sisältävästä mallista yksittäin tekijöitä, jotka eivät olleet tilastollisesti merkitseviä. Tulokset yllättivät: Klotsapiini menestyi odotettua heikommin 7.11.2014 Page 10

Tulokset (SOHO) Lääkärit olivat tietoisia aikaisemmista klotsapiinilla saaduista hyvistä hoitotuloksista klotsapiiniä määrättiin useammin vakavasti sairaille potilaille Seurauksena, vaikka klotsapiinista oli ollutkin apua, sen vaikutus ei ollut täyttänyt tutkimuksessa määriteltyjä remissiokriteerejä. 7.11.2014 Page 11

7.11.2014 Page 12 Tulokset SOHO

Mitä tapahtui (Virusaineisto) Aineisto Aineistossa oli 274 potilasta. Potilaiden seuranta aloitettiin hetkestä, jolloin he saivat ensimmäisen virushoitonsa Potilailta saadut seuranta-ajat vaihtelivat lyhimmästä kuudesta päivästä aina 1054 päivään asti 213 eventtiä 7.11.2014 Page 13

Onkolyyttiset virukset syövän hoidossa Serotyyppi AD3, AD5, AD5/3 AD5- RGD Immuuniherätteet CD40L, GMCSF Lukuisia promoottoreita 7.11.2014 Page 14 Raki M. Oncolytic adenoviruses for treatment of ovarian cancer. Helsinki University Biomedical Dissertations No 122. Helsinki 2009.

Virushoidot Luokka Virukset Hoitojen lkm AD5/3 AD3-HTERT-E1 32 AD5/3-COX2L-D24 36 AD5/3-D24-GMCSF 194 AD5/3-D24-HNIS 1 AD5/3-E2F-D24-GMCSF 73 AD5/3-HTERT-CD40L 118 AD5-RGD AD5-D24-RGD 16 AD5-D24-RGD-GMCSF 88 Toisena mielenkiinnon kohteena pidettiin mahdollista virukseen liitetyn immuuni-herätteen (GMCSF, CD40L) vaikutusta elinaikaan. Tästä muodostettiin erillistä analyysiä varten dikotominen tekijä. ICOVIR-7 77 AD5 AD5-D24-GMCSF 113 7.11.2014 Page 15

Taustamuuttujat Keskiarvo Keskihajonta min. q1 mediaani q3 maks. Ikä 55,5 13,3 3 48 58 64 84 Luokka N (%) WHO matala 152 (55,5) korkea 122 (45,5) Sukupuoli mies 116 (42,3) 7.11.2014 Page 16 nainen 158 (57,7)

Aikariippuvaiset muuttujat Aikariippuvaisilla tekijöillä pyrittiin huomioimaan mahdollista aikariippuvaista sekoittumista kolme erilaista, joilla pyrittiin esittämään potilaan hoitohistoriaa mahdollisimman hyvin. Hoitoaika kuinka kauan potilas on ollut samalla hoidolla määriteltyjen virusluokkien mukaan. Tällä ei siis huomioitu, kuinka monta kertaa potilas on saanut samaa käsittelyä, vaan ainoastaan se, kuinka monta päivää potilas on ollut samantyyppisen virushoidon alla. hoitojen lukumäärä Kertojen määrä, jolloin potilaan hoito oli vaihtunut toisen tyyppiseksi. käsittelyjen lukumäärä yksittäisten hoitokertojen määrää riippumatta siitä, minkälaista hoitoa annettiin. 7.11.2014 Page 17

Analyysi Analyysimenetelmänä käytettiin diskreettien aikojen elinaika-analyysiä, jossa hyödynnettiin yleistettyjä estimointiyhtälöitä. Aineisto jaettiin kymmenen päivän mittaisiin aikaikkunoihin aineiston paloittainen käsittely mahdollisti helpon tavan muodostaa yksittäisille havainnoille käytettävät IPT-painot Havaintoja käsiteltiin siten, että jokaisella henkilöllä ajateltiin olevan aikavälillä tietty virushoito aktiivisena. Aikavälin virushoito määritettiin edellisestä hoidosta Kun henkilö sai uuden hoidon, sitä seuraavissa aikaväleissä henkilöllä katsottiin olevan tämä virushoito aktiivinen kunnes henkilö sai taas uuden virushoidon. Analyysi suoritettiin GEE-estimoinnilla. Tilastollisia malleja tehtiin kiinnostuksen kohteiden mukaisesti kaksi erilaista. Mallit olivat muuten samanlaisia lukuun ottamatta sitä, että toisessa mallissa yhtenä tekijänä oli virustyyppi ja toisessa tämän tilalla oli dikotominen immuunivastemuuttuja. Aikaikkunaa osoittavalle tekijälle tehtiin logaritmi-muunnos mallin sopivuuden parantamiseksi. 7.11.2014 Page 18

Painottamaton malli GEE-malli (vasteena elossa/kuolema) Kovariaatteina (aikaikkunassa j) Käsittely(j) Sukupuoli WHO Ikä Log(Aika(j)) 7.11.2014 Page 19

Painotettu malli Marginaalirakennemallituksessa muodostettiin ensin käsittelymallit, joiden perusteella laskettiin käytetyille havainnoille IPT-painot. Jokaista henkilön tilaa eri aikaväleillä käsiteltiin yksittäisinä havaintoina, joille jokaiselle laskettiin oma IPT-paino. Lopullinen marginaalirakennemalli, jota hyödynnettiin varsinaisten mielenkiinnon kohteiden estimointiin, vastasi painotettua versiota aikaisemmasta painottamattomasta mallista. 7.11.2014 Page 20

Käsittelymallit Vakautetut painot Kaksi mallitusta Ensimmäinen malli sisälsi pelkästään aikariippuvaiset tekijät Toinen malli näiden lisäksi myös lähtötilanteen taustamuuttujat. Vakautetut painot määritettiin näistä saatujen estimaattien suhteena. Saadun käsittelyn todennäköisyyttä mallitettiin logistisella regressiolla Aikariippuvaisina tekijöinä oli hoitoaika, hoitojen lukumäärä ja käsittelyjen lukumäärä Lähtötilanteen taustamuuttujina käytettiin WHO-luokitusta, sukupuolta ja ikää Keskivirheet kuitenkin kasvoivat kohtuuttoman suuriksi käytettäessä kaikki tekijöitä ja tarkasteltaessa jokaista aikaväliä. Tekijöitä ja tarkasteluaikaa jouduttiin rajaamaan 7.11.2014 Page 21

Lopulliset IPT-painot Malli Keskiarvo Keskihajonta Min. Q1 Mediaani Q3 Maks. Virustyyppi 0.997 0.186 0.339 0.920 0.995 1.051 3.378 Immuuniheräte 1.000 0.133 0.219 0.970 1.000 1.021 3.183 7.11.2014 Page 22

Tulokset ja vertailu Vertailu Painottamaton malli MRM OR 95 % luottamusväli OR 95 % luottamusväli Virustyyppi (AD5 vs. AD5/3) 1.087 (0.791, 1.493) 1.062 (0.763, 1.477) Virustyyppi (AD5-RGD vs. AD5/3) 1.165 (0.839, 1.620) 1.191 (0.846, 1.676) Sukupuoli (mies vs. nainen) 1.520 (1.123, 2.056) 1.423 (1.044, 1.940) WHO (Korkea vs. Matala) 2.818 (1.952, 4.066) 3.130 (2.237, 4.380) 7.11.2014 Page 23

7.11.2014 Page 24 Tulokset ja vertailu

Tulokset ja vertailu Vertailu Painottamaton malli MRM OR 95 % luottamusväli OR 95 % luottamusväli Immuuniheräte (Ei vs. Kyllä) 1.506 (1.075, 2.111) 1.573 (1.110, 2.229) Sukupuoli (mies vs. nainen) 1.483 (1.093, 2.014) 1.467 (1.077, 1.997) WHO (Korkea vs. Matala) 2.819 (1.942, 4.091) 2.797 (1.917, 4.081) 7.11.2014 Page 25

7.11.2014 Page 26 Tulokset ja vertailu

Miksi näin aineistojen havaintojen rakenteet olivat hyvin erilaiset. SOHO-tutkimus: 6516 potilasta ja viisi aikaväliä Virustutkimus: 274 potilasta ja 106 väliä SOHO-tutkimuksen Lopullisissa analyyseissä voitiin käyttää monimutkaisempia malleja Virusaineistomallissa painojen laskennassa ajauduttiin typistämään merkittävästi malleja, jotta estimaattien keskivirheet pysyivät hallinnassa IPT-painoja muodostettaessa 7.11.2014 Page 27

Marginaalirakennemallitus on aikaisempien tutkimusten ja teorian perusteella hyvä työkalu, mutta sen käyttöä ei liene syytä ajatella oletusarvoisena havainnoivien tutkimusten aineistojen analysoinnissa. 7.11.2014 Page 28