Tilastotiede ja Etiikka

Samankaltaiset tiedostot

Tilastotiede ja Etiikka. Jouko Miettunen, Professori, Akatemiatutkija Elinikäisen terveyden tutkimusyksikkö Oulun yliopisto

Tilastotiede ja Etiikka

Kliiniset kokeet. Jouko Miettunen, dosentti Psykiatrian klinikka, OY Oulu

Tutkimusartikkelien kriittinen arviointi. Jouko Miettunen

What to do with outcome reporting bias? Mitä tehdä tulosten raportointiharhalle?

Statistical design. Tuomas Selander

Capacity Utilization

Benchmarking Controlled Trial - a novel concept covering all observational effectiveness studies

RANTALA SARI: Sairaanhoitajan eettisten ohjeiden tunnettavuus ja niiden käyttö hoitotyön tukena sisätautien vuodeosastolla

Näytön jäljillä CINAHL-tietokannassa

Liikunnan vaikuttavuus ja kuntoutus

Results on the new polydrug use questions in the Finnish TDI data

Perusnäkymä yksisuuntaiseen ANOVAaan

Vaikutusten mittaaminen. Hannes Enlund Fimea Lääkehoitojen arviointi

Otoskoon arviointi. Tero Vahlberg

Aineistokoko ja voima-analyysi

Meta-analyysit. Oulu Jouko Miettunen, dosentti Psykiatrian klinikka Oulun yliopisto

Adaptiiviset lääkekokeet. Lääketieteellisen tutkimusetiikan seminaari Olli Tenhunen FIMEA, OYS/syöpätaudit ja hematologia

Increase of opioid use in Finland when is there enough key indicator data to state a trend?

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Somaattinen sairaus nuoruudessa ja mielenterveyden häiriön puhkeamisen riski

3 9-VUOTIAIDEN LASTEN SUORIUTUMINEN BOSTONIN NIMENTÄTESTISTÄ

EBM ja laboratorio. Kristina Hotakainen HY ja HUSLAB

Master's Programme in Life Science Technologies (LifeTech) Prof. Juho Rousu Director of the Life Science Technologies programme 3.1.

Suomen Potilasturvallisuusyhdistys SPTY ry

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Perusterveydenhuollon erilaisten diabeteksen hoitomallien tuloksellisuuden vertailu (painopisteenä tyypin 1 diabetes)

Korkeakoulujen tietohallinto ja tutkimus: kumpi ohjaa kumpaa?

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Lataa Cognitive Function in Opioid Substitution Treated Patiens - Pekka Rapeli. Lataa

Efficiency change over time

EU:n lääketutkimusasetus ja eettiset toimikunnat Suomessa Mika Scheinin

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Constructive Alignment in Specialisation Studies in Industrial Pharmacy in Finland

Läpimurto ms-taudin hoidossa?

Mitä vaikuttavuusnäytöllä tehdään? Jorma Komulainen LT, dosentti Käypä hoito suositusten päätoimittaja

GOOD WORK LONGER CAREER:

Gap-filling methods for CH 4 data

Perusoikeusbarometri. Panu Artemjeff Erityisasiantuntija

Julkaisun laji Opinnäytetyö. Sivumäärä 43

Asiakaspalautteen merkitys laboratoriovirheiden paljastamisessa. Taustaa

National Building Code of Finland, Part D1, Building Water Supply and Sewerage Systems, Regulations and guidelines 2007

Noona osana potilaan syövän hoitoa

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Luennoitsija ja mahdolliset kirjan sivut Ti VIB LS6 EPI p Ti oma tila epi Ke VIB LS6 EPI

Naisnäkökulma sijoittamiseen Vesa Puttonen

Mitä IHMEttä on MIXTURE -mallintaminen?

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

HMG-CoA Reductase Inhibitors and safety the risk of new onset diabetes/impaired glucose metabolism

Network to Get Work. Tehtäviä opiskelijoille Assignments for students.

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

ELEMET- MOCASTRO. Effect of grain size on A 3 temperatures in C-Mn and low alloyed steels - Gleeble tests and predictions. Period

Reliable diagnostic support Ultra-light design

HARJOITUS- PAKETTI A

Terveysalan uudistaminen yritysten, korkeakoulujen ja palvelujärjestelmän yhteistyöllä

pitkittäisaineistoissa

T Statistical Natural Language Processing Answers 6 Collocations Version 1.0

Biopankkien hyödyntäminen terveystaloudellisessa arvioinnissa

Tutkimusdata ja julkaiseminen Suomen Akatemian ja EU:n H2020 projekteissa

Osallistujaraportit Erasmus+ ammatillinen koulutus

Tilastollisten tutkimusmenetelmien käyttö ja väärinkäyttö (terveystieteellisessä tutkimuksessa)

Tupakkapoliittisten toimenpiteiden vaikutus. Satu Helakorpi Terveyden edistämisen ja kroonisten tautien ehkäisyn osasto Terveyden edistämisen yksikkö

Guideline on Similar biological medicinal products containing biotechnology-derived proteins as active substance: non-clinical and clinical issues

Matching in structural change area. Olli Retulainen

Information on preparing Presentation

KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Kohderyhmä: Lääketaloustieteen syventäviä opintoja suorittavat proviisoriopiskelijat. Koulutus soveltuu erityisesti eri alojen jatko-opiskelijoille.

Uusi Ajatus Löytyy Luonnosta 4 (käsikirja) (Finnish Edition)

Työsuojelurahaston Tutkimus tutuksi - PalveluPulssi Peter Michelsson Wallstreet Asset Management Oy

Yksilön ja yhteisön etu vastakkain? Prof. Veikko Launis Lääketieteellinen etiikka Kliininen laitos, Turun yliopisto

lääketieteen koulutuksessa nykytila ja haasteet

Uusia kokeellisia töitä opiskelijoiden tutkimustaitojen kehittämiseen

ReFuel 70 % Emission Reduction Using Renewable High Cetane Number Paraffinic Diesel Fuel. Kalle Lehto, Aalto-yliopisto 5.5.

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Kliininen arviointi ja kliininen tieto mikä riittää?

* for more information. Sakari Nurmela

Aikuisten lihavuuden elintapahoidon vaikuttavuus tutkimusnäytön näkökulmasta Veikko Kujala

GEENEISTÄ SOSIAALISEEN KÄYTTÄYTYMISEEN. Markus Jokela, Psykologian laitos, HY

MEETING PEOPLE COMMUNICATIVE QUESTIONS

ETIIKKASEMINAARI Rahoitushauissa huomioitavaa

Testejä suhdeasteikollisille muuttujille

Use of spatial data in the new production environment and in a data warehouse

Missing data may bias your conclusions. Juha Karvanen Department of Mathematics and Statistics University of Jyväskylä

Eettisen toimikunnan ja TUKIJA:n vuorovaikutuksesta. Tapani Keränen Kuopion yliopisto

Harjoitus 7: NCSS - Tilastollinen analyysi

Masennus ja mielialaongelmien ehkäisy Timo Partonen

Tiedonhankintatavat kliinisen fysioterapian tutkimuksessa

1. SIT. The handler and dog stop with the dog sitting at heel. When the dog is sitting, the handler cues the dog to heel forward.

Co-Design Yhteissuunnittelu

Koneoppimisen hyödyt arvopohjaisessa terveydenhuollossa. Kaiku Health

Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta?

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

Raskausdiabetes. GDM Gravidassa Tammikuun kihlaus Kati Kuhmonen

812336A C++ -kielen perusteet,

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi

NÄYTÖN ARVIOINTI: SYSTEMAATTINEN KIRJALLISUUSKATSAUS JA META-ANALYYSI. EHL Starck Susanna & EHL Palo Katri Vaasan kaupunki 22.9.

BIOENV Laitoskokous Departmental Meeting

Tutkimusasetelmat. - Oikea asetelma oikeaan paikkaan - Vaikeakin tutkimusongelma voi olla ratkaistavissa oikealla tutkimusasetelmalla

Transkriptio:

Tilastotiede ja Etiikka Jouko Miettunen, Professori, Akatemiatutkija Center for Life Course and Systems Epidemiology Oulun yliopisto jouko.miettunen@oulu.fi

Sisältö Eettiset säännöt tilastotieteessä Virheet tilastoanalyyseissä Tilastotestien oletukset Monitestaus Tilastollinen voima ja kato Kliiniset kokeet Julkaisuharha Lähteitä 2

Tilastollisten menetelmien väärä käyttö voi rikkoa useita eettisiä sääntöjä tai velvollisuuksia, kuten velvollisuutta olla rehellinen ja objektiivinen, sekä velvollisuutta välttää virheitä ja olla avoin? Huonot tilastometodit huonoa tiedettä! Gardenier and Resnik 2002 3

Miksi tilastometodeja käytetään väärin? Paineita julkaista, tuottaa tuloksia, tai saada avustuksia? Uratavoitteita tai toiveita? Eturistiriitoja ja taloudellisia syitä? Riittämätön ohjaus tai koulutus? Gardenier and Resnik 2002 4

Tilastollisten käytäntöjen eettiset ohjeet Esitä havainnot ja tulkinnat rehellisesti ja puolueettomasti Vältä totuudenvastaisia, harhaanjohtavia tai epäselviä lausuntoja Selvitä mahdolliset taloudelliset tai muut eturistiriidat, jotka voivat vaikuttaa ammatilliseen lausuntoon (tai tutkimukseen) Kerää vain tarvittavat tiedot tutkimuksen tarkoitukseen Suojaa tietojen luottamuksellisuus Varmistettava, että aina kun tiedot siirretään muille henkilöille tai järjestöille siirto on sallittu ja luottamuksellisuus säilyy Esim. filesender ohjelma, kirjallinen vakuutus (engagement) American Statistical Association 1999 (www.amstat.org) 5

Tilastollisten käytäntöjen eettiset ohjeet Dokumentoi tietolähteet ja tietojen epätarkkuudet ym. Data tulisi olla vapaasti käytettävissä (tietyillä ehdoilla) Tunnista että tilastollinen menettely saattaa jossain määrin olla tulkintakysymys (mieti vaihtoehdot, sensitivity analysis) Huomioida että asiakas (tutkija) tai työnantaja voi olla henkilö joka ei tunne tilastokäytäntöjä ja -metodeita Valitse tilastolliset menetelmät ilman huolta myönteisestä tuloksesta (esim. p<0.05 haluttuun suuntaan!) Esitä selvästi, tarkasti ja kattavasti vaihtoehtoiset (suositeltavat) tilastolliset menetelmät sekä kaikkien mahdollisten lähestymistapojen edut ja vaikutukset American Statistical Association 1999 6

Tilastollisten käytäntöjen eettiset ohjeet Tutkijoiden on käsiteltävä tilastollisia kysymyksiä kuten Poikkeavat havainnot, tietojen muokkaus (imputointi) ja puhdistus, tiedon louhinta (data mining) Nämä toiminnot ovat usein käytännöllisiä, tai jopa välttämättömiä, ne on tärkeää kertoa rehellisesti ja avoimesti raportoidessa tutkimustuloksia. Asianmukaiset poistamiset (eksluusiot) tai puuttuvan tiedon korvaamiset (imputoinnit) voivat olla hyviä keinoja vähentää kohinaa muuttamatta signaalia, joka kuvaa tutkittavaa suhdetta tai vaikutusta. Gardenier and Resnik 2002 7

8

Tilastolliset virheet Virheitä on helppo tehdä! Ei välttämättä helppo huomata! Tahallinen vai tahaton virhe? Kuka teki analyysit? Eroja tilasto-ohjelmien välillä? Kuinka usein? Lang T. Twenty statistical errors even you can find in biomedical research articles. Croatian Med J 2004; 45:361-70. 9

Testien oletukset Normaalijakautuneisuus Visuaalinen tarkastelu Keskiarvo vs. mediaani Regressioanalyysin oletus Muunnokset (logaritmi tms.) Voivat vaikeuttaa tulkintaa Osborne and Waters 2002 10

Testien oletukset Havaintojen riippumattomuus Jos hyvin suunniteltu tutkimus ei ole yleensä ongelma Isoissa tutkimuksissa ei ole ongelma Mittauksien luotettavuus Huono luotettavuus vähentää tilastollista voimaa! Osborne and Waters 2002 11

Testien oletukset Homoskedastisuus Eli varianssin tulisi olla sama muuttujan eri tasoilla Oletus regressioanalyysissa Korkea heteroskedastisuus vähentää tilastollista voimaa! Osborne and Waters 2002 12

Testien oletukset Ei-lineariset yhteydet vähentävät voimaa normaalissa regressioanalyysissa Osborne and Waters 2002 13

Monitestaus 14

Monitestaus Hypoteesin asettaminen on tärkeää! Data louhinta tai kalastelu (data fishing, data mining) Monitestaus korjaukset esim. Bonferroni korjaus yksinkertainen, mutta konservatiivinen Bootstrap- menetelmä Post-Hoc testaus varianssianalyysissa 15

Tulkinta Tilastollinen merkitsevyys vs. vaikutus (effect)? The difference between significant and not significant is not itself statistically significant Absence of evidence is not evidence of absence 16

Voima 17

Voima-analyysit Power analyses Hyvin tehty voima-analyysi tulisi olla osa kaikkia tutkimussuunnitelmia! Liian paljon tutkimusta liian pienillä aineistoilla eettinen ongelma! 18

Voima-analyysit Otoskoot kliinisissä kokeissa ovat yleensä pieniä, esim. Nivelreuma: mediaani otoskoko 54 potilasta (196 kliinistä koetta) Ihotaudit: 46 potilasta (73 koetta) Skitsofrenia: 65 potilasta (2000 koetta) Otoskoko ei yleensä perustu mihinkään! Post hoc voima-analyysit ovat turhia, luottamusvälit kertoa voimasta Moher et al. CONSORT statement 2010 19

Voima-analyysit Tarvittavat tiedot Tutkittavien määrä Tärkeimmän vasteen esiintyvyys (odotettu vastetapahtumien määrä) Tehtävät oletukset Vaikutuksen koko Tilastollisen merkitsevyyden raja (α) Tilastollinen voima (1-β) 20

Alfa eli merkitsevyystaso (esim. 0.05 tai 5%) Todennäköisyys että ero löytyy vaikka sitä ei ole olemassa (väärä positiivinen löydös) Beta eli voima (esim 0.8 tai 80%) Todennäköisyys että löydetty ero on todellinen Välianalyysit (interim analyses) ovat etukäteen (a priori) suunniteltuja analyyseja meneillään olevaan kliiniseen kokeeseen Syyt eettisiä tai taloudellisia α virhe kasvaa Voima voi jäädä riittämättömäksi? Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7 13. 21

Erilaisia asetelmia Keskiarvojen erot Osuuksien erot Monimuuttujamallit Erilaisia ohjelmia Nettilaskurit Spesifit ohjelmat SPSS sample power, http://homepage.stat.uiowa.edu/~rlenth/power/index.html 22

Tutkimusasetelma Kliinisissä kokeissa pienempi otoskoko on riittävä Varianssi Suurempi varianssi vaatii isompaa aineistoa ryhmäerojen löytämiseksi Seurantutkimukset Huomioi kato (muutot, kuolemat, kieltäytymiset) Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7 13. 23

Kato / Edustavuus Lääkärit ja potilaat osallistuvat huonosti kliinisiin kokeisiin. Lääkärit haluavat päättää potilaittensa hoidosta. Nykyiseen hoitokäytäntöön on vahva usko! Esim. Syöpäpotilaista vain 3% osallistuu kliinisiin kokeisiin. Jos <80% aineistosta lopullisissa analyyseissa, tuloksia ei tulisi huomioida (EBM toolkit 2006). 24

Lieberman JA, et al. Antipsychotic drug effects on brain morphology in first-episode psychosis. Arch Gen Psychiatry. 2005 Apr;62(4):361-70. OBJECTIVE: To test a priori hypotheses that olanzapine-treated patients have less change over time in whole brain gray matter volumes and lateral ventricle volumes than haloperidol-treated patients. DESIGN: Longitudinal, randomized, controlled, multisite, double-blind study. Patients treated and followed up for up to 104 weeks. Neurocognitive and magnetic resonance imaging (MRI) assessments performed at weeks 0 (baseline), 12, 24, 52, and 104. INTERVENTIONS: Random allocation to a conventional antipsychotic, haloperidol (2-20 mg/d), or an atypical antipsychotic, olanzapine (5-20 mg/d). RESULTS: Of 263 randomized patients, 161 had baseline and at least 1 postbaseline MRI evaluation. Haloperidol-treated patients exhibited significant decreases in gray matter volume, whereas olanzapine-treated patients did not. A matched sample of healthy volunteers (n = 58) examined contemporaneously showed no change in gray matter volume. CONCLUSIONS: Patients with first-episode psychosis exhibited a significant between-treatment difference in MRI volume changes. Haloperidol was associated with significant reductions in gray matter volume, whereas olanzapine was not. Post hoc analyses suggested that treatment effects on brain volume and psychopathology of schizophrenia may be associated. The differential treatment effects on brain morphology could be due to haloperidol-associated toxicity or greater therapeutic effects of olanzapine. 25

26

Kliiniset kokeet

Intention-to-treat Aineisto analysoidaan satunnaistamisen mukaisesti. Satunnaistamisen vaikutus säilyy! 28

Tom Lang. Croatian Medical Journal 2004;45:361-70 - jos merkitsevä ero ennustemuuttujassa, voidaan käyttää kovariaattina 29

Menetelmät Intervention valinta Perusteet? Tutkimuksen kesto? Yleistettävyys? Ensisijainen vs. toissijainen vaste Alaryhmien analyysit 30

Tulokset Tilastolliset menetelmät tulisi esittää selkeästi Luottamusvälit tulisi esittää kun kuvata vaikutuksen varmuutta Tarkat p-arvot (ei <0.05 tms.) 31

Puutteellinen haittojen raportointi 1. Using generic or vague statements, such as the drug was generally well tolerated or the comparator drug was relatively poorly tolerated. 2. Failing to provide separate data for each study arm. 3. Providing summed numbers for all adverse events for each study arm, without separate data for each type of adverse event. 4. Providing summed numbers for a specific type of adverse event, regardless of severity or seriousness. 5. Reporting only the adverse events observed at a certain frequency or rate threshold (for example, >3% or >10% of participants). 6. Reporting only the adverse events that reach a P value threshold in the comparison of the randomized arms (for example, P > 0.05). 7. Reporting measures of central tendency (for example, means or medians) for continuous variables without any information on extreme values. 8. Improperly handling or disregarding the relative timing of the events, when timing is an important determinant of the adverse event in question. 9. Not distinguishing between patients with 1 adverse event and participants with multiple adverse events. 10. Providing statements about whether data were statistically significant without giving the exact counts of events. 11. Not providing data on harms for all randomly assigned participants. Ioannidis JP, et al. Ann Intern Med 2004; 141:781-8. Haittavaikutuksia voidaan tutkia havaintotutkimuksissa! 32

Pohdinta Heikkoudet? Vertailu aiempiin tutkimuksiin? Yleistettävyys? Tulkinta? Johtopäätökset? 33

Julkaisuharha Tutkimuksen perusongelma Ongelma meta-analyyseissa ja alkuperäistutkimuksissa Johtuu tutkijoista ja lehdistä!

Non-significant results http://mchankins.wordpress.com/2013/04/21/still-not-significant-2/ 35

Miten ei tule raportoida eimerkitseviä tuloksia! a clear, strong trend (p=0.09) an encouraging trend (p<0.1) an important trend (p=0.066) approached conventional levels of significance (p<0.10) below (but verging on) the statistical significant level (p>0.05) difference was apparent (p=0.07) essentially significant (p=0.10) failed to reach significance on this occasion (p=0.09) flirting with conventional levels of significance (p>0.1) leaning towards significance (p=0.15) narrowly escaped significance (p=0.08) not conventionally significant (p=0.089), but.. not significant in the narrow sense of the word (p=0.29) on the very fringes of significance (p=0.099) http://mchankins.wordpress.com/2013/04/21/still-not-significant-2/ 36

Meta-analyysit Julkaisuharhaa voidaan arvioida funnel plotin avulla Oletetaan että tarkimmat (usein suurimmat) tutkimukset antavat keskimääräiset tulokset, muut tutkimukset sijoittuvat molemmille puolille keskiarvoa Trim and fill Rosenberg. Evolution 2005;59: 464-8 37

Funnel Plot Corpet & Pierre Eur J Cancer 2005 (http://corpet.free.fr/maaspirin.html) 38

Trim and Fill Voidaan korjata julkaisuharhaa 39

Why most published research findings are false? 1. The smaller the studies conducted in a scientific field, the less likely the research findings are to be true. 2. The smaller the effect sizes in a scientific field, the less likely the research findings are to be true. 3. The greater the number and the lesser the selection of tested relationships in a scientific field, the less likely the research findings are to be true. 4. The greater the flexibility in designs, definitions, outcomes, and analytical modes in a scientific field, the less likely the research findings are to be true. 5. The greater the financial and other interests and prejudices in a scientific field, the less likely the research findings are to be true. 6. The hotter a scientific field (with more scientific teams involved), the less likely the research findings are to be true. Ioannidis JPA. Why most published research findings are false. PLOS Medicine 2005;2:e124.

Ratkaisuja eettisiin ongelmiin? - Enemmän tilastotieteen opetusta? - Ohjeita? - Ryhmätyö? - Tutkimusten rekisteröinti? - Julkisesti saatavilla olevat aineistot? - Sensitiivisyysanalyysit?

Kirjallisuutta Altman DG. Statistics and ethics in medical research. Misuse of statistics is unethical. Br Med J 1980; 281: 1182 4. DeMets DL. Statistics and ethics in medical research. Science and Engineering Ethics 1999; 5:97-117. Easterbrook PJ, et al. Publication bias in clinical research. Lancet 1991; 337:867 72. Gardenier J & Resnik D. The misuse of statistics: concepts, tools, and a research agenda. Accountability in Research: Policies and Quality Assurance 2002; 9:65-74. 42

Kirjallisuutta Hutton JL. The ethics of randomised controlled trials: a matter of statistical belief? Health Care Anal 1996; 4:95-102 Lang T. Twenty statistical errors even you can find in biomedical research articles. Croatian Med J 2004; 45:361-70. Ioannidis JPA. Why most published research findings are false. PLOS Medicine 2005;2:e124. Moher D, et al. CONSORT 2010 explanation and elaboration: updated guidelines for reporting parallel group randomised trials. BMJ 2010; 340:c869. 43

Kirjallisuutta Osborne JW & Waters E. Four assumptions of multiple regression that researchers should always test. Practical Assessment, Research, and Evaluation 2002: 8 (available online). Palmer CR. Ethics and statistical methodology in clinical trials. J Med Ethics 1993; 19:219-22. Suresh KP & Chandrashekara S. Sample size estimation and power analysis for clinical research studies. J Hum Reprod Sci 2012; 5: 7 13. jouko.miettunen@oulu.fi 44