Tilastotiede ja Etiikka. Jouko Miettunen, Professori, Akatemiatutkija Elinikäisen terveyden tutkimusyksikkö Oulun yliopisto

Samankaltaiset tiedostot
Tilastotiede ja Etiikka

Tilastotiede ja Etiikka

Kliiniset kokeet. Jouko Miettunen, dosentti Psykiatrian klinikka, OY Oulu

Tutkimusartikkelien kriittinen arviointi. Jouko Miettunen

What to do with outcome reporting bias? Mitä tehdä tulosten raportointiharhalle?

Statistical design. Tuomas Selander

Capacity Utilization

Results on the new polydrug use questions in the Finnish TDI data

Otoskoon arviointi. Tero Vahlberg

RANTALA SARI: Sairaanhoitajan eettisten ohjeiden tunnettavuus ja niiden käyttö hoitotyön tukena sisätautien vuodeosastolla

Adaptiiviset lääkekokeet. Lääketieteellisen tutkimusetiikan seminaari Olli Tenhunen FIMEA, OYS/syöpätaudit ja hematologia

Läpimurto ms-taudin hoidossa?

Benchmarking Controlled Trial - a novel concept covering all observational effectiveness studies

Näytön jäljillä CINAHL-tietokannassa

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Asiakaspalautteen merkitys laboratoriovirheiden paljastamisessa. Taustaa

Liikunnan vaikuttavuus ja kuntoutus

Increase of opioid use in Finland when is there enough key indicator data to state a trend?

Luennoitsija ja mahdolliset kirjan sivut Ti VIB LS6 EPI p Ti oma tila epi Ke VIB LS6 EPI

ELEMET- MOCASTRO. Effect of grain size on A 3 temperatures in C-Mn and low alloyed steels - Gleeble tests and predictions. Period

Korkeakoulujen tietohallinto ja tutkimus: kumpi ohjaa kumpaa?

Lataa Cognitive Function in Opioid Substitution Treated Patiens - Pekka Rapeli. Lataa

HARJOITUS- PAKETTI A

Perusnäkymä yksisuuntaiseen ANOVAaan

EU:n lääketutkimusasetus ja eettiset toimikunnat Suomessa Mika Scheinin

3 9-VUOTIAIDEN LASTEN SUORIUTUMINEN BOSTONIN NIMENTÄTESTISTÄ

Gap-filling methods for CH 4 data

GOOD WORK LONGER CAREER:

Efficiency change over time

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Suomen Potilasturvallisuusyhdistys SPTY ry

Julkaisun laji Opinnäytetyö. Sivumäärä 43

Vaikutusten mittaaminen. Hannes Enlund Fimea Lääkehoitojen arviointi

Perusterveydenhuollon erilaisten diabeteksen hoitomallien tuloksellisuuden vertailu (painopisteenä tyypin 1 diabetes)

EBM ja laboratorio. Kristina Hotakainen HY ja HUSLAB

Mitä IHMEttä on MIXTURE -mallintaminen?

Aineistokoko ja voima-analyysi

Constructive Alignment in Specialisation Studies in Industrial Pharmacy in Finland

Noona osana potilaan syövän hoitoa

Perusoikeusbarometri. Panu Artemjeff Erityisasiantuntija

pitkittäisaineistoissa

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Kliininen arviointi ja kliininen tieto mikä riittää?

T Statistical Natural Language Processing Answers 6 Collocations Version 1.0

Meta-analyysit. Oulu Jouko Miettunen, dosentti Psykiatrian klinikka Oulun yliopisto

Somaattinen sairaus nuoruudessa ja mielenterveyden häiriön puhkeamisen riski

Master's Programme in Life Science Technologies (LifeTech) Prof. Juho Rousu Director of the Life Science Technologies programme 3.1.

Guideline on Similar biological medicinal products containing biotechnology-derived proteins as active substance: non-clinical and clinical issues

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Other approaches to restrict multipliers

812336A C++ -kielen perusteet,

Harjoitus 7: NCSS - Tilastollinen analyysi

Yksilön ja yhteisön etu vastakkain? Prof. Veikko Launis Lääketieteellinen etiikka Kliininen laitos, Turun yliopisto

Network to Get Work. Tehtäviä opiskelijoille Assignments for students.

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Osallistujaraportit Erasmus+ ammatillinen koulutus

* for more information. Sakari Nurmela

Digital Admap Native. Campaign: Kesko supermarket

ReFuel 70 % Emission Reduction Using Renewable High Cetane Number Paraffinic Diesel Fuel. Kalle Lehto, Aalto-yliopisto 5.5.

Uusi Ajatus Löytyy Luonnosta 4 (käsikirja) (Finnish Edition)

Missing data may bias your conclusions. Juha Karvanen Department of Mathematics and Statistics University of Jyväskylä

HMG-CoA Reductase Inhibitors and safety the risk of new onset diabetes/impaired glucose metabolism

Raskausdiabetes. GDM Gravidassa Tammikuun kihlaus Kati Kuhmonen

LX 70. Ominaisuuksien mittaustulokset 1-kerroksinen 2-kerroksinen. Fyysiset ominaisuudet, nimellisarvot. Kalvon ominaisuudet

FETAL FIBROBLASTS, PASSAGE 10

Aikuisten lihavuuden elintapahoidon vaikuttavuus tutkimusnäytön näkökulmasta Veikko Kujala

Draft VAMMOJEN EHKÄISYYN. Markku Tuominen. Suomen jääkiekkoliitto. International Ice Hockey Federation

Vertaispalaute. Vertaispalaute, /9

KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto

The CCR Model and Production Correspondence

Reliable diagnostic support Ultra-light design

7.4 Variability management

Lataa Legislating the blind spot - Nikolas Sellheim. Lataa

MALE ADULT FIBROBLAST LINE (82-6hTERT)

Paikkatiedon semanttinen mallinnus, integrointi ja julkaiseminen Case Suomalainen ajallinen paikkaontologia SAPO

Biopankkien hyödyntäminen terveystaloudellisessa arvioinnissa

Toimitusprosessi ja näytön vahvuus Point-of-Care -tietokannoissa. BMF syysseminaari Veera Mujunen, EBSCO Health

Tilastollisten tutkimusmenetelmien käyttö ja väärinkäyttö (terveystieteellisessä tutkimuksessa)

Co-Design Yhteissuunnittelu

Ohjelmien kehittämisstudiot varmistavat laadukkaat ja linjakkaat maisteriohjelmat Maire Syrjäkari ja Riikka Rissanen

Sosiaali- ja terveydenhuollon kehittämisestä

Olet vastuussa osaamisestasi

Mitä vaikuttavuusnäytöllä tehdään? Jorma Komulainen LT, dosentti Käypä hoito suositusten päätoimittaja

MEETING PEOPLE COMMUNICATIVE QUESTIONS

Miehittämätön meriliikenne

Information on preparing Presentation

GEENEISTÄ SOSIAALISEEN KÄYTTÄYTYMISEEN. Markus Jokela, Psykologian laitos, HY

Matemaatikot ja tilastotieteilijät

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Naisnäkökulma sijoittamiseen Vesa Puttonen

Kliininen arviointi ja tutkimus yrityksen kannalta maalaisjärki

Use of spatial data in the new production environment and in a data warehouse

Työsuojelurahaston Tutkimus tutuksi - PalveluPulssi Peter Michelsson Wallstreet Asset Management Oy

1. SIT. The handler and dog stop with the dog sitting at heel. When the dog is sitting, the handler cues the dog to heel forward.

Tiedonhankintatavat kliinisen fysioterapian tutkimuksessa

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

National Building Code of Finland, Part D1, Building Water Supply and Sewerage Systems, Regulations and guidelines 2007

Uusia kokeellisia töitä opiskelijoiden tutkimustaitojen kehittämiseen

Transkriptio:

Tilastotiede ja Etiikka Jouko Miettunen, Professori, Akatemiatutkija Elinikäisen terveyden tutkimusyksikkö Oulun yliopisto jouko.miettunen@oulu.fi

Sisältö Eettiset säännöt tilastotieteessä Virheet tilastoanalyyseissä Tilastotestien oletukset Monitestaus Tilastollinen voima ja kato Kliiniset kokeet Julkaisuharha Lähteitä 2

Tilastollisten menetelmien väärä käyttö voi rikkoa useita eettisiä sääntöjä tai velvollisuuksia, kuten velvollisuutta olla rehellinen ja objektiivinen, sekä velvollisuutta välttää virheitä ja olla avoin? Huonot tilastometodit huonoa tiedettä! Gardenier and Resnik 2002 3

Miksi tilastometodeja käytetään väärin? Paineita julkaista, tuottaa tuloksia, tai saada avustuksia? Uratavoitteita tai toiveita? Eturistiriitoja ja taloudellisia syitä? Riittämätön ohjaus tai koulutus? Gardenier and Resnik 2002 4

Tilastollisten käytäntöjen eettiset ohjeet Esitä havainnot ja tulkinnat rehellisesti ja puolueettomasti Vältä totuudenvastaisia, harhaanjohtavia tai epäselviä lausuntoja Selvitä mahdolliset taloudelliset tai muut eturistiriidat, jotka voivat vaikuttaa ammatilliseen lausuntoon (tai tutkimukseen) Kerää vain tarvittavat tiedot tutkimuksen tarkoitukseen Varmistettava, että aina kun tiedot siirretään muille henkilöille tai järjestöille siirto on sallittu ja luottamuksellisuus säilyy Esim. filesender ohjelma, kirjallinen vakuutus (engagement) American Statistical Association 1999 (www.amstat.org) 5

Tilastollisten käytäntöjen eettiset ohjeet Tunnista että tilastollinen menettely saattaa jossain määrin olla tulkintakysymys Huomioida että asiakas (tutkija) tai työnantaja voi olla henkilö joka ei tunne tilastokäytäntöjä ja -metodeita Valitse tilastolliset menetelmät ilman huolta myönteisestä tuloksesta (esim. p<0.05 haluttuun suuntaan!) Esitä selvästi, tarkasti ja kattavasti vaihtoehtoiset (suositeltavat) tilastolliset menetelmät (sensitivity analysis) sekä kaikkien mahdollisten lähestymistapojen edut ja vaikutukset American Statistical Association 1999 6

Tilastollisten käytäntöjen eettiset ohjeet Tutkijoiden on käsiteltävä tilastollisia kysymyksiä kuten Poikkeavat havainnot, tietojen muokkaus (imputointi) ja puhdistus, tiedon louhinta (data mining) Nämä toiminnot ovat usein käytännöllisiä, tai jopa välttämättömiä, ne on tärkeää kertoa rehellisesti ja avoimesti raportoidessa tutkimustuloksia. Asianmukaiset poistamiset (eksluusiot) tai puuttuvan tiedon korvaamiset (imputoinnit) voivat olla hyviä keinoja vähentää kohinaa muuttamatta signaalia, joka kuvaa tutkittavaa suhdetta tai vaikutusta. Gardenier and Resnik 2002 7

8

Tilastolliset virheet Virheitä on helppo tehdä! Ei välttämättä helppo huomata! Tahallinen vai tahaton virhe? Kuka teki analyysit? Eroja tilasto-ohjelmien välillä? Kuinka usein? Lang T. Twenty statistical errors even you can find in biomedical research articles. Croatian Med J 2004; 45:361-70. 9

Testien oletukset Normaalijakautuneisuus Visuaalinen tarkastelu Keskiarvo vs. mediaani Regressioanalyysin oletus Muunnokset (logaritmi tms.) Voivat vaikeuttaa tulkintaa Osborne and Waters 2002 10

Testien oletukset Havaintojen riippumattomuus Jos hyvin suunniteltu tutkimus ei ole yleensä ongelma Isoissa tutkimuksissa ei ole ongelma Mittauksien luotettavuus Huono luotettavuus vähentää tilastollista voimaa! Osborne and Waters 2002 11

Testien oletukset Homoskedastisuus Eli varianssin tulisi olla sama muuttujan eri tasoilla Oletus regressioanalyysissa Korkea heteroskedastisuus vähentää tilastollista voimaa! Osborne and Waters 2002 12

Testien oletukset Ei-lineariset yhteydet vähentävät voimaa normaalissa regressioanalyysissa Osborne and Waters 2002 13

Monitestaus 14

Monitestaus Hypoteesin asettaminen on tärkeää! Data louhinta tai kalastelu (data fishing, data mining) Monitestaus korjaukset esim. Bonferroni korjaus yksinkertainen, mutta konservatiivinen Bootstrap- menetelmä Post-Hoc testaus varianssianalyysissa 15

Tulkinta Tilastollinen merkitsevyys vs. vaikutus (effect)? The difference between significant and not significant is not itself statistically significant Absence of evidence is not evidence of absence 16

17

Mark DB, et al. Understanding the Role of P Values and Hypothesis Tests in Clinical Research. JAMA Cardiol. 2016; 1(9):1048-1054. The primary focus in interpreting therapeutic clinical research data should be on the treatment effect. This effect is assessed using 2 complementary types of statistical measures calculated from the data, namely, effect magnitude or size and precision of the effect size. In a randomized trial, effect size is often summarized using constructs, such as odds ratios, hazard ratios, relative risks, or adverse event rate differences. How large a treatment effect has to be to be consequential is a matter for clinical judgment. Effect size and its precision can both be helpful but, by themselves, provide only a tunnel vision perspective on study results that ignores the clinical effects the study was conducted to measure. 18

Voima 19

Voima-analyysit Power analyses Hyvin tehty voima-analyysi tulisi olla osa kaikkia tutkimussuunnitelmia! Liian paljon tutkimusta liian pienillä aineistoilla eettinen ongelma! 20

Voima-analyysit Otoskoot kliinisissä kokeissa ovat yleensä pieniä, esim. Nivelreuma: mediaani otoskoko 54 potilasta (196 kliinistä koetta) Ihotaudit: 46 potilasta (73 koetta) Skitsofrenia: 65 potilasta (2000 koetta) Otoskoko ei yleensä perustu mihinkään! Post hoc voima-analyysit ovat turhia, luottamusvälit kertovat voimasta Moher et al. CONSORT statement 2010 21

Voima-analyysit Tarvittavat tiedot Tutkittavien määrä Tärkeimmän vasteen esiintyvyys (odotettu vastetapahtumien määrä) Tehtävät oletukset Vaikutuksen koko Tilastollisen merkitsevyyden raja (α) Tilastollinen voima (1-β) 22

Alfa eli merkitsevyystaso (esim. 0.05 tai 5%) Todennäköisyys että ero löytyy vaikka sitä ei ole olemassa (väärä positiivinen löydös) Beta eli voima (esim 0.8 tai 80%) Todennäköisyys että löydetty ero on todellinen Välianalyysit (interim analyses) ovat etukäteen (a priori) suunniteltuja analyyseja meneillään olevaan kliiniseen kokeeseen Syyt eettisiä tai taloudellisia α virhe kasvaa Voima voi jäädä riittämättömäksi? Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7 13. 23

Erilaisia asetelmia Keskiarvojen erot Osuuksien erot Monimuuttujamallit Erilaisia ohjelmia Nettilaskurit Spesifit ohjelmat SPSS sample power, http://homepage.stat.uiowa.edu/~rlenth/power/index.html 24

Tutkimusasetelma Kliinisissä kokeissa pienempi otoskoko on riittävä Varianssi Suurempi varianssi vaatii isompaa aineistoa ryhmäerojen löytämiseksi Seurantatutkimukset Huomioi kato (muutot, kuolemat, kieltäytymiset) Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7 13. 25

Kato / Edustavuus Lääkärit ja potilaat osallistuvat huonosti kliinisiin kokeisiin. Lääkärit haluavat päättää potilaittensa hoidosta. Nykyiseen hoitokäytäntöön on vahva usko! Jos <80% aineistosta lopullisissa analyyseissa, tuloksia ei tulisi huomioida (EBM toolkit 2006). 26

Lieberman JA, et al. Antipsychotic drug effects on brain morphology in first-episode psychosis. Arch Gen Psychiatry. 2005 Apr;62(4):361-70. OBJECTIVE: To test a priori hypotheses that olanzapine-treated patients have less change over time in whole brain gray matter volumes and lateral ventricle volumes than haloperidol-treated patients. DESIGN: Longitudinal, randomized, controlled, multisite, double-blind study. Patients treated and followed up for up to 104 weeks. Neurocognitive and magnetic resonance imaging (MRI) assessments performed at weeks 0 (baseline), 12, 24, 52, and 104. INTERVENTIONS: Random allocation to a conventional antipsychotic, haloperidol (2-20 mg/d), or an atypical antipsychotic, olanzapine (5-20 mg/d). RESULTS: Of 263 randomized patients, 161 had baseline and at least 1 postbaseline MRI evaluation. Haloperidol-treated patients exhibited significant decreases in gray matter volume, whereas olanzapine-treated patients did not. A matched sample of healthy volunteers (n = 58) examined contemporaneously showed no change in gray matter volume. CONCLUSIONS: Patients with first-episode psychosis exhibited a significant between-treatment difference in MRI volume changes. Haloperidol was associated with significant reductions in gray matter volume, whereas olanzapine was not. Post hoc analyses suggested that treatment effects on brain volume and psychopathology of schizophrenia may be associated. The differential treatment effects on brain morphology could be due to haloperidol-associated toxicity or greater therapeutic effects of olanzapine. 27

28

Kliiniset kokeet

Intention-to-treat Aineisto analysoidaan satunnaistamisen mukaisesti. Satunnaistamisen vaikutus säilyy! 30

Tom Lang. Croatian Medical Journal 2004;45:361-70 - jos merkitsevä ero ennustemuuttujassa, voidaan käyttää kovariaattina 31

Menetelmät Intervention valinta Perusteet? Tutkimuksen kesto? Yleistettävyys? Ensisijainen vs. toissijainen vaste Alaryhmien analyysit 32

Tulokset Tilastolliset menetelmät tulisi esittää selkeästi Luottamusvälit tulisi esittää kun kuvataan vaikutuksen varmuutta Tarkat p-arvot (ei <0.05 tms.) 33

Puutteellinen haittojen raportointi 1. Using generic or vague statements, such as the drug was generally well tolerated or the comparator drug was relatively poorly tolerated. 2. Failing to provide separate data for each study arm. 3. Providing summed numbers for all adverse events for each study arm, without separate data for each type of adverse event. 4. Providing summed numbers for a specific type of adverse event, regardless of severity or seriousness. 5. Reporting only the adverse events observed at a certain frequency or rate threshold (for example, >3% or >10% of participants). 6. Reporting only the adverse events that reach a P value threshold in the comparison of the randomized arms (for example, P > 0.05). 7. Reporting measures of central tendency (for example, means or medians) for continuous variables without any information on extreme values. 8. Improperly handling or disregarding the relative timing of the events, when timing is an important determinant of the adverse event in question. 9. Not distinguishing between patients with 1 adverse event and participants with multiple adverse events. 10. Providing statements about whether data were statistically significant without giving the exact counts of events. 11. Not providing data on harms for all randomly assigned participants. Ioannidis JP, et al. Ann Intern Med 2004; 141:781-8. Haittavaikutuksia voidaan tutkia havaintotutkimuksissa! 34

Pohdinta Heikkoudet? Vertailu aiempiin tutkimuksiin? Yleistettävyys? Tulkinta? Johtopäätökset? 35

Julkaisuharha Tutkimuksen perusongelma Ongelma meta-analyyseissa ja alkuperäistutkimuksissa Johtuu tutkijoista ja lehdistä!

Non-significant results http://mchankins.wordpress.com/2013/04/21/still-not-significant-2/ 37

Miten ei tule raportoida eimerkitseviä tuloksia! a clear, strong trend (p=0.09) an encouraging trend (p<0.1) an important trend (p=0.066) approached conventional levels of significance (p<0.10) below (but verging on) the statistical significant level (p>0.05) difference was apparent (p=0.07) essentially significant (p=0.10) failed to reach significance on this occasion (p=0.09) flirting with conventional levels of significance (p>0.1) leaning towards significance (p=0.15) narrowly escaped significance (p=0.08) not conventionally significant (p=0.089), but.. not significant in the narrow sense of the word (p=0.29) on the very fringes of significance (p=0.099) http://mchankins.wordpress.com/2013/04/21/still-not-significant-2/ 38

Meta-analyysit Julkaisuharhaa voidaan arvioida funnel plotin avulla Oletetaan että tarkimmat (usein suurimmat) tutkimukset antavat keskimääräiset tulokset, muut tutkimukset sijoittuvat molemmille puolille keskiarvoa Trim and fill Rosenberg. Evolution 2005;59: 464-8 39

Funnel Plot Corpet & Pierre Eur J Cancer 2005 (http://corpet.free.fr/maaspirin.html) 40

Trim and Fill Voidaan korjata julkaisuharhaa 41

Why most published research findings are false? 1. The smaller the studies conducted in a scientific field, the less likely the research findings are to be true. 2. The smaller the effect sizes in a scientific field, the less likely the research findings are to be true. 3. The greater the number and the lesser the selection of tested relationships in a scientific field, the less likely the research findings are to be true. 4. The greater the flexibility in designs, definitions, outcomes, and analytical modes in a scientific field, the less likely the research findings are to be true. 5. The greater the financial and other interests and prejudices in a scientific field, the less likely the research findings are to be true. 6. The hotter a scientific field (with more scientific teams involved), the less likely the research findings are to be true. Ioannidis JPA. Why most published research findings are false. PLOS Medicine 2005;2:e124.

Ratkaisuja eettisiin ongelmiin? - Enemmän tilastotieteen opetusta? - Enemmän ohjeita? - Ryhmätyö ja verkostoituminen? - Tutkimusten rekisteröinti? - Julkisesti saatavilla olevat aineistot? - Sensitiivisyysanalyysit?

Kirjallisuutta Altman DG. Statistics and ethics in medical research. Misuse of statistics is unethical. Br Med J 1980; 281: 1182 4. Blackford JU. Leveraging statistical methods to improve validity and reproducibility of research findings. JAMA Psychiatry. 2017 Feb 1;74(2):119-120. DeMets DL. Statistics and ethics in medical research. Science and Engineering Ethics 1999; 5:97-117. Easterbrook PJ, et al. Publication bias in clinical research. Lancet 1991; 337:867 72. Gardenier J & Resnik D. The misuse of statistics: concepts, tools, and a research agenda. Accountability in Research: Policies and Quality Assurance 2002; 9:65-74. Greenland S, et al. Statistical tests, p-values, confidence intervals, and power: a guide to misinterpretations. Draft 1 Mar 2016. Ioannidis JPA. Why most published research findings are false. PLOS Medicine 2005;2:e124. Lang T. Twenty statistical errors even you can find in biomedical research articles. Croatian Med J 2004; 45:361-70. 44

Kirjallisuutta Mark DB, et al. Understanding the role of p values and hypothesis tests in clinical research. JAMA Cardiol. 2016; 1(9):1048-1054. Moher D, et al. CONSORT 2010 explanation and elaboration: updated guidelines for reporting parallel group randomised trials. BMJ 2010; 340:c869. Osborne JW & Waters E. Four assumptions of multiple regression that researchers should always test. Practical Assessment, Research, and Evaluation 2002: 8 (available online). Palmer CR. Ethics and statistical methodology in clinical trials. J Med Ethics 1993; 19:219-22. Suresh KP & Chandrashekara S. Sample size estimation and power analysis for clinical research studies. J Hum Reprod Sci 2012; 5: 7 13. Wasserstein RL & Lazar NA. The ASA s statement on p-values: context, process and purpose. DOI: 10.1080/00031305.2016.1154108 jouko.miettunen@oulu.fi 45