Otoskoon arviointi. Tero Vahlberg

Samankaltaiset tiedostot
Aineistokoko ja voima-analyysi

Väliestimointi (jatkoa) Heliövaara 1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Sovellettu todennäköisyyslaskenta B

Estimointi. Otantajakauma

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Kliininen arviointi ja kliininen tieto mikä riittää?

ABHELSINKI UNIVERSITY OF TECHNOLOGY

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Teema 9: Tilastollinen merkitsevyystestaus

Testejä suhdeasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Testit laatueroasteikollisille muuttujille

2. Keskiarvojen vartailua

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tilastollisia peruskäsitteitä ja Monte Carlo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Perusnäkymä yksisuuntaiseen ANOVAaan

10. laskuharjoituskierros, vko 14, ratkaisut

031021P Tilastomatematiikka (5 op) viikko 5

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Estimointi. Vilkkumaa / Kuusinen 1

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Mat Sovellettu todennäköisyyslasku A

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Matemaatikot ja tilastotieteilijät

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

2. TILASTOLLINEN TESTAAMINEN...

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Otoskoko 107 kpl. a) 27 b) 2654

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Sovellettu todennäköisyyslaskenta B

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta?

NÄYTÖN ARVIOINTI: SYSTEMAATTINEN KIRJALLISUUSKATSAUS JA META-ANALYYSI. EHL Starck Susanna & EHL Palo Katri Vaasan kaupunki 22.9.

9. laskuharjoituskierros, vko 12-13, ratkaisut

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Parametrin estimointi ja bootstrap-otanta

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

voidaan hylätä, pienempi vai suurempi kuin 1 %?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden ominaisuuksia

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

tilastotieteen kertaus

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

MTTTP5, luento Luottamusväli, määritelmä

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Sovellettu todennäköisyyslaskenta B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Transkriptio:

Otoskoon arviointi Tero Vahlberg

Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä Otoskokolaskelmat tulisi esittää jokaisessa hyvin tehdyssä tutkimussuunnitelmassa. Otoskokolaskelmat kertovat, että tutkijalla tai tutkimusryhmällä on ennen aineiston keräämistä selkeä käsitys, mitä tutkimushypoteesia (tutkimushypoteeseja) ollaan tutkimassa. Myös monet lehdet vaativat näitä laskelmia. Otoskoon on oltava riittävän suuri, jotta kliinisesti merkittävä ero pystytään suurella todennäköisyydellä havaitsemaan Suurilla aineistoilla kliinisesti hyvin pienetkin erot tulevat usein tilastollisesti merkitseviksi, koska tutkimuksen voima on niin suuri (estimaattien keskivirheet pienenevät ja tarkkuus paranee, jolloin estimaattien luottamusvälit ovat pieniä). Liian suuren potilasmäärän kerääminen ei ole taloudellisesti ja ajallisesti järkevää. Lisäksi se voi olla epäeettistä, jos tutkitaan uutta hoitomuotoa. Pienillä aineistoilla kliinisesti suuriakaan eroja ei kyetä havaitsemaan tilastollisesti merkitseviksi, koska tutkimuksen voima on niin pieni (estimaattien keskivirheet ovat suuret, jolloin estimaattien luottamusvälit ovat suuria) Liian pienen potilasmäärän kerääminen on tutkimusresurssien tuhlaamista. Sekin voi olla epäeettistä, jos altistetaan potilaat turhaan uudelle hoitomuodolle.

Laskelmat tehdään yleensä yhden tai muutaman tärkeimmän vastemuuttujan (primary outcomes) mukaan. Eri vastemuuttujille saadaan erilainen vaatimus aineiston koosta. Usein näistä valitaan suurin otoskokovaatimus. Tarvittavan otoskoon määrittämiseen on olemassa laskentakaavoja, taulukkokokoelmia ja tilasto-ohjelmistoja esim. tilasto-ohjelmistot SAS, NQuery, JMP ja R. esim. Prof. S. Sarnan Excel-pohjaiset laskukaavat osoitteessa: http://www.kttl.helsinki.fi/sarna/stats/aineistokoko/ Otoskoon arvioinnissa on käytännössä hyvä tehdä laskelmia useammille vaihtoehtoisille tilanteille, jotta eri tekijöiden vaikutus otoskokoon hahmottuu Otoskokoa arvioitaessa on huomioitava kadon arviointi. Jos esim. oletetaan katoa tulevan 0%, niin tarvittava otoskoko on N / (1-0.) (=1.5-kertainen aineiston koko) Otoskokolaskelmat ovat tärkeitä, mutta käytännössä ne toimivat kuitenkin vain yleisenä ohjenuorana tehtäessä päätöstä kerättävän aineiston koosta Lopullisen aineistokoon valintaan vaikuttavat otoskokolaskelmien lisäksi myös potilaiden saatavuus sekä eettiset, taloudelliset resurssit, käytettävissä oleva ja käytännölliset syyt 3

Määritelmiä Hylkäämisvirhe (väärän positiivisen tuloksen riski), tyypin I virhe, α-virhe, p-arvo: Testin perusteella todetaan, että eroa on eli hylätään nollahypoteesi, vaikka todellisuudessa eroa ei ole Hyväksymisvirhe (väärän negatiivisen tuloksen riski), tyypin II virhe, β-virhe: Testin perusteella todetaan, että eroa ei ole eli hyväksytään nollahypoteesi, vaikka todellisuudessa eroa on Tutkimuksen (testin) voima 1- β (= havaitaan testin perusteella ero, joka on myös todellinen ero) määritellään tutkimuksen otoskokoa laskettaessa eroa totuus erosta eroa ei ole testin tulos erosta eroa on eroa ei ole ei virhettä 1-β (=voima) tyypin II virhe β-virhe tyypin I virhe α-virhe ei virhettä 4

Kysymyksiä otoskoon laskemista varten: 1. Mikä on kokeen päätarkoitus? Määritellään tutkimushypoteesi.. Mikä on keskeisin vastemuuttuja? 3. Mitä tilastollista analyysimenetelmää käytetään eron testaamiseksi? 4. Millaisia keskimääräisiä tuloksia on ennakoitavissa standardikäsittelyllä (eli millaisia tuloksia oletetaan vertailuryhmässä)? 5. Mikä on pienin kliinisesti merkittävä ero, joka on tärkeätä paljastaa suurella varmuudella (=vaikutuksen suuruus eli effect size)? 6. Mikä on tutkijan sopivaksi katsoma tilastollinen merkitsevyystaso ja testin voima? 5

Tilastollinen merkitsevyystaso (p-arvo): Todennäköisyys, että hylätään nollahypoteesi, vaikka se on totta (tyypin I virhe) Välttämätön edellytys kliiniselle merkittävyydelle, mutta ei kerro mitään vaikutuksen suuruudesta Merkitään symbolilla α ja useimmiten käytetään arvoa 0.05 Päätetään, käytetäänkö yksi- vai kaksisuuntaista vaihtoehtoista hypoteesia Tutkimuksen/testin voima: Todennäköisyys, että olemassa oleva ero havaitaan eli nollahypoteesi hylätään, kun vaihtoehtoinen hypoteesi on tosi Merkitään symbolilla 1-β ja yleensä käytetään 80-90% voimaa 6

Esimerkki taulukosta, josta nähdään otoskoon laskentakaavoissa tarvittavan funktion f(α,β) arvoja valittujen virhetasojen mukaan: Tutkimuksen voimakkuus (1-β) 0.95 0.90 0.80 0.50 α 0.1 10.8 8.6 6..7 (tyypin 0.05 13.0 10.5 7.9 3.8 I virhe) 0.0 15.8 13.0 10.0 5.4 0.01 17.8 14.9 11.7 6.6 Funktion f arvon millä tahansa α:n ja β:n arvoilla voi määrittää standardoidun normaalijakauman mukaisesti (esim. taulukon avulla) seuraavan kaavan avulla: f, z 1 1 z 7

Esimerkkikuvia tutkimuksen voimaan vaikuttavista tekijöistä: Ryhmien potilasmäärän suhteiden vaikutus tutkimuksen voimaan Power Curves by Ratio of Group Sample Sizes Lähde: SAS Institute 8

Vastemuuttujan keskihajonnan vaikutus tutkimuksen voimaan Power Curves by Standard Deviation Power 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0. 0.1 0 0.5 1.5 1.0 0 0.5 1.0 1.5.0.5 Difference Between Means 5 Lähde: SAS Institute 9

Vastemuuttujan keskiarvoeron ja keskihajonnan vaikutus tutkimuksen voimaan Sensitivity Analysis 1.0 0.9 0.8 Power 0.7 0.6 0.5 0.4 0.3 0. 0.1 0 0 0 40 60 80 100 Sample Size Std Dev, Mean Diff 0.5, 0.6 1.0, 0.6 0.5, 0.8 1.0, 0.8 6 Lähde: SAS Institute 10

Kahden ryhmän suhteellisten osuuksien vertailu Kun halutaan vertailla kahden ryhmän suhteellisia osuuksia (prosentteja), tarvittava N (per ryhmä) voidaan laskea seuraavalla kaavalla: N 100 P P 100 P 1 P P P 1 f 1, Kaavassa P 1 on hoidon onnistumisen osuus prosentteina vertailuhoitoa saaneilla ja P uutta hoitoa saaneilla. Funktion f(α,β) arvo määräytyy valittujen virhetasojen perusteella. 11

Kahden ryhmän suhteellisten osuuksien vertailu, esimerkki: 1. Tutkimuksessa päätarkoituksena on selvittää, onko testilääkkeellä vaikutusta sydäninfarktin jälkeiseen kuolleisuuteen. Ensisijainen vastemuuttuja on kuolleisuus kahden vuoden kuluessa 3. Valitaan käytettäväksi tilastolliseksi testiksi χ testi. 4. Plasebo-käsittelyssä oletetaan noin 10% potilaista kuolevan kahden vuoden sisällä (P 1 ) 5. Jos testilääke vähentää kuolleisuutta puoleen (5%), eroa voidaan pitää kliinisesti merkittävänä (P ) 6. Käytetään 5% merkitsevyystasoa (-suuntainen testaus) ja 90% voimakkuutta (1-β) eli haluttu 5% ero käsittelyissä paljastuu 90% varmuudella N 10 = 577.5 potilasta/ryhmä 100 10 5100 5 10 5 900 475 5 0.05,0.10 10. 5 f 1

Esimerkki otoskoon laskemisesta SAS-ohjelmalla, suhteellisten osuuksien vertailu SAS-koodi: proc power; twosamplefreq test=pchi groupproportions = (.10.05) npergroup =. power = 0.80 0.90; run; SAS-tulostaulukot: Distribution Method Fixed Scenario Elements Asymptotic normal Normal approximation Group 1 Proportion 0.1 Group Proportion 0.05 Number of Sides Null Proportion Difference 0 Alpha 0.05 Index Computed N per Group Nominal Power Actual Power N per Group 1 0.8 0.801 435 0.9 0.900 58 13

Eri tekijöiden vaikutukset otoskokoihin, kahden ryhmän suhteellisten osuuksien vertailu: Otoskoot on laskettu SAS-ohjelmalla ja kerätty taulukkoon. Suhteellinen osuus % Alpha 1-beta (power) Plasebo Lääke N/ryhmä N 0.05 0.8 10 5 435 870 0.05 0.9 10 5 58 1164 0.05 0.8 10 7 1356 71 0.05 0.9 10 7 1814 368 0.05 0.8 0 10 199 398 0.05 0.9 0 10 66 53 0.05 0.8 0 5 76 15 0.05 0.9 0 5 101 0 14

Kahden ryhmän keskiarvon vertailu Kun halutaan vertailla kahden ryhmän keskiarvoja kahden otoksen t-testillä (ryhmillä sama hajonta) tarvittava N (per ryhmä) voidaan laskea seuraavalla kaavalla: N x SD x 1 f, x ) Kaavassa SD on vastemuuttujan keskihajonta (SD on vastemuuttujan varianssi) ja ( 1 on ryhmien keskiarvojen kliinisesti merkittävä erotus. Funktion f(α,β) arvo määräytyy valittujen virhetasojen perusteella. x 15

Kahden ryhmän keskiarvon vertailu, esimerkki: 1. Tutkimuksessa päätarkoituksena on selvittää, laskeeko uusi kolesteroliaineenvaihduntaan vaikuttava lääke kolesterolia. Ensisijainen vastemuuttuja on kokonaiskolesteroliarvon muutos 3 kk aikana 3. Valitaan käytettäväksi tilastolliseksi testiksi kahden otoksen t-testi 4. Plasebo-käsittelyn ei oleteta laskevan kolesterolia 5. Jos kolesteroli laskee testilääkkeen avulla 0.5 mmol/l, laskua voidaan pitää kliinisesti merkittävänä. Aiempien tutkimusten perusteella tiedetään, että kolesterolin keskihajonta tällaisessa potilasryhmässä on 1. mmol/l 6. Käytetään 5% merkitsevyystasoa (-suuntainen testaus) ja 90% voimakkuutta (0.5 mmol/l lasku paljastuu 90% varmuudella) N 1. mmol 0.5 mmol f.88 0.5 0.05,0.1 10. 5 = 11 potilasta/ryhmä 16

Esimerkki otoskoon laskemisesta SAS-ohjelmalla, kahden ryhmän keskiarvon vertailu SAS-koodi: proc power; twosamplemeans test=diff meandiff = 0.5 stddev = 1 1. 1.4 npergroup =. power = 0.80 0.90; run; SAS-tulostaulukot: Fixed Scenario Elements Distribution Normal Method Exact Mean Difference 0.5 Number of Sides Null Difference 0 Alpha 0.05 Index Computed N per Group Std Dev Nominal Power Actual Power N per Group 1 1.0 0.8 0.801 64 1.0 0.9 0.903 86 3 1. 0.8 0.803 9 4 1. 0.9 0.90 13 5 1.4 0.8 0.803 15 6 1.4 0.9 0.900 166 17

Eri tekijöiden vaikutukset otoskokoihin, kahden ryhmän keskiarvon vertailu: Otoskoot on laskettu SAS-ohjelmalla ja kerätty taulukkoon. Keskiarvo muutokselle Alpha 1-beta (power) Plasebo Lääke Ero Keskihajonta N/ryhmä N 0.05 0.8 0-0.5-0.5 1 64 18 0.05 0.9 0-0.5-0.5 1 86 17 0.05 0.8 0-0.5-0.5 1. 9 184 0.05 0.9 0-0.5-0.5 1. 13 46 0.05 0.8 0-0.5-0.5 1.4 15 50 0.05 0.9 0-0.5-0.5 1.4 166 33 0.05 0.8 0-0.3-0.3 1. 53 506 0.05 0.9 0-0.3-0.3 1. 338 676 0.05 0.8 0-1 -1 1. 4 48 0.05 0.9 0-1 -1 1. 3 64 18