Aineistokoko ja voima-analyysi



Samankaltaiset tiedostot
TUTKIMUSOPAS. SPSS-opas

Otoskoon arviointi. Tero Vahlberg

Kliininen arviointi ja kliininen tieto mikä riittää?

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Sovellettu todennäköisyyslaskenta B

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

HAVAITUT JA ODOTETUT FREKVENSSIT

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

ABHELSINKI UNIVERSITY OF TECHNOLOGY

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Otoskoko 107 kpl. a) 27 b) 2654

Väliestimointi (jatkoa) Heliövaara 1

Estimointi. Otantajakauma

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Harjoitus 7: NCSS - Tilastollinen analyysi

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Testit järjestysasteikollisille muuttujille

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Tilastollisia peruskäsitteitä ja Monte Carlo

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

031021P Tilastomatematiikka (5 op) viikko 5

Perusnäkymä yksisuuntaiseen ANOVAaan

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tutkimusasetelmat. - Oikea asetelma oikeaan paikkaan - Vaikeakin tutkimusongelma voi olla ratkaistavissa oikealla tutkimusasetelmalla

Matemaatikot ja tilastotieteilijät

Testejä suhdeasteikollisille muuttujille

Hypoteesin testaus Alkeet

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Mat Sovellettu todennäköisyyslasku A

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi

Mitä kalibrointitodistus kertoo?

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.

Testit laatueroasteikollisille muuttujille

Aki Taanila VARIANSSIANALYYSI

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

1. Tilastollinen malli??

5.7 Uskottavuusfunktioon perustuvia testejä II

Toimintaympäristö. Tulot Jenni Kallio

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

TyEL-kuolevuusperusteesta

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

5 Lisa materiaali. 5.1 Ristiintaulukointi

10. laskuharjoituskierros, vko 14, ratkaisut


Mittaustulosten tilastollinen käsittely

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Teema 9: Tilastollinen merkitsevyystestaus

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Ensimmäiset ikäindeksit laskettu berninpaimenkoirille

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Rakennusalan tarjouskilpailujen toteutus tasapuoliseksi: kokonaistaloudellisuuden arviointi hinta-laatu -menetelmällä.

ISÄNNÖINTIYRITYSTEN TALOUSBAROMETRI 2015

TILASTOLLINEN LAADUNVALVONTA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastotieteen jatkokurssi syksy 2003 Välikoe

Kvantitatiiviset menetelmät

Sovellettu todennäköisyyslaskenta B

Parametrin estimointi ja bootstrap-otanta

Tilastollinen aineisto Luottamusväli

Luottamusvälit. Normaalijakauma johnkin kohtaan

Transkriptio:

TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla voidaan ennen varsinaisen tutkimuksen aloittamista selvittää sopiva aineistomäärä tavoitteiden toteuttamiseksi. Vaikka tutkimuksella oltaisiinkin osoittamassa merkittävää ja lähes itsestään selvää eroa, liian pienellä aineistolla tämän eron osoittaminen ei onnistu. Isoilla aineistoilla lähes kaikki erot ovat tilastollisesti merkitseviä, mutta turhan suuren aineiston kerääminen ei ole ajallisesti ja taloudellisesti kannattavaa. Lisäksi on huomioitava eettinen näkökulma: osoitettaessa uuden hoitomuodon toimivuutta ylimääräisten potilaiden hoitaminen on turhaa. Useat lehdet vaativat voimalaskelmien raportointia tutkimuksen tuloksia julkaistaessa. Haettaessa tutkimukselle rahoitusta voimalaskelmilla voidaan osoittaa, että tutkijalla on käsitys, mitä on osoittamassa todeksi ja kuinka suurella aineistolla tämä tulee onnistumaan. Tässä oppaassa kuvataan, kuinka otoskoon määritys tehdään tyypillisimmässä lääketieteellisessä tutkimusasetelmassa. Tyypillisin tilanne on kahden ryhmän tutkimus, jossa on kyseessä joko keskiarvojen tai osuuksien vertailu. Toteutus Tutkimuksessa on yleensä aina nolla- ja vastahypoteesi. Nollahypoteesi on esimerkiksi muotoa: ryhmät eivät eroa toisistaan tai käsittelyllä ei ole vaikutusta. Vastahypoteesi on nollahypoteesin vastakohta: ryhmät eroavat toisistaan tai käsittelyllä on vaikutusta. Määritettäessä aineiston kokoa toteutus on yleensä samankaltainen. Valitaan tai oletetaan tutkimukseen p-arvo, voima (englanniksi power) ja efektin koko. Näiden tietojen avulla tietokone ratkaisee matemaattisen yhtälön, ja tuloksena saadaan otoskoko N. On tärkeää huomioida, että määritetty aineiston koko on arvio, joka pätee silloin kun oletukset toteutuvat. Käytännössä p-arvo tarkoittaa todennäköisyyttä, että nollahypoteesi on totta. Jos on havaittu pieni p-arvo, tapahtuman ryhmät eivät eroa toisistaan tai käsittelyllä ei ole vaikutusta todennäköisyys on pieni. Käsite voima tarkoittaa: mikäli on havaittu tilastollisesti merkitsevä p-arvo, niin todennäköisyydellä voima havaittu ero on todellinen. 1

Käytännössä tutkimuksen suunnitteluvaiheessa voiman voidaan ajatella olevan todennäköisyys sille, että saadaan tilastollisesti merkitsevä p-arvo. Lääketieteellisessä tutkimuksessa tutkitaan pääsääntöisesti keskiarvojen tai osuuksien eroja. Nämä on voitava olettaa. Osuuksien ollessa kyseessä oletetaan tutkimusryhmiin esimerkiksi parantuneiden osuudet, aikaisempi menetelmä parantaa tietyn prosenttiosuuden ja testattava menetelmä jonkin verran enemmän. Osoitettaessa keskiarvojen erojen olemassaoloa oletetaan ryhmiin keskiarvot ja yleensä yhteinen keskihajonta. Lisäksi kannattaa pohtia, onko kehitteillä oleva menetelmä kliinisesti merkitsevästi parempi kuin vanhempi menetelmä. Esimerkiksi kivun hoidossa voi olla, että koetun kivun on laskettava vähintään 20 %, jotta kivun alenemista voidaan pitää kliinisesti merkitsevänä. Näiden keskiarvojen tai osuuksien avulla lasketaan efektin koko. Efektin koon laskentaa ei tarvitse tehdä käytännössä, sillä laskentaohjelmat tekevät sen annettujen lukujen perusteella. Yleensä tutkimuksissa käytetään p-arvona lukemaa 0,05 ja voiman määränä lukemaa 0,80. Tutkimusta suunniteltaessa kannattaa varmistaa, ovatko nämä arvot nimenomaisen tieteenalan käytössä. Tehtäessä arvioita otoskoosta kannattaa kokeilla eri arvoja näille kahdelle parametrille, etenkin eri voimatasoja, ja katsoa, kuinka arvio aineistonkoosta muuttuu. Jos tutkimuksessa on useita tavoitteita, niin aineistokokolaskelmat on tehtävä kaikille lopputulosmuuttujille erikseen. Tutkimuksissa on yleensä aina myös katoa. Tämä on otettava huomioon päätettäessä aineiston koosta. Jos tipahtamisosuus on p, aineiston koon on oltava N /(1 p). Jos tipahtamisosuus olisi 30 %, tällöin aineiston koon olisi oltava noin 1,4-kertainen, jotta aineistokoko olisi riittävä aloitettaessa aineiston analysointia. Voimalaskelmia tehdään myös toiseen suuntaan tutkimuksessa saatujen tulosten perusteella. Tällä tarkoitetaan sitä, että tutkimuksessa saaduille tuloksille lasketaan voima. Tässä vaiheessa ovat tiedossa keskiarvot hajontoineen tai osuudet ja aineistonkoko. Näiden avulla on mahdollista laskea havaitun efektin voima. Voimaa ratkaistaessa kiinnitetään p-arvoksi yleensä lukema 0,05 ja syötetään otoskoko ja havaitut käsittelyvaikutukset. On tärkeää tehdä voiman laskenta sitä tilastomenetelmää vastaavalla menetelmällä, jolla tutkimuksen vertailutkin on tehty. Jos tutkimuksen keskiarvovertailut on tehty t-testillä, käytetään t-testin voimalaskuria. Jos tästä ratkaistu tutkimuksen tulosten voima on korkea, esimerkiksi yli 0,80, voidaan olla suhteellisen varmoja, että havaittu käsittelyvaikutus on todella olemassa. Tämä laskettu voima on hyvä raportoida julkaisun tulososiossa. Aineistokoko- ja voimalaskelmia varten löytyy netistä laskureita. Hakusanoina keskiarvojen tapauksissa toimii sample size calculator mean ja osuuksille sample size calculator proportion. Laskureista kannattaa valita sellainen, johon voi laittaa myös halutun voimatason. Paras tapa tehdä voimalaskelmia on käyttää yleisessä käytössä olevia ohjelmistoja, esimerkiksi R-ohjelmaa. Joissakin laskureissa on mahdollisuus säätää vastahypoteesi yksisuuntaiseksi, eli uudempi menetelmä on parempi kuin vanhempi. Tä- 2

mä muutos pienentää arviota otoskoosta. Kaksisuuntainen hypoteesi, eli käsittelyt eroavat toisistaan, on kuitenkin kaikista yleisin ja suositeltavin vaihtoehto. Esimerkkejä Esimerkki 1. Tutkitaan 80-vuotiaiden kuolleisuutta. Halutaan osoittaa, että sukupuolten välillä on eroa kuolleisuudessa. Oletetaan, että miehistä kuolee 33 % ja naisista 22 % seuraavan viiden vuoden kuluessa. Valitaan tutkimukseen p-arvoksi 0,05 ja käytetään voimatasona lukemia 0,80 ja 0,90. Näin olettaen vaaditut otoskoot per sukupuoli ovat 258 ja 345 kahdella eri voimatasolla. Kokemuksesta tiedetään, että seuranta-ajan päätyttyä elossaolotietoa ei ole saatavilla viidesosalta henkilöistä. Tämä tieto huomioiden saadaan otoskokoarvioiksi 323 ja 432. Voimatasolla 0,80 ja käyttäen p-arvoa 0,05 tulisi 80-vuotiaita miehiä olla mukana 323 ja naisia 323. Tutkimusta lähdettiin toteuttamaan suunnitelman mukaisesti eli 323 henkeä per sukupuoli. Viiden vuoden jälkeen tieto oli saatavissa 251 miehestä, joista oli kuollut 82 (32,7 %). Naisista tieto oli saatavilla 260:stä ja heistä oli kuollut 60 (23,1 %). Tilastollinen merkitsevyys tälle havaitulle osuuksien erolle on p=0,02 ja voima 0,68. Tutkimuksessa saatiin merkitsevä ero sukupuolten väliselle kuolleisuudelle, mutta voima jäi hieman tavoitetasoa alhaisemmaksi. Kuvassa 1 on esitetty, kuinka voima voidaan laskea nettilaskurilla. Linkki laskuriin: http://www.stat.ubc.ca/~rollin/stats/ssize/b2.html Kuva 1. Voiman laskeminen. Laskuriin on lisätty kuolleiden osuudet havaitusta aineistosta, p-arvoksi on valittu 0,05 ja keskiarvo on otettu ryhmäkooista. Näiden avulla on laskettu voima sukupuolten väliselle kuolleisuuden erolle. 3

Esimerkki 2. Synnytyssalissa on havaittu, että uudelleen synnyttäjien lapset ovat painavampia kuin ensisynnyttäjien lapset. Halutaan osoittaa tämä huomio todeksi. Oletetaan, että ensisynnyttäjien lapset painavat keskimäärin 3400 grammaa ja uudelleen synnyttäjien 3600 grammaa. Lisäksi oletetaan keskihajonnan olevan 500 grammaa per synnyttäjäryhmä. Valitaan tutkimuksen p-arvoksi 0,05 ja voimatasoksi 0,80. Lisäksi tiedetään, että 10 %:lta vastasyntyneistä ei saada mitattua painoa tutkimusprotokollan mukaisesti. Näiden oletusten vallitessa synnytyksiä tulee olla 99 per synnyttäjäryhmä. Huomioiden painon mittaustuloksen puute ensisynnytyksiä tulee olla 110 ja uudelleen synnyttäjiä 110. Kuvassa 2 on laskettu, kuinka otoskoon voi laskea tällaisessa tilanteessa. Linkki laskuriin: http://www.stat.ubc.ca/~rollin/stats/ssize/n2.html Kun ennalta määritetty otoskoko oli saavutettu, ensisynnyttäjien lapsia oli punnittu 98 ja uudelleen synnyttäjien lapsia 100. Ensisynnyttäjien lapset painoivat keskimäärin 3329 grammaa ja uudelleen synnyttäjien 3589 grammaa. Hajonta oli likimäärin 520 grammaa molemmissa ryhmissä. P-arvo tälle erolle oli p<0,001 ja voima 0,94. Tässä tutkimuksessa saatiin voimatasoksi korkea lukema, joten voidaan olla suhteellisen varmoja, että uudelleen synnyttäjien lapset ovat painavampia kuin ensisynnyttäjien. Kuva 2. Otoskoon laskeminen. Laskuriin on laitettu keskiarvot ja -hajonta, p-arvo ja voimataso. Kun nämä on syötetty, voidaan laskea otoskoko per ryhmä. 4

Lähteet Matthews D.E., Farewell V.T. (2007) Using and Understanding Medical Statistics. Sarna S. (2011) Kliinisen biostatistiikan peruskurssi. Tämän tutkimusoppaan on laatinut Tuomas Selander, biostatistikko, KYS Tiedepalvelukeskus, tuomas.selander (at) kuh.fi 5 KYS KYS Tiedepalvelukeskus Tiedepalvelukeskus 4/2014 4/2014