Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk 25.8.2011



Samankaltaiset tiedostot
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

ARVIOINTIPERIAATTEET

HAVAITUT JA ODOTETUT FREKVENSSIT

Aineistokoko ja voima-analyysi

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

Testejä suhdeasteikollisille muuttujille

KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen

Kandidaatintutkielman aineistonhankinta ja analyysi

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Harjoitus 7: NCSS - Tilastollinen analyysi

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Sovellettu todennäköisyyslaskenta B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Testit järjestysasteikollisille muuttujille

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Kvantitatiiviset tutkimusmenetelmät maantieteessä

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastotieteen aihehakemisto

Kvantitatiiviset menetelmät

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Testit laatueroasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Kvantitatiiviset menetelmät

Väliestimointi (jatkoa) Heliövaara 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Hypoteesin testaus Alkeet

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ ESIPUHE...III ESIPUHE KIRJAN TOISEEN PAINOKSEEN... VIII SISÄLLYSLUETTELO...

10. laskuharjoituskierros, vko 14, ratkaisut

Yleistetyistä lineaarisista malleista

Otoskoon arviointi. Tero Vahlberg

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

TILASTOLLINEN LAADUNVALVONTA

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

1. Tilastollinen malli??

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Hoitotyön henkilöstövoimavarojen hallinnan mallintaminen kansallisesti yhtenäisillä tunnusluvuilla

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

KAHDEN RYHMÄN VERTAILU

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tutkimusaineiston luominen

Sovellettu todennäköisyyslaskenta B

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Sovellettu todennäköisyyslaskenta B

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Ohjeita kvantitatiiviseen tutkimukseen

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Tilastollisia peruskäsitteitä ja Monte Carlo

pisteet Frekvenssi frekvenssi Yhteensä

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ

Mat Sovellettu todennäköisyyslasku A

Todennäköisyyden ominaisuuksia

11. laskuharjoituskierros, vko 15, ratkaisut

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

TUTKIMUSOPAS. SPSS-opas

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Transkriptio:

Tutkimuksen suunnittelu / tilastolliset menetelmät Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk 25.8.2011

Kvantitatiivisen tutkimuksen vaiheet Suunnittelu Datan keruu Aineiston analysointi Raportointi, tulosten tulkinta 2

Tutkimuksen suunnittelu Tutkimusongelma(t) Koeasetelma ja datan keruu Aineiston koko, voimalaskelmat, kato yms. Tilastolliset menetelmät Hyvin suunniteltu puoleksi tehty 3

Tutkimusongelma(t) Eksploratiivinen / konfirmatorinen Kohdepopulaatio Tutkimusmuuttujat: ensi- ja toissijaiset 4

Koeasetelma Poikkileikkaus- vai pitkittäisaineisto Satunnaisotos vai kohortti Tapaus-verrokki-tutkimukset, mätsäys? Valintaan vaikuttaa monesti käytännön ja taloudelliset resurssit sekä koeasetelman tehokkuus Pidä mahdollisimman yksinkertaisena 5

Voimalaskelmat Aina riippuvaisia tilastollisesta menetelmästä Yleisiä käsitteitä: voima (suositus: 80-95 %), merkitsevyystaso (yleisesti 0.05), eron suuruus, havaintomäärä Edellisistä voidaan laskea jokin, kun muut tiedetään tai on kiinnitetty 6

Voimalaskelmat, esimerkkejä >?power.prop.test starting httpd help server... done > power.prop.test(p1=.20, p2=.25, power=.8) Two-sample comparison of proportions power calculation n = 1093.739 p1 = 0.2 p2 = 0.25 sig.level = 0.05 power = 0.8 alternative = two.sided NOTE: n is number in *each* group 7

Voimalaskelmat, esimerkkejä > power.prop.test(p1=.4, p2=.8, power=.95) Two-sample comparison of proportions power calculation n = 35.94604 p1 = 0.4 p2 = 0.8 sig.level = 0.05 power = 0.95 alternative = two.sided NOTE: n is number in *each* group 8

Voimalaskelmat, esimerkkejä >?power.t.test > power.t.test(delta=.5, power=.8) Two-sample t test power calculation n = 63.76576 delta = 0.5 sd = 1 sig.level = 0.05 power = 0.8 alternative = two.sided NOTE: n is number in *each* group 9

Voimalaskelmat, esimerkkejä Jotta havaittaisiin korrelaation 0.3 (0.2) ero nollasta 80 % voimakkuudella, tarvittaisiin 85 (194) havaintoa. Mikäli voimakkuudeksi halutaan 95 %, on vastaava havaintomäärä 139 (320). 10

Muita otoskokolaskelmia Voidaan myös laskea paljonko tarvitaan dataa tietyn tunnusluvun mittaamiseksi tietyllä tarkkuudella Esimerkiksi suhteellisen osuuden normaaliapproksimaatioon perustuva hajonta on sqrt(p*(1-p)/n). Mikäli hajonnaksi haluttaisiin enintään luku a, pitäisi olla n > p*(1-p)/a^2. Eli esim. 10 %:in 1 %:n hajonnalla (95 % CI: 8-12 %) tarvittaisiin havaintoja 900. 100 havainnolla saadaan 50 %:n hajonnaksi 5 % (95 % CI: 40-60 %) 11

Kato puuttuvat havainnot 12

Aineiston analysointi Kuvailu: kuvat, tunnusluvut, luottamusvälit Luottamusväli on aina kiinteästi yhteyksissä tunnuslukuun 95 % luottamusväli on yleisesti käytetyin Tulkinta: ko. tunnusluku on tällä välillä 95 %:n varmuudella Tilastolliset menetelmät ja mallinnus Hypoteesien testaaminen, p-arvot 13

Tilastollisen testauksen perusidea Hypoteesit nollahypoteesi (H 0 ) ja vastahypoteesi (H 1 ) Testisuure ja sen jakauma testiin liittyy yleensä testisuure, jonka jakauma tiedetään ja jonka avulla p-arvo lasketaan P-arvo on aina välillä [0,1] suuri p-arvo tukee nollahypoteesia ja päinvastoin pieni tukee vastahypoteesia tilastollisen merkitsevyyden rajana pidetään useasti lukua 0.05 14

P-arvo On paljolti riippuvainen aineiston koosta Pieni p-arvo ei välttämättä tarkoita, että tulos olisi kliinisesti merkitsevä Vastaavasti suuri p-arvo ei välttämättä tarkoita, etteikö esim. yhteyttä muuttujien välillä voisi olla Testien lisäksi on tästä syystä hyvä käyttää myös asianmukaisia tunnuslukuja ja mahdollisesti myös niiden luottamusvälejä. Ne kuvaavat dataa paremmin kuin mikään testi. 15

Tilastollisen menetelmän/testin valinta Menetelmän valintaan vaikuttavia asioita: Muuttujien mitta-asteikot (luokittelu- / järjestys- / välimatka- / suhdeasteikko) Menetelmän oletukset (normaalisuus, lineaarisuus, riippumattomuus, ) 16

Tilastolliset menetelmät: kahden muuttujan välinen yhteys Molemmat luokitteluasteikollisia: khii-toiseen testi, Fisherin testi, suhteellisten osuuksien testi, McNemarin testi Luokittelu- ja järjestysasteikollinen: Mann-Whitney, Wilcoxon, Kruskal-Wallis, Friedman Luokittelu- ja välimatka-asteikollinen: t-testit, varianssianalyysi, toistomittaus-anova / sekamallit Molemmat järjestysasteikollisia: Spearmanin korrelaatio Molemmat välimatka-asteikollisia: Pearsonin korrelaatio, lineaarinen regressio 17

Yleiset/yleistetyt lineaariset mallit Yleiset lineaariset mallit jatkuville selittäjille: varianssianalyysi, regressioanalyysi, kovarianssianalyysi Logistinen regressio binääriselle vasteelle Poisson-regressio lukumäärämuuttujille Yleiset/yleistetyt lineaariset sekamallit toistomittauksille ja erilaisten korrelaatiorakenteiden mallittamiseen 18

Erikoisempia malleja erityistilanteisiin Kaplan-Meier-menetelmä ja Coxin regressio elinaijan mallittamiseen ROC-analyysi testin hyvyyden mittaamiseen Aikasarja-analyysin menetelmät Faktorianalyysi, klusterianalayysi, Bayes-menetelmät frekventististen sijaan Boostrap otoksen jakauman käyttäminen 19

Ongelmatilanteita Puutteellinen suunnittelu, joka pahimmillaan aiheuttaa esim. sen, ettei haluttuun ongelmaan / kysymykseen saada vastausta Liian vähän dataa Jokin oleellinen muuttuja aineiston riippuvuusrakenteen kannalta puuttuu Käytetyn mallin oletukset epärealistisia Liian monimutkainen tutkimusasetelma 20