Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto



Samankaltaiset tiedostot
Tutkimusasetelmat. - Oikea asetelma oikeaan paikkaan - Vaikeakin tutkimusongelma voi olla ratkaistavissa oikealla tutkimusasetelmalla

Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta?

Matemaatikot ja tilastotieteilijät

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Harjoitus 7: NCSS - Tilastollinen analyysi

Testit järjestysasteikollisille muuttujille

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Väliestimointi (jatkoa) Heliövaara 1

Tilastollinen aineisto Luottamusväli

Mitä on näyttö vaikuttavuudesta. Matti Rautalahti Suomalainen Lääkäriseura Duodecim

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Sovellettu todennäköisyyslaskenta B

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

HAVAITUT JA ODOTETUT FREKVENSSIT

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastotieteen jatkokurssi syksy 2003 Välikoe

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

031021P Tilastomatematiikka (5 op) viikko 5

Teema 8: Parametrien estimointi ja luottamusvälit

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Otoskoon arviointi. Tero Vahlberg

Tilastotieteen aihehakemisto

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kliininen arviointi ja kliininen tieto mikä riittää?

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

10. laskuharjoituskierros, vko 14, ratkaisut

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

tilastotieteen kertaus

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

Estimointi. Otantajakauma

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Osa 2: Otokset, otosjakaumat ja estimointi

Tutkimustiedonhallinnan peruskurssi

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Aineistokoko ja voima-analyysi

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Sovellettu todennäköisyyslaskenta B

Yleistetyistä lineaarisista malleista

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

1 TILASTOMENETELMIEN PERUSTEITA

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen

Mat Tilastollisen analyysin perusteet, kevät 2007

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Parametrin estimointi ja bootstrap-otanta

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Transkriptio:

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen Haitat Tuo mukanaan otantavirheen Suuruus on matemaattisesti arvioitavissa Tekee tilastotieteen tarpeelliseksi Otanta on AINOA MAHDOLLISUUS

Tavoitteena yleistäminen vasta sitten kiinnostaa laajasti Tilastotiede tekee tämän mahdolliseksi Tulosten kuvaus Kuinka tarkkoja havaintomme ovat? Päätösten teko testaus Mihin jakauman kohtaan saatu testisuureen arvo asettuu? Yleistämisen vuoksi operoidaan testisuureilla, ei varsinaisilla havaintoarvoilla Estimointi tulosten käyttämiseen päätöksenteossa Lasketaan luottamusvälejä Syy-seuraus suhteen todistaminen Tulokset harhattomia

Tutkimusasetelmat - oikea asetelma oikeaan paikkaan - älä vain toista itseäsi

Tutkimusasetelmat Havainnoivat tutkimukset Tapausselostus Potilassarjat Poikkileikkaustutkimus Ekologinen tutkimus Tapaus-verrokkitutkimus Altistuslähtöinen tutkimus

Tutkimusasetelmat Kokeelliset asetelmat Rinnakkaistutkimus Satunnaistetut ja satunnaistamattomat Sokkoutetut ja sokkouttamattomat Factorial design Cross-over trial Sequential trial

Tutkimusnäyttö Järjestys 1. Havainnoivat asetelmat 2. Kliininen koe Tapaus-verrokki Kohorttitutkimus 3. Kokeellinen asetelma Paras näyttö

Havainnoivat tutkimukset Edut Helppoja tehdä Halpa ei aina Hyviä hypoteesien tuottoon Joitakin asioita voidaan tutkia vain näillä Haitat Harhaisten virheiden hallinta vaikeata Tulosten luotettavuus Eivät sovi hypoteesien testaamiseen

Ekologiset tutkimukset Analyysi yhdistetystä datasta yksilöitä ei tunnisteta Halpa, helppo tehdä, harhojen kontrollointi vaikeata

Tautilähtöinen tutkimus Vertailu altistuneiden määrien välillä Altistuneet Altistumattomat Altistuneet Altistumattomat Sairaat Tapaukset Terveet Kontrollit Tuloksena vetosuhde (odds ratio) arvio suhteellisesta riskistä

Altistuslähtöinen tutkimus Altistuneet Altistumattomat Sairastuneet Terveenä pysyneet Sairastuneet Terveenä pysyneet Vertailu sairastuneiden määrien välillä Tuloksena todellinen suhteellinen riski

Kliiniset kokeet Edut Hyviä hypoteesien testaamiseen Harhojen hallinta helppoa tulokset luotettavia Systemaattiset virheet voi muuttaa satunnaisvirheiksi satunnaistamalla Haitat Kalliita Teho elävässä elämässä alhaisempi Kaikkea ei voi tutkia kliinisellä kokeella

Hoitotutkimus Tutkimukseen sopivat Tutkimukseen tulleet Hoito A Satunnaistaminen Seuranta Hoito B Satunnaistamisen jälkeen aina omassa ryhmässään Tilastomenetelmä päättötapahtuman mukaan Hoidosta hyötyneet Ei hyötyä hoidosta Hoidosta hyötyneet Ei hyötyä hoidosta Vertailu vain hoidon loputtua kaikkien satunnaistettujen välillä

Factorial design Voi käyttää, jos hoidot toisistaan riippumattomia

Sequential trial - Otoskokoa ei ole määrätty

Parhaan asetelman valinta Valinnan pitäisi perustua Testattaviin hypoteeseihin Mihin halutaan vastaus Missä vaiheessa ollaan? Aloita helpolla asetelmalla Mihin uskoa? Yksi tutkimus harvoin riittävä evidenssi Jos asetelma havainnoiva enemmän tutkimuksia kuin kliinisissä kokeissa

Aineiston tunnusluvut

Tunnusluvuilla kuvataan aineistoa Aritmeettinen keskiarvo hyvä Tuttu, helppo ymmärtää Standardideviaatio Kuvaa hajontaa, ei edellytä jakaumalta mitään kertoo siitä Keskiarvon keskivirhe (standard error) Kuvaa otantavirhettä Laskuihin, testaukseen älä anna äläkä käytä hajonnan kuvaamiseen Mediaani vain yksi arvo, ei ole toistettavissa

Otoskoon arviointi - maksimoi hyötysuhteen - huomioidaan β-virhe

Otoskoon arviointi Miksi? Optimoidaan tutkittavien määrä Ei liikaa, jos ei tarvita Riittävästi, niin että ei eroa tulos olisi myös tärkeä Totuus erosta + - Tulos + - % β virhe 1-βpower α - virhe, P-arvo %

Satunnaistaminen Termit tunnettava Blokkisatunnaistaminen, permutoidut blokit Aina satunnaisesti kun mahdollista Ei-satunnaisjakoja Jako sairaalan, osaston mukaan Joka toinen, hoitotiimi Ryhmien välillä muitakin eroja kuin ryhmäjaon mukaan määräytyvä hoito!

Tilastolliset testit

Tilastomenetelmän valinta Mitta-asteikon merkitys * määrää datan käsittelyn * analyysit/vertailut asteikon mukaan * älä hukkaa tietoa keräysvaiheessa

Non-parametriset testit Jakaumaoletuksista vapaat (melkein) testit Chii-toiseen testi, spearman rankcorrelation testi Perustuvat rankingiin (järjestyspisteytykseen) Tarkastellaan ranking pisteiden jakaumia Tuloksena vain P-arvo

t-testi Parametrinen testi aineiston tulee olla vähintään välimatka-asteikollinen testi on robust Kahden otoksen keskiarvon testaamiseen Yhden otoksen keskiarvon poikkeavuus nollasta Vertailtavien aineistojen varianssien tulee olla yhtä suuria tätä ei koskaan tiedetä Perustuu t-jakaumaan ja hypoteettisten otoskeskiarvojen jakaumaan Gosset julkaisi nimimerkillä 1908 Otoskoon kasvaessa lähenee normaalijakaumaa

Monimuuttujamallinnukset Regressioanalyysi Selitetään välimatka-asteikollista muuttujaa Tavallisin yhteys jota haetaan lineaarinen Log-lineaarinen Selitetään moniluokkaista muuttujaa Logistinen malli Selitetään kaksiluokkaista muuttujaa Riittävästi havaintoyksiköitä (mielellään satoja) Hypoteesien tuottamiseen Mallinnusta ei voi testata siinä aineistossa, jossa se on tuotettu!

Mikä testi? Kaksi otosta Useita otoksia Mittaasteikko Riippuvat Yksi otos Riippuvat Riippumattomatomat Riippumattomat Luokitteleva SND-testi Khii-toiseen McNemarin testi SND-testi Khii-toiseen Fisher Cochran Q Khii-toiseen rxk Järjestys Merkkitesti Wilcoxon Mann- Whitney 2-suuntainen varianssi Varianssi analyysi Välimatka t-testi t-testi t-testi 2-suuntainen varianssi Varianssi

Mitä testaus kertoo?

Testauksen tulos Testituloksena testisuureen arvo Testisuure noudattaa vastaavaa jakaumaa Binomijakauma Poissonin jakauma t-jakauma jne Tähän jakaumaan perustuen saadaan todennäköisyys tällaiselle tai vielä enemmän poikkeavalle testisuureen arvolle nollahypoteesin ollessa totta Tämä on testauksen tuloksena saatu P-arvo

P-arvon tulkinta, lähtötilanne Asetetaan nollahypoteesi eroa ei ole nollahypoteesi jää voimaan tai hylätään Tulos Sovitaan kliinisesti merkittävä ero Virhetasot Päätetään virhetasot Tyypi I ja tyyppi II virhetaso

Tulos saatu, P-arvo alle hylkäystason Nollahypoteesi hylätään Tulos hoitovertailuissa todennäköistä, että hoidoissa on eroa P-arvo kertoo todetun tai enemmän poikkeavan tuloksen todennäköisyyden nollahypoteesin ollessa totta

P-arvo yli hylkäystason Nollahypoteesi jää voimaan Tulos hoitovertailuissa eroa hoitojen välillä ei voi varmistaa P-arvo yli sovitun hylkäystason, (yleensä P>0.05)

Tilastollinen testi Testaus ei kerro Eron suuruutta Mitä pienempi P-arvo # sitä isompi ero Havainnon biologista merkittävyyttä Virhettä väitettäessä eron puuttuvan Tämä huomioitava otoskoon laskussa Kuinka todennäköistä on, että tulos on selitettävissä sattumalla

Lopuksi Valitse analyysien tilastomenetelmät siten että saat mahdollisimman paljon informaatiota Parametriset testit Luottamusvälien ilmoittaminen Biostatistiikan tuntemus auttaa tutkijaa Oikein toteutetulle soveltamiselle substanssin tunteminen tärkeätä Tulisi tuntea kaikki, mitä käyttää Yleinen ongelma jo P-arvon tulkinta