Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto
Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen Haitat Tuo mukanaan otantavirheen Suuruus on matemaattisesti arvioitavissa Tekee tilastotieteen tarpeelliseksi Otanta on AINOA MAHDOLLISUUS
Tavoitteena yleistäminen vasta sitten kiinnostaa laajasti Tilastotiede tekee tämän mahdolliseksi Tulosten kuvaus Kuinka tarkkoja havaintomme ovat? Päätösten teko testaus Mihin jakauman kohtaan saatu testisuureen arvo asettuu? Yleistämisen vuoksi operoidaan testisuureilla, ei varsinaisilla havaintoarvoilla Estimointi tulosten käyttämiseen päätöksenteossa Lasketaan luottamusvälejä Syy-seuraus suhteen todistaminen Tulokset harhattomia
Tutkimusasetelmat - oikea asetelma oikeaan paikkaan - älä vain toista itseäsi
Tutkimusasetelmat Havainnoivat tutkimukset Tapausselostus Potilassarjat Poikkileikkaustutkimus Ekologinen tutkimus Tapaus-verrokkitutkimus Altistuslähtöinen tutkimus
Tutkimusasetelmat Kokeelliset asetelmat Rinnakkaistutkimus Satunnaistetut ja satunnaistamattomat Sokkoutetut ja sokkouttamattomat Factorial design Cross-over trial Sequential trial
Tutkimusnäyttö Järjestys 1. Havainnoivat asetelmat 2. Kliininen koe Tapaus-verrokki Kohorttitutkimus 3. Kokeellinen asetelma Paras näyttö
Havainnoivat tutkimukset Edut Helppoja tehdä Halpa ei aina Hyviä hypoteesien tuottoon Joitakin asioita voidaan tutkia vain näillä Haitat Harhaisten virheiden hallinta vaikeata Tulosten luotettavuus Eivät sovi hypoteesien testaamiseen
Ekologiset tutkimukset Analyysi yhdistetystä datasta yksilöitä ei tunnisteta Halpa, helppo tehdä, harhojen kontrollointi vaikeata
Tautilähtöinen tutkimus Vertailu altistuneiden määrien välillä Altistuneet Altistumattomat Altistuneet Altistumattomat Sairaat Tapaukset Terveet Kontrollit Tuloksena vetosuhde (odds ratio) arvio suhteellisesta riskistä
Altistuslähtöinen tutkimus Altistuneet Altistumattomat Sairastuneet Terveenä pysyneet Sairastuneet Terveenä pysyneet Vertailu sairastuneiden määrien välillä Tuloksena todellinen suhteellinen riski
Kliiniset kokeet Edut Hyviä hypoteesien testaamiseen Harhojen hallinta helppoa tulokset luotettavia Systemaattiset virheet voi muuttaa satunnaisvirheiksi satunnaistamalla Haitat Kalliita Teho elävässä elämässä alhaisempi Kaikkea ei voi tutkia kliinisellä kokeella
Hoitotutkimus Tutkimukseen sopivat Tutkimukseen tulleet Hoito A Satunnaistaminen Seuranta Hoito B Satunnaistamisen jälkeen aina omassa ryhmässään Tilastomenetelmä päättötapahtuman mukaan Hoidosta hyötyneet Ei hyötyä hoidosta Hoidosta hyötyneet Ei hyötyä hoidosta Vertailu vain hoidon loputtua kaikkien satunnaistettujen välillä
Factorial design Voi käyttää, jos hoidot toisistaan riippumattomia
Sequential trial - Otoskokoa ei ole määrätty
Parhaan asetelman valinta Valinnan pitäisi perustua Testattaviin hypoteeseihin Mihin halutaan vastaus Missä vaiheessa ollaan? Aloita helpolla asetelmalla Mihin uskoa? Yksi tutkimus harvoin riittävä evidenssi Jos asetelma havainnoiva enemmän tutkimuksia kuin kliinisissä kokeissa
Aineiston tunnusluvut
Tunnusluvuilla kuvataan aineistoa Aritmeettinen keskiarvo hyvä Tuttu, helppo ymmärtää Standardideviaatio Kuvaa hajontaa, ei edellytä jakaumalta mitään kertoo siitä Keskiarvon keskivirhe (standard error) Kuvaa otantavirhettä Laskuihin, testaukseen älä anna äläkä käytä hajonnan kuvaamiseen Mediaani vain yksi arvo, ei ole toistettavissa
Otoskoon arviointi - maksimoi hyötysuhteen - huomioidaan β-virhe
Otoskoon arviointi Miksi? Optimoidaan tutkittavien määrä Ei liikaa, jos ei tarvita Riittävästi, niin että ei eroa tulos olisi myös tärkeä Totuus erosta + - Tulos + - % β virhe 1-βpower α - virhe, P-arvo %
Satunnaistaminen Termit tunnettava Blokkisatunnaistaminen, permutoidut blokit Aina satunnaisesti kun mahdollista Ei-satunnaisjakoja Jako sairaalan, osaston mukaan Joka toinen, hoitotiimi Ryhmien välillä muitakin eroja kuin ryhmäjaon mukaan määräytyvä hoito!
Tilastolliset testit
Tilastomenetelmän valinta Mitta-asteikon merkitys * määrää datan käsittelyn * analyysit/vertailut asteikon mukaan * älä hukkaa tietoa keräysvaiheessa
Non-parametriset testit Jakaumaoletuksista vapaat (melkein) testit Chii-toiseen testi, spearman rankcorrelation testi Perustuvat rankingiin (järjestyspisteytykseen) Tarkastellaan ranking pisteiden jakaumia Tuloksena vain P-arvo
t-testi Parametrinen testi aineiston tulee olla vähintään välimatka-asteikollinen testi on robust Kahden otoksen keskiarvon testaamiseen Yhden otoksen keskiarvon poikkeavuus nollasta Vertailtavien aineistojen varianssien tulee olla yhtä suuria tätä ei koskaan tiedetä Perustuu t-jakaumaan ja hypoteettisten otoskeskiarvojen jakaumaan Gosset julkaisi nimimerkillä 1908 Otoskoon kasvaessa lähenee normaalijakaumaa
Monimuuttujamallinnukset Regressioanalyysi Selitetään välimatka-asteikollista muuttujaa Tavallisin yhteys jota haetaan lineaarinen Log-lineaarinen Selitetään moniluokkaista muuttujaa Logistinen malli Selitetään kaksiluokkaista muuttujaa Riittävästi havaintoyksiköitä (mielellään satoja) Hypoteesien tuottamiseen Mallinnusta ei voi testata siinä aineistossa, jossa se on tuotettu!
Mikä testi? Kaksi otosta Useita otoksia Mittaasteikko Riippuvat Yksi otos Riippuvat Riippumattomatomat Riippumattomat Luokitteleva SND-testi Khii-toiseen McNemarin testi SND-testi Khii-toiseen Fisher Cochran Q Khii-toiseen rxk Järjestys Merkkitesti Wilcoxon Mann- Whitney 2-suuntainen varianssi Varianssi analyysi Välimatka t-testi t-testi t-testi 2-suuntainen varianssi Varianssi
Mitä testaus kertoo?
Testauksen tulos Testituloksena testisuureen arvo Testisuure noudattaa vastaavaa jakaumaa Binomijakauma Poissonin jakauma t-jakauma jne Tähän jakaumaan perustuen saadaan todennäköisyys tällaiselle tai vielä enemmän poikkeavalle testisuureen arvolle nollahypoteesin ollessa totta Tämä on testauksen tuloksena saatu P-arvo
P-arvon tulkinta, lähtötilanne Asetetaan nollahypoteesi eroa ei ole nollahypoteesi jää voimaan tai hylätään Tulos Sovitaan kliinisesti merkittävä ero Virhetasot Päätetään virhetasot Tyypi I ja tyyppi II virhetaso
Tulos saatu, P-arvo alle hylkäystason Nollahypoteesi hylätään Tulos hoitovertailuissa todennäköistä, että hoidoissa on eroa P-arvo kertoo todetun tai enemmän poikkeavan tuloksen todennäköisyyden nollahypoteesin ollessa totta
P-arvo yli hylkäystason Nollahypoteesi jää voimaan Tulos hoitovertailuissa eroa hoitojen välillä ei voi varmistaa P-arvo yli sovitun hylkäystason, (yleensä P>0.05)
Tilastollinen testi Testaus ei kerro Eron suuruutta Mitä pienempi P-arvo # sitä isompi ero Havainnon biologista merkittävyyttä Virhettä väitettäessä eron puuttuvan Tämä huomioitava otoskoon laskussa Kuinka todennäköistä on, että tulos on selitettävissä sattumalla
Lopuksi Valitse analyysien tilastomenetelmät siten että saat mahdollisimman paljon informaatiota Parametriset testit Luottamusvälien ilmoittaminen Biostatistiikan tuntemus auttaa tutkijaa Oikein toteutetulle soveltamiselle substanssin tunteminen tärkeätä Tulisi tuntea kaikki, mitä käyttää Yleinen ongelma jo P-arvon tulkinta