Sisällysluettelo. Biostatistiikan kurssit 2000 i Sisällysluettelo
|
|
- Mauno Haavisto
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Sisällysluettelo Johdanto 1 Tilastollisten menetelmien käytöstä Oppikirjoista Ohjelmistoista Lääketieteellisten artikkelien laatu tilastollisesti tarkasteltuna. 5 Tutkimusprosessi Tilastollinen päättely Viitteet Kirjallisuutta Ohjelmia Tutkimustyypit ja -asetelmat 11 Kokeelliset tutkimukset Kokonaistutkimukset Otantatutkimukset Meta-analyysi Kirjallisuutta Aineistokoko ja tutkimuksen voima-analyysi 21 Johdanto Otoskoon määrittämiseen liittyvät avainkysymykset Yhden binomijakaumaa noudattavan suhdeluvun testaaminen 24 Kahden binomijakaumaa noudattavan suhdeluvun vertailu. 25 Kahden suhdeluvun ekvivalenttisuuden testaaminen Kvantitatiivinen lopputulos, kahden keskiarvon vertailu.. 31 Muita otoskoon laskentatilanteita Kommentteja Viitteet Kirjallisuutta Ohjelmia Satunnaistaminen ja sokkouttaminen 39 Yleistä Yksinkertainen (rajoittamaton) satunnaistaminen Korvaamismenettely Korttipakan sekoittamis -menettely Satunnaiset permutoidut lohkot Harhaisen kolikon menetelmä Ositettu satunnaistaminen ( stratified randomization ) Minimointimenettely Epäsymmetrisesti tasapainotetut menetelmät Lähtötason vertailut ja puutteet satunnaistamisessa Viitteet Biostatistiikan kurssit 2000 i Sisällysluettelo
2 Aineiston kerääminen ja sen alustava käsittely 51 Otantamenetelmiä Aineiston käsittely Keskiluvut Hajonnan mitat Jakauman vinous ja huipukkuus Jakauman normaalisuus Graafiset kuvaajat Viitteet Ohjelmia ja kirjallisuutta Luottamusväliestimointi 63 Yleistä Normaalijakaumaan perustuvat luottamusvälit Keskiarvon luottamusväli Keskiarvojen erotuksen luottamusväli Mediaanien ja muiden prosenttipisteiden luottamusvälit Mediaanien erotuksen luottamusväli Suhdeluvun luottamusväli (tarkka väli) Suhdelukujen erotuksen luottamusväli Lukumäärän luottamusvälit Lukumäärien suhteen luottamusväli Poisson-jakauman tapauksessa Luottamusvälit preferensseille Multinomijakaumaan perustuva luottamusväli Eksponenttijakaumaan perustuva luottamusväli Altistus- ja vaarasuhteen luottamusvälit Viitteet Ohjelmia Tilastollisten testien valinta ja toteuttaminen 81 Hypoteesien testaaminen Monivertailut Parametrinen ja ei-parametrinen testi P-arvon käyttöön liittyviä rajoitteita ja ongelmia Tilastollisten testien valintaperusteet Normaalisuuden testaaminen Varianssien homogeenisuustestit Permutaatiotesti riippuville otoksille Parittainen t-testi Wilcoxonin parittainen testi McNemarin testi Yleistetty McNemarin testi LR-testi siirtymätodennäköisyysmatriiseille Riippumattomien ryhmien t-testi Mann-Whitneyn U-testi Wilcoxonin järjestyslukujen summatesti Sisällysluettelo ii Seppo Sarna
3 Binomiaalisten suhdelukujen trenditesti χ 2 -nelikenttätesti Fisherin tarkka nelikenttätesti Fisherin kontingenssitaulutesti 2 k taulukoille Mantel-Haenszelin nelikenttätesti Kruskal-Wallisin yksisuuntainen varianssianalyysi Monivertailut - Dunnin testi Jonckheere-Terpstra trenditesti Friedmanin testi ja Pagen testi Kaksisuuntainen ei-parametrinen varianssianalyysi Eloonjäämiskäyrien vertailu Pearsonin korrelaatiokerroin Spearmanin järjestyskorrelaatiokerroin Kendallin Tau ja Somerin D Cohenin kappa ja painotettu kappa Kirjallisuutta Biostatistisia näkökohtia artikkelin kirjoittamisessa 127 Yleistä monimuuttujamenetelmistä 131 Monimuuttuja-analyysi: mistä siinä on kyse? Monimuuttujamenetelmien luokittelu Kirjallisuutta Lineaarinen monimuuttujaregressioanalyysi 135 Regression käsite Yksinkertainen lineaarinen regressio Regressiomallit ja niiden käyttö Analysointitavat Mihin olettamuksiin mallit perustuvat? Box Cox muunnos Residuaalien tulkinta Kuinka kertoimet tulkintaan? Standardoidut regressiokertoimet Neliösummat Mallin selitysaste Varianssianalyysitaulukko Multikollineaarisuus Residuaalien kvantitatiiviset analysointimenetelmät Puuttuvat havaintoarvot Regressioanalyysin yhteys erotteluanalyysiin Kirjallisuutta Varianssi- ja kovarianssianalyysi 151 Varianssianalyysin ongelma-asettelut Mallityypit Yksisuuntainen (parametrinen) varianssianalyysi Varianssien homogeenisuustestit Biostatistiikan kurssit 2000 iii Sisällysluettelo
4 Parittaiset vertailut Monivertailut (post-hoc -vertailut) Monivälitestit ( multiple range -testit) Kaksisuuntainen varianssianalyysi Toistomittausten varianssianalyysi Ristiintaulukkoanalyysit Laatueroasteikollinen R C-taulukko Yhteen suuntaan järjestetty R C-taulukko Kahteen suuntaan järjestetty R C-taulukko Viitteet Loglineaariset mallit 169 Käsitteitä Mallin parametrin skaalaus Yhteensopivuustestit Analysointivaiheet Esimerkkejä Viitteet Logistinen monimuuttujamalli 181 Logistinen malli Olettamuksista Sairastumisvaaran arviointi Mallin parametrien tulkinta Kerrointen merkitsevyyden testaaminen ja luottamusvälit. 186 Interaktion hallinta Sekoittavien tekijöiden hallinta Mallin valinta Muuttujien valintaongelmia Kirjallisuutta Eloonjäämisanalyysi 191 Väestöelinaikataulut ja -mallit Kohortti (seuranta-) eloonjäämisanalyysit Eloonjäämistaulut Kaplan-Meier -menetelmä Eloonjäämiskäyrien vertailu Parametriset mallit Coxin malli Kirjallisuutta Sanastoa 201 Englannista suomeen Sisällysluettelo iv Seppo Sarna
5 Johdanto Tilastollisten menetelmien käytöstä Tilastollisten menetelmien käyttö lääketieteellisissä julkaisuissa on erittäin yleistä. On arvioitu (Emerson & Colditz 1983), että noin kolmessa neljästä julkaistusta tutkimuksesta on käytetty merkittävässä määrin tilastollisia menetelmiä. Tästä johtuen useimmissa arvostetuissa tieteellisissä lehdissä on viime vuosina alettu kiinnittää erityistä huomiota tilastollisten menetelmien riittävälle ja oikealle käytölle. Monet lehdet, kuten. esim British Medical Journal ja Lancet ovat luoneet erillisen tilastollisen arviointijärjestelmänsä tavanomaisen arviointijärjestelmän täydennykseksi. Näissä lehdissä on julkaistu myös hyviä ohjeistoja tilastollisten menetelmien asiallisesta käytöstä ja siitä mihin asioihin lääketieteellisiin lehtiin kirjoittavien tutkijoiden tulisi kiinnittää erityistä huomiota (Altman ym. 1983, Gore ym. 1992). Kliinisissä kokeissa ( clinical trials ) edellytetään nykyisin, että tilastollista asiantuntemusta käytetään jo tutkimuksen suunnitteluvaiheesta alkaen. Myös muuntyyppisissä kliinisissä tutkimuksissa, joissa tilastollisten menetelmien käyttö on relevanttia, tulisi tilastollista asiantuntemusta hyödyntää mahdollisimman varhaisesta vaiheesta alkaen. Hyvin suunnitellun ja toteutetun, mutta huonosti tai puutteellisesti analysoidun tutkimuksen voi yleensä saada julkaisukuntoon uudelleenanalysoinnilla. Huonosti suunnitellun, hallinnoidun ja toteutetun tutkimuksen tuloksia ei hyvälläkään tilastollisella analyysilla saa tieteellisesti luotettaviksi. Vain osassa lääketieteellisistä julkaisuista tilastotieteen asiantuntija on tutkimuksen tekijöiden joukossa. Tästä syystä lääkäritutkijoiden tulisikin myös itse perehtyä tilastotieteen peruskäsitteisiin ja -menetelmiin riittävässä määrin, jotta heidän tutkimuksiensa laatu olisi myös tilastollisesti pätevää. Valtaosa kliinikoista ei itse suorita tutkimuksia, vaan he ovat muiden suorittamien tutkimusten hyödyntäjiä, tutkimustulosten siirtäjiä kliiniseen käyttöön. Myös tämän ryhmän kohdalla tilastollisten menetelmien tuntemisesta on hyötyä; on tärkeää kyetä erottelemaan jyvät akanoista ja ottamaan kliiniseen käyttöön vain tieteellisesti luotettavia tuloksia. Oppikirjoista Viime vuosina on ilmestynyt ilahduttavan paljon hyviä biostatistiikan kirjoja, jotka tarjoavat lääketieteellisiin lehtiin kirjoittaville ja kirjoituksia hyödyntäville hyvän perustietopaketin tutkimusasetelmista ja tavallisimmin käytetyistä tilastollisista menetelmistä sekä niiden oikeasta käytöstä. Monissa kirjoissa sisällön pääpaino on selkeästi asetettu menetelmävalintoihin, käyttöedellytyksiin ja analyysien tuottamien tulosten tulkintaan, eikä niinkään analyysien tekniseen suorittamiseen. Tilastollisten algoritmien sisältö matemaattisine kaavoineen ja erilaiset estimointitekniikat ovat asioita, joista ohjelmia hyödyntävän ei tarvitse tietää juuri mitään. Mitä biostatistiikan peruskirjoja lääketieteen tutkijan ja kliinikon kannattaa kirjahyllyynsä hankkia? Valintaan vaikuttaa aikaisempi perehtyneisyys biostatistiikkaan, kuinka paljon biostatistisia menetelmiä työssään tarvitsee ja ehkä jossain määrin kirjan hinta. Joitakin peruskir- Biostatistiikan peruskurssi Johdanto
6 joja tutkijan tai tutkijayhteisön kirjahyllyssä olisi kuitenkin hyvä olla. Seuraavassa esitellään joukko sellaisia alkeis- tai peruskirjoja, joista erityisesti kliinisten alojen tutkijat hyötyvät eniten. Campbellin ja Machinin Medical Statistics. A Commonsense Approach on nimensä mukaisesti helppotajuinen peruskirja. Kirja on tarkoitettu lääketieteen ja sairaahoitoalan opiskelijoille, mutta se on hyödyllinen myös potilaita hoitaville lääkäreille muistuttamaan tilastollisten tutkimusasetelmien ja tulosten tulkinan olennaisimmista asioista. Kirjan sisältää paljon hyviä käytännön ohjeita myös lääketieteellisiin lehtiin kirjoittaville tutkijoille. Kirja on selkeästi kirjoitettu ja siinä on hyvät lähdeviitteet niihin menetelmiin, esim. monimuuttujamenetelmiin, jotka on rajattu kirjan ulkopuolelle. Molemmilla kirjan tekijöistä laaja opetus ja konsultointikokemus. Se näkyy erityisesti esimerkkien valinnassa. Esimerkit ovat aitoja ja ne on otettu tekijöiden omista tutkimuksista tai lääketieteellisestä kirjallisuudesta. BMJ:n lukijoille monet esimerkeistä ovat hyvinkin tuttuja. Kirja sisältää runsaasti tehtäviä vastauksineen. Niiden avulla lukijan on helppo evaluoida asioiden omaksumista. Hyvä kirja perusopetukseen. Hinnaltaan se on edullinen, $40 internet-kirjakaupassa Altmanin kirja Practical Statistics for Medical Research on erittäin hyvä biostatistiikan perusoppikirja ja vankka lähdeteos. Kirja on tarkoitettu ennenkaikkea lääketieteen tutkijoille ja kliinikoille, jotka haluavat saada hyvän yleiskäsityksen tilastollisista pääperiaatteista ja menetelmistä, mutta se on erinomainen kirja myös lääketieteen opiskelijoille ja statistikoille, jotka haluavat suuntautua kliiniseen biostatistiikkaan. Avainkäsitteet on määritelty selkeästi ja sisällön pääpaino on ennenkaikkea lääketieteellisten tutkimusten suunnittelun ja analysoinnin käytännön näkökohdissa. Kirjan sisältö on kattava sisältäen jopa joidenkin monimuuttujamenetelmienkin perusteet, tosin hyvin suppeasti. Kirjan rakennuselementteinä on käytetty Altmaninin lukuisia yleistajuisia biostatistisia, mm. BMJ:ssä julkaistuja, artikkeleita vuosien varrelta. Kirja sisältää paljon sellaista hyödyllistä tietoa, mitä ei yleensä ole saatavilla yhdestä lähteestä. Siinä on paljon hyviä esimerkkejä ja harjoitustehtäviä todellisista kliinisistä tutkimuksista täydellisine tutkimusaineistoineen, joten kirjaa voidaan erinomaisesti hyödyntää sekä perus- että jatko-opetuksessa. Kirjan hinta on $65 (amazon). Dunnin ja Everittin kirjan Clinical biostatistics, An Introduction to Evidence-Based Medicine alaotsikko paljastaa, että kyseessä ei ole tavanomainen oppikirja vaan nykysuuntauksen mukainen ongelmalähtöinen esitys. Kirja on mielenkiintoisesti kirjoitettu, mutta on sisällöltään se on melko suppea ja aihevalinnoiltaan tavallisista oppikirjoista poikkeava; mm. tilastollista testausta siinä ei käsitellä juuri ollenkaan, eikä monia muitakaan alkeisoppikirjojen käsittelemiä aiheita, kuten yksinkertaista regressioanalyysiä. Yksinään tämä kirja ei tutkijalle riitä. Runsas melko vaikeasti todettavien painovirheiden määrä häiritsee jonkin verran lukemista. Suositeltavaa luettavaa kaikesta huolimatta. Kirjan hinta 11 sterling. Glantzin Primer of Biostatistics on nimensä mukaisesti vasta-alkajille tarkoitettu biostatistiikan alkeisoppikirja, joka on ollut jo vuosia tutkijoiden käytössä. Uusin painos ilmestyi syksyltä -97. Rakenteeltaan kirja on tavanomainen oppikirja, joka kattaa kliinisen tutkijan kannalta kaikki olennaiset perusasiat ja se on hyvin kirjoitettu. Painoasu ei ole luettavuuden kannalta paras mahdollinen. Kirjan hinta on $32 (amazon). Wassertheil-Smollerin Biostatistics and Epidemiology on terveydenhuoltohenkilöstölle suunnattu alkeisoppikirja, joka sisältää biostatistiikan ohella myös tärkeimmät epidemiologian peruskäsitteet ja määritelmät. Kirja on helppolukuinen, hinnaltaan edullinen ($32, ama- Johdanto 2 Seppo Sarna
7 zon) ja soveltuu hyvin perusopetukseen lääketieteen opiskelijoille. Se ei edellytä juuri mitään lähtötietoja. Normanin ja Steinerin Biostatistics, The Bare Essentials on hauskasti ja selkeästi kirjoitettu kirja. Tekstiä on sopivasti höystetty huumorilla. Kirjan sisällössä ja esimerkeissä näkyy tekijöiden monialainen koulutus ja suuntautuneisuus ennenkaikkea kliiniseen psykologiaan ja kasvatustieteisiin. Kirja soveltuu hyvin myös itseopiskeluun. Käsitteet on selkeästi määritelty ja teksti on helposti omaksuttavaa. Kirjan ulkoasu on hyvä. Sisältö on peruskirjaksi hyvinkin kattava. Kirjaa voi varauksetta suositella aloittelijallekin. Satunnaistetut kliiniset kokeet näyttelevät tärkeää roolia uusien hoitojen ja lääkkeiden kehittelyssä. Tutkimustulosten oikeellisuus riippuu oleellisesti siitä kuinka hyvin tutkimus on organisoitu ja toteutettu. Pocockin kirja Clinical Trials, A Practical Approach tarjoaa lyhyen mielenkiintoisen katsauksen kliinisten kokeiden historiaan ja tiiviin ja kattavan esityksen niiden yleisperiaatteista, suunnittelusta ja toteuttamisesta. Kirjoittajan laaja käytännön kokemus ja syvällinen perehtyneisyys aihepiiriin näkyy kirjan sisällössä ja tekstissä. Tilastollisia menetelmiä käsittelevä osa on suppea, mutta sisältää kuitenkin kaikkein olennaisimman. Kaikkien niiden, jotka joutuvat jollain muotoa kliinisten kokeiden kanssa tekemisiin kannattaa ehdottomasti lukea tämä kirja ja mahdollisesti hankkia se kirjahyllyynsä. Tekijä on kirjoittamut myös monia hyviä yleistajuisia artikkeleita tästä aiheesta (esim. Pocock 1985 ja 1987). Biostatistiikan perusasiat jo osaavalle voi suositella Altmanin kirjan vaihtoehdoksi Armitagen ja Berryn Statistical Methods in Medical Research. Se on uusittu versio perinteikkäästä pelkastään Armitagen nimissä kulkeneesta monelle tutkijalle hyvinkin tutusta oppikirjasta. Olennaisimmat muutokset aiempiin painoksiin verrattuna on tapahtunut niissä kappaleissa, jotka käsittelevät eloonjäämismenetelmiä, sekventiaalisia ja epidemiologisia menetelmiä. Aihepiiriltään se kattaa suunnilleen samat asiat kuin Altmanin kirja, mutta se on esitykseltään jonkin verran syvällisempi ja edellyttää lukijalta enemmän perustietoja. Kirja on kuitenkin kirjoitettu ei-matematiikoille. Sisältö kattaa hyvin kaikki ne tilastolliset perustekniikat, joita useimmiten lääketieteellisissä tutkimuksissa käytetään. Suomenkielisiä biometrian oppikirjoja on niukasti saatavilla. Rannan, Ritan ja Koukin kirjoittama Biometria niminen kirja on suunnattu ekologeille, mikä tarkoittaa ennenkaikkea esimerkkien substanssivalikoimaa. Sinäsä kirja kattaa hyvin myös ne tilastolliset perusmenetelmät, joita lääketieteilijätkin käyttävät. Kirja on selkeästi ja hyvin kirjoitettu. Jonkinasteisia vaikeuksia kliinikolle voi syntyä, kun hän yrittää muodostaa analogioita kirjan esimerkeistä omaan tutkimustilanteeseensa. Lääketieteessä käytetään paljon ei-parametrisia tilastollisia menetelmiä. Niiden perusasiat on yleensä riittävästi kuvattu yllä luetelluissa perusoppikirjoissa. Mikäli joku kuitenkin haluaa yksityiskohtaisempaa tietoa näistä menetelmistä, niin kannattaa tutustua klassiseen Siegelin ja Castellanin kirjaan Non-parametric Statistics for the Behavioral Sciences. Ohjelmistoista Mikrotietokoneiden helpot käyttöliittymät ja uudet ohjelmistot ovat viime vuosina mahdollistaneet tilastollisten menetelmien käytön kohtuullisella vaivannäöllä myös muillekin kuin am- Biostatistiikan peruskurssi Johdanto
8 mattilaisille. Monissa ohjelmissa on lisäksi sisäänrakennettuna tilastollisten menetelmien käytöstä opastavia tutor -järjestelmiä. Ohjelmistopaketeista SPSS, Statistica, Systat, BMDP, SAS ja S-Plus lienevät tavallisimmin käytettyjä yleisohjelmia lääketieteilijöiden keskuudessa PC-puolella. Näistä kaikista on saatavissa myös Windows versiot, jotka toimivat Windows 3.1x, Windows 95 ja Windows NT ympäristöissä. SPSS:n uusin versio 9.0 on helppokäyttöinen ja sen menetelmätarjonta on monipuolinen. BMDP:n New System on vielä melko keskeneräinen, joskin ohjelmistotoimittaja on lupaillut kehittyneempää versiota lähiaikoina. Systatin ja Statistican etuja ovat mm. hyvä grafiikka, ja Systat 8.0:n alla voi ajaa myös BMDP-ohjelmia. Monipuolisimmat mahdollisuudet kokeneemmille käyttäjälle tarjoavat SAS, S-Plus ja BMDP Professional. Ohjelmiston valinnan ratkaisee paljolti ympärillä toimiva tiedeyhteisö ja erilaiset tottumiskysymykset. Tiedostojen siirtoa eri tilastopakettien, tietokanta- ja taulukkolaskinohjelmien välillä voidaan kätevästi suorittaa DBMS/Copy -ohjelmalla. Yleisohjelmien ohella tarjolla on myös hyviä erityisohjelmia. Esimerkiksi eksakteihin testeihin erikoistunut StatXact 4 ja epidemiologisten aineistojen mallittamiseen ja testaamiseen soveltuva Egret ovat hyviä ja paljon käytettyjä ohjelmistoja. Mac-puolella tilastollisten ohjelmien tarjonta on perinteisesti ollut aina niukempaa kuin PC-puolella. Yleisohjelmista StatView 5.0 ja Statistica lienevät yleisimmin käytettyjä lääkäritutkijoiden keskuudessa. Kliinisissä tutkimuksissa voimalaskelmat ovat tärkeitä. nquery 3.0 ja PASS 6.0 ovat tähän tarkoitukseen soveltuvia helppokäyttöisiä ja monipuolisia erityisohjelmia. Egret Siz on tärkeä työväline epidemiologisten tutkimusten suunnittelussa. Se on helppokäyttöinen, tehokas ja sofistikoitu paketti aineistokoon arviointiin epälineaarisia malleja käytettäessä. Yleisohjelmilla aineistokoon arviointimahdollisuuksia ei juurikaan ole. Varsinaisten tilastopakettien ohella perusstatistiikkaa voidaan laskea myös useimmilla taulukkolaskinohjelmilla, esim. Excel, joka on suunnilleen sama ohjelma sekä PC- että Mac-puolella. Perehtymällä näihin ohjelmiin vähän syvällisemmin, käyttäjä voi helposti itse täydentää ohjelman tarjoamaa perusvalikoimaa tekemällä ns. makroja, sellaisista tilastollista suureista, joiden algoritmi (ratkaisumenetelmä) on verrattain helppo, esimerkiksi useimmat tässä monisteessa olevat laskentakaavat. Satunnaistamislistojen ( randomization list ) tekeminen on keskeisellä osalla monien kliinisten tutkimusten alkuvaiheessa. Niitä voidaan helposti tehdä MedStat-ohjelmalla useimpiin kliinisissä tutkimuksissa esille tuleviin tilanteisiin. Excel-käyttäjien on myös helppo ohjelmoida kaikki tässä monisteessa kuvatut satunnaistamisalgoritmit. Nykysin useimmat arvostetut lehdet vaativat perinteisesti lääketieteellisissä julkaisuissa esitettyjen P-arvojen (tilastollinen merkitsevyys, statistical significance ) ohella myös luottamusvälejä ( confidence interval ), esimerkiksi hoitokokeissa lopputulosmuuttujien ( outcome measure ) arviota esitettäessä. Tilastollisten yleispakettien tulosteisiin on mahdollista saada jonkin verran luottamusvälejä. Hämmästyttäviä puutteita tässä suhteessa niissä kuitenkin esiintyy. Läheskään kaikkia aivan tavallisimpiakaan kliinisissä tutkimuksissa tarvittavia luottamusvälejä ei niistä löydy ja tutkija joutuu turvautumaan erityisohjelmiin tai rakentamaan taulukkolaskinohjelmaansa niistä makron. Hyvä eritysohjelma PC-puolella luottamusvälilaskentaan on BMJ:n markkinoima CIA-ohjelma, johon sisältyy myös pieni kirja (Gardner ja Altman 1989). Ohjelma on erittäin helppokäyttöinen. Johdanto 4 Seppo Sarna
9 Lääketieteellisten artikkelien laatu tilastollisesti tarkasteltuna Nykyisin monet lääkäritutkijat käyttävätkin jo näitä paketteja sujuvasti ja asiantuntemuksella. Hyvistä tilastotieteen kirjoista ja ohjelmista on ollut selkeästi havaittavissa oleva hyöty. Tilastollisten menetelmien tietämys ja käyttö on selvästi viime vuosina parantunut lääketieteellisissä tutkimuksissa. Silti runsaasti parantamisen varaa on vielä olemassa, minkä osoittaa Lancetissa julkaistu tutkimus (Gore, Jones ja Thompson 1992). Kun yhteensä 191 Lancet-lehden alustavan arvioinnin läpäissyttä tutkimusta aikaväliltä marraskuu 1990 ja kesäkuu 1991 arvioitiin uudelleen tilastolliselta kannalta erityisen refereeryhmän toimesta, niin tulos oli pääpiirteissään seuraava: Vain 54% käsikirjoituksista katsottiin hyväksyttäviksi tai hyväksyttäviksi korjauksen jälkeen. Muita joko suositeltiin hylättäviksi (14%) tai olennaista korjausta vaativiksi (32%). Menetelmien kuvaukset olivat puutteellisia noin puolessa käsikirjoituksista. Noin joka neljännessä oli abstrakti tai johtopäätökset puutteellisia. Huomattavia virheellisyyksiä tilastollisessa päättelyssä ( statistical inference ) esiintyi 48 artikkelissa. Näissä artikkeleissa esiintyi puutteellisuuksia myös tutkimuksen suunnittelun ( study design ) suhteen. Tilastollinen raati kiinnitti erityistä huomiota siihen olivatko tehdyt johtopäätökset perusteltuja tutkimusasetelman ja suoritettujen tilastollisten analyysien pohjalta. Ohjeita lääketieteellisiin lehtiin kirjoittaville tutkijoille on julkaistu useita: Altman, Gore, Gardner ja Pocock 1983, Gardner ja Altman 1989 ovat suositeltavaa luettavaa. Näissä kirjoituksissa olevien ohjeiden suhteen lienee statistikkojen keskuudessa laaja konsensus. Tutkimusprosessi Tutkimus on monivaiheinen ja monimutkainen kokonaisuus. Sitä voidaan luonnehtia prosessina, joka alkaa tutkimuksen suunnittelusta ja joka useimmiten päätyy tulosten julkaisemiseen ja niiden hyödyntämiseen. Tutkimusprosessin eri vaiheita ovat: Ongelman realisoituminen (tiedostamisen aste ja tärkeys) Tutkimuksen yleissuunnittelu (resurssien kartoitus, aikaisempien tutkimusten arviointi) Ongelman tieteellinen lähestymistapa (tutkimustyypin, -asetelman ja -menetelmien valinta) Aineiston valinta (kohdeperusjoukon populaation määrittely, otantamenetelmien valinta) Tietojen kerääminen (mittarit ja mittaamismenetelmät, tietojen luotettavuus ja sen turvaaminen) Tietojen tallennus, muokkaaminen ja esikäsittely (virheiden tarkistus, poikkeavien arvojen outlier etsintä, jakaumien muodot) Biostatistiikan peruskurssi Johdanto
10 Tulosten analysointi (menetelmävalinnat) Tulosten tiivistäminen ja esittäminen (tunnusluvut, taulukointitekniikka ja graafiset kuvaajat) Tulosten tulkinta ja johtopäätöstenteko (laajuus, yleistettävyys ja kliininen merkitys) Tieteellinen julkaisu tai tutkimusraportti (julkaisufoorumin valinta) Tulosten käyttö (väärinkäyttö) (tiedon vastaanotto, tulkinta ja sovellukset) Kaikkiin edellä mainittuihin tutkimusprosessin vaiheisiin liittyy monia virhe- ja harhamahdollisuuksia ( bias ) sekä salakuoppia ( pitfalls ), joihin kokenutkin tutkija saattaa langeta. Tilastolliseen tutkimukseen liittyvät harhat voidaan määritellä sellaisina tulkintoina ja toimenpiteinä missä tahansa tutkimusprosessin vaiheessa, jotka johtavat systemaattiseen poikkeamaan todellisuudesta. Harhasta voidaan myös käyttää nimitystä systemaattinen virhe ( systematic error ). Erilaisia harhatyyppejä on kirjallisuudessa kuvattu useita kymmeniä (Sackett 1979). Kriittisen tutkimuksen olennainen osa on harhamahdollisuuksien jatkuva arviointi tutkimuksen kaikissa vaiheissa. Harhamahdollisuuksien painottuminen vaihtelee kliinisen tutkimuksen eri osa-alueilla, tutkimustyypistä riippuen. Kliinisiä kokeita varten on laadittu erityinen normisto, GCTP ( Good Clinical Trial Practice ), jossa yksityiskohtaisesti määritellään kuinka tulisi menetellä, jotta tutkimus täyttäisi kaikilta osin mahdollisimman hyvin tieteellisyyden kriteerit. GCTP:stä on olemassa myös ns. Pohjoismaiset ohjeet (NLN Publ 28, 1989), jotka ovat lähes yhteneväiset kansainvälisten ohjeiden kanssa. Laboratoriopuolella on vastaavankaltaiset ohjeet, GLP ( Good Laboratory Practice ), joissa laboratoriotutkimusten ja -käytäntöjen normit. Monia näissä normistoissa määriteltyjä asioita tulisi noudattaa suunniteltaessa ja toteutettaessa myös muun tyyppisiä kliinisiä tutkimuksia. Tilastollinen päättely Tilastollisen päättelyn ( Statistical inference ) perusideana on tehdä johtopäätöksiä (päätelmiä) otoksesta (tai otoksista, samples ) perusjoukkoa ( population ) koskeviksi. Perusjoukkoja on käsitteellisesti kahta tyyppiä: kohdeperusjoukko ( target population ) ja otosperusjoukko ( population sampled ). Mikäli otanta on asianmukaisesti suoritettu siten, että tutkittavat on valittu toisistaan riippumatta ja satunnaisesti, niin otantatutkimuksen tulokset ovat yleistettävissä otosperusjoukkoa koskeviksi otoskoon sallimalla varmuudella. Kohdeperusjoukkoa koskeviksi saatuja tuloksia ei kuitenkaan ilman muuta voida yleistää. Pitää ensin tutkia, onko otosperusjoukko mahdollisesti valikoitunut jollakin mekanismilla tavoiteperusjoukosta ja mitkä tekijät ovat olleet syynä tähän valikoitumiseen. Johdanto 6 Seppo Sarna
11 Esim. Tutkitaan nivelreuman etenemiseen vaikuttavia tekijöitä ja niiden välisiä riippuvuussuhteita. Otosperusjoukon muodostaa esimerkiksi Reumasäätiön sairaalassa hoidettavat potilaat. Otos (tutkimusaineisto) kerätään jollain otantamenetelmistä näiden potilaiden joukosta. Saadut tulokset voidaan yleistää sairaalassa hoidettuihin potilaisiin, mutta ei välittömästi kaikkiin nivelreumatapauksiin. Valikoivana tekijänä on tässä tapauksessa mm. taudin vaikeusaste. Lievimpiä nivelreumatapauksia ei hoideta erikoissairaalassa ja riippuvuussuhteet saattavat lievemmissä tapauksissa olla aivan erilaiset kuin vaikeimmissa tapauksissa. Kliinisissä tutkimuksissa, erityisesti hoitokokeissa tutkittavien joukko ei yleensä muodosta selkeää otosta mistään perusjoukosta, vaan se valikoituu sisäänotto- ja poisuljentakriteerien perusteella tutkimuksen tavoitteiden kannalta mahdollisimman tarkoituksenmukaiseksi. Tilastollisia päätelmiä tehtäessä tämä pitää ottaa huomioon, yleistyksiä esim. hoituloksista tai hoitoeroista ei voi varauksettomasti tehdä jotakin muuta kuin tutkittavien edustamaa perusjoukkoa koskeviksi. Esim. SAVE-tutkimus (Moyé et al. 1991) Satunnaistettu lumehoitokontrolloitu kaksoissokkotutkimus ACE-estäjähoidon vaikutuksesta sydäninfarktin jälkeiseen kuolleisuuteen vasemman kammion vajaatoimintaa potevilla potilailla. Kyseessä oli monikeskustutkimus, jonka potilasmateriaali seulottiin sepelvaltimotautihoitoyksiköistä USA:ssa kolmen vuoden ajalta. Seulottavien määrä oli kaikkiaan Näistä :lla potilaalla todettiin kliininen sydäninfarkti, olivat selvinneet hengissä 72 tuntia infarktin jälkeen ja olivat iältään vuotiaita (potilasjoukko A). Erilaisin poissuljennoin potilasjoukkoa rajattiin ja päädyttiin 2231:een potilaaseen (potilasjoukko B), jotka satunnaistetiin SAVE-tutkimukseen. Merkittävin poissulku tapahtui, kun kaikki ne potilaat, joilla ejektiofraktio oli yli 40% suljettiin tutkimuksen ulkopuolelle. Potilasjoukko B oli siten 6.1% potilasjoukosta A. Tutkimuksessa todettiin selvä myönteinen vaikutus kuolleisuuteen ACE-estäjähoidolla. Tutkimuksen tuloksia hyödynnettiin välittömästi mm. lääkemainonnassa ja rohkeasti yleistettiin hoidon myönteiset vaikutukset lähes kaikkiin infarktitapauksiin. Näin rajuihin yleistyksiin ei voida kuitenkaan yllä kuvatun tutkimuksen perusteella mennä, sillä todettu myönteinen tulos pätee ainoastaan sellaiseen perusjoukkoon, jota potilasjoukko B, satunnaistetut potilaat, edustaa. Myöhemmin on tosin suoritettu tutkimuksia, joiden perusteella ACE-hoidon käyttö indikaatioita on voitu olennaisestikin laajentaa. Tilastollinen päättely voidaan jakaa kahteen päätyyppiin: estimointiin (arviointi) ja hypoteesien testaamiseen. Biostatistiikan peruskurssi Johdanto
12 Estimointia on kahta tyyppiä: piste-estimointia ( point estimation ) ja luottamusväliestimointia ( confidence interval estimation ). Piste-estimointi tarkoittaa sitä, että perusjoukon tuntemattomia suureita arvioidaan yhdellä otoksesta laskettavalla luvulla, piste-estimaatilla. Esim. jakauman keskeisyyttä jollakin keskiluvulla. Piste-estimaatin luotettavuutta arvioidaan keskivirheellä ( standard error ), SE( ). Hypoteesien testaamisessa voidaan erottaa kaksi päätyyppiä: yksi testattava suure simultaaniset testaukset; monta samanaikaisesti testattavaa suuretta Menetelmätyypit: parametriset menetelmät ( parametric methods ) ei-parametriset menetelmät ( non-parametric methods ) Mallien rakentaminen: yhden muuttujan mallit ( univariate models ), esim. y = a + bx monimuuttujamallit ( multivariate models ), esim. logit(y) = a + Σ b i x i Mallien rakentamiseen ( modelling ) liittyy sekä mallin parametrien (a, b,...) estimointia että erilaisia testejä muuttujien merkitsevyys muuttujien väliset yhdysvaikutukset ( interactions ) mallin hyvyys ( goodness of the fit ) Viitteet Altman DG, Gore SM, Gardner MJ, Pocock SJ. Statistical guidelines for contributors to medical journals. BMJ 1983; 286: Emerson JD, Colditz GA. Use of statistical analysis in the New England Journal of Medicine. N. Eng. J. Med. 309, Gore S, Jones G, Thompson SG. Lancet s statistical review process: areas for improvements by authors. Lancet 1992; 340: Moyé LA, Pfeffer MA, Braunwald E for the SAVE investigators. Rationale, Design and Baseline Characteristics of the Survival and Ventricular Enlargement Trial. Am J Cardiol 68: 70D-79D, Pocock SJ. Current issues in the design and interpretation of clinical trials. BMJ 1985; 290: Sackett DL. Bias in analytic research. J Chron Dis 1979; 32: Good clinical trial practice. Nordic guidelines. NLN publ. No 28. Nordiska Läkemedelsnämnden, Nordic Council on Medicines, Uppsala Johdanto 8 Seppo Sarna
13 Kirjallisuutta Altman DG. Practical statistics for medical research. Chapman & Hill, London ISBN (HB). Armitage P, Berry G. Statistical methods in medical research. Blackwell Sci. Publ., Boston ISBN Campbell MJ, Machin D. Medical statistics, a commonsense approach. John Wiley & Sons, Chichester ISBN Dunn G, Everitt B. Clinical Biostatistics. An introduction to Evidence-Based Medicine. Edward Arnols, London ISBN Glantz SA. Primer of biostatistics. Second edition. McGraw-Hill, Singapore ISBN Norman GR, Steiner DL. Biostatistics, the bare essentials. Mosby year book, Inc, St Louis ISBN Pocock SJ. Clinical Trials, A practical approach. John Wiley & Sons, Chichester ISBN Pocock SJ, Hughes MD, Lee RJ. Statistical problems in the reporting of clinical trials. A Survey of Three Medical Journals. N Eng J Med 1987; 317: Ranta E, Rita H, Kouki J. Biometria. Yliopistopaino, Helsinki ISBN X. Senn S. Cross-over trials in clinical research. John Wiley & Sons, Chichester ISBN: Siegel S, Castellan NJ. Nonparametric statistics for the behavioral sciences. McGraw-Hill, Singapore ISBN Ohjelmia Axum versio 5.0. Maahantuoja Zenex. Fax: Grafiikkaohjelma, hinta 1600,- mk BMDP New System. Statistical Solutions, LTD, Irlanti, Fax: CIA (Confidence Interval Analysis). Gardner MJ, Gardner SB, Winter PD. CIA (Versio 0.5). BMJ, Tavistock Square, London WC1H 9JR. DBMS/COPY versio 6. Conceptual Software, Inc. Houston, Texas. Fax FigP versio 7.0. Biosoft, USA. Fax: (314) Hyvä julkaisugrafiikkaohjelma, hinta $500. Biostatistiikan peruskurssi Johdanto
14 nquery Advisor versio 3.0. Statistical Solutions, LTD, Irlanti, Fax: , Aineistokoon arviointiohjelma, hinta 395. Medstat versio The Astra Group A/S, Denmark, Vanha DOS-ohjelma, hankala käyttöliittymä. SAS 7.0. Suomessa ohjelmaa myy mm. SAS-Instituutti. SigmaPlot, Statistical Solutions LTD. Fax: , Hyvä grafiikkaohjelma, hinta 295 S-PLUS 4.0. Suomessa ohjelmaa myy mm. Invarianssi Tietojärjestelmät Oy, fax: , Solas versio 1.0. Statistical Solutions, LTD, Irlanti, Fax: Puuttuvien tietojen käsittelyohjelma, hinnaltaan kallis 495 SPSS 9.0. SPSS ASC International bv. Suomessa ohjelmaa myy mm. Action Office Oy, fax Monilla yliopistoilla ja korkeakouluilla on SPSS:stä edullinen kampuslisenssi. Statistica. StatSoft. Tulsa, USA. Fax: Suomessa ohjelmaa myy mm. SmartSystems, fax: StatXact 4 for Windows. CYTEL Software Corporation 1998, 675 Massachusetts Ave., Cambridge, MA 02139, USA. Fax: (617) Kaikkia CYTEL:in tuotteita myy joustavasti nk. päivän hintaan myös tanskalainen Spadille Biostatistics Aps. Fax: , SYSTAT 8.0 for Windows. Statistical Solutions, LTD. Fax: , Johdanto 10 Seppo Sarna
15 Tutkimustyypit ja -asetelmat Lääketieteessä samaa ongelmaa voidaan lähestyä monin eri tutkimustyypein ja -asetelmin. Tilastollista käsittelyä vaativat lääketieteelliset tutkimukset voidaan jakaa kahteen päätyyppiin: 1) kokeelliset ( experimental, intervention ) tutkimukset ja 2) havainnoivat ( survey ) tutkimukset. Kokeellisille tutkimuksille on tyypillistä tutkijan aktiivinen rooli havaintoyksiköiden (esim. potilaiden) jakamisessa tutkittaviin ryhmiin ja koejärjestelyitä ja -olosuhteita luonnehtivien parametriasetusten määrittelyssä (esim. annosten määrittely annos-vaste-tutkimuksissa). Kokeellisissa tutkimuksissa tutkittavien (koe-eläimet, ihmiset,...) jako ryhmiin tapahtuu koesuunnitelman mukaisesti. Havainnoivissa tutkimuksissa tutkijalla on passiivisempi rooli rekisteröidessään tutkittavaan ilmiöön liittyviä tapahtumia tutkimussuunnitelman mukaisissa ryhmissä. Näissä tutkimuksissa tutkijalla ei ole mahdollisuutta suoranaisesti vaikuttaa tutkittavien jakautumiseen tutkittaviin ryhmiin, esimerkiksi jollekin vaaratekijälle altistuneisiin ( exposed group ) ja altistumattomiin ( non-exposed group ). Havainnoivia tutkimuksia on kahta tyyppiä: kokonaistutkimukset ( population studies ) ja otantatutkimukset ( sample studies ). Otantatutkimukset voidaan edelleen jakaa kahteen tyyppiin riippuen siitä suoritetaanko otanta taudin tai vaikutuksen vai altistustekijän, ominaisuuden tai oletetun syytekijän suhteen. Tutkimuksen aikasuuntauksen ja tutkittavien tietojen rekisteröintitavan mukaan tutkimukset voidaan edelleen jakaa poikkileikkaustutkimuksiin ( cross-sectional ), takeneviin ( retrospective ), eteneviin ( prospective ) ja molempisuuntaisiin ( ambispective ) tutkimuksiin. Kokeelliset tutkimukset Käyttö: Lääke- ja hoitokokeet, interventiotutkimukset (väestökokeet) Havaintoyksiköt: koe-eläimet, ihmiset, mallit Kliininen koe ( clinical trial ) on mikä tahansa ihmisillä suoritettu kokeellinen tutkimus, joka perustuu tarkkaan etukäteissuunnitelmaan ( protocol ) ja jonka tavoitteena on löytää mahdollisimman hyvä hoitomenetelmä uusille tuleville potilaille. Lääkekokeet luokitellaaan tavallisesti koesuunnittelultaan neljään eri vaiheeseen (faasiin, phase ). Faasi I:n tutkimukset suoritetaan tavallisesti terveillä vapaaehtoisilla ja ne tähtäävät lähinnä lääkkeen imeytymisen ja metaboloitumisen selvittelyyn sekä turvallisten lääkeannosten löytämiseen. Faasi II:n pienimuotoisilla, aineistokooltaan yleensä korkeintaan potilaan tutkimuksilla haetaan alustavaa selvyyttä lääkkeiden tehoon ja sivuvaikutuksiin. Faasi III:n tutkimukset ovat täyslaa- Biostatistiikan peruskurssi Tutkimustyypit ja -asetelmat
16 juisia lääkkeen tai hoidon tehon luotettavaan selvittelyyn tähtääviä tutkimuksia. Lääkkeen markkinoille tulon tai hoidon laajamittaisen käyttöönoton jälkeisiä seuranta- ja monitorointitutkimuksia kutsutaan faasi IV:n tutkimuksiksi. Huomattava osa faasi III:n tutkimuksista on sellaisia, että niissä vertaillaan kokeiltavana olevaa hoitoa tai interventiotoimenpidettä johonkin kontrollina olevaan hoitoon tai toimenpiteeseen. Vertailtavia ryhmiä voi olla myös useita ja niiden tulee olla mahdollisimman samankaltaisia muiden paitsi tutkittavan tekijän (esim. lääkehoidon) suhteen. Vertailtavien ryhmien samankaltaisuudella taustatekijöiden (esim. ikä, sukupuoli, taudin vaikeusaste) suhteen pyritään varmistamaan se, että mikäli tutkittavien ryhmien välillä todetaan ero, niin se todella johtuu tutkittavasta tekijästä eikä taustatekijöistä. Samankaltaisuus pyritään takaamaan siten, että tutkimukseen soveltuvien henkilöiden sijoittelussa vertailtaviin ryhmiin käytetään satunnaistamismenettelyä ( randomization ). Valtaosa faasi III:n tutkimuksista on nykyisin satunnaistettuja. Yksi satunnaistamismenettelyn syistä on estää subjektiivisuuden vaikutus tutkimuksen tuloksiin. Satunnaistamismenettelyllä vertailtavista ryhmistä tulisi lähtötilanteessa täysin samankaltaisia, mikäli satunnaistamismenettelyä voitaisiin jatkaa rajatta. Käytännössä kuitenkin joudutaan tyytymään melko pieniin ryhmäkokoihin ja huomattaviakin eroja taustatekijöiden suhteen saattaa ryhmien välillä esiintyä. Jokaisessa satunnaistetussa kliinisessä kokeessa on syytä suorittaa ryhmien vertailu kaikkien relevanttien taustatekijöiden suhteen, jotta voitaisiin varmistua siitä, kuinka hyvin ryhmät ovat lähtötilanteessa tasapainossa. Mikäli käytetään yksinkertaista satunnaistamista ja ryhmäkoot ovat pieniä, niin ryhmistä voi tulla huomattavastikin erisuuruiset. Samansuuruisten ryhmien aikaansaamiseksi täytyy käyttää nk. rajoitettuja tai lohkosatunnaistamismenetelmiä ( block randomization ). Mikäli satunnaistaminen on suoritettu siten, että tutkittavat henkilöt eivät tiedä mihin ryhmään he kuuluvat, mutta tutkija ja/tai muu hoitohenkilökunta tietää, kyseessä on yksöissokkokoe ( single blind ), mutta jos kumpikaan osapuoli ei tiedä ryhmiin sijoittelua ennen tutkimuksen päättymistä (mieluiten ennen tutkimusten analysointia), niin kyseessä on kaksoissokkokoe ( double blind ). Näistä jälkimmäinen sisältää vähemmän harhamahdollisuuksia. Yksinkertaisen satunnaistamismenettelyn asemesta voidaan käyttää monimutkaisempiakin menetelmiä takaamaan vertailtavien ryhmien vertailukelpoisuutta lähtötilanteessa. Eräs tällainen menettely on ositettu satunnaistaminen ( stratified randomization ). Tällöin potilaat jaetaan taustatekijöiden mukaan ositteisiin ja suoritetaan satunnaistaminen kussakin ositteessa erikseen. Kliinisessä kokeessa päästään harvoin täysin satunnaiseen valintaan. Varsin tavallinen on esim. tilanne, että tutkija ottaa hoitoryhmään ne potilaat, jotka tulevat hänen klinikalleen ja naapuriklinikalla hoidetut potilaat muodostavat verrokkiryhmän. Tällainen asetelma on kuitenkin varsin altis kritiikille ja harhamahdollisuuksille. Toisinaan on epäeettistä tai mahdotonta suorittaa puhdas satunnaistaminen (esim. fataalit sairaudet, potilaan saama hyöty jne.). Näissä tilanteissa on erityisen tärkeää tutkimustuloksia analysoitaessa tutkia huolella ryhmien vertailukelpoisuutta ja käyttää tarvittaessa erilaisia adjustointitoimenpiteitä analyysivaiheessa, esim. erilaisten tilastollisten mallien avulla. Monissa lääkekokeissa voidaan säästää tutkittavien määrässä suorittamalla nk. ristikkäistutkimus ( cross-over trial ). Tässä tutkimussuunnitelmassa potilaat jaetaan satunnaistamalla tutki- Tutkimustyypit ja -asetelmat 12 Seppo Sarna
17 muksen alkaessa esim. ryhmiin A ja B, jotka saavat tiettyä hoitoa määrätyn pituisen ajan, jonka jälkeen seuraa puhdistumisajanjakso, ( wash-out ), jolloin koehenkilöt eivät saa mitään tutkimustuloksiin vaikuttavaa hoitoa. Tämän jälkeen seuraa kolmas tutkimusajanjakso, jolloin ne potilaat, jotka aloittivat hoidolla A saavat ajanjaksona hoitoa B ja päinvastoin. Ristikkäistutkimusasetelmassa ei siten ole erillistä kontrolliryhmää, vaan potilaat toimivat itsensä kontrolleina. Lueteltujen kolmen tutkimusvaiheen lisäksi tutkimukseen liitetään usein lumehoitojaksot eri tutkimusvaiheiden alkuun ja loppuun. Ristikkäistutkimusasetelma soveltuu sellaisiin tutkimuksiin, joissa hoidon tai lääkkeen vaikutus on lyhytkestoinen, sillä muuten ei voida yhdistää tutkimustuloksia tutkimusjaksoista 1 ja 3 ja siten menetetään asetelman käytön peruste, säästövaikutus potilasmäärissä. Mikäli edellisestä tutkimusvaiheesta lääkkeen tai hoidon efekti jää päälle ( carry-over effect ), niin tutkimusperiodi pitää ottaa huomioon tutkimustuloksia analysoitaessa. Tällaisissa tilanteissa tutkimustulosten tulkinta on usein vaikeaa. Kliinisissä tutkimuksissa suoritetaan usein samoista potilaista toistomittauksia, käytetään toistomittausasetelmia ( repeated measures designs ). Niiden käytön perusideana on vähentää yksilöiden välisen vaihtelun vaikutusta tutkittavaan asiaan, esimerkiksi hoitojen vaikutukseen. Samoin kuin ristikkäsiasetelmassa, toistoasetelmassakin aikaansaadaan säästöjä koe-eläin tai henkilömäärissä. Sama voima ( power ) saavutetaan pienemmällä tutkittavien määrällä kuin jos jokaisesta tutkittavasta olisi vain yksi mittausarvo. Toistoasetelmat antavat monia mahdollisuuksia tutkia mm. ajan ja erilaisten olosuhteiden sekä niiden yhdysvaikutusten ( interaction ) vaikutusta koe- tai hoitotuloksiin. Valtaosa kliinisistä kokeista ovat luonteeltaan vertailevia, ja todettu ero ryhmien (esim. hoitoja vertailuryhmän) välillä voi johtua seuraavista syistä: Otosvaihtelusta tai sattumasta Sisäisistä eroavuuksista ryhmien välillä (esim. prognoosiin vaikuttavat tekijät) Eroista ryhmien käsittelyssä ja seurannassa (esim. hoitoryhmän intensiivisempi seuranta) Todellinen ero ryhmien välillä tutkittavan asian suhteen Käyttö: Kokonaistutkimukset hallinnolliset kartoitukset, väestötilastot Havaintoyksiköt: henkilöt, kuolintodistukset, sairaalastapoistot, väestö- ja tautiryhmät Kokonaistutkimus kohdistuu koko perusjoukkoon; esimerkiksi rutiinisti suoritetut väestötilastoinnit, ovat luonteeltaan kokonaistutkimuksia. Niitä käytetään silloin, kun halutaan saada ehdottoman tarkka tieto tutkittavista asioista. Kokonaistutkimus luo usein hypoteeseja ja antaa vihjeitä mahdollisista riippuvuuksista sekä tarjoaa tutkimusaineistoja muun tyyppisille tutkimuksille. Kokonaistutkimuksen haittoja ovat kalleus, hitaus ja usein laadunvalvonnan vaikeus. Biostatistiikan peruskurssi Tutkimustyypit ja -asetelmat
18 Käyttö: Otantatutkimukset Poikkileikkaustutkimukset ( cross-sectional studies ) Yleiskartoitukset Vallitsevuudet ( prevalence ) Riippuvuudet tautien tai riskitekijöiden välillä Seurantatutkimusten osana Koska poikkileikkaustutkimukset eivät sisällä aikatekijää, ei todettujen riippuvuuksien perusteella voida päätellä mitään syy-seuraus -suhteesta. Kohorttitutkimusten (seurantatutkimusten) tiedonkeruujärjestelmä pohjautuu usein poikkileikkaustutkimuksiin. Tapaus-verrokkitutkimukset ( case-control tai case-referent studies) Tapaus-verrokkitutkimuksen perusasetelmassa on kyse vertailusta kahden ryhmän välillä. Toisen ryhmän ( tapaukset ) muodostavat ne henkilöt, joilla on tutkimuksen kohteena oleva tauti ja toisen ne henkilöt, joilla tätä tautia ei ole ( verrokit ). Tapaus-verrokki -tutkimusta nimitetään myös sairauslähtöiseksi tutkimukseksi. Tutkimuksessa kerätään altistus- ja vaaratekijätietoja kummastakin ryhmästä (yleensä takenevasti, retrospektiivisesti) ja tutkitaan, esiintyykö jokin tietty tekijä tai tekijäyhdistelmä useammin tai voimakkaampana tapauksilla kuin verrokeilla. Tapaus-verrokkiasetelmasta on olemassa kaksi variaatiota kaltaistettu ( matched ) ja kaltaistamaton asetelma ( unmatched ). Kaltaistetussa asetelmassa tapaukset ja verrokit on valittu siten, että ne ovat samankaltaisia tiettyjen tekijöiden (ikä, sukupuoli jne. suhteen). Kaltaistus on eräs vakiointikeinoista, jolla pyritään poistamaan kaltaistustekijöiden vaikutus tutkittavasta ilmiöstä, eli vaara- tai altistustekijän ja taudin välisestä yhteydestä. Yleensä tekijöitä, joiden suhteen kaltaistus suoritetaan ei saisi olla kovin monta, sillä muuten vaanii ylikaltaistuksen vaara; kaltaistuksella poistetaan osa tutkittavaa vaikutusta. Kaltaistamattomassa asetelmassa tutkittavien tulisi olla otoksia vastaavista perusjoukoista. Tapaus-verrokkitutkimusta edeltää tavallisesti sairastavuus tai kuolleisuustutkimus, jonka pohjalta todettu (tai todetut) yhteydet tiettyjen altistus- tai vaaratekijöiden ja taudin (tai tekijöiden aiheuttaman vaikutuksen) välillä halutaan varmentaa. Pääasiallisin ero poikkileikkaustutkimukseen verrattuna on aikatekijän olemassaolo. Tapaus-verrokkitutkimuksesta saatavien tulosten oikeellisuuden kannalta keskeisiä seikkoja ovat: tapausten ja verrokkien määrittelykriteerin (tai kriteerien) oikeellisuus Tutkimustyypit ja -asetelmat 14 Seppo Sarna
19 sekä tapaus- että verrokkiryhmän edustavuus tapaus- ja verrokkiryhmän vertailukelpoisuus altistus- ja vaaratekijätietojen tarkkuus ja oikeellisuus Kaikkiin näihin kohtiin liittyy lukuisia harhamahdollisuuksia. Mikäli ryhmien määritettelykriteeri (tai kriteerit) ovat puutteellisia, saattaa osa tapauksista olla sellaisia, ettei heillä olekaan tutkimuksen kohteena olevaa tautia (väärät positiiviset), vastaavasti osa verrokkiryhmään kuuluvista saattaa kuulua sinne virheellisesti (väärät negatiiviset). Nämä luokitusvirheet voivat peittää alleen todellisen riippuvuuden joko täydellisesti tai osittain tai ne saattavat synnyttää harhaisen riippuvuuden altistus- tai vaaratekijöiden ja taudin välillä. Mikäli edustavuus on puutteellinen, putoaa tutkimukselta pohja pois joko täysin tai osittain, sillä tilastollisessa tutkimuksessa pyritään siihen, että todetut tulokset voidaan yleistää perusjoukkoa koskeviksi. Verrokkiryhmän valinta tapaus-verrokkitutkimuksissa on usein vaikea tehtävä. Usein verrokkiryhmä joudutaan keräämään eri lähteistä kuin tapaukset ja tällöin vertailukelpoisuus saattaa olla puutteellinen. Riippuvuudet voivat tällöin tulla joko liian voimakkaiksi tai liian heikoiksi riippuen siitä onko verrokkiryhmä liian huono tai hyvä. Tietojen keruu tapaus-verrokkitutkimuksissa joudutaan usein suorittamaan takenevasti ja tällaisten historiatietojen luotettavuus ei aina ole paras mahdollinen. Myös tästä saattaa syntyä harhaisia tutkimustuloksia. Esimerkiksi tapauksilta altistus- ja vaaratekijätiedot saattavat olla huolellisemmin ja/tai useammin tallennettuja kuin verrokeilta ja haastattelu- ja kyselytutkimuksissa tapaukset saattavat muistaa verrokkeja paremmin altistus- ja vaaratekijähistoriansa. Tällöin seurauksena on harhainen tai liian voimakas riippuvuus altistus- tai vaaratekijän ja taudin välillä. Myös usein ne henkilöt, joilla on sekä tutkimuksen kohteena tauti että jokin siihen liittyvä vaaratekijä, saattavat tulla suuremmalla todennäköisyydellä valituksi tutkimusaineistoon (otokseen) kuin ne henkilöt, joilla on pelkästään ko. tauti tai vaaratekijä. Tuloksena on harhaisen korkea vaaratekijän esiintyvyys tapausten joukossa. Tapaus-verrokkitutkimuksessa ei ole mahdollista suoraan arvioida altistus- tai vaaratekijän vaikutuksen suuruutta, lisääntynyttä vaaraa tapauksilla. Epäsuorasti arviointi on kuitenkin mahdollista. Arviointi perustuu olettamuksiin: taudin ilmaantuvuus on alhainen perusjoukossa sekä tapaukset että verrokit muodostavat kumpikin erikseen satunnaisotoksen vastaavista perusjoukoista Vain harvoissa tapaus-verrokkitutkimuksissa tämä jälkimmäinen olettamus on tarkalleen voimassa, mutta käytännössä poikkeamat siitä eivät yleensä ole ratkaisevia tulosten merkitsevyyden kannalta. Tapaus-verrokki -asetelman etuja ovat: taloudellisuus nopea toteuttaminen riittävät määrät tapauksia helposti saatavissa aineisto helposti kerättävissä. Biostatistiikan peruskurssi Tutkimustyypit ja -asetelmat
Sisällysluettelo. Biostatistiikan peruskurssi 1998 i Sisällysluettelo
Sisällysluettelo Johdanto 1 Tilastollisten menetelmien käytöstä.............. 1 Oppikirjoista.......................... 1 Ohjelmistoista......................... 3 Lääketieteellisten artikkelien laatu
Lähtötason vertailut ja puutteet satunnaistamisessa.. 53 Viitteet... 54
Sisällysluettelo Johdanto 5 Tilastollisten menetelmien käytöstä........... 5 Oppikirjoista....................... 5 Ohjelmistoista...................... 8 Lääketieteellisten artikkelien laatu tilastollisesti
KLIINISEN BIOSTATISTIIKAN PERUSKURSSI
Sisällysluettelo KLIINISEN BIOSTATISTIIKAN PERUSKURSSI SISÄLLYSLUETTELO: Johdanto... 5 Tilastollisten menetelmien käytöstä... 5 Oppikirjoista... 5 Ohjelmistoista... 8 Lääketieteellisten artikkelien laatu
BIOSTATISTIIKKAA ESIMERKKIEN AVULLA
BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 2005 Biostatistiikkaa esimerkkien avulla 1 Sisällysluettelo Johdanto...3 Ohjelmistoista
Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto
Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen
Tutkimusasetelmat. - Oikea asetelma oikeaan paikkaan - Vaikeakin tutkimusongelma voi olla ratkaistavissa oikealla tutkimusasetelmalla
Tutkimusasetelmat - Oikea asetelma oikeaan paikkaan - Vaikeakin tutkimusongelma voi olla ratkaistavissa oikealla tutkimusasetelmalla Jotta kokonaisuus ei unohdu Tulisi osata Tutkimusasetelmat Otoskoko,
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12
Harjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)
Kliininen arviointi ja kliininen tieto mikä riittää?
Kliininen arviointi ja kliininen tieto mikä riittää? Riittävä tutkimuksen otoskoko ja tulos Timo Partonen LT, psykiatrian dosentti, Helsingin yliopisto Ylilääkäri, Terveyden ja hyvinvoinnin laitos Tutkimuksen
TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen 03.11.2014
TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA LUKIJAN NÄKÖKULMA 2 TAUSTAKYSYMYKSIÄ 3 Mitä tutkimusmenetelmiä ja taitoja opiskelijoille tulisi opettaa koulutuksen eri vaiheissa?
Tilastollisten aineistojen kerääminen ja mittaaminen
Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2007) 1 ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen
Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2005) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)
KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto
KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT Vesa Kiviniemi (FL) Itä-Suomen yliopisto 13.4.2010 SISÄLTÖ 1 Kokeellisen tutkimuksen tutkimustyypit 2 Kohdepopulaatio ja potilaiden valinta 3 Vertailuryhmän
Tilastollisten menetelmien käytöstä lääketieteessä... 4
Johdanto Sisällysluettelo: Tilastollisten menetelmien käytöstä lääketieteessä... 4 Tutkimustyypit ja -asetelmat... 5 Tutkimusprosessi... 5 Tutkimustyypit... 5 Kokeelliset tutkimukset, satunnaistaminen...
pitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Todennäköisyyslaskennan kertaus Satunnaismuuttujat ja tn-jakaumat Tunnusluvut χ 2 -, F- ja t-jakauma Riippumattomuus Tilastotieteen
Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta?
Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta? Matti Uhari Lääkärin ammatin harjoittaminen Akateeminen ei pelkkä suorittaja Asiantuntija potilaalle lääketieteellisestä tiedosta Biologinen/luonnontieteellinen
Tilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
Kandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
pitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1
Koesuunnittelu ja tilastolliset mallit Johdanto TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu: Johdanto Johdattelevia esimerkkejä Tilastolliset kokeet TKK (c) Ilkka Mellin (2005) 2 Koesuunnittelu: Johdanto
NÄYTÖN ARVIOINTI: SYSTEMAATTINEN KIRJALLISUUSKATSAUS JA META-ANALYYSI. EHL Starck Susanna & EHL Palo Katri Vaasan kaupunki 22.9.
NÄYTÖN ARVIOINTI: SYSTEMAATTINEN KIRJALLISUUSKATSAUS JA META-ANALYYSI EHL Starck Susanna & EHL Palo Katri Vaasan kaupunki 22.9.2016 Näytön arvioinnista Monissa yksittäisissä tieteellisissä tutkimuksissa
Tilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
Otoskoon arviointi. Tero Vahlberg
Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
Regressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
Aineistokoko ja voima-analyysi
TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla
tilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
Kokeellinen asetelma. Klassinen koeasetelma
Kokeellinen asetelma Salla Grommi, sh, verisuonihoitaja, TtM, TtT-opiskelija Hoitotyön tutkimuspäivä 31.10.2016 Klassinen koeasetelma Pidetään tieteellisen tutkimuksen ideaalimallina ns. kultaisena standardina.
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen
Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
PSY181 Psykologisen tutkimuksen perusteet, kirjallinen harjoitustyö ja kirjatentti
PSY181 Psykologisen tutkimuksen perusteet, kirjallinen harjoitustyö ja kirjatentti Harjoitustyön ohje Tehtävänäsi on laatia tutkimussuunnitelma. Itse tutkimusta ei toteuteta, mutta suunnitelman tulisi
Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa
Sisältö Kvantitatiivinen metodologia verkossa Perusteiden Kertaus Pekka Rantanen Helsingin yliopisto Tilastollinen analyysi Tilastotieteen tavoitteet Kvantitatiivisen tutkimuksen peruskäsitteitä Tilastollisten
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa
Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA
JBI: Arviointikriteerit kvasikokeelliselle tutkimukselle 29.11.2018 Tätä tarkistuslistaa käytetään kvasikokeellisen tutkimuksen metodologisen laadun arviointiin ja tutkimuksen tuloksiin vaikuttavan harhan
Matemaatikot ja tilastotieteilijät
Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat
1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto
Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi
Kvantitatiiviset tutkimusmenetelmät maantieteessä
Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.
54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Regressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.
10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn
Tilastotieteen aihehakemisto
Tilastotieteen aihehakemisto hakusana ARIMA ARMA autokorrelaatio autokovarianssi autoregressiivinen malli Bayes-verkot, alkeet TILS350 Bayes-tilastotiede 2 Bayes-verkot, kausaalitulkinta bootstrap, alkeet
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9
Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Harjoitus 2, viikko 38, syksy 2012 1. Tutustu liitteen 1 kuvaukseen Suuresta bränditutkimuksesta v. 2009. Mikä tämän kuvauksen perusteella on ko.
Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)
r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
Epävarmuuden hallinta bootstrap-menetelmillä
1/17 Epävarmuuden hallinta bootstrap-menetelmillä Esimerkkinä taloudellinen arviointi Jaakko Nevalainen Tampereen yliopisto Metodifestivaalit 2015 2/17 Sisältö 1 Johdanto 2 Tavanomainen bootstrap Bootstrap-menettelyn
Yleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:
4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2
Tilastollisen tutkimuksen vaiheet
Tilastollisen tutkimuksen vaiheet Jari Päkkilä Johdatus tilastotieteeseen Matemaattisten tieteiden laitos TILASTOLLISEN TUTKIMUKSEN TARKOITUS Muodostaa mahdollisimman hyvä mielikuva havaintoaineistosta,
Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007
EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET L2 kevät 2007 mittaaminen Biostatistiikan näkökulmasta Janne Pitkäniemi VTM, MSc (biometry) HY, Kansanterveystieteen laitos 1 Perusjoukon ja otoksen käsitteet
Teema 8: Parametrien estimointi ja luottamusvälit
Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.
MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO
8.9.2016/1 MTTTP1 Tilastotieteen johdantokurssi Luento 8.9.2016 1 JOHDANTO Tilastotiede menetelmätiede, joka käsittelee - tietojen hankinnan suunnittelua otantamenetelmät, koejärjestelyt, kyselylomakkeet
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä
HAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen
TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Johdatus tilastotieteeseen ja mittaaminen TKK (c) Ilkka Mellin (2004) 2 ja mittaaminen: Mitä opimme? 1/3 Tilastollisen tutkimuksen kaikki mahdolliset kohteet
TAPAUS-VERROKKITUTKIMUS
TAPAUS-VERROKKI TUTKIMUKSEN TYYPIT JA TULOSTEN ANALYYSI Simo Näyhä Jari Jokelainen Kansanterveystieteen ja yleislääketieteen laitoksen jatkokoulutusmeeting.3.4.2007 TAPAUS-VERROKKITUTKIMUS Idea Tutkimusryhmät
Mitä on näyttö vaikuttavuudesta. Matti Rautalahti Suomalainen Lääkäriseura Duodecim
Mitä on näyttö vaikuttavuudesta Matti Rautalahti Suomalainen Lääkäriseura Duodecim Sidonnaisuudet Päätoimi Suomalaisessa Lääkäriseurassa Duodecimissa Suomen ASH ry hallitus Tieteellinen näyttö Perustana
/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:
2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2
1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10
SISÄLTÖ 1 TILASTOJEN KÄYTTÖ 7 Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10 Tilastoaineisto 11 Peruskäsitteitä 11 Tilastoaineiston luonne 13 Mittaaminen
MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)
21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.
Testit järjestysasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten
SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?
SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?...7 TILASTO...7 TILASTOTIEDE...8 HISTORIAA...9 TILASTOTIETEEN NYKYINEN ASEMA...9 TILASTOLLISTEN MENETELMIEN ROOLIT ERI TYYPPISET AINEISTOT JA ONGELMAT...10
Parametrin estimointi ja bootstrap-otanta
Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista
Kokeellinen interventiotutkimus
Kokeellinen interventiotutkimus Raija Sipilä LT, toimituspäällikkö Suomalainen Lääkäriseura Duodecim Kriittisen arvioinnin kurssi 2.10.2017 Kiitos Käypä hoito -tiimille Interventio Interventio tarkoittaa
Mittariston laatiminen laatutyöhön
Mittariston laatiminen laatutyöhön Perusopetuksen laatukriteerityö Vaasa 18.9.2012 Tommi Karjalainen Opetus- ja kulttuuriministeriö Millainen on hyvä mittaristo? Kyselylomaketutkimuksen vaiheet: Aiheen
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13
BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali
BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto Metodifestivaali 28.5.2009 1 1 Mitä ihmettä on bootstrap? Webster: 1. a loop of leather or cloth sewn at the top rear, or sometimes on each side of a boot
Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,
Testejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N
11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
Tutkimustiedonhallinnan peruskurssi
Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt
TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,
Mitä eri tutkimusmetodeilla tuotetusta tiedosta voidaan päätellä? Juha Pekkanen, prof Hjelt Instituutti, HY Terveyden ja Hyvinvoinnin laitos
Mitä eri tutkimusmetodeilla tuotetusta tiedosta voidaan päätellä? Juha Pekkanen, prof Hjelt Instituutti, HY Terveyden ja Hyvinvoinnin laitos Päätöksentekoa tukevien tutkimusten tavoitteita kullakin oma
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012
Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko
Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA
JBI: Kriittisen arvioinnin tarkistuslista prevalenssitutkimukselle 26.3.2019 Tätä tarkistuslistaa käytetään prevalenssitutkimuksen metodologisen laadun arviointiin. Arvioinnin tarkistuslistaan sisältyy
Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin
Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:
Harjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä
Tutkimusaineiston luominen
Tutkimusaineiston luominen Johdatus kliiniseen tutkimukseen 26.8.2010 Marjo Tuppurainen Prof. Ma Naistentaudit- ja synnytykset Luu- ja rustotutkimusyksikkö UEF Yleistä Kokeellisen tutkimuksen tutkimustyypit