BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos



Samankaltaiset tiedostot
Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Estimointi. Otantajakauma

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Teema 9: Tilastollinen merkitsevyystestaus

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Perusnäkymä yksisuuntaiseen ANOVAaan

Testejä suhdeasteikollisille muuttujille

Harjoitus 7: NCSS - Tilastollinen analyysi

Väliestimointi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Otoskoon arviointi. Tero Vahlberg

Testit järjestysasteikollisille muuttujille

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTP5, luento Luottamusväli, määritelmä

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Kliininen arviointi ja kliininen tieto mikä riittää?

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Mat Tilastollisen analyysin perusteet, kevät 2007

Aki Taanila VARIANSSIANALYYSI

Tilastollinen aineisto Luottamusväli

2. TILASTOLLINEN TESTAAMINEN...

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Sovellettu todennäköisyyslaskenta B

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Mat Sovellettu todennäköisyyslasku A

pisteet Frekvenssi frekvenssi Yhteensä

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

10. laskuharjoituskierros, vko 14, ratkaisut

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

tilastotieteen kertaus

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

2. Aineiston kuvailua

Tilastollisia peruskäsitteitä ja Monte Carlo

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Sovellettu todennäköisyyslaskenta B

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Estimointi. Vilkkumaa / Kuusinen 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Kandidaatintutkielman aineistonhankinta ja analyysi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

Otoskoko 107 kpl. a) 27 b) 2654

Aineistokoko ja voima-analyysi

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Testit laatueroasteikollisille muuttujille

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Aki Taanila TILASTOLLINEN PÄÄTTELY

KAHDEN RYHMÄN VERTAILU

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Parametrin estimointi ja bootstrap-otanta

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

031021P Tilastomatematiikka (5 op) viikko 5

Ohjeita kvantitatiiviseen tutkimukseen

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Harjoitus 2: Matlab - Statistical Toolbox

SPSS-perusteet. Sisältö

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Transkriptio:

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 2) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 2005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy 2005

Tilastollisten testien valinta ja toteuttaminen...3 Hypoteesien testaaminen... 3 Testisuureiden jakaumia...6 Normaalijakauma... 6 Studentin t jakauma... 7 Khii toiseen (χ 2 ) jakauma... 9 Monivertailut... 10 P arvon käyttöön liittyviä rajoitteita ja ongelmia...11 Tilastollisten testien valintaperusteet...12 Normaalisuuden testaaminen...13 Varianssien homogeenisuustestit.16 Riippumattomien ryhmien t testi...17 Parittainen t testi...21 Luottamusväliestimointi...24 Yleistä... 24 Normaalijakaumaan perustuvat luottamusvälit... 25 Keskiarvon luottamusväli... 25 Biostatistiikkaa esimerkkien avulla 2 Janne Pitkäniemi, syksy 2005

Tilastollisten testien valinta ja toteuttaminen Hypoteesien testaaminen Tilastollisten testien avulla voidaan tutkia perusjoukkoa koskevien väittämien eli hypoteesien paikkansapitävyyttä perustuen poimittuun otokseen. Tehtävät johtopäätökset perustuvat aina siis siihen informaatioon, jonka poimittu otos perusjoukosta antaa. Koska päätökset perustuvat otokseen, täyttä varmuutta ei koskaan saada. Tilastollisten testien avulla on kuitenkin mahdollista arvioida riskiä sille, että otoksen perusteella tehty perusjoukkoa koskeva johtopäätös olisi virheellinen. Virhelähteenä on siis otoksesta johtuva satunnaisuus. Klassisen tilastollisen testauksen vaiheet voidaan jaotella seuraavasti: 1. Muodostetaan hypoteesi (ennen otoksen poimintaa) 2. Poimitaan otos ja lasketaan tarvittavat otostunnusluvut (estimointi) 3. Lasketaan testisuureen arvo otoksen perusteella 4. Testisuureen jakauman perusteella lasketaan todennäköisyys sille, että olisi saatu poikkeavampi testisuureen arvo kuin kohdassa 3 laskettu (näin saadaan p arvo) 5. Tehdään johtopäätös eli nollahypoteesi joko hylätään tai ei hylätä Hypoteesien muodostamien Otoksen poiminta Testisuureen laskenta p arvon laskenta Johtopäätösen tekeminen Hypoteesien testaamisessa voidaan erottaa kaksi perustyyppiä: yksi testattava suure monta samanaikaisesti testattavaa suuretta Hypoteesien testauksessa on kyse valinnasta kahden toisensa poissulkevan hypoteesin välillä: nollahypoteesi (H 0, null hypothesis ) vaihtoehtoinen hypoteesi (H A, alternative hypothesis ) Nollahypoteesi (H 0 ) null hypothesis on ennalta määritelty perusväittämä, jonka hyväksymiseen tai kumoamiseen tutkimuksessa pyritään. Esim., että vertailtavien lääkehoitojen A ja B tehojen välillä ei ole eroa. Vaihtoehtoinen hypoteesi (H A ) alternative hypothesis on ennalta määritelty vaihtoehtoinen väittämä nollahypoteesille. Esim., että lääkehoitojen teholla on eroa, mutta ei määritellä suuntaa (kaksisuuntainen hypoteesi) tai että hoito A on tehokkaampi kuin hoito B (yksisuuntainen hypoteesi). Tavallisimmin tutkimuksissa käytetään kaksisuuntaista hypoteesia, koska etukäteen ei yleensä voida olla täysin varmoja tuloksen suunnasta. Biostatistiikkaa esimerkkien avulla 3 Janne Pitkäniemi, syksy 2005

Esimerkki 1: Oletetaan että olemme kiinnostuneet suomalaisten keskimääräisestä kolesteroliarvosta, jota emme kuitenkaan voi suoraan havaita. Noudatetaan edellä kuvattuja tilastollisen testauksen vaiheita: 1. Tutkija muotoilee seuraavat väittämät: H 0 : perusjoukon kolesteroli keskiarvo on 7.0 mmol/l H A : perusjoukon kolesteroli keskiarvo on jotain muuta 2. Tehdään otos (7.5, 4.8, 6.3, 5.4, 2.0) ja poimitun otoksen perusteella laskimme aikaisemmin seuraavat otossuureet x = 5.2 mmol/l, n = 5, sd(x) = 2.058 mmol/l (jatkamme esimerkkiä s. 4) Testaukseen liittyvä päättelyprosessi päätyy ratkaisuun, joka on kaksiarvoinen: a) joko siten, että katsotaan tutkimuksen antavan näyttöä hoitoeroista, jolloin päätetään hyväksyä vaihtoehtoinen hypoteesi eli nollahypoteesi hylätään tai b) siten, että tutkimuksen perusteella ei saada riittävää näyttöä hoitoeroista, eli nollahypoteesi jää voimaan (ei hylätä). H 0 :a ei voida koskaan tilastollisin keinoin todistaa oikeaksi. Oikea johtopäätös päädyttäessä siihen, että H 0 jää voimaan, on esimerkiksi "tutkimuksessa ei voitu osoittaa hoitojen A ja B välille tilastollisesti merkitsevää eroa." Vaihtoehtoinen hypoteesi H A voi olla joko kaksi tai yksisuuntainen; on eroa tai on ero johonkin tiettyyn suuntaan. Valtaosassa kliinisiä vertailevia tutkimuksia vaihtoehtoinen H A on kaksisuuntainen, koska etukäteen ei voida olla täysin varmoja, ettei jokin tietty hoito voisi olla esim. lumehoitoa haitallisempikin, ainakin jossakin tutkimuksen kohteeksi valitussa potilasjoukossa. Yksisuuntaista testausta voidaan käyttää silloin, kun hypoteesin toinen suunta ei ole mielekäs tai testauksen kannalta relevantti. Esim. aiheuttaako runsas kännykän käyttö aivotoiminnan häiriöitä? Joskus yksisuuntaista testausta näkee selvästi käytettävän siitä syystä, että kaksisuuntainen testi ei ole antanut tilastollisesti merkitsevää tulosta (P < 0,05). Tämä menettely on luonnollisesti vastoin tieteen sääntöjä. Yksinkertaista ja yleispätevää ohjetta yksi tai kaksisuuntaisen testin käytöstä ei kuitenkaan voi antaa. Taloudelliset syyt saattavat puoltaa yksisuuntaisen testin käyttöä, koska silloin selvitään paljon pienemmällä potilasmäärällä. Biostatistiikkaa esimerkkien avulla 4 Janne Pitkäniemi, syksy 2005

Käytännössä tilastollinen testaus ei anna koskaan täysin varmaa päätöstä kumpaankaan suuntaan, vaan päätöksiin sisältyy virhemahdollisuus. Edellä esitetyssä hoitokoe esimerkissä päätöksentekoon liittyvät virheet voidaan esittää seuraavanlaisena nelikenttänä: Päätös tutkimuksen/ otoksen perusteella H 0 hylätään (hoitoeroa on) H 0 :aa ei hylätä (ei hoitoeroa) Todellinen tilanne Hoitoero Kyllä Ei Voima 1 I lajin virhe II lajin virhe 1 Otoksen perusteella tehtävään päätökseen liittyviä virheitä on siis kahta tyyppiä: virhe, hylkäämisvirhe, eli I lajin virhe: H 0 hylätään, vaikka se todellisuudessa pitää paikkansa. Esim. tehdään johtopäätös, että eri hoitojen välillä on eroa, vaikka sitä todellisuudessa ei ole. Syynä voi olla esimerkiksi sattuma tai väärä testi. virhe, hyväksymisvirhe, eli II lajin virhe: H 0 jää voimaan, vaikka se onkin väärä ja pitäisi siten hylätä. Esim. tehdään johtopäätös, että eri hoitojen välillä ei ole eroa, vaikka sitä todellisuudessa on. Syynä voi olla riittämätön aineistokoko tai väärä testi. virhe on sama kuin tilastollinen merkitsevyystaso ( statistical significance level ). virhe voi olla yksi tai kaksisuuntainen. Aineistokoolla ei ole vaikutusta virheen esiintymismahdollisuuteen. Testin voimakkuus on virheen funktio 1. Se arvioidaan ensisijaisesti tutkimuksen suunnitteluvaiheessa tai toissijaisesti tutkimustulosten luotettavuutta tarkasteltaessa. virhe on aina yksisuuntainen. Kun testattavassa suureessa, esimerkiksi kliinisten vertailtavien tutkimusten lopputulosmuuttujassa, todetaan ero, se voi johtua satunnaisvaihtelusta, satunnaisvaihtelusta ja hoitoerosta, tai satunnaisvaihtelusta ja harhasta Tilastollisessa tutkimuksessa pyritään tutkimaan voiko todettu ero selittyä satunnaisvaihtelulla. Harhan mahdollisuuksia pyritään välttämään mm. valitsemalla vertailuryhmä oikein. Esimerkki 1: (jatkuu sivulta 2) Biostatistiikkaa esimerkkien avulla 5 Janne Pitkäniemi, syksy 2005

3. Lasketaan havaittu testisuureen arvo poimimamme otoksen perusteella, yleensä tietokonetta ja valittua tilasto ohjelmaa apuna käyttäen. Testisuureen laskentakaava saadaan tilastotieteellisestä kirjallisuudesta ja sitä ei soveltavan tutkijan tarvitse itse päätellä. Meidän esimerkki tapauksessa se on muotoa ( x µ 0) 5.2 7 t = = = 1.956 sd( x) / n 2.058/ 5 4. Verrataan testisuureen teoreettiseen jakaumaan joka on tässä tapauksessa t jakauma ja saadaan p arvo=0.122. 5. Tehdään johtopäätös: H0:aa ei hylätä, joten poimimamme otos on voinut tulla perusjoukosta, jonka kolesteroli keskiarvo on 7.0 mmol/l. Testisuureiden jakaumia Tavallisimmat testisuureiden jakaumat jotka tutkimusta tehdessä tutkija kohtaa ovat 1) normaalijakauma, 2) Studentin t jakauma ja 3) khii toiseen (χ 2 ) jakauma. Näitä jakaumia tarvitsemme tämän kurssin kuluessa ja siksi tarkastelemme niitä seuraavassa hieman tarkemmin. Tilastollisten jakaumat ovat keskeisessä osassa tilastollisessa testauksessa, koska jokaisella testisuureella on ns teoreettinen jakauma jonka perusteella p arvo lasketaan. Normaalijakauma Esimerkiksi on luonnollista olettaa että jatkuva satunnaismuuttuja kuten ihmisten kolesteroliarvo noudattaa normaalijakaumaa. Normaalijakauman tiheysfunktiota merkitään yleisesti: N ( µ, σ ). Tässä µ on normaalijakauman odotusarvo ja σ keskihajonta. Usein tarvitaan normaalijakaumaa jonka odotusarvo on 0 ja hajonta 1 ja sen tiheysfunktio on seuraavan näköinen: Biostatistiikkaa esimerkkien avulla 6 Janne Pitkäniemi, syksy 2005

Normaalijakauma (0,1) dnorm(x, 0, 1) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x Tämä on ns. standardoitu normaalijakauma. Useat testit olettavat muuttujan arvojen otoksessamme noudattavan normaalijakaumaa ja tällöin testataan havaintojen yhteensopivuutta normaalijakauman kanssa. Studentin t jakauma Testisuure t, johon tutustuimme ensimmäisenä esimerkki 1:ssä oli t jakautunut. t jakauma lähestyy em. standardoitua normaalijakaumaa kun otoskoko kasvaa. Sitä tarvitaan koska käytännössä lähes aina joudumme laskemaan otoksestamme (estimoimaan) kiinnostavan muuttujan otoskeskihajonnan, koska sitä ei yleensä tunneta etukäteen. t jakaumaan liittyy vapaus asteen käsite. t jakauman muoto riippuu otoskoosta ja alle onkin piirretty t jakauman tiheysfunktioita otoskoon arvoilla 3 ja 10. t jakauma t distribution on yksi yleisimmin käytetyistä todennäköisyysjakaumista Normaalijakauman ohella. Jakauman muotoa säätelee parametri nimeltä vapausaste, jonka laskentakaava riippuu tutkimusaineiston koosta ja jakauman käyttötarkoituksesta. Jakaumasta käytetään myös nimitystä Studentin t jakauma. Se on Normaalijakaumaa litteämpi ja pitkähäntäisempi. Biostatistiikkaa esimerkkien avulla 7 Janne Pitkäniemi, syksy 2005

Normaalijakauman N(0.1) and t jakauma 3 ja 10 vapausastetta tiheysfunktiot dnorm(x, 0, 1) 0.0 0.1 0.2 0.3 0.4 N(0,1) t(3) t(10) 4 2 0 2 4 x Esimerkki 1 : Seuraava kuva havainnollistaa tilastolliseen testaamiseen liittyvää p arvon laskentaa. Olemme ensin laskeneet edellä kuvatulla tavalla testisuureen arvon aineistoomme perusteella ja saaneet vastauksen t= 1.956. Tarkastelemme seuraavaksi testisuureen jakaumaa. Koska olimme kiinnostuneet perusjoukon kolesteroli keskiarvon poikkeamisesta alas tai ylöspäin on kyseessä kaksisuuntainen testaus. Etsimme todennäköisyyttä millä testisuure voisi poiketa vielä enemmän kuin mitä havaitsimme. Tätä havainnollistaa seuraava kuva. Biostatistiikkaa esimerkkien avulla 8 Janne Pitkäniemi, syksy 2005

t jakauma 4 vapausastetta tiheysfunktio dt(x, 4) 0.0 0.1 0.2 0.3 t(4) laskettu t= 1.956 pinta ala 0.061 p arvo=jakauman häntien pinta ala 0.122 laskettu t=1.956 pinta ala 0.061 4 2 0 2 4 t Khii toiseen (χ 2 ) jakauma χ 2 jakaumaa (chi squared distribution) tarvitaan kun testataan lukumäärien/prosenttiosuuksien eroja tai yhteensopivuuksia jonkin teoreettisen jakauman kanssa. Sen tiheysfunktio on positiivinen, vino ja sen jakauman muoto (ja siis täten myös p arvo riippuu) vapausasteista, kuten t jakaumallakin. Alla on muutamia khiitoiseen jakaumia esimerkin omaisesti, mutta ne tulevat tutuiksi jatkossa. Biostatistiikkaa esimerkkien avulla 9 Janne Pitkäniemi, syksy 2005

Khii toiseen jakauma 3,5, 10 ja 20 vapausastetta tiheysfunktiot dchisq(x, 3) 0.00 0.05 0.10 0.15 0.20 0.25 X2(3) x2(5) X2(10) X2(20) 0 10 20 30 40 50 x Monivertailut Monivertailutestaustilanne syntyy silloin, kun a) päälopputulosmuuttujan ohella vertaillaan useita muita lopputulosmuuttujia (jotka on valittu joko ad hoc tai post hoc), joiden testaamiseen ei voimalaskelmissa ole varauduttu b) kun vertaillaan pareittain tuloksia useina ajankohtina tai samana ajankohtana useiden ryhmien välillä c) tehdään osaryhmäanalyysejä d) tehdään välianalyysejä. Monivertailutestaustilanne kasvattaa virheen mahdollisuutta ja siksi monivertailutesteissä ( multiple comparison test ) suoritetaankin virheen korjaus.. Bonferroni korjaus Bonferroni correction on monivertailujen yhteydessä käytetty P arvojen korjausmenettely, jonka tavoitteena on säilyttää alkuperäinen tilastollinen merkitsevyystaso ( virhe) alun perin suunnitellun suuruisena monivertailuista huolimatta. Tavallisimmin käytetty taso on 0,05 (5 %). Bonferronikorjauksella korjattu P arvo saadaan kertomalla testin antama P arvo vertailujen lukumäärällä. Tällä korjauksella on taipumus ylikorjata, koska se olettaa monivertailut toisistaan riippumattomiksi, mitä ne eivät yleensä käytännössä ole. Ainoa oikea tapa käsitellä monivertailuongelmaa on käyttää sellaisia tilastollisia menetelmiä ja testejä, jotka on suunniteltu tähän tarkoitukseen: toistomittausten ANOVA, Friedmanin testi, Cochranin Q testi, erilaiset monivertailutestit. Biostatistiikkaa esimerkkien avulla 10 Janne Pitkäniemi, syksy 2005

Kliinisten tutkimusten suunnitelmissa tulisi ilmoittaa mahdollisimman tarkasti, mitä hypoteeseja on tarkoitus testata ja kuinka testit tai erilaiset vertailut tullaan suorittamaan (suunnitellut vertailut, ad hoc comparisons ). Usein varsinaisten hypoteesien lisäksi tutkimusprosessin analyysivaiheessa kehitellään lisähypoteeseja, valitaan niihin soveltuvat testit ja vertailutavat (jälkikäteisvertailut, post hoc comparisons ). Nämä testaukset tulkitaan kuitenkin suoritetun tutkimuksen kannalta toisarvoisiksi. Lähinnä niillä on merkitystä jatkotutkimusten kehittelyn kannalta. P arvon käyttöön liittyviä rajoitteita ja ongelmia P arvon määrittely edellyttää käsitteiden testisuure ja sen otosjakauma määrittelyä. Testisuureella tarkoitetaan mitä tahansa nollahypoteesin testaamiseen käytettyä otossuuretta, otoksen havaintoarvojen funktiota. Testisuureen otosjakauma on kaikkien mahdollisten testisuureen saamien arvojen muodostama jakauma. P arvo määritellään seuraavasti: P arvo P value on havaintoaineiston ja käytetyn testisuureen otosjakauman perusteella laskettu todennäköisyys saada lopputulos, joka on vähintään yhtä epätodennäköinen (harvinainen) kuin tutkimuksessa todettu lopputulos edellyttäen, että todellisuudessa nollahypoteesi (H 0 ) olisi tosi. P arvo liittyy ainoastaan H 0 :n testaamiseen, eikä kerro esimerkiksi hoitoerosta mitään, toisin kuin luottamusväli. Jonkin todetun eron biologinen tai lääketieteellinen merkitsevyys on eri asia kuin tilastollinen merkitsevyys. Tästä syystä artikkeleissa kannattaa käyttää jälkimmäisestä termiä statistically significant. Kliinisen merkitsevyyden arviointia helpottaa, kun ei tyydytä pelkkään P arvoon, vaan keskeisimmille lopputulosmuuttujille lasketaan myös luottamusvälit. Vaikka P arvo ei antaisikaan esim. ryhmien välille tilastollisesti merkitsevää hoitoeroa, niin luottamusväli voi paljastaa, että käytännön kannalta eroa saattaisi olla, mikä näkyy esim. välin kapeutena ja selvänä epäsymmetrisyytenä nollan suhteen. Isoilla aineistoilla kliinisesti merkityksettömätkin erot saattavat tulla tilastollisesti erittäin merkitseviksi, esim. P< 0,0001. Vakiintunut käytäntö vetää tilastollisesti merkitsevän ja ei merkitsevän ( non significant ) tuloksen raja tasolle 0.05 ei perustu mihinkään matemaattiseen tosiseikkaan. Se on täysin keinotekoinen valinta ja aiheuttaa paljon harhakäsityksiä. Esim. tutkija saattaa raportoida P arvoon 0,051 päätyneen tuloksen tilastollisesti eimerkitsevänä, kun taas joku toinen tutkija samankaltaisesta tutkimuksesta saamansa Biostatistiikkaa esimerkkien avulla 11 Janne Pitkäniemi, syksy 2005

tuloksen P = 0,049 tilastollisesti merkitseväksi. Jos tutkijat eivät ilmoita P arvoa, niin lukijalla ei ole mahdollista arvioida tulosten merkitystä. Koko tilastollisen testauksen periaatteet on täysin väärin ymmärretty, mikäli näillä kahdella tuloksella katsottaisiin olevan jotain eroa käytännön kannalta. On syytä muistaa, että eri ohjelmienkin tuottamat P arvot samasta testistä voivat vaihdella jonkin verran, ja joskus jopa paljon, riippuen siitä, minkälaista laskenta algoritmia mikäkin ohjelma käyttää. Käsitteitä melkein merkitsevä ( almost significant ), merkitsevä ( significant ) ja erittäin merkitsevä ( highly significant ) ei nykysuositusten mukaan tulisi käyttää. Ne ovat peräisin taulukoiden laadinnasta ja antavat P arvon luonteesta väärän kuvan. Useimmissa tilanteissa P arvo kannattaa antaa ns. tarkkana, siten että siinä on korkeintaan neljä desimaalia ja kaksi merkitsevää numeroa, esim. P = 0,0032, P = 0,0002 tai P < 0,0001. Tätä pienemmät P arvot eivät ole mielekkäitä, koska P arvo liittyy vain virheeseen. Jonkin geneettisen ominaisuuden esiintymistodennäköisyys voisi olla 3,2*10 6 (eli 3,2/1 000 000). P arvon kohdalla näin pieni arvo ei anna enempää varmuutta H 0 :n oikeellisuudesta kuin mitä arvo 0,0001 antaisi. Tilastollisten testien valintaperusteet Tilastollisten testien valintapäätös on yleensä melko monitahoinen asia. Testi tulisi valita siten, että se on riittävän herkkä toteamaan eroja jos niitä on olemassa, mutta toisaalta se ei saisi olla myöskään liian optimistinen. Ainakin alla esitettyihin asioihin pitää ottaa kantaa sopivaa testiä mietittäessä: Aineiston rakenne / testausasetelma Riippumattomat independent otokset/ryhmät Riippuvat related, dependent otokset/ryhmät Kaltaistetut matched otokset/ryhmät Mitta asteikko Välimatka/suhdeasteikko Järjestysasteikko Laatueroasteikko Binomiaalinen asteikko (kaksiluokkainen) Otosten/ryhmien lukumäärä Yksi Kaksi Yli kaksi Testauksen tarkoitus Heterogeenisuus Trendi Assosiaatio Biostatistiikkaa esimerkkien avulla 12 Janne Pitkäniemi, syksy 2005

Aineiston koko Kohtalainen (yli 30 ryhmää kohden) Pienehkö (10 30 ryhmää kohden) Pieni (alle 10 ryhmää kohden) Jakauma Normaali / Log normaali Binomi Poisson Monissa tilastopaketeissa on sisäänrakennettuna ohjelmamoduuleja statistical adviser, statistical navigator, tutor, guide, wizard, jotka avustavat tutkijaa testitai menetelmävalinnoissa. Nämä ohjelmien valikot tai niiden esittämät kysymykset perustuvat mm. yllä esitettyihin valintaperusteisiin. Lisäksi usein niissä kerrotaan testien ja menetelmien käyttöedellytyksistä. Normaalisuuden testaaminen Monissa lääketieteellisissä aineistoissa muuttujien jakauman normaalisuuden tarkistaminen on aiheellista, koska hyvin usein normaalisuusoletus ei ole voimassa. Tällöin on syytä välttää sellaisia menetelmiä ja testejä, jotka voimakkaasti perustuvat normaalisuuteen. Esimerkiksi paljon käytettyä t testiä luonnehditaan yleensä melko robustiksi testiksi, mikä tarkoittaa, ettei se ole kovin herkkä poikkeamille niistä oletuksista, joihin testi perustuu. Poikkeavat havaintoarvot aiheuttavat kuitenkin herkästi t testin nimittäjässä olevan keskivirheen kasvamisen, jolloin testistä tulee konservatiivinen, ylivarovainen. Kaksi tavallisimmin käytettyä testiä normaalisuuden tarkistamiseen ovat Shapiro Wilkin W ja Kolmogorov Smirnovin testit. Esim. Tietokanta datasetb. Ongelma: Onko muuttujan weigth jakauma normaalinen? SPSS ohjelmalla saadaan seuraavat tulokset: Normaalijakauman referenssikäyrä histogrammiin saadaan valikoista Graphs Histogram, kun klikataan lokero Display normal curve Biostatistiikkaa esimerkkien avulla 13 Janne Pitkäniemi, syksy 2005

25 20 Frequency 15 10 5 0 50,00 60,00 70,00 80,00 90,00 100,00 110,00 weigth (kg) Mean = 76,2376 Std. Dev. = 12,08334 N = 200 Normaalisuustestit löytyvät valikoista: Analyze Descriptive Statistics Explore. Kohtaan Dependent list viedään tutkittava muuttuja weight. Kohdasta Plots klikataan lokerot Normality plots with tests ja Histogram. Tulos: Tests of Normality Kolmogorov Smirnov a Shapiro Wilk Statistic df Sig. Statistic df Sig. weigth (kg),066 200,033,982 200,012 a. Lilliefors Significance Correction Tulkinta: Molemmat testit antavat tuloksen P<0,05, joten muuttujan weight jakauma poikkeaa Normaalijakaumasta, tosin ei kovin dramaattisesti kuten histogrammi osoittaa. Histogrammin perusteella weight:n jakauma muistuttaa Lognormaalia jakaumaa. Tehdään Transform kohdassa muunnos Lnweight=LN(weight). Tulos: Biostatistiikkaa esimerkkien avulla 14 Janne Pitkäniemi, syksy 2005

Tests of Normality Kolmogorov Smirnov a Shapiro Wilk Statistic df Sig. Statistic df Sig. lweight,060 200,079,992 200,319 a. Lilliefors Significance Correction Tulkinta: Koska molemmissa testeissä P>0,05, niin todetaan, että logaritmimuunnos korjasi muuttujan weight vinouden, joten muuttujalle Lnweight Normaalisuusoletus on voimassa. Normal Q Q Plot of weigth (kg) 3 2 Expected Normal 1 0 1 2 3 40 60 80 100 120 Observed Value Yllä olevalla kuviolla on monta englanninkielistä nimeä: Normal probability plot, Quantile quantile eli Q Q plot tai probit plot. Kuviossa x akselilla on havaitut arvot ja y akselilla normaalijakaumaan perustuvat odotusarvot. Mikäli jakauma noudattaisi täysin normaalijakaumaa, niin pisteet sijoittuisivat kuviossa olevalle suoralle viivalle. Kuvioista saadaan kuitenkin vain visuaalinen käsitys siitä, missä määrin ja miltä osin jakauma poikkeaa normaalijakaumasta. Tulkinta: Tässä tapauksessa muuttujan weight perusteella saatu käyrä on muodoltaan lievästi kupera, mikä viittaa siihen, että jakaumassa on pidempi häntä oikealle, eli jakauman sanotaan olevan positiivisesti vino (oikealle vino). Tämän tyyppinen jakauma korjaantuu usein normaaliseksi log muunnoksella (lognormaalinen jakauma), kuten edellä todettiinkin. Mikäli pisteistön muodostama kuvio olisi kovera, niin kyseessä olisi negatiivisesti (vasemmalle vino) jakauma. Tällöin exp(x) muunnosta Biostatistiikkaa esimerkkien avulla 15 Janne Pitkäniemi, syksy 2005

kannattaa kokeilla jakauman normalisoimiseksi. Mikäli pisteistä muodostuva kuvio olisi S:n muotoinen, niin jakaumalla olisi normaalijakaumaa pidemmät hännät molempiin suuntiin. Tällöin kannattaisi kokeilla käänteismuunnosta 1/x normaalisuuden saavuttamiseksi. Varianssien homogeenisuustestit Joissakin testeissä edellytetään vertailtavien ryhmien varianssien homogeenisuutta. Tämän tutkimiseksi käytämme testiä, jonka saamme kätevästi SPSS:llä jossa nollahypoteesi on siis että tutkittavan muuttujan varianssit ovat samat eri ryhmissä. Esim. Tietokanta datasetb. Ongelma: Onko muuttujan weight varianssi sama sekä korkean ja matalan sosioekonomisen asemassa olevilla (sesdic 1=korkea SES, 0=keski tai matala SES)? SPSS:llä varianssien homogeenisuus voidaan testata Levenen testillä valikoista: Analyze Compare means Independent Samples t test asettamalla testattava muuttuja weight kohtaan test variable ja kohtaan grouping variable ryhmämuuttuja sesdic. Lisäksi määrittelemme ryhmä muuttujat arvot kohdasta define groups group1 : 0 ja group2 : 1 Tulos: Independent Samples Test Levene's Test for Equality of Variances weigth (kg) Equal variances assumed F Sig.,314,576 Tulkinta: Koska tämä arvo on selvästi suurempi kuin yleisesti kriittisenä arvona pidetty 0,05, niin varianssien homogeenisuusoletus jää voimaan. Biostatistiikkaa esimerkkien avulla 16 Janne Pitkäniemi, syksy 2005

Riippumattomien ryhmien t testi Käyttötilanne: Halutaan verrata kahden toisistaan riippumattoman ryhmän (esimerkiksi kahden hoitoryhmän) keskiarvoja toisiinsa t testillä. t testi on moniin eri testaustilanteisiin soveltuva parametrinen testi, joka perustuu t jakaumaan. Testistä on olemassa monia eri versioita. Testin perusmuoto on: t = [(otossuure) (hypoteettinen arvo)] / (otossuureen keskivirhe). Testistä on olemassa monia eri versioita riippuen siitä, kuinka nimittäjässä olevan keskivirhe arviointi ja vapausasteiden laskentatavasta. Riippumattomien ryhmien t testi independent sample t test on erityismuoto t testistä. Sitä käytetään kahden toisistaan riippumattoman ryhmän, keskiarvojen vertailuun. Testattavan suureen oletetaan noudattavan normaalijakaumaa. Testistä on olemassa kaksi perusmuotoa, riippuen siitä ovatko vertailtavien ryhmien varianssit homogeeniset vai heterogeeniset. Jälkimmäiseen tapaukseen tilastopaketeista löytyy monia testin modifikaatioita. Ne perustuvat erilaisiin vapausasteiden muuntamistapoihin, joilla testisuure saadaan noudattamaan normaalijakaumaa. Käyttötilanne: Halutaan verrata keskiarvoja kahden toisistaan riippumattoman ryhmän, esim. hoito ja kontrolliryhmän välillä. Riippumattomuus tarkoittaa, että vertailtavissa ryhmissä ei saa olla esim. samoja koehenkilöitä. Oletetaan, että (x 1,, x n1 ) ja (x 1,, x n2 ) ovat havaintoarvoja jatkuvasta muuttujasta x kahdessa toisistaan riippumattomassa ryhmässä 1 ja 2. Lasketaan ryhmien keskiarvot x1ja x 2 ja keskihajonnat SD 1 ja SD 2 sekä otoskoot n 1 ja n 2 Studentin t testi lasketaan kaavoilla: Biostatistiikkaa esimerkkien avulla 17 Janne Pitkäniemi, syksy 2005

t = x1 x2, SE(x x ) 1 SE( x1 x2 SD p = (n 1 2 ) = SD p 1 + n 1 1 n 2 1) SD1 + (n2 1) SD n + n 2 SD p on ryhmien 1 ja 2 yhdistetty hajonta. Olettamukset t testin käytölle: 1 2 2 1. Muuttujan x jakauma tulee likimain normaalinen 2. Havaintoarvojen vertailtavien ryhmien sisällä tulee olla toisistaan riippumattomia. 3. Varianssit ovat homogeeniset Olettamus kaksi on testin kannalta olennainen. Testi ei sovellu toisistaan riippuville havaintoarvoille. Riippuvuus voisi syntyä esim. siten, että vertailtavissa ryhmissä on samoja henkilöitä tai vertailtavien ryhmien sisällä on toistomittauksia samoista henkilöistä. Toistomittausten huomioon ottaminen edellyttää erityismenetelmiä. Varianssien homogeenisuus voidaan testata Levenen testillä. Mikäli testin antama P arvo on alle 0,05, homogeenisuusoletus hylätään. Tähän tilanteeseen on olemassa useita t testin modifikaatioita, jotka tavallisimmat tilastopaketit laskevat. Usein tässä tilanteessa kannattaa kuitenkin käyttää Mann Whitneyn U testiä. 2 2 Esim. Tiedosto: datasetb.sav. Ongelma: Halutaan testata onko korkean js matalan SES ryhmien (sesdic=1 jos SES on 1 tai 2 eli korkeimmat ryhmät, 0 muuten SES 3,4 tai 5) välillä eroa muutosmuuttujan vuoden 1950 painon keskiarvoissa. SPSS:llä tehtävä suoritetaan valikoista: Analyze Compare means Independent Samples t test asettamalla Test variable =weight1950 ja Grouping variable =sesdic. Tulos: Group Statistics weigth (kg) Sosio economic status (1=low (SES 1,2) 0= 0 1 Std. Error N Mean Std. Deviation Mean 143 76,4988 12,13502 1,01478 57 75,5825 12,03452 1,59401 Biostatistiikkaa esimerkkien avulla 18 Janne Pitkäniemi, syksy 2005

Independent Samples Test t test for Equality of Means t df Sig. (2 tailed) Mean Difference Std. Error Difference weigth (kg) Equal variances Equal variances assumed not assumed,483,485 198 103,863,629,629,91636,91636 1,89642 1,88962 95% Confidence Interval of the Difference Lower Upper 2,82342 2,83088 4,65613 4,66359 Sosio economic status (1=low (SES 1,2) 0=: 0 20 15 Frequency 10 5 0 60,00 70,00 80,00 90,00 100,00 110,00 weigth (kg) Mean = 76,4988 Std. Dev. = 12,13502 N = 143 Biostatistiikkaa esimerkkien avulla 19 Janne Pitkäniemi, syksy 2005

Sosio economic status (1=low (SES 1,2) 0=: 1 12 10 8 Frequency 6 4 2 0 50,00 60,00 70,00 80,00 90,00 100,00 110,00 weigth (kg) Mean = 75,5825 Std. Dev. = 12,03452 N = 57 Tulkinta: Koska Levenen testiin liittyvä F testi antaa tulokseksi P>0,05, niin oletusta varianssien yhtä suuruudesta ei hylätä ja tuloksia pitää tarkastella kohdasta Equal variances assumed. Keskiarvoeroksi tulee 0.92 ja P arvoksi 0,62, joka on täsmälleen sama kuin mitä yleisesti pidetään tilastollisen merkitsevyyden rajana. Tarkastelemalla ryhmien korkea ja matala sosioekonominen painon jakaumia todetaan että t testin käytön kannalta ei ole ongelma. Biostatistiikkaa esimerkkien avulla 20 Janne Pitkäniemi, syksy 2005

Parittainen t testi (ylimääräinen luku, ei pakollinen) Parittainen t testi Paired t test/mached pair t test on erityismuoto t testistä ja sitä käytetään kahden parittaisen ryhmän, esim. kaltaistettujen parien tai samojen henkilöiden toistomittausparien muodostaman erotusmuuttujan testaamiseen. Käyttötilanne: Halutaan verrata keskiarvoja kahdessa toisistaan riippuvassa ryhmässä Oletetaan, että (x 1i, x 2i ), i = 1,..., n ovat pareittaisia havaintoarvoja muuttujasta x joko a) parikaltaistetuissa ryhmissä 1 ja 2 tai b) saman ryhmän toistettuja mittausarvoja, esimerkiksi kahtena ajankohtana. Lasketaan erotukset d i = x 2i x 1i, i = 1,..., n ja erotusmuuttujan d keskiarvo d, keskihajonta SD d ja keskivirhe SE d = SD / n. Laskentakaava: d / SE d Tämä suure noudattaa Studentin t jakaumaa vapausastein df = n 1. Studentin t jakauma on muodoltaan hivenen litteämpi kuin normaalijakauma, ts. sillä on pidemmät hännät sekä vasemmalle että oikealle. Jakauman litteyden määrää vapausaste df. Kun df kasvaa t jakauma lähestyy normaalijakaumaa. Kun n on suuruusluokkaa 30, jakaumat ovat lähes yhtenevät. Olettamukset parittaisen t testin käytölle: 1. Differenssimuuttujan d jakauma tulee olla likimain normaalinen 2. Havaintoarvojen ryhmän/toiston sisällä tulee olla toisistaan riippumattomia. Huom. Olettamus 1 ei tarkoita, että muuttujan x jakauman tarvitsisi olla normaalinen ryhmissä 1 ja 2. Riittää, kun d noudattaa likimain normaalijakaumaa. t testi ei ole kovin herkkä poikkeamalle normaalisuudesta, eli testi on tässä suhteessa ns. robustinen. Kovin pienillä aineistoilla (alle 10) poikkeavilla havaintoarvoilla voi olla suuri vaikutus t testin tulokseen ja t testistä tulee konservatiivinen (varovainen), koska testisuureen nimittäjässä oleva keskivirhe kasvaa. Lisäksi normaalisuudesta on vaikea varmistua ja silloin kannattaa käyttää t testin parametritonta vaihtoehtoa, Wilcoxonin parittaista testiä. Olettamus kaksi on testin kannalta olennainen. Testi ei sovellu toisistaan riippuville havaintoarvoille. Riippuvuus voisi syntyä esim. seuraavasti: 30 henkilöltä on mitattu verenpaine kolme kertaa ja t testi lasketaan ikään kuin havaintoja olisi 90. Toistomittausten huomioon ottaminen edellyttää erityismenetelmiä. Esimerkki Halutaan tietään onko kolesteroliarvot muuttuneet esimerkki aineistossamme (datasetb) vuodesta 1950 vuoteen 1962 tilastollisesti merkitsevästi? Biostatistiikkaa esimerkkien avulla 21 Janne Pitkäniemi, syksy 2005

Asetelma: mittaus 1950 mittaus 1962 datasetb.sav kolesteroli muuttuja ja niiden erotus: id chol1950 chol1962 erotus (d i ) 5 13,50 14,50 1,00 6 11,67 13,61 1,94 7 12,17 15,28 3,11 8 11,28 15,06 3,78 10 10,28 13,39 3,11 11 14,44 18,11 3,67 14 15,67 13,11 2,56 20 18,22 16,67 1,55 21 12,56 17,28 4,72 22 20,17 15,33 4,84 Testataan aluksi differenssimuuttujan d i normaalisuusoletuksen paikkansapitävyys. SPSS:llä normaalisuustestit löytyvät valikoista: Analyze Descriptive Statistics Explore. Kohtaan Dependent list viedään tutkittava muuttuja choldiff. Kohdasta Options klikataan lokerot Normality plots with tests ja Histogram Tulos: Tests of Normality(b) Kolmogorov Smirnov(a) Shapiro Wilk Statistic df Sig. Statistic df Sig. choldiff,084 143,015,980 143,039 a Lilliefors Significance Correction b Sosio economic status (1=low (SES 1,2) 0= = 0 Tulkinta: Molemmilla testeillä P<0,05, joten normaalisuusoletus hylätään. Biostatistiikkaa esimerkkien avulla 22 Janne Pitkäniemi, syksy 2005

Kokeillaan muuttuja muunnosta eli otetaan logaritmit kummastakin muuttujasta ja testataan logaritmoitujen muuttujien erotusta. Tests of Normality b Kolmogorov Smirnov a Shapiro Wilk Statistic df Sig. Statistic df Sig. lcholdiff,075 143,049,983 143,065 a. Lilliefors Significance Correction b. Sosio economic status (1=low (SES 1,2) 0= = 0 Tulkinta: Vieläkään ei saavutettu erinomaista normaalisuutta mutta 5% merkitsevyystasolla normaalisuus oletusta ei hylätä. Huom. Näin pienellä aineistokoolla differenssimuuttujan normaalisuusoletuksen varmistaminen voi olla ongelmallista. Yksikin poikkeava havaintoarvo saattaa kasvattaa keskivirhettä ja tehdä t testistä konservatiivisen, eli antaa liian suuren P arvon. SPSS: Parittainen t testi löytyy valikoista: Analyze Compare means Paired Samples t test viemällä lokeroon Paired variables muuttujat lchol1950 ja lchol1960. Tulos: Paired Samples Statistics Pair 1 lchol1950 lchol1962 Std. Error Mean N Std. Deviation Mean 2,6409 200,21042,01488 2,6300 200,18847,01333 Biostatistiikkaa esimerkkien avulla 23 Janne Pitkäniemi, syksy 2005

Paired Differences Paired Samples Test Mean Std. Deviation Std. Error Mean Pair 1 lchol1950 lchol1962,01093,20349,01439 t df Sig. (2 tailed) 95% Confidence Interval of the Difference Lower Upper,01744,03930,760 199,448 Tulkinta: Koska P>0,05 (p=0.448) niin kolesteroliarvoissa ei ole tapahtunut tilastollisesti merkitsevää muutosta. Luottamusväliestimointi Yleistä Kaikille tärkeimmille tutkimustuloksille tulisi aina laskea luottamusvälit. Ne antavat käsityksen tulosten varmuudesta, ts. kuinka paljon ilmoitetut tulokset voisivat vaihdella otantavaihtelusta johtuen. Luottamusvälien laskenta on osa estimointia. Estimoinnilla estimation tarkoitetaan tutkittavan ilmiön kuvaamiseen käytetyn mallin tai jakauman sisältämien tuntemattomien suureiden, parametrien, arviointia tutkimusaineiston (otoksen/otosten) perusteella. Estimointitapoja on kahta päätyyppiä: piste estimointia ( point estimation ) ja luottamusväliestimointia ( confidence interval estimation ) Piste estimointi on tuntemattoman suureen, eli parametrin, (esim. jonkin taudin yleisyys) arviointi yhdellä lukuarvolla (estimaatilla), joka on laskettu havaintoaineistosta. Otossuure sample statistic on otoksen havaintoarvojen perusteella laskettu suure, havaintoarvojen funktio. Estimaattori sample statistic on otossuure, jolla tuntematonta parametria arvioidaan. Parametri parameter on tuntematon suure, joka säätelee tutkittavan ilmiön Biostatistiikkaa esimerkkien avulla 24 Janne Pitkäniemi, syksy 2005

kuvaamisessa käytettyä mallia, esim. jotain teoreettista jakaumaa. Arvioidaan tutkimusaineiston perusteella. Normaalijakaumaan perustuvat luottamusvälit Monet likimääräisistä luottamusväleistä perustuvat normaalijakaumaan. Luottamusvälien laskentakaava on muotoa: Alaraja : ˆ z /2 SE( ˆ), Yläraja : ˆ + z1 /2 1 SE( ˆ), Kaavassa ˆ on tarkasteltavan suureen piste estimaatti, SE( ˆ) sen keskivirhe ja z 1 /2 standardin normaalijakauman (keskiarvo 0, hajonta 1) prosenttipiste, joka on 95% luottamusvälille 1.96 eli noin 2. Keskiarvon luottamusväli Tärkeimmille tutkimustuloksille, lopputulosmuuttujille, on tapana ilmoittaa pisteestimaatin ohella myös luottamusväli. Mikäli kyseessä on jatkuva muuttuja ja sen aritmeettinen keskiarvo, niin 100(1 α) %:n luottamusväli lasketaan kaavalla: Alaraja : x t 1) SD/ n, Yläraja : x + t 1) 1 /2 (n 1 /2 (n SD/ n Kaavassa t 1 /2 (n 1) on Studentin t jakauman prosenttipiste vapausastein n 1, x on aineistosta (x 1, x 2,, x n ) laskettu aritmeettinen keskiarvo ja SD / n on keskiarvon keskivirheen arvio. Esim. Tietokanta datasetb. Muuttuja: dias1950 SPSS: Valikot: Analyze Descriptive Statistics Explore. Tulos: Descriptives Diastolic blood pressure (mmhg) Mean 95% Confidence Interval for Mean Lower Bound Upper Bound Statistic 83,6300 82,1629 85,0971 Biostatistiikkaa esimerkkien avulla 25 Janne Pitkäniemi, syksy 2005

Esim. Ajatellaan esimerkkiämme kolesteroliarvoja koskevasta otoksestamme. Jos tietäisimme että todellinen suomalaisten kolesteroli keskiarvo olisi 5.0 mmol/l ja jos poimisimme suomalaisista 10 kappaletta 5 sekä 50 hengen otoksia ja laskisimme 95% ja 99% keskiarvon luottamusvälit tulokset voisivat näyttää seuraavilta. 95% luottamusväli otoskoko 5 95% luottamusväli otoskoko 50 otoksen numero 2 4 6 8 10 0 2 4 6 8 10 kol (mmol/l) 99% luottamusväli otoskoko 5 otoksen numero 2 4 6 8 10 otoksen numero 2 4 6 8 10 0 2 4 6 8 10 kol (mmol/l) 99% luottamusväli otoskoko 50 otoksen numero 2 4 6 8 10 0 2 4 6 8 10 kol (mmol/l) 0 2 4 6 8 10 kol (mmol/l) Kuten kuvista huomaamme luottamusvälin pituus kasvaa kun haluamme olla varmempia että todellinen (5.0 mmol/l) perusjoukon keskiarvo kuuluu välille. Toisaalta luottamusväli kapenee kun otoskoko kasvaa eli keskiarvon keskivirhe pienenee. Biostatistiikkaa esimerkkien avulla 26 Janne Pitkäniemi, syksy 2005