KAHDEN RYHMÄN VERTAILU



Samankaltaiset tiedostot
USEAN RYHMÄN VERTAILU

Kvantitatiiviset tutkimusmenetelmät maantieteessä

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Testit järjestysasteikollisille muuttujille

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Sovellettu todennäköisyyslaskenta B

TUTKIMUSOPAS. SPSS-opas

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

MTTTP5, luento Luottamusväli, määritelmä

Kandidaatintutkielman aineistonhankinta ja analyysi

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Aki Taanila TILASTOLLINEN PÄÄTTELY

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Testejä suhdeasteikollisille muuttujille

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

ABHELSINKI UNIVERSITY OF TECHNOLOGY

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Harjoitus 7: NCSS - Tilastollinen analyysi

Väliestimointi (jatkoa) Heliövaara 1

2. Aineiston kuvailua

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Ohjeita kvantitatiiviseen tutkimukseen

Tilastollinen aineisto Luottamusväli

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

HAVAITUT JA ODOTETUT FREKVENSSIT

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9

Aki Taanila VARIANSSIANALYYSI

Teema 9: Tilastollinen merkitsevyystestaus

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

pisteet Frekvenssi frekvenssi Yhteensä

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Aki Taanila TILASTOLLINEN PÄÄTTELY

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

I Keskiarvot ja hajonnat muuttujista 3-26 niin, että luokittelevana muuttujana on muuttuja 2 eli sukupuoli

I Tilastollisen aineiston ja analyysin edellytysten tarkistaminen. - Muunnokset, uudelleen koodaaminen, summamuuttujien luominen

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Otoskoko 107 kpl. a) 27 b) 2654

Testit laatueroasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

Mat Tilastollisen analyysin perusteet, kevät 2007

Muuttujien väliset riippuvuudet esimerkkejä

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Perusnäkymä yksisuuntaiseen ANOVAaan

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

10. laskuharjoituskierros, vko 14, ratkaisut

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Mat Tilastollisen analyysin perusteet, kevät 2007

SPSS-ohjeita. Metropolia Pertti Vilpas

TESTINVALINTATEHTÄVIEN VASTAUKSET

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Estimointi. Vilkkumaa / Kuusinen 1

SPSS-perusteet. Sisältö

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Transkriptio:

10.3.2015 KAHDEN RYHMÄN VERTAILU Jouko Miettunen Center for Life-Course and Systems Epidemiology jouko.miettunen@oulu.fi

Luennon sisältö Luokitellut muuttujat Ristiintaulukko, prosentit Khiin neliötesti ( 2 -testi) Jatkuvat muuttujat Keskiarvo, t-testi Mediaani, Mann-Whitneyn U-testi

Tutkimusongelma Verrataan 2 eri ryhmää tai käsittelyä sukupuoli, hoitomuoto, opetusmenetelmä, taustatekijä, riskitekijä, sairas/terve,... ryhmä i = (kuvitteellinen) populaatio, joka koostuu kaikista (henkilöt tms.) käsittelyn i saaneista tilastoyksiköistä (i = 1 tai 2) Testattava nollahypoteesi H 0 : tutkittava ominaisuus (vastemuuttuja) on jakautunut kahdessa ryhmässä samalla tavalla (ts. ei eroa)

Menetelmän valinta (2 ryhmää) EI, koska laatua mittaava vaste Voiko keskiarvoa käyttää? EI, koska vasteen jakauma hyvin vino Kyllä Ristiintaulukko - prosentit - khiin neliötesti Vertaile keskiarvoja ryhmien välillä - kahden riippumattoman ryhmän t-testi Ilmoita mediaanit - parametriton testi: Mann-Whitneyn testi 4

Kahden ryhmän vertailu Olkoon X 1 = tutkittava ominaisuus osajoukossa 1 ja X 2 = tutkittava ominaisuus osajoukossa 2 Käytettävät menetelmät 2 testi luokkamuuttujille t-testi (symmetrinen jakauma) parametriton Mann-Whitneyn testi (vino jakauma) 5

Jatkuva vai luokiteltu muuttuja? Ilmiöt ovat usein jatkuvia, muuttujat kuitenkin usein luokiteltuja Luokittelemalla menetetään tietoa selkeytetään tulosten esittämistä Analyysimenetelmät erilaisia 6

Luokitellut muuttujat 7

Suhteellisten osuuksien vertailu Esimerkki: Koulumenestyksen yhteys itsemurhaan psykoottisilla ja ei-psykoottisilla (Pohjois-Suomen vuoden 1966 Syntymäkohortti, 35-vuotisseuranta ) Alaräisänen ym. Good school performance is a risk factor of suicide in psychoses: a 35-year follow up of the Northern Finland 1966 Birth Cohort. Acta Psychiatr Scand 2006; 114: 357-62.

Ristiintaulukkona Tilastollinen testi on khiin neliötesti Itsemurha Ei itsemurhaa Kaikki p-arvo Koulumenestys n % n % Ei-psykoottiset 0.001 keskiarvo 43 0.5 8427 99.5 8470 <8.5 keskiarvo >8.5 2 0.4 2074 99.6 2076 Psykoottiset 0.020 keskiarvo 6 4.7 121 95.3 127 <8.5 keskiarvo >8.5 4 18.0 18 82.0 22 SPSS: Analyze > Descriptive statistics > crosstabs (statistics -> Chi-square) 9

2 -TESTI Voidaanko ristiintaulukon ehdollisten prosenttijakaumien ero selittää satunnaisvaihtelun aiheuttamaksi? Testin nollahypoteesi on muotoa H 0 : Tutkittavan muuttujan jakaumat ovat samat eri osajoukoissa Testisuureena käytetään ristiintaulukosta laskettavaa 2 testiä tai Fisherin testiä 10

SPSS: Analyze > Descriptive statistics > crosstabs (statistics -> Chi-square) 11

Esimerkki Pohjois-Suomen 1966 syntymäkohortti Äidin raskauden aikaisen tupakoinnin yhteys luokiteltuun syntymäpainoon 12

2 testi: syntymäpaino kaksiluokkaisena - Pienille otoksille (mikäli SPSS ei laske Pearsonin exact p-arvoa)

2 testi: syntymäpaino kolmeluokkaisena

Jatkuvat muuttujat

Keskiarvo vai mediaani? Keskiarvo soveltuu likimain normaalijakautuneelle aineistolle Mikäli aineistossa on paljon poikkeavia arvoja tai se on huomattavan vino, mediaani kuvaa muuttujan jakaumaa paremmin

Normaaliuden arviointi Mikäli mediaani ja keskiarvo eroavat huomattavasti toisistaan, jakauma ei ole normaalijakautunut Huipukkuus (kurtosis) ja vinous (skewness) kuvaavat normaalisuutta Erilaisia tilastollisia testejä normaalisuudelle, visuaalinen arvio on kuitenkin tärkeä (histogrammit ym.)

Muuttujien erilaisia jakaumia B on normaalijakautunut. A on positiivisesti huipukas jakauma C negatiivisesti huipukas jakauma Havainnot ovat kasaantuneet oikealle (jakauma on negatiivisesti vino eli vino vasemmalle) 19

Esimerkki: kouluarvosana SPSS: analyze > descriptive statistics > frequencies > charts / histogram 20

Arvosana sukupuolen mukaan 21

Määrää mittaava symmetrinen vaste Vertaile keskiarvoja ryhmissä Tilastollisen merkitsevyyden arvionti Kahden ryhmän tapauksessa kahden riippumattoman ryhmän t-testi SPSS: Analyze > Compare Means > Independent- Samples T-Test

Kahden riippumattoman ryhmän keskiarvojen t-testi Vertaillaan yhden ominaisuuden (muuttujan) keskiarvoja kahdessa eri perusjoukossa tai osajoukossa. Tutkittavan muuttujan oletetaan noudatettavan normaalijakaumaa Tietojenkäsittelyä varten tarvitaan lisäksi muuttuja, joka ilmaisee kummassa osajoukossa mittaus on tehty. Se on ns. ryhmittelymuuttuja (Grouping Variable). 23

t-testin hypoteesit H 0 : Tutkittavan ominaisuuden keskiarvo (odotusarvo) on yhtä suuri osajoukoissa 1 ja 2. H 1 : Tutkittavan ominaisuuden keskiarvot ovat erisuuret osajoukoissa 1 ja 2 24

Testisuureen kaavat Testisuureen havaittu arvo voidaan laskea kahdella eri kaavalla kaava A kaava B Kaavassa (A) oletetaan, että hajonta on osajoukoissa saman suuruinen eli tutkittavan ominaisuuden varianssit ovat yhtä suuret Kaavassa (B) tätä oletusta ei tehdä 25

Esimerkki: Pohjois-Suomen 1985-1986 syntymäkohortti n = 350 mean = 3.11 N = 188 (53.7%) 26

SPSS: Analyze > Compare Means > Independent-Samples T-Test 27

SPSS- tulostus Esimerkki: hajonnat eri suuret (kaava B) 28

Parametrittomat menetelmät Käytetään kun keskiarvo ei ole sopiva tutkittavan jakauman tunnusluku vino jakauma muista poikkeavat havainnot Ei tehdä oletuksia muuttujien todennäköisyysjakaumista parametriton = jakauman muodon määräävistä parametreistä ei lausuta mitään 29

Mann-Whitneyn U testi Verrataan tutkittavan ominaisuuden jakaumaa kahdessa ryhmässä Oletetaan, että tutkittava ominaisuus on mitattu vähintään järjestysasteikolla Testi on tarkka, jos ominaisuus on määrää mittaava Menetelmä perustuu havaintojen järjestyslukujen vertailuun (yhdistetyssä otoksessa) 30

Mann-Whitneyn testin hypoteesit H 0 : Tutkittavan ominaisuuden jakaumat ovat samat vertailtavissa ryhmissä H 1 : Tutkittavan ominaisuuden jakaumat eroavat sijainniltaan 31

Määrää mittaava vino vaste Ilmoita mediaanit ryhmittäin SPSS: Analyze > Descriptive Statistics > Explore Tilastollisen merkitsevyyden arvionti Kahden ryhmän tapauksessa Mann-Whitneyn testi SPSS: Analyze > Nonparametric Tests > Legacy dialogs > Two Independent Samples

Mann-Whitneyn testin esimerkki Tutkitaan yskösten histamiinipitoisuutta Aineisto koostui 22 tupakoijasta 9 allergikkoa 13 oireetonta rank ALLERGIKOT EI ALLERGIAA rank 7 31,0 4,7 1 11 39,6 5,2 2 16 64,7 6,6 3 17 65,9 18,9 4 18 67,6 27,3 5 19 100,0 29,1 6 20 102,4 32,4 8 21 1112,0 34,3 9 22 1651,0 35,4 10 41,7 12 45,5 13 48,0 14 48,1 15

Mediaanien vertailu: Mann-Whitneyn U-testi Ranks HISTAM histamiinipitoisuus RYHMÄ N Mean Rank Sum of Ranks 1 allergikot 9 16.78 151.00 2 ei allergia Total 13 7.85 102.00 22 Test Statistics(b) Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed) Exact Sig. [2*(1-tailed Sig.)] HISTAM histamiinipitoi suus 11.000 102.000-3.172.002.001(a) a Not corrected for ties. b Grouping Variable: RYHMÄ

* Ensimmäisessä avohoidossa n = 17 755, **Mann Whitneyn U-testi Salokangas ym. Suomen Lääkärilehti 2009

Esimerkkejä Bottlender et al. Eur Arch Psychiatry Clin Neurosci (2002) 252: 226 231 37

Esimerkkejä

Esimerkki Koponen ym. Suomen Lääkärilehti 2009 2 testi Fisherin eksakti testi

LK Kaisa-Maria Eronen ja LK Ville Saari Syventävien opintojen tutkielma Psykiatrian klinikka, Oulun yliopisto 2011 (saatavissa optimasta syventävien töiden kansiosta) Lääketieteen opiskelijoiden mielenterveyskysely Tutkimus toteutettiin kyselytutkimuksena Oulun ja Helsingin lääketieteellisissä tiedekunnissa, sekä Oulun hammaslääketieteen tiedekunnassa lukuvuoden 2010-2011 aikana. Kyselyt jaettiin ja kerättiin pakollisissa opetustilaisuuksissa. Oulun opiskelijoista kaikki vuosikurssit paitsi 2. vuosikurssi osallistuivat kyselyyn. Yleisen lääketieteen opiskelijoista 438 vastasi kyselyyn. Hammaslääketieteen opiskelijoita tutkimuksessa oli 147 henkilöä. Vastausprosentti yleisen lääketieteen puolella oli 69,4. Hammaslääketieteen puolella vastausprosentti oli 74,6. Tutkimuksessa lääketieteen opiskelijoilla mielenterveyden ongelmien määrässä ei nähty selvästi kasvavaa trendiä vuosikurssilta toiselle. Hammaslääketieteen puolella sen sijaan ongelmat näyttivät lisääntyvän vuosikurssien myötä. Hammaslääketieteen puolella kaikkia SCL:n oiredimensioita näytti esiintyvän tilastollisesti merkittävästi yleistä lääketiedettä enemmän, kun tarkasteltiin kliinisiä kursseja (3.-6. vuosikurssit) keskenään. Ensimmäisen vuosikurssin opiskelijoilla merkittävää eroa yleisen ja hammaslääketieteen välille ei syntynyt. Hammaslääketieteen opiskelijat myös kokivat opinnot selvästi raskaammiksi ja oman hyvinvointinsa keskimäärin huonommaksi kuin yleisen puolen kollegansa. Työmäärät hammaslääketieteen opiskelijoilla olivat myös suuremmat kuin yleisen lääketieteen puolella. Molemmilla aloilla koettiin opiskelijoiden tarvitsevan lisää apua jaksamiseen. Opiskelijat toivoivat muun muassa toimivaa tutorointi-järjestelmää, joustavuutta opintoihin, matalan kynnyksen apua mielenterveysongelmissa ja erityisesti hammaslääketieteen puolella toivottiin opintojen kuormittavuuden vähentämistä. 40

LK Kaisa-Maria Eronen ja LK Ville Saari Syventävien opintojen tutkielma Psykiatrian klinikka, Oulun yliopisto 2011 Lääketieteen opiskelijoiden mielenterveyskysely Yleisen lääketieteen 1. (n=101) ja 6. (n=103) vuoden opiskelijoiden SCL:n keskiarvot Studentin t testi 41

LK Kaisa-Maria Eronen ja LK Ville Saari Syventävien opintojen tutkielma Psykiatrian klinikka, Oulun yliopisto 2011 Lääketieteen opiskelijoiden mielenterveyskysely Kliinisen vaiheen lääketieteen (n=232) ja hammaslääketieteen (n=107) opiskelijoiden SCL-keskiarvot Studentin t testi 42