TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Samankaltaiset tiedostot
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

HAVAITUT JA ODOTETUT FREKVENSSIT

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Kandidaatintutkielman aineistonhankinta ja analyysi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI LTKY012. Timo Törmäkangas

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

TUTKIMUSOPAS. SPSS-opas

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Monitasomallit koulututkimuksessa

Mat Tilastollisen analyysin perusteet, kevät 2007

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja:

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

5 Lisa materiaali. 5.1 Ristiintaulukointi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Kyllä. Kyllä. Jäitkö vielä epävarmaksi: Selvitä antavatko testit samansuuntaisen tuloksen.

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Testit järjestysasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Mat Tilastollisen analyysin perusteet, kevät 2007

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testejä suhdeasteikollisille muuttujille

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Kvantitatiiviset menetelmät

Väliestimointi (jatkoa) Heliövaara 1

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

805306A Johdatus monimuuttujamenetelmiin, 5 op

Ohjeita kvantitatiiviseen tutkimukseen

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Til.yks. x y z

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Määrällisen aineiston esittämistapoja. Aki Taanila

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

Mat Tilastollisen analyysin perusteet, kevät 2007

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Harjoitus 7: NCSS - Tilastollinen analyysi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Regressioanalyysi. Kuusinen/Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI. LTKY012 Timo Törmäkangas Gerontologian tutkimuskeskus

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Harjoitukset 4 : Paneelidata (Palautus )

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Transkriptio:

TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas

RIIPPUVUUS ALARYHMISSÄ Riippuvuus saattaa olla erilaista jos samassa aineistossa on esim. tutkittavia molemmista sukupuolista Yhteys saattaa olla erilaista alaryhmissä, mikä saattaa johtaa virhepäätelmiin riippuvuudesta Jos muuttujissa on sukupuolten välisiä tasoeroja, riippuvuuden tunnusluvut saattavat kertoa enemmän ryhmien välisestä erosta kuin riippuvuudesta Tällöin on usein järkevämpää raportoida riippuvuustarkastelu miehille ja naisille erikseen

Pituuden ja painon yhteys 75-vuotiailla glostrupilaisilla vuonna 1989.

Pituuden ja painon yhteys 75-vuotiailla glostrupilaisilla vuonna 1989.

Pituuden ja painon yhteys 75-vuotiailla glostrupilaisilla vuonna 1989. Miesten ja naisten kuvaajien (punainen katkoviiva) nousukulmat ovat matalampia kuin Kokonaisaineiston kuvaajalla (musta yhtenäinen viiva): Osa kokonaisaineiston riippuvuudesta tulee ryhmien tasoeroista.

YLEISESTI Eroja saattaa esiintyä myös muiden kuin sukupuolimuuttujien suhteen Yleisesti voidaan viitata kolmannen tekijän vaikutukseen riippuvuuden tarkastelussa Jos tällainen tekijä on mitattu voidaan sen vaikutusta huomioida esim. tarkastelemalla riippuvuutta osittaiskorrelaatiokertoimen avulla

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

RIIPPUVUUDEN TUNNUSLUKUJA A. LUOKITTELUASTEIKKO: Χ 2 TESTISUURE χ 2 testisuure mittaa kahden muuttujan välisen riippuvuuden voimakkuutta, mutta ei määritä sille suuntaa Mitä suuremman arvo suure saa, sitä enemmän muuttujien välillä on riippuvuutta Arvo vaihtelee teoreettisesti välillä [0, ] Perustuu ristiintaulukkoon Tunnusluvun laskenta: 1) Määritetään odotetut frekvenssit. 2) Lasketaan testisuureen arvo. χ 2 testisuuratta laskettaessa muuttujan arvoille ei odoteta järjestystä

ESIMERKKI Onko tupakoinnin useus riippuvaista sukupuolesta? Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Merkintöjä (rivi ija sarake j) Rivisumma: f i (esim. f 1 = 91) Sarakesumma: f j (esim. f 2 = 42)

ODOTETUT FREKVENSSIT Nimitetään ristiintaulukoksiesellaista, jossa ei ole ollenkaan riippuvuutta RistiintaulukonEmarginaalit ( Yhteensä ) ovat samat kuin havaitussa ristiintaulukossa; olkoon tämä jälkimmäinen F Ristiintaulukon E solufrekvenssit lasketaan e ij = f i f j / n

Χ 2 TESTISUURE Määrittää mikä on havaitun ristiintaulukon(f) etäisyys täydellisestä riippumattomuudesta (E), ts. F E. Lasketaan missä g on rivien ja h sarakkeiden lukumäärä (tässä esimerkissä g= 2 ja h= 3).

ESIMERKKI: ODOTETUT FREKVENSSIT Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Mies, usein: 91 64 / 284 = 20.507 Mies, harvoin: 91 42 / 284 = 13.458 Mies, ei tupakoi: 91 178 / 284 = 57.035 Nainen, usein: 193 64 / 284 = 43.493 Nainen, harvoin: 193 42 / 284 = 28.542 Nainen, ei tupakoi: 193 178 / 284 = 120.965

HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 21 13 57 91 Nainen (2) 43 29 121 193 Yhteensä 64 42 178 284

f ij e ij : Usein (1) Harvoin (2) Ei tupakoi (3) Mies (1) 38.493 14.542-53.035 0 Nainen (2) -38.493-14.542 53.035 0 0 0 0 (f ij e ij ) 2 /e ij : Usein (1) Harvoin (2) Ei tupakoi (3) Mies (1) 72.254 15.713 49.316 Nainen (2) 34.068 7.409 23.252 χ 2 = 72.254 + 34.068 + 15.713 + 7.409 + 49.316 + 23.252 = 202.012

MERKITSEVYYS χ 2 -testisuure poikkeaa siis nollasta, joten riippuvuutta on muuttujien välillä Jos riippuvuus on tilastollisesti merkitsevää, voidaan riippuvuutta sanoa olevan myös perusjoukossa Tilastollinen testi suureelle osoittaa, että siihen liittyy pieni p-arvo (Asymp. Sig.), joten riippuvuus on tässä merkitsevää

Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989. Muuttujien välillä ei ole merkitsevää riippuvuutta. HUOM. Riviprosentit ovat lähes yhtä suuret.

Merkitsevä riippuvuus ulkona liikkumiskyvyn ja sukupuolenvälillä (p = 0.004). Naisilla ongelmat liikkumiskyvyssä (16.6 %) olivat yleisempiä kuin miehillä (7.8 %). Koska ristiintaulukko on 2 2 taulukko, usein raportoidaan Fisherin nelikenttätestin p-arvo.

B. VÄLIMATKA- TAI SUHDEASTEIKOLLISET MUUTTUJAT: PEARSONIN KORRELAATIOKERROIN Kun puhutaan korrelaatiokertoimesta, tarkoitetaan yleensä Pearsonintulomomenttikorrelaatiokerrointa (r, ρ) Kerroin ilmoittaa riippuvuuden suunnan ja voimakkuuden, mutta siitä ei voi suoraan päätellä kausaalisuutta (syy-seuraussuhde) Lineaarisen yhteyden tunnusluku Korrelaation voimakkuus vaihtelee välillä [0, 1] Pienet arvot: vähäinen riippuvuus tai ei riippuvuutta Suuret arvot: korkea tai täydellinen riippuvuus suunta: etumerkki (+ tai -) Positiivinen: kasvavat X muuttujan arvot liittyvät kasvaviin Y muuttujan arvoihin Negatiivinen: kasvavat Xmuuttujan arvot liittyvät pieneneviin Y muuttujan arvoihin

PEARSONIN KORRELAATIOKERROIN Kertoimet erilaisista muuttujapareista ovat (ainakin matemaattisesti) vertailukelpoisia Karkea sääntö kertoimen tulkintaan: r > 0.7 : lineaarinen riippuvuus on voimakasta 0.3 < r < 0.7 : lineaarinen riippuvuus on kohtalaista r < 0.3 : lineaarinen riippuvuus on heikkoa Selitysaste (r 2 ): kuinka paljon Y-muuttujan vaihtelusta voidaan selittää X-muuttujan vaihtelulla Esim. korrelaatiokerrointa r = 0.7 vastaa r 2 = 0.49, eli 100 0.49 = 49 %, joten noin puolet Y-muuttujan vaihtelusta selittyy X-muuttujan vaihtelulla ja loput muilla tekijöillä

Kertoimen laskeminen: = 2 2 = =1 =1 2 =1 2 Yhteisen hajonnan (kovarianssi) suhde muuttujien keskihajontatuloon Jos otoskoko on pieni, niin yksikin poikkeava havainto saattaa vaikuttaa suuresti korrelaatiokertoimen arvoon Mitä suurempi otoskoko, sitä pienempi korrelaatio tulee tilastollisesti merkitseväksi

ESIMERKKI kh Pituus Paino 1 171 98 2 178 76 3 157 70 4 180 71 5 162 81 6 150 51 7 160 70 8 169 69 9 161 63 10 171 66 =165.9 =71.5

ESIMERKKI kh Pituus Paino 1 171 98 2 178 76 3 157 70 4 180 71 5 162 81 6 150 51 7 160 70 8 169 69 9 161 63 10 171 66 Pituus 180 175 170 165 160 155 =165.9 150 = 71.5 50 60 70 Paino 80 90 100

ESIMERKKI kh Pituus Paino 1 171 98 5.1 26.5 2 178 76 12.1 4.5 3 157 70-8.9-1.5 4 180 71 14.1-0.5 5 162 81-3.9 9.5 6 150 51-15.9-20.5 7 160 70-5.9-1.5 8 169 69 3.1-2.5 9 161 63-4.9-8.5 10 171 66 5.1-5.5 =165.9 =71.5

ESIMERKKI kh Pituus Paino 1 171 98 5.1 26.5 135.15 2 178 76 12.1 4.5 54.45 3 157 70-8.9-1.5 13.35 4 180 71 14.1-0.5-7.05 5 162 81-3.9 9.5-37.05 6 150 51-15.9-20.5 325.95 7 160 70-5.9-1.5 8.85 8 169 69 3.1-2.5-7.75 9 161 63-4.9-8.5 41.65 10 171 66 5.1-5.5-28.05 499.50 =165.9 =71.5

ESIMERKKI kh Pituus Paino 1 171 98 5.1 26.5 135.15 26.01 702.25 2 178 76 12.1 4.5 54.45 146.01 20.25 3 157 70-8.9-1.5 13.35 79.21 2.25 4 180 71 14.1-0.5-7.05 198.81 0.25 5 162 81-3.9 9.5-37.05 15.21 90.25 6 150 51-15.9-20.5 325.95 252.81 420.25 7 160 70-5.9-1.5 8.85 34.81 2.25 8 169 69 3.1-2.5-7.75 9.61 6.25 9 161 63-4.9-8.5 41.65 24.01 72.25 10 171 66 5.1-5.5-28.05 26.01 30.25 499.50 812.90 1346.50 =165.9 =71.5 = =1 =1 2 =1 2 = 499.5 812.9 1346.50 =0.477 Otoksessa pituuden ja painon välillä on siis kohtalainen riippuvuus. Pituus jakaumalla suureneviin arvoihin liittyvät myös jossain määrin suurenevat painomitat.

ESIMERKKI(SPSS) kh Pituus Paino 1 171 98 2 178 76 3 157 70 4 180 71 5 162 81 6 150 51 7 160 70 8 169 69 9 161 63 10 171 66

POIKKEAVAN HAVAINNON VAIKUTUS

KORRELAATIOMATRIISI Korrelaatio ja sen merkitsevyyden indikaattori (**) Tarkka p-arvo Ristitulo Kovarianssi Otoskoko Jyväskyläläiset 75-v. miehet, NORA tutkimus, 1989.

RAPORTOITAVA KORRELAATIOMATRIISI Table 1. Correlation matrix of height, weight, waist and hip girth among 75-year-old women living in Jyväskylä in 1989 (n = 191). Height Weight Waist girth Height -- Weight 0.31* -- Waist girth 0.05 0.87* -- Hip girth 0.09 0.86* 0.76 * * Correlation significant at the 0.05 alpha level. HUOM! Viimeinen sarake on turha, koska muuttujan (tässä: lantionleveys) korrelaatio itsensä kanssa on aina 1, eikä siksi mielenkiintoinen.

PAIRWISE VAI LISTWISE? Kun aineistossa on muuttujia, joilla on erilainen lukumäärä puuttuvia havaintoja, voidaan korrelaatio laskea kahdella tavalla Pairwise: jokaiselta muuttujaparilta huomioidaan kaikki muuttujaparilla havaitut arvot Listwise: muuttujilta huomioidaan arvot, jotka jäävät kun kaikki puuttuvat arvot poistetaan tarkastelusta Listwiseon tilastomatemaattisesti paremmin perusteltu ja johtaa jatkoanalyyseissa usein harvemmin ongelmiin kuin pairwise Esim. tarkastellaan painon ja vyötärönympäryksen riippuvuutta Koehenkilö Pituus Paino Vyötärönympärys 1 169 76 98.5 2 -- 82 85.5 3 187 -- 86.0 Pairwise: 1,2 Listwise: 1 Imputointi / SU-estimointi: 1,2,3

C. JÄRJESTYSLUKUASTEIKOLLISET MUUTTUJAT: SPEARMANIN JÄRJESTYSLUKUKORRELAATIOKERROIN Symbolit: otos, r S, perusjoukko, ρ S Vähintään järjestysasteikolliset muuttujat; poikkeavia havaintoja sisältävät muuttujat; kun jakaumaoletukset eivät ole kunnossa Pearsonin korrelaatiolle Havaintoarvojen sijasta perustuu havaintojen keskinäiseen riippuvuuteen Laskeminen: 1) X-ja Y-muuttujien havaintoarvot korvataan järjestysluvuilla R(x i ) ja R(y i ). 2) Lasketaan järjestyslukujen erotusten neliö d i2 = [R(x i ) R(y i )] 2 3) Sijoitetaan neliöt kaavaan:

ESIMERKKI Tarkastellaan itse arvioidun terveydentilan ja käden puristusvoiman välistä riippuvuutta (n = 5). Aineisto: Koehenkilö Terveydentila Käden puristusvoima (Newton) 1 4 (= huono) 363 2 3 (= kohtalainen) 198 3 5 (= erittäin huono) 78 4 1 (= erittäin hyvä) 387 5 2 (= hyvä) 387 Olkoon seuraavassa terveydentila Xja puristusvoima Y. Huom. Terveydentila kertoo huonosta terveydentilasta (suuret arvot).

MUUTTUJAN ARVOLUOKKIEN KÄÄNTÄMINEN Muuttuja X on Terveydentila Suurin arvo: Max = 5 Pienin arvo: Min = 1 Lasketaan: Max x i + Min (i = 1,, 5) Terveydentila 4 (= huono) 3 (= kohtalainen) 5 (= erittäin huono) 1 (= erittäin hyvä) 2 (= hyvä)

MUUTTUJAN ARVOLUOKKIEN KÄÄNTÄMINEN Muuttuja X on Terveydentila Suurin arvo: Max = 5 Pienin arvo: Min = 1 Lasketaan: Max x i + Min (i = 1,, 5) Terveydentila Laskutoimitus 4 (= huono) 5 4 + 1 3 (= kohtalainen) 5 3 + 1 5 (= erittäin huono) 5 5 + 1 1 (= erittäin hyvä) 5 1 + 1 2 (= hyvä) 5 2 + 1

MUUTTUJAN ARVOLUOKKIEN KÄÄNTÄMINEN Muuttuja X on Terveydentila Suurin arvo: Max = 5 Pienin arvo: Min = 1 Lasketaan: Max x i + Min (i = 1,, 5) Terveydentila Laskutoimitus Käännetty Terveydentila 4 (= huono) 5 4 + 1 2 (= huono) 3 (= kohtalainen) 5 3 + 1 3 (= kohtalainen) 5 (= erittäin huono) 5 5 + 1 1 (= erittäin huono) 1 (= erittäin hyvä) 5 1 + 1 5 (= erittäin hyvä) 2 (= hyvä) 5 2 + 1 4 (= hyvä) Huom. Arvoluokat muuttuvat, mutta jokaisen tutkittavan terveysluokan tulkinta säilyy samana

ESIMERKKI Koehenkilö x y 1 2 363 2 3 198 3 1 78 4 5 387 5 4 387 Σ

ESIMERKKI Koehenkilö x y R(x) 1 2 363 2 2 3 198 3 3 1 78 1 4 5 387 5 5 4 387 4 Σ

ESIMERKKI Koehenkilö x y R(x) R(y) 1 2 363 2 3 2 3 198 3 2 3 1 78 1 1 4 5 387 5 4.5 5 4 387 4 4.5 Σ

ESIMERKKI d i = R(x i ) - R(y i ) Koehenkilö x y R(x) R(y) d i 1 2 363 2 3-1.0 2 3 198 3 2 1.0 3 1 78 1 1 0.0 4 5 387 5 4.5-0.5 5 4 387 4 4.5 0.5 Σ 0.0

ESIMERKKI Koehenkilö x y R(x) R(y) d i d 2 i 1 2 363 2 3-1.0 1.00 2 3 198 3 2 1.0 1.00 3 1 78 1 1 0.0 0.00 4 5 387 5 4.5-0.5 0.25 5 4 387 4 4.5 0.5 0.25 Σ 0.0 2.50 =1! "# $ % &$ = 1 '.() ( % &( = 1 *( *') = 1 *, = -, = 0.875 Terveinä itsensä kokevilla on siis myös korkea puristusvoima. Korrelaatio on varsin korkea, mutta se laskettiin varsin pienestä aineistosta. Jos terveysmuuttujan arvoja ei olisi käännetty ennen laskemista, olisi saatu vastaava negatiivinen korrelaatiokertoimen arvo.

ESIMERKKI Korrelaatio SPSS-ohjelmalla tarkasteltuna: Kertoimen itseisarvo on hieman pienempi kuin käsin laskettaessa. SPSS käyttää tasatulosten osalta korjauskaavaa, joka johtaa hieman erilaiseen tulokseen (vrt. Ranta: Biometria)

MITEN VALITA OIKEA RIIPPUVUUDEN TUNNUSLUKU JA KUVAUSKEINO Mitta-asteikkot Jatkuvajatkuva Tarkista lineaarisuus (LOESS) Nominaali-nominaali Nominaali-ordinaali (vähän luokkia) Ordinaali-ordinaali Ordinaali-jatkuva On Ei Syy: muutama poikkeava havainto Ei Ristiintaulukko χ 2 testisuure Hajontakuvio Spearmanin korrelaatio Kyllä On ongelmia Tarkista poikkeavat havainnot / vinous Ei ongelmia Hajontakuvio Epälineaariset menetelmät Hajontakuvio Pearsonin korrelaatio Jos tarkasteltavana on alaryhmiä (miehet / naiset tms.), käy vaiheet läpi kullekin ryhmälle erikseen.

Marko: Aineisto: Perusjoukko: Kolme muuttujaa: Tutkimuskysymys: Kaksi ryhmää (koe ja kontrolli), liikuntainterventio Uransa lopettaneet pohjoismaiset kilpaurheilijat Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) 1)Onko ryhmien keskiarvoissa eroa perusjoukossa? Auttaako liikuntainterventio toimintakyvyn ylläpitämistä? 2)Onko keskiarvoeroja itse arvioidun terveyden suhteen (hyvä / keskinkertainen / huono). Sari: Aineisto: Ryhmä naisia, tutkimus on osa geneettistä analyysia Perusjoukko: Suomalaiset naiset Kolme muuttujaa: Kehon painoindeksi (kg/m 2 ) Fyysinen aktiivisuus (MET, energiankulutus suhteessa lepotilaan) Kävelynopeus (m/s) Tutkimuskysymys: Onko painoindeksi riippuvainen fyysisen aktiivisuuden määrästä ja / tai kävelynopeudesta? Elina: Aineisto: Perusjoukko: Kaksi muuttujaa: Tutkimuskysymys: Ryhmä satunnaisesti valittuja viidesluokkalaisia kolmesta koulusta Jyväskylän koululaiset Ruokavalio (vähärasvainen, vähälaktoosinen, normaali) Itse arvioitu terveys (hyvä / keskinkertainen / huono). Riippuuko oma arvio terveyden tilasta ruokavaliosta? Kenen tulisi käyttää riippuvuuden tunnuslukuja tutkimuksessaan? Mikä riippuvuuden tunnusluku olisi silloin sopiva käytettäväksi?