TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Samankaltaiset tiedostot
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

HAVAITUT JA ODOTETUT FREKVENSSIT

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Kandidaatintutkielman aineistonhankinta ja analyysi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI. LTKY012 Timo Törmäkangas Gerontologian tutkimuskeskus

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Teema 5: Ristiintaulukointi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSOPAS. SPSS-opas

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja:

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Sovellettu todennäköisyyslaskenta B

Määrällisen aineiston esittämistapoja. Aki Taanila

Kyllä. Kyllä. Jäitkö vielä epävarmaksi: Selvitä antavatko testit samansuuntaisen tuloksen.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Mat Tilastollisen analyysin perusteet, kevät 2007

Regressioanalyysi. Vilkkumaa / Kuusinen 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Mat Tilastollisen analyysin perusteet, kevät 2007

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

5 Lisa materiaali. 5.1 Ristiintaulukointi

Til.yks. x y z

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Harjoitukset 4 : Paneelidata (Palautus )

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

RISTIINTAULUKOINTI JA Χ 2 -TESTI

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

pisteet Frekvenssi frekvenssi Yhteensä

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

Monitasomallit koulututkimuksessa

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ohjeita kvantitatiiviseen tutkimukseen

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Opinnäytetyön kvantitatiivinen osuus

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Luento JOHDANTO

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Harjoittele tulkintoja

Väliestimointi (jatkoa) Heliövaara 1

Todennäköisyyden ominaisuuksia

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

SPSS-perusteet. Sisältö

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Identifiointiprosessi

Määrällisen aineiston esittämistapoja. Aki Taanila

805306A Johdatus monimuuttujamenetelmiin, 5 op

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Mat Tilastollisen analyysin perusteet, kevät 2007

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Transkriptio:

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Luokittelu- ja järjestysasteikko: Ristiintaulukko Sukupuoli Mies (1) Nainen (2) Maa Suomi (1) 119 236 355 Ruotsi (2) 159 209 368 Tanska (3) 222 259 481 Yhteensä 500 704 1204 Arvoparin frekvenssi näkyy taulukon soluista Ehdolliset frekvenssit: kiinnitetään yksi maamuuttujan luokka (esim. Suomi) ja tarkastellaan sukupuolijakaumaa

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Sukupuoli Mies (1) Nainen (2) Maa Suomi (1) 119 236 355 Ruotsi (2) 159 209 368 Tanska (3) 222 259 481 Yhteensä 500 704 1204 Riviprosentit: esim. 100 119 / 355 = 33.52 %

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Luokitteluasteikko: Ristiintaulukko Sukupuoli Mies (1) Nainen (2) Maa Suomi (1) 119 (34 %) 236 (66 %) 355 (100 %) Ruotsi (2) 159 (43 %) 209 (57 %) 368 (100 %) Tanska (3) 222 (46 %) 259 (54 %) 481 (100 %) Yhteensä 500 704 1204 Riviprosentit: esim. 100 119 / 355 = 33.52 % Suomessa otos painottui selkeämmin naisiin (vain noin kolmannes oli miehiä)

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Sukupuoli Mies (1) Nainen (2) Maa Suomi (1) 119 236 355 Ruotsi (2) 159 209 368 Tanska (3) 222 259 481 Yhteensä 500 704 1204 Sarakeprosentit: esim. 100 119 / 500 = 23.80 %

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Sukupuoli Mies (1) Nainen (2) Maa Suomi (1) 119 (24 %) 236 (34 %) 355 Ruotsi (2) 159 (32 %) 209 (30 %) 368 Tanska (3) 222 (44 %) 259 (37 %) 481 Yhteensä 500 (100 %) 704 (100 %) 1204 Sarakeprosentit: esim. 100 119 / 500 = 23.80 % Miehistä vähiten oli suomalaisia, naisista pienin osuus oli ruotsalaisilla

RISTIINTAULUKON GRAAFINEN ESITYS 300 Huono: Vaikea erottaa pylväitten keskinäisiä korkeuksia 250 200 150 Miehet 100 Naiset 50 0 Suomi Ruotsi Tanska Naiset Miehet

RISTIINTAULUKON GRAAFINEN ESITYS 300 250 200 150 100 Mies Nainen 50 0 Suomi Ruotsi Tanska Maa

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156 147 2 174 170 3 169 167 4 153 151 5 164 163 6 156 155 7 160 159 8 159 158 9 175 174 10 173 173

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156 147 2 174 170 3 169 167 4 153 151 5 164 163 6 156 155 7 160 159 8 159 158 147 9 175 174 10 173 173 156

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156 147 2 174 170 3 169 167 4 153 151 5 164 163 6 156 155 7 160 159 8 159 158 9 175 174 10 173 173

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Tulkintaa helpottavia kuvaajia Identiteettiviiva

KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Tulkintaa helpottavia kuvaajia Identiteettiviiva Regressiosuora

RIIPPUVUUS Antavatko muuttujan X arvoihin liittyvät frekvenssit lisätietoa muuttujan Y arvojen frekvensseistä? Keskeisiä riippuvuuden ominaisuuksia ovat suunta ja voimakkuus, jotka pyritään kuvaamaan yhdellä tunnusluvulla (jos mahdollista) Muuttujat kannattaa koodata niin, että suuret arvot tarkoittavat mitattavan ominaisuuden suurempaa esiintymistä tutkittavassa: Esim. terveydentila suuret arvot tarkoittavat parempaa terveyttä

1. LUOKITTELUASTEIKOLLISET MUUTTUJAT Ovatko muuttujan X jakaumat samanlaiset muuttujan Y eri luokissa (ehdolliset jakaumat)? Tunnuslukuja mm. χ 2 testisuure, kontingenssikerroin Muita: McNemarin testi, Fisherin nelikenttätesti

ESIMERKKI 1 EI RIIPPUVUUTTA MUUTTUJIEN VÄLILLÄ Esim. Tupakoinnin useus ja sukupuoli. Onko tässä muuttujien välillä riippuvuutta? Päivittäin Silloin Ei koskaan Yhteensä tällöin Mies 40 52 28 120 Nainen 50 65 35 150 Yhteensä 90 117 63 270 Tarkastellaan esim. riviprosentteja Samaan johtopäätökseen päästään tarkastelemalla sarakeprosentteja

ESIMERKKI 1 EI RIIPPUVUUTTA MUUTTUJIEN VÄLILLÄ Päivittäin Silloin Ei koskaan Yhteensä tällöin Mies 40 (33.3) 52 (43.3) 28 (23.3) 120 (100) Nainen 50 (33.3) 65 (43.3) 35 (23.3) 150 (100) Yhteensä 90 117 63 270 Johtopäätös: Tupakoinnin useus ei riipu siitä kumpaa sukupuolta tarkastellaan muuttujien välillä ei ole (lainkaan) riippuvuutta Riippuvuuden tarkastelussa kannattaa kiinnittää huomio ehdollisiin prosenttijakaumiin

ESIMERKKI 2 RIIPPUVUUTTA MUUTTUJIEN VÄLILLÄ Esim. Tupakoinnin useus ja sukupuoli, kun muuttujien välillä on riippuvuutta Päivittäin Silloin Ei koskaan Yhteensä tällöin Mies 59 5 28 92 Nainen 14 4 174 192 Yhteensä 73 9 202 284

ESIMERKKI 2 RIIPPUVUUTTA MUUTTUJIEN VÄLILLÄ Esim. Tupakoinnin useus ja sukupuoli, kun muuttujien välillä on riippuvuutta Päivittäin Silloin Ei koskaan Yhteensä tällöin Mies 59 (64.1) 5 (5.4) 28 (30.4) 92 Nainen 14 (7.3) 4 (2.1) 174 (90.6) 192 Yhteensä 73 9 202 284 Riviprosentit Johtopäätös: Tupakoinnin useuden ja sukupuolen välillä on riippuvuutta; miehillä painottuu päivittäinen tupakointi, kun taas naiset eivät tupakoi.

2. JATKUVAT MUUTTUJAT Kun muuttujan X arvot lisääntyvät yksikön, liittyykö myös muuttujan Y arvoihin lisäystä tai vähentymistä? Lineaarinen riippuvuus Korrelaatiokertoimet (mm. Spearman ja Pearson)

HAJONTAKUVIO EI RIIPPUVUUTTA

HAJONTAKUVIO POSITIIVINEN RIIPPUVUUS

HAJONTAKUVIO POSITIIVINEN RIIPPUVUUS

HAJONTAKUVIO POSITIIVINEN RIIPPUVUUS

HAJONTAKUVIO SUURIN MAHDOLLINEN POSITIIVINEN RIIPPUVUUS

HAJONTAKUVIO NEGATIIVINEN RIIPPUVUUS

SAMANAIKAINEN HAJONTAKUVIO Pituuden, painon ja kehon rasvaprosentin samanaikainen hajontakuvio 75-vuotiaille jyväskyläläisille miehille vuonna 1989.

3. JÄRJESTYSASTEIKOLLISET MUUTTUJAT Käsitys riippuvuudesta samankaltainen kuin jatkuvilla muuttujilla Varsinaisten havaintoarvojen sijasta käytetään järjestyslukuja

LINEAARISUUDESTA Usein kiinnostus kohdistuu yksikertaisiin riippuvuussuhteisiin muuttujien välillä, kuten edellä on esitetty Lineaarisuus: kuvaajaan asetettu suora kuvaa riippuvuudesta olennaisimman Joskus muuttujien väliset yhteydet eivät ole lineaarisia lineaarinen kuvaus on riittämätön tulokset saattavat olla epätarkkoja tai harhaanjohtavia

sprint60 60 metrin sprintin aika ja ikä. Veteraaniurheilijat ATHLAS-tutkimus (2002-2012).

Lineaarisen yhteyden kuvaaja sprint60 60 metrin sprintin aika ja ikä. Veteraaniurheilijat ATHLAS-tutkimus (2002-2012).

sprint60 Lineaarisen yhteyden kuvaajan (yhtenäinen viiva), ohella kaarevan yhteyden kuvaaja (katkoviiva). 60 metrin sprintin aika ja ikä. Veteraaniurheilijat ATHLAS-tutkimus (2002-2012).

sprint60 Lineaarisen yhteyden kuvaajan (yhtenäinen viiva), ohella kaarevan yhteyden kuvaaja (katkoviiva), sekä empiirinen LOESS -kuvaaja. 60 metrin sprintin aika ja ikä. Veteraaniurheilijat ATHLAS-tutkimus (2002-2012).

sprint60 Selitysaste tukee paremmin kaarevaa yhteyden kuvaajaa 60 metrin sprintin aika ja ikä. Veteraaniurheilijat ATHLAS-tutkimus (2002-2012).

RIIPPUVUUS ALARYHMISSÄ Riippuvuus saattaa olla erilaista jos samassa aineistossa on esim. tutkittavia molemmista sukupuolista Yhteys saattaa olla erilaista alaryhmissä, mikä saattaa johtaa virhepäätelmiin riippuvuudesta Jos muuttujissa on sukupuolten välisiä tasoeroja, riippuvuuden tunnusluvut saattavat kertoa enemmän ryhmien välisestä erosta kuin riippuvuudesta Tällöin on usein järkevämpää raportoida riippuvuustarkastelu miehille ja naisille erikseen

Pituuden ja painon yhteys 75-vuotiailla glostrupilaisilla vuonna 1989.

Pituuden ja painon yhteys 75-vuotiailla glostrupilaisilla vuonna 1989.

Pituuden ja painon yhteys 75-vuotiailla glostrupilaisilla vuonna 1989. Miesten ja naisten kuvaajien (punainen katkoviiva) nousukulmat ovat matalampia kuin Kokonaisaineiston kuvaajalla (musta yhtenäinen viiva): Osa kokonaisaineiston riippuvuudesta tulee ryhmien tasoeroista.

KOLMANNEN TEKIJÄN VAIKUTUS Eroja saattaa esiintyä myös muiden kuin sukupuolimuuttujien suhteen Yleisesti voidaan viitata kolmannen tekijän vaikutukseen riippuvuuden tarkastelussa Jos tällainen tekijä on mitattu voidaan sen vaikutusta huomioida esim. tarkastelemalla riippuvuutta osittaiskorrelaatiokertoimen avulla

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

RIIPPUVUUDEN TUNNUSLUKUJA A. LUOKITTELUASTEIKKO: Χ 2 TESTISUURE χ 2 testisuure mittaa kahden muuttujan välisen riippuvuuden voimakkuutta, mutta ei määritä sille suuntaa Mitä suuremman arvo suure saa, sitä enemmän muuttujien välillä on riippuvuutta Arvo vaihtelee teoreettisesti välillä [0, ] Perustuu ristiintaulukkoon Tunnusluvun laskenta: 1) Määritetään odotetut frekvenssit. 2) Lasketaan testisuureen arvo. χ 2 testisuuratta laskettaessa muuttujan arvoille ei odoteta järjestystä

ESIMERKKI Onko tupakoinnin useus riippuvaista sukupuolesta? Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Merkintöjä (rivi i ja sarake j) Rivisumma: f i (esim. f 1 = 91) Sarakesumma: f j (esim. f 2 = 42)

ODOTETUT FREKVENSSIT Nimitetään ristiintaulukoksi E sellaista, jossa ei ole ollenkaan riippuvuutta Ristiintaulukon E marginaalit ( Yhteensä ) ovat samat kuin havaitussa ristiintaulukossa; olkoon tämä jälkimmäinen F Ristiintaulukon E solufrekvenssit lasketaan e ij = f i f j / n

Χ 2 TESTISUURE Määrittää mikä on havaitun ristiintaulukon (F) etäisyys täydellisestä riippumattomuudesta (E), ts. F E. Lasketaan missä g on rivien ja h sarakkeiden lukumäärä (tässä esimerkissä g = 2 ja h = 3).

ESIMERKKI: ODOTETUT FREKVENSSIT Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Mies, usein: 91 64 / 284 = 20.507 Mies, harvoin: 91 42 / 284 = 13.458 Mies, ei tupakoi: 91 178 / 284 = 57.035 Nainen, usein: 193 64 / 284 = 43.493 Nainen, harvoin: 193 42 / 284 = 28.542 Nainen, ei tupakoi: 193 178 / 284 = 120.965

HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 21 13 57 91 Nainen (2) 43 29 121 193 Yhteensä 64 42 178 284

f ij e ij : Usein (1) Harvoin (2) Ei tupakoi (3) Mies (1) 38.493 14.542-53.035 0 Nainen (2) -38.493-14.542 53.035 0 0 0 0 (f ij e ij ) 2 /e ij : Usein (1) Harvoin (2) Ei tupakoi (3) Mies (1) 72.254 15.713 49.316 Nainen (2) 34.068 7.409 23.252 χ 2 = 72.254 + 34.068 + 15.713 + 7.409 + 49.316 + 23.252 = 202.012

MERKITSEVYYS χ 2 -testisuure poikkeaa siis nollasta, joten riippuvuutta on muuttujien välillä Jos riippuvuus on tilastollisesti merkitsevää, voidaan riippuvuutta sanoa olevan myös perusjoukossa Tilastollinen testi suureelle osoittaa, että siihen liittyy pieni p-arvo (Asymp. Sig.), joten riippuvuus on tässä merkitsevää