Teema 5: Ristiintaulukointi

Samankaltaiset tiedostot
5 Lisa materiaali. 5.1 Ristiintaulukointi

Til.yks. x y z

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Määrällisen aineiston esittämistapoja. Aki Taanila

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Til.yks. x y z

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Kandidaatintutkielman aineistonhankinta ja analyysi

Määrällisen aineiston esittämistapoja. Aki Taanila

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus tn-laskentaan perjantai

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

HAVAITUT JA ODOTETUT FREKVENSSIT

Esimerkki 1: auringonkukan kasvun kuvailu

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mediaani. Keskihajonta

805306A Johdatus monimuuttujamenetelmiin, 5 op

pisteet Frekvenssi frekvenssi Yhteensä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSOPAS. SPSS-opas

2. Aineiston kuvailua

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Hyvinkääläisten matkat LÄHDE: WSP FINLAND OY, HELSINGIN SEUDUN LAAJA LIIKENNETUTKIMUS, MATKAPÄIVÄKIRJATUTKIMUS VIRPI PASTINEN

MTTTP1, luento KERTAUSTA

11. laskuharjoituskierros, vko 15, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

AIHE: Tyossa_kouluttautuminen

MTTTP1, luento KERTAUSTA

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Aluenopeusrajoituksen muutos ja liikenteen rauhoittamistoimenpiteet Kaukajärvellä ja Vehmaisissa-kyselyn vastausten koonti

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Teema 10: Regressio- ja varianssianalyysi

I. Ristiintaulukointi Excelillä / Microsoft Office 2010

Kansallisen käyttäjäkyselyn tulosten visualisointia Tampereen tulokset

Sovellettu todennäköisyyslaskenta B

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

JYVÄSKYLÄN YLIOPISTON HENKILÖSTÖTILINPÄÄTÖKSEN 2005 LIITEOSA

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

AIHE: Demografiset_muutokset

1. laskuharjoituskierros, vko 4, ratkaisut


MTTTP1, luento KERTAUSTA

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Oma nimesi Tehtävä (5)

Bussiyhteyksiin perustuva joukkoliikenne YKR-ANALYYSITULOKSIA HÄMEENLINNAN VOUTILA. Katri Eerola Suomen ympäristökeskus

Johdatus tilastotieteeseen

Henkilöstö henkilötyövuosina % -osuudet (ei sisällä Normaalikoulua) Normaalikoulun henkilöstö henkilötyövuosina

TAMPEREEN TEKNILLINEN YLIOPISTO KÄYTTÖOHJE TIETOVARASTON KUUTIOT

Korvaussuoritukset kaatumis-ja putoamistapaturmista (lakisääteinen tapaturmavakuutus)

Tule mukaan kehittämään Kauppatoria!

AIHE: Tyytyvaisyysmittareita

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Aluenopeusrajoituksen muutos ja liikenteen rauhoittamistoimenpiteet Viinikassan Nekalassa, yms-kyselyn vastausten koonti

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3

Liite teokseen Semi Purhonen ym., Suomalainen maku: Kulttuuripääoma, kulutus ja elämäntyylien sosiaalinen eriytyminen (Gaudeamus 2014)

Taloyhtiöiden jätehuoltopalvelut

Vaikuttamisindeksi

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

JOENSUUN ASEMANSEUDUN KEHITTÄMINEN KÄYTTÄJÄKYSELYN TULOKSET

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Robottiautojen vaikutukset liikkumistottumuksiin. Timo Liljamo

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Internetin saatavuus kotona - diagrammi

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

AIHE: Tyytyvaisyysmittareita

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

EKOLIITU - HÄMEENLINNAN SEUDUN KESTÄVÄN JA TURVALLISEN LIIKKUMISEN SUUNNITELMA LIIKKUMISEN TUNNUSLUKUJA NYKYTILAN ANALYYSIT I LIIKKUMISEN NYKYTILA

Kvantitatiiviset menetelmät

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Valtionhallinnon ylin johto numeroin kesäkuussa 2013

Katoavat työpaikat. Pekka Myrskylä

Maanpuolustusjärjestöjen jäsenkysely turvallisuus- ja puolustuspoliittisista kysymyksistä

Webropol 3.0 tulosten raportointi. Aki Taanila

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Harjoittele tulkintoja

Transkriptio:

Teema 5: Ristiintaulukointi Kahden (tai useamman) muuttujan ristiintaulukointi: aineiston analysoinnin ja tulosten esittämisen perusmenetelmä usein samat tiedot esitetään sekä taulukkona että kuvana mahdollisen riippuvuuden havaitseminen (ei vain lineaarisen) Eri tyyppiset taulukot: frekvenssitaulukot soveltuvat kaikille muuttujille: laadulliset ja diskreetit muuttujat sellaisenaan jatkuvat muuttujat luokiteltuina (vrt. pylväskuva) luokkia tarvittaessa yhdisteltävä (tiivistäminen) prosenttitaulukot kuvaavat suhteellisia osuuksia: oltava tarkkana, mitä taulukon osaa kuvataan: sarakkeita / rivejä / kokonaismäärää? esityskäytössä %:t hyvä pyöristää kokonaisluvuiksi laskelmat kuitenkin tehtävä tarkemmilla luvuilla tunnuslukutaulukot kuvaavat jatkuvia muuttujia: esim. keskiarvot ja -hajonnat luokittain Esimerkki frekvenssitaulukosta Kurssin osallistujien ikäjakauma tiedekunnittain: (lähde: WebOodi/KV) Tiedekunta 17 22 23 27 28 32 33 46 yht. Valtiotieteellinen 132 62 21 13 228 Matem. luonnontiet. 47 30 9 6 92 Muut tiedekunnat 49 27 3 4 83 yhteensä 228 119 33 23 403 tdk: 3 luokkaa, ikä: 4 luokkaa, joten taulukossa 3 4 = 12 solua rivejä ja sarakkeita kutsutaan ehdollisiksi jakaumiksi: esim. ikäjakauma ehdolla että tarkastellaan valtiotieteellistä rivi- ja sarakesummia kutsutaan reunajakaumiksi: ikä: ks. Teema3:n pylväskuva, tdk: ks. Harjoitus 3, Tehtävä 3 taulukon kokonaismäärä (N=403) on solujen tai kumman tahansa reunajakauman summa

Esimerkki prosenttitaulukoista Sarakeprosentit ja riviprosentit (huomaa merkitysero): Valtiotieteellinen 57.9 52.1 63.6 56.5 56.6 Matem. luonnontiet. 20.6 25.2 27.3 26.1 22.8 Muut tiedekunnat 21.5 22.7 9.1 17.4 20.6 yhteensä % (N=403) 100.0 100.0 100.0 100.0 100.0 Valtiotieteellinen 57.9 27.2 9.2 5.7 100.0 Matem. luonnontiet. 51.1 32.6 9.8 6.5 100.0 Muut tiedekunnat 59.0 32.5 3.6 4.8 100.0 yhteensä % (N=403) 56.6 29.5 8.2 5.7 100.0 Esimerkki prosenttitaulukoista, toinen versio Samat %-taulukot kuin edellä, mutta luvut pyöristetty: Valtiotieteellinen 58 52 64 57 57 Matem. luonnontiet. 21 25 27 26 23 Muut tiedekunnat 22 23 9 17 21 yhteensä % (N=403) 100 100 100 100 100 Valtiotieteellinen 58 27 9 6 100 Matem. luonnontiet. 51 33 10 7 100 Muut tiedekunnat 59 33 4 5 100 yhteensä % (N=403) 57 30 8 6 100

Esimerkki prosenttitaulukoista, kolmas muoto Kokonaisprosentit (huomaa erot ja yhtäläisyydet): Valtiotieteellinen 33 15 5 3 57 Matem. luonnontiet. 12 7 2 2 23 Muut tiedekunnat 12 7 1 1 21 yhteensä % (N=403) 57 30 8 6 100 prosenttitaulukoissa oltava mukana havaintojen lukumäärä sarake- ja rivi-%-taulukot yleisimmin käytettyjä tiedekunnittaiset ikäjakaumat vaikuttavat hieman erilaisilta (kaikkien edelläolevien taulukoiden perusteella) taulukoiden tilastollista testausta käsitellään osassa 2 Taulukon visualisointi: kasattu pylväskuva 1 Kurssin osallistujien ikäjakauma (%) tiedekunnittain (N=403) Valtiotieteellinen (N=228) Matem.-luonnontiet. (N=92) Muut tiedekunnat (N=83) 0 10 20 30 40 50 60 % : 17-22 23-27 28-32 33-46 huomaa pylväiden pinta-alat ja %-akseli

Taulukon visualisointi: kasattu pylväskuva 2 Kurssin osallistujien ikäjakauma (%) tiedekunnittain (N=403) Valtiotieteellinen (N=228) Matem.-luonnontiet. (N=92) Muut tiedekunnat (N=83) 0 20 40 60 80 100 % : 17-22 23-27 28-32 33-46 huomaa pylväiden paksuudet ja %-akseli Taulukon visualisointi: monipylväskuva Kurssin osallistujien ikäjakauma (%) tiedekunnittain (N=403) Valtiotieteellinen (N=228) Matem.-luonnontiet. (N=92) Muut tiedekunnat (N=83) 0 20 40 60 % : 17-22 23-27 28-32 33-46 ikäryhmien %-osuuksia helpompi hahmottaa ja vertailla?

Esimerkki tunnuslukutaulukosta ESS 2002: Luottamus eduskuntaan ikäryhmittäin (N=207) asteikko: 0 = en luota ollenkaan, 10 = luotan erittäin vahvasti miehet naiset ikä keskiarvo -hajonta N keskiarvo -hajonta N 15-17 7.3 0.6 3 4.0 1.7 3 18-20 6.7 1.5 3 6.7 0.6 3 21-30 6.2 1.3 15 5.8 2.4 24 31-40 5.8 2.0 13 6.0 2.0 19 41-50 6.2 1.7 19 6.0 1.7 30 51-60 4.8 2.9 13 6.0 2.2 12 61-70 6.6 1.4 15 6.1 2.1 14 71-80 6.5 1.2 6 5.2 2.4 10 81-8.5 0.7 2 7.3 0.6 3 kaikki 6.1 1.9 89 5.9 2.0 118 Esimerkki tunnuslukutaulukosta, tiiviimpi versio ESS 2002: Luottamus eduskuntaan ikäryhmittäin (N=207) asteikko: 0 = en luota ollenkaan, 10 = luotan erittäin vahvasti miehet naiset ikä ka kh N ka kh N 15-17 7.3 0.6 3 4.0 1.7 3 18-20 6.7 1.5 3 6.7 0.6 3 21-30 6.2 1.3 15 5.8 2.4 24 31-40 5.8 2.0 13 6.0 2.0 19 41-50 6.2 1.7 19 6.0 1.7 30 51-60 4.8 2.9 13 6.0 2.2 12 61-70 6.6 1.4 15 6.1 2.1 14 71-80 6.5 1.2 6 5.2 2.4 10 81-8.5 0.7 2 7.3 0.6 3 kaikki 6.1 1.9 89 5.9 2.0 118 ka = keskiarvo, kh = keskihajonta

Taulukon visualisointi: keskiarvoprofiilit luottamus keskimäärin 10 9 8 7 6 5 4 3 2 1 0 Luottamus eduskuntaan ikäryhmittäin vuonna 2002 ESS (keskiarvot ja -hajonnat, N=207) asteikko: 0 = en luota ollenkaan, 10 = luotan erittäin vahvasti 15-17 18-20 21-30 31-40 41-50 51-60 61-70 71-80 81- ikäryhmä miehet naiset selvä ero vain 15 17 -vuotiailla (huomaa kuitenkin pieni N) myös keskiarvoerojen testausta käsitellään osassa 2 Toinen esimerkki tunnuslukutaulukosta KPT 2001: Työmatkan pituus ja pääasiallinen kulkuneuvo Työmatka yhteen suuntaan, km Kulkuneuvo p a m y s ka kh N Joukkoliikenne 1 5 8 12 999 14.8 50.7 934 (106) Henkilöauto 1 5 8 13 620 13.2 29.1 1092 (99) Polkupyörä 1 2 3 5 17 3.7 2.7 392 (32) Jalkaisin 1 1 2 3 8 1.9 1.1 356 (72) Muu kulkuneuvo 1 2 7 12 100 12.9 24.6 23 (8) (Työssä kotona) 50 (50) (Ei työssä) 2 4 6 6 10 5.5 2.7 601 (595) 1 3 5 9 325 9.9 32.3 479 (343) Kaikki yhteensä 1 3 6 10 999 11.0 34.8 3927 (1305) p = pienin arvo, a = alakvartiili, m = mediaani, y = yläkvartiili, s = suurin arvo ka = keskiarvo, kh = keskihajonta, N = vastausten lkm, = tieto puuttuu

Esimerkkejä kolmen muuttujan ristiintaulukoista (KPT) TAULUKKO 1 mies nainen yht TAULUKKO 2 mies nainen yht ika koul koul ika 15-24 perus 22 43 65 perus 15-24 22 43 65 yo/am 149 238 387 25-34 29 27 56 kork 20 65 85 35-44 51 74 125 25-34 perus 29 27 56 45-54 116 154 270 yo/am 170 278 448 55-64 133 184 317 kork 112 173 285 65-74 75 127 202 35-44 perus 51 74 125 yo/am 15-24 149 238 387 yo/am 146 235 381 25-34 170 278 448 kork 85 129 214 35-44 146 235 381 45-54 perus 116 154 270 45-54 120 213 333 yo/am 120 213 333 55-64 87 137 224 kork 86 86 172 65-74 31 38 69 55-64 perus 133 184 317 kork 15-24 20 65 85 yo/am 87 137 224 25-34 112 173 285 kork 58 59 117 35-44 85 129 214 65-74 perus 75 127 202 45-54 86 86 172 yo/am 31 38 69 55-64 58 59 117 kork 15 25 40 65-74 15 25 40 yht 1505 2285 3790 yht 1505 2285 3790 koulutustason luokat kuvattu selkeämmin lomakkeessa (taulukoihin perehdytään tarkemmin yhdessä) Esimerkkejä kolmen muuttujan ristiintaulukoista (KPT) TAULUKKO 3 perus yo/am kork yht TAULUKKO 4 perus yo/am kork yht ika sukup sukup ika 15-24 mies 22 149 20 191 mies 15-24 22 149 20 191 nainen 43 238 65 346 25-34 29 170 112 311 25-34 mies 29 170 112 311 35-44 51 146 85 282 nainen 27 278 173 478 45-54 116 120 86 322 35-44 mies 51 146 85 282 55-64 133 87 58 278 nainen 74 235 129 438 65-74 75 31 15 121 45-54 mies 116 120 86 322 nainen 15-24 43 238 65 346 nainen 154 213 86 453 25-34 27 278 173 478 55-64 mies 133 87 58 278 35-44 74 235 129 438 nainen 184 137 59 380 45-54 154 213 86 453 65-74 mies 75 31 15 121 55-64 184 137 59 380 nainen 127 38 25 190 65-74 127 38 25 190 yht 1035 1842 913 3790 yht 1035 1842 913 3790 TAULUKKO 5 15-24 25-34 35-44 45-54 55-64 65-74 yht koul sukup perus mies 22 29 51 116 133 75 426 nainen 43 27 74 154 184 127 609 yo/am mies 149 170 146 120 87 31 703 nainen 238 278 235 213 137 38 1139 kork mies 20 112 85 86 58 15 376 nainen 65 173 129 86 59 25 537 yht 537 789 720 775 658 311 3790 TAULUKKO 6 15-24 25-34 35-44 45-54 55-64 65-74 yht sukup koul mies perus 22 29 51 116 133 75 426 yo/am 149 170 146 120 87 31 703 kork 20 112 85 86 58 15 376 nainen perus 43 27 74 154 184 127 609 yo/am 238 278 235 213 137 38 1139 kork 65 173 129 86 59 25 537 yht 537 789 720 775 658 311 3790