Teema 5: Ristiintaulukointi Kahden (tai useamman) muuttujan ristiintaulukointi: aineiston analysoinnin ja tulosten esittämisen perusmenetelmä usein samat tiedot esitetään sekä taulukkona että kuvana mahdollisen riippuvuuden havaitseminen (ei vain lineaarisen) Eri tyyppiset taulukot: frekvenssitaulukot soveltuvat kaikille muuttujille: laadulliset ja diskreetit muuttujat sellaisenaan jatkuvat muuttujat luokiteltuina (vrt. pylväskuva) luokkia tarvittaessa yhdisteltävä (tiivistäminen) prosenttitaulukot kuvaavat suhteellisia osuuksia: oltava tarkkana, mitä taulukon osaa kuvataan: sarakkeita / rivejä / kokonaismäärää? esityskäytössä %:t hyvä pyöristää kokonaisluvuiksi laskelmat kuitenkin tehtävä tarkemmilla luvuilla tunnuslukutaulukot kuvaavat jatkuvia muuttujia: esim. keskiarvot ja -hajonnat luokittain Esimerkki frekvenssitaulukosta Kurssin osallistujien ikäjakauma tiedekunnittain: (lähde: WebOodi/KV) Tiedekunta 17 22 23 27 28 32 33 46 yht. Valtiotieteellinen 132 62 21 13 228 Matem. luonnontiet. 47 30 9 6 92 Muut tiedekunnat 49 27 3 4 83 yhteensä 228 119 33 23 403 tdk: 3 luokkaa, ikä: 4 luokkaa, joten taulukossa 3 4 = 12 solua rivejä ja sarakkeita kutsutaan ehdollisiksi jakaumiksi: esim. ikäjakauma ehdolla että tarkastellaan valtiotieteellistä rivi- ja sarakesummia kutsutaan reunajakaumiksi: ikä: ks. Teema3:n pylväskuva, tdk: ks. Harjoitus 3, Tehtävä 3 taulukon kokonaismäärä (N=403) on solujen tai kumman tahansa reunajakauman summa
Esimerkki prosenttitaulukoista Sarakeprosentit ja riviprosentit (huomaa merkitysero): Valtiotieteellinen 57.9 52.1 63.6 56.5 56.6 Matem. luonnontiet. 20.6 25.2 27.3 26.1 22.8 Muut tiedekunnat 21.5 22.7 9.1 17.4 20.6 yhteensä % (N=403) 100.0 100.0 100.0 100.0 100.0 Valtiotieteellinen 57.9 27.2 9.2 5.7 100.0 Matem. luonnontiet. 51.1 32.6 9.8 6.5 100.0 Muut tiedekunnat 59.0 32.5 3.6 4.8 100.0 yhteensä % (N=403) 56.6 29.5 8.2 5.7 100.0 Esimerkki prosenttitaulukoista, toinen versio Samat %-taulukot kuin edellä, mutta luvut pyöristetty: Valtiotieteellinen 58 52 64 57 57 Matem. luonnontiet. 21 25 27 26 23 Muut tiedekunnat 22 23 9 17 21 yhteensä % (N=403) 100 100 100 100 100 Valtiotieteellinen 58 27 9 6 100 Matem. luonnontiet. 51 33 10 7 100 Muut tiedekunnat 59 33 4 5 100 yhteensä % (N=403) 57 30 8 6 100
Esimerkki prosenttitaulukoista, kolmas muoto Kokonaisprosentit (huomaa erot ja yhtäläisyydet): Valtiotieteellinen 33 15 5 3 57 Matem. luonnontiet. 12 7 2 2 23 Muut tiedekunnat 12 7 1 1 21 yhteensä % (N=403) 57 30 8 6 100 prosenttitaulukoissa oltava mukana havaintojen lukumäärä sarake- ja rivi-%-taulukot yleisimmin käytettyjä tiedekunnittaiset ikäjakaumat vaikuttavat hieman erilaisilta (kaikkien edelläolevien taulukoiden perusteella) taulukoiden tilastollista testausta käsitellään osassa 2 Taulukon visualisointi: kasattu pylväskuva 1 Kurssin osallistujien ikäjakauma (%) tiedekunnittain (N=403) Valtiotieteellinen (N=228) Matem.-luonnontiet. (N=92) Muut tiedekunnat (N=83) 0 10 20 30 40 50 60 % : 17-22 23-27 28-32 33-46 huomaa pylväiden pinta-alat ja %-akseli
Taulukon visualisointi: kasattu pylväskuva 2 Kurssin osallistujien ikäjakauma (%) tiedekunnittain (N=403) Valtiotieteellinen (N=228) Matem.-luonnontiet. (N=92) Muut tiedekunnat (N=83) 0 20 40 60 80 100 % : 17-22 23-27 28-32 33-46 huomaa pylväiden paksuudet ja %-akseli Taulukon visualisointi: monipylväskuva Kurssin osallistujien ikäjakauma (%) tiedekunnittain (N=403) Valtiotieteellinen (N=228) Matem.-luonnontiet. (N=92) Muut tiedekunnat (N=83) 0 20 40 60 % : 17-22 23-27 28-32 33-46 ikäryhmien %-osuuksia helpompi hahmottaa ja vertailla?
Esimerkki tunnuslukutaulukosta ESS 2002: Luottamus eduskuntaan ikäryhmittäin (N=207) asteikko: 0 = en luota ollenkaan, 10 = luotan erittäin vahvasti miehet naiset ikä keskiarvo -hajonta N keskiarvo -hajonta N 15-17 7.3 0.6 3 4.0 1.7 3 18-20 6.7 1.5 3 6.7 0.6 3 21-30 6.2 1.3 15 5.8 2.4 24 31-40 5.8 2.0 13 6.0 2.0 19 41-50 6.2 1.7 19 6.0 1.7 30 51-60 4.8 2.9 13 6.0 2.2 12 61-70 6.6 1.4 15 6.1 2.1 14 71-80 6.5 1.2 6 5.2 2.4 10 81-8.5 0.7 2 7.3 0.6 3 kaikki 6.1 1.9 89 5.9 2.0 118 Esimerkki tunnuslukutaulukosta, tiiviimpi versio ESS 2002: Luottamus eduskuntaan ikäryhmittäin (N=207) asteikko: 0 = en luota ollenkaan, 10 = luotan erittäin vahvasti miehet naiset ikä ka kh N ka kh N 15-17 7.3 0.6 3 4.0 1.7 3 18-20 6.7 1.5 3 6.7 0.6 3 21-30 6.2 1.3 15 5.8 2.4 24 31-40 5.8 2.0 13 6.0 2.0 19 41-50 6.2 1.7 19 6.0 1.7 30 51-60 4.8 2.9 13 6.0 2.2 12 61-70 6.6 1.4 15 6.1 2.1 14 71-80 6.5 1.2 6 5.2 2.4 10 81-8.5 0.7 2 7.3 0.6 3 kaikki 6.1 1.9 89 5.9 2.0 118 ka = keskiarvo, kh = keskihajonta
Taulukon visualisointi: keskiarvoprofiilit luottamus keskimäärin 10 9 8 7 6 5 4 3 2 1 0 Luottamus eduskuntaan ikäryhmittäin vuonna 2002 ESS (keskiarvot ja -hajonnat, N=207) asteikko: 0 = en luota ollenkaan, 10 = luotan erittäin vahvasti 15-17 18-20 21-30 31-40 41-50 51-60 61-70 71-80 81- ikäryhmä miehet naiset selvä ero vain 15 17 -vuotiailla (huomaa kuitenkin pieni N) myös keskiarvoerojen testausta käsitellään osassa 2 Toinen esimerkki tunnuslukutaulukosta KPT 2001: Työmatkan pituus ja pääasiallinen kulkuneuvo Työmatka yhteen suuntaan, km Kulkuneuvo p a m y s ka kh N Joukkoliikenne 1 5 8 12 999 14.8 50.7 934 (106) Henkilöauto 1 5 8 13 620 13.2 29.1 1092 (99) Polkupyörä 1 2 3 5 17 3.7 2.7 392 (32) Jalkaisin 1 1 2 3 8 1.9 1.1 356 (72) Muu kulkuneuvo 1 2 7 12 100 12.9 24.6 23 (8) (Työssä kotona) 50 (50) (Ei työssä) 2 4 6 6 10 5.5 2.7 601 (595) 1 3 5 9 325 9.9 32.3 479 (343) Kaikki yhteensä 1 3 6 10 999 11.0 34.8 3927 (1305) p = pienin arvo, a = alakvartiili, m = mediaani, y = yläkvartiili, s = suurin arvo ka = keskiarvo, kh = keskihajonta, N = vastausten lkm, = tieto puuttuu
Esimerkkejä kolmen muuttujan ristiintaulukoista (KPT) TAULUKKO 1 mies nainen yht TAULUKKO 2 mies nainen yht ika koul koul ika 15-24 perus 22 43 65 perus 15-24 22 43 65 yo/am 149 238 387 25-34 29 27 56 kork 20 65 85 35-44 51 74 125 25-34 perus 29 27 56 45-54 116 154 270 yo/am 170 278 448 55-64 133 184 317 kork 112 173 285 65-74 75 127 202 35-44 perus 51 74 125 yo/am 15-24 149 238 387 yo/am 146 235 381 25-34 170 278 448 kork 85 129 214 35-44 146 235 381 45-54 perus 116 154 270 45-54 120 213 333 yo/am 120 213 333 55-64 87 137 224 kork 86 86 172 65-74 31 38 69 55-64 perus 133 184 317 kork 15-24 20 65 85 yo/am 87 137 224 25-34 112 173 285 kork 58 59 117 35-44 85 129 214 65-74 perus 75 127 202 45-54 86 86 172 yo/am 31 38 69 55-64 58 59 117 kork 15 25 40 65-74 15 25 40 yht 1505 2285 3790 yht 1505 2285 3790 koulutustason luokat kuvattu selkeämmin lomakkeessa (taulukoihin perehdytään tarkemmin yhdessä) Esimerkkejä kolmen muuttujan ristiintaulukoista (KPT) TAULUKKO 3 perus yo/am kork yht TAULUKKO 4 perus yo/am kork yht ika sukup sukup ika 15-24 mies 22 149 20 191 mies 15-24 22 149 20 191 nainen 43 238 65 346 25-34 29 170 112 311 25-34 mies 29 170 112 311 35-44 51 146 85 282 nainen 27 278 173 478 45-54 116 120 86 322 35-44 mies 51 146 85 282 55-64 133 87 58 278 nainen 74 235 129 438 65-74 75 31 15 121 45-54 mies 116 120 86 322 nainen 15-24 43 238 65 346 nainen 154 213 86 453 25-34 27 278 173 478 55-64 mies 133 87 58 278 35-44 74 235 129 438 nainen 184 137 59 380 45-54 154 213 86 453 65-74 mies 75 31 15 121 55-64 184 137 59 380 nainen 127 38 25 190 65-74 127 38 25 190 yht 1035 1842 913 3790 yht 1035 1842 913 3790 TAULUKKO 5 15-24 25-34 35-44 45-54 55-64 65-74 yht koul sukup perus mies 22 29 51 116 133 75 426 nainen 43 27 74 154 184 127 609 yo/am mies 149 170 146 120 87 31 703 nainen 238 278 235 213 137 38 1139 kork mies 20 112 85 86 58 15 376 nainen 65 173 129 86 59 25 537 yht 537 789 720 775 658 311 3790 TAULUKKO 6 15-24 25-34 35-44 45-54 55-64 65-74 yht sukup koul mies perus 22 29 51 116 133 75 426 yo/am 149 170 146 120 87 31 703 kork 20 112 85 86 58 15 376 nainen perus 43 27 74 154 184 127 609 yo/am 238 278 235 213 137 38 1139 kork 65 173 129 86 59 25 537 yht 537 789 720 775 658 311 3790