Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan) b) Kvalitatiivisia muuttujia: asema; kvantitatiivisia muuttujia: ikä, palkka ja lasten lkm c) ei mitään, kunhan vain tietää miltä sarakkeelta eri muuttuja-arvot löytyvät d) ei mitään, koska ei ole mitään väliä sillä, missä järjestyksessä tilastoyksiköt ovat e) voi vääristää tilastoanalyysin tuloksia, jos on kvantitatiivinen muuttuja f) ok, yleisin tapa esittää puuttuva tieto. Nominaaliasteikkoa ja diskreettejä: Sukup, Asuu, Vars, Työ Ordinaaliasteikkoa ja diskreettejä: Matem, Ydinv, Tuuli/vesi, Pakko Intervalliasteikkoa ja diskreettejä: Vuosi, Kenkä Suhdeasteikkoa ja jatkuvia: Tunnit, Ikä, Pituus 3. Tilastoyksikkönä osallistuja; muuttujina x = sukupuoli ( = mies, = nainen), y = opetusmuoto ( = verkko, = luento) ja z =pistemäärien erotus. Tilastoyksiköitä 33 kpl, joten havaintomatriisissa 33 vaakariviä. Muuttujia 3 kpl, joten havaintomatriisissa varsinaisesti 3 saraketta Til.yks. x y z 0.3 3.5 9 4.7 0 6. 5.6 7 3.4 8.5 9 7.8 4 9.4 5 8. 6-6. 33 33. Voidaan esim. tutkia taustatietoja: montako miestä ja montako naista, kuinka moni seuraa luento-opetusta ja kuinka moni verkko-opetusta ja sitten voidaan tutkia esim.: tapahtuuko kurssilla oppimista (onko erotuksen keskiarvo nollaa suurempi), onko miesten ja naisten piste-eroilla eroa (onko miesten joukossa piste-eron keskiarvo sama kuin naisten joukossa), onko luento- ja verkko-opetuksilla eroa, sopiiko verkko-opetus paremmin miehille vai naisille, sopiiko luento-opetus paremmin miehille vai naisille. 4. Taulukko: vastausvaihtoehto frekvenssi suht. frekv. pros. frekv. t.e.m. 4 0. h.e.m. 3 0.58 6 e.e.e.s.m. 6 0.36 3 h.s.m. 3 0.58 6 t.s.m. 3 0.58 6 Yhteensä 9.000 00
5. a) vaihteluväli (58, 04) ja sen pituus w = 04-58 = 46. b) Koska n = 9, voisi luokkia olla esim.5, koska 5 = 3 > 9 (tai luokkien määrä voisi olla c) Luokkavälin pituus c > 5 46 = 9. ~ 0 d) ja e) Nyt valitaan k = 5 ja c = 0 (huom. mittaustarkkuus d = ) Pituus cm f i 00 p i F i 00 P i 55-64 5 6 5 6 65-74 4 9 47 75-84 4 3 68 85-94 3 6 6 84 95-04 3 6 9 00 Yhteensä 9 00 6. vaihteluväli (-9.4, 45.4) ja sen pituus w = 54.8. n = 33, voisi luokkia olla esim.6, koska 6 = 64 > 33 54.8 luokkavälin pituus c > = 9.33, esim. 0 6 (huom. mittaustarkkuus d = 0.) Frekvenssijakaumasta yksi versio: Testipisteiden erotus -0.0 - -0. 3 0.0-9.9 8 0.0-9.9 8 0.0-9.9 30.0-39.9 40.0-49.9 Yhteensä 33 f i
7. a), b) ja c)
8. Runkolehtikuvio, rungon leveys 0 vuotta : 8 : 3345689 3: 044688 4: 48 5: 0 9. lasten lukumäärä: keskiarvo keskihajonta [( ) ( ) ] =.9 ikä: keskiarvo keskihajonta [( ) ( ) ] = 5.9 0. 58, 6, 6, 6, 64, 65, 67, 7, 73, 75, 80, 8, 83, 89, 9, 94, 95, 03, 04 Vaihteluväli (58, 04) Moodiarvo 6 Mediaani on nousevan suuruusjärjestyksen sijalla 0, joten Md = x (0) = 75 = 3380 = 77.894 9 9 Keskiarvo x 73 80... 75 Keskihajonta s = = 73 80... 75 73 80... 75 9 9 8 6056 3380 9 =4.865 4.865... Variaatiokerroin V = = 0.083 77.894... Alakvartiilin sija nousevassa suuruusjärjestyksessä on k =( ) alakvartiili Q = x (5) = 64 Yläkvartiilin sija nousevassa suuruusjärjestyksessä on k =( ) yläkvartiili Q 3 = x (5) = 9 kvartiiliväli (64, 9) Koska mediaani on keskiarvoa pienempi, on pituuden jakauma oikealle loiveneva eli positiivisesti vino. Pituudet eroavat keskiarvosta keskimäärin lähes 5 cm. Koska kvartiiliväli on pituudeltaan yli 60 % vaihteluvälin pituudesta, on muuttuja-arvojen vaihtelu suhteellisen voimakasta ja siten keskittyminen heikohkoa.
Laatikko-viikset-kuvio:. a) Iän variaatiokerroin on V ikä = 0.084/3.63 = 0.309 ja pituudella V pit = 0.083, joten pituuden vaihtelu suhteellisesti pienempää kuin iän vaihtelu. b) Pituusarvo standardoituna on z pit = (65 77.89)/4.865 = -0.867 ja ikä standardoituna on z ikä = (38 3.63)/0.084 = 0.533, joten iän osalta muistuttaa suhteellisesti enemmän keskiarvoopiskelijaa.. Miehet:,, 3, 3, 4, 4, 4, 5, 5, 5 0 kpl Naiset:,,,,, 3,3,3, 3 9 kpl Miehet: pienin arvo ja suurin arvo 5 mediaanin sijaluvut 5 ja seuraava eli 6, joten Md = 4 alakvartiilin sijaluku k =( ), joten Q = tai/ja 3 tai.75 tai.5 yläkvartiilin sijaluku k =( ), joten Q 3 = 5 Naiset: pienin arvo ja suurin arvo 3 mediaanin sijaluku = 5, joten Md = alakvartiilin sijaluku k =( ), joten Q = yläkvartiilin sijaluku k =( ), joten Q 3 = 3 3. mediaaniluokka on neljäs luokka: 70 79, koska siinä luokassa summafrekvenssi on ensimmäisen kerran suurempi kuin 47/ = 3.5
0 47 mediaani Md 69.5 9 7.5 5 x 5 44.5 354.5 65.5 5 74.5 384.5 33.5 70.46 47 47 varianssi 33.5 s 5 44.5 354.5 64.5 5 74.5 384.5 47 47 keskiarvo 46 33.5 4065.75 47 59.39 Lisäksi voidaan laskea keskiluvuista moodi ja hajontaluvuista esim. vaihteluväli, vaihteluvälin pituus, kvartiiliväli, kvartiilivälin pituus, kvartiilipoikkeama, variaatiokerroin, koska muuttujan mitta-asteikko on suhdeasteikko. 4. a) esim. mediaani, koska jakauma ei ole symmetrinen vaan keskiarvo n. 400 euroa suurempi kuin mediaani. b) pienin suhteellinen vaihtelu on veroprosentilla, koska sillä on pienin variaatiokerroin V = c) sekä veroprosentilla että verotettavilla tuloilla on huipukkuusluku isohko positiivinen, joten molemmat d) verotettavien tulojen vinous on arvoltaan positiivinen, joten sen jakauma on oikealle loiveneva e) 65 vuotta täyttäneiden osuus, koska sen vinous ja huipukkuus ovat lähinnä lukua nolla f) 65 vuotta täyttäneiden osuus, koska standardoituna se on lähinnä lukua nolla, z = 5. Esim. pylväsryhmäkuvio, josta näkee, että miehet näyttävät suhtautuvan myönteisemmin lisäydinvoiman rakentamiseen kuin naiset.
6. Sukupuoli Mies Nainen Yhteensä Käy ansiotöissä Kyllä 6 6 Ei 4 3 7 Yhteensä 0 9 9 ( ) = 0.090; C = 0.069 C max = Muuttujat ovat lähes täysin riippumattomat. 7. Teoreettiset frekvenssit: Laatu Hinta Huono Hyvä Yhteensä Edull 9 3 Keski 0 4 4 Kallis 7 9 Yhteensä 30 45 75 ( ) ( ) ( ) ( ) ( ) ( ) C max = Hinnan ja laadun välillä on riippuvuutta siten, että huonolaatuiset ovat usein halvempia kuin hyvälaatuiset.