Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan) b) Kvalitatiivisia muuttujia: asema; kvantitatiivisia muuttujia: ikä, palkka ja lasten lkm c) ei mitään, kunhan vain tietää miltä sarakkeelta eri muuttuja-arvot löytyvät d) ei mitään, koska ei ole mitään väliä sillä, missä järjestyksessä tilastoyksiköt ovat e) voi vääristää tilastoanalyysin tuloksia, jos on kvantitatiivinen muuttuja f) ok, yleisin tapa esittää puuttuva tieto. Nominaaliasteikkoa ja diskreettejä: Sukup, Asuu, Vars, Työ Ordinaaliasteikkoa ja diskreettejä: Matem, Ydinv, Tuuli/vesi, Pakko Intervalliasteikkoa ja diskreettejä: Vuosi, Kenkä Suhdeasteikkoa ja jatkuvia: Tunnit, Ikä, Pituus 3. Tilastoyksikkönä osallistuja; muuttujina x = sukupuoli ( = mies, = nainen), y = opetusmuoto ( = verkko, = luento) ja z =pistemäärien erotus. Tilastoyksiköitä 33 kpl, joten havaintomatriisissa 33 vaakariviä. Muuttujia 3 kpl, joten havaintomatriisissa varsinaisesti 3 saraketta Til.yks. x y z 0.3 3.5 9 4.7 0 6. 5.6 7 3.4 8.5 9 7.8 4 9.4 5 8. 6-6. 33 33. Voidaan esim. tutkia taustatietoja: montako miesta ja montako naista, kuinka moni seuraa luento-opetusta ja kuinka moni verkko-opetusta ja sitten voidaan tutkia esim.: tapahtuuko kurssilla oppimista (onko erotuksen keskiarvo nollaa suurempi), onko miesten ja naisten piste-eroilla eroa (onko miesten joukossa piste-eron keskiarvo sama kuin naisten joukossa), onko luento- ja verkko-opetuksilla eroa, sopiiko verkko-opetus paremmin miehille vai naisille, sopiiko luento-opetus paremmin miehille vai naisille. 4. Taulukko: vastausvaihtoehto frekvenssi suht. frekv. pros. frekv. t.e.m. 0.09 9 h.e.m. 3 0.7 7 e.e.e.s.m. 4 0.36 36 h.s.m. 0.8 8 t.s.m. 0.09 9 Yhteensä.00 00
5. a) 36+33+43+9 = 4 b) ++3+0 = 6 c) 36*+33*+43*3+9*0 =34 d) + +3 +0 = 4 e) 4*6 = 846 f) 36 +33 +43 +9 = 5075 g) 4 = 988 6. a) vaihteluväli (60, 89) ja sen pituus w = 89-60 = 9. b) Koska n =, voisi luokkia olla esim.4, koska 4 = 6 > tai luokkien määrä voisi olla. 9 c) Luokkavälin pituus c > = 5.8 ~ 6 5 d) ja e) Nyt valitaan k = 3 ja c = 0 (huom. mittaustarkkuus d = ) Pituus cm f i 00 p i F i 00 P i 60-69 4 36 4 36 70-79 4 36 8 73 80-89 3 7 00 Yhteensä 00 7. vaihteluväli (-9.4, 45.4) ja sen pituus w = 54.8. n = 33, voisi luokkia olla esim.6, koska 6 = 64 > 33 54.8 luokkavälin pituus c > = 9.33, esim. 0 6 (huom. mittaustarkkuus d = 0.) Frekvenssijakaumasta yksi versio: Testipisteiden erotus -0.0 - -0. 3 0.0-9.9 8 0.0-9.9 8 0.0-9.9 30.0-39.9 40.0-49.9 Yhteensä 33 f i 8 a) ja b)
c) 9. Runkolehtikuvio, rungon leveys 0 vuotta : 9 : 033 3: 678 4: 57 0. lasten lukumäärä: = =.5 = ( + +3 +0 ) () =.9 ikä = = 35.5 = (36 + 33 + 43 + 9 ) () = 5.9
. vaihteluväli (60, 89) moodiarvoja sekä 69 että 76 mediaani on nousevan suuruusjärjestyksen sijalla x = 908 = 73.45 keskiarvo 7685... 80 keskihajonta s = =8.96 =6, joten Md = 7 76 75... 80 76 85... 80 = 0 908 33748 8.96 variaatiokerroin V = = 0.05 73.45 alakvartiilin sija nousevassa suuruusjärjestyksessä on k =(+) =3 alakvartiili Q = 69 yläkvartiilin sija nousevassa suuruusjärjestyksessä on k =(+) =9 yläkvartiili Q 3 = 80 kvartiiliväli (69, 80) Koska mediaani ja keskiarvo ovat melko samankokoisia, on pituuden jakauma lähes symmetrinen. Pituudet eroavat keskiarvosta keskimäärin 8.9 cm. Koska kvartiiliväli on 40 % vaihteluvälistä, on muuttuja-arvojen vaihtelu suhteellisen voimasta ja siten keskittyminen heikohkoa. Laatikko-viikset-kuvio:. Iän variaatiokerroin on V ikä = 0.80/3.9 = 0.338 ja pituudella V pit = 8.96/73.45 = 0.05, joten pituuden vaihtelu suhteellisesti pienempää kuin iän vaihtelu. 3. Pituusarvo standardoituna on z pit = (69-73.45)/8.96 = -0.50 ja ikä standardoituna on z ikä = (37-3.9)/0.80 = 0., joten iän osalta muistuttaa suhteellisesti enemmän keskiarvoopiskelijaa.
4. Pienin arvo 3 ja suurin arvo 5. Mediaanin sijaluku sama kuin tehtävässä, joten mediaani on 4; alakvartiilin sijaluku sama kuin tehtävässä, joten alakvartiili on 4; yläkvartiilin sijaluku kuten tehtävässä, joten yläkvartiili on 5. 5. mediaaniluokka on neljäs luokka: 70 79, koska siinä luokassa summafrekvenssi on ensimmäisen kerran suurempi kuin / = 3.5 0 mediaani Md 69.5 9 7.5 5 keskiarvo x 5 44.5 354.5 65.5 574.5 384.5 33.5 70.46 varianssi 33.5 s 5 44.5 354.5 64.5 5 74.5 384.5 46 33.5 4065.75 59.39 Lisäksi voidaan laskea keskiluvuista moodi ja hajontaluvuista esim. vaihteluväli, vaihteluvälin pituus, kvartiiliväli, kvartiilivälin pituus, kvartiilipoikkeama, variaatiokerroin, koska muuttujan mitta-asteikko on suhdeasteikko. 6. a) esim. mediaani, koska jakauma ei ole symmetrinen vaan keskiarvo n. 400 euroa suurempi kuin mediaani. b) pienin suhteellinen vaihtelu on veroprosentilla, koska sillä on pienin variaatiokerroin V =,, c) sekä veroprosentilla että verotettavilla tuloilla on huipukkuusluku isohko positiivinen, joten molemmat d) verotettavien tulojen vinous on arvoltaan positiivinen, joten sen jakauma on oikealle loiveneva e) 65 vuotta täyttäneiden osuus, koska sen vinous ja huipukkuus ovat lähinnä lukua nolla f) 65 vuotta täyttäneiden osuus, koska standardoituna se on lähinnä lukua nolla, z =.. 0.745,