86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164 (R-ohjelmistolla puuttuvan tiedon merkki on oletusarvoisesti NA, yllä olevassa matriisissa puuttuvaa tietoa voisi merkitä myös esim. pisteellä). b) Autojen nopeusmittarien testaaminen. b1) Nopeuden pistekuvio: B A 98 99 1 2 3 4 5 Nopeus (km/h) b2) Auton B nopeusmittari on harhaton (ei systemaattista virhettä), kun taas auton A nopeusmittari on selvästi harhainen. A:n mittari näyttää systemaattisesti liian suuria nopeuslukemia. Auton A nopeusmittari on tarkka, sen toistettavuuus eli konsistenssi on kunnossa. Auton B nopeusmittarin mittaustulokset vaihtelevat paljon enemmän kuin autolla A, joten auton B nopeusmittarin konsistenssi on selvästi auton A mittaria huonompi. 2. Henkilön B ikäarviot vuosina. a) Biokemistien tekemät arviot. v 1 v TAI v 1 v 2 4 2 4556778888889 2 556778888889 3 1345668 3 134 4 5 3 5668 4 4 5 1
b) Biokemistien (n = 22) laatikko-jana - kuvion piirtämistä varten tarvittavat tunnusluvut: Min = x (1) = 24 v Alakvartiili Q 1 : n/4 = 22/4 = 5.5 Q 1 = x (6) = 27 v Mediaani Md : n/2 = 22/2 = 11 Md = x (11)+x (12) 2 = 28+28 2 = 28 v Yläkvartiili Q 3 : 3n/4 = 3 22/4 = 16.5 Q 3 = x (17) = 34 v Maks = x (n) = x (22) = 45 v Maantieteilijöiden vastaavat havaintoarvot saadaan suoraan R-tulostuksesta: min = 24, Q 1 =, Md = 32, Q 3 = 35 ja maks = 48. Vertailua varten tarvittava laatikko-jana -kuvio on BIOK MAAN 25 35 45 Arvion henkilön B iästä (v) Keskimääräinen ikäarvio näyttäisi olevan maantieteilijöillä korkeampi kuin biokemisteillä. Kun vaihtelun määrää mitataan kvartiilivälin pituudella, biokemistien arviot näyttävät vaihtelevan hieman enemmän. (Vaihteluvälillä mitattuna toisin päin.) 3. Tauluun osuneet pallot. a) Suhdeasteikon diskreetti muuttuja. b) Tauluun osuneiden pallojen frekvenssijakauma (kaksi oikeanpuoleisinta saraketta ovat c)-kohdassa kysyttyä summajakaumaa): Tauluun osuneiden pallojen lkm f %f F %F 16 11 16 11 1 37 25 53 36 2 62 42 115 77 3 34 23 149 2
1 2 3 Tauluun osuneiden pallojen lkm c) Summajakauma esitetty b)-kohdassa. (Suhteellisen) summajakauman graafinen esitys. 8 % F 1 1 2 3 4 Tauluun osuneiden pallojen lkm Huom.: Kohtien b) ja c) kuvatyypin valinta perustuu siihen, että kuvattava muuttuja on vähintään välimatka-asteikkoa, diskreetti ja siitä on havaittu aineistossa vain muutamia erillisiä arvoja. 4. Esineen painon arviointi. a) Esitetyn frekvenssijakauman luokitus on tasavälinen, joten histogrammia varten frekvenssejä ei tarvitse korjata. Painoarvioiden histogrammi 19 39 59 79 8 99 3
b) Esitetyn frekvenssijakauman luokitus ei ole nyt tasavälinen, joten histogrammia piirrettäessä on käytettävä korjattuja frekvenssejä. Lisäksi ei-tasavälinen luokitus on otettava huomioon histogrammin pylväiden leveyksissä. Arvio esineen painosta (v) f %f Luokan pituus 19 44 195 ( 5) = 39 66 44 395 195 = 99 39 26 995 395 = Valitaan perusluokaksi luokka 39, koska ko. luokassa luokkavälin pituus on lyhin luokituksessa esiintyvä luokkavälin pituus. Eri luokkien korjatut frekvenssit h i ovat: Luokka 19: h 1 = 44 (/) = 44 Luokka 39: h 2 = 66 (/) = 66 Luokka 99: h 3 = 39 (/) = 13 Painoarvioiden jakauma histogrammina: Painoarvioiden histogrammi 66 Korjattu frekvenssi 44 39 19 39 99 5. Harjoituksen 1 tehtävässä 4 tarkasteltu taulukko: Opiskelijan opintosuunta Sukupuoli Biokemia Biologia Maantiede Muu Mies 15 17 9 Nainen 12 61 21 6 a) Opintosuunnan frekvenssijakauma: Opiskelijan opintosuunta f %f Biokemia 22 14.6 Biologia 76.3 Maantiede 38 25.2 Muu 15 9.9 Yhteensä 151 4
b) Opintosuunta on mitta-asteikoltaan luokitteluasteikkoa, joten kuvataan jakauma pylväskuvion avulla. Kuviossa luokat järjestetään frekvenssien mukaan suuruusjärjestykseen. 8 Biol Maan Biok Muu Opiskelijan opintosuunta 6. Esineen painon arviointi. a) Kuvattava frekvenssijakauma luokkakeskuksilla (X i ) täydennettynä. Arvio esineen painosta (g) f %f Luokkakeskus X i 19 44 95 39 66 44 295 59 33 22 495 79 4 3 695 8 99 2 1 895 Jakauma frekvenssimonikulmiona: 5 95 295 495 695 895 95 5
b) Painoarvioiden summajakauma Arvio esineen painosta (g) f %f F %F 19 44 44 39 66 44 1 74 99 39 26 149 (Prosenttinen) summajakauma graafisesti: Prosenttinen summafrekvenssi 9 8 8 9 6