Tuuslukuja 27 III TUNNUSLUKUJA
Tuuslukuja 28 Tuuslukuja käytetää, ku tilastoaieistoa havaiollistetaa tiivistetysti yksittäisillä luvuilla. Tuusluvut lasketaa muuttujie arvoje perusteella ja e kuvaavat muuttuja jakaumaa. Tuuslukuje pääryhmät ovat sijaitiluvut ja hajotaluvut. Sijaitiluvut kuvaavat jakauma sijaitia ja hajotaluvut jakauma vaihtelua eli havaitoje poikkeavuutta toisistaa. 5. SIJAINTILUKUJA Tärkeimmät sijaitiluvut ovat keskiarvo, mediaai, moodi ja fraktiilit. Keskiarvo, mediaai ja moodi kuvaavat kuki tavallaa jakauma keskusta ja iitä kutsutaa keskiluvuiksi. 5.1. KESKIARVO Keskiarvo o tuetui tuusluvuista. Keskiarvo voidaa laskea välimatka- tai suhdeasteiko muuttujille. Keskiarvo lasketaa jakamalla havaitoje summa havaitoje lukumäärällä: x1 + x x= 2 +... + x = x i x x 1, x 2,,x = keskiarvo = muuttujie arvot, havaitoarvot = havaitoje lukumäärä = summa : Seuraavassa o lueteltu 7 eri ihmise kuukausipalkat ( /kk): 1 210, 1 429, 1 648, 1 765, 2 320, 4 271, 1 984 Palkkoje summa: = 14 267 Havaitoje lukumäärä, : 7 14 627 Keskiarvo = 7 2 090 Ryhmitellyssä aieistossa havaitoje summa saadaa
Tuuslukuja 29 kertomalla muuttuja arvot iide lukumäärillä ja laskemalla äi saadut tulot yhtee. Havaitoje lukumäärä o frekvessie summa. Lasketaa seuraavasta aieistosta keskimääräie poissaolopäivie lukumäärä. Poissaolopäiviä, x i Frekvessi, f i x i f i 0 5 0 1 7 7 2 8 16 3 2 6 4 3 12 5 4 20 29 61 Keskiarvo: X = 61 2,1 29 Keskiarvo samoi kui muutki tuusluvut pitää laskea aia alkuperäisestä aieistosta, ei luokitellusta aieistosta. Keskiarvo o eite käytetty keskiluku, vaikka se oki herkkä poikkeaville havaioille. Muuta aieistoa selvästi suuremmat tai pieemmät arvot paiavat keskiarvoa omaa suutaasa. Joissaki tilateissa tällaiset äärimmäise poikkeavat havaiot voidaa jättää pois keskiarvoa laskettaessa. Excelissä keskiarvo löytyy Kaavat-valitaauhasta kohdasta Lisää fuktio ja sieltä edellee imellä keskiarvo.
Tuuslukuja 30 5.1.1. Paiotettu keskiarvo Joskus havaioiti tehdää osajoukoittai, esim. kuittai ja äide osajoukoista saatuje tietoje perusteella tehdää sitte johtopäätöksiä koko perusjoukosta. Tällöi eri osajoukoilla o erilaie paioarvo, esim. juuri erikokoisilla kuilla o erilaie paioarvo. Isoilla kuilla o suurempi paioarvo kui pieillä. Lasketaa kokoaisarvosaa tietystä opitomoduulista, joka koostuu kolmesta opitojaksosta: OPINTOJAKSO OPINTOPISTEET ARVOSANA A 6 1 B 4 5 C 5 3 6*1+ 4*5 + 5*3 Arvosaa moduulista = = 2,7 6 + 4 + 5 Yleisesti: w1 * x1 + w2 * x2 +... + w x = w + w +... + w 1 2 * x = w x i w i i missä w i = paiot 5.2. MEDIAANI (Md) Mediaai o suuruusjärjestyksee järjestety aieisto keskimmäie arvo, jos havaitoja o parito määrä. Jos havaitoja o parillie määrä, mediaai o joko kahde keskimmäise arvo keskiarvo tai jompikumpi kahdesta keskimmäisestä arvosta. Mediaaia pieempiä ja suurempia arvoja o 50% havaioista. Koska muuttuja arvot täytyy saada suuruusjärjestyksee, pitää muuttuja olla vähitää välimatka-asteiko muuttuja. Edellisestä aieistosta (palkat) mediaai: 1 210, 1 429, 1 648, 1 765, 1 984, 2 320, 4 271 7 havaitoa, keskimmäie 1 765 eli mediaai o 1 765.
Tuuslukuja 31 Mediaai ei ole samaa tapaa herkkä poikkeaville havaioille kui keskiarvo. Se ei huomioi sitä, mite suuria tai mite pieiä se ympärillä olevat arvot ovat. Tämä äkyy myös edellisessä palkkaesimerkissä. Keskiarvo o 2 090 ja mediaai 1 765. Tämä ero johtuu siitä, että keskiarvoa paiaa ylöspäi yksi muita huomattavasti suurempi palkka, 4 271. Mediaaii se ei vaikuta, ei ole väliä kuika paljo suurempi tuo palkka o muita, joka tapauksessa keskimmäie palkka o 1 765. Excelissä mediaai lasketaa fuktiolla mediaai. 5.3. MOODI ELI TYYPPIARVO (Mo) Tyyppiarvo o arvo, joka esiityy useimmi. Se voidaa määrittää myös laatueroasteiko muuttujille. Tällaisille muuttujilleha ei voi määrittää tai laskea muita tuuslukuja. Moodi äkee myös frekvessijakaumasta, se o se muuttuja arvo, joka frekvessi o suuri. Näi koska moodi o se muuttuja arvo, joka esiityy useimmi. Jos muuttuja arvoja o paljo tai muuttuja o jatkuva, pitää se luokitella esi. Luokitellusta aieistosta moodi o se luokka tai se luoka keskikohta, joka frekvessi o suuri. Moodi o helppo määrittää, mutta se ei välttämättä kuvaa kovi hyvi jakauma keskimääräistä sijaitia. Excelissä moodi lasketaa fuktiolla moodi. 5.4. FRAKTIILIT Samaa tapaa kui mediaai yhteydessä sitä pieempiä arvoja o 50% havaioista, voidaa vastaavasti valita mikä tahasa prosettiluku ja määrittää se arvo, jota pieempiä o juuri tämä prosettiluvu verra kaikista havaioista. Tällaisia prosettiosuuksia imitetää fraktiileiksi. P%: fraktiili rajaa suuruusjärjestyksessä olevasta aieistosta pois p% havaioista vasemmalta (eli siis rajaa pieemmät arvot pois). Seuraavia fraktiileja käytetää paljo: o Q 1 = alakvartiili, rajaa 25 % havaioista o Q 2 = mediaai, rajaa 50 % havaioista
Tuuslukuja 32 o Q 3 = yläkvartiili, rajaa 75 % havaioista o D 9 = yhdeksäs desiili, rajaa 90% havaioista Jotta fraktiilit voidaa laskea, pitää muuttuja olla vähitää järjestysasteiko muuttuja. Excelillä fraktiilit lasketaa fuktiolla prosettipiste. Lasketaa kuta-aieistosta asukasluvu alakvartiili Q 1. Vastaukseksi tulee 2 330,5 eli 25%:ssa Suome kuista o asukkaista korkeitaa 2 330,5. Fraktiileja käytetää ilmoittamaa jakauma sijaiti. Käyttämällä ylä- ja alakvartiilia rajataa pieimmät ja suurimmat 25 % aieistosta pois eli jäljelle jää keskimmäie 50 %:a. Kaikkei suurimmat ja pieimmät arvot o äi rajattu pois. 6. HAJONTALUKUJA Havaitoje keskiäise sijaii ja iide jakautumise kuvaamisee käytetää hajotalukuja. Hajoalla kuvataa sitä, mite laajalle ja millä tavalla havaiot ovat jakaatueet. 6.1. VAIHTELUVÄLI Vaihteluväli ulottuu havaitoaieisto pieimmästä arvosta suurimpaa arvoo. Jos aieisto o luokiteltu, se ulottuu esimmäise luoka alarajasta viimeise luoka ylärajaa. Jotta
Tuuslukuja 33 vaihteluväli voidaa ilmoittaa, muuttuja täytyy olla vähitää järjestysasteiko muuttuja. Vaihteluväli pituus o suurimma ja pieimmä arvo erotus. Kegäumerot vaihtelevat 35 ja 46 välillä. Vaihteluväli: (35,46) Vaihteluväli pituus 46 35 = 11 Vaihteluväli pituus o helppo laskea, mutta ei yksiää aa kovi hyvää kuvaa aieistosta, koska se ottaa huomioo vai aieisto äärimmäiset arvot. Excelissä vaihteluväli voidaa määrittää fuktioide mi ja maks avulla. 6.2. KVARTIILIVÄLI Kvartiiliväli ulottuu alakvartiilista yläkavartiilii. Tämäki vaatii järjestysasteiko muuttuja. Kvartiiliväli ei ole aiva yhtä herkkä muista havaioista poikkeaville havaioille, koska äärimmäiset arvot o rajattu pois. Kvartiilivälii kuuluu puolet havaioista ja se ala- ja yläpuolelle jää 25% havaioista. Samalla tavalla voidaa valita joki muuki prosettiosuus, joka mukaa muodostetaa vastaavasti joki muu väli (esim. 5%). 6.3. KESKIHAJONTA JA VARIANSSI Keskihajota o eite käytetty hajotaa kuvaava tuusluku. Se ottaa huomioo kaikki havaiot, toisi kui esimerkiksi vaihteluväli, joka ottaa huomioo vai äärimmäiset arvot. Keskihajota voidaa laskea välimatka- ja suhdeasteiko muuttujille. Sitä merkitää tuuksella s. Keskihajoassa otetaa huomioo jokaie havaito ja se poikkeama keskiarvosta. Se mittaa havaitoje ryhmittymistä keskiarvosa ympärille. Seuraavaa kaavaa käytetää yleisesti keskihajoa laskemisee: ( xi x) s = 1 2 Tästä kaavasta ilmeee, että mitä vähemmä havaiot poikkeavat keskiarvosta, sitä pieempi o keskihajota. Jos aieisto o heterogeeista, keskihajota o suurempi kui jos
Tuuslukuja 34 aieisto olisi homogeeista. Keskihajota o luotettava hajoa mitta ja se o helppo laskea Excelillä. Excelissä keskihajota lasketaa fuktiolla keskihajota. Kyselyy osallistueide iät olivat: 20 25 22 21 23 28 19 18 22 24 25 22 23 24 23 23 22 27 20 21 Näide ikie keskiarvo o 22,6 ja keskihajota, 2.5. Keskihajota o suhteellise piei, eli kyselyy vastaeet olivat melko sama ikäisiä. Keskihajoa arvo ei muutu, jos kaikkii lukuihi lisätää tai iistä väheetää sama luku. Jos luvut kerrotaa tai jaetaa samalla luvulla, keskihajoa arvo tulee myös kerrotuksi tai jaetuksi samalla luvulla. Variassi o keskihajoa eliö. 7. KESKIARVON LUOTTAMUSVÄLI Jos tutkimus o tehty otoksesta, oleellista o kertoa, mite luotettavia otoksesta saadut tuusluvut ovat, ku iitä sovelletaa perusjoukkoo. Siksi eustettaessa otoksesta lasketulla keskiarvolla perusjouko keskiarvoa, ilmoitetaa usei myös keskiarvo luottamusväli. Yleisimmi käytetää 95% luottamusväliä. Se tarkoittaa, että perusjouko keskiarvo x ± 2* s sijaitsee 95%: varmuudella tietyllä ilmoitetulla välillä. Keskiarvo 95%: luottamusväli o: Tietystä aieistosta (otoksesta) o laskettu keskiarvoksi 23 ja keskihajoaksi 7. Aieisto koko o 50. Lasketaa luottamusväli: Alaraja: 7 23 2* 21,02 50
Tuuslukuja 35 Yläraja: 7 23 + 2 * 24,98 50 Koko perusjouko keskiarvo o 95 %: varmuudella välillä (21,02, 24,98) 8. TUNNUSLUKUJEN VERTAILU Havaitoaieisto voidaa jakaa ryhmii ja laskea äistä eri ryhmistä erilaisia tuuslukuja, esim. sukupuole, pohjakoulutukse yms. perusteella. Excelissä voidaa käyttää suodatusta tai Pivot-taulukoita muuttujie tarkasteluu ryhmittäi. Suodatus tehdää Excelissä Tiedot-valitaauha Suodata-paiikkee kautta.