Tunnuslukuja 27 III TUNNUSLUKUJA

Samankaltaiset tiedostot
TILASTOT: johdantoa ja käsitteitä

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Otantajakauman käyttö päättelyssä

3.2 Sijaintiluvut. MAB5: Tunnusluvut

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Mat Tilastollisen analyysin perusteet, kevät 2007

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

****************************************************************** ****************************************************************** 7 Esim.

Osa 2: Otokset, otosjakaumat ja estimointi

n = 100 x = %:n luottamusväli µ:lle Vastaus:

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

8. laskuharjoituskierros, vko 11, ratkaisut

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

811312A Tietorakenteet ja algoritmit, , Harjoitus 4, Ratkaisu

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

6. Kombinaatio-oppi, todennäköisyys ja tilastot

Taloyhtiöiden jätehuoltopalvelut

Tilastotieteen perusteet

Til.yks. x y z

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Tilastotieteen johdantokurssi

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen

4.3 Signaalin autokorrelaatio

RATKAISUT x 2 3 = x 2 + 2x + 1, eli 2x 2 2x 4 = 0, joka on yhtäpitävä yhtälön x 2 x 2 = 0. Toisen asteen yhtälön ratkaisukaavalla saadaan

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

811312A Tietorakenteet ja algoritmit , Harjoitus 1 ratkaisu

TYÖNTEKIJÄIN ELÄKELAIN MUKAISEN VAKUUTUKSEN YLEISET LASKUPERUSTEET. Kokooma Viimeisin perustemuutos on vahvistettu

Mat Sovellettu todennäköisyyslasku A

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastotieteen perusteet

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

MATP153 Approbatur 1B Harjoitus 1, ratkaisut Maanantai

Kvantitatiiviset menetelmät

Vastaus: Kertymäfunktio on F( x) = x, kun 0 x 20. Todennäköisyydet ovat molemmat 1. Frekvenssi f

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

pisteet Frekvenssi frekvenssi Yhteensä

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Tehtäviä neliöiden ei-negatiivisuudesta

Tilastollinen päättely II, kevät 2017 Harjoitus 3B

Kandidaatintutkielman aineistonhankinta ja analyysi

Sovellettu todennäköisyyslaskenta B

Matematiikan tukikurssi

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Tilastollisten aineistojen kuvaaminen

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

811312A Tietorakenteet ja algoritmit, , Harjoitus 3, Ratkaisu

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Kvantitatiiviset menetelmät

KERTAUSHARJOITUKSIA. Tilastojen esittäminen a) vuotiaita tyttöjä Koko väestö Näiden tyttöjen osuus

Matematiikan tukikurssi

Tilastotieteen jatkokurssi 8. laskuharjoitusten ratkaisuehdotukset (viikot 13 ja 14)

Matematiikan tukikurssi. Kertausta 1. välikokeeseen. Tehtävät

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Tehtävä 1. Riku Eskelinen DEMOVASTAUKSET Demokerta 3/ vk 15 Tilastomenetelmien peruskurssi TILP150 Tulostuspv Sivu 1/6

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3

Matematiikan tukikurssi

3 Lukujonot matemaattisena mallina

Matin alkuvuoden budjetti

Tilastolliset menetelmät: Tilastolliset testit

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Luento 7 Luotettavuus Koherentit järjestelmät

Luento 6 Luotettavuus Koherentit järjestelmät

Kertaa tarvittaessa induktiota ja rekursiota koskevia tietoja.

Tilastollinen todennäköisyys

Epäyhtälöoppia matematiikkaolympialaisten tehtäviin

Osa 2: Otokset, otosjakaumat ja estimointi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

BM20A Integraalimuunnokset Harjoitus 8

Til.yks. x y z

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

Analyysi A. Harjoitustehtäviä lukuun 1 / kevät 2018

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen.

Harjoitustehtävien ratkaisuja

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä:

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 2

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

2. Mittaus ja data 2.1. Johdanto Mittaustyypit

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Stokastiikan perusteet Harjoitukset 1 (Todennäköisyysavaruus, -mitta ja -funktio)

2.5. Eksponenttifunktio ja eksponenttiyhtälöt

Ryhmän osajoukon generoima aliryhmä ja vapaat ryhmät

tilavuudessa dr dk hetkellä t olevien elektronien

3.9. Mallintaminen lukujonojen avulla harjoituksia

1 PROSENTTILASKENTAA 7

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

1. osa, ks. Solmu 2/ Kahden positiivisen luvun harmoninen, geometrinen, aritmeettinen ja + 1 u v 2 1

Tehtävä 1. Voidaanko seuraavat luvut esittää kahden neliön summina? Jos voidaan, niin kuinka monella eri tavalla? (i) n = 145 (ii) n = 770.

Transkriptio:

Tuuslukuja 27 III TUNNUSLUKUJA

Tuuslukuja 28 Tuuslukuja käytetää, ku tilastoaieistoa havaiollistetaa tiivistetysti yksittäisillä luvuilla. Tuusluvut lasketaa muuttujie arvoje perusteella ja e kuvaavat muuttuja jakaumaa. Tuuslukuje pääryhmät ovat sijaitiluvut ja hajotaluvut. Sijaitiluvut kuvaavat jakauma sijaitia ja hajotaluvut jakauma vaihtelua eli havaitoje poikkeavuutta toisistaa. 5. SIJAINTILUKUJA Tärkeimmät sijaitiluvut ovat keskiarvo, mediaai, moodi ja fraktiilit. Keskiarvo, mediaai ja moodi kuvaavat kuki tavallaa jakauma keskusta ja iitä kutsutaa keskiluvuiksi. 5.1. KESKIARVO Keskiarvo o tuetui tuusluvuista. Keskiarvo voidaa laskea välimatka- tai suhdeasteiko muuttujille. Keskiarvo lasketaa jakamalla havaitoje summa havaitoje lukumäärällä: x1 + x x= 2 +... + x = x i x x 1, x 2,,x = keskiarvo = muuttujie arvot, havaitoarvot = havaitoje lukumäärä = summa : Seuraavassa o lueteltu 7 eri ihmise kuukausipalkat ( /kk): 1 210, 1 429, 1 648, 1 765, 2 320, 4 271, 1 984 Palkkoje summa: = 14 267 Havaitoje lukumäärä, : 7 14 627 Keskiarvo = 7 2 090 Ryhmitellyssä aieistossa havaitoje summa saadaa

Tuuslukuja 29 kertomalla muuttuja arvot iide lukumäärillä ja laskemalla äi saadut tulot yhtee. Havaitoje lukumäärä o frekvessie summa. Lasketaa seuraavasta aieistosta keskimääräie poissaolopäivie lukumäärä. Poissaolopäiviä, x i Frekvessi, f i x i f i 0 5 0 1 7 7 2 8 16 3 2 6 4 3 12 5 4 20 29 61 Keskiarvo: X = 61 2,1 29 Keskiarvo samoi kui muutki tuusluvut pitää laskea aia alkuperäisestä aieistosta, ei luokitellusta aieistosta. Keskiarvo o eite käytetty keskiluku, vaikka se oki herkkä poikkeaville havaioille. Muuta aieistoa selvästi suuremmat tai pieemmät arvot paiavat keskiarvoa omaa suutaasa. Joissaki tilateissa tällaiset äärimmäise poikkeavat havaiot voidaa jättää pois keskiarvoa laskettaessa. Excelissä keskiarvo löytyy Kaavat-valitaauhasta kohdasta Lisää fuktio ja sieltä edellee imellä keskiarvo.

Tuuslukuja 30 5.1.1. Paiotettu keskiarvo Joskus havaioiti tehdää osajoukoittai, esim. kuittai ja äide osajoukoista saatuje tietoje perusteella tehdää sitte johtopäätöksiä koko perusjoukosta. Tällöi eri osajoukoilla o erilaie paioarvo, esim. juuri erikokoisilla kuilla o erilaie paioarvo. Isoilla kuilla o suurempi paioarvo kui pieillä. Lasketaa kokoaisarvosaa tietystä opitomoduulista, joka koostuu kolmesta opitojaksosta: OPINTOJAKSO OPINTOPISTEET ARVOSANA A 6 1 B 4 5 C 5 3 6*1+ 4*5 + 5*3 Arvosaa moduulista = = 2,7 6 + 4 + 5 Yleisesti: w1 * x1 + w2 * x2 +... + w x = w + w +... + w 1 2 * x = w x i w i i missä w i = paiot 5.2. MEDIAANI (Md) Mediaai o suuruusjärjestyksee järjestety aieisto keskimmäie arvo, jos havaitoja o parito määrä. Jos havaitoja o parillie määrä, mediaai o joko kahde keskimmäise arvo keskiarvo tai jompikumpi kahdesta keskimmäisestä arvosta. Mediaaia pieempiä ja suurempia arvoja o 50% havaioista. Koska muuttuja arvot täytyy saada suuruusjärjestyksee, pitää muuttuja olla vähitää välimatka-asteiko muuttuja. Edellisestä aieistosta (palkat) mediaai: 1 210, 1 429, 1 648, 1 765, 1 984, 2 320, 4 271 7 havaitoa, keskimmäie 1 765 eli mediaai o 1 765.

Tuuslukuja 31 Mediaai ei ole samaa tapaa herkkä poikkeaville havaioille kui keskiarvo. Se ei huomioi sitä, mite suuria tai mite pieiä se ympärillä olevat arvot ovat. Tämä äkyy myös edellisessä palkkaesimerkissä. Keskiarvo o 2 090 ja mediaai 1 765. Tämä ero johtuu siitä, että keskiarvoa paiaa ylöspäi yksi muita huomattavasti suurempi palkka, 4 271. Mediaaii se ei vaikuta, ei ole väliä kuika paljo suurempi tuo palkka o muita, joka tapauksessa keskimmäie palkka o 1 765. Excelissä mediaai lasketaa fuktiolla mediaai. 5.3. MOODI ELI TYYPPIARVO (Mo) Tyyppiarvo o arvo, joka esiityy useimmi. Se voidaa määrittää myös laatueroasteiko muuttujille. Tällaisille muuttujilleha ei voi määrittää tai laskea muita tuuslukuja. Moodi äkee myös frekvessijakaumasta, se o se muuttuja arvo, joka frekvessi o suuri. Näi koska moodi o se muuttuja arvo, joka esiityy useimmi. Jos muuttuja arvoja o paljo tai muuttuja o jatkuva, pitää se luokitella esi. Luokitellusta aieistosta moodi o se luokka tai se luoka keskikohta, joka frekvessi o suuri. Moodi o helppo määrittää, mutta se ei välttämättä kuvaa kovi hyvi jakauma keskimääräistä sijaitia. Excelissä moodi lasketaa fuktiolla moodi. 5.4. FRAKTIILIT Samaa tapaa kui mediaai yhteydessä sitä pieempiä arvoja o 50% havaioista, voidaa vastaavasti valita mikä tahasa prosettiluku ja määrittää se arvo, jota pieempiä o juuri tämä prosettiluvu verra kaikista havaioista. Tällaisia prosettiosuuksia imitetää fraktiileiksi. P%: fraktiili rajaa suuruusjärjestyksessä olevasta aieistosta pois p% havaioista vasemmalta (eli siis rajaa pieemmät arvot pois). Seuraavia fraktiileja käytetää paljo: o Q 1 = alakvartiili, rajaa 25 % havaioista o Q 2 = mediaai, rajaa 50 % havaioista

Tuuslukuja 32 o Q 3 = yläkvartiili, rajaa 75 % havaioista o D 9 = yhdeksäs desiili, rajaa 90% havaioista Jotta fraktiilit voidaa laskea, pitää muuttuja olla vähitää järjestysasteiko muuttuja. Excelillä fraktiilit lasketaa fuktiolla prosettipiste. Lasketaa kuta-aieistosta asukasluvu alakvartiili Q 1. Vastaukseksi tulee 2 330,5 eli 25%:ssa Suome kuista o asukkaista korkeitaa 2 330,5. Fraktiileja käytetää ilmoittamaa jakauma sijaiti. Käyttämällä ylä- ja alakvartiilia rajataa pieimmät ja suurimmat 25 % aieistosta pois eli jäljelle jää keskimmäie 50 %:a. Kaikkei suurimmat ja pieimmät arvot o äi rajattu pois. 6. HAJONTALUKUJA Havaitoje keskiäise sijaii ja iide jakautumise kuvaamisee käytetää hajotalukuja. Hajoalla kuvataa sitä, mite laajalle ja millä tavalla havaiot ovat jakaatueet. 6.1. VAIHTELUVÄLI Vaihteluväli ulottuu havaitoaieisto pieimmästä arvosta suurimpaa arvoo. Jos aieisto o luokiteltu, se ulottuu esimmäise luoka alarajasta viimeise luoka ylärajaa. Jotta

Tuuslukuja 33 vaihteluväli voidaa ilmoittaa, muuttuja täytyy olla vähitää järjestysasteiko muuttuja. Vaihteluväli pituus o suurimma ja pieimmä arvo erotus. Kegäumerot vaihtelevat 35 ja 46 välillä. Vaihteluväli: (35,46) Vaihteluväli pituus 46 35 = 11 Vaihteluväli pituus o helppo laskea, mutta ei yksiää aa kovi hyvää kuvaa aieistosta, koska se ottaa huomioo vai aieisto äärimmäiset arvot. Excelissä vaihteluväli voidaa määrittää fuktioide mi ja maks avulla. 6.2. KVARTIILIVÄLI Kvartiiliväli ulottuu alakvartiilista yläkavartiilii. Tämäki vaatii järjestysasteiko muuttuja. Kvartiiliväli ei ole aiva yhtä herkkä muista havaioista poikkeaville havaioille, koska äärimmäiset arvot o rajattu pois. Kvartiilivälii kuuluu puolet havaioista ja se ala- ja yläpuolelle jää 25% havaioista. Samalla tavalla voidaa valita joki muuki prosettiosuus, joka mukaa muodostetaa vastaavasti joki muu väli (esim. 5%). 6.3. KESKIHAJONTA JA VARIANSSI Keskihajota o eite käytetty hajotaa kuvaava tuusluku. Se ottaa huomioo kaikki havaiot, toisi kui esimerkiksi vaihteluväli, joka ottaa huomioo vai äärimmäiset arvot. Keskihajota voidaa laskea välimatka- ja suhdeasteiko muuttujille. Sitä merkitää tuuksella s. Keskihajoassa otetaa huomioo jokaie havaito ja se poikkeama keskiarvosta. Se mittaa havaitoje ryhmittymistä keskiarvosa ympärille. Seuraavaa kaavaa käytetää yleisesti keskihajoa laskemisee: ( xi x) s = 1 2 Tästä kaavasta ilmeee, että mitä vähemmä havaiot poikkeavat keskiarvosta, sitä pieempi o keskihajota. Jos aieisto o heterogeeista, keskihajota o suurempi kui jos

Tuuslukuja 34 aieisto olisi homogeeista. Keskihajota o luotettava hajoa mitta ja se o helppo laskea Excelillä. Excelissä keskihajota lasketaa fuktiolla keskihajota. Kyselyy osallistueide iät olivat: 20 25 22 21 23 28 19 18 22 24 25 22 23 24 23 23 22 27 20 21 Näide ikie keskiarvo o 22,6 ja keskihajota, 2.5. Keskihajota o suhteellise piei, eli kyselyy vastaeet olivat melko sama ikäisiä. Keskihajoa arvo ei muutu, jos kaikkii lukuihi lisätää tai iistä väheetää sama luku. Jos luvut kerrotaa tai jaetaa samalla luvulla, keskihajoa arvo tulee myös kerrotuksi tai jaetuksi samalla luvulla. Variassi o keskihajoa eliö. 7. KESKIARVON LUOTTAMUSVÄLI Jos tutkimus o tehty otoksesta, oleellista o kertoa, mite luotettavia otoksesta saadut tuusluvut ovat, ku iitä sovelletaa perusjoukkoo. Siksi eustettaessa otoksesta lasketulla keskiarvolla perusjouko keskiarvoa, ilmoitetaa usei myös keskiarvo luottamusväli. Yleisimmi käytetää 95% luottamusväliä. Se tarkoittaa, että perusjouko keskiarvo x ± 2* s sijaitsee 95%: varmuudella tietyllä ilmoitetulla välillä. Keskiarvo 95%: luottamusväli o: Tietystä aieistosta (otoksesta) o laskettu keskiarvoksi 23 ja keskihajoaksi 7. Aieisto koko o 50. Lasketaa luottamusväli: Alaraja: 7 23 2* 21,02 50

Tuuslukuja 35 Yläraja: 7 23 + 2 * 24,98 50 Koko perusjouko keskiarvo o 95 %: varmuudella välillä (21,02, 24,98) 8. TUNNUSLUKUJEN VERTAILU Havaitoaieisto voidaa jakaa ryhmii ja laskea äistä eri ryhmistä erilaisia tuuslukuja, esim. sukupuole, pohjakoulutukse yms. perusteella. Excelissä voidaa käyttää suodatusta tai Pivot-taulukoita muuttujie tarkasteluu ryhmittäi. Suodatus tehdää Excelissä Tiedot-valitaauha Suodata-paiikkee kautta.