Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Samankaltaiset tiedostot
Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kuvaaminen

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Tunnuslukuja 27 III TUNNUSLUKUJA

Osa 2: Otokset, otosjakaumat ja estimointi

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

TILASTOT: johdantoa ja käsitteitä

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset menetelmät: Tilastolliset testit

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

8. laskuharjoituskierros, vko 11, ratkaisut

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Otantajakauman käyttö päättelyssä

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

tilastotieteen kertaus

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Tilastolliset menetelmät: Tilastolliset testit

Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Testit laatueroasteikollisille muuttujille

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

3.2 Sijaintiluvut. MAB5: Tunnusluvut

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johda jakauman momenttiemäfunktio ja sen avulla jakauman odotusarvo ja varianssi.

χ 2 -yhteensopivuustesti

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

2-suuntainen vaihtoehtoinen hypoteesi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Yhden selittäjän lineaarinen regressiomalli

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Testejä suhdeasteikollisille muuttujille

Tilastotieteen johdantokurssi

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

6. Kombinaatio-oppi, todennäköisyys ja tilastot

7. laskuharjoituskierros, vko 10, ratkaisut

Tilastolliset menetelmät: Johdanto

Tilastotieteen perusteet

χ 2 -yhteensopivuustesti

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Tilastolliset menetelmät: Johdanto

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Til.yks. x y z

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot

Mat Sovellettu todennäköisyyslaskenta B 5. harjoitukset / Ratkaisut Aiheet: Jatkuvia jakaumia Avainsanat: Jatkuvia jakaumia

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Tilastollinen todennäköisyys

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

2-suuntainen vaihtoehtoinen hypoteesi

n = 100 x = %:n luottamusväli µ:lle Vastaus:

Tilastotieteen perusteet

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

((12345A, 5, 1, 5), (98759K, 1, 5, 2), (33312K, 4, 4, 3), (23453B, 4, 4, 3), (21453U, 3, 3, 3)),

Satunnaismuuttujien muunnokset ja niiden jakaumat. Satunnaismuuttujien muunnokset ja niiden jakaumat

Mat Tilastollisen analyysin perusteet, kevät 2007

pisteet Frekvenssi frekvenssi Yhteensä

Väliestimointi (jatkoa) Heliövaara 1

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 2

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Testit järjestysasteikollisille muuttujille

Tilastollinen riippuvuus ja korrelaatio

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

1. Valitaan tilanteeseen sopiva stokastinen malli. 2. Sovitetaan malli havaittuun dataan (estimoidaan mallin parametrit).

1 Eksponenttifunktion määritelmä

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

Tilastollinen päättely II, kevät 2017 Harjoitus 3B

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

3 Lukujonot matemaattisena mallina

Transkriptio:

TKK (c) Ilkka Melli (004) Tilastolliste aieistoje kuvaamie Tuusluvut Laatueroasteikolliste muuttujie tuusluvut Johdatus tilastotieteesee Tilastolliste aieistoje kuvaamie TKK (c) Ilkka Melli (004) Tilastolliste aieistoje kuvaamie: Mitä opimme? / Parhaa kuva joki tilastollise muuttuja havaittuje arvoje vaihtelusta ataa havaitoarvoje jakauma. Jos tarkasteltava tilastollie muuttuja o diskreetti, se havaitoarvoje jakaumaa voidaa kuvata frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä, pylväsdiagrammilla. Jos tarkasteltava tilastollie muuttuja o jatkuva, se havaitoarvoje jakaumaa voidaa kuvata luokitellulla frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä, histogrammilla. Tilastolliste aieistoje kuvaamie: Mitä opimme? / Kuvaus havaitoarvoje jakaumasta halutaa tavallisesti tiivistää muutamaksi jakauma karakteristisia omiaisuuksia kuvaavaksi tuusluvuksi. Keskimääräiste, tyypilliste tai yleiste havaitoarvoje sijaitia kuvataa keskiluvuilla. Havaitoarvoje keskittymistä tai hajaatumista joki keskiluvu ympärillä kuvataa hajotaluvuilla. Myös havaitoarvoje jakauma vioutta ja huipukkuutta voidaa kuvata sopivasti valituilla tuusluvuilla. Tarkasteltava tilastollise muuttuja mitta-asteikolliset omiaisuudet määräävät, mitä tuuslukuja muuttujaa koskevista havaitoarvoista saa ja kaattaa laskea. TKK (c) Ilkka Melli (004) 3 TKK (c) Ilkka Melli (004) 4 Tilastolliste aieistoje kuvaamie: Esitiedot Esitiedot: ks. seuraavaa lukua: Tilastolliste aieistoje keräämie ja mittaamie Tilastolliste aieistoje kuvaamie: Lisätiedot Tilastollisia aieistoja kuvaavie tuuslukuje otosjakaumia käsitellää luvussa Otos ja otosjakaumat TKK (c) Ilkka Melli (004) 5 TKK (c) Ilkka Melli (004) 6

TKK (c) Ilkka Melli (004) 7 Tilastolliste aieistoje kuvaamie >> Tuusluvut Laatueroasteikolliste muuttujie tuusluvut Avaisaat Frekvessijakauma Frekvessit Havaitoarvot Histogrammi Luokiteltu frekvessijakauma Luokkafrekvessit Mitta-asteikot ja havaitoarvoje jakauma kuvaamie Pylväsdiagrammi Tilastolliset aieistot TKK (c) Ilkka Melli (004) 8 Tilastollie aieisto Havaitoarvot Tilastollise tutkimukse kaikki mahdolliset kohteet muodostavat tutkimukse (kohde-) perusjouko. Tutkimukse kohteiksi valittuja perusjouko alkioita kutsutaa havaitoyksiköiksi. Tilastollie aieisto koostuu havaitoyksiköitä kuvaavie muuttujie havaituista arvoista. Huomautuksia: Tilastollie aieisto voi sytyä tilastollise kokee tuloksea tai tekemällä suoria havaitoja. Jos tutkimukse kohteea o koko perusjoukko, tutkimusta kutsutaa kokoaistutkimukseksi, muute kyseessä o otatatutkimus. Olkoo tutkimukse kohteiksi valittuje havaitoyksiköide lukumäärä. Olkoo x i, i =,,, kohdeperusjouko alkioide omiaisuutta kuvaava muuttuja x havaittu arvo havaitoyksikössä i. Kutsumme muuttuja x havaittuja arvoja x, x,, x tavallisesti havaitoarvoiksi tai havaioiksi. Havaitoarvo x i saadaa mittaamalla muuttuja x arvo havaitoyksikölle i. TKK (c) Ilkka Melli (004) 9 TKK (c) Ilkka Melli (004) 0 ja se kuvaamie /4 ja se kuvaamie /4 Perusjouko alkioide omiaisuutta kuvaava muuttuja x havaittuje arvoje x, x,, x vaihtelua havaitoyksiköide joukossa kuvaa parhaite havaitoarvoje jakauma. Perusjouko alkioide omiaisuutta kuvaava muuttuja x havaittuje arvoje x, x,, x jakaumaa voidaa kuvailla ja esitellä tiivistämällä havaitoarvoihi sisältyvä iformaatio sopivaa muotoo: a kokoaisuutea voidaa kuvata sopivasti valitulla graafisella esityksellä. Jakauma karakteristisia omiaisuuksia voidaa kuvata sopivasti valituilla tuusluvuilla. TKK (c) Ilkka Melli (004) TKK (c) Ilkka Melli (004)

TKK (c) Ilkka Melli (004) 3 ja se kuvaamie 3/4 ja se kuvaamie 4/4 Perusjouko alkioide omiaisuutta kuvaava muuttuja x (mitta-asteikolliset) omiaisuudet (ks. lukua Tilastolliste aieistoje keräämie ja mittaamie) määräävät muuttuja x havaittuje arvoje x, x,, x jakaumalle parhaite sopiva kuvaustava; ks. seuraavaa kalvoa. Jos muuttuja x o diskreetti, se havaittuje arvoje jakaumaa voidaa kuvata frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä pylväsdiagrammilla. Jos muuttuja x o jatkuva, se havaittuje arvoje jakaumaa voidaa kuvata luokitellulla frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä histogrammilla. TKK (c) Ilkka Melli (004) 4 Frekvessit Frekvessijakauma Olkoo muuttuja x diskreetti ja olkoot y, y,, y m muuttuja x mahdolliset arvot. x, x,, x muuttuja x havaitut arvot. Muuttuja x mahdollise arvo y k, k =,,, m frekvessi f k kertoo kuika mota kertaa y k esiityy havaitoarvoje x, x,, x joukossa. Muuttuja x mahdolliset arvot y, y,, y m yhdessä iide frekvessie f, f,, f m kassa muodostavat muuttuja x havaittuje arvoje x, x,, x frekvessijakauma. Huomaa, että f + f + + f m = jossa o havaitoje kokoaislukumäärä. TKK (c) Ilkka Melli (004) 5 TKK (c) Ilkka Melli (004) 6 Pylväsdiagrammi Pylväsdiagrammi piirtämie: Havaiollistus / Frekvessijakaumaa (y k, f k ), k =,,, m voidaa kuvata graafisesti pylväsdiagrammilla, jossa muuttuja x mahdollise arvo y k frekvessiä f k havaitoarvoje x, x,, x joukossa esittää pisteesee y k piirretty pylväs, joka korkeus vastaa frekvessiä f k. Huomautus: Pylväsdiagrammi tulkita o aalogie diskreeti todeäköisyysjakauma pistetodeäköisyysfuktio tulkia kassa; ks. lukua Satuaismuuttujat ja todeäköisyysjakaumat. y, y,, y m muuttuja x mahdolliset arvot ja olkoo (y k, f k ) k =,,, m muuttuja x havaittuje arvoje x, x,, x frekvessijakauma. Frekvessi f k kertoo kuika mota kertaa muuttuja x arvo y k esiityy havaitoarvoje joukossa. f f k f k f k+ y k y k y k+ x TKK (c) Ilkka Melli (004) 7 TKK (c) Ilkka Melli (004) 8

TKK (c) Ilkka Melli (004) 9 Pylväsdiagrammi piirtämie: Havaiollistus / Pylväsdiagrammi: Esimerkki / Tarkastellaa muuttuja x mahdollista arvoa y k vastaava pylvää piirtämistä pylväsdiagrammii. Muuttuja x mahdolliset arvot y k määräävät pylväide paikat. Pylvää korkeudeksi valitaa arvo y k frekvessi f k. f f k f k f k+ y k y k y k+ x Matemaattise tilastotietee kurssille osallistui 0 opiskelijaa. Kurssi loppukokee tehtävä 4 arvosteluasteikkoa oli 0-6 pistettä ii, että 0 = huooi pistemäärä 6 = paras pistemäärä Opiskelijoide saamat pisteet o aettu oikealla olevista taulukoista ylemmässä. Alemmassa taulukossa o aettu pisteide frekvessijakauma. Pisteet; = 0 0 0 0 0 0 0 5 5 5 5 5 6 6 6 6 6 Pisteet Frekvessi 0 6 3 3 0 4 0 5 5 6 5 TKK (c) Ilkka Melli (004) 0 Pylväsdiagrammi: Esimerkki / Luokkafrekvessit / Kuva oikealla esittää pisteide frekvessijakaumaa vastaavaa pylväsdiagrammia. Muuttuja x = pistemäärä mahdolliset arvot määräävät pylväide paika. Pylväät o piirretty ii, että iide korkeudet vastaavat muuttuja x mahdolliste arvoje frekvessejä. Frekvessi 7 6 5 4 3 0 Pisteide jakauma 0 3 4 5 6 Pistemäärä Olkoo muuttuja x jatkuva ja oletetaa, että se mahdolliset arvot ovat välillä (a, b) jossa voi olla a =, b = +. Jaetaa väli (a, b) pisteillä a= a0 < a < a < < am < am = b pistevieraisii osaväleihi (a k, a k ], k =,,, m TKK (c) Ilkka Melli (004) TKK (c) Ilkka Melli (004) Luokkafrekvessit / Luokiteltu frekvessijakauma x, x,, x muuttuja x havaitut arvot. Muuttuja x havaittuje arvoje frekvessi f k luokassa k kertoo iide havaitoarvoje x, x,, x lukumäärä, jotka kuuluvat välii (a k, a k ], k =,,, m Luokkavälit (a k, a k ], k =,,, m yhdessä vastaavie luokkafrekvessie f, f,, f m kassa muodostavat muuttuja x havaittuje arvoje x, x,, x luokitellu frekvessijakauma. Huomaa, että f + f + + f m = jossa o havaitoje kokoaislukumäärä. TKK (c) Ilkka Melli (004) 3 TKK (c) Ilkka Melli (004) 4

TKK (c) Ilkka Melli (004) 5 Histogrammi Histogrammi piirtämie: Havaiollistus / Luokiteltua frekvessijakaumaa ((a k, a k ], f k ), k =,,, m voidaa kuvata graafisesti histogrammilla, jossa muuttuja x havaittuje arvoje x, x,, x frekvessiä f k luokassa (a k, a k ] esittää suorakaide, joka kataa o väli (a k, a k ] ja joka pita-ala vastaa luokkafrekvessiä f k. Huomautus: Histogrammi tulkita o aalogie jatkuva todeäköisyysjakauma tiheysfuktio tulkia kassa; ks. lukua Satuaismuuttujat ja todeäköisyysjakaumat. Olkoo ((a k, a k ], f k ) k =,,, m muuttuja x havaittuje arvoje x, x,, x luokiteltu frekvessijakauma. Luokkafrekvessi f k kertoo iide havaitoarvoje lukumäärä, jotka kuuluvat luokkavälii (a k, a k ]. A k h k a k a k a k a k+ a k a k x TKK (c) Ilkka Melli (004) 6 Histogrammi piirtämie: Havaiollistus / Histogrammi: Esimerkki /3 Tarkastellaa k. luokkaa vastaava suorakaitee piirtämistä histogrammii. Luokkaväli (a k, a k ] muodostaa suorakaitee kaa. Suorakaitee korkeus h k saadaa ehdosta A k = k. luokkaa vastaava suorakaitee pita-ala =(a k a k ) h k = f k A k h k a k a k a k a k+ a k a k x Koe tekee ruuveja, joide pituudet vaihtelevat satuaisesti. Poimitaa ruuvie joukosta yksikertaie satuaisotos, joka koko = 30 ja mitataa otoksee poimittuje ruuvie pituudet. Otoksee poimittuje 30: ruuvi pituudet (yksikkö = cm) o aettu oikealla olevassa taulukossa. Ruuvie pituudet; = 30 0.05 0.3 0.0 0.4 0.4 0.06 0.07 0.09 0.00 0.09 0.30 0.7 0.8 0.00 0.0 0.00 9.93 0.6 0. 0.0 9.99 0.3 9.88 9.99 0. 0.0 9.93 0.00 0.07 0.3 TKK (c) Ilkka Melli (004) 7 TKK (c) Ilkka Melli (004) 8 Histogrammi: Esimerkki /3 Histogrammi: Esimerkki 3/3 Muodostetaa otoksee poimittuje ruuvie pituuksie luokiteltu frekvessijakauma. Järjestetää sitä varte havaitoarvot suuruusjärjestyksee; ks. ylempää taulukkoa oikealla. Pituuksie luokiteltu frekvessijakauma o aettu alemmassa taulukossa. Esimerkiksi luokkaa, joka määrää puoliavoi väli (0.0, 0.5] kuuluu 4 ruuvia. Ruuvie pituudet; = 30 9.88 9.93 9.93 9.99 9.99 0.00 0.00 0.00 0.00 0.0 0.0 0.05 0.06 0.07 0.07 0.09 0.09 0. 0.3 0.3 0.4 0.6 0.7 0.8 0.0 0.0 0. 0.3 0.4 0.30 Luokkavälit Luokkafrekvessit (9.85,9.90] (9.90,9.95] (9.95,0.00] 6 (0.00,0.05] 3 (0.05,0.0] 5 (0.0,0.5] 4 (0.5,0.0] 5 (0.0,0.5] 3 (0.5,0.30] Kuva oikealla esittää otoksee poimittuje ruuvie pituuksie luokiteltua frekvessijakaumaa vastaavaa histogrammia. Luokkavälit määräävät histogrammi suorakaiteide kaat. Suorakaiteet o piirretty ii, että iide pita-alat vastaavat luokkafrekvessejä. Frekvessi 7 6 5 4 3 0 Ruuvie pituuksie luokiteltu frekvessijakauma 9.8 9.9 0.0 0. 0. 0.3 0.4 Pituus (cm) TKK (c) Ilkka Melli (004) 9 TKK (c) Ilkka Melli (004) 30

TKK (c) Ilkka Melli (004) 3 Mitta-asteikot ja havaitoarvoje jakauma kuvaamie Laatuero- tai järjestysasteikolliste muuttujie havaittuje arvoje kuvaamisee käytettävät välieet: Frekvessijakauma Pylväsdiagrammi Välimatka- tai suhdeasteikolliste muuttujie havaittuje arvoje kuvaamisee käytettävät välieet: Luokiteltu frekvessijakauma Histogrammi Mitta-asteikot: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Tilastolliste aieistoje kuvaamie >> Tuusluvut Laatueroasteikolliste muuttujie tuusluvut TKK (c) Ilkka Melli (004) 3 Tuusluvut Tuusluvut Tuusluvut havaitoaieisto kuvaajia /4 Avaisaat Mitta-asteikot ja iille sallitut tuusluvut Tuusluvut havaitoaieisto kuvaajia Tuusluvut ja mitta-asteikot x, x,, x muuttuja x havaittuja arvoja. Muuttuja x havaittuje arvoje jakaumaa voidaa kuvailla ja esitellä tiivistämällä havaitoarvoihi sisältyvä iformaatio sopivaa muotoo: Jakaumaa kokoaisuutea voidaa kuvata sopivasti valitulla graafisella esityksellä. Jakauma karakteristisia omiaisuuksia voidaa kuvata sopivasti valituilla tuusluvuilla. TKK (c) Ilkka Melli (004) 33 TKK (c) Ilkka Melli (004) 34 Tuusluvut Tuusluvut havaitoaieisto kuvaajia /4 Tuusluvut Tuusluvut havaitoaieisto kuvaajia 3/4 Tuuslukuje tehtävää o kuvata havaitoarvoje jakauma keskeisiä karakteristisia omiaisuuksia: Keskimääräiste, tyypilliste tai yleiste havaitoarvoje sijaitia kuvataa keskiluvuilla. Havaitoarvoje hajaatueisuutta tai keskittyeisyyttä kuvataa hajotaluvuilla. Myös havaitoarvoje jakauma vioutta ja huipukkuutta voidaa kuvata sopivasti valituilla tuusluvuilla. karakteristisia omiaisuuksia o syytä tavallisesti kuvata usealla erilaisella tuusluvulla. Havaitoaieisto jakauma ja kuvaukse tavoitteet määräävät mitä tuuslukuja havaitoaieistosta kaattaa laskea. Tutkittava muuttuja mitta-asteikolliset omiaisuudet määräävät mitä tuuslukuja havaitoaieistosta saa laskea. TKK (c) Ilkka Melli (004) 35 TKK (c) Ilkka Melli (004) 36

TKK (c) Ilkka Melli (004) 37 Tuusluvut Tuusluvut havaitoaieisto kuvaajia 4/4 Tuusluvut Tuusluvut ja mitta-asteikot Huomautuksia: Tuuslukuje atama kuvaus havaitoarvoje jakaumasta jää puutteelliseksi ja saattaa olla jopa harhaajohtava, ellei sitä täydeetä sopivilla jakaumaa kuvaavilla graafisilla esityksillä kute pylväsdiagrammilla tai histogrammilla. a o tavallisesti syytä kuvata usealla eri tavalla. Tarkasteltava muuttuja mitta-asteikolliset omiaisuudet ohjaavat havaitoaieisto kuvaamisessa käytettävie tuuslukuje valitaa. Mitta-asteikot: ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. Tuusluvut voidaa ryhmitellä tarkastelu kohteea olevie muuttujie mitta-asteikolliste omiaisuuksie perusteella seuraavalla tavalla: Tuusluvut välimatka- ja suhdeasteikollisille muuttujille Tuusluvut järjestysasteikollisille muuttujille Tuusluvut laatueroasteikollisille muuttujille TKK (c) Ilkka Melli (004) 38 Tuusluvut Välimatka- ja suhdeasteikolliste muuttujie tuuslukuja Tuuslukuja välimatka- ja suhdeasteikolliste muuttujie havaituille arvoille: Aritmeettie keskiarvo keskilukua Variassija keskihajota hajotalukuia Origomometit Keskusmometit Vious Huipukkuus Harmoie keskiarvo Geometrie keskiarvo Tuusluvut Järjestysasteikolliste muuttujie tuuslukuja Tuuslukuja järjestysasteikolliste muuttujie havaituille arvoille: Järjestystuusluvut Mimimija maksimi Vaihteluväli ja vaihteluväli pituus Prosettipisteet Mediaai keskilukua Kvartiilit Kvartiiliväli ja kvartiiliväli pituus Kvartiilipoikkeama hajotalukua TKK (c) Ilkka Melli (004) 39 TKK (c) Ilkka Melli (004) 40 Tuusluvut Laatueroasteikolliste muuttujie tuuslukuja Tuuslukuja laatueroasteikolliste muuttujie havaituille arvoille: Suhteellie frekvessi Moodi keskilukua Tuusluvut Mitta-asteikot ja iille sallitut tuusluvut /3 Välimatka- ja suhdeasteikollisille muuttujille sallitut tuusluvut: Origo- ja keskusmometit ja iistä johdetut tuusluvut Kaikki laatuero- ja järjestysasteikolliste muuttujie tuusluvut Keskilukua käytetää tavallisesti aritmeettista keskiarvoa, mutta moissa tilateissa keskilukua o syytä käyttää mediaaia tai moodia Hajotalukua käytetää tavallisesti keskihajotaa tai variassia TKK (c) Ilkka Melli (004) 4 TKK (c) Ilkka Melli (004) 4

TKK (c) Ilkka Melli (004) 43 Tuusluvut Mitta-asteikot ja iille sallitut tuusluvut /3 Tuusluvut Mitta-asteikot ja iille sallitut tuusluvut 3/3 Järjestysasteikollisille muuttujille sallitut tuusluvut: Järjestystuusluvut ja iistä johdetut tuusluvut Kaikki laatueroasteikolliste muuttujie tuusluvut Keskilukua käytetää tavallisesti mediaaia, mutta moissa tilateissa keskilukua o syytä käyttää moodia Hajotalukua käytetää usei kvartiilipoikkeamaa Huomautus: Välimatka- tai suhdeasteikolliste muuttujie tuuslukuja ei ole mielekästä laskea järjestysasteikolliste muuttujie havaituille arvoille. Laatueroasteikollisille muuttujille sallitut tuusluvut: Suhteelliset frekvessit Keskilukua käytetää moodia Huomautus: Järjestys-, välimatka- tai suhdeasteikolliste muuttujie tuuslukuja ei ole mielekästä laskea laatueroasteikolliste muuttujie havaituille arvoille. TKK (c) Ilkka Melli (004) 44 Tilastolliste aieistoje kuvaamie Tuusluvut >> Laatueroasteikolliste muuttujie tuusluvut Avaisaat Aritmeettie keskiarvo Geometrie keskiarvo Harmoie keskiarvo Huipukkuus Keskihajota Keskusmometit Luokitellu aieisto aritmeettie keskiarvo Origomometit Stadardoiti Tilastollie etäisyys Variassi Vious TKK (c) Ilkka Melli (004) 45 TKK (c) Ilkka Melli (004) 46 Tuusluvut suhdeasteikollisille muuttujille Aritmeettie keskiarvo Tavallisimmat tuusluvut suhdeasteikolliste muuttujie havaituille arvoille: Aritmeettie keskiarvo keskilukua Variassija keskihajota hajotalukuia Origomometit Keskusmometit Vious Huipukkuus Harmoie keskiarvo Geometrie keskiarvo x, x,, x välimatka- tai suhdeasteikollise muuttuja x havaittuja arvoja. Aritmeettie keskiarvo x+ x + + x x = xi = i= kuvaa havaitoarvoje x, x,, x keskimääräistä arvoa. Aritmeettisesta keskiarvosta (egl. mea) käytetää usei myös symbolia M. TKK (c) Ilkka Melli (004) 47 TKK (c) Ilkka Melli (004) 48

TKK (c) Ilkka Melli (004) 49 Luokitellu aieisto aritmeettie keskiarvo Aritmeettie keskiarvo jakauma kuvaajaa Oletetaa, että jatkuva muuttuja x havaituista arvoista o muodostettu luokiteltu frekvessijakauma ja olkoo käytetty luokkie lukumäärä k. Oletetaa, että luokkakeskuksia ovat luvut z, z,, z k ja että vastaavat luokkafrekvessit ovat f, f,, f k Tällöi luokitellu aieisto aritmeettie keskiarvo o k fz i i i = x = jossa = f i. Aritmeettie keskiarvo kuvaa havaitoarvoje keskimääräistä arvoa. Havaitoarvoje aritmeettie keskiarvo sijoittuu havaitoarvoje jakauma paiopisteesee. Jos havaitoarvoje jakauma o vio tai moihuippuie, aritmeettie keskiarvo ei välttämättä ole tyypillie tai yleie havaitoarvo. Aritmeettie keskiarvo ei ole robusti eli se o herkkä poikkeaville havaitoarvoille, koska jokaie havaitoarvo vetää aritmeettista keskiarvoa puoleesa; ks. havaiollistusta seuraavalla kalvolla. TKK (c) Ilkka Melli (004) 50 Aritmeettise keskiarvo herkkyys poikkeaville havaioille Aritmeettie keskiarvo o herkkä poikkeaville havaioille. Havaitoarvoje,, 3 aritmeettie keskiarvo o + + 3 M = = 3 Muutetaa havaitoarvo 3 havaitoarvoksi 9 ja pidetää muut havaitoarvot samoia. Tällöi uudeksi aritmeettiseksi keskiarvoksi tulee + + 9 M = = 4 3 Ks. kuvaa oikealla. 0 3 4 5 6 7 8 9 0 M 0 3 4 5 6 7 8 9 0 M Variassi / x, x,, x välimatka- tai suhdeasteikollise muuttuja x havaittuja arvoja ja olkoo x havaitoarvoje aritmeettie keskiarvo. (Otos-) variassi s = ( x ) i x i= kuvaa havaitoarvoje x, x,, x hajaatueisuutta tai keskittyeisyyttä iide paiopistee x ympärillä. TKK (c) Ilkka Melli (004) 5 TKK (c) Ilkka Melli (004) 5 Variassi / Havaitoarvoje x, x,, x otosvariassi lasketaa usei myös kaavalla ˆ σ = ( x ) i x i= jossa summalausekkee jakajaa o. Huomautus: Otosvariassi kaksi erilaista kaavaa liittyvät erilaisii tapoihi estimoida ormaalijakauma N(µ, σ ) variassiparametri σ : (i) s o harhato estimaattori parametrille σ. (ii) σˆ o parametri σ suurimma uskottavuude estimaattori. Variassi: Toiset kaavat Jos otosvariassi joudutaa laskemaa käsi tai laskimella havaitoarvoje x, x,, x variassi kaattaa laskea kaavoilla s = xi xi i = i= ˆ σ = xi xi i= i= TKK (c) Ilkka Melli (004) 53 TKK (c) Ilkka Melli (004) 54

TKK (c) Ilkka Melli (004) 55 Keskihajota / Keskihajota / x, x,, x välimatka- tai suhdeasteikollise muuttuja x havaittuja arvoja ja olkoo x havaitoarvoje aritmeettie keskiarvo. (Otos-) keskihajota s = ( x ) i x i= o otosvariassi s eliöjuuri ja kuvaa havaitoarvoje x, x,, x hajaatueisuutta tai keskittyeisyyttä iide paiopistee x ympärillä. Havaitoarvoje x, x,, x (otos-) keskihajota lasketaa usei myös kaavalla ˆ σ = ( x ) i x i= jossa summalausekkee jakajaa o. Huomautus: Keskihajoa kaksi erilaista kaavaa liittyvät erilaisii tapoihi estimoida ormaalijakauma N(µ, σ ) variassiparametri σ : (i) s o harhato estimaattori parametrille σ. (ii) σˆ o parametri σ suurimma uskottavuude estimaattori. TKK (c) Ilkka Melli (004) 56 Keskihajota ja variassi jakauma kuvaajaa / Keskihajota ja variassi jakauma kuvaajaa / Keskihajota ja variassi ovat havaitoarvoje vaihtelu mittoja. Variassi o havaitoarvoje keskimääräie eliöllie poikkeama iide aritmeettisesta keskiarvosta. Havaitoarvoje keskihajota o variassi eliöjuuri. Jos havaitoarvoje jakaumaa kuvaavaa keskilukua o käytetty aritmeettista keskiarvoa, hajotalukua o luotevaa käyttää keskihajotaa: (i) Keskihajoalla ja aritmeettisella keskiarvolla o sama dimesio (laatu). (ii) Variassi ja aritmeettise keskiarvo dimesio (laatu) ei ole sama. TKK (c) Ilkka Melli (004) 57 Piei keskihajota (variassi) merkitsee sitä, että havaitoarvot keskittyvät iide paiopistee (aritmeettise keskiarvo) ympärille. Suuri keskihajota (variassi) merkitsee sitä, että havaitoarvot ovat hajaatueet iide paiopistee (aritmeettise keskiarvo) ympärille. Variassi ja keskihajota eivät ole robusteja eli e ovat herkkiä poikkeaville havaitoarvoille. TKK (c) Ilkka Melli (004) 58 Aritmeettie keskiarvo ja variassi: Laskemie / Oletetaa, että haluamme laskea havaitoarvoje x, x,, x aritmeettise keskiarvo x ja otosvariassi s käsi tai käyttämällä laskita Tällöi tarvittavat laskutoimitukset o mukavita järjestää seuraavalla kalvolla esitettävä kaavio muotoo. TKK (c) Ilkka Melli (004) 59 Aritmeettie keskiarvo ja variassi: Laskemie / Havaitoarvoje aritmeettie keskiarvo ja variassi voidaa laskea määräämällä esi havaitoarvoje summa ja eliösumma sekä käyttämällä se jälkee alla esitettyjä kaavoja. i xi xi x = xi i= x x x x s = xi xi i= i= x x Summa xi xi i= i= TKK (c) Ilkka Melli (004) 60

TKK (c) Ilkka Melli (004) 6 Stadardoiti Tilastollie etäisyys x välimatka- tai suhdeasteikollise muuttuja x havaittuje arvoje x, x,, x aritmeettie keskiarvo ja s x iide variassi. Tällöi stadardoituje havaitoarvoje xi x zi =, i =,,, sx aritmeettie keskiarvo ja variassi ovat z = zi = 0 i= s = ( z z) = z i i= x välimatka- tai suhdeasteikollise muuttuja x havaittuje arvoje x, x,, x aritmeettie keskiarvo ja s x iide variassi. Havaitoarvoje x k ja x l tilastollie etäisyys d kl o xk xl dkl = sx Havaitoarvoje x k ja x l tilastollie etäisyys ottaa etäisyyttä määrättäessä huomioo kaikkie havaitoarvoje x, x,, x vaihtelu. Huomautus: Tilastollisessa testauksessa käytettävät testisuureet voidaa usei tulkita tilastollise etäisyyde mittareiksi; ks. lukuja Testit. TKK (c) Ilkka Melli (004) 6 Origomometit Keskusmometit x, x,, x välimatka- tai suhdeasteikollise muuttuja x havaittuja arvoja. Havaitoarvoje x, x,, x k. origomometti o k a = x, k =,,3, k i i = Erityisesti. origomometti a o havaitoarvoje x, x,, x aritmeettie keskiarvo: a = x x, x,, x välimatka- tai suhdeasteikollise muuttuja x havaittuja arvoja ja olkoo x havaitoarvoje aritmeettie keskiarvo. Havaitoarvoje x, x,, x k. keskusmometti o k m = ( x x), k =,,3, k i = i Erityisesti m = 0 kaikille havaitoarvoille ja m = ˆ σ = a a o havaitoarvoje x, x,, x variassi. TKK (c) Ilkka Melli (004) 63 TKK (c) Ilkka Melli (004) 64 Vious Vious jakauma kuvaajaa /3 m = 3 ( i ) 3 ( i ) x x m = i x x = i= havaitoarvoje x, x,, x. ja vastaavasti 3. keskusmometti. Tuuslukua m3 c = 3 m käytetää kuvaamaa havaitoarvoje jakauma vioutta. Jos havaitoarvoje jakauma o symmetrie paiopisteesä suhtee, c 0 Esimerkki: Normaalijakautueilla havaitoaieistoilla c 0. TKK (c) Ilkka Melli (004) 65 TKK (c) Ilkka Melli (004) 66

TKK (c) Ilkka Melli (004) 67 Vious jakauma kuvaajaa /3 Vious jakauma kuvaajaa 3/3 Jos c > 0 saomme, että havaitoarvoje jakauma o positiivisesti vio. Oletetaa, että c > 0 ja havaitoarvoje jakaumaa kuvaava pylväsdiagrammi (diskreeti muuttuja tapauksessa) tai histogrammi (jatkuva muuttuja tapauksessa) o yksihuippuie. Tällöi jakaumaa kuvaava diagrammi o vio oikealle eli se oikeapuoleie hätä o pitempi kui se vasemmapuoleie hätä. Jos c < 0 saomme, että havaitoarvoje jakauma o egatiivisesti vio. Oletetaa, että c < 0 ja havaitoarvoje jakaumaa kuvaava pylväsdiagrammi (diskreeti muuttuja tapauksessa) tai histogrammi (jatkuva muuttuja tapauksessa) o yksihuippuie. Tällöi jakaumaa kuvaava diagrammi o vio vasemmalle eli se vasemmapuoleie hätä o pitempi kui se oikeapuoleie hätä. TKK (c) Ilkka Melli (004) 68 Huipukkuus Huipukkuus jakauma kuvaajaa m = ( i ) 4 ( i ) x x m = i x x = i= havaitoarvoje x, x,, x. ja vastaavasti 4. keskusmometti. Tuuslukua 4 m4 c = 3 m käytetää kuvaamaa havaitoarvoje jakauma huipukkuutta. TKK (c) Ilkka Melli (004) 69 Normaalijakautueilla havaitoaieistoilla c 0. Olkoo havaitoarvoje jakauma huipukkuus c > 0 Tällöi jakauma o huipukas (ormaalijakautueesee havaitoaieistoo verrattua). Olkoo havaitoarvoje jakauma huipukkuus c < 0 Tällöi jakauma o laakea (ormaalijakautueesee havaitoaieistoo verrattua). TKK (c) Ilkka Melli (004) 70 Harmoie keskiarvo x, x,, x positiivise välimatka- tai suhdeasteikollise muuttuja x havaittuja arvoja. Havaitoarvoje x, x,, x harmoie keskiarvo o H = x i= i Harmoie keskiarvo: Esimerkki / Esimerkki osoittaa, että aritmeettie keskiarvo ei ole kaikissa tilateissa sopiva keskiluku. Olkoo kahde kaupugi A ja B välimatka 0 km. Ajetaa matka A:sta B:he 60 km/h ja matka B:stä A:ha 0 km/h. Mikä o ollut keskiopeus edestakaisella matkalla? Matka A:sta B:he ja takaisi = 40 km Ajoaika A:sta B:he = h Ajoaika B:stä A:ha = h Ajoaika yhteesä = 3 h Keskiopeus edestakaisella matkalla = 40/3 = 80 km/h TKK (c) Ilkka Melli (004) 7 TKK (c) Ilkka Melli (004) 7

TKK (c) Ilkka Melli (004) 73 Harmoie keskiarvo: Esimerkki / Nopeuksie aritmeettie keskiarvo 60 + 0 M = = 90 km/h ataa väärä keskiopeude. Se sijaa opeuksie harmoie keskiarvo H = = 80 km/h + 60 0 ataa oikea keskiopeude. Geometrie keskiarvo x, x,, x positiivise välimatka- tai suhdeasteikollise muuttuja x havaittuja arvoja. Havaitoarvoje x, x,, x geometrie keskiarvo o G = xx x Huomautus: Geometrise keskiarvo logaritmi o havaitoarvoje logaritmie aritmeettie keskiarvo: log( x) + log( x) + + log( x ) log( G) = TKK (c) Ilkka Melli (004) 74 Geometrie keskiarvo: Esimerkki /4 Esimerkki osoittaa, että aritmeettie keskiarvo ei ole kaikissa tilateissa sopiva keskiluku. Olkoo laia suuruus 00. Olkoo korkoprosetti. vuotea 0 % ja. vuotea 0 %. Jos laiaa ei lyheetä, laiapääoma karttuu seuraavalla tavalla: Pääoma. vuode lopussa =. 00 = 0 Pääoma. vuode lopussa =. 0 = 3 Geometrie keskiarvo: Esimerkki /4 Korkoprosettie aritmeettie keskiarvo 0 + 0 M = = 5 % tuottaa väärä laiapääoma. vuode lopussa: Pääoma. vuode lopussa =.5 00 = 5 Pääoma. vuode lopussa =.5 5 = 3.5 Laiapääoma karttuu siis kahdessa vuodessa 3 %. Jos kumpaaki vuotea käytettäisii samaa korkoprosettia, mite se pitäisi valita, jotta laiapääoma olisi. vuode lopussa 3? TKK (c) Ilkka Melli (004) 75 TKK (c) Ilkka Melli (004) 76 Geometrie keskiarvo: Esimerkki 3/4 Korkoprosetti 3 6 % = tuottaa väärä laiapääoma. vuode lopussa: Pääoma. vuode lopussa =.6 00 = 6 Pääoma. vuode lopussa =.6 6 = 34.56 Geometrie keskiarvo: Esimerkki 4/4 Se sijaa geometrie keskiarvo G =.. =.4895 ataa korkoprosetiksi 4.895 % joka tuottaa oikea laiapääoma. vuode lopussa: Pääoma. vuode lopussa =.4895 00 = 4.895 Pääoma. vuode lopussa =.4895 4.895 = 3.00 TKK (c) Ilkka Melli (004) 77 TKK (c) Ilkka Melli (004) 78

TKK (c) Ilkka Melli (004) 79 Aritmeettie, harmoie ja geometrie keskiarvo Oletetaa, että aritmeettie keskiarvo M, harmoie keskiarvo H ja geometrie keskiarvo G määrätää samoista positiivisista luvuista x, x,, x. Tällöi H G M ja H = G = M jos ja vai jos x = x = = x Tilastolliste aieistoje kuvaamie Tuusluvut >> Laatueroasteikolliste muuttujie tuusluvut TKK (c) Ilkka Melli (004) 80 Tuusluvut järjestysasteikollisille muuttujille / Avaisaat Box ad Whisker -kuvio Järjestystuusluvut Kvartiilipoikkeama Kvartiilit Kvartiiliväli ja kvartiiliväli pituus Luokitellu aieisto mediaai Mediaai Mimimi ja maksimi Prosettipisteet Robustisuus Vaihteluväli ja vaihteluväli pituus Tavallisimmat tuusluvut järjestysasteikolliste muuttujie havaituille arvoille: Järjestystuusluvut Mimimija maksimi Vaihteluväli ja vaihteluväli pituus Prosettipisteet Mediaai keskilukua Kvartiilit Kvartiiliväli ja kvartiiliväli pituus Kvartiilipoikkeama hajotalukua TKK (c) Ilkka Melli (004) 8 TKK (c) Ilkka Melli (004) 8 Tuusluvut järjestysasteikollisille muuttujille / Järjestystuusluvut havaitoaieistoje jakaumia voidaa usei havaiollistaa kätevästi Box ad Whisker -kuviolla. Huomautus: Järjestysasteikolliste muuttujie tuuslukuja saa käyttää ja o usei myös järkevää käyttää kuvaamaa välimatka- ja suhdeasteikolliste muuttujie havaittuje arvoje jakaumaa. x, x,, x järjestys-, välimatka- tai suhdeasteikollise muuttuja x havaittuja arvoja. Järjestetää havaitoarvot x, x,, x suuruusjärjestyksee pieimmästä suurimpaa ja olkoot z, z,, z järjestyksee asetetut havaitoarvot. Suuruusjärjestyksessä k. havaitoarvoa z k kutsutaa k. järjestystuusluvuksi. TKK (c) Ilkka Melli (004) 83 TKK (c) Ilkka Melli (004) 84

TKK (c) Ilkka Melli (004) 85 Miimi, maksimi ja vaihteluväli Prosettipisteet z, z,, z järjestys-, välimatka- tai suhdeasteikollise muuttuja x havaitut arvot järjestettyiä suuruusjärjestyksee pieimmästä suurimpaa. Tällöi z = miimiarvo z = maksimiarvo (z, z )= vaihteluväli z z = vaihteluväli pituus z, z,, z järjestys-, välimatka- tai suhdeasteikollise muuttuja x havaitut arvot järjestettyiä suuruusjärjestyksee pieimmästä suurimpaa. Havaitoarvoje p. prosettipiste z (p), p =,,, 99 jakaa havaitoaieisto kahtee osaa: (i) p % havaitoarvoista o lukua z (p) pieempiä tai korkeitaa yhtä suuria kui z (p). (ii) (00 p) % havaitoarvoista o lukua z (p) suurempia. TKK (c) Ilkka Melli (004) 86 Mediaai Mediaai laskemie z, z,, z järjestys-, välimatka- tai suhdeasteikollise muuttuja x havaitut arvot järjestettyiä suuruusjärjestyksee pieimmästä suurimpaa. Mediaai Me o havaitoarvoje 50. prosettipiste: Me = z (50) Mediaai jakaa havaitoaieisto kahtee yhtä suuree osaa ii, että toisessa kaikki havaitoarvot ovat mediaaia pieempiä, toisessa kaikki havaitoarvot ovat mediaaia suurempia. Havaitoarvoje mediaai Me voidaa laskea seuraavalla tavalla: () Järjestetää havaitoarvot suuruusjärjestyksee pieimmästä suurimpaa. (a) Jos havaitoarvoje lukumäärä o parito, mediaai o järjestetyistä havaitoarvoista keskimmäie. (b) Jos havaitoarvoje lukumäärä o parillie, mediaai o järjestetyistä havaitoarvoista kahde keskimmäise aritmeettie keskiarvo. TKK (c) Ilkka Melli (004) 87 TKK (c) Ilkka Melli (004) 88 Luokitellu aieisto mediaai Mediaai jakauma kuvaajaa / Luokitellu aieisto mediaai voidaa laskea kaavalla Σf Me= L + j i ci fi jossa L i = mediaailuoka alaraja f j = kaikkie mediaailuoka alapuolella olevii luokkii kuuluvie havaitoarvoje frekvessi f i = mediaailuokkaa kuuluvie havaitoarvoje frekvessi c i = mediaailuoka pituus = havaitoarvoje lukumäärä Mediaai o suuruusjärjestyksee asetettuje havaitoarvoje keskimmäie havaitoarvo (tai kahde keskimmäise aritmeettie keskiarvo). Jos havaitoarvoje jakauma o symmetrie, havaitoarvoje mediaai ja aritmeettie keskiarvo yhtyvät. Jos havaitoarvoje jakauma o vio, mutta yksihuippuie, havaitoarvoje mediaai kuvaa tyypillisiä havaitoarvoja usei paremmi kui iide aritmeettie keskiarvo. Jos havaitoarvoje jakauma o moihuippuie, mediaai ei välttämättä ole yleie havaitoarvo. TKK (c) Ilkka Melli (004) 89 TKK (c) Ilkka Melli (004) 90

TKK (c) Ilkka Melli (004) 9 Mediaai jakauma kuvaajaa / Mediaai robustisuus: Havaiollistus Mediaai o robusti eli se ei ole toisi kui aritmeettie keskiarvo herkkä poikkeaville havaitoarvoille. Havaitoarvoje,, 3 aritmeettie keskiarvo o + + 3 M = = 3 Muutetaa havaitoarvo 3 havaitoarvoksi 9 ja pidetää muut havaitoarvot samoia. Tällöi uudeksi aritmeettiseksi keskiarvoksi tulee + + 9 M = = 4 3 Se sijaa havaitoarvoje mediaai Me ei muutu. Ks. kuvaa oikealla. 0 3 4 5 6 7 8 9 0 M = Me 0 3 4 5 6 7 8 9 0 Me M TKK (c) Ilkka Melli (004) 9 Mediaai, aritmeettie keskiarvo ja jakauma vious Oletetaa, että aritmeettie keskiarvo M ja mediaai Me määrätää samasta jatkuva muuttuja havaittuje arvoje luokitellusta frekvessijakaumasta. Jos havaitoarvoje jakauma o yksihuippuie, pätee seuraava (ks. havaiollistusta seuraavalla kalvolla): (i) Vasemmalle vioilla jakaumilla M < Me (ii) Symmetrisillä jakaumilla M Me (iii) Oikealle vioilla jakaumilla Me < M Mediaai, aritmeettie keskiarvo ja jakauma vious: Havaiollistus / Frekvessi 35 30 5 0 5 0 5 0 X 0 4 6 8 0 4 6 8 0 Luoka yläraja Yllä olevat histogrammit perustuvat sataa satuaislukuje avulla geeroituu havaitoarvoo: X ~ χ (5) Y = 0 X Frekvessi 35 30 5 0 5 0 5 0 Y 0 4 6 8 0 4 6 8 0 Luoka alaraja TKK (c) Ilkka Melli (004) 93 TKK (c) Ilkka Melli (004) 94 Mediaai, aritmeettie keskiarvo ja jakauma vious: Havaiollistus / Kvartiilit / Frekvessi 35 30 5 0 5 0 5 0 X 0 4 6 8 0 4 6 8 0 Luoka yläraja Jakauma o vio oikealle: Vious =.5 Aritmeettie keskiarvo = 5.9 Mediaai = 4.4 Frekvessi 35 30 5 0 5 0 5 0 Y 0 4 6 8 0 4 6 8 0 Luoka alaraja Jakauma o vio vasemmalle: Vious =.5 Aritmeettie keskiarvo = 4.8 Mediaai = 5.59 z, z,, z järjestys-, välimatka- tai suhdeasteikollise muuttuja x havaitut arvot järjestettyiä suuruusjärjestyksee pieimmästä suurimpaa. Tällöi Q = Alakvartiili = 5. prosettipiste = z (5) Q = Keskikvartiili = 50. prosettipiste = z (50) Q 3 = Yläkvartiili = 75. prosettipiste = z (75) TKK (c) Ilkka Melli (004) 95 TKK (c) Ilkka Melli (004) 96

TKK (c) Ilkka Melli (004) 97 Kvartiilit / Kvartiilit, kvartiiliväli ja kvartiilipoikkeama Kvartiilit Q, Q, Q 3 jakavat suuruusjärjestyksee asetetu havaitoaieisto eljää yhtä suuree osaa. Erityisesti: Keskikvartiili Q = Havaitoarvoje mediaai Me Alakvartiili Q = Havaitoarvoje mediaaia Me pieempie havaitoarvoje mediaai Yläkvartiili Q 3 = Havaitoarvoje mediaaia Me suurempie havaitoarvoje mediaai havaitoarvoje kvartiilit Q, Q, Q 3. Tällöi (Q, Q 3 ) = kvartiiliväli Q 3 Q = IQR = kvartiiliväli pituus (Q 3 Q )/ = IQR/ = kvartiilipoikkeama Kvartiiliväliä, kvartiiliväli pituutta (IQR = iterquartile rage) ja kvartiilipoikkeamaa voidaa käyttää kuvaamaa havaitoarvoje hajaatueisuutta (keskittyeisyyttä). Jos havaitoarvoje jakaumaa kuvaavaa keskilukua o käytetty mediaaia, hajotalukua käytetää usei kvartiilipoikkeamaa. TKK (c) Ilkka Melli (004) 98 Box ad Whisker -kuvio /6 Box ad Whisker -kuvio /6 a voidaa usei kätevästi havaiollistaa s. Box ad Whisker -kuviolla. Olkoo (Q, Q 3 ) havaitoarvoje kvartiiliväli ja Me = Q havaitoarvoje mediaai. Olkoo IQR = Q 3 Q havaitoarvoje kvartiiliväli (Q, Q 3 ) pituus. Määritellää kuvio sisäaidat f ja f 3 kaavoilla f = Q.5 IQR f 3 = Q 3 +.5 IQR Olkoo a piei havaitoarvo, joka toteuttaa ehdo a f Olkoo a 3 suuri havaitoarvo, joka toteuttaa ehdo a 3 f 3 Määritellää kuvio ulkoaidat F ja F 3 kaavoilla F = Q 3 IQR F 3 = Q 3 + 3 IQR TKK (c) Ilkka Melli (004) 99 TKK (c) Ilkka Melli (004) 00 Box ad Whisker -kuvio 3/6 Box ad Whisker -kuvio 4/6 Box ad Whisker -kuvio koostuu laatikosta, viiksistä ja kuvioo merkityistä poikkeuksellisista havaioista. Box ad Whisker -kuvio piirtämie: (i) Piirretää suorakaitee muotoie laatikko kuvaamaa havaitoarvoje kvartiiliväliä (Q, Q 3 ) Merkitää havaitoarvoje mediaai Me = Q laatikkoo poikkiviivalla. Box ad Whisker -kuvio piirtämie (jatkuu): (ii) Piirretää jaamuotoiset viikset laatiko molemmille puolille kuvaamaa välejä (a, Q ) ja (Q 3, a 3 ) (iii) Merkitää väleihi (F, a ) ja (a 3, F 3 ) kuuluvat havaitoarvot kuvioo tähdillä. Merkitää väleihi (, F ) ja (F 3, + ) kuuluvat havaitoarvot kuvioo ympyröillä. TKK (c) Ilkka Melli (004) 0 TKK (c) Ilkka Melli (004) 0

TKK (c) Ilkka Melli (004) 03 Box ad Whisker -kuvio 5/6 Box ad Whisker -kuvio 6/6 Laatiko ja viiksie määrittelemää välii (a, a 3 ) kuuluvat havaitoarvoja voidaa pitää tavallisia. Erityisesti kvartiiliväli (Q, Q 3 ) määrittelemä laatikko sulkee sisääsä keskimmäiset 50 % havaitoarvoista. Tähdillä ja ympyröillä merkityt, väli (a, a 3 ) ulkopuolelle jäävät havaitoarvot ovat poikkeuksellisia: (i) Tähdillä merkityt, väleihi (F, a ) ja (a 3, F 3 ) kuuluvat havaitoarvot ovat vai lievästi poikkeuksellisia. (ii) Ympyröillä merkityt, väleihi (, F ) ja (F 3, + ) kuuluvia havaitoarvoja voidaa pitää voimakkaasti poikkeuksellisia. TKK (c) Ilkka Melli (004) 04 Box ad Whisker -kuvio: Havaiollistus Box ad Whisker -kuvio: Tilastolliste aieistoje kuvaamie Tuusluvut >> Laatueroasteikolliste muuttujie tuusluvut F f a Q Me Q 3 a 3 f 3 F 3 IQR TKK (c) Ilkka Melli (004) 05 TKK (c) Ilkka Melli (004) 06 Laatueroasteikolliste muuttujie tuusluvut Laatueroasteikolliste muuttujie tuusluvut Tuusluvut laatueroasteikollisille muuttujille Avaisaat Luokitellu aieisto moodi Moodi Suhteellie frekvessi Tavallisimmat tuusluvut laatueroasteikolliste muuttujie havaituille arvoille: Suhteellie frekvessi Moodi keskilukua Huomautus: Laatueroasteikolliste muuttujie tuuslukuja saa käyttää ja o usei myös järkevää käyttää kuvaamaa järjestys-, välimatka- ja suhdeasteikolliste muuttujie havaittuje arvoje jakaumaa. TKK (c) Ilkka Melli (004) 07 TKK (c) Ilkka Melli (004) 08

TKK (c) Ilkka Melli (004) 09 Laatueroasteikolliste muuttujie tuusluvut Suhteellie frekvessi Laatueroasteikolliste muuttujie tuusluvut Moodi Olkoo otoskoko eli kerättyje havaitoarvoje lukumäärä. Olkoo A perusjouko osajoukko ja otoksee kuuluvie A-tyyppiste havaitoarvoje frekvessi eli lukumäärä f. Tällöi A-tyyppiste havaitoarvoje suhteellie frekvessi eli osuus otoksessa o f Frekvessijakauma moodi eli tyyppiarvo Mo o yleisi havaitoarvo. Luokitellu frekvessijakauma moodi eli tyyppiarvo Mo o siiä luokassa, jossa luokiteltua frekvessijakaumaa vastaava histogrammi saavuttaa maksimisa. Huomautuksia: Jos käytetty luokitus o tasavälie, luokitellu frekvessijakauma moodi o siiä luokassa, jota vastaava frekvessi o suuri. Jos käytetty luokitus ei ole tasavälie, luokitellu frekvessijakauma moodi ei välttämättä ole siiä luokassa, jota vastaava frekvessi o suuri. TKK (c) Ilkka Melli (004) 0 Laatueroasteikolliste muuttujie tuusluvut Luokitellu aieisto moodi Laatueroasteikolliste muuttujie tuusluvut Moodi jakauma kuvaajaa Luokitellu aieisto moodi voidaa laskea kaavalla di Mo= Li + ci di + di+ jossa L i = moodiluoka alaraja d i = moodiluoka ja sitä alemma luoka suorakaiteide korkeuksie erotus d i+ = moodiluoka ja sitä ylemmä luoka suorakaiteide korkeuksie erotus c i = moodiluoka pituus Moodi kuvaa yleisimpie havaitoarvoje sijoittumista havaitoarvoje jakaumassa. Jos havaitoarvoje jakauma o yksihuippuie ja symmetrie, havaitoarvoje moodi, mediaai ja aritmeettie keskiarvo yhtyvät. Jos havaitoarvoje jakauma o moihuippuie, jakaumalla o useita lokaaleja moodeja. Jos havaitoarvoje jakauma o moihuippuie, jakauma lokaalit moodit atavat usei paremma kuva jakaumasta kui mediaai tai aritmeettie keskiarvo. TKK (c) Ilkka Melli (004) TKK (c) Ilkka Melli (004) Laatueroasteikolliste muuttujie tuusluvut Moodi, mediaai, aritmeettie keskiarvo ja jakauma vious Oletetaa, että aritmeettie keskiarvo M, mediaai Me ja moodi Mo määrätää samasta jatkuva muuttuja havaittuje arvoje luokitellusta frekvessijakaumasta. Jos havaitoarvoje jakauma o yksihuippuie, pätee seuraava (ks. havaiollistusta seuraavalla kalvolla): (i) Vasemmalle vioilla jakaumilla M < Me < Mo (ii) Symmetrisillä jakaumilla M Me Mo (iii) Oikealle vioilla jakaumilla Mo < Me < M Laatueroasteikolliste muuttujie tuusluvut Moodi, mediaai, aritmeettie keskiarvo ja jakauma vious: Havaiollistus / Frekvessi 35 30 5 0 5 0 5 0 X 0 4 6 8 0 4 6 8 0 Luoka yläraja Yllä olevat histogrammit perustuvat sataa satuaislukuje avulla geeroituu havaitoarvoo: X ~ χ (5) Y = 0 X Frekvessi 35 30 5 0 5 0 5 0 Y 0 4 6 8 0 4 6 8 0 Luoka alaraja TKK (c) Ilkka Melli (004) 3 TKK (c) Ilkka Melli (004) 4

TKK (c) Ilkka Melli (004) 5 Laatueroasteikolliste muuttujie tuusluvut Moodi, mediaai, aritmeettie keskiarvo ja jakauma vious: Havaiollistus / X Y 35 35 30 30 5 5 Frekvessi 0 5 Frekvessi 0 5 0 0 5 5 0 0 4 6 8 0 4 6 8 0 Luoka yläraja Jakauma o vio oikealle: Vious =.5 Aritmeettie keskiarvo = 5.9 Mediaai = 4.4 Moodi (, 4] 0 0 4 6 8 0 4 6 8 0 Luoka alaraja Jakauma o vio vasemmalle: Vious =.5 Aritmeettie keskiarvo = 4.8 Mediaai = 5.59 Moodi (6, 8]