Tilastotieteen perusteet



Samankaltaiset tiedostot
TILASTOT: johdantoa ja käsitteitä

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Tunnuslukuja 27 III TUNNUSLUKUJA

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Tilastotieteen perusteet

Otantajakauman käyttö päättelyssä

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Tilastollinen todennäköisyys

****************************************************************** ****************************************************************** 7 Esim.

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Til.yks. x y z

Tilastotieteen johdantokurssi

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

3.2 Sijaintiluvut. MAB5: Tunnusluvut

Mat Tilastollisen analyysin perusteet, kevät 2007

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen.

Mat Sovellettu todennäköisyyslasku A

4.3 Signaalin autokorrelaatio

8. laskuharjoituskierros, vko 11, ratkaisut

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Tilastolliset menetelmät: Tilastolliset testit

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3

Matematiikan tukikurssi

S Laskennallinen systeemibiologia

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Aritmeettinen jono

MATP153 Approbatur 1B Harjoitus 1, ratkaisut Maanantai

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

Yhden selittäjän lineaarinen regressiomalli

RATKAISUT x 2 3 = x 2 + 2x + 1, eli 2x 2 2x 4 = 0, joka on yhtäpitävä yhtälön x 2 x 2 = 0. Toisen asteen yhtälön ratkaisukaavalla saadaan

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Matematiikan tukikurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Äärettämän sarjan (tai vain sarjan) sanotaan suppenevan eli konvergoivan, jos raja-arvo lims

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Kertaa tarvittaessa induktiota ja rekursiota koskevia tietoja.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tehtäviä neliöiden ei-negatiivisuudesta

3 Lukujonot matemaattisena mallina

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Epäyhtälöoppia matematiikkaolympialaisten tehtäviin

Insinöörimatematiikka IA

n = 100 x = %:n luottamusväli µ:lle Vastaus:

Tehtävä 1. Riku Eskelinen DEMOVASTAUKSET Demokerta 3/ vk 15 Tilastomenetelmien peruskurssi TILP150 Tulostuspv Sivu 1/6

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Sormenjälkimenetelmät

1 Eksponenttifunktion määritelmä

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

Ryhmän osajoukon generoima aliryhmä ja vapaat ryhmät

Kandidaatintutkielman aineistonhankinta ja analyysi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

EX1 EX 2 EX =

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin yliopisto Harjoitus 3, ratkaisuehdotuksia

Markov-ketjun hetkittäinen käyttäytyminen

MONISTE 2 Kirjoittanut Elina Katainen

2. Mittaus ja data 2.1. Johdanto Mittaustyypit

Kvantitatiiviset menetelmät

2.5. Eksponenttifunktio ja eksponenttiyhtälöt

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 5 (6 sivua)

811312A Tietorakenteet ja algoritmit , Harjoitus 1 ratkaisu

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

KERTAUSHARJOITUKSIA. Tilastojen esittäminen a) vuotiaita tyttöjä Koko väestö Näiden tyttöjen osuus

7. laskuharjoituskierros, vko 10, ratkaisut

Til.yks. x y z

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Luento 7 Luotettavuus Koherentit järjestelmät

Luento 6 Luotettavuus Koherentit järjestelmät

SMG-4200 Sähkömagneettisten järjestelmien lämmönsiirto Ehdotukset harjoituksen 6 ratkaisuiksi

Stokastiikan perusteet Harjoitukset 1 (Todennäköisyysavaruus, -mitta ja -funktio)

Vastaus: Kertymäfunktio on F( x) = x, kun 0 x 20. Todennäköisyydet ovat molemmat 1. Frekvenssi f

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Esimerkki 2 (Kaupparatsuongelma eli TSP)

Diskreetin Matematiikan Paja Ratkaisuja viikolle 4. ( ) Jeremias Berg. n(n + 1) 2. k =

2 avulla. Derivaatta on nolla, kun. g( 3) = ( 3) 2 ( 3) 5 ( 3) + 6 ( 3) = 72 > 0. x =

811312A Tietorakenteet ja algoritmit, , Harjoitus 4, Ratkaisu

Matematiikan tukikurssi. Kertausta 1. välikokeeseen. Tehtävät

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

xe y = ye x e y + xe y y = y e x + e x y xe y y y e x = ye x e y y (xe y e x ) = ye x e y y = yex e y xe y e x = x 3 + x 2 16x + 64 = D(x)

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Markov-ketjun hetkittäinen käyttäytyminen

LIITE 1 VIRHEEN ARVIOINNISTA

Kvantitatiiviset menetelmät

Transkriptio:

VAASAN YLIOPISTO Tilastotieteeperusteet Luetoruko Christia Gustafsso

SISÄLLYSLUETTELO 1. JOHDANTO... 3 1.1. Mitä tilastotiede o?... 3 1.. Tilastotietee historiaa... 4. HAVAINTOAINEISTO JA MITTAAMINEN... 6.1. Peruskäsitteitä... 6.. Mittaamisesta... 7 3. YKSIULOTTEINEN EMPIIRINEN JAKAUMA... 11 3.1. Frekvessijakauma peruskäsitteitä ja luokitus... 11 3.. Graafie esitys... 15 3.3. Yksiulotteise jakauma tuusluvut... 0 3.3.1. Keskiluvut... 0 3.3.. Hajotaluvut... 5 3.3.3. Yksiulotteise jakauma muita tuuslukuja... 30 4. KAKSIULOTTEINEN EMPIIRINEN JAKAUMA... 31 4.1. Ristiitaulukko... 31 4.. Korrelaatiodiagrammi ja korrelaatio... 36 4.3. Järjestyskorrelaatio... 40 4.4. Regressio... 41 5. TODENNÄKÖISYYSLASKENTAA... 46 5.1. Kombiatoriikkaa... 46 5.. Todeäköisyyde määrittely... 49 5.3. Ehdollie todeäköisyys ja riippumattomuus... 5 5.4. Kokoaistodeäköisyys ja Bayesi kaava... 54 6. TEOREETTISISTA JAKAUMISTA... 56 6.1. Satuaismuuttujista... 56 6.. Keskeisiä diskreettejä jakaumia... 6 6.3. Keskeisiä jatkuvia jakaumia... 66 7. HAVAINTOAINEISTON HANKINNASTA... 74 7.1. Johdato... 74 7.. Otatatutkimuksesta yleesä... 74 7.3. Otatameetelmistä... 75 7.4. Otatajakaumista... 77 8. TILASTOLLISESTA PÄÄTTELYSTÄ... 80 8.1. Estimoiti... 80 8.1.1. Piste-estimoiti... 80 8.1.. Väliestimoiti (luottamusvälit)... 81 8.. Hypoteesie testaus... 84 8..1. Testaukse pääpiirteet... 84 8... Keskiarvotestejä... 88 8..3. Prosettilukutestejä... 9 8..4. Riippuvuustutkimuksee liittyviä testejä... 94 8..5. -yhteesopivuustesti... 97

3 1. JOHDANTO 1.1. Mitä tilastotiede o? Tilasto o empiiristä ilmiötä kuvaava usei taulukkoa esitetty umeerie aieisto. Tilastoiti tuottaa tällaisia eri ilmiöitä kuvaavia aieistoja. Erilaisia empiirisiä ilmiöitä kuvaavissa aieistoissa esiityy samatyyppisiä ogelmia, joide tutkimisessa tilastotieteestä o apua ja muodostetut tilastot ovat tilastollise tutkimukse materiaalia. Professori Leo Törqvisti määritelmä mukaa: "Tilastotiede o tietotuotao tekologiaa, joka avulla voidaa suorittaa kvatitatiiviste tietoje joukkotuotatoa ja havaitoihi perustuvia tieteellisiä ja käytäöllisiä päätöksiä." Tilastotiede o siis empiirisluotoiste tietoje hakia suuittelua keräämistä deskriptiivie eli järjestämistä kuvaileva tilastotiede esittämistä sekä aalysoitia tilastollie päättely eli tulkitaa iferessi *) koskeva tiede. *) Tilastollie päättely o luoteeltaa iduktiivista, jolloi osajoukkoa koskevat tulokset yleistetää koskemaa koko perusjoukkoa. Tilastotiede o s. meetelmätiede, joka tehtävää o kehittää meetelmiä muide tieteide (esim. talous-, luoo- ja yhteiskutatieteide) empiirisiä ilmiöitä kuvaavie tietoje aalysoitia varte. Empiirie ilmiö voi olla sellaie, joho vaikuttavat vai systemaattiset tekijät (determiistie ilmiö) tai sellaie, joho systemaattiste tekijöide lisäksi vaikuttaa myös sattuma (satuaisilmiö). Sattuma käsitteellä tarkoitetaa satuaisilmiö sitä käyttäytymise osuutta, jota ei voida etukätee tarkkaa eakoida. Usei kuiteki sattuma käyttäytymie oudattaa omia lakejaa. Tilastotiedettä käytetää erityisesti satuaisilmiöide tutkimisee. Tilastotietee lisäksi meetelmätieteitä ovat myös matematiikka ja tietotekiikka. Tilastotiede soveltaa meetelmiä kehittäessää matematiika teoriaa, erityisesti todeäköisyyslaskea teoriaa, siksi tilastotiedettä usei pidetääki sovelletu matematiika eräää osa-alueea (matemaattie eli teoreettie tilastotiede). Tilastotietee ja tietotekiika yhteistä aluetta saotaa tilastolliseksi tietojekäsittelyksi.

4 Usei tilastolliste meetelmie kehittämisvaiheessa iihi liittyy vaatimus sovellettavuudesta ja käsitys sovellustilateesta. Oki käyyt usei ii, että raja tilastotietee ja soveltavie tieteide välillä o hämärtyyt, jolloi soveltavie tieteide piirissä o raja-aluetta alettu imittää omalla imellä (esim. epidemiologia, biometria, psykometriikka ja ekoometria). Tilastotiedettä voidaa kuiteki soveltaa lähes mihi tahasa tieteesee, koska tilastotietee teoria o yleistä. Esim. Deskriptiivisee eli kuvailevaa tilastotieteesee törmätää päivittäi - osakkeide hiamuutoksissa - työttömyysluvuissa - puolueide kaatusluvuissa - lämpötiloissa yms. Esim. Tilastollista päättelyä käytetää mm. - tulevaisuude eustamisessa - vakuutusyhtiö arvioidessa vakuutukse hitaa - laadutarkkailussa Tilastollisessa aalyysissä tutkittavat ogelmat pelkistyvät usei seuraavalaisiksi kysymyksiksi: - Millaie tilae o keskimääri? - Kuika suuri o prosetuaalie osuus? - Kuika suurta o omiaisuude vaihtelu? - Oko eroa? - Oko samalaisuutta? - Oko muutosta? - Oko riippuvuutta? - Millaista riippuvuus o? - Mite tulevaisuudessa? 1.. Tilastotietee historiaa Laajassa mielessä tilastotiedettä harrastettii systemaattiste tietoje keräykse muodossa jo muiaisessa Kiiassa ja Egyptissä (väestökirjapito). Moderi tilastotietee juuret voidaa ajoittaa 1600-luvulle, jolloi eurooppalaiste yhteiskutie kehittyessä tarvittii luotettavaa tietoa taloude ilmiöistä (= poliittie taloustiede, joka erästä osa-aluetta

5 saottii yliopistostatistiikaksi) sekä valtio ja väestö tilasta (= poliittie aritmetiikka). Saa tilasto saksa- ja eglaikieliset vastieet Statistik ja statistics viittaavatki saa alkuperäisee merkityksee: valtio kuvaus. Vuoa 166 julkaistii Eglaissa tilastollise tutkimukse urauurtaja Joh Grauti teos Natural ad Political Observatios o the Bills of Mortality. Merkittävästi tilastotietee sytyy ja kehityksee ovat vaikuttaeet myös uhkapeliogelmat. Uhkapeliharrastuste lisäätymise myötä alettii 1600-luvulla tutkia todeäköisyyslasketaa erityisesti Raskassa. Vielä 1700-luvulla ja se jälkeeki havaitoaieistoja käsiteltii varsi alkeellisi meetelmi (yksikertaisia meetelmiä, lähiä kuvailevaa tilastotiedettä). Aalysoiva tilastotietee rialla kulki siitä erilliseä halliollie tilastoiti. Nämä yhdistyivät jossai määri 1800-luvulla, ku matematiika voimakas kehittymie loi tilastotieteelle selkeä teoreettise pohja. 1800-luvulla alettii luoo-, yhteiskuta- ja käyttäytymistieteissä kiiostua tilastotietee meetelmistä. Tältä ajalta ovat peräisi esim. Gregor Medeli periöllisyyskokeet. Myös matemaattie tilastotiede alkoi kehittyä voimakkaasti 1800- luvu loppupuolella, esimerkiksi korrelaatioteoria ja regressiolai perusteet esitettii v. 1888. 1900-luvu alkupuolella sytyivät moet tilastotietee perusmeetelmistä. Viime vuosikymmeiä tilastotietee teoria ja sovellusalueet ovat laajetueet valtavasti. Tähä o erityisesti vaikuttaut tietojekäsittelymahdollisuuksie kehittymie. Suomekielie saa tilasto otettii käyttöö 1840-luvulla. Ruotsi-Suomi oli esimmäie valtio, jossa alettii sääöllisesti laatia väestötilastoja, esimmäiset tiedot koskivat vuotta 1749. Tuolloi Ruotsi-Suome väkiluku oli 13 619 hekeä. Esimmäie suomekielie tilastokirja Suome Suuriruhtiaa Nykyie Tilasto julkaistii vuoa 1848. Vuoa 1865 perustettii Tilastollie toimisto (yk. Tilastokeskus). Vuoa 1905 Karl Willgre julkaisi esimmäise suomalaise tilastotietee oppikirja. Esimmäie tilastotietee professuuri saatii Helsigi yliopistoo vuoa 1945.

6. HAVAINTOAINEISTO JA MITTAAMINEN Havaitoaieisto o tilastollise aalyysi perusta, jote o tärkeää, että se o huolella koottu ja esikäsitelty..1. Peruskäsitteitä Tilastollie tutkimus kohdistuu aia joideki tutkimusobjektie muodostamaa joukkoo, joka o tutkimukse perusjoukko eli populaatio. Populaatio rajaamie o tutkimukse esimmäisiä vaiheita. Populaatio alkioita eli tutkimusobjekteja kutsutaa tilastoyksiköiksi, joista käytetää yleesä merkitää a 1, a, a 3, Jos tutkittavaa o kokreettie aieisto, tilastoyksiköt imetää "omalla imellää". Esim. Tutkittavaa o 0 kpl Suome kutia, joista tiedetää veroäyri hita. Tilastoyksikköä o kuta, mutta mikä o populaatio? - em. kutie joukko, jos tutkitaa vai äitä kutia (kokoaistutkimus) - kaikki Suome kuat (otatatutkimus) - tiety lääi kuat (otatatutkimus) - Huom. Tutkittavista tilastoyksiköistä tehtävät johtopäätökset ulottuvat vai määrättyy populaatioo (vrt. superpopulaatio). Tilastoyksikköö liittyviä omiaisuuksia kutsutaa tilastollisiksi muuttujiksi, joita merkitää usei, y, z, tai 1,, 3, Jotta tilastollisia meetelmiä voidaa soveltaa, o tutkittava ilmiö omiaisuudet voitava esittää umeerisesti. Tämä tehdää mittaamalla tilastoyksiköiltä muuttujie arvot eli havaitoarvot. Ku tutkittavilta tilastoyksiköiltä mitataa halutut tutkittavat omiaisuudet, saadaa havaitoaieisto. Havaitoaieisto esitetää usei havaitomatriisia seuraavasti 1 j k a1 a ai a 11 1 1i 1 1 i j1 j ji j k1 k ki k

7 Tilastoyksiköitä tässä havaitomatriisissa o kpl (eli vaakarivie lukumäärä). Yhde tilastoyksikö (a i ) eri omiaisuudet esitetää yhdellä vaakarivillä. Tätä vaakariviä saotaa ko. tilastoyksikö havaitovektoriksi eli profiiliksi. Muuttujia havaito-matriisissa o k kpl (eli sarakkeide lukumäärä). Yhdellä sarakkeella esitetää site kaikkie tilastoyksiköide tämä omiaisuus ( j ). Sarake muodostaa site ko. muuttuja jakaumavektori. Esim. SPSS-ohjelma havaitomatriisiesityksessä tilastoyksikö imestä voidaa tehdä muuttuja (esim. kua imi), joka saa arvoksee merkkejä (= kirjaimia). Muut tämä aieisto muuttujat saavat arvoksee lukuja. Yhdellä vaakarivillä o yhde tilastoyksikö eli kua erilaisia omiaisuuksia. Yksi sarake eli pystyrivi esittää yhde omiaisuude eli muuttuja arvoja. (Aieisto peruslähde o Tilastokeskukse Kutafakta-aieisto.).. Mittaamisesta Mittaamisella tarkoitetaa meettelyä (operaatiota, säätöä), jolla tutkittavaa tilastoyksikköö liitetää jotaki se omiaisuutta kuvaava luku eli mittaluku. Ku tilastoyksikö tarkastelualaie omiaisuus mitataa ja saadaa mittaustulos, saotaa tätä tulosta muuttuja arvoksi. Käytetyt mittaluvut ovat tilastollise tutkimukse lähtökohta, joho tutkimukse oistumie perustuu. O huolehdittava siitä, että muuttujalla o korkea validiteetti (asiamukaisuus) eli muuttuja mittaa sitä omiaisuutta, jota se olisi tarkoitus mitata. Esimerkiksi kysymys Kuika mota kertaa syöt viikossa porkkaaraastetta? ei mittaa sitä, pidätkö porkkaaraasteesta vai et. Myös muuttuja reliabiliteeti (pysyvyyde, eisattumavaraisuude) täytyy olla korkea, eli toisistaa riippumattomie samalle tilastoyksikölle tehtyje mittauste tulokset pitäisi olla samat. Tilastolliset muuttujat voivat olla suoraa mitattuja tai teoreettisia muuttujia. Teoreettiste muuttujie (esim. älykkyyde) mittaamisessa käytetää apua idikaattoreita. Älykkyyde idikaattoreita voisivat olla esim. meestymie erilaisissa testeissä, joide tulokset yhdistetää esim. yhdeksi muuttujaksi laskemalla eri testie pistemäärät yhtee.

8 Tilastollie muuttuja o jatkuva, jos se voi periaatteessa saada mikä tahasa reaalilukuarvo joltai (järkevältä) väliltä. Vaikka muuttuja olisiki periaatteessa jatkuva, o käytäössä mittaustarkkuus aia äärellie. Jatkuvuude käsite perustuuki ajatuksee, että mittaustarkkuutta voidaa parataa rajatta. Muuttuja o diskreetti eli epäjatkuva, jos se arvoia voivat olla vai jotki erilliset lukuarvot jollaki välillä. Havaitomatriisissa olevat havaitoarvot äyttävät tavallisilta reaaliluvuilta. Näillä arvoilla o kuiteki myös toie sisältö. Ne kuvaavat jotaki omiaisuutta, ja käytetty esitystapa o vai välie ilmiö tutkimisessa. Tavallisia reaalilukuja voidaa laskea yhtee, jakaa keskeää, iistä voidaa ottaa logaritmeja je. Myös havaitoaieistolle tehtävät tilastolliset operaatiot perustuvat tällaisii laskutoimituksii, mutta äitä operaatioita tehtäessä o aia pidettävä mielessä, että saatu tulos o voitava tulkita empiirisesti mielekkäällä tavalla. Tulkia mielekkyys riippuu usei muuttuja mitta-asteikosta. Muuttuja mitta-asteiko tutemie o tärkeää, koska erilaisille muuttujille sopivat vai tietyt tilastolliset tuusluvut ja aalysoitimeetelmät. Mitä korkeampi o mittaustaso, sitä eemmä o käytössä aalyysimeetelmiä. Seuraavassa esitellää mitta-asteikkojako, jossa muuttujat jaetaa eljää ryhmää, jotka esitetää alhaisimmasta korkeimpaa. 1 Nomiaali- eli luokittelu- eli laatueroasteikko Jos tilastoyksiköt aioastaa jaetaa muuttuja perusteella luokkii, mitataa muuttujaa omiaaliasteikolla. Tällöi jokaisesta tilastoyksiköstä a i ja a j voidaa saoa aioastaa, että e ovat joko samalaisia tai erilaisia muuttuja suhtee. Jokaie tilastoyksikkö voi kuulua vai yhtee luokkaa. Nomiaaliasteikollise muuttuja arvoje koodaus voidaa valita vapaasti. Aritmeettiset laskutoimitukset eivät ole sallittuja muuttuja arvoille. Aioastaa lukumäärie laskemie o järkevää. Esim. sukupuoli: mies = 1 aie = ammatti: pappi = 1 lukkari = kattori = 3 Esim. Liisa o pappi ja Leea o kattori. Liisalla ja Leealla o eri ammatit. Liisalla ja Leealla o sama sukupuoli. Ordiaali- eli järjestysasteikko Ordiaaliasteikolla voidaa luokittelu lisäksi luokat asettaa järjestyksee muuttuja arvoje perusteella. Muuttuja arvoje välillä vallitsee joki järjestysrelaatio, joka voidaa ilmaista saoilla "parempi", "vaikeampi", "kauiimpi", Mitää lukua ei vertailuu voida kuitekaa ottaa mukaa. Peruslaskutoimitukset eivät ole sallittuja ordiaaliasteikolla.

9 Ordiaaliasteikollise muuttuja arvoje koodaus o muute vapaata, kuha olemassa oleva järjestys tulee yksikäsitteisesti määrätyksi. Esim. arvosaa: tyydyttävä = 1 hyvä = kiitettävä = 3 suhtautumie tiettyy väitteesee: täysi eri mieltä = 1 jokseeki eri mieltä = ei eri mieltä eikä samaa mieltä = 3 jokseeki samaa mieltä = 4 täysi samaa mieltä = 5 sijoitus maastojuoksu piirimestaruuskilpailuissa Esim. Matti sai tetistä arvosaa hyvä ja Liisa sai arvosaa kiitettävä. (Matti ja Liisa saivat eri arvosaa.) Liisa arvosaa o parempi kui Matilla. 3 Itervalli- eli välimatka-asteikko Itervalliasteikolla voidaa luokittelu ja järjestyksee asettamise lisäksi vertailla muuttuja lisäyste suuruutta keskeää lukuje avulla. Kahde tilastoyksikö a i ja a j välistä eroa muuttuja suhtee vastaa muuttuja-arvoje i ja j erotus. Muuttuja-arvoje yhtee- ja väheyslasku o sallittua, ja lieaarie muuos f() = a + b, missä b > 0 säilyttää itervalliasteiko raketee. Asteiko ollapiste o sopimuksevaraie (keiotekoie). Muuttuja voi saada joskus egatiivisiaki arvoja. Esim. lämpötila Celsius- tai Fahreheit-mittarilla mitattua ( Celsius, y Fahreheit; lieaarie muuos y = 3 + 1.8) kaleteri mukaa mitattava aika leveys- ja pituusasteet Esim. Vaasa lämpötila o -6 C ja Helsigi + C. (Vaasassa ja Helsigissä o eri lämpötila. Helsigissä o lämpimämpää kui Vaasassa.) Helsigissä 8 C lämpimämpää kui Vaasassa. 4 Suhdeasteikko Jos itervalliasteiko vaatimukset ovat voimassa ja lisäksi o olemassa absoluuttie ollapiste, jossa tarkasteltava omiaisuus "häviää" eli omiaisuude määrä o todella olla, o muuttuja mitta-asteikko suhdeasteikko. Aritmeettise laskutoimitukset ovat sallittuja, ja lieaarie muuos f() = a, missä a > 0 o sallittu. Suhdeasteikolla voidaa tilastoyksiköide muuttuja arvoje vertailussa käyttää suhdelukua.

10 Esim. pituus cm paio kg Esim. Matti paiaa 90 kg ja Liisa 45 kg. (Matti ja Liisa ovat eri paioisia. Matti o paiavampi kui Liisa. Matti paiaa 45 kg eemmä kui Liisa.) Mati paio o kaksikertaie Liisa paioo verrattua. Huom. Muuttuja mitta-asteikko ilmoitetaa se toteuttama korkeimma asteiko perusteella Huom. Usei mitta-asteikot jaotellaa vielä kahtee luokkaa: omiaali- tai ordiaaliasteiko muuttujia saotaa kvalitatiivisiksi eli laadullisiksi muuttujiksi. Itervalli- tai suhdeasteiko muuttujia saotaa kvatitatiivisiksi eli määrällisiksi muuttujiksi. Huom. Asteikkotyypi määrittämie ei ole välttämättä helppoa eo. tuusmerkkie avulla. Joissaki tilateissa muuttuja mitta-asteikosta esiityy erilaisia äkemyksiä. Tyypillisesti tällaie muuttuja mittaa mielipidettä. Tarkasti ottae ko. muuttuja o järjestysasteiko muuttuja, mutta joskus se ajatellaa oleva välimatka-asteiko muuttuja. Viimeksi maiittu tulkitatapa johtuu siitä, että aieisto käsittelijä mieltää muuttuja-arvoje erotukse umeerise erotukse mukaiseksi.

11 3. YKSIULOTTEINEN EMPIIRINEN JAKAUMA 3.1. Frekvessijakauma peruskäsitteitä ja luokitus Jos tutkittavie tilastoyksiköide lukumäärä o suuri, ei havaitomatriisi aia riitä muuttujie yleispiirteide selvittämiseksi. Muuttuja yleiset omiaisuudet hukkuvat yksityiskohtie joukkoo. Aieistoa o järjestettävä ja tiivistettävä. Havaitomatriisi sisältämää tietoa voidaa tiivistää esimerkiksi muodostamalla muuttuja (luokiteltu, suora, yksiulotteie) frekvessijakauma. Frekvessijakauma muodostamiseksi muuttuja saamat arvot jaetaa erillisii luokkii, merk. E 1, E,, E k, missä k o luokkie lukumäärä. Luokkaa E i kuuluvie : arvoje lukumäärää saotaa luoka E i frekvessiksi, merk. f i. Ku muuttuja luokat ja luokkia vastaavat frekvessit tuetaa, ii silloi tuetaa : frekvessijakauma. Usei absoluuttiste frekvessie sijasta esitetää frekvessit, jotka o suhteutettu havaitoje kokoaismäärää. Näitä suhteutettuja frekvessejä voidaa käyttää esimerkiksi kahde eri havaitoaieisto frekvessijakaumie vertailuu. Lukua p i = f i saotaa luoka E i suhteelliseksi frekvessiksi ja lukua 100p i saotaa prosetuaaliseksi frekvessiksi. Jos muuttuja o epäjatkuva eli diskreetti, o luokkie määrittely yleesä selvää. Luokkia käytetää muuttuja arvoja joko sellaiseaa tai iitä vastaavia koodilukuja. Jos muuttuja luokilla o joki vakiituut esittämisjärjestys tai muuttuja o aiaki järjestysasteikolla mitattu, o luokat esitettävä vastaavassa järjestyksessä. Esim. Vuode 003 alussa Suome kutie lääijakauma oli seuraavalaie: (Aieisto peruslähde o Tilastokeskukse Kutafakta) Lääi f i p i 100p i Etelä-Suome 88 0.197 0 Läsi-Suome 04 0.457 46 Itä-Suome 66 0.148 15 Oulu 50 0.11 11 Lapi 0.049 5 Ahveamaa 16 0.036 4 Yhteesä 446 1.000 100

1 Jos luokkia tulee hyvi paljo ja suuri osa frekvesseistä o pieiä, kaattaa luokkia yhdistellä. Tällöi luokat o yhdisteltävä ii, että samaa luokkaa tulevat arvot kuuluvat mahdollisimma loogisesti yhtee. Jos muuttuja o jatkuva-arvoie, o se luokittelu hakalampaa, koska tällaise muuttuja arvot voivat olla mitä tahasa reaalilukuja joltai väliltä, ja kaikki mitatut arvot voivat olla erisuuruisia. Jos muuttujasta halutaa muodostaa tiivis frekvessijakauma, o luokkie oltava välejä, jotka kattavat muuttuja arvot. Jatkuva muuttuja luokittelussa tietoa häviää, koska yt ei eää ilmoiteta muuttuja havaittuja arvoja vaa luokka, joho havaitoarvo kuuluu. Luokitellu aieisto esitystapa o kuiteki usei selvempi kui luokittelemattoma, koska jatkuva-arvoise muuttuja jakauma esittämie esimerkiksi tilastokuvioa perustuu usei luokitteluu. Jatkuva muuttuja luokittelua voidaa hahmottaa seuraavasti: Oletetaa, että luokiteltavia havaitoja o kpl ja e o pyöristetty jolleki mittaustarkkuudelle, merk. d. (Jos mittaustulokset ovat kokoaislukuja, o d = 1, jos mittauksissa o käytetty yhtä desimaalia, ii d = 0.1). 1 Etsitää piei arvo, merk. (1), ja suuri arvo, merk. (). Muuttuja arvoje vaihteluväli muodostaa väli ( (1), () ). Vaihteluväli pituus o w = () - (1). Päätetää, käytetääkö tasavälistä vai epätasavälistä luokitusta. Luokitus o tasavälie, jos kaikki luokat ovat yhtä leveitä. Jos vai voidaa, kaattaa käyttää tasavälistä luokitusta. 3 Valitaa luokkie lukumäärä k, k 3 tai k. (Jos = 15, ii k 5-7.) Yleesä luokkia o 4-10 kpl. 4 Tasavälisessä luokituksessa määritetää arvio luokkaväli pituudelle c site, että c > w. Luokkie rajoje o oltava selkeitä, ja siksi c valitaa usei hiuka k suuremmaksi kui edellie suhde. 5 Muodostetaa luokat site, että e peittävät koko vaihteluväli. Esimmäise luoka pyöristety alaraja pitäisi olla pieempi tai yhtä suuri kui (1). Muut luokat määritellää pyöristettyje luokkarajoje avulla, jotka esitetää samalla mittaustarkkuudella kui muuttujaki o mitattu. 6 Tutkitaa jokaie arvo, ja määrätää luokkie frekvessit. Yksittäie havaito voi kuulua vai yhtee luokkaa. Esim. Tilastokeskukse Kutafakta-aieistossa yhteä omiaisuutea o kuassa v. 00 myytyje asutoje keskihita /m. Asutoje keskihitaa ei ole määritetty 30 kuassa, jote käytettävie havaitoje (eli kutie) kokoaismäärä o 416. Keskihita o määritetty euroia eliömetriä kohde, jote mittaustarkkuus d = 1. Muuttuja o suhdeasteikolla mitattu ja jatkuva. Piei arvo o 336 ja suuri 166. Vaihteluväli pituus o 1830.

13 Sopiva luokkie lukumäärä tämä suuruisessa aieistossa o oi 7-9. Tarkastellaa yt valmiiksi luokiteltua aieistoa, jossa luokkie lukumääräksi o valittu k = 8 ja luokkaväli pituudeksi c = 30. Esimmäise luoka pyöristetyksi alarajaksi o valittu luku 330, koska se pieitä arvoa pieempi tasaluku. Toise luoka pyöristetty alaraja o luokkaväli pituude etäisyydellä esimmäise luoka alarajasta. Esimmäise luoka pyöristetty yläraja o mittaustarkkuude verra pieempi kui toise luoka pyöristetty alaraja. Absoluuttiste frekvessie lisäksi jakaumassa o esitetty prosetuaaliset frekvessit. Asutoje keskihita / m f i 100 p i 330-559 49 11.8 560-789 195 46.9 790-1019 118 8.4 100-149 38 9.1 150-1479 11.6 1480-1709 1 0. 1710-1939 1 0. 1940-169 3 0.7 Yhteesä 416 100.0 Mittaustarkkuus d äkyy frekvessijakaumataulukossa site, että se o i:e luoka pyöristety alaraja ja sitä edeltävä luoka pyöristety yläraja erotus. Taulukossa äkyvät pyöristetyt luokkarajat ovat luokkie symboleja. Tasavälisessä luokituksessa edeltävä luoka ja seuraava luoka pyöristettyje alarajoje (ja myös ylärajoje) välie etäisyys vastaa luokkaväli pituutta. Peräkkäiste luokkie välie todellie luokkaraja o luoka i pyöristety yläraja ja sitä seuraava luoka pyöristety alaraja välie pyöristysraja. Sitä saotaa edeltävä luoka todelliseksi ylärajaksi ja seuraava luoka todelliseksi alarajaksi. Todellisesta alarajasta käytetää merkitää L i ja todellisesta ylärajasta merkitää U i. Todellisia luokkarajoja käytetää mm. graafisissa esityksissä sekä tuuslukuje laskemisessa. Luokkaväli pituus c i o luoka todellise ylä- ja alaraja erotus eli c i =U i - L i. Tasavälisessä luokituksessa luokkaväli pituus o kaikilla luokilla sama ja tällöi siitä voidaa käyttää merkitää c.

14 L U Luoka E i luokkakeskus m i o luoka keskipiste eli m i i i. Koska luokittelussa katoaa tilastoyksiköide tarkat muuttuja-arvot, tulkitaa luokkakeskus usei ko. luoka havaitoje keskiarvoa. Luokkakeskuksia käytetää mm. tilastokuvioissa. Jos muuttuja o epäjatkuva, itervalli- tai suhdeasteikolla mitattu ja jos muuttujalla o paljo erilaisia arvoja, voidaa muuttujaa kohdella kui se olisi jatkuva. Jos muuttuja o mitattu vähitää järjestysasteikolla, voidaa muuttujalle määrittää summafrekvessi eli kumulatiivie frekvessi F i ilmaisee, kuika mota tilastoyksikköä (havaitoa) kuuluu luokkaa E i tai sitä edeltävii luokkii yhteesä eli eli F i i f j j1 F1 f1 F f1 f F1 f F3 f1 f f3 F Fk f1 f fk f3 Fk 1 fk Edellee saadaa suhteellie summafrekvessi P i F i ja prosetuaalie summa- frekvessi 100P i. Esim. Seuraavassa taulukossa o esitetty keskihia frekvessijakauma lisäksi summafrekvessit, prosetuaaliset summafrekvessit, todelliset luokkarajat ja luokkakeskukset. Asutoje keskihita / m f i F i 100 P i L i U i m i 330-559 49 49 11.8 39.5 559.5 444.5 560-789 195 44 58.7 559.5 789.5 674.5 790-1019 118 36 87.0 789.5 1019.5 904.5 100-149 38 400 96. 1019.5 149.5 1134.5 150-1479 11 411 98.8 149.5 1479.5 1364.5 1480-1709 1 41 99.0 1479.5 1709.5 1594.5 1710-1939 1 413 99.3 1709.5 1939.5 184.5 1940-169 3 416 100.0 1939.5 169.5 054.5 Yhteesä 416

15 3.. Graafie esitys Frekvessijakauma voi esittää myös graafisesti. Usei käytetty kuviotyyppi o pylväskuvio. Pylväskuviot muodostuvat joko vaaka- tai pystypylväistä. Pylväide pitaalat (ja tasalevyiste pylväide pituudet) kuvaavat määriä, jote pylvää pituutta osoittava asteiko o lähdettävä luvusta 0. Vaakapylväskuvioita tulisi käyttää silloi, ku kuvataa laadullise muuttuja jakaumaa. Muuttuja luokat esitetää pystyakselilla ja vaaka-akselilla kuvataa frekvessit (absoluuttiset, suhteelliset tai prosetuaaliset). Jos muuttuja o omiaaliasteikolla mitattu, esitetää aieisto ii, että yli pylväs o pisi ja muut pylväät piirretää pituusjärjestyksessä. Pylväide välii jätetää pieet raot. Jos muuttuja o järjestysasteikollie, esitetää pylväät luokkia vastaavassa järjestyksessä. Sektoridiagrammia (ympyräkuvio, piirakkakuvio) käytetää laadullise muuttuja jakauma esittämisessä erityisesti silloi, ku halutaa havaiollistaa joki kokoaisuude jakautumista osii. Jokaise luoka kokoa edustaa sektori pita-ala, joka o suoraa verraollie luoka kokoo. Sektorikuvio sijasta kaattaa käyttää vaakapylväsesitystä erityisesti silloi, jos halutaa esittää, että kahde (tai useamma) melko samakokoise ryhmä välillä o kuiteki eroavuutta havaitomäärässä. Esim. Suome kutie lääijakauma vaakapylväskuvioa Läsi-Suome lääi Etelä-Suome lääi Lääi Itä-Suome lääi Oulu lääi Lapi lääi Ahveamaa 0 50 100 150 00 50 kpl

16 Esim. Suome kutie tyyppijakauma sektorikuvioa Kaupukimaie 15,% Taajamatyyppie 16,4% Maaseutumaie 68,4% Määrällise epäjatkuva muuttuja jakaumaa voidaa kuvata jaakuviolla, joka o pystypylväskuvio. Jaadiagrammi piirretää ii, että koordiaatistoo piirretää muuttuja arvoje kohdalle kyseiste arvoje frekvessie korkuiset jaat tai pylväät. Esim. Vialliste tuotteide lukumääräjakauma tuote-erissä esitettyä taulukkoa ja jaakuvioa 5 vialliste lkm f i 1 4 3 4 3 5 6 1 Tuote-erie määrä 4 3 1 0 1 3 4 5 6 Vialliste tuotteide määrä Frekvessihistogrammi o pystypylväskuvio, jota käytetää määrällisille jatkuville muuttujille. Ku luokitus o tasavälie, histogrammi muodostuu pylväistä, joide leveys o luokkaväli pituus c, korkeus luoka E i frekvessi f i ja katoje kärkipisteiä vaakaakselilla ovat todelliset luokkarajat. Yleesä kuiteki todelliste luokkarajoje sijasta merkitää vaaka-akselille äkyvii "siistit" luvut, jotka ovat lähellä todellisia luokkarajoja tai luokkakeskuksia. Histogrammissa o pylvää pita-ala tärkeämpi kui korkeus, jote kuvio olisi piirrettävä ii, että luokkie frekvessie suuruus o suoraa verraollie

17 pylväide pita-aloihi. Tämä vaatimus toteutuu helposti tasavälise luokitukse yhteydessä, ku piirretää frekvessi korkuisia pylväitä. Jos luokitus o epätasavälie, o pita-alatulkita muistettava! Esim. Asutoje keskihia jakauma frekvessihistogrammia 00 150 Kutie määrä 100 50 0 445 675 905 1135 1365 1595 185 055 Asutoje keskihita /m² Yksiulotteie jatkuva määrällise muuttuja frekvessijakauma voidaa esittää myös frekvessimoikulmio avulla. Jokaise luokkakeskukse kohdalle piirretää piste frekvessi (tai suhteellise tai prosetuaalise frekvessi) korkeudelle ja peräkkäiset pisteet yhdistetää toisiisa jaoilla. Frekvessimoikulmio päätepisteet ovat -akselilla s. ollaluokkie (= luokitukse alkuu ja loppuu lisättävie ylimääräiste luokkie) luokkakeskuksissa. Jos ollaluokkia ei voi lisätä, ei frekvessimoikulmiota voi piirtää. Esim. Asutoje keskihia jakauma frekvessimoikulmioa 00 150 Kutie lukumäärä 100 50 0 15 445 675 905 1135 1365 1595 185 055 85 Asutoje keskihita /m²

18 Myös summafrekvessijakauma voidaa esittää kuvioa. Jatkuva määrällise muuttuja summafrekvessijakaumaa kuvataa summakäyrällä. Jokaise luoka todellise yläraja kohdalle piirretää piste summafrekvessi (tai suhteellise tai prosetuaalise summafrekvessi) korkeudelle ja peräkkäiset pisteet yhdistetää toisiisa jaoilla. Summakäyrä lähtee vaaka-akselilta ja ousee :ää asti. Jos summakäyrä muodostetaa prosetuaalisesta summafrekvessijakaumasta, voidaa käyrä avulla selvittää mm. - kuika mota % havaitoarvoista o pieempiä kui luku a - mikä o se muuttuja arvo, jota pieempiä havaitoarvoja o p %. Esim. Asutoje keskihia prosetuaalie summakäyrä 100 Kutie prosetuaalie osuus 80 60 40 0 0 330 560 790 100 150 1480 1710 1940 170 Asutoje keskihita /m² Diskreeti määrällise muuttuja summafrekvessijakaumaa vastaava summakäyrä o porrasfuktio. Vaaka-akselille merkitää muuttuja arvot ja piirretää käyrä, joka saa arvo kohdalla se frekvessi suuruise hyppäykse ja pysyy arvoje välillä edellise arvo kohdalla saamallaa tasolla. Viivakuviota käytetää ee kaikkea aikasarjoje graafisee esittämisee. Tällöi muuttuja kuvaa yleesä yhde tilastoyksikö yhtä omiaisuutta eri ajakohtia. Viivadiagrammissa vaaka-akselilla kuvataa aika ja pystyakselilla kuvataa muuttuja arvot. Sekä vaaka- että pystyakseli voi katkaista. Esim. Terveyspalvelu yrityste liikevaihto (milj. mk) vuosia 1989-1995 vuosi 1989 1990 1991 199 1993 1994 1995 liikevaihto 3 939 4 40 4 853 4 693 4 719 4 570 4 634

19 5000 4800 Liikevaihto milj. mk 4600 4400 400 4000 3800 1989 1990 1991 199 1993 1994 1995 vuosi Jos muuttuja o vähitää järjestysasteiko mittaustasoa, voidaa se havaitoarvoje jakautumie esittää laatikko-viikset - eli bo-plot -kuvioa. Tässä kuviossa ei esitetä luokitteluu perustuvaa jakaumaa, vaa kuviosta ilmeee muuttuja tuuslukuje arvoja. Kuviossa piirretää laatikko, joka pohja o alakvartiili korkeudella ja kasi o yläkvartiili korkeudella. Muuttuja mediaai merkitää laatikkoo poikkiviivalla. Laatiko pohjasta ja kaesta piirretää viikset kummalleki puolella laatikkoa. Viiksie piirtämisessä o useita käytätöjä, viiksie toisia päätepisteiä voivat olla esim. 10 %: ja 90 %: fraktiilit, jolloi kuvaa voidaa vielä eriksee merkitä e havaiot, jotka ovat kauempaa jakauma keskikohdasta kui em. fraktiilit. Määrällise muuttuja jakaumaa voidaa esittää ruko-lehti -kuviolla. Muuttuja-arvoista jätetää esittämättä tietty määrä oikeapuoleisia umeroita. Jäljelle jäävistä muodostetaa esitykse ruko, joka arvot esitetää perättäisiä kokoaislukuia piei luku ylimmällä rivillä ja suuri alimmalla rivillä. Rukoarvoje perää kirjoitetaa lehdet yleesä site, että havaioista pois jätety umero-osuude esimmäiset umerot tulevat oikealle riville suuruusjärjestyksessä. Esim. Seuraavassa o muutama Suome kua verotettavat tulot suuruusjärjestyksessä ( /asukas): 7693, 8381, 8664, 8738, 876, 9090, 9573, 1000, 10879, 11334, 1789 ja 13070. Ruko-lehti -kuvio, jossa rugo leveys o 1000 : 7: 6 8: 3677 9: 05 10: 8 11: 3 1: 7 13: 0

0 3.3. Yksiulotteise jakauma tuusluvut Frekvessijakaumie laatimisella yritetää saada muuttuja keskeiset omiaisuudet helpommi hahmotettaviksi. Usei muuttuja havaitoarvoje sisältämä iformaatio halutaa tiivistää vieläki voimakkaammi. Tällöi lasketaa havaioista tilastollisia tuuslukuja. Sijaitia kuvaavia tilastollisia tuuslukuja saotaa keskiluvuiksi. Hajotaluvuilla puolestaa kuvataa havaitoarvoje vaihtelua eli "hajaatumista" jakauma keskikohda ympärille. O olemassa myös muita jakauma muotoa kuvaavia tilastollisia tuuslukuja. 3.3.1. Keskiluvut Muuttuja arvoje keskimääräistä suuruutta ja jakauma sijaitia muuttuja-akselilla kuvataa keskilukuje avulla. Moodi (Mo) eli tyyppiarvo o se muuttuja arvo tai luokka, joka frekvessi o suuri. Moodi sopii kaikille mitta-asteikoille, mutta se ei ole aia yksikäsitteie. Vähitää itervalliasteikollise muuttuja luokitellussa aieistossa moodi voidaa tulkita moodiluoka luokkakeskukseksi. Esim. Kutafakta-aieisto Lääi-muuttuja moodi o Läsi-Suome lääi, koska kutia o eite Läsi-Suome lääissä. Asutoje keskihia moodiluokka o toie luokka: 560 789. Moodi voidaa yt tulkita oleva moodiluoka luokkakeskus eli. 675 /m. Esim. Erää tilastotietee kurssi opiskelijoista valitussa 19 hekilö otoksessa olivat opiskelijoide iät suuruusjärjestyksessä: 19, 0, 0, 0, 0, 1, 1, 1, 1, 1,,, 3, 3, 5, 6, 9, 4 ja 46. Iä moodiarvo o 1 vuotta. Mediaai (Md) eli keskusarvo o se havaitoarvo, jota pieempiä ja suurempia havaitoarvoja o yhtä paljo. Mediaaia ei voi laskea omiaaliasteikollisesta muuttujasta. Jos havaiot o asetettu suuruusjärjestyksee ja kyseessä o luokittelemato aieisto, ii Md voidaa määrätä seuraavasti: 1 parito: Md o keskimmäie havaitoarvo (k), missä k = 1 parillie: etsitää kumpiki keskimmäisistä arvoista. Jos muuttuja o ordiaaliasteikolla mitattu, o mediaai kumpiki äistä arvoista. Jos muuttuja o