Tilastokaaviot Oma nimi Ohje Tietotekniset välineet xx.xx.201x
Sisällys 1 Tilastojen esitystavat... 2 1.1 Taulukot... 2 1.2 Tilastokuviot... 4 1.3 Tilastokuvion valinta... 5 1.3.1 Viivakuvio... 5 1.3.2 Pystypylväskuvio... 7 1.3.3 Viivakuvion ja pystypylväskuvion ero... 7 1.3.4 Piirakkakuvio... 8 1.4 Kuviotyypin valinta... 9 Lähteet... 11
1 Tilastojen esitystavat Kurssin kolmannella oppitunnilla tutustutaan tilastojen esitystapoihin. Esitystavoista ensimmäisenä tarkastellaan taulukkoa, joka on perinteisin tapa esittää tilastoaineistoa. Oppitunnilla käydään läpi taulukon eri osat, jotka jokaisessa riittävän informatiivisessa taulukossa tulisi olla. Seuraavaksi tarkastellaan tilastografiikkaa, eli erilaisia tilastokuvioesityksiä ja eri kuviotyyppien mahdollisuuksia esittää tilastotietoa. Oppitunnilla esitellään lyhyesti yleisimmät kuviotyypit: pylväskuvio, viivakuvio, parvikuvio sekä piirakkakuvio. Tilastojen oikean tulkinnan kannalta on tärkeää arvioida tilaston laatua. Suomessa virallisille tilastoille on asetettu laatukriteerit. Näitä laatukriteereitä tarkastellaan oppitunnilla lähemmin. Saat tietää muun muassa mitä tarkoittavat tilastojen vertailukelpoisuus sekä yhtenäisyys. Oppitunnin lopuksi tarkastellaan tilastoindikaattoreita, joiden avulla voidaan seurata useista eri tilastoaineistoista muodostuvia laajoja ilmiöalueita, esimerkiksi työmarkkinoita tai tietoyhteiskunnan kehitystä. 1.1 Taulukot Tilastotaulukko on perinteinen tapa järjestää numeerinen havaintoaineisto helposti omaksuttavaan muotoon. Parhaimmillaan taulukko kirkastaa esitetyn asian lukijalleen nopeasti ja tiivistetysti, tuoden samalla esiin kuvattavan ilmiön keskeisimmät piirteet. Taulukko 1. Suomen kotitalouksien kulutusmenojen rakenne vuonna 2006
Taulukon tarkastelun lähtökohta on otsikko. Hyvässä taulukko-otsikossa kerrotaan 1) mikä on tutkittava joukko, 2) mitä asiaa (muuttujaa) taulukko kuvaa ja miten se on luokiteltu, 3) mikä on havaintojen ajankohta ja 4) millaista mittayksikköä mittarissa käytetään. Jos samaan taulukkoon on koottu tietoja, joissa käytetään eri mittayksikköjä, voi mittayksiköt jättää pois taulukon otsikosta. Esimerkki hyvästä taulukko-otsikosta: Työttömien työnhakijoiden päivärahan suuruus ikäryhmittäin syyskuussa 2006, euroa. Otsikon jälkeen on syytä paneutua taulukkopäihin eli rivi- ja sarakeotsikoihin. Niistä löytyvät tarkasteltavien muuttujien ja niiden luokkien nimet. Usein taulukkoon kootaan useampia muuttujia, jotka ristiintaulukoidaan. Taulukko 2. Koulun oppilaiden pituus ja sukupuoli Pituus cm Sukupuoli Tytöt Pojat 100-119 80 10 120-139 140 120 140-159 100 150 160-180 10 50 Näin saadaan selville havaintoaineiston sisäisiä riippuvuuksia, esimerkiksi sukupuolen ja iän vaikutuksia johonkin kolmanteen asiaan. Esimerkkitaulukko osoittaa että pojat ovat keskimäärin pitempiä kuin tytöt. Soluihin on koottu havainnot taulukkopään jäsennysten mukaan. Jos taulukossa on prosenttilukuja tai summia, on tulkinnan kannalta välttämätöntä tarkistaa, onko ne laskettu sarakkeittain vai riveittäin. Prosenttijakaumia vertailtaessa on kiinnitettävä huomiota myös alkuperäisten jakaumien tapausten lukumäärään, sillä mitä pienempi prosenttilaskun kantaluku (luku, josta laskettuja osuuksia prosenttiluvut kuvaavat) on, sitä enemmän prosenttijakaumat sisältävät satunnaisvaihtelua. Kantalukua koskevan tiedon tulisi löytyä prosenttien summasolujen (= 100 %) vierestä (kuten tämän kokonaisuuden ensimmäisessä taulukossa).
Lukujen mahdollinen jatkokäyttö vaatii toisinaan, että havaintojen lukumäärä esitetään taulukoissa mahdollisimman tarkasti. Niitä luettaessa kannattaa pyöristää lukuja mielessään riittävästi ja etsiä suuria linjoja. Varsinkaan otostutkimuksissa ei yleensä saada tuloksia, joissa tosiasiallinen tarkkuus ylittäisi kolmen numeron tarkkuuden. Joskus on myös mahdollista esittää tarkat luvut liitetaulukoissa ja pyöristettyjä lukuja artikkelitekstin yhteyteen nostetussa taulukossa. Alaviitteissä kerrotaan yksittäiseen soluun, riviin tai sarakkeeseen mahdollisesti liittyviä erityistietoja. Alaviitteessä on maininta esimerkiksi siitä, jos tieto on eri vuodelta kuin otsikko ilmoittaa, jos tieto eroaa käsitteellisesti otsikon ilmoittamasta tai on laadultaan poikkeava muista tiedoista (esimerkiksi saatu eri lähteestä). Taulukon alla voidaan tarvittaessa kertoa myös taulukon lähde. 1.2 Tilastokuviot Kaikilla tavallisimmilla tilastokuvioilla on suurelta osin samanlainen perusrakenne ja niinpä jokaisesta huolella tehdystä kuviosta pitäisi löytyä tietyt perusosat. Yleisimmistä kuviotyypeistä ainoastaan niin sanottu piirakkakuvio poikkeaa muista, koska siinä käytetään erilaista koordinaatistoa. Tosin muilta osin siinäkin on paljon samoja osia kuin muissa kuvioissa. Jotkut kuvioiden rakenteet seuraavat lähes automaattisesti siitä, että kuviot tehdään suorakulmaiseen koordinaatistoon. Jotkut piirteet taas ovat historian mukanaan tuomia sopimuksia. Tilastokuviot eivät näet ole aivan uusi keksintö, vaan niiden historia ulottuu yli kahdensadan vuoden päähän. Kuvioiden perusrakenteet ovat takertuneet ajatteluumme varsin kiinteästi, jopa niin, että niistä poikkeaminen saattaa tehdä kuviosta lukukelvottoman suurelle osalle yleisöstä. Kuvioiden rakenteessa on kaksi keskeistä kokonaisuutta, joihin kumpaankin on kiinnitettävä huomiota: kuvion piirrososat, eli itse kuvio, ja kuvion tekstit. Molemmat ovat välttämättömiä, jotta kuvion voisi ymmärtää. Karkeasti voidaan sanoa, että määrällinen informaatio syntyy kuviosta ja tekstit liittävät kuvion symbolisen esityksen todellisuuteen, eli tekevät siitä tulkittavan.
1.3 Tilastokuvion valinta Tavallisimmin käytetyt neljä kuviotyyppiä ovat viiva-, pystypylväs-, vaakapylväs- ja piirakkakuvio, jotka skotlantilainen William Playfair kehitti 1700- ja 1800-luvun vaihteen tienoilla (ks. Kuusela, 2000). Näiden perusmuodot muunnelmineen kattavat suurimman osan esitettävistä tilastokuvioista. Tosin muitakin, varsin tehokkaita kuviotyyppejä on valittavissa, mutta niitä näkee pääasiassa erikoistilanteissa, kuten tieteellisissä julkaisuissa. Niistä mainittakoon esimerkiksi parvikuvio. Teemakarttoja eli karttakuvioita, jotka esittävät jotakin muuta kuin maantieteellisiä ilmiöitä, on myös alettu käyttää yhä enemmän. Eri kuviotyypeillä on erilaisia, toisistaan poikkeavia ominaisuuksia. Siksi niillä on myös erilainen käyttöala ja niillä voidaan ilmaista erilaisia asioita. Tällä oppitunnilla esitellään yleisimmät kuviotyypit, niiden ominaisuudet ja niiden käyttö yleisellä tasolla. Kuviotyyppien esittelyn lisäksi tässä luvussa pohditaan kuvioiden laadinnan yleisiä tekijöitä ja niiden vaikutusta kuvion rakenteeseen. On kuitenkin aina muistettava, että onnistuneen tilastokuvion tekeminen ei ole pelkästään graafinen ja tekninen asia. Sen tiedon, jota kuvio esittää, on oltava sekä luotettavaa että kiinnostavaa. Tilastokuvio - kuten taulukkokin - voi olla vain niin hyvä kuin se tieto, mitä siihen on viety. Epämääräisestä tai sekavasta tietomassasta ei saa onnistunutta esitystä millään keinolla. Yhdentekevästä asiasta voi saada vain yhdentekevän tilastokuvion ja yritys korjata tilannetta keinotekoisella kuviotekniikalla ja koristelulla vain pahentaa tilannetta. 1.3.1 Viivakuvio Viivakuviolla, tai oikeammin murtoviivakuviolla, tarkoitetaan kuviota, jossa koordinaatistoon on piirretty yksi tai useampia havaintopisteiden kautta kulkevia viivoja. Yleensä viivat kulkevat suoraan pisteestä toiseen. Joissain erikoistilanteissa viiva voi olla myös "pyöristetty" jonkin laskennallisen operaation avulla tai silmämääräisesti. Jos pyöristys on tehty laskemalla, puhutaan aritmeettisesta viivakuviosta.
Kuvio 1. Malliesimerkki viivakuviosta Viivakuvio korostaan kehityssuuntaa ja vaihtelua. Erityisesti trendit - tai niiden puuttuminen - nousevat selvästi esiin viivakuviosta. Sen sijaan kokonaismäärä jää taustalle. Esimerkiksi kuviosta 1 luultavasti ensimmäiseksi kiinnittyy huomio viljakasvien peltoalan nopeaan vähenemiseen vuodesta 1990 vuoteen 1992, ja sen jälkeen loivasti lähtevään lisääntymiseen. Samoin nurmikasvien peltoalan hidas, mutta tasainen kasvu saattaa kiinnittää huomiota. Joku saattaa vielä huomioida senkin, että viljelyalojen välillä ei ole mainittavaa riippuvuutta. Viivakuviolle on tyypillistä, että siinä on kummallakin akselilla jatkuva-arvoinen ja tasavälinen asteikko. Jos sen sijaan jompikumpi asteikoista ei ole jatkuva-arvoinen, viivakuvio ei ole oikea esitystapa. Tyypillisimmillään viivakuvio soveltuu aikasarjojen esittämiseen, mutta toki muunkin tyyppisiä ilmiöitä voidaan esittää.
1.3.2 Pystypylväskuvio Pystypylväskuviossa vaaka-asteikon pisteiden kohdalle piirretään yksi tai useampia pylväitä kuvaamaan määrää. Pystyakselilla on määräasteikko. Kuvio 2. Esimerkki pystypylväskuviosta Pystypylväskuvio korostaa määriä ja määrien vaihtelua. Esimerkiksi kuviossa 2 huomio kiinnittyy pylväiden (suhteellisiin) pituuksiin ja se assosioituu itse viljelyalaan kiinteämmin kuin viiva. Myös tässä kuviotyypissä molemmilla akseleilla tulee olla jatkuva-arvoinen ja tasavälinen asteikko. Pystypylväskuvio, kuten viivakuviokin, soveltuu hyvin aikasarjojen esittämiseen, mutta myös muun tyyppisiä ilmiöitä sillä voidaan kuvata. 1.3.3 Viivakuvion ja pystypylväskuvion ero Viivakuvio ja pystypylväskuvio ovat toistensa vaihtoehtoja. Niitä voidaan käyttää aivan samoissa tilanteissa. Kummassakin kuviotyypissä siis on vaaka-akselin asteikon oltava jatkuva-arvoinen. Valinta viiva- ja pystypylväskuvion välillä on tehtävä sen perusteella, mitä puolta ilmiöstä halutaan painottaa. Kun viivakuvio korostaa kehityssuuntaa eli trendiä ja
vaihtelua, herättää pylväskuvio puolestaan ensisijaisesti mielleyhtymän määrästä. Kuviotyyppien eron huomaa nopeasti, kun vertaa edelläolevia kuvioita. Molemmat esittävät tarkalleen samaa asiaa, ja niissä on siis käytetty tarkalleen samoja lukuja. Kuitenkin ne tuntuvat kertovan hieman eri tarinan. Kuvio 3. Kaksi samoista luvuista tehty kuviota, jotka tuovat esiin viiva- ja pystypylväskuvion eron. 1.3.4 Piirakkakuvio Piirakkakuviossa ympyrä jaetaan sektoreihin osoittamaan kunkin luokan osuutta kokonaisuudesta eli suhteellista määrää. Piirakkakuviossa ei ole ollenkaan asteikkoa, joten informaatio välittyy yksinomaan lohkojen pinta-alojen ja niiden suhteiden välityksellä. Osittain tästä johtuen piirakkakuvio on näistä neljästä kuviotyypistä kaikkein epätarkin.
Kuvio 4. Esimerkki piirakkakuviosta. Lohkojen sisään on merkitty lohkon suhteellinen "koko" ja nimiön alla on esitetty todellinen määrä (miljoonana kuutiometrinä). Piirakkakuviolla (tai ympyrädiagrammilla) esitetään vain sitä, kuinka jokin kokonaisuus on jakautunut osiin eli prosenttijakaumaa. Mitään muuta sillä ei voi esittää. 1.4 Kuviotyypin valinta Kuviotyypin valinta pitää tehdä harkiten ja niin, että siinä otetaan huomioon paitsi esitystilanne yleisöineen myös esitettävän tiedon luonne. Oikean kuviotyypin valinta ei voi olla satunnainen tai automaattinen menettely esimerkiksi siten, että tyydytään ohjelmistojen oletuksena tarjoamiin vaihtoehtoihin. Kannatta muistaa, että itsestään selvät tilanteet voivat olla hyvinkin harhaanjohtavia. Kuviotyypin valinta on tehtävä ensisijaisesti esitettävän asian luonteen perusteella ja toissijaisesti sen mukaan, minkä sanoman kuviolla haluaa välittää. Tällöin on huomioitava muun muassa esitettävän tietoalkion luonne (lukumäärät, prosentit, keskiarvo jne.), muuttujien määrä, muuttujien mitta-asteikko, luokiteltujen muuttujien asteikkotyyppi ja luokkien määrä. Muuttujien asteikkotyyppi, erityisesti jako jatkuviin ja epäjatkuviin muuttujiin, rajaa jyrkimmin mahdolliset kuviotyypit. Muuttujien tarkastelussa on myös eroteltava ne, jotka ovat varsinaisesti kiinnostuksen kohteina, eli esitettävät tai selitettävät muuttujat ja ne, joiden suhteen esitettävää muuttujaa eritellään, eli niin sanotut erittelevät tai selittävät tekijät. Esitettävänä muuttujana voi esimerkiksi olla viljelty peltoala ja erittelevänä ominaisuutena kuluva aika sekä kasvityyppi kuten kuvioissa 1. ja 2. Tavallisin esitettävä asia on absoluuttinen tai suhteellinen määrä, esimerkiksi kappalemäärä, myynti tuhansina euroina tai prosenttiosuus. Niinpä tilastografiikasta puhuttaessa
joskus käytetäänkin ilmaisua määrätiedon visuaalinen esittäminen. (Alan parhaimmistoa on Edward Tuften kirjoittama kirja "The Visual Display of Quantitative Information".) Erittelevä muuttuja voi olla mitattu millä tahansa neljästä mitta-asteikosta: laatuero-, järjestys-, välimatka- ja suhdeasteikolla. Merkittävin huomioitava tekijä on siis mitta-asteikon jatkuvuus tai epäjatkuvuus. Epäjatkuvia asteikkoja ovat laatuero- ja järjestysasteikko ja jatkuvia asteikkoja ovat välimatka- ja suhdeasteikko. Yleisesti käytetty jatkuva-arvoinen selittäjä tai erittelevä tekijä on kuluva aika. Silloin kuvataan siis ilmiöiden muutoksia ajan suhteen eli aikasarjaa. Viivakuvio tai pystypylväskuvio ovat selkeästi havainnollisimmat tavat esittää aikasarjoja. Sen sijaan vaakapylväskuviosta hämärtyy aikasarjaan olennaisesti liittyvä jatkuvuus. Jos erittelevä muuttuja on epäjatkuva, eivät jatkuvuuden kuvaamisen tarkoitetut kuviotyypit, esimerkiksi viivakuviot ja pystypylväskuvio, sovellu. Tämä vaatimus juontaa ihmisten tavasta mieltää suorakulmaisen koordinaatiston vaaka-akseli jatkumona, jossa oikealla on "enemmän" kuin vasemmalla. Epäjatkuva selittävä muuttuja soveltuu vaakapylväskuvion pystyakselille tai siitä voidaan tehdä piirakkakuvio. Järjestysasteikolla mitatun erittelevän muuttujan kohdalla voidaan toisinaan valita, pannaanko se vaaka- vai pystyakselille, eli sekä pysty- että vaakapylväskuviot ovat tässä tapauksessa käytettävissä. Sen sijaan viivakuvio ei tällöin välttämättä tuota onnistunutta tulosta. Se, mikä joissakin tilanteissa tekee järjestysasteikon ongelmalliseksi, on järjestysasteikon ja lukujärjestelmän ristiriitaisuus. Esimerkiksi aidossa järjestysasteikossa 1 on parempi kuin 2 ja paljon parempi kuin 10. Lukujärjestelmässä sen sijaan 10 on enemmän (ja siis usein parempi) kuin 2 tai 1. Vaaka-akselille sijoitettuna oikealla ovat suurimmat luvut, mutta huonoimmat 'sijoitukset'. Tosin sanoen tällaisessa tilanteessa järjestysasteikko on ristiriidassa koordinaatiston ominaisuuksien kanssa.
Lähteet Tilastokeskus 2006. Verkkokoulu. Luettavissa: http://www.stat.fi/tup/verkkokoulu/data/tg/index.html. Luettu: 26.1.2010.