Numerotiedon visuaalinen esittäminen 1 1
Mihin tilastografiikalla pyritään? } Grafiikan tarkoitus on välittää tietoja } Mahdollisimman tarkasti } Helposti ymmärrettävästi } Niin että lukijat ymmärtävät ne oikein } Tilastografiikka välittää määrätietoa tai tilastotietoa } Kuvioita ei pidä käyttää koristelutarkoituksessa } Kuvioiden tarkoitus ei ole esitellä tekijän (teknisiä) taitoja } Tilastografiikassakin pätee: Garbage in garbage out } Kuviotekniikalla kikkailut vain pahentaa tilannetta 2
Kolme tapaa esittää tilastotietoa: taulukko, kuvio ja teksti 3 3
Analoginen ja digitaalinen tieto omaksutaan eri tavoin } Tilastokuviota ja taulukkoa voi verrata viisarikelloon ja digitaalikelloon } Viisarikellon on havainnollinen ja käyttö on nopeaa, mutta se on epätarkka } Digitaalikellon hahmottaminen vie aikaa, mutta sen tarkkuutta voidaan lisätä 4 4
Taulukkojen ymmärtäminen ei tapahdu hetkessä x y 13 9 11 14 6 4 12 7 7 9 7 4 11 6 x y 13 9 11 14 64 12 7 9 9 9 9 6 3 9 7 x y 13 9 11 14 6 4 12 7 7 7 13 7 9 6 6 6 x y 19 7 6 9 7 13 6 7
Kuviot paljastavat lukujen suhteita paremmin kuin taulukot 1 1 1 1 2 Kaikista näistä kuvioista saadaan sama korrelaatiokerroin ja regressiosuora! 1 1 2 6 1 2 1 2 6
Sääntöjä epäonnistuneen esityksen tekemiseksi H. Wainer: How to Display Data Badly. The American Statistician, 194. H. Wainer: Visual Relevations. Copernicus, 1997. } Esitä mahdollisimman vähän tietoa } minimoi tietotiheys } Piilota tieto, jonka esität } minimoi tieto-muste -suhde } täytä kuvio kuvioroinalla } Unohda visuaalinen vertailtavuus } Anna vain järjestykselle merkitys } Esitä kuvio ilman asiayhteyttä } Muuta asteikkoa akselien keskellä } Korosta itsestään selvää } ja unohda merkityksellinen } Vaihtele perusviivaa } Australia ensimmäiseksi } Nimiöi lukukelvottomasti, vaillinaisesti. sekavasti tai väärin } Enemmän on sekavampaa: enemmän desimaaleja ja dimensiota 7 7
Esitä mahdollisimman vähän tietoa eli minimoi tietotiheys } Kuvion sanoma syntyy vertailusta } Yksi pylväs ei sisällä paljoa informaatiota, koska sitä ei voi verrata mihinkään } Kahden pylvään välille syntyy yksi vertailuasetelma } Tietotiheydessä on kaksi tekijää: } Tietojen määrä } Kuvion koko } Vähistä tiedoista ei pidä tehdä isokokoista kuviota
Piilota tieto, jonka esität Minimoi tieto-muste -suhde }Tiedon voi piilottaa }valitsemalla huonosti sopivan esitystavan }täyttämällä kuva-ala kuvioroinalla }kuvioroinan määrää mitataan tieto/muste suhteella } Joskus tiedon piilottamisen syynä on se, että niin peitetään vähäinen tietotiheys 9 9
Unohda visuaalinen vertailtavuus } Visuaalinen vertailtavuus on koko kuvioesittämisen kulmakivi } Visuaalinen vertailtavuus tarkoittaa sitä, että kuviossa olevat fyysisten objektien suhteet vastaava lukujen suhteita } Lukuja ja esitetään pylväillä, joista toinen on kaksi kertaan niin pitkä kuin toinen.
Kolmiulotteisuus heikentää aina visuaalista vertailtavuutta 11 11
Visuaalinen vertailtavuus saattaa hävitä yhdisteltäessä kuvioita 12 12
Anna vain järjestykselle merkitys! } Muutos todellisuudessa: 1mailia/gallona -> 27, mailia/gallona eli 3% } Muutos kuviossa:,6 tuumasta,3 tummaan -> 73% } Valekerroin = 73 % / 3 % = 14, 13 13
Tilastokuvion osat Otsikko Muuttuja ja mittayksikkö Liikenteen ja lämmityksen energian kulutus Suomessa 19-199 4 Tietoviivat Tietosuorakulmio 4 Kulutus, TOE * 3 3 2 2 Pystyakseli ja pystyasteikko Vaaka-akseli ja vaaka-asteikko 19 192 194 196 19 199 1992 1994 Liikenne Hilaviivat Lämmitys Selite 3 3 2 2 (*) TOE = Öljytonni ekvivalentti eli energia ilmaisuna öljytonneina Alaviite Nimiöt Asteikkosuorakulmio 14 14
Tavallisimmat kuviotyypit Naudan- ja sianlihan omavaraisuusasteen muutos Suomessa vuodesta 199 vuoteen 24 Omavaraisuusaste 12 1 9 7 6 4 3 2 199 1991 1992 1993 1994 199 1996 1997 199 1999 2 21 22 23 24 12 1 9 7 6 4 3 2 Työttömyysprosentti Euroopan Unionin jäsenmaissa heinäkuu 199 1 2 Nauta Sika Metsäntutkimuslaitoksen rekisteröimien siemenkeräysmetsiköiden määrä puulajeittain vuonna 1992 Espanja Suomi Ranska Saksa Irlanti Belgia Ruotsi Portugali Tanska Itävalta Luxenburg EMU:n ulkopuolella EU-maat keskimäärin:,1% Mänty 6 Muut 23 Hieskoivu 44 Rauduskoivu 66 Hollantia, Britanniaa, Italiaa ja Kreikkaa koskevat tiedot puuttuvat Lähde: EuroStat News Release 66/9 Kuusi 27 1 1
Viivakuvio kaavamaisesti 16 16
Akselien asteikkojen tasavälisyys on välttämätöntä 4 3 2 4 1 196 197 197 19 19 199 2 A A B } Vain tasavälinen aika-asteikko (ylempi paneeli) näyttää kehityssuunnan eli trendin oikein } Epätasavälinen aika-asteikko (alempi paneeli) vääristää trendin kaikissa tapauksissa } Huom! Asteikko on koordinaattiakselien ominaisuus ei tietojen ominaisuus. 3 2 B 196 197 19 193 196 197 199 199 17 17
Muotosuhde vaikuttaa kuvion sanomaan 12 6 4 2 196 196 197 197 19 19 199 12 12 6 6 4 4 2 2 196 196 197 197 19 19 199 1 196 196 197 197 19 19 199 1
Pylväskuviot } Pylväskuvioista on kaksi päätyyppiä, joilla on useita alatyyppejä } Pystypylväskuvio } Kuvaa jatkuvaa ilmiötä, esimerkiksi aikasarjaa } Vaakapylväskuvio } Kuvaa epäjatkuvaa ilmiötä } Pysty- ja vaakapylväskuviot ovat eri kuviotyyppejä eivätkä ole toistensa vaihtoehtoja 19 19
Pystypylväskuvio kaavamaisesti } Pylväiden leveys määritellään visuaalisin perustein } Pylväiden välin tulee olla 3% - % pylväiden leveydestä } Määräasteikko vasemmalla ja oikealla 2 2
Pystypylväskuvion aika-asteikon oltava tasavälinen Kuntien sosiaalitoimen menot Menot, milj. markkaa 2 2 1 Menot, milj. markkaa Kuntien sosiaalitoimen menot 2 2 1 1969 197 19 19 19 199 1991 196 197 197 19 19 199 21 21
Pystypylväskuvion määräasteikkoa ei saa katkaista } Pystypylväskuvion määräasteikon on alettava nollasta } Jos asteikko typistetään } kuvio antaa väärän mielikuvan } valekertoimen arvo nousee 22 22
Vaakapylväskuvio kaavamaisesti } Lähes poikkeuksetta tulos on parempi, jos kuvio järjestetään pylväiden pituuden mukaa, eikä esimerkiksi aakkosjärjestykseen } Luonnollista järjestystä ei pidä muuttaa } Määräasteikon on alettava nollasta 23 23
Myös vaakapylväskuviossa asteikon on alettava nollasta Erittäin alhainen haihtuvuus ja öljyn kulutus XXX Ultra-x W/4 1W/4 W/3 W/4 W/ W/4 W/4 6 7 9 11 12 13 haihtumisesta johtuva hävikki (%) XXX Ultra-x W/4 Vähäinen haihtuvuus ja öljynkulutus } Vaakapylväskuvion viesti syntyy samalla tavalla kuin pystypylväidenkin } Määräasteikon katkaiseminen kasvattaa valekertoimen arvoa väistämättä. Ylemmässä kuviossa valekerroin on noin,4 (tai 1.6) 1W/4 W/3 W/4 W/ W/4 W/4 2 4 6 12 14 haihtumisesta johtuva hävikki(%) 24
Piirakkakuvio Metsäntutkimuslaitoksen rekisteröimät siemenkeräysmetsiköt 1991 Metsäntutkimuslaitoksen rekisteröimät siemenkeräysmetsiköt 1991 Mänty Hieskoivu Muut 6 Rauduskoivu 66 44 26 66 44 26 Muut Hieskoivu Kuusi 27 6 Mänty 27 Rauduskoivu Lähde: Metsätilastolllinen vuosikirja 199-1991 Kuusi Lähde: Metsätilastolllinen vuosikirja 199-1991 2 2
Piirakkakuvio on hyvin epätarkka A E B C D } Piirakkakuvion rakenne tekee kuviosta erittäin epätarkan, selvästi epätarkemman kuin muut kuviotyypit A B } Piirakkakuviossa on perustelua esittää luvut sektorien vierellä C D E 1 2 2 26 26
Piirakoiden vertailu on vaikeata 27 27
Vaakapylväskuviot toimivat paremmin Yhdistettävät kunnat: Helsinki - Vantaa Vastaajan kotipaika Espoo Kauniainen Helsinki Vantaa 2 3 4 6 7 9 % vastaajista Kannattaa Ei mielipidettä Vastustaa Yhdistettävät kunnat: Helsinki - Espoo - Kauniainen Vastaajan kotipaika Espoo Kauniainen Helsinki Vantaa 2 3 4 6 7 9 % vastaajista Kannattaa Ei mielipidettä Vastustaa Yhdistettävät kunnat: Espoo - Kauniainen Yhdistettävät kunnat: Helsinki - Espoo - Kauniainen - Vantaa Vastaajan kotipaika Espoo Kauniainen Helsinki Vantaa 2 3 4 6 7 9 % vastaajista Kannattaa Ei mielipidettä Vastustaa Vastaajan kotipaika Espoo Kauniainen Helsinki Vantaa 2 3 4 6 7 9 % vastaajista Kannattaa Ei mielipidettä Vastustaa 2 2
Maailman paras tilastokuvio? 29 29