Tilastografiikan sudenkuopat - millaista on hyvä tilastografiikka? Datajournalismin kurssi 25.11.2011 Heli Mikkelä heli.mikkela@tilastokeskus.fi
Tilastotiedon esittämistavat Miksi grafiikkaa? Tilastografiikan elementit Tilastograafisen esityksen perustyypit Esimerkkejä Esittämistavan/Grafiikkatyypin valinta - yhteenveto Aineistoa ja lähteitä
Tilastotiedon/asiantuntijatiedon esittäminen Tilastotiedon esittämisen keinot: teksti taulukko kuvio Roolit ja luonteet: nopeus, tarkkuus, havainnollisuus, korostus, valinnat/poiminnat, kuvattava ilmiö, subjektiivisuus, erittely/yhdistelytarve Yleensä paras tulos sopivalla yhdistelmällä TP/HMikkelä Marraskuu 2011 25.11.2011
Tekstin piirteitä Mahdollistaa taustoituksen, analyysin, asioiden välisten suhteiden kuvaamisen On aina subjektiivinen ja sisältää tulkintaa Teksti tekstinä, esimerkiksi ei ole tarkoituksenmukaista kirjoittaa taulukkoa tai kuvaa auki tekstiin tekstissä kuvataan ilmiötä, ei kuvion viivan suuntaa tai taulukon numeroiden muutoksia TP/HMikkelä Marraskuu 2011 25.11.2011
Taulukon piirteitä Objektiivisin menetelmä Tarkkuus valittavissa tilanteen mukaan Yhdisteltävyys, vertailtavuus Syventyminen Laajat kokonaisuudet ja monimutkaiset tietorakenteet Tiivistää ja yhdistää Mahdollistaa lukijan omat analyysit TP/HMikkelä Marraskuu 2011 25.11.2011
Kuvan/ graafin piirteitä Tilastograafin tehtävä: tiedon esittäminen visuaalisesti Kommunikoivat nopeasti ja suoraan Korostavat loppuun saatettuja, johdonmukaisia ja ratkaisevia viestejä Mahdollistavat nopean vertailun Ovat vakuuttavampia Ovat paljastavampia Kiinnittävät huomiota ja pitävät huomiota yllä
Kuvat / graafit 2 Aineiston rakenteellisten ominaisuuksien esittäminen Suurten tietomäärien tiivistäminen Asioiden välisten kytkentöjen esittäminen Ajatusten ja johtopäätösten välittäminen Tunnelman luominen Kulttuurisidonnaisuus Fyysisen havaintokyvyn rajat ja puutteet Joitakin ilmiöitä voidaan esittää vain kuviolla Voi olla helppo tai vaikea, yksiselitteinen tai monitulkintainen => Yksinkertainen on kaunista TP/HMikkelä Marraskuu 2011 25.11.2011
Kuvat vs taulukko 4,0 7,0 10,0 12,0 14,0 15,1 14,9 13,0 11,0 21,1 7,8 21,4 7,1 17,3 8,7 16,7 8,5 20,8 7,6 20,3 6,7 17,2 8,1 17,3 8,3 20 7,7 19,1 7,2 TP/HMikkelä Marraskuu 2011 25.11.2011
Kuvat vs taulukko 4,0 7,0 10,0 12,0 14,0 15,1 14,9 13,0 11,0 16,0 14,0 12,0 10,0 8,0 6,0 4,0 2,0 0,0 21,1 7,8 21,4 7,1 17,3 8,7 16,7 8,5 20,8 7,6 20,3 6,7 17,2 8,1 17,3 8,3 20 7,7 19,1 7,2 0 5 10 0 20 18 16 14 12 10 8 6 4 2 0 2 4 6 8 10 TP/HMikkelä Marraskuu 2011 25.11.2011
Kuva vertailee 60 A 50 40 30 20 10 0 1 TP/HMikkelä Marraskuu 2011 25.11.2011
Kuva vertailee 60 50 40 A 120 100 80 30 60 20 40 10 0 1 20 0 A B TP/HMikkelä Marraskuu 2011 25.11.2011
Kuva vertailee 60 50 40 A 120 100 80 30 60 20 40 10 0 1 Vuonna 2001 hinta oli 50 euroa 20 0 A Vuonna 2002 hinta oli kaksi kertaa niin suuri kuin 2001 B TP/HMikkelä Marraskuu 2011 25.11.2011
Kuvien lukeminen havaintopsykologia: tiedostettu ja tiedostamaton havainnointi kohdelähtöinen ja kokijalähtöinen tulkinta tilastokuvioiden kuvioelementit vakioituneita => kuviokieli: symbolit, symbolien yhteiskäyttö, symbolien kykeytyminen määrään tai suuruuteen määrä: pinta-ala, pituudet, suunnat, kulmien suuruudet ja värikylläisyys
Grafiikan rakenne ja peruselementit Kuviot tehdään usein suorakulmaiseen koordinaatistoon Historian mukanaan tuomat sopimukset Perusrakenne on konventio => lukukelpoisuus Kuvioiden rakenteen kaksi kokonaisuutta kuvion piirrososat eli itse kuvio = määrällinen informaatio kuvion tekstit = liittymä todellisuuteen, tulkittavuus
Grafiikan elementit, 2 Akselin otsikko ja/tai mittayksikkö Pysty- eli y-akseli Asteikko Hilaviivat Tietoalkiot/ tietoviivat Otsikko Asteikkosuorakulmio Tietosuorakulmio Vaaka eli x-akseli ja mittayksikkö Selite Tietoalkioiden nimiöt Vuosi Asteikkopisteiden nimiöt Alaviite
Hyvän tilastografiikan arviointi Tietotiheys Valekerroin Tieto-muste suhde Itse asia vs. kuvioroina Tehokkuus silmän liike
Visuaalinen vertailtavuus kuviossa olevien kuvioelementtien suhde on sama kuin lukujen suhde
KoImiulotteisuus Tilavuuden vertailu on epätarkkaa Erimuotoisten kolmiulotteisten kappaleiden tilavuuksien vertailu (pallo ja pyramidi) lähes mahdotonta. Kolmiulotteisuus heikentää kuvioon sisältyvää visuaalista vertailtavuutta ei paranna kuvion kykyä välittää tietoa
Uhanalaisten osuus (%) Maatalous ja rakennetut Rannat Vedet Kalliot Uhanalaisten osuus (%) Maatalous ja rakennetut Rannat Vedet Kalliot Tunturit Suot Metsät 0 5 10 15 Tunturit Suot Metsät 0 5 10 15
Grafiikkakuvioiden perustyylit viiva pystypalkki (pylväs) vaakapalkki piirakka muita: parvikuvio, teemakartat jne.
Viivakuvio (murtoviivakuvio) korostaan kehityssuuntaa ja vaihtelua. trendit tai niiden puute korostuvat, kokonaismäärä jää taustalle kummallakin akselilla jatkuva-arvoinen ja tasavälinen asteikko y-akselin ei välttämättä tarvitse alkaa nollasta aspektisuhde: tasaista kasvua kuvataan 45 :n kulmalla
18 16 14 12 10 8 6 4 2 0 määräaikaiset osa-aikaiset
Pylväskuvio korostaa määriä ja määrien vaihtelua soveltuu aikasarjojen kuvaamiseen akseleilla jatkuva-arvoinen ja tasavälinen asteikko y-akselia ei saa katkaista; pitkät pylväät katkaistaan tarvittaessa ja merkitään luku näkyviin pylväiden väli 25-50 % niiden leveydestä ryhmissä korkeintaan 3 pylvästä vierekkäin viivakuvio ja pylväskuvio toistensa vaihtoehtoja viivakuvio trendit, sarjojen väliset suhteet pylväiden rasterointi: tummuusasteet ja sävyt parhaat
90000 Mielenterveyden häiriöt Tuki- ja liikuntaelinten sairaudet Verenkiertoelinten sairaudet Muut sairaudet 80000 70000 60000 50000 40000 30000 20000 10000 0 2004 2005 2006 2007 2008
300000 250000 200000 150000 100000 Mielenterveyden häiriöt Tuki- ja liikuntaelinten sairaudet Verenkiertoelinten sairaudet Muut sairaudet yhteensä 50000 0 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Pylväskuvio: vaaka-akselin leveyden ja pylväiden leveyden vaikutus 250000 200000 150000 100000 50000 0 2004 2005 2006 2007 2008
Pylväskuvio: vaaka-akselin leveyden ja pylväiden leveyden vaikutus 250000 250000 200000 200000 150000 100000 50000 0 150000 100000 50000 2004 2005 2006 2007 2008 0 2004 2005 2006 2007 2008
Pylväskuvio: vaaka-akselin leveyden ja pylväiden leveyden vaikutus 250000 250000 200000 200000 150000 100000 50000 0 150000 100000 50000 2004 2005 2006 250000 2007 2008 0 2004 2005 2006 2007 2008 200000 150000 100000 50000 0 2004 2005 2006 2007 2008
18 16 14 12 10 8 6 4 2 0 määräaikaiset osa-aikaiset
18 16 määräaikaiset osa-aikaiset 14 12 10 8 6 4 2 0
Vaakapylväskuvio (palkkikuvio) soveltuu eri luokkien määrän esittämiseen ja vertailuun pystyakselilla yleensä luokitteleva (epäjatkuva) ominaisuus, vaaka-akselilla määräasteikko aikasarjat voidaan esittää vaakapylväillä, ei tässä tarkoituksessa yhtä havainnollinen kuin pystypylväikkö x-akselin asteikkoa ei saa katkaista pylväät suuruusjärjestykseen ellei luokilla ole luonnollista järjestystä Vaaka- ja pystypylväskuvio eivät toistensa vaihtoehtoja
Uhanalaisten osuus (%) Tunturit Maatalous ja rakennetut ympäristöt Rannat Kalliot Vedet Suot Metsät 0 2 4 6 8 10 12 14 16
Uhanalaisten osuus (%) Tunturit Maatalous ja rakennetut ympäristöt Rannat Kalliot Vedet Suot Metsät 0 2 4 6 8 10 12 14 16
Piirakkakuvio (ympyrädiagrammi) osuuksien kuvaaminen ei asteikkoa, osuudet pinta-alojen suhteena epätarkin korkeintaan kuusi sektoria suuruusjärjestys suurimmasta pienimpään suurimmasta alkaen joko klo 12 myötäpäivään klo 3 vastapäivään /nykyisin yleisempi piirakoiden välinen vertailu vaikeaa
Suositus: mistä piirakkakuvion suurin osio alkaa Muu tutkinto 3 % Ei tutkintoa, opiskeli 58 % Ylempi korkeakoul u-tutkinto 23 % Alempi korkeakoulututkinto 9 % Ei tutkintoa eikä opiskellut 7 % Alempi korkeakoulututkinto 9 % Ei tutkintoa eikä opiskellut 7 % Muu tutkinto 3 % Ylempi korkeakoulututkinto 23 % Ei tutkintoa, opiskeli 58 % Klo 3 vastapäivään Klo 12 myötäpäivään
Esimerkkejä erilaisista kuvista http://tilastokeskus.fi/til/mettp/2007/mettp_2007_2009-12-17_tie_001_fi.html http://tilastokeskus.fi/til/hrah/2008/hrah_2008_2009-12-16_tie_001_fi.html http://tilastokeskus.fi/til/merek/2009/11/merek_2009_11_2009-12- 04_tie_001.html TP/HMikkelä Marraskuu 2011 25.11.2011
BAD EXAMPLE of a line chart Number of students taking English as a second language at West High School, by first language spoken, 1987 to 2002 Source: Statistics Canada, Learning Resources: Using graphs5
Samat luvut, eri asteikko ja skaalaus 25.11.2011 TP/HMikkelä Marraskuu 2011
Samat luvut, eri asteikko ja skaalaus 25.11.2011 TP/HMikkelä Marraskuu 2011
Samat luvut, eri asteikko ja skaalaus 25.11.2011 TP/HMikkelä Marraskuu 2011
Samat luvut, eri asteikko ja skaalaus 25.11.2011 TP/HMikkelä Marraskuu 2011
Samat luvut, piirakka ja pylväät
Kauppalehti Optio 8/2010 TP/HMikkelä Marraskuu 2011 25.11.2011
Pohjolan Sanomat 15.11.2011 TP/HMikkelä Marraskuu 2011 25.11.2011
3500 3000 2500 2000 1500 1000 500 0 Miehet Naiset Sukupuolet yhteensä 500 000 500 000 500 000 500 0 Miehet Naiset Sukupuolet yhteensä 3500 3000 2500 2000 1500 1000 500 0 Miehet Naiset Sukupuolet yhteensä
3500 3000 2500 2000 1500 1000 500 0 Miehet Naiset Sukupuolet yhteensä 4000 4000 3500 3500 3000 2500 3000 2000 1500 2500 1000 500 2000 Miehet Naiset Sukupuolet yhteensä 0 Miehet Naiset Sukupuolet yhteensä
Oikea esitystapa 1 tietosisällöltään oikein kieli-, väri- ja muoto-opillisesta oikein oikeassa suhteessa kohderyhmään oikeassa suhteessa viestinnän tavoitteeseen oikeassa suhteessa käytettävissä olevaan aikaan TP/HMikkelä Marraskuu 2011 25.11.2011
Oikea esitystapa 2 tyylilajiltaan oikea (teknisesti) julkaisuvälineen kanssa yhteensopiva oikeaan aikaan oikeassa paikassa rakenteellisesti selkeä visuaalisesti luettava TP/HMikkelä Marraskuu 2011 25.11.2011
Grafiikkatyypin valinta, yhteenveto 1 esitystilanne esitettävän tiedon luonne sanoma, jonka haluaa välittää Grafiikan asema ja rooli kokonaisesityksessä tietoalkion luonne (lukumäärät, prosentit, keskiarvo..) muuttujien määrä muuttujien mitta-asteikko
Grafiikkatyypin valinta, yhteenveto 2 luokiteltujen muuttujien asteikkotyyppi ja luokkien määrä jatkuvuus/epäjatkuvuus järjestysasteikko vs. ihmisten lukutapa värit symboliikka, kylläisyys, värisokeus, tulostus/kopiointi mustavalkoisena hilaviivat apuviivat, esim. vertailuarvo asteikko kummassakin reunassa ei kahta mittayksikköä samaan kuvaan ei kolmiulotteisuutta liikkuvaa kuvaa/animaatiota mutta harkiten!
Visualisointiesimerkki vuodelta1949 TP/HMikkelä Marraskuu 2011 25.11.2011
Aineistoja, lähteitä, luettavaa Kuusela Vesa. 2000: Tilastografiikan perusteet. Edita Tilastokeskuksen verkkokoulu. Tilastografiikan perusteet. http://www.tilastokeskus.fi/tup/verkkokoulu/data/tg/index.html Tufte Edward. The Visual Display of Quantitative Information Malamed, Connie. 2009. Visual language for designers (yleisempi teos) http://www.niemanlab.org/2011/10/word-clouds-considered-harmful/ McCandless, David. Tieto on kaunista. Kustannusosakeyhtiö Nemo 2009. UNECE: Making Data Meaningful. A guide to writing stories about numbers. Making Data Meaningful 2. Style guide on presentation of statistics. http://www.unece.org/stats/documents/writing/