Kvantitatiivisen informaation graafinen esittäminen Datan määrän kasvaessa jatkuvasti, on informaation tehokkaaseen esittämiseen panostettava entistä enemmän. Ihmisillä on luontainen kyky ymmärtää erilaisista abstraktioita ja muodostaa niistä näkemyksiä. Datan tehokas graafinen esittäminen helpottaa ensinnäkin informaation löytämistä monimutkaisistakin kvantitatiivisista aineistoista ja toiseksi halutunlaisten tulkintojen herättämistä esitysten kohdeyleisössä. Sisällysluettelo 1. Johdanto... 2 2. Tekniikan kehitys ja informaation visualisoinnin merkitys... 2 3. Datan graafisen esityksen tulkitseminen... 4 4. Kvantitatiivisen datan oivallinen graafinen esittäminen... 5 4.1 Graafinen oivallisuus... 5 4.2 Valehtelevat graafiset esitykset... 6 4.3 Graafisen esittämisen perusperiaatteet ja johtopäätökset... 6 5. Lähdeluettelo... 6
1. Johdanto Tämän esseen on tarkoitus tukea Informaatioverkostot: Studio 4 -kurssin toista ohjelmointitehtävää, jonka aiheena on informaation visualisointi. Ohjelmointitehtävässä ryhmämme tavoitteena on tarjota erilaisia graafisia esittämistapoja eri valtioiden tilastoihin perustuvalle kvantitatiiviselle datalle. Tässä esseessä puidaan ensinnä motivointina informaation visualisoinnin merkitystä nykymaailmassa. Toiseksi esitellään perusteita ihmisten kvantitatiivisen informaation tulkitsemista, ja kolmanneksi pohditaan sitä, kuinka kvantitatiivista informaatiota voidaan tehokkaasti esittää graafisesti. Esseen aihe on siis rajattu käsittelemään juuri erilaisia kvantitatiivisen informaation esittämistapoja. Tarkoituksena on tuottaa teksti, joka auttaa ryhmämme jäseniä arvioimaan ja arvostelemaan tuottamiaan kvantitatiivisen informaation graafisia esitysmalleja. 2. Tekniikan kehitys ja informaation visualisoinnin merkitys Datan määrä kasvaa räjähdysmäisesti. Etenkin nyt tieto- ja viestintäteknologisen vallankumouksen jälkeen dataa on alkanut olla tarjolla rajattomat määrät. On esitetty arvioita, joiden mukaan joka 15. minuutti kertyisi levyille saman verran dataa kuin Yhdysvaltain kongressin kirjastossa on tekstiä, kuvia ja äänitteitä. Datan määrä vastaisi myös historian kaikkien ihmisten puhetta litteroituna. (Oja E. & Mannila H., luento TKK:lla 3.11.2008) Datan uskomattoman suuri määrä aiheuttaa haasteita merkityksellisen informaation löytämiselle ja havainnollistamiselle. Tieto- ja viestintäteknologian huikeaa kehitystä ei tietenkään tule pitää huonona asiana. Teknologian kehitys on datamassojen luomisen lisäksi myös auttanut huikeasti erilaisten graafisten esitysmallien kehittämisessä. Tästä huolimatta Robert Spencen mukaan informaation visualisoinnin suurimmat ideat syntyivät jo paljon ennen tietokoneita. Spence nostaa kirjassa Information Visualization: Design for Interaction esille neljä eri informaation visualisoinnin klassikkoa: Napoleonin Moskovan marssin reitin ja joukkojen vahvuuden visualisoinnin, scutarilaisen sairaalan kuukausittaisten kuolinlukujen visualisoinnin, Sohon koleran aiheuttamien kuolemantapausten sijaintien suhteessa vesipumppujen sijanteihin visualisoinnin sekä Lontoon maanalaisen reittien visualisoinnin (kuva 1). [1 s. 1-5] 2
Kuva 1: Informaation visualisoinnin neljä klassikkoa [1 s. 1-5] Paneuduttaessa tarkemmin Spencen (kuvassa 1 näkyviin) klassikkoesimerkkeihin, ja erityisesti hänen Napoleonin marssi ja Lontoon metrokartta -esimerkkeihin, huomataan, kuinka valtavasti informaatiota yksittäiseen visualisointiin voidaan sisällyttää. On mielenkiintoista pohtia, kuinka monta tuhatta sivua tekstiä ja numeroita tarvittaisiin vastaavan informaation saattamisessa kirjalliseen muotoon. Kolera-esimerkistä huomataan, kuinka graafinen esitys nopeuttaa johtopäätösten tekemistä. Esityksessä on siis kuvattuna kuolintapausten ja vesipumppujen sijainnit kartalla. Pienentäessäni kuvaa tähän dokumenttiin sopivaksi jouduin korostamaan vesipumppujen sijainnit punaisella värillä. Myös alkuperäisestä mustavalkoisesta kuvasta huomaa heti, kuinka kuolemantapaukset (mustat pisteet) ovat keskittyneet keskimmäisen vesipumpun ympärille. Spencen esittämistä visualisoinnin klassikoista kvantitatiivisen datan graafiseen esittämiseen liittyvät erityisesti Napoleonin marssi-esimerkki sekä kuolemantapausten määrää kuvaava esimerkki. Kuten toisesta esimerkistä huomataan, voidaan myös yksinkertaisen kvantitatiivisen datan hyvällä graafisella esittämisellä tehostaa tulkintaa. Tästä syystä kvantitatiivisen datan 3
graafiseen esittämiseen tulee etsiä entistä parempia ratkaisuja. Aivan kuten ryhmämme ohjelmointitehtävässä onkin tehty. 3. Datan graafisen esityksen tulkitseminen Tutkittaessa tarkemmin 2. kappaleessa esitettyjä visualisoinnin klassikoita ja erityisesti niiden ihmisissä aikaan saamaa reaktiota, huomataan mielenkiintoisia asioita. Ensinnäkin on olemassa tietty data, josta kukin graafinen esitys on muodostettu. Ihminen aistii graafisen esityksen silmillään, jonka jälkeen muodostaa siitä näkemyksen. Tämä prosessi on esitetty esseen teemaa mukaillen graafisesti kuvassa 2. [1 s. 5] Ihmisen havainnon tekeminen ja näkemyksen luominen muodostavat yhdessä Englannin kielellä information visualization -termillä kulkevan ilmiön. Englanninkielinen termi ei siis liity tietokoneilla tehtäviin graafisiin esityksiin, vaan on ihmisten kognitiivinen malli. [1 s. 5] data graafinen esitys havainto tulkinta Kuva 2: Näkemyksenluomisen prosessimalli [1 s. 5] 4
4. Kvantitatiivisen datan oivallinen graafinen esittäminen 4.1 Graafinen oivallisuus Edward Tufte käsittelee kirjassa The Visual Display of Quantitative Information erilaisten graafisten esitysten oivallisuutta ja sitä, millaisia oivallisten graafisten esitysten tulisi olla. Tuften mukaan erilaisten statistiikkojen graafisen esittämisen oivallisuus on siinä, että niiden avulla voidaan kompleksisetkin ideat esittää selkeästi, eksaktisti ja tehokkaasti. [2 s. 13, 51] Päästäkseen selkeyteen eksaktiuteen ja tehokkuuteen, tulee graafisen esityksen pystyä esittämään dataa, esittämään moniakin numeroita pienessä tilassa sekä tekemään suurestakin datamäärästä koherenttia. Hyvä graafinen esitys ei todellakaan saisi peittää alleen sitä, mitä tilastolla on sanottavaa. Hyvän esityksen tulisi myös johdatella katsojansa miettimään varsinaista substanssia ja vertailemaan esityksessä ilmeneviä tiedon palasia tai esityksen alueita keskenään, eikä johdatella katselijaa ajattelemaan mitään epäolennaisuuksia. Ylipäätään hyvän graafisen esityksen tulisi palvella varsinaista tarkoitustaan selittävänä, tutkimiseen johdattelevana ja koristavana asiana. Graafisen esityksen tulisi myös olla läheisesti integroituna tilastolliselle ja suulliselle datan selostuksille. [2 s. 13] Edellä mainittujen vaatimusten kautta muodostuu graafiselle oivallisuudelle eräänlainen määritelmä. Graafinen oivallisuus on: hyvin suunniteltu esitys mielenkiintoisesta datasta kompleksisten ideoiden esittämistä selkeästi, tarkasti ja tehokkaasti mahdollisimman monien eri ajatusten herättämistä katselijassa, mahdollisimman lyhyessä ajassa, mahdollisimman pienellä määrällä mustetta mahdollisimman pienessä tilassa. [2 s. 51] Tuften luettelemista hyvän graafisen esityksen vaatimuksista nousee mielestäni todella tärkeänä esille graafisen esityksen tarkoituksenmukaisuus. Ihmisten tehdessä toisilleen tarkoitettuja graafisia esityksiä, tulee grafiikalla ehdottomasti olla jokin päämäärä. Esimerkiksi ryhmämme ohjelmointitehtävässä, jossa on tarkoitus esittää eri valtiota koskevia kvantitatiivisia tilastoja erilaisin graafisin keinoin, tulisi jokaisella esittämiskeinolla pyrkiä johonkin tavoitteeseen. 5
Kvantitatiivisen informaation graafisella esittämisellä voidaan esimerkiksi yrittää mahdollisimman hyvin havainnollistaa eri maiden tilastoissa ilmeneviä eroja. 4.2 Valehtelevat graafiset esitykset Tarkoituksenmukaisuudessa on toki omat haasteensa, kun puhutaan informaation esittämisestä graafisessa muodossa. Tuften mukaan suurimmalle osalle ihmisistä tuleekin tilastollisista grafiikoista mieleen ensimmäisenä sana vale [2 s. 53]. Onkin totta, että objektiivisimmastakin kvantitatiivisesta datasta voidaan melko yksinkertaisin keinoin saada aikaan graafinen esitys, joka ei enää kuvaakaan totuutta. Tarkat säännöt esimerkiksi eroa kuvaavien akseleiden ja arvojen merkitsemisessä tekevät kuitenkin esityksestä yhtenäisemmän ja näin valehtelemisesta vaikeampaa. [2 s. 77] 4.3 Graafisen esittämisen perusperiaatteet ja johtopäätökset Tufte esittää hyvälle graafiselle esittämiselle viisi perusperiaatetta. Hänen mukaansa kaiken perustana on tietenkin datan esittäminen. Se, millä päästään parempiin esityksiin on, että maksimoidaan data/painomuste -suhde. Tämä saavutetaan poistamalla esityksistä painomustetta, joka ei sisällä dataa tai painomustetta, joka sisältää redundanttia dataa. Viimeisenä perusperiaatteena on koko parannuksen toistaminen uudelleen ja uudelleen. [2 s. 105] Henkilökohtainen graafinen kyvykkyys vaatii graafisen esitysmuodon suunnittelijalta monenlaisia ominaisuuksia, kuten riippumattomuutta sekä tilastollisia ja taiteellisia taitoja [2 s. 87]. Kun esittäjän hyvät ominaisuudet vielä yhdistetään Tuften tarjoamiin graafisen esittämisen perusperiaatteisiin, on lopputulos taatusti oivallinen. 5. Lähdeluettelo [1] Spencer R. Information Visualization: Design for Interaction. Prentice Hall 2007. [2] Tufte, E. The Visual Display of Quantitative Information. Graphics Press. 1983. 6