T-111.2211 INFORMAATIOVERKOSTOT: STUDIO 4 Informaation visualisointitekniikoiden kehitys Antti Häkkinen 17.3.2010 Lyhyt katsaus informaation visualisoinnin lähtökohtiin, historiaan ja tekniikoihin.
Sisältö Johdanto... 1 Ensimmäiset visualisoinnit... 2 Mittausmenetelmät, teoria ja graafinen esitys... 3 Visualisoinnin yleistyminen... 4 Nykyaikainen visualisointi... 5 Yhteenveto... 7 Lähteet... 8
Johdanto Tiedon visualisointi on helppo mieltää kohtalaisen moderniksi tieteenalaksi, mutta todellisuudessa kvantitatiivisen tiedon visualisoinnilla on hyvinkin pitkät perinteet. Monet historialliset edistysaskeleet piirtämistekniikoissa, kuvien tuottamisessa, matematiikassa, tilastotieteessä, tiedon keräämisessä, empiirisessä havainnoinnissa ja nauhoittamisessa ovat mahdollistaneet nykyisenkaltaisten visualisointien laajan käytön. (Friendly 2008, s. 1-2) Edistysaskeleet tieteessä ja kaupankäynnissä ovat usein seurausta keksinnöistä, jotka antoivat ihmisille keinoja nähdä asioita uudessa valossa. Visualisointia hyödynnetään asioiden selkiyttämisessä. Moni kuvaa asian ymmärtämistä asian näkemiseksi. Visualisoinnit auttavat meitä selkiyttämään ja järjestämään käsittelemäämme tietoa. Vaikka tiedon käsittely ei ole vaikeaa ilman visualisointeja, useiden tiedonpalasten säilyttäminen muistissa yhtä aikaa on haastavaa. Kun tiedonpalasten määrä nousee useisiin tuhansiin, on niiden käsittely ihmismielelle lähes mahdotonta ilman apuvälineitä. Vaikka graafisilla apuvälineillä on todella pitkä historia, tietotekniikan kehittyminen on tuonut alalle aivan uusia välineitä. Uusilla tekniikoilla visualisoinneissa päästään tarkempiin kuvauksiin, reaaliaikaiseen interaktiivisuuteen ja alhaisempiin kustannuksiin. Lukemattomia dataelementtejä voidaan koota kuviksi, jotka paljastavat piilossa olevia rakenteita. (Card, Mackinlay & Shneiderman 1999, s. 1-5) Vaikka visualisointi on kehittynyt useiden satojen vuosien aikana, suuri osa visualisoinnin historian merkittävistä virstanpylväistä ajoittuu 1800- ja 1900-lukujen loppuun (Kaavio 1) sekä 2000-luvulle. Aikaisemmat virstanpylväät olivat kuitenkin suhteessa merkittävämpiä kuin myöhemmät. Osaa vuosisatoja sitten kehitetyistä tekniikoista hyödynnetään edelleen jossain muodossa. 1
Kaavio 1 (Friendly 2008 s.3) Ensimmäiset visualisoinnit Ensimmäiset tiedon visualisoinneiksi luokiteltavat teokset olivat mitä ilmeisimmin karttoja, joita on tehty jo vuodesta 6200 EAA. (Friendly 2009, s. 3-4) Erityisesti tähdistä ja muista taivaankappaleista tehdyt kartat olivat yleisiä. Näitä karttoja käytettiin navigointiin ja tutkimusmatkailuun. (Friendly 2008, s. 3-4) Tässä esseessä ei kuitenkaan paneuduta karttoihin kovin laajasti, vaan keskitytään numeerisen ja epänumeerisen tiedon visualisointitekniikoihin. Kartatkin olisi mahdollista asettaa tähän kategoriaan perustellusti, mutta aihepiirin rajaaminen tästä kohtaa on järkevää, jotta päästäisiin edes jonkinlaiseen tarkkuuteen muiden visualisointien käsittelyssä. Karttoja ei kuitenkaan ole jätetty täysin pois. Tutkin myös visualisointeja, jotka esitetään kartan avulla, mutta niiden päätarkoitus ei ole kuvata eri maantieteellisiä alueita itsessään, vaan tuoda esiin lähdedatan sijaintikomponentti. 2
Tiettävästi ensimmäinen yritys näyttää muuttuvia arvoja graafisesti käsitteli auringon, kuun ja planeettojen sijaintia taivaalla vuoden aikana. Kaavio on todennäköisesti 950-luvulta. Abstraktimman tiedon ensimmäiset kaaviot laati Ramon Llull (1235 1316), joka muun muassa laati mekaanisia kuvaajia tiedosta päättelyn avuksi. (Friendly 2009, s. 5) Ensimmäinen palkkikaavio teoreettisesta funktiosta laadittiin noin vuonna 1350. Ranskan Lisieuksen piispa Nicole Oresme (1323 1382) ehdotti kaaviota, jossa toisen muuttujan arvo riippui toisesta. Näin hän tuli myös implisiittisesti ehdottaneeksi koordinaattijärjestelmää kuvaajiin. (Friendly 2009, s. 5) Mittausmenetelmät, teoria ja graafinen esitys Fyysisiin mittauksiin liittyvät ongelmat olivat pinnalla 1600-luvulla. Tällä aikajaksolla merkityksellisiksi nousivat muun muassa analyyttinen geometria ja koordinaatistot, virheiden mittaus ja arviointi ja todennäköisyyslaskenta. Uutta oli myös William Pettyn (1623 1687) esiin tuoma käsite "poliittinen aritmetiikka", joka tarkoitti valtion vaurauden ymmärtämistä väestön, maan, verojen ja tavaroiden arvon tutkimisen kautta. (Friendly 2008, s. 4-5) Merkittävintä 1600-luvussa oli oikeastaan se, että merkityksellistä dataa osattiin kerätä ja sen ymmärrykseen oli jo jonkin verran teoreettista pohjaa. Lisäksi opittiin myös muutamia tekniikoita, joilla tietoa voitiin esittää. (Friendly 2009, s. 7) Vuonna 1644 laadittiin tiettävästi ensimmäinen tilastodatan pohjalta tehty grafiikka, jolla pyrittiin arvioimaan etäisyyttä Toledosta Roomaan pituuspiireissä. Kaavio esittää yhdellä viivalla kaikki 12 tunnettua arviota etäisyydestä. Jokaisen mittauksen kohdalla näkyy arvion tehneen astronomin nimi. (Friendly 2008, s. 5-6) (Kaavio 2) Kaavio 2 (Friendly 2009, s. 9) 3
Kun 1600-luvun ansiot olivat mittausmenetelmien ja tilastotieteellisten teorioiden perustan luomisessa, 1700-luvulla keskityttiin näiden kehittämiseen ja lisäksi graafisen esitystekniikan parantamiseen. Graafisen visualisoinnin käyttö levisi laajemmalle ja taloudellista ja poliittista dataa kerättiin yhä enemmän. Teknisistä innovaatioista voidaan mainita esimerkiksi Jacob de Blonin vuonna 1710 kehittämä kolmiväripaino, joka osaltaan edisti värien käyttöä grafiikassa. William Playfairin (1759 1823) aikaansaannokset näkyvät edelleen, hän kehitti monta sellaista kaaviotyyppiä, jotka ovat edelleen visualisoinnin perustana. Esimerkiksi palkkikaavio, viivakaavio ja piirakkakaavio ovat häneltä lähtöisin. (Friendly 2008, s. 8) Visualisoinnin yleistyminen Kun perusta datalle, sen käsittelylle ja graafiselle esittämiselle oli luotu, 1800-luvulla tilastollista grafiikkaa ja teemakarttoja laadittiin runsaasti aikaisempaa enemmän. (Friendly 2009, s. 15) Teemakartta on kartta, jolla voidaan kuvata jonkin teeman tai ilmiön laatua tai määrää sekä sen sijaintia. Toinen nimitys teemakartalle on temaattinen kartta. (Käsitteet ja määritelmät - Teemakartta) Tilastollinen grafiikka hyötyi olemassa olevasta teoreettisesta perustasta ja erityisesti Playfairin kehittämistä kaaviotyypeistä. Toinen tärkeä saavutus visualisoinnin kehityksen kannalta oli sen saaminen myös viralliseen käyttöön. Grafiikasta tuli hyväksytty apuväline taloudellisessa ja valtiollisessa suunnittelussa. Esimerkiksi niitä voitiin jo käyttää rautateiden ja kanaalien rakennuspaikkojen määrittämisen apuna tai tuonnin ja viennin välisen suhteen ymmärtämiseen. Hyvä esimerkki tämän tyyppisestä hyödyntämisestä on Charles Joseph Minardin (1781 1870) kaavio tavarakaupasta Canal du Centrellä. (Friendly 2008, s.12-13) (Kaavio 3) Kaavio 3 (Friendly 2008, s. 13) 4
1800-luvun puoliväliin mennessä valtiollisia tilastotieteellisiä virastoja oli perustettu ympäri Eurooppaa. Numeerisen informaation merkitys tunnustettiin jokaisella hallinnon alueella. (Friendly 2009, s. 20) Vuosisadan loppupuolta voidaankin kuvata jopa kultaiseksi aikakaudeksi, jolloin kehitystä tapahtui jatkuvasti. Useampien muuttujien visualisointia samalla kaaviolla oli yritetty aikaisemminkin, mutta 1800-luvun loppupuolella tässä onnistuttiin uudella tavalla, kun useat tilastotieteilijät loivat kolmiulotteisia pintakaavioita. (Friendly 2008, s. 14) Esimerkiksi Luigi Perozzon laatima kolmiulotteinen pintakaavio Ruotsin väkiluvusta vuosilta 1750 1875 jaoteltuna vuoden ja ikäryhmän mukaan. (Kaavio 4) (Friendly 2009, s. 24) Kaavio 4 (Friendly 2009, s. 24) Nykyaikainen visualisointi Visualisointien kehityksen 1800-luvun jättiharppaukset eivät saaneet jatkoa enää 1900-luvun alussa. Vuosisadan alkupuoliskolla arvostettiin eniten todella tarkkaa numeerista dataa. Kuvilla oli vaikeaa esittää arvojen eroja kahden tai kolmen desimaalin tarkkuudella, joten monet tilastotieteilijät alkoivat pitää kaavioita lähinnä kauniina kuvina, joilla ei pystynyt esittämään tarkkoja faktoja. Vaikka visualisoinnissa ei nähty suuria innovaatioita tai sen arvostus ei noussut, kaaviot pääsivät valtavirtaan ja niiden käyttö yleistyi. (Friendly 2008, s. 20-21) Todellista kehitystä visualisoinnissa alkoi tapahtua 1900-luvun puolivälin jälkeen. Kehittyneimmät kaavioiden käsin piirtämiseen kehitetyt tekniikat olivat alkaneet jo unohtua, mutta tietotekniikan kehitys toi datan käsittelyyn ja graafiseen esittämiseen aivan uusia mahdollisuuksia. Viimeisimmät kehitysaskeleet ovat myös tulleet niin nopeassa tahdissa ja 5
laajoilla aloilla, että niistä on vaikeaa nostaa esille tiettyjä erityisen merkityksellisiä virstanpylväitä. (Friendly 2009, s. 27-35) Kuitenkin viime vuosikymmenten kehitystä voidaan kuvailla seuraavilla teemoilla: interaktiiviset tilastolliset järjestelmät, uudet mahdollisuudet visuaalisen datan manipuloinnissa, uudet menetelmät moniulotteisen datan visualisointiin ja huomattavasti aiempaa suurempi ihmisen havainnointi- ja kognitiivisten kykyjen huomiointi visualisoinnin suunnittelussa. (Friendly 2008, s. 24) Uutta ovat esimerkiksi uutisotsikoiden, blogeista kerättyjen tunneilmauksien ja erilaisten aihepiirien yhteyksien reaaliaikainen visualisointi. (Friedman 2007) We Feel Fine projektin ohjelmisto kerää päivittäin 15 000 20 000 tunneilmausta tietokantaansa, jota voi analysoida kaikille avoimella appletilla. Tällä työkalulla pystytään esimerkiksi analysoimaan, mitä ihmiset tuntevat minäkin päivänä tai mitkä kaupungit ovat maailman onnellisimpia. (Harris, Kamvar 2006) Toinen varmasti maininnan arvoinen toimija on ruotsalainen säätiö Gapminder, jonka toiminnan näkyvin osa on selaimessa toimiva animoitu ja interaktiivinen visualisointiohjelma Gapminder World. Ohjelmisto on myyty Googlelle, mutta säätiö jatkaa tilastojen keräämistä ja pyrkii tuomaan tilastolliset tiedot esiin uudesta näkökulmasta. (About Gapminder - Our mission) Kaavio 5 (http://www.gapminder.org/world/) 6
Yhteenveto Kovin moni ei varmastikaan tule ajatelleeksi, että käyttäessään taulukkolaskentaohjelman peruskaavioita hyödyntää lähes samanmuotoista visualisointia, jota käytettiin jo satoja vuosia sitten. Olisikin siis mahdollista ajatella, että yleisesti käytetyt kaaviot ovat kehittyneet todella hitaasti tai eivät lainkaan. Informaation visualisoinnissa yksinkertaisuus ja ymmärrettävyys ovat kuitenkin ensiarvoisen tärkeitä. Visualisoinnista ei ole hyötyä, jos se on liian monimutkainen ymmärrettäväksi. Ymmärrettävyyttä helpottaa myös, jos kaavioiden muoto on ennestään tuttu. Tästä syystä tietyt peruskaaviot ovatkin vakiintuneet yleiseen käyttöön. Historiallisesti informaation visualisointiin ovat kuuluneet tilastotieteilijöiden kaaviot ja temaattiset kartat. Tietokoneiden suorituskyvyn kehittyminen ja tietovirran jatkuva kasvu Internetissä luovat pohjan täysin uudenlaiselle tiedon visualisoinnille. Aikaisemmin visualisoinnin luomista varten täytyi lähes aina aktiivisesti kerätä ja tilastoida tietoa, kun nykyisin tämän työn tekevät usein automaattisesti tehtävänsä hoitavat sovellukset, jotka tarkkailevat esimerkiksi ihmisten käyttäytymistä verkossa tai verkon sisältöä. Tiedon keräämisen lisäksi tietotekniikan vahvuus on tiedon esittämisessä. Kun aikaisemmin visualisoinnissa rajoitteena oli staattinen paperi, niin nykyisin rajoitteet ovat lähes olemattomia aikaisempaan verrattuna. Tekniikan kehityksen myötä rajoitteita poistuu edelleen. Onkin siis mahdotonta ennustaa, millaista visualisointia hyödynnämme tulevaisuudessa. Todennäköisesti tutut palkki- ja viivakaaviot eivät kuitenkaan ole lähtemässä taulukkolaskentaohjelmista ja esityskalvoista vielä vuosiin. 7
Lähteet About Gapminder - Our mission [Gapminder], [Online]. Saatavilla: http://www.gapminder.org/about-gapminder/our-mission/, Haettu: [17.3.2010]. Käsitteet ja määritelmät - Teemakartta [Tilastokeskus], [Online]. Saatavilla: http://www.stat.fi/meta/kas/teemakartta.html, Haettu: [16.3.2010]. Card, S.K., Mackinlay, J.D. & Shneiderman, B. 1999, Readings in information visualization : using vision to think, Morgan Kaufmann, San Francisco CA. Friedman, V. Päivitetty: 2.8.2007, Data Visualization: Modern Approaches. Saatavilla: http://www.smashingmagazine.com/2007/08/02/data-visualization-modernapproaches/, Haettu: [14.3.2010]. Friendly, M. Päivitetty: 24.8.2009, Milestones in the history of thematic cartography, statistical graphics, and data visualization. Saatavilla: http://www.math.yorku.ca/scs/gallery/milestone/milestone.pdf, Haettu: [11.3.2010]. Friendly, M. 2008, "A Brief History of Data Visualization", Springer handbooks of computational statistics: Handbook of data visualization, toim. C. Chen, W. Härdle & A. Unwin, Springer, Berlin ; London, s. 15-56. Saatavilla myös: http://www.math.yorku.ca/scs/papers/hbook.pdf. Harris, J. & Kamvar, S. Päivitetty: 2006, mission [We Feel Fine], [Online]. Saatavilla: http://www.wefeelfine.org/mission.html, Haettu: [17.3.2010]. 8