Visualisointi kansanedustajista neljässä eri ulottuvuudessa



Samankaltaiset tiedostot
Laskennallinen data-analyysi II

Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi

Tehtävä 1: Veroprosentti

Paikkatiedon käsittely 11. Suuren mittakaavan

Arvioi vastaustesi pistemäärät arvosteluohjeiden mukaisesti. Huomaa, että kaikkia asioita ei pidä aina mainita.

Daniel Valtakari. TEK vaalit 2014

KYSELYLOMAKE: FSD2627 EDUSKUNTAVAALIT 2011: EHDOKKAIDEN JA VAALIKONEEN KÄYTTÄJIEN VASTAUKSET VAPAA-AJATTELIJAIN LIITON VAALIKONEESEEN

DEMOKRATIAINDIKAATTORIT 2015

PORVOOLAISTEN NUORTEN ÄÄNESTYSAKTIIVISUUSKYSELY

TUTKIMUSOSIO Julkaistavissa klo 00:01. Puoluekartta: Oikeistossa kuusi, keskusta-oikeistossa kaksi ja vasemmistossa kolme puoluetta

Sosiaalinen media. Havaintoja eduskuntavaalien kampanjasta ja pohdintoja koskien presidentinvaaleja

Paretoratkaisujen visualisointi

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Talousmatematiikan perusteet: Luento 14. Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu

Vaalikysely. 1. Minkä puolueen kunnanvaltuutettuna toimitte? 2. Kotikuntanne asukasmäärä. 3. Vastaajan sukupuoli. Vastaajien määrä: 80

Ilmoitus ehdokkaan vaalirahoituksesta

Vaalikone.fi API Presidentinvaalit 2012

Paretoratkaisujen visualisointi. Optimointiopin seminaari / Kevät 2000 Esitelmä 11 Petteri Kekäläinen 45305L

Laskennallinen data-analyysi II

1 Kannat ja kannanvaihto

piraattipuolue PIRAATTIPUOLUE-KYSELY

YHTEISKUNTAOPPI 9. LUOKKA: POLITIIKKA JA PUOLUEET

Maakuntavaalit HE 15/2017 vp maakuntalakiesitys

Oma nimesi Tehtävä (5)

Muutosvaalit Suomen vaalitutkimuskonsortio

Matematiikan tukikurssi

YH1 kurssin kertaus. Vallan kolmijakoteoria ja sen toteuttajat Suomessa. Kansalaisen oikeudet ja velvollisuudet. Tasavallan presidentin valinta

Laskennallinen data-analyysi II

VALTIONTALOUDEN TARKASTUSVIRASTON YLEISOHJEET JÄLKI-ILMOITUKSEN TEKE- MISESTÄ VUODEN 2011 EDUSKUNTAVAALEISSA

SAKSAN VAALIT 2017 TULOS & IMPLIKAATIOT

Uudenmaan vaalipiirin kansanedustajien ja kuntajohtajien tapaaminen

Talousmatematiikan perusteet: Luento 13. Rajoittamaton optimointi Hessen matriisi Ominaisarvot ja vektorit Ääriarvon laadun tarkastelu

Määrällisen aineiston esittämistapoja. Aki Taanila

Tasavallan presidentin vaali

Esimerkki 1: auringonkukan kasvun kuvailu

Ortogonaaliset matriisit, määritelmä 1

EDUSKUNTA EHDOKAS VAALIT ÄÄNESTÄÄ VAALIUURNA VAALI- KUNTA- VALVO- KAMPANJA ÄÄNIOIKEUS OIKEUS VAALI LEIMA POLIITTINEN KAMPANJOIDA

Ajankäyttötutkimuksen satoa eli miten saan ystäviä, menestystä ja hyvän arvosanan tietojenkäsittelyteorian perusteista

Sipoon Sanomat on Sipoon ykköslehti, sillä millään muulla lehdellä ei ole yhtä suurta levikkiä Sipoossa.

Kysely tutkijoiden asiantuntijaroolissa saamasta palautteesta. Tulosten käyttö

Sisällysluettelo ja ohjeet tilastojen tulkintaan (osa 1) 1.1 Esittelee kyselyn tulokset kokonaisuudessa

KUNTIEN JA HUS:N ASIAKAS- JA POTILASTIETOJÄRJESTELMÄN HANKINTA

Ilmoitus ehdokkaan vaalirahoituksesta

Euroopan parlamentti päätöksenteko ja vaikuttaminen. Syksy 2013 Pekka Nurminen Euroopan parlamentin Suomen-tiedotustoimisto

Mitä murteita Suomessa onkaan?

TUTKIMUSOSIO Julkaistavissa

Presidenttiehdokkaiden ideologiset etäisyydet

Puolueen nimi. Lehtiä yht. (5) Nimi (Sukunimi ensin) Henkilötunnus 1) Arvo, ammatti, toimi (Enintään kaksi ilmaisua) Kotikunta. Kotikunta.

Muuttujien määrittely

Turvallisuuskysely. Erikoissuunnittelija Markus Alanko, rikoksentorjuntaneuvoston sihteeristö

Käyttäjäystävällinen tapa saada luotettavaa tietoa yhteiskunnan kehityksestä. FT Ulla Rosenström Politiikka-analyysiyksikkö Valtioneuvoston kanslia

TURVALLISUUS JA KOETUT UHKATEKIJÄT (%).

Symmetriaryhmät ja niiden esitykset. Symmetriaryhmät, /26

Äänestys. Sähköisen äänestyksen pilotti. Luokkamalli. Government. Versio 1.4H Julkinen (8) Luokkamalli

Ilmoitus ehdokkaan vaalirahoituksesta

Sähköisen äänestyksen pilotti

EU-päätöksenteko toimittajan näkökulmasta. Pekka Nurminen Kevät 2013

JHL:n jäsenet kansanedustajina

SUOMALAISTEN SUHDE PUOLUEISIIN. Epäusko puolueiden aikaansaannoksiin on lisääntynyt

Laskennallinen data-analyysi II

Ilmoitus ehdokkaan vaalirahoituksesta

Ilmoitus ehdokkaan vaalirahoituksesta vuoden 2008 kunnallisvaaleissa

SISÄLLYS. N:o 750. Oikeusministeriön päätös. eduskuntavaaleissa käytettävien ehdokasasettelulomakkeiden kaavoista

PIRAATTIPUOLUE PUOLUEOHJELMAN MUUTTAMINEN

Eduskuntatyön erityispiirteistä

Tehtäväsarja I Kertaa tarvittaessa materiaalin lukuja 1 3 ja 9. Tarvitset myös luvusta 4 määritelmän 4.1.

Seurakuntavaalit 2018

Valmistautuminen kampanjointiin. Minustako ehdokas?

3.4 Käänteiskuvauslause ja implisiittifunktiolause

MISSÄ ASUN? Katu? Kaupunginosa? Kunta? Kaupunki? Maakunta? Maa?

Kuntaliiton valtuuskunnan valinta vuonna 2017

Kuntaliiton valtuuskunnan valinta vuonna Riitta Myllymäki

Mediaseuranta & tiedotejakelu:! PR kolikon kääntöpuolet? Koodiviidakko Oy

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

FSD2412. Kansanedustajien vaalirahoitus Koodikirja

Äänestystutkimus. Syksy 2006

Ilmoitus ehdokkaan vaalirahoituksesta

Neljännes kansalaisista luottaa hallituksen kykyyn hoitaa maan asioita

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Kyselyn tuloksia. Kysely Europassin käyttäjille

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Sovelluksia additiivisen arvofunktion käytöstä projektiportfolion valinnassa

Tekoäly ja koneoppiminen metsävaratiedon apuna

Käytöskyselyn käyttöominaisuuksia koskevan osuuden analysointia:

Eduskuntavaalit

LIITE 2: Kyselylomake

Valmistelija/lisätietojen antaja: Hallintopäällikkö Matleena Mikkonen puh tai sähköposti

Osallistumista, kuulemista, vuorovaikutusta..

HSY Avoin data. Henna-Kaisa Räsänen Kaupunkisuunnittelulla parempaa ilmanlaatua ja ilmastoa

Uusien kanavien haasteet ja mahdollisuudet mediaviestinnässä. Kasper Stenbäck Johtaja, verkko ja teknologiat Cocomms Oy

JAKSO 2 KANTA JA KOORDINAATIT

Osallistumista, kuulemista, vuorovaikutusta..

Linked Events. Helsingin tapahtumarajapinta. Aleksi Salonen

Ilmoitus ehdokkaan vaalirahoituksesta

Ortogonaalinen ja ortonormaali kanta

Tämä dokumentti on tehty pohjaan Muistiopohja_logolla.ott

Tietokoneohjelmien käyttö laadullisen aineiston analyysin apuna

2.8. Kannanvaihto R n :ssä

HY / Avoin yliopisto Lineaarialgebra ja matriisilaskenta II, kesä 2015 Harjoitus 1 Ratkaisut palautettava viimeistään maanantaina klo

Transkriptio:

Visualisointi kansanedustajista neljässä eri ulottuvuudessa Jaakko Talonen talonen.dm@gmail.com

Johdanto Helsingin Sanomat julkaisi eduskuntavaalien 2011 vaalikoneensa avoimena tietona. Vaalikoneen tietojen julkaiseminen mahdollisti HS:n ulkopuolisten koodarien, graafikoiden ja toimittajien pääsemisen käsiksi ehdokkaiden vastauksiin. Journalismin perustehtävä on tiedon välittäminen ja valtaa pitävien tarkkaileminen. Tiedot julkistetiin [Creative Commons] -lisenssillä Nimeä-epäkaupallinen-tarttuva 3.0. http://creativecommons.org/licenses/by-nc-sa/3.0/ [hs-julkaisee-vaalikoneensa-avoimena-tietona-ennenvaaleja]. 2/22

Johdanto: Politiikka tutuksi tilastotieteen avulla Avoin poliittinen data + Tilastotiede = Parempi Demokratia. Kuka tahansa saa visualisoinnin avulla nopeasti ja helposti kokonaiskuvan siitä, millä arvoilla ja ketkä kansaa edustaa Arkadianmäellä. Hans Roslingin kehittämä sovellus mahdollistaa muuttujien vertailemisen internet-selaimella. TED konferista videopätkä: Hans Rosling näyttää parhaat koskaan näkemänne tilastot. Suomenkielinen tekstitys saatavilla. 3/22

Johdanto: visualisointi antaa vastauksen mm. seuraaviin kysymyksiin Vuoden 2011 eduskuntavaaleissa oli yli 2000 ehdokasta. Lähes samankaltaisia ehdokkaita oli edustettuna eri puolueissa. Erosiko valitut kansanedustajat toisistaan ja miten? Äänestäjän on vaikea hahmottaa sitä, mikä puolue edustaa parhaiten hänen kantaansa. Onko puolueissa eroja? Missä aihepiireissä? Onko talous-aihepiirin vastauksilla ja vasemmisto-oikeisto -akselin välillä riippuvuutta? Korreloiko yhtiörahoituksen määrä ja esimerkiksi talouteen liittyvät vastaukset? 4/22

Data: lähteet Visualisoinnissa käytettiin useita eri tietolähteitä ja menetelmiä. Tärkein yksittäinen tietolähde analyysin kannalta oli HS:n julkaisema vaalikonedata: [HS-vaalikone2011.xls]. Datassa oli kuitenkin puutteita, joita paikattiin eri lähteistä: A. Poikola yhdisteli HS:n dataa oikeusministeriön dataan: [Ehdolla.org] vaalitulos: [Vaalit.fi] ja ministerit sekä suuren valiokunnan jäsenet osoitteesta: [Eduskunta.fi]. HS oli koonnut vaalirahoitusdatan yhteen tiedostoon: [280-kaikki-ilmoitukset-rahoitusmuodossa.xls]. 5/22

Data: luokittelu Data luokiteltiin viiteen eri ryhmään: (A) aihepiirimuuttujat: Aihepiirin kysymyksiin samalla tavalla vastanneiden kansanedustajien pisteytys on lähellä toisiaan. (I) numeerinen informaatiomuuttujat: ikä ja äänimäärä. (HS) vaalikonedatasta laskettu muuttuja: yksittäisestä luvusta voidaan jo tehdä päätelmiä. (L) luokkamuuttuja: Tämä voidaan valita vain ulottuvuuteen väri. (e) vaalirahoitukseen liittyvä muuttujat. 6/22

Data: HS oli jaotellut kysymykset yhdeksään eri aihepiiriin Vaalikoneessa oli yhteensä 31 kysymystä eri aihepiireistä: (yleiset) Kysymykset 1-5, Eläkkeet 6-8, Talous 9-11, Verot 12-15, Puolustus 16-17, Ulkomaat 18-21, Kotimaa 22-26, Kunnat 27-30, Hallituspohja 31. 7/22

HS datan jalostaminen aihepiirimuuttujiksi Vaalikoneen jokainen vastausvaihto edustaa matriisissa X saraketta. Sarakkeita painotettiin kunkin kysymyksen vastausvaihtoehtojen lukumäärällä sekä ehdokkaan antaman painotuksen perusteella. Tämän jälkeen matriisi X b projisoitiin suoralle aihepiireittäin. Tämä helpottaa huomattavasti esimerkiksi vaalirahoitusdatan vertailemista mielipiteisiin. Yksittäinen aihepiirimuuttujan arvo ei vielä sisällä mitään informaatiota. Lähellä olevat arvot viittaavat siihen, että kansanedustajat vastasivat samalla tapaa aihepiirin kysymyksiin ja ääriarvot suurista eroista mielipiteissä. Muuttujan luotettavuutta on arvioitu käyttämällä merkintää "x/100"visualisoinnin aihepiirimuuttujissa (A). Lopuksi vastaamatta jättäneet ehdokkaiden aihepiirimuuttujat estimoitiin puolueen ehdokkaiden vastauksien perusteella. 8/22

Datan analysointi: pääkomponenttianalyysi Pääkomponenttianalyysi (engl. Principal components analysis, PCA) on dimension redusointitekniikka. Pääkomponenttianalyysin tavoitteena on löytää monidimensioisesta datasta ne komponentit, joiden avulla sen keskeisimmät piirteet voidaan esittää ilman, että merkittävää informaatiota menee hukkaan. [Pääkomponenttianalyysi]. Pääkomponenttianalyysin avulla kukin moniulotteinen aihepiiridata projisoitiin suoralle. Lisäksi vastausmatriisi X b projisoitiin 173-ulotteisesta avaruudesta tasoon. Visualisoinnissa muuttujat on merkitty HS: kaikki kysymykset 1.komp. ja 2.komp.. 9/22

Datan analysointi: pääkomponenttianalyysi Vastausdata projisoituna tasoon. Interaktiivisessa visualisoinnissa käyttäjä voi tarkastella kansanedustajia vaihtamalla koordinaatistoa, väriä ja palluran kokoa. 10/22

Datan tarkempi analysointi: taulukko Kansanedustajien vastauksia voi tarkastella visualisoinnin alla olevasta taulukosta. Vaalikoneessa oli mahdollisuus painottaa vastaustaan ja se on merkitty taulukkoon seuraavasti: (-) pieni ja (+) suuri merkitys. Lähellä toisiaan olevat aihepiirimuuttujat (A) vastaavat samankaltaisia kansanedustajien vastauksia. 11/22

Muiden tekemiä analyysejä mukana visualisoinnissa Mielenkiintoisia analyysejä voidaan tehdä yhdistelemällä datan lisäksi myös muiden tutkijoiden tuloksia. Tuomas Yli-Anttila arvioi ehdokkaiden konservatiivisuutta. [HS blogi] Martti Leppänen laski ehdokkaiden sijainnit vasemmisto-oikeisto sekä restriktiivi-liberaali koordinaatistossa. Visualisointi ja laskentatapa löytyy täältä: [Leppänen]. Leppäsen HS-vaalikoneen vastausten pisteytystaulukko: [konsensuspisteet.pdf]. 12/22

Muiden tekemiä analyysejä mukana visualisoinnissa: Yli-Anttila Tämän mittarin perusteella näyttää siltä, että konservatiiviset kansanedustajat jäivät oppositioon. 13/22

Muiden tekemiä analyysejä mukana visualisoinnissa: Leppänen Hallitus ja oppositio ovat melko samankaltaisia. Hallituksen sisällä näyttäisi olevan ristiriitoja, sillä kansanedustajia on restriktiivi-liberaali akselin ääripäissä. 14/22

Kaikki ehdokkaat Pääkomponenttianalyysin ja Leppäsen koordinaattiakselien parivertailu. Ensimmäinen pääkomponentti korreloi vasemmisto-oikeistoakselin kanssa. 15/22

Kaikki ehdokkaat Ehdokkaiden riippuvuutta komponentti- ja Martti Leppäsen määrittelemillä akseleilla vertailtiin. Johtopäätös: Komponenttiakselit ovat hyödyllisiä, kun halutaan tutkia sitä, keillä ovat erilaiset ja samanlaiset arvot, sillä pääkomponenttianalyysi perustuu suurimman varianssin suuntaan. Ehdokkaiden sijainti suhteessa toisiin ehdokkaisiin ovat melko samantyyppiset molemmissa koordinaatistoissa. Komponenttiakselit voidaan laskea mihin kysymyksiin tahansa. Tulkinta hankalampaa, mutta ei mahdotonta. Toisaalta tulkinnan kannalta Leppäsen laskemat mittarit ovat mielekkäämmät. 16/22

Menetelmien jatkojalostus Visualisointia varten Leppäsen laskemat mittarit painotettiin ehdokkaiden antamien painotusten perusteella. pieni merkitys: kerroin 0.5. suuri merkitys: kerroin 1.5. Koordinaatiston akselit skaalattiin asettamalla vasemmistolaisin ehdokas pisteeseen -100, oikeistolaisin ehdokas pisteeseen 100, restriktiivisin ehdokas pisteeseen -100, liberaalein ehdokas pisteeseen 100. Saadaan vastaus esimerkiksi kysymykseen: Kuinka liberaali kansanedustaja? 17/22

Esimerkki: Kuinka liberaali kansanedustaja? Kimmo Sasi on 67% restriktiivi ja Markus Mustajärvi on 64% liberaali. Tämän liberaalimmat ja restriktiivimmät eivät tulleet valituksi, ks. [Leppäsen visualisointi]. 18/22

Vasemmisto-oikeisto vs. yhtiörahoitus Kokoomuksen ja Keskustan kansanedustajat saivat eniten yhtiörahoitusta. 19/22

approksimointi HS:n vaalikoneeseen antoi vastauksia 1820 ehdokasta. Vastaamatta jättäneiden ehdokkaiden vastaukset approksimoitiin. Kansanedustajat, jotka eivät vastanneet HS:n vaalikoneeseen on merkitty *:llä. Heidän sijaintinsa vasemmisto-oikeisto sekä restriktiivi-liberaali akseleilla (HS) on approksimoitu puolueen kansanedustajien ja vaalipiirin perusteella. Heidän sijaintinsa komponentti- ja aihepiiriakseleilla (A) on approksimoitu puolueen ehdokkaiden ja äänimäärän perusteella. 20/22

approksimointi Kansanedustajat, jotka eivät vastanneet HS:n vaalikoneeseen on merkitty *:llä. 21/22

Politiikan ja tilastotieteen ilosanoma! Tutustu kansamme edustajiin ja siirry visualisointiin: Visualisointi kansanedustajista 22/22