Measuring political landscape by voting advice applications a unique opportunity for big data collection on political parties and voters Teemu Kemppainen Tuomas Ylä-Anttila Tilastotieteen seminaari / J. Alho 10.2.2016
Part 1: Basic development Municipal elections 2012
Background Tuomas Ylä-Anttila and HS had already developed an early version of vaalikone in 2011 I suppose We developed it further in close co-operation with HS (Esa Mäkinen) Why unique? vote advice applications found elsewhere as well http://www.euvox2014.eu, http://www.euprofiler.eu (2009) but often based on expert surveys (party data)
Early ideas 1 Dimension 1: left-right or economic policy merit & income differences (ESS4) services and taxes (ESS4) unemployment & decommodification (ESS4) municipalities & privatisation (HS) Theoretical interpretation for this dimension to be decided a priori narrow: only concrete economic policy issues wider: also e.g. attributions for the causes of individual successes and failures frames of mind
Early ideas 2 Dimension 2: values & conservatism family, army, immigration, homosexuality, criminal justice, religion... Dimension 3: Green, environment About methodology factoring item formulations Likert type: DK out of the scale, and a genuine neutral in the middle
Pilot, spring 2012 HS organised respondents the group was naturally biased a time-span of one month or so we were able to adjust and make experiments on the run distributions, alpha, factoring choice of items for the poll machine balancing content validity, univariate variance, clear covariance structure, and reliability Next: responses by candidates, 3rd October 2012, (n=3946)
Final items: economic policy 1. Kotikuntani palveluita tulisi ulkoistaa entistä enemmän yksityisten yritysten tuotettavaksi. 2. Jos kunnassani tulee eteen tilanne, jossa on välttämätöntä joko leikata kunnallisia palveluita ja sosiaalietuuksia tai korottaa veroja, veronkorotukset ovat parempi vaihtoehto. 3. Suuret tuloerot ovat hyväksyttäviä, jotta erot ihmisten lahjakkuudessa ja ahkeruudessa voidaan palkita. 4. Nykyisen kaltaiset kunnalliset palvelut ja sosiaalietuudet ovat pitemmän päälle liian raskaita julkiselle taloudelle.
Correlations: economic policy
Final items: values 5. Kotikuntani päätöksenteossa pitää vaalia perinteisiä suomalaisia arvoja. 6. Eduskunta hyväksyi vuonna 2009 lain, joka mahdollistaa parisuhteensa rekisteröineille homo- ja lesbopareille perheen sisäisen adoption. Pitäisikö homo- ja lesboparien saada oikeus myös perheen ulkopuoliseen adoptioon? 7. Jos valtio tarjoaa maahanmuuttajien vastaanottokeskuksen perustamista kotikuntani keskustaan, tarjous pitää hyväksyä. 8. Kouluissa kohdellaan koululaisia liian lepsusti. Tiukempi kuri tekisi kouluista parempia
Correlations: values
Final items: green 9. Talouskasvu ja työpaikkojen luominen tulisi asettaa ympäristöasioiden edelle, silloin kun nämä kaksi ovat keskenään ristiriidassa. 10. Kaikessa kotikuntani päätöksenteossa pitäisi arvioida vaikutukset ympäristöön ja tarvittaessa luopua ympäristölle haitallisista hankkeista.
Correlation: green
Extracting latent variables Manual sum Manual sum + jitter Factor (all items) Factor (dimension by dimension) - Balancing - reliability, - simplicity (HS readers) - readability (jitter?) - the possibility for interdimension correlation (cf. Varimax)
Scatters 1: Center alpha:.68 alpha:.74
Scatters 2: True Finns
Scatters 3: Greens
Scatters 4: Left and right
Published image (HS 14.10.12) Correlation of the dimensions not taken into account in the visualisation... cf. orthogonal rotation which we did not want to use
Part 2: 2014 elections (EU) and latent class analysis
Idea & procedure To test the possibilities of LCA with our data Euro-election parties For semi-entertaining purposes (HS article) Procedure learning about the method (run in R) tests with smaller data (ESS) final models: interpreting them together consulting experts (bringing a bit of peer-review into data journalism)
Items: EU & our general items euhyva Suomen jäsenyys EU:ssa on hyvä asia. komiss Suomen komissaari pitäisi valita suoralla kansanvaalilla. eupar Europarlamentilla on liian vähän valtaa euliikaa Suomi maksaa liikaa EU-jäsenmaksua. euilm EU:n ei pidä asettaa sitovia ilmastomääräyksiä uusituvalle energialle. Pelkkä kasvihuonekaasujen vähennystavoite riittää. jousto Jos työllisyyttä halutaan parantaa, eurooppalaisilla työmarkkinoilla pitää lisätä joustoja. gmo Geenimuunneltuja ruokakasveja pitäisi saada kasvattaa EU:ssa nykyistä vapaammin. EU:n pitää kieltää kännyköiden roaming- eli verkkovierailumaksut, jolloin EU:n sisäisissä puheluissa olisi sama hinta kaikkialle, eupuh vaikka samalla tämä heikentäisi operaattorien kykyä investoida nopeampiin verkkoyhteyksiin. eumuutto EU:n pitää rajoittaa muuttoa EU-alueelle. Suomalaisten pitää saada terveydenhoitoa missä tahansa EU-maassa, vaikka se tarkoittaa että vastaavasti EU-kansalaiset saavat tulla terv hoitoon Suomeen. euarm EU:n kannattaa luoda joukoistaan selvemmin yhteinen armeija eikä pitää kansallisesti rahoitettuja joukkoja erikseen joka maassa. nato Suomen tulisi liittyä puolustusliitto Naton jäseneksi. turkki Turkkia ei pidä ottaa EU:n jäseneksi, vaikka se täyttäisikin jäsenkriteerit. russia EU:n tulisi pitkällä tähtäimellä pyrkiä eroon Venäjältä toimitetusta energiasta. hadopt Homo- ja lesbopareilla pitää olla samat avioliitto- ja adoptio-oikeudet kuin heteropareilla. turvap Jos valtio tarjoaa turvapaikanhakijoiden vastaanottokeskuksen perustamista kotikuntaani, tarjous pitää hyväksyä. kuri Kouluissa kohdellaan koululaisia liian lepsusti. Tiukempi kuri tekisi kouluista parempia. perarv Perinteiset arvot - kuten koti, uskonto ja isänmaa - muodostavat hyvän arvopohjan politiikalle. yks Julkisia palveluita tulisi ulkoistaa entistä enemmän yksityisten yritysten tuotettavaksi Jos tulee eteen tilanne, jossa on välttämätöntä joko leikata julkisia palveluita ja sosiaalietuuksia tai korottaa veroja, verokor veronkorotukset ovat parempi vaihtoehto. tuloero Suuret tuloerot ovat hyväksyttäviä, jotta erot ihmisten lahjakkuudessa ja ahkeruudessa voidaan palkita. raskas Nykyisen kaltaiset palvelut ja sosiaalietuudet ovat pitemmän päälle liian raskaita julkiselle taloudelle. talvihr Talouskasvu ja työpaikkojen luominen tulisi asettaa ympäristöasioiden edelle, silloin kun nämä kaksi ovat keskenään ristiriidassa. vihr Kaikessa päätöksenteossa pitäisi arvioida vaikutukset ympäristöön ja tarvittaessa luopua ympäristölle haitallisista hankkeista. euvote Suomessa tulisi järjestää kansanäänestys EU-jäsenyyden ehdoista samaan tapaan kuin Britanniassa aiotaan tehdä. euro Suomen olisi parasta laatia pitkän ajan suunnitelma ja irrottautua eurosta. maatal Maatalouden tukemista EU:n varoin pitäisi vähentää. kreikka Kreikalle ei pidä enää myöntää yhtään tukilainoja, vaikka maa uhkaisi ajautua maksukyvyttömyyteen. sosraj Jäsenmaiden pitäisi voida rajoittaa työttömyysturvan tai lapsilisän kaltaiset etuudet vain oman maan kansalaisille. rusviis Venäläisille tulisi antaa viisumivapaus EU-maihin.
(Almost) Big Data 67 541 respondents Biased group Metropolitan region HS-readers etc... But then again: so is the group of voters.. Likert-type scale -> recoded agree / neutral / disagree Data exploration and description by LCA theoretical assumption: there are a few number of latent traits that predict how people react to our survey items on values and EU policy
Package polca exploratory LCA http://cran.rproject.org/web/packages/polca/polca.pdf Linzer & Lewis: polca: An R Package for Polytomous Variable Latent Class Analysis http://www.jstatsoft.org/v42/i10/paper
Number of classes Balancing parsimony & fit: BIC We run models from 1 to 30 classes and BIC was of no help in determining the number Reasoning together from the substance point of view
Conditional response probabilities for all solutions from 2 8 an arbitrary upper cut analysis and interpretations on the basis of CRP s the article follows this logic from 2 to 5 classes Miettinen, Mäkinen & Pylväs: HS 25.5.2014 snapshots taken from this text
Two parties Left liberal values taxes up pro-eu contra-nato Right liberal and conservative values economic austerity more positive towards NATO
Three parties LIVV (liberaalit vasemmisto-vihreät) Oikeisto liberal values KOPU conservative values
Final thoughts Interaction between journalists and Academia Peer-review into data journalism Serious measurements...and some humour and entertainment
...but what kind of data is this? 1) (Virtually) all respondents (candidates) 2) A self-selected sample (lay users) Neither is a classic random sample in any meaningful sense...the development of response rates future is something else than random sample studies How to think about this kind of data? description of the data is easy (1 & 2) description of the population is easy (1) and difficult (2) But what else? What is the meta-analytical framework that will have to be established sooner or later? How long can we wait for the lower and lower response rates? And continue with the classic inference approach?
Thank you! 1) (Virtually) all respondents (candidates) 2) A self-selected sample (lay users) Neither is a classic random sample in any meaningful sense...the development of response rates future is something else than random sample studies How to think about this kind of data? description of the data is easy (1 & 2) description of the population is easy (1) and difficult (2) But what else? What is the meta-analytical framework that will have to be established sooner or later? How long can we wait for the lower and lower response rates? And continue with the classic inference approach?