GOOGLE DATA WORKSHOP MIHIN GOOGLE DATAA VOI KÄYTTÄÄ JA MITÄ SE KÄYTÄNNÖSSÄ TARKOITTAA? SOSTE, 4 SEPT 2015 JOONAS TUHKURI, ETLA, THE RESEARCH INSTITUTE OF THE FINNISH ECONOMY AND THE UNIVERSITY OF HELSINKI
BIG DATA
BIG DATA 20 000 ekr 2003 jkr : 5 EB informaatiota. 1 Tänään ja eilen saman verran. 2 1 Google 2010 EB = exabyte = 1.1529215 10 18 bytes 2 IBM 2014
BIG DATA Google Flu Trends The Billion Prices Project UPS NSA
30 M
Google Trends työkalu maailmalla
ESIMERKIT Työttömyys (Varian & Choi 2012, Askitas & Zimmerman 2009 yms.) Asuntomarkkinat (Brynjolfsson & Wu 2013) Myynti (Goel et al 2010, PNAS) Makromuuttujat (Koop & Onorante 2013) Luottovaikeudet (Askitas & Zimmerman 2013) Osakekurssit (Preis et al 2013) Kulutus (Vosen & Schmidt 2012) Influenssa (Ginsberg et al. 2009, Nature) Rasismi (Stephens-Davidowitz 2014, JOLE) Media (Kearney & Levine, 2014)
Ensimmäistä kertaa Suomessa: hakudata talouden kehityksen ennustamisessa
TYÖTTÖMYYS Työttömysaste (%) 4 6 8 10 12 2004m1 2006m1 2008m1 2010m1 2012m1 2014m1 Aika
GOOGLE INDEX Työttömyysaste (%) 4 6 8 10 12 20 40 60 80 100 Google Index 2004m1 2006m1 2008m1 2010m1 2012m1 2014m1 Aika Työttömyysaste Google Index
TULOKSET 1. Nykyhetki: Nykyhetken ennuste parantui 10,0 %* 2. Tulevaisuus: 3 kk ennuste parantui 39,2 %* 3. Käännekohdat: Tarkennus erityisesti käännekohdissa *Vertailukohtaan nähden
ETLAnow
ETLAnow h"ps://www.etla.fi/en/etlanow- eu28/ Username and password: etlanow2015
GOOGLE DATA Googlea käytti 4/2014 suomalaisista internetinkäyttäjistä 96% 1 Internetiä käytti 2013 16-74 vuotiaista suomalaisista 92% 2 1 comscore MMX, Finland, Age 15+, April 2014 2 Väestön Jeto- ja viesjntätekniikan käy"ö Tilastokeskus 2014
GOOGLE DATA Google Trends Google Correlate Google AdWords
GOOGLE TRENDS: BEFORE
GOOGLE TRENDS: AFTER
Google Trends - mistä liikkeelle www.google.com/trends/explore 1. 2. 1) Suosituimmat - Googlen vuositilastot Googlen julkaisemat listat aihealueittain sekä maittain 2) Tutki omat analyysit kuluttajien verkkokäyttäytymisestä Google Confidential and Proprietary
Google Trends - miten tulkita dataa? Google Trends -työkalu mahdollistaa kuluttajatrendien tutkimisen verkossa. Valitsemalla maantieteellisen alueen, ajankohdan, sekä hakutermin, voit luoda räätälöityjä analyysejä kuluttajakäyttäytymisestä Huomioitavaa Google trends näyttää indeksoituja ja normalisoituja hakutrendejä, ei absoluuttista hakuvolyymiä Mikäli hakudataa ei indeksoitaisi, asukasmäärältään suuret maantieteelliset alueet koroistuisivat aina vertailussa. Normalisoinnilla tarkoitetaan, että hakutietojoukot on jaettu yhteisellä muuttujalla (hakujen kokonaismäärällä). Google Trends käsittelee kuluttajien hakuja suhteessa saman ajanjakson ja paikan kaikkiin hakuihin, ja näyttää kehityksen skaalalla 0-100. Google Confidential and Proprietary
Tulkinta Datan normalisointi: kuluttajakysyntä suhteessa aikaan ja paikkaan Skaala: hakumäärät indeksoituna skaalalle 0-100. Keskiarvo: Keskiarvo skaalan indeksiarvoista valitulla ajanjaksolla, ja valitussa paikassa Uutisotsikot satunnaisesti valitut uutisotsikot valitulta ajanjaksolta Ennuste: Hakujen kehitys tulevaisuudessa perustuen historialliseen dataan Asetukset: kieliasetukset, sekä datan lataaminen csvtiedostona. Google Confidential and Proprietary
Tulkinta Maantieteellinen kiinnostus: Missä suhteellinen kiinnostus on suurin suhteessa alueen kaikkii hakuihin. Suosituimmat: suositut hakutermit, joita on haettu valitun ilmiön yhteydessä Kasvavat: hakutermit, jotka ovat eniten kasvaneet prosentuaalisesti ajanjaksolla suhteessa edelliseen verrattavaan ajanjaksoon. Prosenttiluvun sijasta teksti nopeimmin kasvavat viittaa sellaisiin hakutermeihin, joissa kasvua on olut yli 5000%. Google Confidential and Proprietary
Vinkit analyysien tekemiseen 1) Brändi- tai ilmiövertailu: hakutermit max 5 eri ilmiötä yhdellä markkinalla 2) Markkinavertailu: sijainnit yksi brändi tai ilmiö max 5 eri markkinalla 3) Aikavälit yksi brändi tai ilmiö max 5 eri ajankohtana 4) Verkko vs muut haut kuluttajien tekemät haut Googlen hakukoneessa, YouTubessa tms. 5) Kategoriat tietyillä markkinoilla on mahdollista tarkastella kuluttajakysyntää toimialoittain Google Confidential and Proprietary
Vinkit analyysien tekemiseen: Miten valita hakutermit tennis kengät Haut, joissa mukana tennis JA kengät, missä tahansa järjestyksessä sekä mahdollisesti muiden termien kanssa tennis kengät Haut, joissa mukana tennis JA kengät, juuri samassa järjestyksessä kuin heittomerkkien sisään on kirjoitettu tennis + kengät Haut, joissa mukana joko tennis TAI kengät, missä tahansa järjestyksessä sekä mahdollisesti muiden termien kanssa max 25 termiä yhdessä ryhmässä tennis -kengät Haut, joissa mukana vain tennis, ei hakuja, joissa mukana kengät Google Confidential and Proprietary
Usein kysytyt kysymykset Tarkoittaako laskeva graafi, että absoluuttinen hakuvolyymi on vähentynyt? Laskusuunnassa oleva viiva ei välttämättä tarkoita, että hakutermin absoluuttinen hakumäärä olisi vähenemässä. Se tarkoittaa vain, että sen suosio on laskussa. Miksi kaikilla termeillä ei ole ennustetta? Trends ei näytä ennusteita termeille, joiden ennustaminen on erityisen vaikeaa. Lisäksi jos termille on valittu lyhyt aikaväli, Trendsin käytettävissä ei ehkä ole riittävästi historiatietoja. Jos jokin maantieteellinen alue näyttää 0 indeksiarvoa, tarkoittaako se ettei siellä ole lainkaan hakuja Googlessa? Jos jotakin kartan aluetta ei ole korostettu hakutermin osalta, se ei tarkoita, että hakuja ei ole siellä lainkaan. Google Trendsin tiedot on normalisoitu, joten termiä saatetaan silti käyttää alueella, mutta se on suositumpi muualla. Google Confidential and Proprietary
GOOGLE TRENDS EDUT 1. Uusi informaatio 2. Resoluutio: Aika + Maantiede 3. Kustannukset
GOOGLE TRENDS HAITAT 1. Aineiston muoto 2. Mekanismi 3. Korrelaatio
GOOGLE TRENDS YHTEENVETO Uuden tiedon hankkiminen, Googlenomics Nykyhetken ennustaminen, Nowcasting
GOOGLE CORRELATE Parhaiten oman datan tai toisen hakutermin kanssa korreloivat haut Google Flu Trends 1 1 Ginsberg, Jeremy, et al. "Detecting influenza epidemics using search engine query data." Nature 457.7232 (2009): 1012-1014.
GOOGLE CORRELATE
GOOGLE CORRELATE
GOOGLE CORRELATE
GOOGLE ADWORDS Mainostajille tarkoitettu palvelu Aidot hakumäärät Web analytiikka
GOOGLE ADWORDS
GOOGLE ADWORDS
GOOGLE ADWORDS
GOOGLE ADWORDS