Kehittynyt data-analytiikka johtamisessa www.uef.fi/.etava 1.1.2013-31.12.201 4 Noin 50 opiskelijaa saa valmiudet data scientist -tehtäviin Pohjois-Savon maakunnassa toimiville organisaatioille teemakoulutuksia ja seminaareja sekä datan hyödyntämisen kypsyyskartoituksia 2 1
Maija Marttila-Kontio (projektipäällikkö) Mikko Kontio (projektikoordinaattori) Virpi Hotti (vastuullinen johtaja) TIETÄVÄ-TIIMI Maija Marttila-Kontio visualisoiva datatieteilijä Ø LinkedIn-osoite: http:// www.linkedin.com/in/ marttila Ø Opinnot: FT, tietojenkäsittelytiede Ø Sivuaineet: matematiikka (cum laude), fysiikka, kasvatustiede 2
Mikko Kontio verkostoituva datatieteilijä Ø LinkedIn-osoite: http:// www.linkedin.com/in/ kontio Ø Opinnot: MBA, FM, tietojenkäsittelytiede Ø Sivuaineet: yrittäjyys ja kauppatiede, matematiikka, fysiikka Virpi Hotti visioiva datatieteilijä Ø LinkedIn-osoite: http:// www.linkedin.com/in/ virpihotti Ø Opinnot: FT, tietojenkäsittelytiede Ø Sivuaineet: Kauppatiede (cum laude) 3
Kehittynyt data-analytiikka johtamisessa Orientoiva teemakoulutus Teemana Opi Kysymään Teemakoulutuksen aikataulu 8:30 Ilmoittautuminen ja aamukahvit 9:00 Statistista datataituriksi (Virpi) 9:45 Kuvailevan analytiikan treeni 10:15 Millainen on data scientist? (Maija) 11:00 Lounas 12:00 Missä mennään BI? (Mikko) 13:00 Avoimen datan lähteet ja hyödyntäminen (Mikko/Maija) 14:00 Kahvit 14:20 Tietokannoista ja kyselykielistä (Mikko) 15:30 Lopetus 8 4
Statistista datataituriksi Virpi Hotti Motto: Loista lainavaloilla kunnes omat valot syttyy 10/20/30 30/40/30-80 10/20/30 on Guy Kawasakin evankeliointi vuodesta 2005 HS 2.9.2012: http://www.hs.fi/tyoelama/a1346467216817 10 5
Voi ei! Datatulva Google- kuvahaku: JasonGoto. 11 Datatulvan aiheuttajat http://hortonworks.com/wp-content/uploads/2012/05/bigdata_diagram.png 12 6
Ja kuinka paljon meillä vielä onkaan informaatiota, johon liittyvää dataa ei ole vielä käytössämme... Noumeenit Fenomeenit Exformaatio Data Exformation: useful and relevant information, not just data http://foxhugh.wordpress.com/reference-fiction/science-fiction-dictionary/ 13 14 7
Lähde: Advanced Business Analy.cs Course Notes, SAS Ins.tute. 15 Google- kuvahaku: JasonGoto. 16 8
Organisaatiokohtaiset datajoukot valitaan yleensä mitattavien asioiden perusteella - mutta mitataanko vai arvataanko? Kuvan lähde: http://kpilibrary.com/ 17 Mittaamisessa (ja myös datan analysoinnissa) tasapainotellaan datatarpeiden ja käytettävien datojen välillä KPI:t ja muut tarpeet Datat 18 9
Fakta- leh. 15.8.2013 ja Talouselämä 20.8.2013 htp://www.talouselama.fi/tyoelama/ datamassojen+kaivelijoita+tarvitaan+nyt/ a2199421 19 Kylli Koskesta Hans Roslingiin Katsotaan: http://www.youtube.com/watch?v=jbksrlysojo Hae Googlen kuvahausta Kylli-täti ja Hans Rosling http://freshspectrum.com/hans-rosling-in-3-cartoons/ 20 10
Kerro visualisoituja tarinoita (narration eli storytelling) Kuvan lähde: htp://vis.stanford.edu/files/2010- Narra.ve- InfoVis.pdf 21 Aloittaminen on vaikein vaihe valitse datajoukko, kuvaile se ja kerro tarina slicing dicing 22 11
Esimerkki datajoukon kuvailusta JMP työkalulla nominal ordinal con.- nuous ville hyvä 50 heikki tyydytävä 60 kalle kiitetävä 55 leila kiitetävä 70 lyyli hyvä 50 heikki hyvä 55 D A T A J O U K O T Analytiikan konteksti Kuvaileva statistiikka Graafit Tunnusluvut Mitä saa laskea? Mitä kannattaa laskea? Tehdään päätöksiä, jatketaanko? Päättelevä statistiikka Mallit Testit N Ä K E M Y K S E T 24 12
Open-minded data exploration and navigation Potential business rules? Potential segments? Potential predictors? Kuvien lähde: Gain U., Ho4 V.: Big Data analy;cs for professionals, Data- milling for laypeople. Horizon Research Publishing, USA 25 Kehittynyt data-analytiikka (KDA) proaktivoi KDA:ssa hyödynnetään mm. työkaluja, jotka generoivat/tuottavat/visualisoivat automaattisesti/ semi-automaattisesti potentiaalisia liiketoimintasääntöjä, vaihtoehtoisia ennustemalleja ja arvioivat niiden hyvyyttä => factual and visual narra.ves => suitable data sets 26 13
Datanälkä kasvaa tunnuslukujen narratiivisessa tulkinnassa Mitta-asteikko Tunnusluku Keskiarvo X X Varianssi X X Keskihajonta X X Vinous X X Huipukkuus X X Suhde Välimatka Järjestys Laatuero Minimi, Maksimi X X X Vaihteluväli X X X Prosenttipisteet X X X Moodi X X X X Frekvenssi X X X X Do you want to be a lover of clarity? htp://todayinsci.com/quota.onscategories/o_cat/ Observa.on- Quota.ons.htm mukaan John Steinbeck and Edward Flanders RickeTs, Sea of Cortez: a Leisurely Journal of Travel and Research (1941), 73. 28 14