Maija Marttila-Kontio visualisoiva datatieteilijä

Samankaltaiset tiedostot
Hei SAS Forumilla 2013 mukana olleet!

2. Aineiston kuvailua

Sovellettu todennäköisyyslaskenta B

Data Scientist? Poikkitieteellinen, oma-aloitteinen monitaituri

ARVOTIETO Oy. Asiakasdatasta lisäarvoa

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

pisteet Frekvenssi frekvenssi Yhteensä


Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Sosiaali- ja terveysalan toimialamalli tiedolla johtamisen avuksi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Sovellettu todennäköisyyslaskenta B

Kandidaatintutkielman aineistonhankinta ja analyysi

Til.yks. x y z

Itä-Suomen yliopisto Tietojenkäsittelytiede

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Location Business Forum 2015 Paikkatieto osana uudistuvaa analytiikkaa ja tiedolla johtamista

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Ennustava analytiikka B2B- myynnissä. Miten hyötyä säännönmukaisuuksista markkinoinnissa ja myynnissä

Tilastollisten aineistojen kuvaaminen

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

7. laskuharjoituskierros, vko 10, ratkaisut

Intranet Manager. Kaikki irti organisaation intranetistä. Kevät Syksy !

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Monimutkaisesta datasta yksinkertaiseen päätöksentekoon. SAP Finug, Emil Ackerman, Quva Oy

KUOPION TYÖLLISYYSSEMINAARI

Missä mennään BI? Mikko Kontio

Matematiikka. Orientoivat opinnot /

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSOPAS. SPSS-opas

Hyvä sivistystoimenjohtaja/rehtori

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. päivä Ilmoittautuminen ja aamukahvi, materiaalin jako

Analytiikan teknologiset trendit ja uudet mahdollisuudet HR:lle. Heikki Penttinen, OlapCon Oy

Kvantitatiiviset tutkimusmenetelmät maantieteessä

M I K S I AVA R E A TÄ N Ä Ä N PA I K A L L A?

Miten tullaan opettajaksi Helsingin yliopistosta?

Infrahankkeiden projektipäällikkö

VeTe päätösseminaari VeTeen piirretty viiva Tampere-talolla

Myös opettajaksi aikova voi suorittaa LuK-tutkinnon, mutta sillä ei saa opettajan kelpoisuutta.

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Kaupan digimurros SKO-koulutuspäivät

Open Access & Open Data & Tulosten suojaus Horisontti ohjelmassa. Liisa Ewart Lakimies Sopimus- ja kustannusasioiden NCP VTT 27.3.

AMMATILLISEN KOULUTUKSEN HYVINVOINTISEMINAARI

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Tunnuslukujen hyödyntäminen johtamisessa

AMMATILLISEN KOULUTUKSEN HYVINVOINTISEMINAARI

Verkkojalanjälki Digitaalinen löydettävyys ja maineenhallinta

Tilastomenetelmien lopputyö

ARVOTIETO Oy. Asiakasdatasta lisäarvoa. Marko J. Kivelä

Intranet Manager. Kaikki irti organisaation intranetistä

LUONNONTIETEELLINEN KOULUTUSALA

Infrahankkeiden projektipäällikkökoulutus 1. jakso Helsinki 2. jakso Helsinki 3. jakso

Matematiikka ja tilastotiede. Orientoivat opinnot /

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

Visuaaliset työpöydät - lisää voimaa liiketoimintaan suurten datamassojen ketterästä analysoinnista

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

FSD1118. Kunnallisalan ilmapuntari 1997 : kuntalaiset. Koodikirja

FYSIIKAN JA MATEMATIIKAN LAITOS, JOENSUU 1. vuosikurssi 2. vuosikurssi 3. vuosikurssi

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Til.yks. x y z

Matemaatikot ja tilastotieteilijät

AMMATILLISEN KOULUTUKSEN HYVINVOINTISEMINAARI

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Voittaja. Toimenpiteen nimi. Työtila datan käsittelyyn. Tavoite / toimenpide

Turvallisuus ihmisten toimintana

OPISKELIJAN NIMI: OPISKELIJANUMERO:

Aureolis Oy. Analytiikka määrää myymälävalikoiman - Case Alkon myymäläuudistus 2015

ARVOTIETO OY. Asiakasdatasta lisäarvoa. Marko J. Kivelä

Tekoäly ja alustatalous. Miten voit hyödyntää niitä omassa liiketoiminnassasi

THL / Sote-tietopohja

Datasta arvoaliiketoiminnalle. Kirsi Pietilä Business Intelligence Lead

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Taloustieteen perusopetus yliopistossa. Matti Pohjola

KULUTTAJAN KONTEKSTI

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Tilastolliset toiminnot

MATEMATIIKAN TASOTESTI / EKAMK /

Sivuston tiedotqbsupportcustom erservice.com

Kokonaisvaltainen mittaaminen ohjelmistokehityksen tukena

T Y Ö RY H M Ä T J A T Y Ö PA J A N A I H E E T

AMMATILLISEN KOULUTUKSEN HYVINVOINTISEMINAARI

VERKKOMARKKINOINNIN MAHDOLLISUUDET Tietoa ja tuottoa pienteurastamoihin -hanke

FSD2828. Uutisointi ilmastonmuutoksesta ja rehevöitymisestä Koodikirja

INSSI-seminaari VOV! Risto Salminen

Määrällisen aineiston esittämistapoja. Aki Taanila

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja

Rakennusautomaation käytettävyys. Rakennusautomaatioseminaari Sami Karjalainen, VTT

Big data ja AI K-ryhmässä. TIEKE Jani Store, Senior Web Analyst

HOITOTYÖN JOHTAMISEN RAPORTOINTIJÄRJESTELMÄ

VeTe päätösseminaari VeTeen piirretty viiva Tampere-talolla

Transkriptio:

Kehittynyt data-analytiikka johtamisessa www.uef.fi/.etava 1.1.2013-31.12.201 4 Noin 50 opiskelijaa saa valmiudet data scientist -tehtäviin Pohjois-Savon maakunnassa toimiville organisaatioille teemakoulutuksia ja seminaareja sekä datan hyödyntämisen kypsyyskartoituksia 2 1

Maija Marttila-Kontio (projektipäällikkö) Mikko Kontio (projektikoordinaattori) Virpi Hotti (vastuullinen johtaja) TIETÄVÄ-TIIMI Maija Marttila-Kontio visualisoiva datatieteilijä Ø LinkedIn-osoite: http:// www.linkedin.com/in/ marttila Ø Opinnot: FT, tietojenkäsittelytiede Ø Sivuaineet: matematiikka (cum laude), fysiikka, kasvatustiede 2

Mikko Kontio verkostoituva datatieteilijä Ø LinkedIn-osoite: http:// www.linkedin.com/in/ kontio Ø Opinnot: MBA, FM, tietojenkäsittelytiede Ø Sivuaineet: yrittäjyys ja kauppatiede, matematiikka, fysiikka Virpi Hotti visioiva datatieteilijä Ø LinkedIn-osoite: http:// www.linkedin.com/in/ virpihotti Ø Opinnot: FT, tietojenkäsittelytiede Ø Sivuaineet: Kauppatiede (cum laude) 3

Kehittynyt data-analytiikka johtamisessa Orientoiva teemakoulutus Teemana Opi Kysymään Teemakoulutuksen aikataulu 8:30 Ilmoittautuminen ja aamukahvit 9:00 Statistista datataituriksi (Virpi) 9:45 Kuvailevan analytiikan treeni 10:15 Millainen on data scientist? (Maija) 11:00 Lounas 12:00 Missä mennään BI? (Mikko) 13:00 Avoimen datan lähteet ja hyödyntäminen (Mikko/Maija) 14:00 Kahvit 14:20 Tietokannoista ja kyselykielistä (Mikko) 15:30 Lopetus 8 4

Statistista datataituriksi Virpi Hotti Motto: Loista lainavaloilla kunnes omat valot syttyy 10/20/30 30/40/30-80 10/20/30 on Guy Kawasakin evankeliointi vuodesta 2005 HS 2.9.2012: http://www.hs.fi/tyoelama/a1346467216817 10 5

Voi ei! Datatulva Google- kuvahaku: JasonGoto. 11 Datatulvan aiheuttajat http://hortonworks.com/wp-content/uploads/2012/05/bigdata_diagram.png 12 6

Ja kuinka paljon meillä vielä onkaan informaatiota, johon liittyvää dataa ei ole vielä käytössämme... Noumeenit Fenomeenit Exformaatio Data Exformation: useful and relevant information, not just data http://foxhugh.wordpress.com/reference-fiction/science-fiction-dictionary/ 13 14 7

Lähde: Advanced Business Analy.cs Course Notes, SAS Ins.tute. 15 Google- kuvahaku: JasonGoto. 16 8

Organisaatiokohtaiset datajoukot valitaan yleensä mitattavien asioiden perusteella - mutta mitataanko vai arvataanko? Kuvan lähde: http://kpilibrary.com/ 17 Mittaamisessa (ja myös datan analysoinnissa) tasapainotellaan datatarpeiden ja käytettävien datojen välillä KPI:t ja muut tarpeet Datat 18 9

Fakta- leh. 15.8.2013 ja Talouselämä 20.8.2013 htp://www.talouselama.fi/tyoelama/ datamassojen+kaivelijoita+tarvitaan+nyt/ a2199421 19 Kylli Koskesta Hans Roslingiin Katsotaan: http://www.youtube.com/watch?v=jbksrlysojo Hae Googlen kuvahausta Kylli-täti ja Hans Rosling http://freshspectrum.com/hans-rosling-in-3-cartoons/ 20 10

Kerro visualisoituja tarinoita (narration eli storytelling) Kuvan lähde: htp://vis.stanford.edu/files/2010- Narra.ve- InfoVis.pdf 21 Aloittaminen on vaikein vaihe valitse datajoukko, kuvaile se ja kerro tarina slicing dicing 22 11

Esimerkki datajoukon kuvailusta JMP työkalulla nominal ordinal con.- nuous ville hyvä 50 heikki tyydytävä 60 kalle kiitetävä 55 leila kiitetävä 70 lyyli hyvä 50 heikki hyvä 55 D A T A J O U K O T Analytiikan konteksti Kuvaileva statistiikka Graafit Tunnusluvut Mitä saa laskea? Mitä kannattaa laskea? Tehdään päätöksiä, jatketaanko? Päättelevä statistiikka Mallit Testit N Ä K E M Y K S E T 24 12

Open-minded data exploration and navigation Potential business rules? Potential segments? Potential predictors? Kuvien lähde: Gain U., Ho4 V.: Big Data analy;cs for professionals, Data- milling for laypeople. Horizon Research Publishing, USA 25 Kehittynyt data-analytiikka (KDA) proaktivoi KDA:ssa hyödynnetään mm. työkaluja, jotka generoivat/tuottavat/visualisoivat automaattisesti/ semi-automaattisesti potentiaalisia liiketoimintasääntöjä, vaihtoehtoisia ennustemalleja ja arvioivat niiden hyvyyttä => factual and visual narra.ves => suitable data sets 26 13

Datanälkä kasvaa tunnuslukujen narratiivisessa tulkinnassa Mitta-asteikko Tunnusluku Keskiarvo X X Varianssi X X Keskihajonta X X Vinous X X Huipukkuus X X Suhde Välimatka Järjestys Laatuero Minimi, Maksimi X X X Vaihteluväli X X X Prosenttipisteet X X X Moodi X X X X Frekvenssi X X X X Do you want to be a lover of clarity? htp://todayinsci.com/quota.onscategories/o_cat/ Observa.on- Quota.ons.htm mukaan John Steinbeck and Edward Flanders RickeTs, Sea of Cortez: a Leisurely Journal of Travel and Research (1941), 73. 28 14