Hei SAS Forumilla 2013 mukana olleet!

Samankaltaiset tiedostot
Maija Marttila-Kontio visualisoiva datatieteilijä

Sovellettu todennäköisyyslaskenta B

2. Aineiston kuvailua

Data Scientist? Poikkitieteellinen, oma-aloitteinen monitaituri

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

Til.yks. x y z

Tilastollisten aineistojen kuvaaminen

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

TUTKIMUSOPAS. SPSS-opas

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

pisteet Frekvenssi frekvenssi Yhteensä

Sosiaali- ja terveysalan toimialamalli tiedolla johtamisen avuksi

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

OPPIMISTULOSTEN ARVIOINTI MILLAISTA TIETOA ARVIOINTIJÄRJESTELMÄ TUOTTAA OPPIMISTULOKSIA

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Sovellettu todennäköisyyslaskenta B

OPPIMISTULOSTEN ARVIOINTI Kuuntele kysy opi. Esimerkkinä Sähkö- ja automaatiotekniikka (hiusalan ja maatalousalan vertailut)

Visuaaliset työpöydät - lisää voimaa liiketoimintaan suurten datamassojen ketterästä analysoinnista

Til.yks. x y z

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

7. laskuharjoituskierros, vko 10, ratkaisut

HR-analytiikan seuraava vaihe: työkyvyn johtaminen ja henkilöstötuottavuus Ossi Aura, filosofian tohtori Petteri Laine, seniorikonsultti, Silta Oy

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Monipuolisen yhteistyön haaste pyrittäessä korkealle

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Kandidaatintutkielman aineistonhankinta ja analyysi

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tekoälysovellusten vaatimukset datalle, tiedon hallinnan prosesseille ja johtamiselle

Objektiharjoituksia. Harjoitus 2 Tässä on lyhyitä dialogeja. Pane objektit oikeaan muotoon. 1) - Vien... TÄMÄ KIRJE postiin.

FSD2275. Äänestäminen ja puolueiden valintaperusteet eduskuntavaaleissa Koodikirja

Matemaatikot ja tilastotieteilijät

Sosiaalinen media matkailusektorilla Koodiviidakko Oy Pekka Huttunen Liiketoimintajohtaja, KTM

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Information on Finnish Courses Autumn Semester 2017 Jenni Laine & Päivi Paukku Centre for Language and Communication Studies

Rakennetaan asiakaslähtöinen, digitaalinen kunta case Tyrskylä

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Information on Finnish Language Courses Spring Semester 2018 Päivi Paukku & Jenni Laine Centre for Language and Communication Studies

Kaupan digimurros SKO-koulutuspäivät

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Kvantitatiiviset menetelmät

Information on Finnish Language Courses Spring Semester 2017 Jenni Laine

Itsemurhasta on turvallista puhua

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Digitalisoituminen, verkottuminen ja koulutuksen tulevaisuus. Teemu Leinonen Medialaboratorio Taideteollinen korkeakoulu

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

#MKK3 Maankoodauskurssi 2018

MONISTE 2 Kirjoittanut Elina Katainen

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Tilastomenetelmien lopputyö

Pääkaupunkiseudun kuntien päivähoidon asiakaskysely 2011

FinFamily PostgreSQL installation ( ) FinFamily PostgreSQL

Tilastolliset toiminnot

Hieman linkkejä: lyhyt ohje komentoriviohjelmointiin.

L U PA TE HDÄ FIKS UM M IN

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Muskarimessu: Hyvän paimenen matkassa

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

FSD2805. Kirjastojen kansallinen käyttäjäkysely: yleiset kirjastot Koodikirja

Bachelor level exams by date in Otaniemi

Bachelor level exams by subject in Otaniemi

9.1. Mikä sinulla on?

FSD2828. Uutisointi ilmastonmuutoksesta ja rehevöitymisestä Koodikirja

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

VERKKOMARKKINOINNIN MAHDOLLISUUDET Tietoa ja tuottoa pienteurastamoihin -hanke

UUDET KANSALLISET OPPIMISTULOKSET Sähkö- ja automaatiotekniikka. (hiusalan ja maatalousalan vertailuja)

TYÖKIRJANEN. Saat inspiroivaa henkisen alan koulutusta

FINLAND FESTIVALS. Finland Festivals

Määrällisen aineiston esittämistapoja. Aki Taanila

Google Adwords pikaohje

MATEMATIIKAN TASOTESTI / EKAMK /

Toimintatapainnovaatiot: kehity ja kehitä kokeilemalla Lupa toimia eri tavalla

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Näkökulmia kunnan talouden tasapainon tulkintaan Kuntaliitto

YRITTÄJÄ, TEE NYT V**TU EDES JOTAIN, MARKKINOI ÄLÄ MARISE

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Teknillinen korkeakoulu T Tietojenkäsittelyopin ohjelmatyö. Testitapaukset - Koordinaattieditori

Herään aikaisin aamulla herätyskellon pirinään. En jaksanut millään lähteä kouluun, mutta oli aivan pakko. En syönyt edes aamupalaa koska en olisi

Contents. Kuinka monta jakson sanaa opit? Väritä tähdet. Hello. Numbers. Colours. 1. This is me. 2. Clothes. 3. Family. 4. Home. 5. Food. 6.

Kim Polamo Työnohjaukse ks n voi n m voi a Lu L e,,ku inka i t yönohj t aus s autt t a t a t yös t s yös ä s si s. i 1

Lapsellanne synt. on varattu aika neuvolan

Tunnuslukujen hyödyntäminen johtamisessa

FSD2501. Nuorisobarometri 2009: vuotiaiden vertailuaineisto. Koodikirja

Keski-Uudenmaan Ohjaamot. Suuntaviivat ja vinkit 2017

TRAFI, AJOVARMA JA KATSASTUS. Lämmittely. Tykkäätkö autoista? Millaisista? Ajatko paljon? Millä matkustat?

Markkinointi Kimmo Vihanto

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja

3. Arvot luovat perustan

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Yritysyhteistyötutkimus Julkinen yhteenveto tutkimusraportista

HAVAITUT JA ODOTETUT FREKVENSSIT

Transkriptio:

Hei SAS Forumilla 2013 mukana olleet! Ottakaa minuun yhteyttä, jos ja kun haluatte keskustella kanssani dataan liittyvistä asioita. 040-5629192, virpi.hotti@uef.fi Ja verkostoidutaan eli tervetuloa LinkedInverkostooni http://www.linkedin.com/pub/virpihotti/41/968/960 Virpi Hotti 1

Statistista datataituriksi Virpi Hotti Motto: Loista lainavaloilla kunnes omat valot syttyy

10/20/30 30/40/30-80 10/20/30 on Guy Kawasakin evankeliointi vuodesta 2005 HS 2.9.2012: http://www.hs.fi/tyoelama/a1346467216817 3

Pääaiheet (keynotes) Voi ei! - Mitä ihmettä!? - Onks kaikki ok? Kylli Koskesta Hans Roslingiin 5 koota Tietävä-hankeella vastataan data scientist -kysyntään 4

Voi ei! Datatulva Google-kuvahaku: JasonGoto. 5

Datatulvan aiheuttajat http://hortonworks.com/wpcontent/uploads/2012/05/bigdata_diagram.png 6

Mitä ihmettä Minustahan on myös datatulvassa dataa! Google-kuvahaku: JasonGoto. 7

Mitä dataa minusta onkaan olemassa? Jokaisen maksutapahtuman tiedot jopa nimiketasolla, jos olen käyttänyt etu-/maksukortteja Jokainen SOME-edesottamukseni Jokainen työpaikan ovien nappiavainaukaisu Jokainen Google-haku... 8

Ja kuinka paljon meillä vielä onkaan informaatiota, johon liittyvää dataa ei ole vielä käytössämme... Noumeenit Fenomeenit Exformaatio Data Exformation: useful and relevant information, not just data http://foxhugh.wordpress.com/reference-fiction/science-fiction-dictionary/ 9

10

Esimerkki ilmiön/ihmetyksen selityksestä 13.8.2013 http://www.aka.fi/fi/a/suomen- Akatemia/Mediapalvelut/Tiedotteet1/Hypnoosi-mahdollistaa-todellisiahallusinaatioita/ 11

Lähde: Advanced Business Analytics Course Notes, SAS Institute. 12

D A T A J O U K O T Analytiikan konteksti Kuvaileva statistiikka Graafit Tunnusluvut Mitä saa laskea? Mitä kannattaa laskea? Tehdään päätöksiä, jatketaanko? Päättelevä statistiikka Mallit Testit N Ä K E M Y K S E T 13

Onks kaikki ok? Google-kuvahaku: JasonGoto. 14

Totuudenpuhujaa harva rakastaa miten päästään ns. tuumasta toimeen? Google-kuvahaku: JasonGoto. 15

Asenne ratkaisee! Ääripäissä HiPPO ja GEEK how about you? HiPPO (the highest-paid person's opinion) http://blogs.sas.com/content/sascom/2013/04/30/hipposversus-geeks-who-will-win/ 16

Kylli Koskesta Hans Roslingiin Katsotaan: http://www.youtube.com/watch?v=m2h1rpoquqg ja http://www.youtube.com/watch?v=jbksrlysojo Hae Googlen kuvahausta Kylli-täti ja Hans Rosling http://freshspectrum.com/hans-rosling-in-3-cartoons/ 17

Kun kysyt, odota selkeitä vastauksia; kun vastaat, pyri vastaamaan selkeästi do you want to be a lover of clarity? http://todayinsci.com/quotationscategories/o_cat/observatio n-quotations.htm mukaan John Steinbeck and Edward Flanders Ricketts, Sea of Cortez: a Leisurely Journal of Travel and Research (1941), 73. 18

Kerro visualisoituja tarinoita (narration eli storytelling) Kuvan lähde: http://vis.stanford.edu/files/2010-narrative- InfoVis.pdf 19

Aloittaminen on vaikein vaihe valitse datajoukko, kuvaile se ja kerro tarina slicing dicing 20

Esimerkki datajoukon kuvailusta JMP 10 AddIn toiminnolla continuous nominal ordinal ville hyvä 50 heikki tyydyttävä 60 kalle kiitettävä 55 leila kiitettävä 70 lyyli hyvä 50 heikki hyvä 55

Datanälkä kasvaa tunnuslukujen narratiivisessa tulkinnassa Mitta-asteikko Tunnusluku Suhde Välimatka Järjestys Laatuero Keskiarvo X X Varianssi X X Keskihajonta X X Vinous X X Huipukkuus X X Minimi, Maksimi X X X Vaihteluväli X X X Prosenttipisteet X X X Moodi X X X X Frekvenssi X X X X

Organisaatiokohtaiset datajoukot valitaan yleensä mitattavien asioiden perusteella - mutta mitataanko vai arvataanko? Kuvan lähde: http://kpilibrary.com/ 23

Mittaamisessa (ja myös datan analysoinnissa) tasapainotellaan datatarpeiden ja käytettävien datojen välillä KPI:t ja muut tarpeet Datat 24

5 KOOTA Kulje reppu selkään ja maailmalle! Kuuntele Katsele Kokeile parempi kourallinen kokemusta kuin tynnyrillinen tietoa! Kysele kysyvä ei tieltä eksy?!?

Kehittynyt data-analytiikka johtamisessa www.uef.fi/tietava

1.1.2013-31.12.2014 Yli 50 opiskelijaa saavat valmiudet data scientist -tehtäviin Organisaatioille teemakoulutuksia ja seminaareja 27

Datat ovat meille kuin kasa Legopalikoita, jotka saatuaan lapsi alkaa miettiä, mitä niistä saisi rakennettua Reflection-lehti 1/2013 http://issuu.com/sas-institue/docs/refleksion1-2013-fi?e=1490380/1997075 Tarvitaan datamassojen kaivelijoita, jotka kertovat datasta saataviin graafisiin esityksiin ja tunnuslukuihin liittyviä tarinoita Fakta-lehti 15.8.2013 ja Talouselämä 20.8.2013 http://www.talouselama.fi/tyoelama/datamassojen+kaivelijoita+tarvitaan+nyt/a2 199421 28

SAS Forumilla myös Tietävähankkeen projektipäällikkö Maija Marttila-Kontio 29

Kiitos kaunis! Syntyikö oivalluksia?

Richard Branson- 31