Big datan laatu ja analytiikka
|
|
- Kalevi Lehtinen
- 8 vuotta sitten
- Katselukertoja:
Transkriptio
1 hyväksymispäivä arvosana arvostelija Big datan laatu ja analytiikka Mirva Toivonen Seminaarityö Helsinki HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
2 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta Fakultet Faculty Laitos Institution Department Matemaattis-luonnontieteellinen tiedekunta Tekijä Författare Author Tietojenkäsittelytieteen laitos Mirva Toivonen Työn nimi Arbetets titel Title Big datan laatu ja analytiikka Oppiaine Läroämne Subject Tietojenkäsittelytiede Työn laji Arbetets art Level Seminaarityö Tiivistelmä Referat Abstract Aika Datum Month and year Sivumäärä Sidoantal Number of pages 12 sivua Big datan suuri määrä, käytettävien lähteiden moninaisuus ja nopeus jolla dataa tulee käsiteltäväksi tuovat haasteita analytiikan laadunhallintaan. Työssä tarkastellaan big datan luokittelun, tutkittavan ilmiön ymmärtämisen ja analyyseissä käytettävien moninaisten lähteiden yhteenvedon haasteita. Datan luokittelu arvokkaaseen dataan parantaa suurten tietomassojen käsittelyä, mutta oleellisen tiedon löytäminen on haasteellista, eikä suuri tietomassa aina johda tarkempaan analyysiin. Tutkittavan ilmiön ymmärtäminen big datan avulla on vaikeaa, koska näyte voi olla vinounut, mahdollisuus vääriin korrelaatioihin ja syy-seuraussuhteisiin kasvaa datan moninaisuuden ja määrän vuoksi. Datan ymmärtämistä voidaan helpottaa rakentamalla malli tutkittavasta ilmiöstä. Datan yhdistäminen auttaa suodattamaan oleellisen tiedon esimerkiksi suurista dokumenteista, mutta ongelmana on datan puuttuminen lähteiden eri rakeisuustasojen, yksityisyydensuojan ja näytteenottotiheyden takia. ACM Computing Classification System (CCS): Avainsanat Nyckelord Keywords big data, laatu, analytiikka Säilytyspaikka Förvaringställe Where deposited Muita tietoja Övriga uppgifter Additional information
3 ii Sisältö 1 Johdanto 1 2 Big Data 1 3 Big data -analytiikka 3 4 Big data haasteita analytiikalle Datan identifiointi ja luokittelu Datan ymmärtäminen Datan yhteenveto Yhteenveto 9 Lähteet 11
4 1 1 Johdanto Big data tuo perinteisen tietokantadatan rinnalla syvyyttä ja strategista liiketoimintaetua yrityksille. Perinteisellä tietovarastoratkaisuihin perustuvalla raportoinnilla voidaan tarkastella menneitä tapahtumia. Uudenlaiset datalähteet, kuten sensori-, teksti-, videoja äänidata mahdollistavat tapahtumien ennustamisen ja vastaamisen kysymykseen mitä tapahtuu juuri nyt. Big data -termi kuvaa datan ominaisuuksia, joissa dataa saadaan monenlaisista lähteistä, dataa virtaa käsiteltäväksi nopeasti ja paljon. Kaikkea big dataa ei voida esikäsitellä samaan tapaan kuin tietovarastodataa, vaan big dataa analysoidaan sellaisenaan usein ilman puhdistustoimenpiteitä. Huonoa dataa voidaan heittää pois, sillä tilalle on tarjolla paljon korvaavaa dataa. Big datan laadunhallinnassa ongelmana on hyvän, merkityksellisen datan löytäminen massasta joka on luonteeltaan sotkuista. Datan sotkuisuus vaikuttaa myös tutkittavan ilmiön ymmärtämiseen ja oleellisen tiedon tiivistämiseen moninaisista lähteistä. Tässä työssä esitellään ongelmia, joita big data aiheuttaa mielenkiintoisen ja arvokkaan datan eristämisessä, tutkittavan ilmiön ymmärtämisessä ja moninaisten lähteiden yhdistämisessä. Luvussa 2 tarkastellaan big data -termiä kolmen muuttujan, määrä, moninaisuus ja vauhti avulla, sekä esitellään minkälaista dataa liiketoiminnassa käytetään big data -analytiikan pohjana. Luvussa 3 esitellään big data -analytiikan piirteitä ja mitä yritysjohtajat toivovat analytiikalta big data ratkaisuiden yhteydessä. Luvussa 4 tarkastellaan kolmea analytiikan haastetta big datan laadun näkökulmasta: datan identifiointia ja luokittelua, datan ymmärtämisen vaikeutta sekä datalähteiden yhdistämistä. 2 Big Data Termi big data niputtaa saman termin alle datan valtavan määrän (volume), datalähteiden moninaisuuden (variety) ja vauhdin (velocity), jolla dataa tuotetaan. Big datan määrä tarkoittaa massaa jota ei perinteisin laskentakeinoin voida käsitellä. Moninaisuus tarkoittaa dataa tuottavien lähteiden ja datan rakenteen kirjoa. Dataa voidaan perinteisen operationaalisten tietolähteiden kuten tietokantadatan ja tietovarastodatan lisäksi kerätä sensoreista (esimerkiksi mobiililaitteiden GPS data),
5 2 web-sovelluksista (likkauskäyttäytymistä (clkickstream behavior) ja dataa sosiaalisesta mediasta), blogeista, uutisista ja mikroblogeista (twiitit), videoista ja äänitiedostoista. Data voi olla ihmisen tai koneen tuottamaa, rakenteeltaan strukturoitua, strukturoimatonta tai puolistruktuurista tiedostoihin pakattua dataa. Datan vauhti tarkoittaa että dataa tulee jatkuvana virtana, jota halutaan hyödyntää tosiaikaisesti sitä mukaan kuin dataa virtaa systeemiin [Laney01]. Tosiaikaista big dataa saadaan muun muassa liike- ja kuvasensoreista ja paikannusdatasta kuten GPS -datasta (Global Positioning System) [Tien 13]. Big data -analytiikkaprojekteihin valitut tai tulevaisuudessa käytettävät dataähteet ovat jakautuneet EMA:n (Enterprise Management Associates) ja IBM:n tutkimuksessa [Devlin et al. 12] seuraavasti (Kuva 1). Eniten käytetty datalähde analyyseissä on strukturoitua operationaalitason dataa, joka voi liittyä myyntiin, toimitusketjuun tai asiakkuuden hallintaan (50% vastaajista käytti operationaalitason dataa big data projekteissa). Toiseksi yleisin analytiikkadatan lähde oli ihmisten tuottamat dokumentit kuten sähköpostit ja lomakkeet (40% vastaajista). Muita datalähteitä kuten kuvia, koneen tuottamaa dataa ja sosiaalista mediaa käytti noin 30% vastaajista. Äänitiedostoja käytettiin vähiten, vain 19% vastaajista. Kuva 1: Datalähteiden käytön jakautuminen big data projekteissa. Strukturoitu operationaalinen data, ihmisen luomat dokumentit ja transaktiodata ovat kolme suosituinta datalähdettä big datan analysointiprojekteissa [Devlin et al. 12].
6 3 Kuvassa 2 big data jakautuu strukturoituun dataan, kuten relaatiotietokantadataan, sovelluskohtaiseen dataan ja struktuoimattomaan dataan, kuten video-, kuva-, ääni-, dokumenttidata ja JSON -muotoiseen dataan [Devlin et al. 12] Kuva 2: Big data ympäristössä yhdistetään strukturoitua ja strukturoimatonta dataa. 3 Big data -analytiikka Analytiikan käyttö on liiketoimintaetu. Liiketoiminnassaan erittäin hyvin menestyvät yritykset käyttivät analytiikkaa melkein 50% enemmän kuin heikommin menestyvät kilpailijat erottautuakseen kilpailijoistaan [LaValle et al 11]. LaVallen tutkimukesssa analytiikan käyttö toi liiketoimintaan tehokkuutta, kasvua tai kilpailuetua ja analytiikan ja liiketoimintamenestyksen väliltä löytyi selkeä positiivinen korrelaatio. Analytiikan tarkoituksena on eristää hyödyllistä tietoa valtavista tietosäiliöistä (data repositories) [Cuzzocrea et al 13]. Tietoa voidaan eristää laadullisilla analyyseillä, joissa pyritään ymmärtämään tutkittavaa ilmiötä tekemällä yhteyksiä ja johtopäätelmiä ilmiötä mittaavista muuttujista. Liiketoiminta-analytiikan tavoitteena on tuottaa arvoa nopeammin ja löytää tärkeimpiä muutoskohteita [LaValle et al 11]. Perinteisessä raportoinnissa data on mahdollisimman optimaalista. Tietovarastoissa dataa esikäsitellään yhdenmukaistamalla tietoa ja poistamalla väärää tai virheelistä tietoa. Datasta tehdään mahdollisimman edustava ja tarkka, jonka jälkeen data varastoidaan raportointia ja analyysejä varten. Datamassan kasvaessa yksinkertainenkin operaatio voi aiheuttaa merkittäviä viiveitä ajo- ja vastausaikaan (runtime, responsiveness) [Parker 12]. Big datan kontekstissa datan optimaalisuus on
7 4 epärealistista, erityisesti tosiaikaisissa järjestelmissä. Perinteinen data ensin lähestymistapa, jossa kaikki data kerätään ensiksi ja puhdistetaan ennen analyysien tekoa ei toimi big datan analytiikassa datan valtavan koon ja moninaisuuden takia. Data ensin lähestyminen jättää liian vähän aikaa, energiaa ja resursseja tiedon pontetiaalisen käytön ymmärtämiseen ja sen sijaan keskitytään datan keräämiseen ja puhdistamiseen [LaValle et al 11]. Big data pakottaa luopumaan optimaalisen datan vaatimuksesta ja keksimään luovempia, innovatiivisempia tapoja lähestyä datan analysointia ja käsittelyä. Perinteisten operationaalitason analyysityökalujen, kuten raporttien ja kojelautojen (dashboard) avulla voidaan seurata mitä on tapahtunut ja miksi näin on tapahtunut [Kimball 12]. Perinteisten analyysityökalujen fokus on menneessä ajassa. Rinnakkaista laskentaa käyttävän ohjelmointiparadigman MapReducen ja pilvilaskennan mahdollistamat parannukset datan käsittelynopeudessa ja skaalautuvuudessa mahdollistavat analytiikan näkökulman muuttumisen menneestä siihen mitä tapahtuu juuri nyt, mitä todennäköisesti tapahtuu seuraavaksi ja minkälaisia toimenpiteitä täytyy tehdä, jotta saavutetaan optimaalisia liiketoimintatuloksia [LaValle et al 11]. Analyyseissä dataa voidaan yhdistää strukturoidusta, yleensä yrityksen sisäisestä järjestelmästä, strukturoimattomaan usein yrityksen ulkopuolelta tulevaan dataan. Strukturoimaton data mahdollistaa vastaamisen sellaisiin kysymyksiin joihin aikaisemmin ei ollut mahdollista vastata. Big datalla ei ole tarkoitus korvata perinteistä analytiikkaa, kuten raportointia, vaan täydentää analytiikkaa lisäämällä syvyyttä ja nyansseja olemassaoleviin ratkaisuihin[letouzé 12]. Big data analytiikan omaksumisen suurimmat esteet ovat ennemmin hallinnollisia tai yrityskulttuurisia esteitä kuin datan keräämiseen, laatuun tai teknologiaan liittyviä [Madsen 13], [LaValle et al 11]. Fiksujen, uudenlaisten ja innovatiivisten ratkaisuiden tekeminen oli suurin haaste big data analytiikan käytöönotossa. LaValle et al 2011 tutkimuksessa laatuun liittyvät esteen olivat kolmanneksi yleisin ongelma (20% piti ongelmia datan laadussa päällimmäisenä esteenä). Datan moninaisuuden käsitteleminen koettiin suuremmaksi haasteeksi kuin pelkkä datan määrä big data -analytiikan omaksumisessa [Geopalkrishnan el al 12].
8 5 Yritysjohtajat kaipasivat dataan perustuvia välittömiä ohjeistuksia yllättäviin tilanteisiin, joissa esimerkiksi yllättävä kilpailija ilmaantuu markkinoille, toimitusketjun alueella tapahtuu maanjäristys tai jos asiakas näyttää merkkejä tuottajan vaihtamisesta [LaValle et al 11]. Big data analytiikalta kaivattiin apua optimaalisten ratkaisuiden löytämiseen ja ymmärtämiseen, jotta korjausliikkeitä voidaan tehdä nopeasti. 4 Big data haasteita analytiikalle Big data analytiikalta toivotaan parempaa ymmärrystä liiketoiminnasta. Big datan analysoinnin haasteina on datan heterogeeninen luonne, määrä ja vauhti, jotka vaikeuttavat oleellisen datan löytämistä, datan ja tutkittavan ilmiön ymmärtämistä sekä datan yhteenvetoa. Aliluvussa 4.1 annetaan esimerkkejä huonosta datasta ja esitellään kaksi tapaa identifioida analytiikan kannalta tärkeää, oikeaa tai mielenkiintoista tietoa: lähestymällä big dataa kysymys ensin periaatteella ja luokittelemalla dataa arvokkaaseen ja vähemmän arvokkaaseen dataan. Aliluvussa 4.2 tarkastellaan miten datan moninaisuus ja määrä vaikeuttavat datan ymmärtämistä, sekä esitellään tutkittavan ilmiön mallintamista jota vasten on helpompi ymmärtää ja luokitella dataa. Aliluvussa 4.3 esitellään datalähteiden yhteenvetoa jonka avulla data saadaan pakattua ymmärrettävämpään muotoon. 4.1 Datan identifiointi ja luokittelu Tarkoituksenmukainen tieto pitää jollain tapaa identifioida ja löytää. Jos halutaan löytää poikkeamia (anomaly) pitää ensin määritellä mikä on epänormaalia ja mikä normaalia [Letouzé 12] ja lisäksi mikä on mielenkiintoista ja mikä ei. Epäjohdonmukaisuudet voivat kertoa mielenkiintoisesta ja epätavallisesta ilmiöstä tai rikkinäisestä sensorista, jota kannattaa tutkia tarkemmin. Epätarkkaa tai väärää dataa voidaan kerätä esimerkiksi rikkinäisistä sensoreista tai mittausvirheen takia. Vanhentunutta, tahallaan tai tahattomasti väärä tai harhaanjohtavaa
9 6 dataa voidaan kerätä esimerkiksi blogeista, uutisista tai sosiaalisen median viesteistä [Bizer et al. 12],[Letouzé 12]. Esimerkkinä Letouzé [Letouzé 12] kirjoittaa blogista jossa kirjoitettiin keksittyä tarinaa arabikevään tapahtumista Damaskoksessa vuonna Kirjoittaja oli todellisuudessa Eurooppalainen heteroseksuaalinen mies, mutta esiintyi silti blogissaan homoseksuaalisena naisena. Blogi saavutti kasvavaa suosiota, kunnes huijaus paljastui. Tapaus nosti esille huolen verifioimattomasta ihmisen tuottaman datan laadusta. On haasteellista arvioida dokumenttien laatua ja löytää lähde, jota voidaan pitää uskottavana, sillä tekstit ovat luonteeltaan spontaaneja ja tietojen tarkistus on löysää. Suurten tietomassojen käsittelyä voidaan tehostaa tiivistämällä ja luokittelemalla dataa mahdollisimman aikaisessa vaiheessa. Sensoreiden tuottamaa raakaa dataa voidaan suodattaa tai tiivistää, sillä suurin osa datasta ei ole mielenkiintoista. Tapauksissa joissa datan määrä ylittää varastointikyvyn datan esikäsittely on tärkeää. Esikäsittely pitää tehdä datan käyttötarkoitus mielessä pitäen, koska muuten tärkeää tietoa voi kadota. Esimerkiksi CERNin suuri LHC hiukkaskiihdytin (Large Hadron Collide, LHC) tuottaa 15 petatavua dataa vuodessa. LHC kokeessa tuotetaan 10 9 interaktioita per sekunti ja dataa esikäsitellään niin että jäljellä on enää 10 7 interaktiota per sekunti [CERN, 08]. On haasteellista luokitella suodattimet niin, etteivät ne heitä pois hyödyllistä informaatiota. Riittääkö esimerkiksi uutisten analysoinnissa, jos tutkitaan vain uutisia joissa mainitaan tietyn yrityksen nimi? Analysoidaanko vain pientä osaa tekstiä yrityksen nimen ympäriltä vai analysoidaanko koko uutinen? Dataa kuvaileva ja määrittävä metatieto on tärkeässä roolissa kun halutaan varmistua validiudesta, datan elinkelpoisuudesta ja laajuudesta [Tien 13]. Esimerkiksi metadataa analysoimalla tiedetään mistä lähteestä uutinen on peräisin, jotta mahdolliset duplikaatit voidaan ottaa huomioon ja tutkia. Tosin on haasteellista kerätä automaattisesti metadataa, joka kuvailee datan joka on tallennettu, miten data on tallennettu ja miten data on mitattu [Labrinidis et al. 12]. Parempi luokittelu hyödyttää enemmän kuin algoritmien parantaminen [Geopalkrishnan el al 12]. Esimerkiksi pankkitoiminnan riskejä arvioiva algoritmi käytti lähteenään noin 2600 puhelinraporttia. Jotta algoritmi toimi, täytyi lähdemateriaalia suodattaa reiluun 70 oleelliseen muuttujaan ja lisäksi tarvittiin pankkialan osaajia jäljellä olevien muttujien
10 7 suodattamiseen. Joissain tapauksissa numeeriset muuttujat piti muuttaa kategorisiksi ja toisin päin. Luokittelussa datan formaatilla ei ole väliä, sillä datasta on aina löydettävissä entiteettejä kuten asiakas, tuote, palvelu, sijainti ja aika [Kimball 12]. Esimerkiksi twiitistä Wov, That is awesome! voidaan saada mittoja asiakkaasta, sijainnista, tuotteesta, tuottajasta, demografisesta klusterista, sessiosta tai twiittiä edeltävästä tapahtumasta. Dimensaliointi olisi hyvä tehdä mahdollisimman aikaisessa vaiheessa ja kaikki dimensiot pitää liittää pysyviin sijaisavaimiin (durable surrogate key) [Kimball 12]. LaValle et al esittää lähestymistavan, jossa kysymykset esitetään ensin ja data kerätään tutkittavaa ilmiötä varten. Jos kysymykset muotoillaan etukäteen, voidaan helpommin paikallistaa data jota tarvitaan analyyseissä, eikä datan välttämättä tarvitse olla täydellistä. Dataa saattaa olla jo valmiina. Kysymyslähtöinen käsittelytapa auttaa löytämään dataa, jota kannattaa puhdistaa. Se auttaa myös tunnistamaan onko näyte edustava, mikä on normaalia dataa ja mitataanko oikeaa asiaa. Zikopoulos et al identifioi artikkelissaan datan matalan ja korkean arvon dataan. Esimerkiksi datan käsittelytoimenpiteet nostavat datan arvoa per tallennettu tavu. Se onko datalla korkea vai matala arvo vaikuttaa datan käsittelyyn ja siihen kuinka paljon puhdistustoimenpiteitä tarvitaan. 4.2 Datan ymmärtäminen Datan määrä mahdollistaa tarkemmat analyysit, sillä mitä enemmän datapisteitä on, sen lähemmäs päästään näytteen odotusarvoa. Tosin tarkkuus ei välttämättä johda parempaan ymmärrykseen ratkaistavasta ongelmasta. Usein dataa käsitellään huolimattomasti ja pinnallisella tasolla, koska big data on luontaisesti sotkuista ja se saattaa hämärtää alla olevia syy-seuraus suhteita [Tien 13]. Big datassa dimensioiden määrä voi räjähtää datan strukturoimattoman luonteen vuoksi [Cuzzocrea et al 13]. Muuttujien määrä kasvattaa mahdollisten korrelaatioiden määrää, myös väärien korrelaatioiden määrää. Big datassa on siksi riski, että nähdään toistuvia malleja siellä missä niitä ei oikeasti ole [Boyd et al. 12]. Lisäksi big datan korrelaatiot voivat johtaa tarkoituksettomiin syy-seuraus suhteisiin [Tien 13]. Datan massiivinen määärän takia on riski, että keskitytään vain toistuvien mallien (pattern) tai
11 8 korrelaatioiden etsimiseen ja tehdään johtopäätöksiä ilman että syvästi ymmärretään dataa ja datan dynamiikkaa. Datan mukana ei tule tietoa näytteen tarkkuudesta, joten analyyseistä ei voida sanoa ovatko ne tarkkoja vai eivät. Näytteen suuri koko on merkityksetön, jos otos ei ole edustava [Boyd et al. 12]. Epäedustavia näytteitä ei voida yleistää näytekontekstin ulkopuolelle [Letouzé 12]. Jos datanäyte ei ole edustava, analyysi ei kerro totuutta mitattavasta ilmiöstä. Esimerkiksi digitaalisia palveluita analysoitaessa ei voida tehdä yleistyksiä koko populaatioon, sillä näytedata on vinoutunutta eikä digitaalisten palveluiden käyttäjät edusta koko populaatiota [Letouzé 12]. Myös tekaistu tai väärin tulkittavissa oleva käyttäjien tuottama sisältö voi muuttaa kokonaiskuvaa analysoitavasta ilmiöstä [Letouzé 12]. Visualisointi- ja datan yhdistämistekniikoilla data saadaan pakattua helpommin ymmärrettävään muotoon [Myllymäki et al. 11]. Yhdistetystä datasta voidaan tehdä malli, jota vasten raakaa dataa on helpompi ymmärtää ja luokitella. Esimerkiksi monen vuoden ajalta kerätystä liikennedatasta voidaan tehdä malli yhdistämällä ja tiivistämällä liikennetietoja jaettuna esimerkiksi arkipäiviin ja viikonloppuun. Näin saadusta mallista voidaan arvioida liikenteen sujuvuutta. Jos dataa puuttuu, voidaan puuttuva data korvata arvioilla. Puuttuvan datan korvaamiseen löytyy tilastotieteellisiä imputointimenetelmiä, joissa puuttuva data korvataan sijaisdatalla. Mallia vasten on helppo myös etsiä epäjohdonmukaisuuksia, kun mitattuja tuloksia voidaan verrataan odotusarvoon [Myllymäki et al. 11]. 4.3 Datan yhteenveto Yhdistämällä erilaisia datalähteitä, esimerkiksi strukturoimatonta ja strukturoitua dataa, saadaan syvempää ymmärrystä liiketoiminnasta. Dokumentteja yhdistelemällä (document summarization) voidaan suodattaa turha tieto pois suurista dokumenteista [Lomotey et Deters 13], eli data saadaan pakattua helpommin ymmärrettävään muotoon. Yhdistetyssä dokumentissa samasta aiheesta kirjoitettujen tekstidokumenttien pääpointit pakataan samaan dokumenttiin. Etuna on yhden aiheen kuvailu monesta eri näkökulmasta yhdellä silmäyksellä, ilman että luetaan alkuperäisiä tiedostoja. Dokumenttien yhdistäminen toteutetaan dokumenttien struktuuria analysoimalla ja
12 9 dokumenttien luokittelulla. Käsittelyn tuloksena tuotetaan yhteenvetoraportti ja tuloksia voidaan visualisoida. Videoita voidaan yhdistellä kuvailutiedon (metadata) perusteella, esimerkiksi videotiedostoon liitettyjen hakusanojen perusteella [Myllymäki et al. 11]. Dokumenttien yhdistämisessä strukturoimattomasta datasta tehdyt yhdisteet (aggregaatit) voivat helposti osoittautua huonoiksi [Cuzzocrea et al 13]. Ongelmana on että transaktionaalisen strukturoidun datan ja strukturoimattoman web peräisen datan yhdistäminen on häviöllistä, yli puolet (40-50% success rate) lähdedatasta puuttuu yhdistetyissä tuloksissa [Geopalkrishnan el al 12]. Datan rakeisuus voi johtaa hyvin harvaan ja hajaantuneeseen yhdisteeseen. Datan rakeisuus vaihtelee eri lähteissä saatavuudesta, näytteenoton toistumisesta, yksityisyyssuojasta ja erilaista luottamustasoista johtuen: Osa datasta on saatavilla yksilöllisellä tasolla, osa voi olla saatavilla vain yhdistetasolla. Eri lähteiden näytteenoton toistuminen voi vaihdella. Yksityisyyssyistä henkilöt voivat päättää olla jakamatta tietojaan. Eri analytiikkatulosten osissa voi olla eritasoisia luottamustasoja (confidence level) yhdistettynä niihin [Geopalkrishnan el al 12]. Oleellisten tapahtumien poimiminen ja niiden yhdistäminen muihin tietoihin ajavasta yksilöstä on vaikeaa kustakin mittauskohteesta tulevan suuren datamäärän ja nopeuden takia. Esimerkiksi autosta voidaan kerätä dataa ajonopeudesta, kiihtyvyydestä ja jarrutusmalleista, jotta ymmärrettäisiin ajavan yksilön riskiprofiilia. Ajonopeudesta, kiihtyvyydestä ja jarrutusmalleista syntyy dataa nopeasti ja suuria määriä [Geopalkrishnan el al 12]. Miten löytää oleellinen data? Tässäkin on ongelmana datan identifiointi ja ymmärtäminen. 5 Yhteenveto Työssä tarkasteltiin big datan luokittelun, tutkittavan ilmiön ymmärtämisen ja analyyseissä käytettävien moninaisten lähteiden yhteenvedon haasteita. Big data pakottaa luopumaan optimaalisen datan vaatimuksesta, jossa data esikäsitellään ja varastoidaan tietovarastoihin ja keksimään luovempia, innovatiivisempia tapoja datan analysointiin ja käsittelyyn. Analytiikan sulauttaminen liiketoimintaan parantaa yrityksen kasvua, tehokkuutta ja kilpailuetua, mutta ongelmana on että ei tiedetä miten big dataa voidaan käyttää hyväksi liiketoiminnassa.
13 10 Big data on sotkuista, joten oleellisen tiedon löytäminen, datan tiivistäminen yhteenvedoilla ja tutkittavien ilmiöiden ymmärtäminen big data -analytiikassa on vaikeaa. Datan suuri määrä ei välttämättä johda datan parempaan ymmärrykseen, koska datan määrä hämärtää monimutkaisten syy-seuraussuhteiden ymmärtämistä, lisää mahdollisuutta vääriin korrelaatioihin, näytedatan mahdollista vinoumaa voi olla vaikeampi hahmottaa ja koska datan tarkkuudesta ei ole tietoa. Datan ymmärtämistä voidaan helpottaa visualisointi- ja yhdistämistekniikoilla, joiden avulla voidaan suodattaa oleellinen tieto esimerkiksi suurista dokumenteista. Yhdisteissä ongelmana on datan puuttuminen lähteiden eri rakeisuustasojen, yksityisyydensuojan ja näytteenottotiheyden takia. Jotta ilmiötä voidaan ymmärtää ja tiivistää, täytyy ensin määritellä mikä on normaalia ja epänormaalia dataa. Luokittelu tehostaa big datan käsittelyä enemmän kuin algoritmien parantaminen, mutta ongelmana on luokitella suodattimet niin että arvokasta tietoa ei heitetä pois. Dataa identifioimalla ja luokitelemalla mahdollisimman aikaisessa vaiheessa voidaan löytää massasta mielenkiintoinen tieto. Mielenkiintoinen ja arvokas data löytyy lähestymällä dataa esimerkiksi kysymys ensin periaatteella.
14 11 Lähteet Laney01 D. Laney. 3-D Data Management: Controlling Data Volume, Velocity and Variety. META Group Research Note, February 6, Tien 13 J. M.Tien, Big data: unleashing information, Journal of Systems Science and Systems Engineering, vol 22, issue 2, p , June Kimball 12 R. Kimball, Newly Emerging Best Practices for Big Data, Kimball Consulting Group White Paper, Devlin et al. 12 B. Devlin, S. Rogers, and J. Myers, Big data comes of age, Tech. Rep. November Cuzzocrea et al 13 A. Cuzzocrea, D. Saccà, J. D. Ullman Big data: a research agenda. In Proceedings of the 17th International Database Engineering & Applications Symposium (IDEAS '13). ACM, New York, NY, USA, , LaValle et al 11 S. LaValle, E. Lesser,R. Shockley, M. S. Hopkins, N. Kruschwitz, Big data, analytics and the path from insights to value. MIT Sloan Management Review, vol. 52, no. 2, p , Winter Parker 12 C. Parker, Unexpected challenges in large scale machine learning, In Proceedings of the 1st International Workshop on Big Data, Streams and Heterogeneous Source Mining: Algorithms, Systems, Programming Models and Applications (BigMine '12). ACM, New York, NY, USA, 1-6, Letouzé 12 E. Letouzé, Big Data for Development: Opportunities & Challenges, Global Pulse May Madsen 13 M. Madsen, The Challenges of Big Data & Approaches to Data Quality: Using big data to examine and discover the value in data for accurate analytics, Technology White paper, Third Nature Inc. and SAP AG, 2013.
15 12 Geopalkrishnan el al 12 V. Gopalkrishnan, D. Steier, H. Lewis, and J. Guszcza, Big data, big business: bridging the gap, In Proceedings of the 1st International Workshop on Big Data, Streams and Heterogeneous Source Mining: Algorithms, Systems, Programming Models and Applications, Big- Mine 12, pages 7 11, New York, NY, USA, ACM, Bizer et al. 12 C. Bizer, P. Boncz, M. L. Brodie, O. Erling, The meaningful use of big data: four perspectives -- four challenges. SIGMOD Rec. 40, 4, January, 56-60, Fan et Bifet 13 W. Fan, A. Bifet, Mining big data: current status, and forecast to the future, SIGKDD Explor. Newsl. Volume 14, Issue 2, April, 1-5, Boyd et al. 12 D. Boyd and K. Crawford. Critical Questions for Big Data. Information, Communication and Society, 15(5): , Myllymäki et al. 11 P. Myllymäki, J. Ahtikari, K. Puolamäki, C. Carlsson, S. Sahala, R. Saarnio,P. Kurki, Strategic Research Agenda for Data to Intelligence (D2I), version 1.0 TiVit, June CERN, 08 CERN (2008): Worldwide LHC Computing Grid. Zikopoulos et al 11 P. Zikopoulos, C. Eaton, D. deroos, T. Deutsch, G. Lapis, IBM Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data,McGraw-Hill Companies,Incorporated, Labrinidis et al. 12 A. Labrinidis, H. V. Jagadish, Challenges and opportunities with big data. Proc. VLDB Endow. 5, 12 (August 2012). Lomotey et Deters 13 R.K Lomotey, R. Deters, "Unstructured data extraction in distributed NoSQL," Digital Ecosystems and Technologies (DEST), 7th IEEE International Conference on, vol., no., pp.160,165, July 2013.
arvostelija OSDA ja UDDI palveluhakemistoina.
Hyväksymispäivä Arvosana arvostelija OSDA ja UDDI palveluhakemistoina. HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta/Osasto Fakultet/Sektion Faculty/Section Laitos Institution
LisätiedotSelainpelien pelimoottorit
Selainpelien pelimoottorit Teemu Salminen Helsinki 28.10.2017 Seminaaritutkielma Helsingin yliopisto Tietojenkäsittelytiede ! 1 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta
LisätiedotAika/Datum Month and year Kesäkuu 2012
Tiedekunta/Osasto Fakultet/Sektion Faculty Laitos/Institution Department Filosofian, historian, kulttuurin ja taiteiden tutkimuksen laitos Humanistinen tiedekunta Tekijä/Författare Author Veera Lahtinen
LisätiedotArkkitehtuurinen reflektio
Arkkitehtuurinen reflektio Toni Ruokolainen Toni.Ruokolainen@cs.helsinki.fi Helsinki 6.10.2003 Tiivistelmä HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET
LisätiedotLaskennallinen yhteiskuntatiede
Laskennallinen yhteiskuntatiede Matti Nelimarkka Helsinki 5.5.2011 LuK tutkielma HELSINGIN YLIOPISTO Tietojenkasittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta
LisätiedotMaailman muutosta tallentamassa Marko Vuokolan The Seventh Wave -valokuvasarja avauksena taidevalokuvan aikaan
Maailman muutosta tallentamassa Marko Vuokolan The Seventh Wave -valokuvasarja avauksena taidevalokuvan aikaan Pro gradu -tutkielma 31.1.2012 Helsingin yliopisto Humanistinen tiedekunta Filosofian, historian,
LisätiedotTyön laji Arbetets art Level Aika Datum Month and year Sivumäärä Sidoantal Number of pages
Tiedekunta/Osasto Fakultet/Sektion Faculty Laitos Institution Department Tekijä Författare Author Työn nimi Arbetets titel Title Oppiaine Läroämne Subject Työn laji Arbetets art Level Aika Datum Month
LisätiedotKoht dialogia? Organisaation toimintaympäristön teemojen hallinta dynaamisessa julkisuudessa tarkastelussa toiminta sosiaalisessa mediassa
Kohtdialogia? Organisaationtoimintaympäristönteemojenhallinta dynaamisessajulkisuudessatarkastelussatoiminta sosiaalisessamediassa SatuMariaPusa Helsinginyliopisto Valtiotieteellinentiedekunta Sosiaalitieteidenlaitos
LisätiedotPro gradu -tutkielma Meteorologia SUOMESSA ESIINTYVIEN LÄMPÖTILAN ÄÄRIARVOJEN MALLINTAMINEN YKSIDIMENSIOISILLA ILMAKEHÄMALLEILLA. Karoliina Ljungberg
Pro gradu -tutkielma Meteorologia SUOMESSA ESIINTYVIEN LÄMPÖTILAN ÄÄRIARVOJEN MALLINTAMINEN YKSIDIMENSIOISILLA ILMAKEHÄMALLEILLA Karoliina Ljungberg 16.04.2009 Ohjaajat: Ari Venäläinen, Jouni Räisänen
LisätiedotLuonnontieteiden popularisointi ja sen ideologia
Luonnontieteiden popularisointi ja sen ideologia Tapauksina Reino Tuokko ja Helsingin Sanomat 1960-luvulla Ahto Apajalahti Helsingin yliopisto Humanistinen tiedekunta Suomen ja Pohjoismaiden historia Pro
Lisätiedot! #! %! & #!!!!! ()) +
! #! %! & #!!!!! ()) + Tiedekunta/Osasto Fakultet/Sektion Faculty Humanistinen tiedekunta Laitos Institution Department Taiteiden tutkimuksen laitos Tekijä Författare Author Matti Pesonen Työn nimi Arbetets
LisätiedotLAS- ja ilmakuva-aineistojen käsittely ArcGIS:ssä
Esri Finland LAS- ja ilmakuva-aineistojen käsittely ArcGIS:ssä November 2012 Janne Saarikko Agenda Lidar-aineistot ja ArcGIS 10.1 - Miten LAS-aineistoa voidaan hyödyntää? - Aineistojen hallinta LAS Dataset
LisätiedotKatsaus korruption vaikutuksesta Venäjän alueelliseen talouskasvuun ja suoriin ulkomaisiin investointeihin
INSTITUUTIOTTALOUSKASVUNEDELLYTYKSENÄ KatsauskorruptionvaikutuksestaVenäjänalueelliseentalouskasvuunjasuoriin ulkomaisiininvestointeihin2000 2010 AshekMohamedTarikHossain HelsinginYliopisto Valtiotieteellinentiedekunta
LisätiedotDepartment of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.
Roolit Tommi Perälä Department of Mathematics, Hypermedia Laboratory Tampere University of Technology 25.3.2011 J. Kleinberg kehitti -algoritmin (Hypertext Induced Topic Search) hakukoneen osaksi. n taustalla
LisätiedotTehostettu kisällioppiminen tietojenkäsittelytieteen ja matematiikan opetuksessa yliopistossa Thomas Vikberg
Tehostettu kisällioppiminen tietojenkäsittelytieteen ja matematiikan opetuksessa yliopistossa Thomas Vikberg Matematiikan ja tilastotieteen laitos Tietojenkäsittelytieteen laitos Kisällioppiminen = oppipoikamestari
LisätiedotVisuaaliset työpöydät - lisää voimaa liiketoimintaan suurten datamassojen ketterästä analysoinnista
Visuaaliset työpöydät - lisää voimaa liiketoimintaan suurten datamassojen ketterästä analysoinnista Tomas Rytkölä Presales Leader Business Analytics 2013 IBM Corporation Agenda 1 Miten saadaan lisää voimaa
LisätiedotHallintomallit Suomen valtionhallinnon tietohallintostrategioissa
Hallintomallit Suomen valtionhallinnon tietohallintostrategioissa Lauri Eloranta Helsingin yliopisto Valtiotieteellinen tiedekunta Viestintä Pro gradu -tutkielma, 2014 Hallintomallit)Suomen)valtionhallinnon)tietohallintostrategioissa
LisätiedotAsuntojen neliöhinnan vaihtelu Helsingissä (1997-2010)
hyväksymispäivä arvosana arvostelija Asuntojen neliöhinnan vaihtelu Helsingissä (1997-2010) Tuomas Puikkonen Helsinki 8.1.2010 Geoinformatiikan menetelmät ja kirjallisuus -kurssin harjoitustyö HELSINGIN
LisätiedotKäyttökokemuksen evaluoinnista käyttökokemuksen ohjaamaan suunnitteluun. ecommunication & UX SUMMIT 18.9.2013 Eija Kaasinen, VTT
Käyttökokemuksen evaluoinnista käyttökokemuksen ohjaamaan suunnitteluun ecommunication & UX SUMMIT 18.9.2013 Eija Kaasinen, VTT 2 Hyvä käyttökokemus Laadukas käyttökokemus Ylivoimainen käyttäjäkokemus
LisätiedotOpetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä
Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä Jukka Paukkeri (projektitutkija) Tampereen Teknillinen Yliopisto Matematiikan laitos Intelligent Information Systems Laboratory
LisätiedotXML-tutkimus Jyväskylän yliopistossa
XML-tutkimus Jyväskylän yliopistossa Airi Salminen Jyväskylän yliopisto Tietojenkäsittelytieteiden laitos airi.salminen@jyu.fi http://www.cs.jyu.fi/~airi/ Airi Salminen, XML-tutkimus Jyväskylän yliopistossa
LisätiedotSairaanhoitopiirien talouden ohjauksen tehokkuus
Alpo Karila Sairaanhoitopiirien talouden ohjauksen tehokkuus Tutkimus sairaanhoitopiirien ohjausjärjestelmien toiminnasta, taloudellisista kannusteista ja kustannushallinnasta Alpo Karila 1 Miksi? - Kunnat
LisätiedotMonimutkaisesta datasta yksinkertaiseen päätöksentekoon. SAP Finug, Emil Ackerman, Quva Oy
Monimutkaisesta datasta yksinkertaiseen päätöksentekoon SAP Finug, 9.9.2015 Emil Ackerman, Quva Oy Quva Oy lyhyesti Quva kehittää innovatiivisia tapoja teollisuuden automaation lisäämiseksi Internetin
LisätiedotTeollisuuden digitalisaatio ja johdon ymmärrys kyvykkyyksistä
Teollisuuden digitalisaatio ja johdon ymmärrys kyvykkyyksistä Markus Kajanto Teollisuuden digitalisaation myötä johdon käsitykset organisaation resursseista, osaamisesta ja prosesseista ovat avainasemassa
LisätiedotARVOA PALVELUPROSESSIEN ANALYSOINNILLA
ARVOA PALVELUPROSESSIEN ANALYSOINNILLA Työkalupäivät 31.8.2016 Ilkka Mikkonen Infotool Oy Taustat Ilkka Mikkonen Infotool - Toimitusjohtaja Konsultointia 25v Palveluiden ja tietotekniikan yhdistäjä Analytiikka,
LisätiedotOppimateriaalin kokoaminen ja paketointi
Oppimateriaalin kokoaminen ja paketointi Pekka Simola Helsinki 14.4.2004 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta/Osasto
LisätiedotOntologiakirjasto ONKI-Paikka
Ontologiakirjasto ONKI-Paikka Tomi Kauppinen, Robin Lindroos, Riikka Henriksson, Eero Hyvönen Semantic Computing Research Group (SeCo) and University of Helsinki and Helsinki University of Technology (TKK)
LisätiedotPaikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com
Paikkaontologiat Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com Mihin tarvitaan paikkaontologioita? Jokainen meistä liittyy paikkoihin Esimerkkejä:
LisätiedotTekoäly muuttaa arvoketjuja
Tekoäly muuttaa arvoketjuja Näin kartoitat tekoälyn mahdollisuuksia projektissasi Harri Puolitaival Harri Puolitaival Diplomi-insinööri ja yrittäjä Terveysteknologia-alan start-up: Likelle - lämpötilaherkkien
LisätiedotPoikkeavuuksien havainnointi (palvelinlokeista)
Poikkeavuuksien havainnointi (palvelinlokeista) TIES326 Tietoturva 2.11.2011 Antti Juvonen Sisältö IDS-järjestelmistä Datan kerääminen ja esiprosessointi Analysointi Esimerkki Lokidatan rakenne Esikäsittely,
LisätiedotTaloushallinnon digitalisoituminen haaveilua ja arveluttavaa todellisuutta?
Taloushallinnon digitalisoituminen haaveilua ja arveluttavaa todellisuutta? Työelämän tutkimuspäivät Työryhmä 32. Suomalaisen työn kiperimmät haasteet tulevaisuudessa Tampereen yliopisto 4.11.2016 Pirkko
LisätiedotPrognos Julkaisusuunnitelmat
Prognos Julkaisusuunnitelmat Työsuunnitelmiin liittyvien raporttien ja vuosiseminaarien lisäksi suunnitellut julkaisut Casejoryt 09/2005 & JR4 25.1.2005 päivitetty tilanne Casejoryt 04/2006 päivitetty
LisätiedotData-analyysi tieteenalana Professori, laitosjohtaja Sasu Tarkoma Tietojenkäsittelytieteen laitos Helsingin yliopisto
Data-analyysi tieteenalana Professori, laitosjohtaja Sasu Tarkoma Tietojenkäsittelytieteen laitos Helsingin yliopisto Faculty of Science Department of Computer Science www.cs.helsinki.fi 9.5.2017 1 Sisällys
LisätiedotTiedonlouhinta rakenteisista dokumenteista (seminaarityö)
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/
LisätiedotCustomer Intelligence ja Big Data. Digile D2I Kimmo Valtonen
Customer Intelligence ja Big Data Digile D2I Kimmo Valtonen Sisältö 1. Data2Intelligence-ohjelman kuvaus 2. Customer Intelligence: mitä sillä tässä tarkoitetaan? 3. Customer Intelligence Big Data ongelmana
LisätiedotMissä mennään BI? Mikko Kontio
Missä mennään BI? Mikko Kontio Source: EMC - Big Data in 2020 % Business Intelligence Business Analytics set of theories, methodologies, architectures, and technologies that transform raw data into meaningful
LisätiedotTalent Management parhaat käytännöt -kartoituksen tulokset
Talent Management parhaat käytännöt -kartoituksen tulokset Tutkimuksen tarkoituksena oli selvittää suomalaisten yritysten käytäntöjä Talent Managementissa ja liiketoiminnan tilanteen vaikutusta valittuihin
LisätiedotUusia tuulia mediaseurannassa:! PR-palveluiden integraatio ja digitalisoituva maailma. Copyright @ Koodiviidakko Oy
Uusia tuulia mediaseurannassa:! PR-palveluiden integraatio ja digitalisoituva maailma. Webnewsmonitor verkkomedian seuranta Maailma muuttuu! Muste sormenpäissä on vaihtunut sormenjälkiin ipadin näytöllä.
LisätiedotBachelor level exams by subject in Otaniemi
Bachelor level exams by subject in Otaniemi 2015-2016 (VT1 means that the place of the exam will be announced later) YOU FIND INFORMATION ABOUT THE PLACE OF THE EXAM IN OTAKAARI 1 U-WING LOBBY (M DOOR)
LisätiedotKielitieteellisten aineistojen käsittely
Kielitieteellisten aineistojen käsittely 1 Johdanto...1 2 Aineistojen kommentointi, metadatan tyypit...1 3 Aineistojen käsittely...2 3.1 Rakenteisten kieliaineistojen kyselykielet...2 3.2 Tiedonlouhinta
LisätiedotAloittelijasta Internet markkinoinnin sankariksi. Artem Daniliants / LumoLink
Aloittelijasta Internet markkinoinnin sankariksi Artem Daniliants / LumoLink CEO at LumoLink Verkkokauppa & Web teknologian asiantuntija 13+ vuotta kokemusta Internet liiketoiminnasta 10+ vuotta kokemusta
LisätiedotWEBINAARI 24.11.2015
WEBINAARI 24.11.2015 Analytiikan hyödyntäminen markkinoinnissa Petri Mertanen, Super Analytics - @mertanen Jarno Wuorisalo, Cuutio - @jarnowu Tomi Grönfors, Brandfors - @groenforsmethod WEBINAARIN ISÄNNÄT
LisätiedotKuluttajien tutkiminen 23C580 Kuluttajan käyttäytyminen Emma Mäenpää
Kuluttajien tutkiminen 23C580 Kuluttajan käyttäytyminen Emma Mäenpää Case New Coke Vuonna 1985 Coca-Cola Company päätti tuoda markkinoille uuden kolajuoman New Cola Makeampi versio perinteisestä Coca Colasta
LisätiedotValtionhallinnon käyttäjäpäivä - IBM Cognosin tulevaisuuskatsaus ja nykypäivä
Valtionhallinnon käyttäjäpäivä - IBM Cognosin tulevaisuuskatsaus ja nykypäivä Tomas Rytkölä Sr. Solution Specialist, Business Intelligence and Performance Management IBM IBM:n yhteistoiminta IBM Power
Lisätiedotmonitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.
Epätäydellisen preferenssiinformaation hyödyntäminen monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi 15.1.2018 Ohjaaja: Prof. Kai Virtanen Valvoja: Prof. Kai Virtanen Tausta Päätöspuu
LisätiedotCALL TO ACTION! Jos aamiaistilaisuudessa esillä olleet aiheet kiinnostavat syvemminkin niin klikkaa alta lisää ja pyydä käymään!
CALL TO ACTION! Jos aamiaistilaisuudessa esillä olleet aiheet kiinnostavat syvemminkin niin klikkaa alta lisää ja pyydä käymään! Monikanavaisen viestinnän mittaaminen: https://www.vapamedia.fi/mittaaminen/
LisätiedotSulautettu tietotekniikka 2007 2013 Kimmo Ahola
M2M - uutta liiketoimintaa ja rahoitusta - työpaja 19.2.2013, Tampere Sulautettu tietotekniikka 2007 2013 Kimmo Ahola Ubicom ohjelman päällikkö, Twitter: @KimmoAhola Helmikuu 2013 Ubicom Embedded ICT Finland
LisätiedotTUTKIMUSDATAN KUVAILU. Kuvailun tiedotuspäivä Tieteenala-asiantuntija, FT Katja Fält
TUTKIMUSDATAN KUVAILU Kuvailun tiedotuspäivä 27.9.2017 Tieteenala-asiantuntija, FT Katja Fält Sisältö Reilu tutkimusdata (FAIR-periaatteet) ja kuvailu Tutkimusdatan kuvailun pääpiirteet Tutkimusdatan kuvailu
Lisätiedotpunainen lanka - Kehitysjohtaja Mcompetence Oy 20.3.2012 markokesti.com Työhyvinvoinnin kohtaamispaikka Sykettätyöhön.
Henkilöstötuottavuuden punainen lanka - työhyvinvoinnilla tuottavuutta Marko Kesti Kehitysjohtaja Mcompetence Oy 20.3.2012 Ota yhteyttä ja seuraa blogiani: markokesti.com Työhyvinvoinnin kohtaamispaikka
LisätiedotSisällönanalyysi. Sisältö
Sisällönanalyysi Kirsi Silius 14.4.2005 Sisältö Sisällönanalyysin kohde Aineistolähtöinen sisällönanalyysi Teoriaohjaava ja teorialähtöinen sisällönanalyysi Sisällönanalyysi kirjallisuuskatsauksessa 1
LisätiedotBachelor level exams by date in Otaniemi
Bachelor level exams by date in Otaniemi 2015-2016 (VT1 means that the place of the exam will be announced later) YOU FIND INFORMATION ABOUT THE PLACE OF THE EXAM IN OTAKAARI 1 U-WING LOBBY (M DOOR) Day
LisätiedotInt rane n avoit itemitt ittarit
Intranetin ti tavoitemittarit itt 17.9.2009 Marko Merisavo, KTT DiViA-tiimi / Systencess Oy Agenda Investoinnin tuotto? Case SodexhoNet Tavoitemittarit KPI:n määritelmä KPI:n luominen KPI-esimerkki Mittaristo
LisätiedotAalto University School of Engineering Ongelmaperusteisen oppimisen innovatiivinen soveltaminen yliopisto-opetuksessa
Aalto University School of Engineering Ongelmaperusteisen oppimisen innovatiivinen soveltaminen yliopisto-opetuksessa Cleantech gaalan iltapäiväseminaari 20.11.2013 Helena Mälkki & Petri Peltonen Aalto-yliopisto,
LisätiedotSYSTEEMIJOHTAMINEN! Sami Lilja! itsmf Finland 2014! Oct 2-3 2014! Kalastajatorppa, Helsinki! Reaktor 2014
SYSTEEMIJOHTAMINEN! Sami Lilja! itsmf Finland 2014! Oct 2-3 2014! Kalastajatorppa, Helsinki! Reaktor Mannerheimintie 2 00100, Helsinki Finland tel: +358 9 4152 0200 www.reaktor.fi info@reaktor.fi 2014
LisätiedotTechnopolis Business Breakfast Technopolis, Kuopio
Technopolis Business Breakfast Technopolis, Kuopio 27.9.2012 Oskari Uotinen Intosome Oy on yhteisöllisen bisneskehityksen asiantuntijayritys. Autamme asiakkaitamme ymmärtämään ja hyödyntämään yhteisöllisiä
LisätiedotTiedekunta/Osasto Fakultet/Sektion Faculty Valtiotieteellinen tiedekunta
Tiedekunta/Osasto Fakultet/Sektion Faculty Valtiotieteellinen tiedekunta Laitos Institution Department Politiikan ja talouden tutkimuksen laitos Tekijä Författare Author Virta, Mikko Antero Työn nimi Arbetets
LisätiedotHand-out kooste26.3.2009
Hand-out kooste26.3.2009 Human Capital Management IT Viikko-seminaari 26.3.2009 Sanomatalo Arc Technology Oracle - Xenetic Aamupäivän agenda 09.10-10.10 Arc Technology 10.10-10.25 Kahvitauko ja verkottuminen
LisätiedotPoweria analytiikkaan
IBM 18.3.2014 Poweria analytiikkaan Informaatiotalous: mikä on muuttunut Keskiajalta jälkiteolliseen yhteiskuntaan Maatalous: maan omistus Teollinen: tuotantokapasiteetin omistus Jälkiteollinen: kyky hyödyntää
LisätiedotWebforum. Version 17.3 uudet ominaisuudet. Päivitetty:
Webforum Version 17.3 uudet ominaisuudet Päivitetty: 2017-09-23 Sisältö Tervetuloa uudistuneeseen Webforumiin!... 3 Yhteenveto... 4 Dokumentit... 5 Autodesk Forge korvaa RasterExin... 5 Laajennettu API...
LisätiedotYhteisöllisen toimintatavan jalkauttaminen!
Yhteisöllisen toimintatavan jalkauttaminen! Käyttöönoton vaiheet Yrityksen liiketoimintatavoitteet Yhteisöllisen toimintatavan käyttöalueet Työkalut Hyödyt yritykselle Hyödyt ryhmälle Hyödyt itselle Miten
LisätiedotAutamme asiakkaitamme menestymään parantamalla tekemisen luottamustasoa ja läpinäkyvyyttä uusilla innovatiivisilla konsepteilla ja ratkaisuilla.
Celkee Oy:n Missio Autamme asiakkaitamme menestymään parantamalla tekemisen luottamustasoa ja läpinäkyvyyttä uusilla innovatiivisilla konsepteilla ja ratkaisuilla. Tuomme organisaatioiden piilossa olevan
LisätiedotKuinka onnellisia suomalaiset ovat työssään? Human@Work 30/09/2014 1
Kuinka onnellisia suomalaiset ovat työssään? Human@Work 30/09/2014 1 Human@Work Human@Work auttaa asiakkaitaan rakentamaan innostavasta yrityskulttuurista kestävää kilpailuetua palveluliiketoimintaan.
LisätiedotTietokannan eheysrajoitteet ja niiden määrittäminen SQL-kielellä
hyväksymispäivä arvosana arvostelija Tietokannan eheysrajoitteet ja niiden määrittäminen SQL-kielellä Tuomas Husu Helsinki 20.2.2010 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Sisältö i 1 Johdanto
LisätiedotMalliperustainen ohjelmistokehitys (Model-Driven Engineering, MDE)
Malliperustainen ohjelmistokehitys (Model-Driven Engineering, MDE) Pasi Lehtimäki Helsinki 10.9.2007 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY
LisätiedotWEBINAARIN ISÄNNÄT. Jarno Wuorisalo Cuutio.fi. Petri Mertanen Superanalytics.fi. Tomi Grönfors Brandfors.com
WEBINAARI 3.11.2015 Mitä Tag Management on käytännössä ja miten se vaikuttaa analytiikkaan? Petri Mertanen, Super Analytics - @mertanen Jarno Wuorisalo, Cuutio - @jarnowu Tomi Grönfors, Brandfors - @groenforsmethod
LisätiedotUseaa tietolähdettä käyttävä klusterointi
Useaa tietolähdettä käyttävä klusterointi Mikko Heinonen Tiedon louhinnan seminaari, kevät 2008 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos 1 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY
LisätiedotMammutti vai elefantti?
Mammutti vai elefantti? Tänään tarjolla Arkkitehtuuri - baseline Esittelyssä Elefantti ylhäältä ja alhaalta teoriaa ja kokemuksia Elefantti vs. Mammutti Kuka vie peliä ja millä säännöillä Meidän esimerkki
LisätiedotMobiili. MULLISTAA MYYNTITYÖN Technopolis Business Breakfast, 12.9.2014
Mobiili MULLISTAA MYYNTITYÖN Technopolis Business Breakfast, 12.9.2014 AIHEITA Taustaa Keskeiset muutoksen tekijät Pilvipalvelut ja sovelluskauppa Mahdollisuudet myyntityössä Miksi myyntiaineistot ja asiakastapaamiset?
LisätiedotDataintensiivinen tutkimus ja osaamistarpeet tutkimuslaitoksissa
Dataintensiivinen tutkimus ja osaamistarpeet tutkimuslaitoksissa Sanna Marttinen, Tutkimuslaitosten yhteenliittymä Tulanet 22.11.2018, DL2021-kehittämisohjelman vuosiseminaari Tutkittua tietoa luonnonvaroista
LisätiedotII Voitto-seminaari Konseptointivaihe 01.04.04
II Voitto-seminaari Konseptointivaihe 01.04.04 08.45-09.00 Kahvi Voitto II seminaariohjelma 01.04.04 09.00-09.15 Tuotekonseptoinnin haasteet/ VTT Tiina Apilo 09.15-09.30 Konseptoinnin eri tasot/ TKK Matti
LisätiedotYksityisyydestä käytävä verkkokeskustelu
Yksityisyydestä käytävä verkkokeskustelu KOKEILUJA, HUOMIOITA JA KYSYMYKSIÄ Esa Sirkkunen, tutkija, tutkimuskeskus COMET, Tampereen yliopisto Mediatutkimuksen päivät, Vaasa 04.04. 2014. Pieniä ja isompia
LisätiedotYhteisöllisyys osana liiketoiminnan strategisia. Ville Laurinen
Yhteisöllisyys osana liiketoiminnan strategisia tavoitteita Ville Laurinen Taustaa Ville Laurinen, toimitusjohtaja Perustanut Ambientian vuonna 1996 Verkkoliiketoiminnan ja erilaisten konseptien asiantuntija
LisätiedotKasvuyrityksen tuotekehitysportfolion optimointi (valmiin työn esittely)
Kasvuyrityksen tuotekehitysportfolion optimointi (valmiin työn esittely) Santtu Saijets 16.6.2014 Ohjaaja: Juuso Liesiö Valvoja: Ahti Salo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla.
LisätiedotTuotekehitysverkoston läpimenoajan lyhentäminen tuotemuutostenhallinnalla ja verkoston tietojärjestelmien integroinnilla
Tuotekehitysverkoston läpimenoajan lyhentäminen tuotemuutostenhallinnalla ja verkoston tietojärjestelmien integroinnilla Yhteenveto NetData-tutkimusprojektin tuloksista http://www.soberit.hut.fi/netdata/
LisätiedotOpenUP ohjelmistokehitysprosessi
OpenUP ohjelmistokehitysprosessi Sami Männistö Helsinki 14.11.2008 Seminaari HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos i HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET Tiedekunta/Osasto Matemaattis-luonnontieteellinen
LisätiedotTrialogisen oppimisen suunnitteluperiaatteet
Trialogisen oppimisen suunnitteluperiaatteet Tekijät: Hanni Muukkonen, Minna Lakkala, Liisa Ilomäki ja Sami Paavola, Helsingin yliopisto 1 Suunnitteluperiaatteet trialogisen oppimisen pedagogiikalle 1.
LisätiedotTableaun hyödyntäminen Toyota Rahoituksessa
Tableaun hyödyntäminen Toyota Rahoituksessa Lauri Varonen Toyota Finance Finland Oy Myynti & markkinointi 12.6.2015 Toyota Finance Finland Oy Tehtaan omistama rahoitusyhtiö 3 Toyota Finance Finland Oy
LisätiedotMobiilit käyttöliittymät lääkitystietoon
Mobiilit käyttöliittymät lääkitystietoon Katja Leiviskä, Harri Oinas-Kukkonen, Teppo Räisänen Oulun yliopisto, Tietojenkäsittelytieteiden laitos katja.leiviska@oulu.fi, harri.oinas-kukkonen@oulu.fi, teppo.raisanen@oulu.fi
Lisätiedot!"#$%&'$("#)*+,!!,"*--.$*#,&--#"*/".,,%0 1&'23456789::94752;&27455<:4;2;&,9:=>23?277<&8=@74;9&ABBCDABBE
!"#$%&'$("#)*+,!!,"*--.$*#,&--#"*/".,,%0 1&'23456789::94752;&2745523?27747544H9;&IG@&JG9?=&15=5H42>:9 '28
LisätiedotTyöhyvinvointi ja tuottavuus
Työhyvinvointi ja tuottavuus DI HTT Marko Kesti marko.kesti@mcompetence.com EVP HRM-Performance, Mcompetence Oy Researcher, Lapin Yliopisto Tietokirjailija, Suomen tietokirjailijat ry Henkilöstö on yrityksen
LisätiedotRiskiperusteisen Vaikuttamisen Prosessi. Maaliskuu 2015
Riskiperusteisen Vaikuttamisen Prosessi Maaliskuu 2015 Riskiperusteisuus Käytettävissä olevilla resursseilla saadaan aikaan maksimaalinen positiivinen vaikutus liikennejärjestelmän riskeihin. Riskiperusteisen
LisätiedotAineiston analyysin vaiheita ja tulkintaa käytännössä. LET.OULU.FI Niina Impiö Learning and Educational Technology Research Unit
Aineiston analyysin vaiheita ja tulkintaa käytännössä LET.OULU.FI Niina Impiö 14.4.2010 Väitöskirjatutkimuksen tavoite Ymmärtää opettajayhteisöjen yhteisöllistä työskentely- ja toimintakulttuuria. Tutkia
LisätiedotMitä taitoja tarvitaan tekstin ymmärtämisessä? -teorian kautta arkeen, A.Laaksonen
Mitä taitoja tarvitaan tekstin ymmärtämisessä? -teorian kautta arkeen, A.Laaksonen Lukemisen taitoja Tulisi kehittää kaikissa oppiaineissa Vastuu usein äidinkielen ja S2-opettajilla Usein ajatellaan, että
LisätiedotTULEVAISUUDEN YHTEISKUNTAA JOHDETAAN TIEDOLLA
TULEVAISUUDEN YHTEISKUNTAA JOHDETAAN TIEDOLLA 7.11.2017 / Jyväskylä Harri Laihonen Tutkimusjohtaja, PhD, KTM AGENDA 1. Tietojohtamisen silmälasit 2. Miltä maailma näyttää näillä laseilla tänään ja huomenna?
LisätiedotRyhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.
Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes 11.06.2012 Ohjaaja: TkT Arto Klami Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla
LisätiedotTIEDONHAKU INTERNETISTÄ
TIEDONHAKU INTERNETISTÄ Internetistä löytyy hyvin paljon tietoa. Tietoa ei ole mitenkään järjestetty, joten tiedonhaku voi olla hankalaa. Tieto myös muuttuu jatkuvasti. Tänään tehty tiedonhaku ei anna
LisätiedotDigitaalisuus palvelumuotoilussa. Annemari Auvinen Digipolku
Digitaalisuus palvelumuotoilussa Annemari Auvinen Digipolku Palvelumuotoilutyöpaja Keskustele parin kanssa: Millaisia hyviä kokemuksia sinulla on erilaisista palveluista, joissa digitaalisuus on ollut
LisätiedotOtannasta ja mittaamisesta
Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,
Lisätiedotarvostelija Turvallisuuskriittisissä, sulautetuissa järjestelmissä esiintyvien ohjelmistovaatimusten virheanalyysi Jarkko-Juhana Sievi
hyväksymispäivä arvosana arvostelija Turvallisuuskriittisissä, sulautetuissa järjestelmissä esiintyvien ohjelmistovaatimusten virheanalyysi Jarkko-Juhana Sievi Helsinki 6.4.2005 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen
LisätiedotLiikkuvien työkoneiden etäseuranta
Liikkuvien työkoneiden etäseuranta TAMK IoT Seminaari 14.4.2016 2 1) IoT liiketoiminnan tukena 2) Iot ja liikkuvat työkoneet 3) Case esimerkit 4) Yhteenveto, johtopäätökset, tulevaisuuden näkymät Cinia
Lisätiedot10 yleistä hakukoneoptimointivirhettä
10 yleistä hakukoneoptimointivirhettä Markus Ossi SEO Technician Klikkicom 2011-05-26 2 Henkilökuva Markus Ossi 32 vuotias ekonomi Tehnyt hakukoneoptimointia vuodesta 1998 Hakukoneoptimointiteknikk o Klikkicomissa
LisätiedotKiinteistö- ja rakennusalan digitalisaatio: BIM & GIS
Kiinteistö- ja rakennusalan digitalisaatio: BIM & GIS Kiinteistön elinkaari Kiinteistö- ja rakennusalan digitalisaatio. Miten tämän perinteisen alan digitalisaatio käytännössä tapahtuu ja mitä hyötyjä
LisätiedotAvoin data ja sen hyödyntäminen tähtitieteessä. Juhani Huovelin Fysiikan laitos Helsingin yliopisto
Avoin data ja sen hyödyntäminen tähtitieteessä Juhani Huovelin Fysiikan laitos Helsingin yliopisto Avoin data avain uuteen, 1.11.2011 Tiedesatelliittien datat tallennettu julkisiin arkistoihin jo kymmeniä
LisätiedotWebropol-kyselyt. Tarja Heikkilä
Webropol-kyselyt Tarja Heikkilä Internet-kyselyt Soveltuvat kyselyihin, joissa kaikilla perusjoukon jäsenillä on mahdollisuus internetin käyttöön, toisin sanoen on mahdollisuus edustavan aineiston saamiseen.
LisätiedotTekoäly liiketoiminnassa. Tuomas Ritola CEO, selko.io
Tekoäly liiketoiminnassa Tuomas Ritola CEO, selko.io Selko.io Automaattista teknisen tekstin luokittelua ja analysointia, eli tekoälyä tekstidatalle. Päivän agenda: Tekoäly. Muotisana? Strategia? Uhka?
LisätiedotScheduling of Genetic Analysis Workflows on Grid Environments (valmiin työn esittely) Arttu Voutilainen
Scheduling of Genetic Analysis Workflows on Grid Environments (valmiin työn esittely) Arttu Voutilainen 20.4.2015 Ohjaaja: FT Lauri Eronen (Biocomputing Platforms Ltd.) Valvoja: Prof. Harri Ehtamo Työn
LisätiedotViisi vinkkiä tasokkaaseen tiedolla johtamiseen ja parempaan asiakasymmärrykseen
Viisi vinkkiä tasokkaaseen tiedolla johtamiseen ja parempaan asiakasymmärrykseen Big Data Solutions Oy 2017 VIISI VINKKIÄ TASOKKAASEEN TIEDOLLA JOHTAMISEEN JA PAREMPAAN ASIAKASYMMÄRRYKSEEN Basware on maailman
LisätiedotOpetusesimerkki hiukkasfysiikan avoimella datalla: CMS Masterclass 2014
Opetusesimerkki hiukkasfysiikan avoimella datalla: CMS Masterclass 2014 CERN ja LHC LHC-kiihdytin ja sen koeasemat sijaitsevat 27km pitkässä tunnelissa noin 100 m maan alla Ranskan ja Sveitsin raja-alueella.
LisätiedotTekoälysovellusten vaatimukset datalle, tiedon hallinnan prosesseille ja johtamiselle
ECRAFT Tekoälysovellusten vaatimukset datalle, tiedon hallinnan prosesseille ja johtamiselle Case: Kiinteistömaailma Jari Laakkonen, Managing Partnter, ecraft Business Insight 5.11.2018 2 ecraft Business
Lisätiedot