Mikä siinä niin isoa? Jukka Rupen Business Analytics Architect +358-40-725-6086 jukka.rupen@fi.ibm.com p I i
Mitä Big Data? 2 p I i
Data uutta Öljyä Data Tied aka-aine. Raakamuodossaan sillä vain vähän arvoa mutta jalostettuna sen arvo kasvaa. Toisin kuin öljy, data uusiutuvaa eikä se kulu sitä jalostettaessa. mpanies are being inundated with data from informati customer-buying habits to supplychain efficiency. But many managers struggle to make sense of the numbers. Suomella erinomainen mahdollisuus kehittyä globaaliksi edelläkävijäksi tied ja tietomassojen hyödyntämisessä. Data lunvaroihin rinnastettava aka-aine, jka jalostamisessa ja hyödyntämisessä valtava tentiaali uusien palvelujen ja liiketoiminnan kehittämisessä.. Data is the new oil. - Clive Humby - 3 p I i
Maailmasta tulossa Älykkäämpi Älykkäämmät kaupungit Älykkäämpi terveydenhuolto Älykkäämmät sähköverkot Älykkäämpi vedenkäyttö Älykkäämpi kuljetus ja liikenne Älykkäämmät prosessit Älykkäämmät tietoverkot Älykkäämpi yleinen turvallisuus Älykkäämpi talouselämä Älykkäämpi kaupankäynti Älykkäämpi asuminen Älykkäämpi oppiminen ja koulutus 4 p I i
Paljko palj"? 24953 Datan määrä kaksinkertaistuu joka 2. vuosi x12 40 ZB (40*10 21 ) x6 09 800 EB (800*10 18 ) 05 130 EB (130*10 18 ) 81 13 3,5 ZB (3,5*10 21 ) Määrä Kirjavuus Muutosnopeus Kaikki ihmiskunnan tuottama infromaatio vuna 1999: 2EB 12 13 Paikallaan oleva data Tietokannat, arkistot, tiedostot Tallennettu loki- ja kedata Sosiaalinen data, jaettu data Dokumentit, sähköstilaatikot, kuvat Liikkuva data Sensorit, mittarit, signaalit, realiaikaiset lokit Tietoliikenne, audio/video, paikannus CDR data (6 miljardia/pv, 60 000/s) Luottokorttitnsaktiot (1 miljardi/pv, 10 000/s) Viestit (Twitterissä 350 miljoaa/pv) Osittain tai täysin Strukturoimat data Sosiaalinen data, analyysit, diagnoosit Dokumentit, artikkelit, sähkösti, viestit Multimedia Kedata Sosiaalinen data BIZ data ei hyödynnetä hyödynnetään 5 p I i
Osaajapulaan vastaaminen? Viimeisten 10 vuoden aikana nopeasti kasvanut yleinen tietoisuus saatavilla olevasta datasta luut taeen kyetä analysoimaan ja hyödyntämään mitä tahansa dataa, milloin tahansa. Tämä uusi normaali tulee väistämättä vaikuttamaan uuden teknologian kehittymiseen, useiden toimialojen ja palvelujen mullistukseen sekä uuden osaamispaineen syntymiseen. Big Data osaaminen Päätökset Skriptaaminen Motivaatio Tekstianalytiikka Todennäköisyys Budjetit API Ennakointi Viestintä Algoritmit Reaaliaikainen data Visualisointi Koodaaminen JSON Datan louhinta Tietosuoja Hadoop 6 p I i
Mahdollisuuksien ymmärtäminen Kansalaisten taeiden ymmärtäminen Resurssien optimointi Infstuktuurin ja palvelujen kestävämpi kehittäminen Tilanteiden ennakointi ja tapaturmien välttäminen Lahjakkuuden kehittäminen Suorituskyvyn pantaminen Toiminnan kehittäminen Osaamisen löytäminen ja säilyttäminen Henkilöstön kehittäminen Kilpailukyvyn pantaminen Toiminnan jatkuvuuden takaaminen Asiakkaisiin kytkeytyminen Mikanavaisuus Persoidut palvelut Trendien ja mieltymysten arviointi Diagnosointi nopeammin ja luotettavammin Toimenpiteiden arviointi ja laadun pantaminen Holistisempi ymmärrys tilaan tilasta Kaupunkisuunnittelija Urheiluvalmentaja Henkilöstöhallinto Markkinointipäällikkö Lääkäri Yhdistettynä aiempaan osaamiseen, kokemukseen ja faktatieto, Big Datan avulla voi täydentää näkemystä, joka auttaa tekemään parempia päätöksiä. 7 p I i
VUORI PÄÄ VIRTA KUONO SILTA PANTA ASTIA PUTOUS PÖYTÄ RANTA Salvador Dalì - Appariti of Face and Fruit Dish a Beach, 1938 8 p I i
p I i 9 p p yr g 2 1 I I p at at at at a r i i i i i i i i i 9 Tietojenkäsittelytiede Tietoliikenne Ohjelmointi ja skriptaus Informaati hallinta Nanoteknologia Tekoäly
Kolmas sulvi: Kognitiiviset tietojärjestelmät Mekaanisten tietojärjestelmien aikakausi Ohjelmoitavien tietojärjestelmien aikakausi Kognitiivisten ja itseoppivien tietojärjestelmien aikakausi I Wats Kognitiotiede tutkii tietoilmiöitä kuten havaitsemista, oppimista, muistia, ajattelua, kieltä ja käsitteitä, sekä näiden taustalla olevia tiedkäsittelyn mekanismeja 1900 1950 11 10 p I i
Kognitiivisten järjestelmien läpimurto 06: I Wats tutkimusprojekti käynnistyy, tavoitteena toteuttaa kehittynein lunollista kieltä ymmärtävä ja itseoppiva analyyttinen järjestelmä, joka osaa todistusaineist hjalta vastata vapaasti esitettyyn kysymykseen suurella varmuudella 2/11: Wats voittaa Jeopardy! mestarit lunolliseen kieleen perustuvassa tietokilpailussa Osaa tulkita lunollista kieltä ja ihmisen puhetta Ymmärtää mitä kysymyksellä haetaan ja osaa vastata siihen todistusaineisto ja todennäköisyyteen perustuen 99% 60% 10% Sopeutuu ja oppii ihmisen tekemistä valinnoista ja antamista vastauksista I Wats perustuu itseoppivaan aineist analysointiin, massiiviseen rinnakkaisprosessointiin ja kehittyneisiin päättelyalgoritmeihin 8/11: Wats Memorial Sloan-Kettering Syöpäkeskukseen auttamaan opiskelijoita ja lääkäreitä yksilöllisempien diagnoosien ja hoitosuunnitelmien laatimisessa 3/12: Wats finanssialalle 13/12: Wats japinnat avataan kehittäjille ja ekosysteemille 11 p I i
THIS NUMBER, ONE OF THE FIRST, USES ONLY ONE VOWEL (4 TIMES!) p I i
A PORCH ADJOINING A BUILDING, LIKE WHERE MUMMY OFTEN SERVED TEA p I i
p I i p p p p p p p y gh 2 I I I I I M p p p p p at at r t a i i i i io i i i io i o 1 Tilastotiede Matematiikka Todennäköisyyslaskenta Analytiikka
p I i 15 p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p o p op op r yr yr ri r ri yr ri yr r ri ri yr y h gh gh gh h gh gh gh h g IB IB IB IB IB IB IB I I I I I I I IB I I I I I I I IB I I I I I I I B I M IB I M r o r o p a a a at at atio i i i i i i i i i i i i i i i i i i 15 15 15 15 Yeiskunta Liike-elämä ja talous Politiikka lainsäädäntö ja tietosuoja
Big Data työkaluja saatavilla ilmaiseksikin mutta niitä täytyy päästä käyttämään! USC Film Forecaster' voi kuulostaa ammattilaisen työltä mutta kyseessä oli yksi viestintätieteiden opiskelija joka opetteli välineen käytön päivässä, keräsi tweetit ja analysoi ne. USC s Film Forecaster correctly predicted a clamor for "Hangover 2 that resulted in $100 milli opening over Memorial Day weekend Looked at 250K-500K Tweets and broke down sitive and negative messages using a lexic of 1700 words I InfoSphere BigInsis Hadoop ibm.com/software/data/infosphere/biginsis/quick-start 16 p I i
ja niiden pitää olla helpkäyttöisiä! I InfoSphere BigInsis Hadoop ibm.com/software/data/infosphere/biginsis/quick-start 17 p I i
7. luokkalaisen harjoitustyö? 13-25-01, 13:30:00, 60.21253, 25.0584, Tsi! Kenen lintu twiittaa ensin? tp://www.treehugger.com/gadgets/diy-solar-wered-bird-house-tweets-when-birds-arrive.ml 18 p I i
Yeistyö välttämätöntä osaamisvajeen kuromiseksi tp://ibm.com/press/us/en/pressrelease/41733.wss 19 p I i
ibm.com/bigdata adlibris.com/fi/product.aspx?isbn=952591271x Jukka Rupen Business Analytics Architect jukka.rupen@fi.ibm.com +358-40-725-6086 p I i