IBM 18.3.2014 Poweria analytiikkaan
Informaatiotalous: mikä on muuttunut Keskiajalta jälkiteolliseen yhteiskuntaan Maatalous: maan omistus Teollinen: tuotantokapasiteetin omistus Jälkiteollinen: kyky hyödyntää informaatiota Jälkiteollinen informaatalous Toimintokohtainen optimointi: rationalisointi : automatisointi vs. Kokonaisuuden optimointi: kyky yhdistää tietoa, analysoida sitä ja tehdä päätöksiä sen pohjalta
Paradoksi: raportoinnin ja analysoinnin kehittyessä loppukäyttäjäkokemus rapistuu Tietojohtaminen ja sen pohjana olevat raportointi ja analytiikkaratkaisut ovat menestystarina: yritysten ja organisaatioden kilpailukyky rakenntuu yhä enemmän parempaan ja laajempaan kykyyn hallita informaatiota. Käytön laajentuessa ja vaatimusten noustessa menestyksestä on tullut ongelma Tiedon määrän kasvaessa ratkaisut eivät skaalaudu kuutiot eivät mahdu muistiin, eräajoikkunat eivät riitä ja vastausaika kasvaa sekunneista minuutteihin ja tunteihin Ylläpitotyö ja infrastruktuuri-investoinnit kasvavat kehityksen sijaan optimointi, partitiointi, indeksointi jne. muodostuu päätyöksi Laiteinvestointien - ja sen mukana myös ohjelmistoinvestointien- kasvu ei tuo ratkaisua
Tapahtumankäsittely vs. analyyttinen työkuorma Tapahtuma Tietokanta Item: Shoes Cost: $34 Cust: James 2011 Sales Suuri volyymi, suuri nopeus, yksinkertainen tapahtuma vs. Monimutkainen, moniulotteinen, suuret historialliset tietomäärät Item Cost Cust Shoes $34 James 2011 Sales 2011 Returns 3 rd Party Data Monimutkainen kysely Sales & Profit for Shoes & Belts Year >= 2005 SALES 2010 2009 2008 2007 2006 2005
Tapahtumankäsittely vs. analyyttinen työkuorma Hyvin iso määrä tapahtuma yksinkertaisia päivityksiä, usein vähän Tietokanta yksinkertaisia lukuja Tapahtumaneheys (ACID: Atomicity, Consistency, Isolation, Durability) Viite-eheys Item: Shoes Cost: $34 Cust: James 2011 Sales Suuri volyymi, suuri nopeus, yksinkertainen tapahtuma vs. Monimutkainen, moniulotteinen, suuret historialliset tietomäärät Item Cost Cust Shoes $34 James Yksi kirjoitus, paljon monimutkaisia lukuja Tiedonlaatu - eri lähteistä tulevan tiedon integrointi Minimutkainen kysely Sales & Profit for Shoes & Belts Year >= 2005 SALES 2010 2009 2008 2007 2006 2005 2011 Sales 2011 Returns 3 rd Party Data
Raportoinnista ennakointiin ja optimointiin Itseoppiva tietojenkäsittely Optimointi, Ennakoiva analyysi Raportointi ja Ad-Hoc -kyselyt Mitä tapahtui? Milloin ja missä? Kuinka monta? Mitä tulee tapahtumaan? Mikä sen vaikutus on? Mikä on paras vaihtoehto tässä tilanteessa? 2012 IBM Corporation
Minkä pitää muuttua? Käyttäjäkokemuksen rapautuminen 10-100x perinteistä parempi suorituskyky Case 1 Työn määrä panos tietokannan suorituskyvyn tuunaamisesta liiketoiminnan tarvitseman raportoinnin ja analyysin tuottamiseen Case 2 Liiketoiminnan syklissä toimiminen Eräajoikkunat: ETL ETL summatasot kuutiot vs. ELT & data replication atominen data dynaamiset kuutiot Case 3
Tehokkaan analytiikan kolme kerrosta 3 Analytiikka 2 Tietokanta 1 Laitteisto ja raportointi toiminnallisuus uusiin tarpeisiin uuden arrkitehtuurin hyödyntäminen helppokäyttöisyys laitteiston tehokas hyödyntäminen optimitu muistinvaraisuus yksinkertaisuus arkkitehtuuri ja käskykanta prosessointiteho ja rinakkaiset suorittimet keskusmuistin tehokkuus Äärimmäinen suorituskyky TCO Käytön helppous
Seuraavan sukupolven tietovarasto Kaikki tietolähteet Streaming Data Kehittynyt analytiikka ja syvä näkemys Text Data Applications Data Time Series Big Insights Hadoop Staging & Arkisto DB2 BLU / Netezza Tietovarasto Cognitive Learn Dynamically? Prescriptive Best Outcomes? Predictive What Could Happen? Geo Spatial Video & Image Relational < 4k/TB Kaikki data 10 1000x suorituskyky Descriptive What Has Happened? Exploration and Discovery What Do You Have? Social Network
Kuinka eteenpäin Vaiheet Resurssit 1. Analyysi Tietokantapalvelin kuntoon ja/tai Raportointi ja analytiikka ajan tasalle 2. Koekäyttö Testaus muutamalla käyttötapauksella 3. Toteutus Hanke ja tuotaantoon vienti 1. Kumppanit Big Data Solutions, Capgemini, IBM Global Services, Olapcon, Rongo, Tieto... 2. Valmis ympäristö koekäyttöön: Power 710 Express lainattavissa ohjelmistoineen, IBM:llä laajempi ympäristö 3. Ehdotus hankkeesta ja alustasta, esimerkiksi Power 710 Express DB2 BLU:lla (1TB) 52,000.