Massadatan standardisointi Jari Salo asiantuntija, TIEKE 2.6.2015
Aiheet Massadatan standardisointiryhmä Viitekehys ja tehtävänasetanta Työalueet Ensimmäisen kokouksen tulokset Jatkotyö ja kokousaikataulu 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 2
Massadatan standardisointiryhmä
ISO/IEC JTC 1/SG 2/WG9 - Big Data ISO/IEC JTC 1/SG 2/WG9 - Big Data järjesti ensimmäisen kokouksensa Bremenissä, Jacobs Universityn isännöimänä. Big Data on hyväksytty uudeksi projektiksi komitean alaisuuteen. Big Data projekti sai tunnuksen ISO/IEC NP 20546. Kokoukseen osallistui 24 edustajaa eri maista: Irlanti, Japani, Kiina, Korea, Saksa, Suomi, UK ja USA. Suurimmat delegaatiot olivat USA:lla, Kiinalla ja Korealla. Työryhmän koollekutsuja (Convenor) Wo Chang, NIST, USA. 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 4
Viitekehys ja tehtävänasetanta
Big Data työryhmän toiminnan määrittely (ToR) Keskeinen toimija JTC 1:n Big Data standardisointiohjelmassa. Laatii perustavat standardit Big Datalle - Big Data yleiskatsaus ja sanasto (Overview and Vocabulary) Viitearkkitehtuuri (Reference Achtechture) JTC 1:n työn ohjaamiseksi ja muiden Big Data standardien kehittämiseksi. Kehittää muita perusstandardeihin pohjautuvia Big Data standardeja, jos sopivia JTC 1 alaryhmiä, jotka voivat käsitellä näitä standardeja, ei ole tai eivät pysty niitä kehittämään. Tunnistaa puutteet Big Data-standardoinnissa. 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 6
Toiminnan määrittely (jatkoa) Kehittää ja ylläpitää yhteyksiä kaikkien asianomaisten JTC 1:n yksiköiden ja työryhmien kanssa, joka voivat ehdottaa Big Dataan liittyviä työkohteita tulevaisuudessa. Tunnistaa JTC 1:n (ja muiden organisaatioiden) yksiköt, jotka kehittävät standardeja ja niihin liittyvää materiaalia sekä edistävät Big Dataa sekä tarvittaessa selvittää käynnissä olevat ja mahdolliset uudet työkohteet, joka voivat vaikuttaa Big Datan kehittämiseen. Luoda suhteita JTC 1:n ulkopuolella toimivien yhteisöjen kanssa, tietoisuuden lisäämiseksi, sitouttamiseksi ja yhteyksien muodostamiseksi JTC 1 Big Data-standardointiin. 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 7
Työalueet
Big Data - Overview and Vocabulary Big Data - Overview and Vocabulary (ISO/IEC 20546) Tavoitteena on laatia kansainvälinen standardi joka sisältää yleiskuvaksen Big Datasta sekä siihen liittyviä termejä ja määrittelyjä. Standardi muodostaa terminologisen pohjan kaikille Big Dataan liittyville standardeille. Projektin editoriksi valittiin Nancy Grady, NACS (US) ja co-editoriksi Lili Yang, Huawei (CH). Projektin kesto 36 kk. 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 9
Big Data viitearkkitehtuuri Big Data Reference Achitecture - BDRA (ISO/IEC 20547) Tavoitteena on määritellä Big Data viitearkkitehtuuri, joka sisältää: roolit, toiminnot ja toiminnalliset komponentit suhteineen ja riippuvuuksineen. Projektin editoriksi valittiin Sunwook Ha, (KR) ja co-editoreiksi David Boyd (US) ja Ian Walshe (IR). Projektin kesto 36 kk. 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 10
Ensimmäisen kokouksen tulokset
Tuloksia Kummankin projektin osalta editorit valmistelevat työryhmän luonnoksen jaetaan kommenteille verkkotyötilaan (livelink) työryhmän jäsenet kommentoivat luonnosta 23. kesäkuuta asti editori laatii päivitetyn version seuraavaan kokoukseen. Laadittiin luonnos sisällysluetteloksi Big Data - Overview and Vocabulary dokumenttiin. Laadittiin sisällysluetteloa Big Data Reference Architecture dokumenttiin sekä keskusteltiin etenemisestä ja työmenetelmästä. Käytiin läpi editorien ensimmäiset luonnokset Overview and Vocabulary ja Reference Architechture dokumenteista. 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 12
Tuloksia Nimettiin yhdyshenkilöt muihin standardointiryhmiin, raportoivat Big Data työn etenemisestä heille nimetyissä työryhmissä. Yhdyshenkilöiksi nimettiin: Ray Walshe ISO/IEC JTC 1/SC38 ja Jörn Barthels ISO/IEC JTC 1/SC32. Päätettiin lähettää tiedote WG 9 Big Data työn aloittamisesta mm. JTC 1:n sisäisille komiteoille ja työryhmille: ITU-T SG 13, OASIS, W3C, Open Geospatial Consortium (OGC), Transaction Processing Performance Council (TPC), TM Forum. 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 13
Jatkotyö ja kokousaikataulu
Projektien tuotoksille ja etenemiselle asetettiin aikatauluksi: Työluonnos, marraskuu 2015 Komitealuonnos, maaliskuu 2016 Standardiluonnos marraskuu 2016 Kansainvälinen standardi maaliskuu 2017 Seuraava kokous Koreassa 7.-9. heinäkuuta 2015 2015 marraskuu Brasilia, Brasilia 2016 kevät Espanja 2016 kesä Peking, Kiina 2016 loka/marras Marrakesh, Marokko 2017 kevät Japani 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 15
Suomessa Big data Forum Finland BiFF Foorumi jalkauttaa LVM:n Big data strategiaa käytäntöön LVM rahoittanut foorumin perustamisvaihetta Foorumi on avoin ja riippumaton Foorumi toimii tiiviissä yhteistyössä ja vuorovaikutuksessa Finnish Industrial Internet Forumin (FIIF) kanssa Haaste: Alan käsitteistö ja määritelmät ovat edelleen sekavia ja ristiriitaisia Ns. datatietoisuus on heikko Julkinen keskustelu ja big datan täysimääräinen hyödyntäminen edellyttävät yleistiedon tuottamista ja levittämistä 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 16
Big data buzz Ihmisten ja tietoverkkoihin kytkettyjen laitteiden ja antureiden tuottaman tiedon määrä kasvaa hyvin nopeasti. High Volume, high Velocity & high Variety of sources Datan arvo laskee nopeasti, jos sitä ei hyödynnetä. Uusi tekniikka mahdollistaa hyvin suurten tietomäärien varastoimisen ja analysoinnin murto-osalla aiemmista kustannuksista. Haasteena tiedon pirstaloituminen ja heikko laatu (puutteelliset määrittelyt, epäyhdenmukaiset tiedon esitysmuodot, puuttuva metadata) Itseään koskevan tiedon hallitseminen, my data Big Data tarkoittaa näiden tietovarantojen reaaliaikaista analysointia ja hyödyntämistä uusissa kuluttajille ja teollisuudelle tarjottavissa palvelutuotteissa toiminnan ohjaamiseksi reaaliaikaisesti tai automaattisesti.
BiFF törmäyttää substanssi- ja big data -osaamisen Koulutus - tarpeet - sisällöt Tutkimus - kysymys - väline Teollisuus Kunnat Substanssi - tietovarat - tarpeet Ministeriöt Innovaatiot - tuotteet - palvelut BiFF Tieke Big Data - tiedonhallinta - analyysi Tutkimuslaitokset Yliopistot Konsultit Tiedolla johtaminen - real time economy - toimintatavat 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 18
Mahdollisuuksia ja haasteita Uudet palvelut ja tuotteet Kuluttajille suunnatut palvelut, esim. terveystieto- ja elämäntapapalvelut, älykäs sähköverkko ja älykäs asuminen Investointituotteiden muuttuminen tietointensiivisiksi palveluiksi, esim. hissit, koneet, automaatiojärjestelmät Teollisuuden palvelut, esim. ennakoiva logistiikka Tiedolla johtaminen Liiketoiminnan tai julkishallinnon reaaliaikainen ohjaus (real time economy) Haasteena tunnistaa, mitä datalta halutaan kysyä (esim. visualisoimalla dataa) Big datan haasteet Tietoturva ja yksityisyyden suoja kun kaikesta ja kaikista kerätään tietoa Päätöksenteon läpinäkyvyyden katoaminen numeronmurskauksen taakse Datan laadun varmentaminen: Bad data in, terrible information out. Virheitä voivat aiheuttaa tahattomat virheet analysoitavissa tiedoissa tai analyysialgoritmeissa tai tietojen tai algoritmien tahallinen manipulointi 3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 19
TIEKE Tietoyhteiskunnan kehittämiskeskus ry TIEKE on v. 1981 perustettu tietoyhteiskunnan puolueeton ja riippumaton vaikuttaja, verkottaja ja vauhdittaja. TIEKEn toiminnan painopisteet ovat 1. Tieto- ja viestintätekniikan osaamisen kehittäminen 2. Sähköisten toimintaprosessien edistäminen 3. Tietoyhteiskunnan tietopalvelut TIEKEn toimintatapoja ovat hankkeet, foorumit, palvelut, seminaarit ja yhteiskunnallinen vaikuttaminen. TIEKEn jäsenenä on yli 80 julkista ja yksityistä organisaatiota Jäsenmaksu liikevaihdon perusteella 3 500, 1 700 tai 800 TIEKEn liikevaihto on n. 1,3 milj. vuodessa TIEKEssä työskentelee 12 henkilöä 2013 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 20