DATA-ANALYYSIN TUTKIMUS JA OPETUS 25.8.2014

Samankaltaiset tiedostot
DATA-ANALYYSIN TEMAATTINEN MAISTERIKOULUTUS (DATA)

LAUSUNTO BIG DATA STRATEGIAAN. Big Data 2: Johdanto

DATA-ANALYYSIN KOULUTUS

PELIT JA PELILLISYYS -MAISTERIKOULUTUS (PELIT)

KYBERTURVALLISUUDEN JA BIG DATA- ANALYYSIN TUTKIMUS JA OPETUS

Kyberturvallisuuden ja big data-analyysin tutkimus ja opetus

SOVELLETUN MATEMATIIKAN MAISTERIKOULUTUS

Tilanne sekä MS-A0003/4* Matriisilaskenta 5 op

Kitkaton Suomi kasvu, kilpailukyky ja osaaminen uuden edessä

Computing Curricula raportin vertailu kolmeen suomalaiseen koulutusohjelmaan

TSSH-HEnet : Kansainvälistyvä opetussuunnitelma. CASE4: International Master s Degree Programme in Information Technology

Big datan tutkimus ja opetus Jyväskylän yliopistossa

Menetelmätieteiden opintokokonaisuudessa on kaikissa tapauksissa oltava vähintään 10 op matematiikkaa ja vähintään 10 op tilastotiedettä.

OPINTOJAKSOJA KOSKEVAT MUUTOKSET/MATEMATIIKAN JA FYSIIKAN LAITOS/ LUKUVUOSI

Kukin kurssi voi sisältyä vain yhteen alemman tai ylemmän perustutkinnon moduuliin.

Kukin kurssi voi sisältyä vain yhteen alemman tai ylemmän perustutkinnon moduuliin.

Tieteen ja tutkimusalan opintoihin hyväksyttävät opintojaksot ovat (taulukossa A= aineopinnot, S=syventävät opinnot, J = jatko-opinnot):

Matematiikka ja tilastotiede. Orientoivat opinnot /

Näkökulmia tietoyhteiskuntavalmiuksiin

Korkeakoulutus ja digitalisaatio -webinaari Ilmari Hyvönen

Tietojenkäsittelytieteen pääaine Pääaineinfo ke

Laskennallisten tieteiden maisteriohjelma 2.0

TIETOJENKÄSITTELYTIEDE

Data-analyysi tieteenalana Professori, laitosjohtaja Sasu Tarkoma Tietojenkäsittelytieteen laitos Helsingin yliopisto

Tietojärjestelmätieteen ohjelmat

Lakkautetut vastavat opintojaksot: Mat Matematiikan peruskurssi P2-IV (5 op) Mat Sovellettu todennäköisyyslaskenta B (5 op)

Opetussuunnitelman perusteet esi- ja perusopetuksessa Osa ohjausjärjestelmää, jonka tarkoitus on varmistaa opetuksen tasa-arvo ja laatu sekä luoda

Sähkötekniikan tutkintoohjelma. DI-tutkinto ja uranäkymät

IT-alan merkitys yhteiskunnassa ja tutkimus- ja innovaatiotoiminnan kehittäminen

Kansainvälisyys korkeakoulun arjessa totta vai tarua?

Elämänkatsomustieto. Arto Vaahtokari Helsingin yliopiston Viikin normaalikoulu Sari Muhonen

OPINTOJAKSOJA KOSKEVAT MUUTOKSET/MATEMATIIKAn JA FYSIIKAN LAITOS LUKUVUOSI

Tutkintovaatimukset. 1. Pääaineopinnot. 2. Sivuaineopinnot (50 op)

PELIT JA PELINOMAISET JÄRJESTELMÄT - MAISTE- RIKOULUTUS (PELIT)

Tietoturvallisuus yhteiskunnan, yritysten ja yksityishenkilöiden kannalta

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Tarvitseeko informaatioteknologia matematiikkaa?

BIG DATAN TUTKIMUS JA OPETUS JYVÄSKYLÄN YLIOPISTOSSA

Bioinformatics in Laboratory of Computer and Information Science

Toimialan ja yritysten uudistuminen

MOOC toiveita ja pelkoja. Jaakko Kurhila opintoesimies tietojenkäsittelytieteen laitos Helsingin yliopisto

Tietojenkäsittelytieteen tutkintovaatimukset

SÄHKÖISEN LIIKETOIMINNAN AMMATILLISET ERIKOISTUMIS- OPINNOT (30 op)

Moderni biolääketieteellinen optiikka X - Optinen mittaaminen sekä valmistusmenetelmät X X X

Moderni biolääketieteellinen optiikka X - Optinen mittaaminen sekä valmistusmenetelmät X X X

Kokemuksia ja näkemyksiä teollisuusmatematiikan koulutuksen kehittämisestä

Laskennallisten tieteiden tutkijakoulu FICS. Ella Bingham, TKK

Laskennallisten tieteiden tutkimusohjelma. Jaakko Astola

T DATASTA TIETOON

AHOT-SUOSITUKSIA AMMATTI- KORKEAKOULUJEN JA YLI- OPISTOJEN KIELI- JA VIESTINTÄOPINTOIHIN

SFS/SR315 Tekoäly Tekoälyn standardisointi

Vaasan yliopisto Vasa Universitet University of Vaasa. Tekniikan ja innovaatiojohtamisen yksikkö School of Technology and Innovations

OPTIMOINNIN JA PÄÄTÖKSENTEON MAISTERI- KOULUTUS (OPTI)

Master's Programme in Life Science Technologies (LifeTech) Prof. Juho Rousu Director of the Life Science Technologies programme 3.1.

Opetussuunnitelma uudistui mikä muuttui? Tietoja Linnainmaan koulun huoltajille syksy 2016

NAO- ja ENO-osaamisohjelmien loppuunsaattaminen ajatuksia ja visioita

Ylemmän AMK-tutkinnon suorittaneiden osaaminen FUAS-ammattikorkeakouluissa. Teemu Rantanen

Indoor Environment

Infrastruktuurin asemoituminen kansalliseen ja kansainväliseen kenttään Outi Ala-Honkola Tiedeasiantuntija

ULKOMAISEN HENKILÖSTÖN TUKIPALVELUIDEN SEURANTARAPORTTI LUOVUTETTU KEHITTÄMISTYÖRYHMÄ JYVÄSKYLÄN YLIOPISTO

Sulautettu tietotekniikka Kimmo Ahola

Tietokonearkkitehtuuri 2 TKT-3201 (5 op)

Laaja-alainen, opiskelijalähtöinen ja projektiperusteinen opetussuunnitelma, case Monitori

NBE-E4510 Special Assignment in Biophysics and Biomedical Engineering AND NBE-E4500 Special Assignment in Human. NBE-E4225 Cognitive Neuroscience

Teollisuuden digitalisaatio ja johdon ymmärrys kyvykkyyksistä

Datapalveluja, infrastuktuureja, ekosysteemejä tutkimuksen hyväksi

SOSIAALITYÖKOULUTUKSEN VALTAKUNNALLISET OSAAMISTAVOITTEET

Digimuutoksen 10 haastetta. DIGISALONKI Tuomo Luoma

Additions, deletions and changes to courses for the academic year Mitä vanhoja kursseja uusi korvaa / kommentit

Osaamispassi ja erityisosaamistietokanta tulevaisuuden osaajille

Prognos Julkaisusuunnitelmat

Strategia vuosille Tarkistetut tavoitteet Strategiset päämäärät:

HOPS Henkilökohtainen opintosuunnitelma LuK -tutkintoon

Matemaatikot ja tilastotieteilijät

Keinoälyn mahdollisuudet terveydenhuollossa

Koulutusvastuun sisäinen jakautuminen Tampereen yliopistossa

TIETOLIIKENNEVERKKOJEN OPISKELU TTY:llä

Pv Pvm Aika Kurssin koodi ja nimi Sali Tentti/Vk Viikko

Jyväskylän yliopisto - ICT-alan innovatiivinen kehittäjä

Johdanto LoM-tarkasteluihin

Numeeriset menetelmät

Matematiikka ja tilastotiede. Orientoivat opinnot /

Kriittisen polun hallinta CRIPMAN (CRItical Path MANagement) Pekka Maijala & Jaakko Paasi

Yrityksen informaatio- ja toimintoprosessien optimointi

Tosi elävä virtuaalimalli Mika Karaila Tutkimuspäällikkö Valmet Automation

Sähkötekniikan kandidaatin tutkinnon opetussuunnitelma

Sähköisen portfolion käsitteet opintoohjaajankoulutuksessa

ELEC-A0120 opintojen suunnittelu. Riikka Leikola

TUKIMATERIAALI: Arvosanan kahdeksan alle jäävä osaaminen

Tilastotiede ottaa aivoon

Itä-Suomen yliopisto tulevaisuuden yliopisto ajassa

Globaalit haasteet metropolialueen koulutukselle

Esineiden, palveluiden ja ihmisten internet

Matematiikka tai tilastotiede sivuaineena

Visualisoinnin aamu 16.4 Tiedon visualisointi. Ari Suominen Tuote- ja ratkaisupäällikkö Microsoft

Tfy Teoreettinen mekaniikka (5 op) Tfy Fysiikka IV alkuosa A ja Tfy Teoreettinen mekaniikka

Kun haluat tehdä muutoksesta totta. Osaamisen verran enemmän.

Tieto- ja viestintätekniikan opinnot Jyväskylän yliopistossa. Humanistinen tiedekunta Syksy 2014 Tanja Välisalo

Teollinen internet ja tiedon hyödyntäminen. Digi Roadshow Tampere, Emil Ackerman, Quva Oy

Transkriptio:

DATA-ANALYYSIN TUTKIMUS JA OPETUS 25.8.2014 JYVÄSKYLÄN YLIOPISTO INFORMAATIOTEKNOLOGIAN TIEDEKUNTA 2014

SISÄLLYS 1 DATA-ANALYYSI... 4 1.1 Data-analyysin osaamisen tarve... 4 1.2 Data-analyysin ajankohtaisuus... 5 1.3 Big datatutkimus... 7 1.3.1 Perusteita... 7 1.3.2 Data-analyysi Jyväskylän yliopiston kesäkoulussa 2013... 8 1.3.3 Big data-analyysiin liittyviä hankkeita... 8 2 DATA-ANALYYSIN KOULUTUS... 9 2.1.1 Tilastotieteen maisteritutkinto... 9 2.1.2 Sovelletun matematiikan maisteritutkinto... 9 2.1.3 Laskennallisten tieteiden maisteritutkinto... 10 2.1.4 Data-analyysin osaamisprofiili... 10 2.1.5 Big data-analyysin jatkokoulutus... 12 LIITE 1 SAATAVILLA OLEVIA VERKKOKURSSEJA... 13 LÄHTEET... 15

3 TIIVISTELMÄ Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tutkimukselle asetettuja vaatimuksia, joita on esitetty Suomen digitaalisessa agendassa (2011), ICT-2015 työryhmän raportissa (2013) ja Keski-Suomen ICT-strategiassa (2013). [2] [3] [4] Data-analyysikoulutus perustuu vahvaan tietotekniikan sekä matematiikan ja tilastotieteen laitoksilla toteutettavaan tutkimukseen ja opetukseen. Koulutuksella vastataan muuttuvan maailman tilanteeseen, jossa suurien dataaineistojen automaattisesta analysoinnista on tullut keskeinen työkalu useilla aloilla. Digitalisoinnin ja erilaisten sensoritekniikoiden avulla tietomassat kasvavat huimaa vauhtia ja sekä tutkimus että teollisuus ovat havainneet data-analyysin tuomat mahdollisuudet. Ala vaatii kuitenkin erikoistunutta osaamista, sekä tilastollisista menetelmistä, että niiden soveltamisesta tietokoneisiin, eikä vastaava koulutusta ole riittävästi. Data-analyysiin profiloitumisen tarkoituksena on kouluttaa osaajia tämän tarpeen täyttämiseksi. Opiskelijoita koulutetaan matematiikan ja tilastotieteen sekä tietotekniikan laitoksen yhteistyönä. Opiskelijoilla on valmistuttuaan hyvät mahdollisuudet siirtyä teollisuuden ja elinkeinoelämän vaativiin asiantuntijatehtäviin tai jatkaa tutkimustyötä poikkitieteellisissä tutkimusryhmissä.

1 DATA-ANALYYSI 1.1 Data-analyysin osaamisen tarve Valtioneuvoston selonteon Tuottava ja uudistuva Suomi Digitaalinen agenda vuosille 2011 2020 mukaan tieto- ja viestintäteknologinen kehitys vaikuttaa merkittävästi koulutuksen, tutkimuksen ja kulttuurin tuottamiseen, välittämiseen ja hyödyntämisen tapoihin. Sähköisen asioinnin yleistyminen sekä tieto- ja viestintätekniikan hyödyntäminen laajasti kaikessa työelämässä edellyttää koko väestöltä riittäviä tietoyhteiskuntaja mediataitoja. Lähes kaikki yhteiskunnan elintärkeät toiminnot, mukaan lukien kansallinen ja kansainvälisiin yhteisöihin liittyvä päätöksenteko, ovat jo sidoksissa tieto- ja viestintäinfrastruktuurin sekä tietojärjestelmien toimintaan. [4] Tieto- ja viestintäteknologinen kehitys vaikuttaa merkittävästi koulutuksen, tutkimuksen ja kulttuurin tuottamiseen, välittämiseen ja hyödyntämisen tapoihin. Sähköisen asioinnin yleistyminen sekä tieto- ja viestintätekniikan hyödyntäminen laajasti kaikessa työelämässä edellyttää koko väestöltä riittäviä tietoyhteiskunta- ja mediataitoja. [4] ICT 2015 työryhmä toteaa: Digitaalisessa maailmassa informaation ja tallennetun tiedon määrä on valtava. Kun yhdistetään älykkäästi ja reaaliajassa näennäisesti turhaa tietoa, pystytään luomaan täysin uudentyyppistä, toimialojen rajoja rikkovaa tietoa. Big data on maailmalla kuuma tutkimuksen ja soveltamisen kohde. Suomen osaaminen tällä alueella on kapeaa, vaikkakin tietyiltä aloilta löytyy huippuosaamista. Big data liittyy läheisesti muihin Suomen kriittisiin avainosaamisalueisiin. Tietoliikenteen osaajina olemme perinteisesti käsitelleet suuria datamääriä. Tietoturva on tärkeää kaikissa big data -tyyppisissä sovelluksissa ja tietovarannoista louhittavien tiedonjyvästen integrointi vaatii vahvaa ohjelmisto- ja tietojenkäsittelyosaamista. Julkisella puolella tietovarantojen avaaminen, yhteinen ICT -palveluarkkitehtuuri ja perinteisesti Suomessa hyvin toimiva julkinen yksityinen -yhteistyö avaa mielenkiintoisia mahdollisuuksia. Suurimmaksi ongelmaksi big data tiedon soveltamisessa ja tietojen avaamisessa toimijat kokevat, että organisaatioilla ei ole riittävästi asiantuntemusta. Organisaatiot tarvitsevat tähän osaajia ja koulutusta. [2] Maaliskuussa 2013 Advanced Scientic Computing Advisory Committee (ASCAC) alakomitea julkaisi raportin Synergistic Challenges in Data-Intensive Science and Exascale Computing, jossa käsiteltiin Big Data and the Fourth Paradigm -teemaa. Raportin mukaan Historically, the two dominant paradigms for scientific discovery have been theory and experiments, with large-scale computer simulations emerging as the third paradigm in the 20th century. In many cases, large-scale simulations are accompanied by the challenges of data-intensive computing. Overcoming the challenges of data-

5 intensive computing has required optimization of data movement across multiple levels of memory hierarchies, and these considerations have become even more important as we prepare for exascale computing. The approaches taken to address these challenges include (a) fast data output from a large simulation for future processing/archiving; (b) minimization of data movement across caches and other levels of the memory hierarchy; (c) optimization of communication across nodes using fast and low-latency networks, and communication optimization; and (d) effective codesign, usage and optimization of system components from architectures to software. [1] Over the past decade, a new paradigm for scientific discovery is emerging due to the availability of exponentially increasing volumes of data from large instruments such as telescopes, colliders, and light sources, as well as the proliferation of sensors and highthroughput analysis devices. Further, data sources, analysis devices, and simulations are connected with current-generation networks that are faster and capable of moving significantly larger volumes of data than in previous generations. These trends are popularly referred to as big data. However, generation of data by itself is of not much value unless the data can also lead to knowledge and actionable insights. Thus, the fourth paradigm, which seeks to exploit information buried in massive datasets to drive scientific discovery, has emerged as an essential complement to the three existing paradigms. The complexity and challenge of the fourth paradigm arises from the increasing velocity, heterogeneity, and volume of data generation. [1] Jyväskylän yliopiston IT-tiedekunta on kehittänyt data-analyysin koulutusta ja tutkimusta systemaattisesti yhteistyössä matematiikan ja tilastotieteen laitoksen sekä kansainvälisten huippuyliopistojen, Tel Avivin ja Yalen yliopistojen, kanssa. IT-tiedekunnan monialainen osaaminen luo hyvän pohjan alan koulutuksen ja tutkimuksen kehittämiseen. Kehitystyötä tullaan jatkamaan sekä metodien että sovellusten osalta (käsittäen kyberturvallisuuden, hyperspektrikameran kuvantamisdatan käsittelyn, big datan sekä Business Intelligent:iin liittyvän datan käsittelyn). 1.2 Data-analyysin ajankohtaisuus Data-analyysillä tarkoitetaan menetelmiä ja lähestymistapoja, joilla eritavoilla (sensorit, videokuvat, signaalit, raportointi) kerätystä tiedosta pyritään muodostamaan kyseistä toimintaa kuvaavia malleja, sekä korkealuokkaista analysointia tai tarkempaa, tilastollisesti luotatettavaa informaatiota. Data-analyysin metodiikka voidaan tiivistää oheiseen kuvaan, joka mukailee Fayyed n Knowledge Discovery in Databases - prosessia. Oleelliset vaiheet kaikessa tekemisessä ovat data valinta, sen esiprosessointi, muuntaminen diskreeteiksi tai jatkuviksi havainnoiksi, rakenteiden löytäminen datan louhimisen avulla ja löydettyjen rakenteiden tulkitseminen ja varmistaminen. Kuvassa 1 on esitetty data-analyysitutkimuksen prosessi.

6 KUVA 1 Data-analyysin tutkimusprosessi Googlen hallituksen puheenjohtaja Eric Schmidt totesi puheessaan, että 5 eksabittiä (10 18 ) dataa on luotu ihmiskunnan alkuajoista vuoteen 2003 mennessä. Nyt yhtä paljon dataa syntyy joka toinen päivä. Data tulvan keskellä ilmaantuu suuria mahdollisuuksia niille, jotka pystyvät ymmärtämään dataa, irrottamaan siitä oleellisen ja visualisoimaan tai muuten selventämään tämän tiedon muille. Tähän massiivisen datan louhimiseen tarvitaan uusia työkaluja ja menetelmiä, mutta ennen kaikkea uusia osaajia data analyytikkoja. ICT 2015 työryhmä [2] on raportissaan tunnistanut Suomen menestymisen kannalta seuraavat teknologiseen osaamiseen liittyvät kehityskohteet: On kehitettävä syvää tietojenkäsittelyosaamista (Computer Science). On varmistettava kriittinen osaamiskeskittymä avainteknologioissa, joita ovat digitaaliset palvelut ja sisällöt, pelillisyys, tietoturva, mobiliteetti ja big data. On laitettava kuntoon tutkimuksen, soveltamisen, tuotteistamisen ja kaupallistamisen ketju. On huomioitava ICT yleisen koulutuspolitiikan kehittämisessä. Big Datan markkina on voimakkaasti kasvava. Vuonna 2011 kokonaismarkkina oli noin 5,1 miljardia dollaria ja vuonna 2013 sen arvioidaan olevan vajaa 17 miljardia ja kasvavan vuoteen 2016 mennessä lähes 55 miljardiin dollariin. Eri yrityksille kertyy yhä suurempia datamääriä asiakkaista ja heidän ostotottumuksistaan. Ihmisillä on useita eri liikkeiden kanta-asiakaskortteja, joiden käytön perusteella yritykset voivat luoda asiakaskohtaisia profiileita. Suurilla yrityksillä ongelmaksi on muodostunut valtavien asiakastietojen käsittely. Kuinka selviytyä miljoonien asiakkaiden päivittäisten ostotapahtumien käsittelystä ja analyysistä? Esimerkiksi peliyhtiö Roviolla on yli 260 miljoonaa aktiivista Angry Birds pelaajaa, joilta saadaan erilaista palautetta peleistä ja pelaamisesta. Big data-analyysi on tehokas vaihtoehto näin suurien käyttäjätietojen tehokkaaseen analyysiin.

7 1.3 Big datatutkimus 1.3.1 Perusteita Suurien datamassojen tutkimusta toteutetaan tilastotieteessä, laskennallisten tieteiden ja sovelletun matematiikan alueilla. Tilastotieteen tutkimusaloja ovat mm: Spatiaalinen tilastotiede tarkastelee paikkatietoaineistojen tilastollista analysointia ja mallinnusta sekä tilastollista kuva-analyysia Aikasarja-analyysin tutkimus kohdistuu tila-avaruusmallien ja monimuuttujaisten aikasarjamallien teoriaan ja metodikehitykseen. Rakenneyhtälömallien tutkimus on kompleksisten monimuuttujaisten aineistojen ja pitkittäisaineistojen mallinnusta Parametrittomien ja robustien monimuuttujamenetelmien tutkimus on merkkija järjestyslukuvektoreihin perustuvien monimuuttujamenetelmien teoreettista kehitystyötä Biometrian ja ympäristötilastotiede on tutkimusalue, joka sisältää populaation mallinnusta ja vesistöjen ekologisen tilan arviointia Erityisen kiinnostava tutkimusalue ovat spatiaaliset mallit. Paikkatietoon perustuvia ennustemalleja voidaan tuottaa päätöksentekijöitä varten muodostamalla datasta jakaumia, kasautumia, riippuvuuksia ja poikkeamia. Havainnoista voidaan tehdä päätelmiä luoda hypoteeseja jatkoanalyysiin. Mobiiliteknologian alueella paikkatiedolla on yhä suurempia sovellusalueita. Spatiaalisten mallien rakentamisen tavoitteena on tutkittavan ilmiön ymmärtäminen, jotta voidaan rakentaa malli ilmiön käyttäytymisen ennustamista varten. Laskennallisten tieteiden tutkimusaloja ovat matemaattinen mallintaminen, luotettava malli- ja datapohjainen simulointi, optimointi, adaptiiviset ja tehokkaat numeeriset laskentamenetelmät, epävarmuuden huomioiminen numeerisessa simuloinnissa, hajautettujen systeemien säätö, spline ja spline wavelet tekniikat signaalin ja kuvankäsittelyssä, dynaamiset systeemit ja nanoelektroniikan mallinnus. Sovelletun matematiikan tutkimusaloja ovat mm. diskreetti matematiikka, matemaattinen mallintaminen, funktionaalianalyysi, mitta- ja integraaliteoria ja kompleksianalyysi. Jyväskylän yliopistossa data-analyysin tutkimusaloja ovat analysointimenetelmien kehittäminen, erityisesti numeriikka ja massiivisen datan luokittelutekniikat, hyperspektrikameran datan analysointitekniikoiden kehittäminen ja tekniikan soveltaminen sen osa-alueilla, kuten solubiologia, lääketiede, ympäristötiede, maa- ja metsätalous, kemialliset aseet, rikospaikkatutkimustekniikka. Lisäksi tutkimukseen liittyviä yhteistyöhankkeita on mm. fysiikan ja aivotutkimuksen alueilla.

1.3.2 Data-analyysi Jyväskylän yliopiston kesäkoulussa 2013 8 Jyväskylän kansainvälisessä kesäkoulussa elokuussa 2013 professori Amir Averbuch piti kurssin (2 op) aiheesta: Advanced Methods for Classification of Big High Dimensional Data. 1.3.3 Big data-analyysiin liittyviä hankkeita Data-analyysin alueella on toteutunut ja käynnissä seuraavia hankekokonaisuuksia. Data-analyysin vuonna 2013 päättynyt hanke: Professori Timo Hämäläinen: Suurien moniulotteisten datajoukkojen järjestäminen ja analysointi, HIDE-hanke (1.1.2012 31.12.2013, Tekes) Data-analyysin käynnissä olevia tutkimushankkeita: Professori Pekka Neittaanmäki: New System for Cyber Attacks Protection of Critical Infrastructures 2012 2014, CAP-projekti (1.11.2012 31.10.2014, Tekes) Professori Jari Veijalainen: Tiedonkaivuu sosiaalisesta mediasta, MineSocMedprojekti (1.9.2013 31.8.2017, SA) tarkoitus kehittää sosiaalisen median analyysialgoritmeja. Professori Timo Hämäläinen: Kiinteistöautomaatiojärjestelmien datan älykäs analysointi, KIIAUDATA-hanke (1.1.2013 31.12.2014, Tekes) Professor Amir Averbuch: MeBUD: Methods for Big Unstructured High Dimensional Data (1.8.2014-30.7.2018, haettu rahoitusta SA)

9 2 DATA-ANALYYSIN KOULUTUS Suurien tietomassojen analyysin opiskelu toteutetaan kolmen maisteriohjelman sisällä, joissa opiskelija voi profiloitua data-analyysiin. Tietotekniikan laitoksella toteutetaan laskennallisten tieteiden ja sovelletun matematiikan maisteriohjelmat ja Matematiikan ja tilastotieteen laitoksella toteutetaan tilastotieteen maisteriohjelma. 2.1.1 Tilastotieteen maisteritutkinto Tilastotieteen maisteriopinnot sisältävät sekä teoreettisia opintoja että tilastotieteen sovelluksia ja tähtäävät ammattitilastotieteilijän taitoon. Tilastotiede kehittää malleja ja menetelmiä numeerisen havaintoaineiston keräämiseen, kuvaamiseen ja analysointiin ja tähän liittyvään laskennalliseen toteuttamiseen. Tilastotieteellä on kiinteä yhteys lähes kaikkiin empiiristä tutkimusta tekeviin tieteenaloihin: tilastollisia menetelmiä sovelletaan niin informaatioteknologiassa, bio- ja ympäristötieteissä, taloustieteessä, lääketieteessä kuin yhteiskunta- ja kasvatustieteissäkin. Tilastotieteessä on kysymys reaalimaailman ilmiöiden mallintamisesta ja sen osaamista tarvitaan yhä enemmän yhteiskunnassa ja elinkeinoelämässä, missä tutkimusaineistojen ja tietovarantojenanalyyseilla ja mallinnuksella halutaan tuottaa jalostettua tietoa päätöksenteon tueksi. Tilastotieteen opetuksen tavoitteena on antaa valmiudet edustavien havaintoaineistojen keräämiseen, aineistojen kuvaamiseen ja analysointiin sekä yleensä numeerisesti mitattavissa olevienilmiöiden pätevään tilastolliseen mallintamiseen. Tilastotieteellä on käytettävissä erilaisia analysointityökaluja data-analyysin toteuttamiseen. 2.1.2 Sovelletun matematiikan maisteritutkinto Sovelletun matematiikan avulla pyritään ratkaisemaan tosielämän ongelmia. Sovelletun matematiikan tavoitteena on mallintaa erilaisia ilmiöitä, kuvailla niitä ja yrittää ymmärtää niitä. Sovelletun matematiikan opiskelussa yhdistyy tieteellisen laskennan käsitteet ja menetelmät, joita käytetään kysymyksiin, jotka ilmentyvät matematiikan ja muiden tieteenalojen rajapinnoissa. Jyväskylän yliopistossa opinnoissa keskitytään sellaisiin osa-alueisiin, kuten funktionaalianalyysi, mitta- ja integraaliteoria, kompleksianalyysi, numeerinen analyysi, optimointi ja simulointi. Valmistunut maisteri hallitsee laaja-alaisesti sovelletun matematiikan ja tieteellisen laskennan käsitteitä ja menetelmiä, joita käytetään itsenäisen ajattelun ja tutkimuksen perustana. Ymmärtää matematiikan ja lähitieteenalojen rajapintojen tietoihin liittyviä laskennallisia kysymyksiä ja tarkastelee niitä ja uutta tietoa kriittisesti.

10 Sovellettu matematiikka tuottaa matemaattisia työkaluja data-analyysin toteuttamiseen. 2.1.3 Laskennallisten tieteiden maisteritutkinto Laskennallisten tieteiden maisterikoulutuksessa käsitellään laaja-alaisesti tilastotieteen, numeerisen laskennan ja ohjelmoinnin käsitteitä ja menetelmiä. Laskennallisten tieteiden maisteri tuntee jatkuvan ja diskreetin simuloinnin periaatteet ja sovelluskohteet. Hän osaa listata jatkuvien simulointimallien tavallisimmat diskretisointimenetelmät ja niiden tehokkaan toteuttamisen perusperiaatteet moderneissa tietokonearkkitehtuureissa. Lisäksi hän osaa nimetä yksi- ja monitavoitteisen epälineaarisen optimoinnin periaatteet ja ratkaisumenetelmät. Hän kykenee muodostamaan tekniikan ja luonnontieteiden ilmiöille matemaattisia simulointimalleja sekä osaa rakentaa mallien ratkaisemiseen tehokkaat ohjelmistot aliohjelmakirjastoja tai vastaavia valmiita komponentteja hyödyntäen. Hän osaa muodostaa ja ratkaista numeerisesti simulointimalleihin pohjautuvia optimointitehtäviä. Laskennalliset tieteet antavat erilaisia numeerisia työkaluja data-analyysin toteuttamiseen. 2.1.4 Data-analyysin osaamisprofiili Edellä kuvatut kolme maisterikoulutusta antavat opiskelijalle mahdollisuuden profiloitua suurten datamassojen analyysiin kunkin tieteenalan näkökulmasta ja tutkimustyökaluja hyväksikäyttäen. Data-analyysissä opetetaan ja tutkitaan menetelmiä ja lähestymistapoja, joilla eritavoin kerätystä tiedosta (data) pyritään muodostamaan malleja ja korkeampaa tai tarkempaa informaatiota. Opetuksessa korostuu keskeisinä tekijöinä datan kerääminen, käsittely, visualisointi ja arvon lisäys. Data-analyysiin erikoistuva opiskelija rakentaa osaamisprofiilinsa mukaisesti opintosuunnitelmansa eri kurssikokonaisuuksista, kuten; tilastotieteen kursseja sovelletun matematiikan kursseja tietoliikennetekniikan kursseja sensoriverkkoihin liittyviä kursseja kokonaisarkkitehtuurin rakentamiseen liittyviä kursseja Data-analyysin maisterikoulutus vastaa muuttuvan maailman tilanteeseen, jossa suurien data-aineistojen automaattisesta analysoinnista on tullut keskeinen työkalu useilla aloilla. Koulutuksen tavoitteena on antaa opiskelijoille data-analyysiin liittyvää erikoisosaamista sekä tilastollisista menetelmistä että niiden soveltamisesta tietokoneympäristöön.

11 Tiedot Maisteri hallitsee laaja-alaisesti tilastotieteen, numeerisen laskennan ja ohjelmoinnin käsitteitä ja menetelmiä, joita käytetään itsenäisen ajattelun ja tutkimuksen perustana. Ymmärtää tilastotieteen ja lähitieteenalojen rajapintojen tietoihin liittyviä tiedon käsittelyyn liittyviä kysymyksiä ja tarkastelee niitä ja uutta tietoa kriittisesti. Taidot Maisteri kykenee ratkaisemaan vaativia ongelmia hyödyntämällä matemaattista, tilastollista, laskennallista ja tietoteknistä erikoisosaamista ja yhdistämällä sitä eri alojen tietoihin. Kykenee kartuttamaan alansa erikoisosaamista ja käytäntöjä sekä seuraamaan ja arvioimaan tilastotieteen, sovelletun matematiikan ja laskennallisten tieteiden kehitystä. Osaa viestiä ja hyvin suullisesti ja kirjallisesti alan sisäisille ja ulkopuolisille kohderyhmille englannin kielellä. Asenteet Maisteri on kiinnostunut soveltamaan tilastotieteen, sovelletun matematiikan ja tieteellisen laskennan menetelmiä ongelmien ratkaisuun. Maisteri on utelias ja avoin tilastotieteen, sovelletun matematiikan ja tieteellisen laskennan ongelmille. Maisteri on yhteistyökykyinen ja valmis ottamaan vastuuta. Maisteri on valmis opettelemaan ja opettamaan uutta tietoa. Maisteri asennoituu vakavasti eettisiin kysymyksiin ja noudattaa eettisiä periaatteita. Jyväskylän yliopiston laaja-alainen ja monitieteellinen toimintaympäristö antaa mahdollisuuden data-analyysin opiskelijoille käyttää hyväkseen erilaisia datamassoja, kuten: oppimiseen liittyvä data (Learning Analytics) hiukkaskiihdyttimen tuottama havaintoaineisto aivotutkimusyksikön tuottama havaintoaineisto erilaiset prosessien tuottamat data-aineistot (Process mining) muu empiirinen tutkimusaineisto Kuvassa 2 on esitetty data-analyysin osaamisprofiilin rakentuminen Jyväskylän yliopiston toimintaympäristössä.

12 KUVA 2 Data-analyysin osaamisprofiilin rakentuminen Lukuvuonna 2014 2015 tarjotaan lisäksi muista maisteriohjelmista data-analyysiin liittyviä kursseja: ITKST47 Advanced Anomaly Detection: Theory, Algorithms and Applications, 5 op ITKST48 Advanced Persistence Threat, 5 op TJTSM61 Business Analytics and Big Data Management, 5 op ITKA204 Tietokannat ja tiedonhallinnan perusteet, 5 op 2.1.5 Big data-analyysin jatkokoulutus Vuonna 2013 julkaistiin seuraavat data-analyysiä käsittelevät väitöskirjat: Guy Wolf: Big high-dimensional data analysis with diffusion maps. Ilkka Pölönen: Discovering knowledge in various applications with a novel hyperspectral imager Tuomo Sipola: Knowledge discovery using diffusion maps Valmisteilla on Limor Gavishin väitöskirja Memcached - nosql and big data databased particularly for caching.

13 LIITE 1 SAATAVILLA OLEVIA VERKKOKURSSEJA Jyu kurssi Sivusto Tyyppi Nimi URL Yliopisto TIES445 Tiedonlouhinta coursera Kurssi Computational Methods for Data Analysis https://www.coursera.org/course/compm ethods Washington TIES445 Tiedonlouhinta coursera Kurssi Computing for Data Analysis https://www.coursera.org/course/compd ata Johns Hopkins University TIES445 Tiedonlouhinta coursera Kurssi Web Intelligence and Big Data https://www.coursera.org/course/bigdata Indian Institute of Technology Delhi TIES445 Tiedonlouhinta mit materiaali Data Mining http://ocw.mit.edu/courses/sloan-schoolof-management/15-062-data-miningspring-2003/ mit materiaali Statistics and Visualization for Data Analysis and Inference coursera Kurssi Scientific Computing coursera Kurssi Computing for Data Analysis coursera Kurssi Data Analysis High Performance Scientific coursera Kurssi Computing coursera Kurssi Statistics: Making Sense of Data Computational Methods for Data coursera Kurssi Analysis http://ocw.mit.edu/resources/res-9-0002- statistics-and-visualization-for-dataanalysis-and-inference-january-iap-2009/ https://www.coursera.org/course/scientif iccomp https://www.coursera.org/course/compd ata https://www.coursera.org/course/dataan alysis https://www.coursera.org/course/scicom p https://www.coursera.org/course/introst ats https://www.coursera.org/course/compm ethods coursera Kurssi Metadata: Organizing and Discovering Information https://www.coursera.org/course/metad ata Koneoppiminen / Neuroverkot coursera Kurssi Machine Learning https://www.coursera.org/course/ml Koneoppiminen Neural Networks for Machine https://www.coursera.org/course/neural / Neuroverkot coursera Kurssi Learning nets Koneoppiminen https://www.coursera.org/course/machle / Neuroverkot coursera Kurssi Machine Learning arning https://www.coursera.org/course/compn Neurobiologia coursera Kurssi Computational Neuroscience euro Neurobiologia coursera Kurssi Tekoäly / Koneoppiminen udacity Kurssi Dynamical Modeling Methods for Systems Biology Introduction to Artificial Intelligence https://www.coursera.org/course/dynami calmodeling https://www.udacity.com/course/cs271 Washington Johns Hopkins University Johns Hopkins University Washington Toronto Washington The University of North Carolina at Chapel Hill Stanford University Toronto Washington Washington Icahn School of Medicine at Mount Sinai Tekoäly / Koneoppiminen edx Kurssi Artificial Intelligence https://www.edx.org/courses/berkeleyx/ CS188.1x/2013_Spring/about TIES324 Signaalin osessointi ja -menetelm t coursera Kurssi Digital Signal Processing https://www.coursera.org/course/dsp http://ocw.mit.edu/courses/electrical- engineering-and-computer-science/6-011-introduction-to-communication- Introduction to Communication, control-and-signal-processing-spring- Control, and Signal Processing 2010/ Signal Processing: Continuous and Discrete TIES324 Signaalin osessointi ja -menetelm t mit materiaali Discrete-Time Signal Processing TIES324 Signaalin osessointi ja -menetelm t mit materiaali TIES324 Signaalinprosessointi ja -menetelm t mit materiaali http://ocw.mit.edu/courses/mechanicalengineering/2-161-signal-processingcontinuous-and-discrete-fall-2008/ http://ocw.mit.edu/courses/electrical- engineering-and-computer-science/6-341-discrete-time-signal-processing-fall- UC Berkeley École Polytechnique Fédérale de Lausanne

14 2005/ TIES324 Signaalin osessointi ja -menetelm t mit materiaali Digital Signal Processing TIES324 Signaalin osessointi ja -menetelm t mit materiaali Signals and Systems TIES411 Konen k ja kuvaanalyysi mit materiaali Machine Vision TIES411 Konen k ja kuvaanalyysi mit materiaali TIES411 Konen k ja kuva- Pattern Recognition for Machine Vision analyysi coursera Kurssi Computer Vision TIES411 Konen k ja kuvaanalyysi Computer Vision: The Fundamen- coursera Kurssi tals TIES411 Konen Computer Vision: From 3D Reanalyysi k ja kuvaconstruction to Visual Recogni- coursera Kurssi tion TIES411 Konen k ja kuvaanalyysi coursera Kurssi Fundamentals of Digital Image and Video Processing http://ocw.mit.edu/resources/res-6-008- digital-signal-processing-spring-2011/ http://ocw.mit.edu/courses/electrical- engineering-and-computer-science/6-003-signals-and-systems-fall-2011/ http://ocw.mit.edu/courses/electrical- engineering-and-computer-science/6-801-machine-vision-fall-2004/ http://ocw.mit.edu/courses/brain-andcognitive-sciences/9-913-patternrecognition-for-machine-vision-fall-2004/ https://www.coursera.org/course/compvi sion https://www.coursera.org/course/vision https://www.coursera.org/course/compu tervision https://www.coursera.org/course/digital Technische Universität München California, Berkeley Michigan Northwestern University

15 LÄHTEET [1] Synergistic Challenges in Data-Intensive Science and Exascale Computing, Summary Report of the Advanced Scienti Computing Advisory Committee (ASCAC) Subcommittee, March 2013, http://science.energy.gov/~/media/40749fd92b58438594256267425c4ad1.ash x) [2] Työ- ja elinkeinoministeriö, 21 polkua Kitkattomaan Suomeen, ICT 2015 - työryhmän raportti 17.1.2013, http://www.tem.fi/ajankohtaista/julkaisut/julkaisujen_haku/21_polkua_kitkatto maan_suomeen.98249.xhtml [3] Keski-Suomen maakunnallinen ICT-strategia 2013, http://www.keskisuomi.fi/filebank/23660-ks_ict-strategia2013.pdf [4] Tuottava ja uudistuva Suomi Digitaalinen agenda vuosille 2011 2020, Valtioneuvoston selonteko eduskunnalle 2010, http://www.lvm.fi/julkaisu/1225475/tuottava-ja-uudistuva-suomi-digitaalinenagenda-vuosille-2011-2020