Jeremias Penttilä. Koneoppiminen. Tietotekniikan kandidaatintutkielma. 2. elokuuta Jyväskylän yliopisto. Tietotekniikan laitos

Koko: px
Aloita esitys sivulta:

Download "Jeremias Penttilä. Koneoppiminen. Tietotekniikan kandidaatintutkielma. 2. elokuuta Jyväskylän yliopisto. Tietotekniikan laitos"

Transkriptio

1 Jeremias Penttilä Koneoppiminen Tietotekniikan kandidaatintutkielma 2. elokuuta 2015 Jyväskylän yliopisto Tietotekniikan laitos

2 Tekijä: Jeremias Penttilä Yhteystiedot: Työn nimi: Koneoppiminen Title in English: Machine learning Työ: Kandidaatintutkielma Sivumäärä: 22+0 Tiivistelmä: Koneoppiminen on monipuolinen ja tehokas työkalu erilaisiin tehtäviin. Tässä tutkielmassa on tarkoituksena tutustua sekä ohjatun että ohjaamattoman oppimisen yleisimpiin menetelmiin. Tarkoituksena on käsitellä nämä menetelmät yleisellä tasolla niin, että asiasta tietämätön ymmärtää perusperiaatteet miten eri menetelmät toimivat. Tarkempia yksityiskohtia ja matemaattisia algoritmejä ei tulla käsittelemään. Avainsanat: Koneoppiminen, ohjattu oppiminen, ohjaamaton oppiminen, neuroverkot, itseorganisoituvat kartat, klusterointi, adaptive resonance theory, art Abstract: Machine learning is powerfull and versatile tool for a multitude of tasks. The point of this study is to familiarize oneself with a couple of different methods of both supervised and unsupervised machine learning, so that anyone can understand the basic principles behind the different methods. We will not go into details, nor will we explain the mathematical algorithms behind these methods. Keywords: Machine learning, supervised learning, unsupervised learning, neural networks, self-organizing maps, clustering, adaptive resonance theory, art i

3 Kuviot Kuvio 1. Ohjatun oppimisen työnkulku (lähde: Googlen kuvahaku)... 4 Kuvio 2. Esimerkki päätöspuusta... 5 Kuvio 3. Yksinkertainen Bayes-verkko (lähde: Googlen kuvahaku)... 6 Kuvio 4. Markovin piilomalli esimerkki (lähde: Googlen kuvahaku)... 7 Kuvio 5. Optimaalinen hypertaso tulosavaruudessa (lähde: Googlen kuvahaku)... 8 Kuvio 6. K-lähintä naapuria esimerkki (lähde: Googlen kuvahaku)... 9 Kuvio 7. Voronoi-diagrammi ennen Lloydin algoritmia, ja sen jälkeen (lähde:wikipedia, Lloyd s algorithm) Kuvio 8. K-means algoritmi ja DBSCAN-algoritmi sovellettuna samaan pistejoukkoon (lähde: Googlen kuvahaku, DBSCAN vs k-means) Kuvio 9. Neuroverkko-malli Kuvio 10. Itseorganisoituvan kartan opetusprosessi ii

4 Sisältö 1 JOHDANTO KONEOPPIMINEN YLEISESTI OHJATTU OPPIMINEN Päätöspuut Bayes-verkot Markovin mallit Tukivektorikoneet K-lähimmän naapurin algoritmit OHJAAMATON OPPIMINEN Klusterointi K-means klusterointi DBSCAN klusterointi Itseorganisoituvat kartat ja neuroverkot Neuroverkot Itseorganisoituvat kartat Adaptive resonance theory YHTEENVETO LÄHTEET iii

5 1 Johdanto Mitä koneoppiminen on? Onko se scifissä esiintyneitä robotteja, vai jotain maanläheisempää? Tässä tutkimuksessa on tarkoituksena tuoda esille yleisellä tasolla, mitä koneoppiminen on, mitä eri menetelmiä se pitää sisällään ja miten nämä menetelmät eroavat toisistaan. Kun teknologia etenee suurin harppauksin, ja erilaiset enemmän tai vähemmän älykkäät järjestelmät leviävät arkielämään, kasvattaa koneoppiminen tärkeyttään aikaisempaan verrattuna. Koneoppiminen on jo integraalinen, vaikkakin usein piilossa oleva, osa modernia elämää. Esimerkiksi joihinkin valokuva-albumiohjelmiin on tullut automaattinen kasvojentunnistustoiminto, joka perustuu hahmontunnistukseen. Hahmontunnistus ja konenäkö yleisesti ovat yksi tärkeimpiä koneoppimisen tutkimuskohteita. Yksinkertaisempiakin esimerkkejä löytyy, muun muassa sähköpostiohjelmien roskapostifiltterit, jotka skannaavat tulevia posteja ja yrittävät määrittää ovatko ne roskapostia vai ei. Erityisen tärkeässä asemassa koneoppiminen on tiedonlouhintaa tehtäessä. Siinä koneoppimisen avulla pyritään valtavasta tiedon määrästä etsimään yhteyksiä (Kapitanova ja Son 2012). Kuten nähdään, koneoppiminen on integraalinen osa modernia elämää ja ainakin sen yleinen ymmärtäminen on hyödyllistä. Koneoppimisen tutkimisen ja kehittämisen pitkän aikavälin tavoitteena voidaan nähdä todellisen tekoälyn (ts. tekoäly jolla on tietoisuus) saavuttaminen. Tämä ei ole mahdollista ilman koneoppimista. Koneoppiminen on tekoälyn osa-alue, joka voidaan määritellä alaksi, jonka tarkoituksena on luoda algoritmeja, jotka empiiristä dataa, kokemusta ja koulutusta avulla käyttäen mukautuvat muutoksiin halutulla tavalla. Koneoppiminen sisältää osia muun muassa psykologiasta, filosofiasta, tilastotieteistä ja neurobiologiasta (Kapitanova ja Son 2012). Nykyyhteiskunnassa, jossa tieteen eri alojen rajoja pyritään rikkomaan, koneoppiminen on ajankohtainen ja moderni tutkimusalue. Etenkin kun edellä mainitut älykkäät järjestelmät yleistyvät, voi viallinen koneoppimisen tai sen osa-alueen huono toteutus johtaa jopa hengenvaarallisiin tilanteisiin. Esimerkiksi uusien ajoneuvojen ADAS-järjestelmät (engl. advanced driver assistance systems) toimivat paljolti hahmontunnistuksen avulla (Geronimo et al. 2010). Mainitun todellisen tekoälyn saavuttaminen tulisi olemaan tieteellisesti erittäin suuri läpi- 1

6 murto, joka saattaisi aloittaa uuden nopean teknologisen ja tieteellisen kehittymisen aikakauden. Tähän tapahtumaan liittyy myös synkkä puoli: ihmiskunta ei kykene sopeutumaan nopeaan teknologian kehittymiseen. Tätä tapahtumaa kutsutaan teknologiseksi singulariteetiksi. Termi jonka matemaatikko John von Neumann kehitti 1950-luvulla, ja jonka tieteiskirjailija Vernor Vinge toi kuuluisaksi. Tässä tutkimuksessa tarkoituksena on kartoittaa yleisellä tasolla koneoppimisen eri menetelmiä, sen käyttötarkoituksia sekä hyötyjä ja haittoja. Pääpaino pyritään pitämään ohjaamattomassa oppimisessa, mutta koska tarkoituksena on kuvata koneoppimista, niin käydään myös ohjatun oppimisen yleisimpiä menetelmiä läpi. Luvussa 2 käsitellään koneoppimista yleisellä tasolla. Koneoppiminen terminä selvitetään; miten se määritellään, ja mitä se pitää sisällään. Lisäksi käydään läpi lyhyesti muut koneoppimisen menetelmät kuin ohjaamaton ja ohjattu oppiminen. Luvuissa 3 ja 4 käsitellään ohjattu ja ohjaamatton oppiminen tarkemmin läpi. Ohjatusta oppimisesta Käsitellään muutaman yleisimmin käytössä olevan menetelmän nopeasti, ja ohjaamattomassa oppimisessa käydään muutama yleinen menetelmä hieman syvällisemmin läpi. Luvussa 5 vedetään lyhyt yhteenveto työn pääkohdista. 2

7 2 Koneoppiminen yleisesti Kuten johdannossa mainittiin, on koneoppiminen Kapitanova ym. (2012) mukaan kokoelma algoritmeja jotka mukautuvat muutoksiin halutulla tavalla. Tämä saavutetaan luomalla opetteludataa, jossa tiedetään syöte (eli alkutila) ja haluttu lopputulos. Näin tätä dataa käyttämällä luodaan algoritmi, joka päätyy samaan lopputulokseen kaikilla samankaltaisilla syötteillä. Esimerkkinä oikein opetetun roskapostifiltterin tulisi tunnistaa erityyppiset roskapostit aiemman datan perusteella, vaikka ne olisivatkin sisällöltään erilaiset. Ohjatulla oppimisella tarkoitetaan algoritmeja, joille annetaan oppimisdataa jonka lopputulos tiedetään (engl. labeled data). Oppimisdatan avulla algoritmia voidaan muokata niin, että se saavuttaa halutut lopputulokset tietynkaltaisella syötteellä. Ohjaamattomassa oppimisessa oppimisdatalle ei sen sijaan ole annettu lopputulosta (engl. unlabeled data) (Kapitanova ja Son 2012; Kotsiantis, Zaharakis ja Pintelas 2007). Tutkimuksessa selvitetään tarkemmin näiden kahden eroja ja vaatimuksia. Tarkemmin käsitellään vain ohjatun ja ohjaamattoman oppimisen menetelmiä, mutta mainitsemisen arvoisia ovat myös vahvistusoppiminen (engl. reinforcement learning) ja puoliohjattu oppiminen (engl. semi-supervised learning). Vahvistusoppiminen on trial-and-error menetelmällä tapahtuvaa oppimista. Tässä menetelmässä syötteen labelia ei tiedetä etukäteen, mutta poiketen ohjaamattomasta oppimisesta vahvistusoppimisessa saadaan tieto, kuinka hyvä tai oikein on algoritmilla saavutettu lopputulos. Toisinsanottuna algoritmi tietää millon se on tehnyt oikean päätöksen, ja näin se hiljalleen oppii tekemään oikeita päätöksiä myös muunlaisten syötteiden kanssa. (Sutton ja Barto 1998) Puoli-ohjattu koneoppiminen on nimensä mukaisesti yhdistelmä ohjattua ja ohjaamatonta koneoppimista. Tässä menetelmässä pääpaino on ohjaamattomassa oppimisessa, mutta opiskeludatasta osa käsitellään ohjatun oppimisen menetelmin. Näin algoritmia saadaan ohjattua haluttuun suuntaan. Puoli-ohjatulla koneoppimisella voidaan välttää sekä ohjatun että ohjaamattoman oppimisen huonoja puolia, kunhan se vain tehdään tarpeeksi hyvin. (Zhu 2006) 3

8 3 Ohjattu oppiminen Ohjattu koneoppiminen on nimensä mukaisesti ihmisten ohjaamaa oppimista. Tämä onnistuu oppimisdatan avulla opettamalla algoritmille syöte-tulos parien avulla halutunlaista käytöstä. Eli kun oppimisdatassa tiedetään sekä syöte että tulos, tutkimusdatan syötteistä ei tiedetä tulosta. Näin oppimisdatan avulla luodaan luokittimia (engl. classifiers), joiden avulla jokainen tutkimusdatan syöte voidaan yleistää yhteen luokittimeen, ja näin ollen saadaan tulos. Tällaisen oppimisdatan käyttö aiheuttaa myös yhden suurimmista ohjatun oppimisen ongelmista, miten oppimisdata luodaan? Oppimisdatan Luominen on työläs ja hidas prosessi ja jos se tehdään huonosti, voi se johtaa koneoppimisalgoritmin huonoon tai väärään opettamiseen, minkä seurauksena se ei toimi halutulla tavalla tai se toimiivajaavaisesti. Oppimisdata usein hankitaan satunnaisotanalla oikean maailman datasta, jolloin siinä saattaa olla mahdottomia arvoja (joko puuttuvia tai vajaita) tai tutkimuksen kannalta merkityksettömiä arvoja. (Kapitanova ja Son 2012; Kotsiantis, Zaharakis ja Pintelas 2007) Kuvio 1. Ohjatun oppimisen työnkulku (lähde: Googlen kuvahaku) Kuvassa 1 näkyy ohjatun oppimisen tavanomainen työnkulu. Aluksi hankitaan dataa joka luokitellaan, ja jolla algoritmia opetetaan. Tämän jälkeen hankitaan uutta dataa, jota ei käsitellä mitenkään ja sillä testataan luotua algoritmia. Tulokset tarkastetaan, ja tarvittaessa 4

9 algoritmia opetetaan lisää kunnes saavutaan halutunlaiseen lopputulokseen. 3.1 Päätöspuut Kuvio 2. Esimerkki päätöspuusta Päätöspuut (engl. decision trees, myös classification trees sekä regression trees) ovat ehkä yksinkertaisin malli ohjatusta koneoppimisesta, mutta se on myös yksi toimivimpia. Päätöspuut ovat yksinkertaisia kuvassa 2 esitetyn kaltaisia binääripuita, joiden avulla järjestelmä tekee päätöksiä. Yksittäiset päätöspuut eivät sinänsä ole oppivia järjestelmiä, koska ne pysyvät staattisina eivätkä muutu ajan myötä, mutta ottamalla mukaan useita puita (metsät) ja soveltamalla erilaisia menetelmiä valintojen tekemiseen, puiden painottamiseen ja uusien puiden luomiseen saavutetaan oppiva järjestelmä (Kapitanova ja Son 2012). Esimerkiksi kuvassa 2 oleva oikeanpuoleinen puu on oppiva mikäli todennäköisyys muuttuu päätösten perusteella. Päätöspuut ovat erityisen toimivia yksinkertaisissa järjestelmissä, mutta laajemmissa järjestelmissä ne kannattaa korvata muilla menetelmillä. 3.2 Bayes-verkot Bayes-verkot (engl. Bayesian networks) ovat graafiteoriaan ja todennäköisyyslaskentaan perustuvia malleja. Bayes-verkot ovat pohjimmiltaan melko yksinkertaisia, kuvan 3 mukaisia suunnattuja syklittomia verkkoja. Bayes-verkot toimivat siten, että edellisen kuvan mukaan jos henkilöllä on päänsärky joka johtaa koomaan, on hänellä todennäköisesti aivokasvain. 5

10 Kuvio 3. Yksinkertainen Bayes-verkko (lähde: Googlen kuvahaku) Nämä kausaalisuhteet eivät ole absoluuttisia: vaikka henkilöllä olisi ollut päänsärky ja kooma, ei hänellä välttämättä ole aivokasvainta. Tämän kaltaisia (mutta huomattavasti laajempia) graafeja voidaan käyttää koneoppimisessa ja päätöksenteossa. Koneoppimisen osalta Bayes-verkkoja käytetään etenkin silloin, kun halutaan kerätä tietoa tuntemattomasta systeemistä. Eli aloitetaan pienella tai olemattomalla puulla ja lähdetään laajentamaan sitä (Kapitanova ja Son 2012; Charniak 1991). Charniakin (1991) artikkeli Bayesian networks without tears on erinomainen perusteiden opiskeluun. 3.3 Markovin mallit Markovin mallit (engl. Markov models) ovat stokastisia prosesseja joilla ei ole muistia. Stokastiset prosessit ovat prosesseja, joilla on jokin tila joka vaihtuu sattumanvaraisesti satunnaisin ajoin. Markovin prosessissa prosessi ei muista aiempaa tilaa, ja tulos on riippuva vain nykytilasta. Esimerkiksi nopan heittäminen on Markovin prosessi, koska lopputulos ei riipu aiemman heiton tuloksesta. Markovin malleja ei itsessään käytetä koneoppimisessa, mutta sen johdannaista Markovin piilomallia (engl. Hidden Markov model) käytetään. Se eroaa normaalista mallista siten, että siinä prosessin tila ja siirtymät ovat tuntemattomia, mutta jokaisen suoritetun siirtymän jälkeen nähdään tulos. 6

11 Kuvio 4. Markovin piilomalli esimerkki (lähde: Googlen kuvahaku) Esimerkiksi kuvassa 4 tilat c i ovat piilotettuja, mutta tulokset y i tiedetään. Vaikka Markovin piilomalleissa ainoastaan nykyhetkellä on vaikutusta tulokseen, riippuvat tilat aiemmasta tilasta. Tämä näkyy kuvassa 4 nuolina tilojen välillä. Markovin piilomallien lisäksi on olemassa vielä Markovin puoli-piilomallit (engl. Hidden Semi-Markov model), joita ei tässä tutkimuksessa käsittele. Markovin mallit ovat erityisen toimivia kun käsitellään ajasta riippuvaa dataa. Esimerkiksi puheentunnistus, jossa yksittäiset äänet ovat merkityksettömiä, mutta missä useiden äänteiden yhdistelmät (ts. useiden tilojen tulokset) ovat merkityksellisiä. (Cortes ja Vapnik 1995) 3.4 Tukivektorikoneet Tukivektorikoneet (engl. Support vector machines, svm) ovat hyvin teoreettinen koneoppimismenetelmä. Toisin kuin useat muut koneoppimisalgoritmit, tukivektorikoneet on kehitelty suoraan tilastopohjaisen oppimisteorian mukaan (engl. Statistical learning theory), eikä käytännön menetelmien pohjalta. Tästä seuraa, että näihin algoritmeihin sisältyy oletuksena lupaus niiden toimivuudesta. Tukivektorikoneet ovat matemaattisia algoritmeja datan luokitteluun ja näin ne soveltuvat erinomaisesti muun muassa tekstintunnistamiseen ja konenäköön. Lyhyesti sanottuna tukivektorikoneet toimivat yhdistämällä syötteen yhteen arvojoukkoon moniulotteisessa avaruudessa. Kuvassa 5 näkyy kaksi arvojoukkoa tulosavaruudessa. Itse 7

12 Kuvio 5. Optimaalinen hypertaso tulosavaruudessa (lähde: Googlen kuvahaku) syötteen yhdistäminen tulokseen ei ole hankalaa, mutta tulosavaruuden arvojoukkojen erottelu toisista on. Tukivektorikoneet tekevät nimenomaan tätä tehtävää, ne erottelevat tulsoavaruuden arvojoukot toisistaan mahdollisimman isolla marginaalilla. Kuvassa katkoviivoilla merkittyjä vektoreita kutsutaan tukivektoreiksi, joista menetelmä saakin nimensä (Cortes ja Vapnik 1995). 3.5 K-lähimmän naapurin algoritmit K-lähimmän naapurin algoritmit (engl. k-nearest neighbor, k-nn) ovat yksinkertaisia algoritmeja datan luokitteluun. Esimerkiksi jos verkkokauppa haluaisi luoda tuotteita joista asiakas voisi olla kiinnostunut, onnistuisi se valitsemalla K:n arvoksi esimerkiksi 10 ja näin etsimällä 10 lähintä naapuria (tässä yhteydessä toista asiakasta, joiden käyttäytyminen on lähellä luokiteltavaa asiakasta). Tarkkailemalla näiden naapurien ostoksia ja toimintaa voidaan luoda suositus-lista. Esimerkin mukaan k-lähimmän naapurin algoritmeja voi soveltaa useisiin eri tilanteisiin, erityisesti luokittelutehtäviin. Näistä algoritmeista on olemassa useita erilaisia 8

13 variaatioita; esimerkiksi etäisyyspainotettu versio (engl. Distance weighted k-nn). (Bhatia ja Vandana 2010) Kuvio 6. K-lähintä naapuria esimerkki (lähde: Googlen kuvahaku) Kuvassa 6 näkyy yksinkertainen esimerkki k-lähimmän naapurin algoritmista, kun halutaan tietää onko X q positiivinen vai negatiivinen silloin kun k=5. Kun viidestä lähimmästä naapurista kolme on negatiivisia, asetetaan myös X q negatiiviseksi. 9

14 4 Ohjaamaton oppiminen Ohjaamaton oppiminen on nimensä mukaisesti ohjatun oppimisen vastakohta. Kun ohjatussa oppimisessa algoritmia ohjataan haluttuun suuntaan, niin annetaaan ohjaamattomassa oppimisessa algoritmin saapua omiin päätöksiin ilman ulkopuolista avustusta. Toisin kuin ohjattu oppiminen, ohjaamaton oppiminen ei käytä syöte-tulos -pareja (engl. labeled data) oppimiseen ja näin se ei kärsi ohjatun oppimisen suurimmasta ongelmasta, eli oppimisdatan luomisesta. Tämä tosin luo ohjaamattoman oppimisen suurimman ongelman/riskin, joka on oikeanlaisen algoritmin valitseminen. Algoritmin valinnalla on tässä yhteydessä vielä suurempi tärkeys kuin ohjatun oppimisen yhteydessä. (Kapitanova ja Son 2012) Kun ohjatun oppimisen tavoitteena on luokitella dataa halutulla tavalla, niin ohjaamattoman oppimisen tavoitteena on etsiä piilossa olevia riippuvuuksia datasta. Näin ollen se on hyvin lähellä tiedonlouhintaa. 4.1 Klusterointi Klusterointialgoritmit ovat yleisimpiä ohjaamattoman oppimisen menetelmistä, ja yksi laajimpia. Valtaosa ohjaamattomasta oppimisesta on erilaisia klusterointialgoritmeja. Yksinkertaisesti ne perustuvat klusterointihypoteesiin, jonka mukaan samaan luokkaan kuuluvat objektit käyttäytyvät samalla tavalla tutkittavan parametrin puitteissa. Esimerkiksi 2-ulotteisessa avaruudessa samaan luokkaan kuuluvat oliot (jatkossa pisteet) muodostavat silminnähtäviä klustereita. Yleisesti klusterianalyysi tehdäänkin juuri moniulotteissa avaruudessa sijaitseviin pisteisiin. (Kapitanova ja Son 2012; Witten ja Frank 2005) Huom. vaikka aikaisemmin mainitut k-lähimmän naapurin algoritmit ovat periaatteessa klusterointialgoritmeja, eivät ne kuulu ohjaamattomaan oppimiseen K-means klusterointi K-means klusterointi on klassinen esimerkki klusterointialgoritmista. Ensin siinä selvitetään kuinka monta klusteria datasta halutaan luoda, eli k:n arvo. Tämän jälkeen k pistettä vali- 10

15 taan satunnaisesti toimimaan jokaisen klusterin keskipisteenä. Lopuksi jäljelle jäävät pisteet liitetään lähimpään klusteriin. Tällaisessa muodossa tämä algoritmi on todella yksinkertainen. Pisteet vain liitetään suoraan lähimpään klusteriin, näin syntyviä klustereita kutsutaan Voronoi-soluiksi jotka muodostavat Voronoi-diagrammin. K-means klusteroinnissa optimaalisen ratkaisun löytäminen on NP-kova ongelma. Näin ollen k-means klusteroinnissa käytetään heuristisia algoritmejä, joista ehkä yleisin on Lloydin algoritmi. (Kapitanova ja Son 2012) Aluksi sattumanvaraisia pisteitä käyttämällä luodaan prototyyppi klusterit, joihin sitten sovelletaan Lloydin algoritmia. Tämä algoritmi laskee klustereille uudet keskipisteet. Tätä jatketaan niin kauan, että päästään haluttuun lopputulokseen. Kuvassa 7 näkyy ensimmäinen Voronoi-diagrammi, ja lopputulos 15 iteraation jälkeen. Kuvio 7. Voronoi-diagrammi ennen Lloydin algoritmia, ja sen jälkeen (lähde:wikipedia, Lloyd s algorithm) K-means klusterointialgoritmista on olemassa useita eri versioita, jotka muun muassa nopeuttavat sen toimintaa. K-means klusterointi on yksinkertainen ja helppo algoritmi, joka toimii todella hyvin tietynlaisiin datajoukkoihin, mutta esimerkiksi esiintymistiheyteen perustuvissa klustereissa se voi leikata klustereita osiin (Kapitanova ja Son 2012; Witten ja Frank 2005). Se on riippuvainen k:n arvoista ja ylimääräinen tai virheellinen tieto (engl. noise) häiritsee sen toimintaa helposti. Lisäksi k-means algoritmin toimintaa häiritsee poikkeavat tai reunoilla olevat tulokset (engl. outliers). 11

16 4.1.2 DBSCAN klusterointi Kun k-means klusterointi on pisteiden välisiin etäisyyksiin perustuva algoritmi, on toinen paljon käytetty menetelmä tiheyteen perustuva klusterointi. Näistä tiheysklusterointi algoritmeistä käytetyin on DBSCAN (Kapitanova ja Son 2012). Kun k-means klusterointialgoritmissa luodaan haluttu määrä tasaisesti hajaantuneita ja samankokoisia klustereita tavoitteena luokitella dataa. Esiintymistiheyteen perustuvat algoritmit toimivat eritavalla. Sen sijaan ne eivät luokittele dataa haluttuihin luokkiin, vaan etsivät datasta jo olemassa olevia luokkia. Kuvassa 8 näkyy vertailu k-means algoritmin ja DBSCAN-algoritmin välillä, kun pistejoukko on sama. Kuvassa k-means -algoritmi hakee kaksi haluttua klusteria, kun DBSCAN-algoritmi löytää vain yhden klusterin. koska kuvan pisteiden (datan) esiintymistiheys on sama pistejoukossa, DBSCAN käsittelee pisteet vain yhtenä klusterina. Tämän ansiosta DBSCAN pystyy löytämään muunmuassa epälineaarisia klustereita. Kuvio 8. K-means algoritmi ja DBSCAN-algoritmi sovellettuna samaan pistejoukkoon (lähde: Googlen kuvahaku, DBSCAN vs k-means) 4.2 Itseorganisoituvat kartat ja neuroverkot Jotta itseorganisoituvat kartat voidaan käydä läpi, selvitämme lyhyesti neuroverkkojen toimintaperiaatteen. 12

17 4.2.1 Neuroverkot Kuvio 9. Neuroverkko-malli Neuroverkot ovat laskennallinen malli, joka perustuu ihmisten keskushermoston rakenteeseen. Siinä luodaan joukko keinotekoisia neuroneita, jotka ovat kytketty toisiinsa. Neuroverkot ovat kuvan 9 mukaisesti rakennettuja verkkoja, joissa vihreät pallot ovat syötekerros, siniset pallot ovat piilotettu kerros ja keltaiset pallot ovat tuloskerros. Kuvassa esitetty malli on eteenpäin kytketty monikerroksinen perseptroniverkko. Neuroverkkojen opettaminen tapahtuu siten, että ne löytävät opetusdatasta alkioiden välisiä merkitseviä riippuvuuksia. Se että verkko nimenomaan löytää merkitsevät riippuvuudet saadaan aikaiseksi valitsemalla opetusdata huolellisesti. Jos esimerkiksi halutaan kameran lukevan auton rekisterikilven, opetusdatassa ei ole muita kuvia kuin rekisterikilpiä. Mikäli muita kuvia lisätään opetusdataan, voi verkko valita väärät merkitsevät riippuvuudet. Itse oppiminen tapahtuu niin, että opetusdataa käsiteltäessä verkon neuronien välisten reittien painoarvot muuttuvat. Lopulta jos opettaminen on mennyt oikein, pitäisi verkon päätyä samaan tulokseen samankaltaisilla syötteillä. Kuvassa 9 olevassa mallissa on vain yksi piilotettu kerros, mutta todellisuudessa niitä voi olla useita. (Haykin 1994) 13

18 4.2.2 Itseorganisoituvat kartat Itseorganisoituvat kartat (engl. self organizing map, SOM myös Kohonen network, Kohonen map) ovat Teuvo Kohosen 1980-luvulla luoma neuroverkkomalli. Yksinkertaistettuna se toimii projektoimalla moniulotteisen datan yleensä 2-ulotteiseen avaruuteen siten, että data ei menetä keskeistä informaatiota. (Haykin 1994) Esimerkiksi valitaan verkko, jossa on kuusi syötettä ja kaksi tulos neuronia. Nämä neuronit ja syötteet projisoidaan kaksi-ulotteiseen avaruuteen (kuva 10). Nyt syötteistä yksi valitaan satunnaisesti (keltainen syöte) ja se ajetaan neuroverkon läpi. Itseorganisoituvissa kartoissa vain yksi tulosneuroni voi olla kerrallaan aktiivinen. Tätä neuronia kutsutaan nimellä voittajaneuroni (engl. winner neutron, winner-takes-all neutron). Tämä neuroni siirretään sitten lähemmäksi aktiivista syötettä. Tulosneuronit on liitetty toisiinsa siten, että vaikka vain yksi neuroni on aktiivinen molempia siirretään samaan suuntaan. Ei-aktiivisille neutroneille tämä siirto on pienempi mitä kauempana se on voittajaneuronista. Tätä prosessia toistetaan niin kauan että kaikki syötteet on käyty läpi (tässä tapauksessa kuusi kertaa). Kun kaikki syötteet on käyty läpi, luokitellaan ne lähimmän tulosneuronin mukaan. Eli esimerkissä saimme kaksi erillistä luokkaa, joita kuvaa sininen ja vihreä tulosneuroni. Kuvio 10. Itseorganisoituvan kartan opetusprosessi Esimerkin mukaisesti tämä menetelmä luo moniulotteisesta datasta halutun määrän luok- 14

19 kia, jotka esitetään yleensä 2-ulotteisessa avaruudessa. Tästä menetelmästä on luotu useita eri variaatioita, ja tämä onkin yksi käytetyimpiä ohjaamattoman oppimisen menetelmistä. On huomioitava, että yksinkertaisilla syötteillä itseorganisoituvat kartat käyttäytyvät hyvin samankaltaisesti k-means -klusterointialgoritmin kanssa, mutta syötteiden ominaisuuksien määrän kasvaessa menetelmien erot tulevat ilmi. 4.3 Adaptive resonance theory Adaptive Reconanse Theory (jatkossa ART) on itseorganisoituvien karttojen tapaan eräs neuroverkkojen implementaatio. Se pohjautuu kilpailevaan oppimiseen (engl. competitive learning), jossa neuronit kilpailevat siitä, kuka saa lähettää dataa eteenpän. Tämä johtaa neuronien erikoistumiseen ajan kuluessa. ART luotiin pyrkimyksenä päästä eroon sekä kilpailevan oppimisen että itseorganisoituvien karttojen ongelmista ja ratkaisemaan stabiilisuusmukautuvuus -dilemma (engl. stability-plasticity dilemma). Tämä dilemma kuvaa ongelmaa oppivissa järjestelmissä, kun pitäisi oppia uutta vanhaa unohtamatta; mukautuvuus tarkoittaa järjestelmän kykyä mukautua uuteen tietoon ja stabiliteetti kykyä säilyttää vanha tieto. (Grossberg 2013) Alunperin ART-malli luotiin selittämään aivojen oppimisprosessia. Soveltamalla sitä keinotekoisiin neuroverkkoihin saadaan aikaan oppivia järjestelmiä, jotka ovat erityisen toimivia kun halutaan järjestelmä jonka pitää oppia uutta vanhaa unohtamatta. Tässä annetaan usein esimerkki ihmisaivoista: ihmiset tunnistavat vanhemmansa jopa vuosien jälkeen huolimatta siitä, että he ovat oppineet useita uusia kasvoja vuosien saatossa. Tämänkaltainen uuden oppiminen ei ole mahdollista valtaosalla koneoppimismalleista. ART-malleja on useita, joista tällä hetkellä käytetyin on ARTMAP. Se pohjautuu ART1 ja ART2 -malleihin. (Grossberg 2013) ART1 on ensimmäinen ja yksinkertaisin luotu malli; se hyväksyy ainoastaan binäärisiä syötteitä. Se toimii yksinkertaisesti siten, että jokainen syöte yritetään sitoa olemassa olevaan luokkaan. Mikäli olemassa olevaa luokka ei löydy niin sidotaan tämä syöte vapaana olevaan tulosneuroniin. Koska luokat ovat tuloskerroksen neuroneita (huom. vain yksi tulosneuroni voi olla aktiivinen kerrallaan, joten yksi tulosneuroni kuvaa yhtä luokkaa), niin järjestelmän 15

20 kokonaismuistikapasiteetti on tulosneuronien lukumäärä. Mikäli syöte on uuteen luokkaan kuuluva, mutta yhtään vapaata neuronia ei ole niin syöte hylätään. Tämä on välttämätöntä jotta jo opittu tieto ei häviä. ART-malleissa on lisäksi niille ominainen vigilance-arvo. Tämä arvo kuvaa sitä, kuinka spesifejä luokat ovat. Esimerkiksi ART-verkko, joka tunnistaa esineitä kuvista voi luokitella auton ja moottoripyörän molemmat kulkuvälineiksi tai se voi luokitella ne omiin luokkiinsa (auto moottoripyörä). Näistä ensimmäinen on huomattavasti geneerisempi muisto, ja näin sen vigilance-arvo on pienempi. (Postma ja Hudson 1995) 16

21 5 Yhteenveto Koneoppiminen on arkipäivää. Se on monipuolinen työkalu, kun tarvitaan järjestelmä joka kykenee luokittelemaan syötetietoja joko ihmisen avustuksella tai ilman. Tässä tutkielmassa on esitelty ohjaamattoman ja ohjatun oppimisen muutamia yleisimpiä menetelmiä tarkastellen niiden toimintaa ja vahvuuksia. Ohjatun oppimisen osalta käytiin läpi muutama yleisemmin käytössä oleva menetelmä. Nämä olivat verrattain yksinkertaisia menetelmiä rajoittunein ominaisuuksin. Tutkimuksessa kävi ilmi, että ohjatun oppimisen menetelmät ovat erinomaisia selkeisiin tehtäviin ja ongelmiin. Esimerkkinä käytetty roskapostifiltteri on erinomainen sovelluskohde ohjatulle oppimiselle. Ohjamaattomasta oppimisesta käsiteltiin muutamia klusterointimenetelmiä, itseorganisoituvia karttoja ja ART-malleja. Näistä kaikki ovat yleisessä käytössä. Klusterointialgorimeista käsiteltiin vain kaksi, mutta niitä löytyy huomattavasti enemmän. Neuroverkkoa ei kokonaisuutena käsitelty selitystä lukuunottamatta, mutta sen kaksi eri implementaatiota käytiin läpi. Ohjaamattoman oppimisen menetelmä ovat todella monipuolisia ja tehokkaita työkaluja monimutkaisiin luokittelutehtäviin. Näistä menetelmistä etenkin ART:llä, ja sen muunnoksilla, on hyvin ihmismäinen oppimisprosessi ja käsittelykyky. Kuten aikaisemmin mainittiinkin on ART kehitetty selittämään matemaattisesti ihmisten oppimista. Tätä tutkielmaa voisi laajentaa huomattavasti, ja tarkoituksena onkin laajentaa se pro gradu - tutkielmaksi, jossa tarkoituksena on tutkia/selvittää koneoppimisen soveltamista tietoturvallisuuteen. Erityiseti anomaliteettien havaitsemiseen; esimerkiksi aiemmin tuntemattomien uhkien havaitseminen, joka voidaan tehdä vain normaalista poikkeavan käytöksen havaitsemisella. 17

22 Lähteet Bhatia, Nitin, ja Vandana Survey of nearest neighbor techniques. International Journal of Computer Science and Information Security 8 (2): Charniak, Eugene Bayesian networks without tears. AI magazine 12 (4): 50. Cortes, Corinna, ja Vladimir Vapnik Support-vector networks. Machine Learning 20 (3): Geronimo, David, Antonio M Lopez, Angel Domingo Sappa ja Thorsten Graf Survey of pedestrian detection for advanced driver assistance systems. IEEE Transactions on Pattern Analysis and Machine Intelligence 32 (7): Grossberg, S Adaptive resonance theory. Scholarpedia 8 (5): Haykin, Simon Neural networks: a comprehensive foundation. Prentice Hall PTR. Kapitanova, Krasimira, ja Sang H Son Machine Learning Basics. Teoksessa Intelligent Sensor Networks: The Integration of Sensor Networks, Signal Processing and Machine Learning, CRC Press. Kotsiantis, Sotiris B, ID Zaharakis ja PE Pintelas Supervised machine learning: A review of classification techniques. Teoksessa Emerging Artificial Intelligence Applications in Computer Engineering, IOS Press. Postma, Eric O, ja Patrick TW Hudson Adaptive resonance theory. Teoksessa Artificial Neural Networks, Springer. Sutton, Richard S., ja Andrew G. Barto Introduction to Reinforcement Learning. 1st. MIT Press. Witten, Ian H, ja Eibe Frank Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann. Zhu, Xiaojin Semi-supervised learning literature survey. Technical report TR1530. Computer Science, University of Wisconsin-Madison. 18

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.

Lisätiedot

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä

Lisätiedot

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä

Lisätiedot

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ] Johdatus tekoälyyn Luento 6.10.2011: Koneoppiminen Patrik Hoyer [ Kysykää ja kommentoikaa luennon aikana! ] Koneoppiminen? Määritelmä: kone = tietokone, tietokoneohjelma oppiminen = ongelmanratkaisukyvyn

Lisätiedot

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään

Lisätiedot

Tee-se-itse -tekoäly

Tee-se-itse -tekoäly Tee-se-itse -tekoäly Avainsanat: koneoppiminen, tekoäly, neuroverkko Luokkataso: 6.-9. luokka, lukio, yliopisto Välineet: kynä, muistilappuja tai kertakäyttömukeja, herneitä tms. pieniä esineitä Kuvaus:

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS NEUROVERKOT TURINGIN KONE (TAI TAVALLINEN OHJELMOINTI) VAIN YKSI LASKENNAN MALLI ELÄINTEN HERMOSTOSSA LASKENTA ERILAISTA: - RINNAKKAISUUS - STOKASTISUUS (SATUNNAISUUS) - MASSIIVINEN

Lisätiedot

Tekoäly ja alustatalous. Miten voit hyödyntää niitä omassa liiketoiminnassasi

Tekoäly ja alustatalous. Miten voit hyödyntää niitä omassa liiketoiminnassasi Tekoäly ja alustatalous Miten voit hyödyntää niitä omassa liiketoiminnassasi AI & Alustatalous AI Digitaalisuudessa on 1 ja 0, kumpia haluamme olla? Alustatalouden kasvuloikka Digitaalisen alustatalouden

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS NEUROVERKOT TURINGIN KONE (TAI TAVALLINEN OHJELMOINTI) VAIN YKSI LASKENNAN MALLI ELÄINTEN HERMOSTOSSA LASKENTA ERILAISTA: - RINNAKKAISUUS - STOKASTISUUS (SATUNNAISUUS) - MASSIIVINEN

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS NEUROVERKOT TURINGIN KONE (TAI TAVALLINEN OHJELMOINTI) VAIN YKSI LASKENNAN MALLI ELÄINTEN HERMOSTOSSA LASKENTA ERILAISTA: - RINNAKKAISUUS - STOKASTISUUS (SATUNNAISUUS) - MASSIIVINEN

Lisätiedot

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

E. Oja ja H. Mannila Datasta Tietoon: Luku 2 2. DATASTA TIETOON: MITÄ DATAA; MITÄ TIETOA? 2.1. Data-analyysin ongelma Tulevien vuosien valtava haaste on digitaalisessa muodossa talletetun datan kasvava määrä Arvioita: Yhdysvaltojen kongressin kirjasto

Lisätiedot

Johdatus tekoälyn taustalla olevaan matematiikkaan

Johdatus tekoälyn taustalla olevaan matematiikkaan Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 3.11.2017 Mitä tekoäly on? Wikipedia: Tekoäly on tietokone tai tietokoneohjelma, joka kykenee älykkäiksi

Lisätiedot

Introduction to Machine Learning

Introduction to Machine Learning Introduction to Machine Learning Aki Koivu 27.10.2016 HUMAN HEALT H ENVIRONMENTAL HEALT H 2016 PerkinElmer Miten tietokone oppii ennustamaan tai tekemään päätöksiä? Historia tiivistettynä Machine Learning

Lisätiedot

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? 1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö

Lisätiedot

Kognitiivinen mallintaminen. Nelli Salminen

Kognitiivinen mallintaminen. Nelli Salminen Kognitiivinen mallintaminen Neuraalimallinnus 24.11. Nelli Salminen nelli.salminen@tkk.fi Tällä kerralla ohjelmassa vielä perseptronista ja backpropagationista kilpaileva oppiminen, Kohosen verkko oppimissääntöjen

Lisätiedot

Koneoppiminen ja tekoäly suurten tietomassojen käsittelyssä yleensä ja erityisesti sovellettuina satelliittidatan käyttöön metsien arvioinnissa

Koneoppiminen ja tekoäly suurten tietomassojen käsittelyssä yleensä ja erityisesti sovellettuina satelliittidatan käyttöön metsien arvioinnissa Koneoppiminen ja tekoäly suurten tietomassojen käsittelyssä yleensä ja erityisesti sovellettuina satelliittidatan käyttöön metsien arvioinnissa Metsätieteen päivä 26.11.2018 Jorma Laaksonen, vanhempi yliopistonlehtori

Lisätiedot

Tekoäly ja sen soveltaminen yrityksissä. Mika Rantonen

Tekoäly ja sen soveltaminen yrityksissä. Mika Rantonen Tekoäly ja sen soveltaminen yrityksissä Mika Rantonen Tekoäly- paljon puhetta, mistä kyse? Lyhyesti sanottuna: tekoäly on sellaista koneen tekemää toimintaa, joka ihmisen tekemänä olisi älykästä Otetaan

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Johdatus monimuuttujamenetelmiin Luennot 30.10.13.12.-18 Tiistaina klo 12-14 (30.10., BF119-1) Keskiviikkoisin klo 10-12 (MA101,

Lisätiedot

Tiedonlouhinta ja sen mahdollisuudet

Tiedonlouhinta ja sen mahdollisuudet Tiedonlouhinta ja sen mahdollisuudet Henry Joutsijoki Sisältö Johdanto Tiedonlouhinta Koneoppiminen ja tiedonlouhinta Tiedonlouhinnan tulevaisuus Alustusta Nyky-yhteiskunnassamme käsitteet tehokkuus, nopeus,

Lisätiedot

Tällä kerralla ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus Kertausta: Perseptronin oppimissääntö

Tällä kerralla ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus Kertausta: Perseptronin oppimissääntö Tällä kerralla ohjelmassa Kognitiivinen mallintaminen Neuraalimallinnus 19.2. Nelli Salminen nelli.salminen@helsinki.fi D433 vielä perseptronista ja backpropagationista kilpaileva oppiminen, Kohosen verkko

Lisätiedot

Älykäs datan tuonti kuljetusongelman optimoinnissa. Antoine Kalmbach

Älykäs datan tuonti kuljetusongelman optimoinnissa. Antoine Kalmbach Älykäs datan tuonti kuljetusongelman optimoinnissa Antoine Kalmbach ane@iki.fi Sisällys Taustaa Kuljetusongelma Datan tuominen vaikeaa Teoriaa Tiedostojen väliset linkit Mikä sarake on mikäkin? Ratkaisutoteutus

Lisätiedot

T DATASTA TIETOON

T DATASTA TIETOON TKK / Informaatiotekniikan laboratorio Syyslukukausi, periodi II, 2007 Erkki Oja, professori, ja Heikki Mannila, akatemiaprofessori: T-61.2010 DATASTA TIETOON TKK, Informaatiotekniikan laboratorio 1 JOHDANTO:

Lisätiedot

Tekoäly liiketoiminnassa. Tuomas Ritola CEO, selko.io

Tekoäly liiketoiminnassa. Tuomas Ritola CEO, selko.io Tekoäly liiketoiminnassa Tuomas Ritola CEO, selko.io Selko.io Automaattista teknisen tekstin luokittelua ja analysointia, eli tekoälyä tekstidatalle. Päivän agenda: Tekoäly. Muotisana? Strategia? Uhka?

Lisätiedot

Oppijan saama palaute määrää oppimisen tyypin

Oppijan saama palaute määrää oppimisen tyypin 281 5. KONEOPPIMINEN Älykäs agentti voi joutua oppimaan mm. seuraavia seikkoja: Kuvaus nykytilan ehdoilta suoraan toiminnolle Maailman relevanttien ominaisuuksien päätteleminen havaintojonoista Maailman

Lisätiedot

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/

Lisätiedot

jens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor

jens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor T-1.81 Luonnollisten kielten tilastollinen käsittely Vastaukset 11, ti 8.4., 1:1-18: Klusterointi, Konekääntäminen. Versio 1. 1. Kuvaan 1 on piirretty klusteroinnit käyttäen annettuja algoritmeja. Sanojen

Lisätiedot

JUHTA ja VAHTI juhlatilaisuus, Tietojärjestelmien tulevaisuudesta tekoälyn kehityksen näkökulmasta. Timo Honkela.

JUHTA ja VAHTI juhlatilaisuus, Tietojärjestelmien tulevaisuudesta tekoälyn kehityksen näkökulmasta. Timo Honkela. JUHTA ja VAHTI juhlatilaisuus, 2017 Tietojärjestelmien tulevaisuudesta tekoälyn kehityksen näkökulmasta Timo Honkela timo.honkela@helsinki.fi 31. lokakuuta 2017 Ihmisestä ja ihmisyhteisöistä Kuva:/skylgroup.com/communities--socities/

Lisätiedot

Johdatus tekoälyn taustalla olevaan matematiikkaan

Johdatus tekoälyn taustalla olevaan matematiikkaan Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 3. luento 17.11.2017 Neuroverkon opettaminen (ohjattu oppiminen) Neuroverkkoa opetetaan syöte-tavoite-pareilla

Lisätiedot

Tarvitseeko informaatioteknologia matematiikkaa?

Tarvitseeko informaatioteknologia matematiikkaa? Tarvitseeko informaatioteknologia matematiikkaa? Oulun yliopisto Matemaattisten tieteiden laitos 1 Kyllä kai IT matematiikkaa tarvitsee!? IT ja muu korkea teknologia on nimenomaan matemaattista teknologiaa.

Lisätiedot

Laskut käyvät hermoille

Laskut käyvät hermoille Laskut käyvät hermoille - Miten ja miksi aivoissa lasketaan todennäköisyyksiä Aapo Hyvärinen Matematiikan ja tilastotieteen laitos & Tietojenkäsittelytieteen laitos Helsingin Yliopisto Tieteen päivät 13.1.2011

Lisätiedot

Tekoäly tukiäly. Eija Kalliala, Marjatta Ikkala

Tekoäly tukiäly. Eija Kalliala, Marjatta Ikkala Tekoäly tukiäly Eija Kalliala, Marjatta Ikkala 29.11.2018 Mitä on tekoäly? Unelma koneesta, joka ajattelee kuin ihminen Hype-sana, jota kuulee joka paikassa Väärinymmärretty sana -> vääriä odotuksia, pelkoja

Lisätiedot

Kaksiluokkainen tapaus, lineaarinen päätöspinta, lineaarisesti erottuvat luokat

Kaksiluokkainen tapaus, lineaarinen päätöspinta, lineaarisesti erottuvat luokat 1 Tukivektoriluokittelija Tukivektorikoneeseen (support vector machine) perustuva luoikittelija on tilastollisen koneoppimisen teoriaan perustuva lineaarinen luokittelija. Perusajatus on sovittaa kahden

Lisätiedot

Poikkeavuuksien havainnointi (palvelinlokeista)

Poikkeavuuksien havainnointi (palvelinlokeista) Poikkeavuuksien havainnointi (palvelinlokeista) TIES326 Tietoturva 2.11.2011 Antti Juvonen Sisältö IDS-järjestelmistä Datan kerääminen ja esiprosessointi Analysointi Esimerkki Lokidatan rakenne Esikäsittely,

Lisätiedot

Tekoäly tänään , Vadim Kulikov (Helsingin Yliopisto)

Tekoäly tänään , Vadim Kulikov (Helsingin Yliopisto) Tekoäly tänään 6.6.2017, Vadim Kulikov (Helsingin Yliopisto) Lyhyesti: kehitys kognitiotieteessä Representationalismi, Kognitio on symbolien manipulointia. Symbolinen tekoäly. Sääntöpohjaiset järjestelmät

Lisätiedot

ALGORITMIT & OPPIMINEN

ALGORITMIT & OPPIMINEN ALGORITMIT & OPPIMINEN Mitä voidaan automatisoida? Mikko Koivisto Avoimet aineistot tulevat Tekijä: Lauri Vanhala yhdistä, kuvita, selitä, ennusta! Tekijä: Logica Mitä voidaan automatisoida? Algoritmi

Lisätiedot

Kombinatorinen optimointi

Kombinatorinen optimointi Kombinatorinen optimointi Sallittujen pisteiden lukumäärä on äärellinen Periaatteessa ratkaisu löydetään käymällä läpi kaikki pisteet Käytännössä lukumäärä on niin suuri, että tämä on mahdotonta Usein

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

Tekstuurintunnistuksen lyhyt oppimäärä. Ts. pari tapaa erottaa tiiliseinä pensaasta.

Tekstuurintunnistuksen lyhyt oppimäärä. Ts. pari tapaa erottaa tiiliseinä pensaasta. Tekstuurintunnistuksen lyhyt oppimäärä Ts. pari tapaa erottaa tiiliseinä pensaasta. Mitä on tekstuuri? Vaikea määritellä, mutta: Pintakuvio Ornamentti tuntu kuviointi Miksi tämän pitäisi kiinnostaa? (Maantienmerkkausrobotti)

Lisätiedot

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018 Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex Puheentunnistus Yleisesti Puheentunnistus Yleisesti Puheentunnistus

Lisätiedot

Kognitiivinen mallintaminen Neuraalimallinnus, luento 1

Kognitiivinen mallintaminen Neuraalimallinnus, luento 1 Kognitiivinen mallintaminen Neuraalimallinnus, luento 1 Nelli Salminen nelli.salminen@helsinki.fi D433 Neuraalimallinnuksen osuus neljä luentokertaa, muutokset alla olevaan suunnitelmaan todennäköisiä

Lisätiedot

KONEOPPIMISEN HYÖDYNTÄMINEN: AUTOMAATTINEN TIKETTIEN KÄSITTELY. Esa Sairanen

KONEOPPIMISEN HYÖDYNTÄMINEN: AUTOMAATTINEN TIKETTIEN KÄSITTELY. Esa Sairanen KONEOPPIMISEN HYÖDYNTÄMINEN: AUTOMAATTINEN TIKETTIEN KÄSITTELY Esa Sairanen 29.03.2017 Sisältö Taustaa Tavoite Mitä on koneoppiminen? Azure Machine Learning koneoppimismenetelmiä Projektin vaiheet Data

Lisätiedot

Ongelma(t): Miten digitaalista tietoa voidaan toisintaa ja visualisoida? Miten monimutkaista tietoa voidaan toisintaa ja visualisoida?

Ongelma(t): Miten digitaalista tietoa voidaan toisintaa ja visualisoida? Miten monimutkaista tietoa voidaan toisintaa ja visualisoida? Ongelma(t): Miten digitaalista tietoa voidaan toisintaa ja visualisoida? Miten monimutkaista tietoa voidaan toisintaa ja visualisoida? 2 Tieto on koodattu aikaisempaa yleisemmin digitaaliseen muotoon,

Lisätiedot

Tänään ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus laskarit. Ensi kerralla (11.3.)

Tänään ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus laskarit. Ensi kerralla (11.3.) Tänään ohjelmassa Kognitiivinen mallintaminen Neuraalimallinnus 26.2. Nelli Salminen nelli.salminen@helsinki.fi D433 autoassosiaatio, attraktorin käsite esimerkkitapaus: kolme eri tapaa mallintaa kategorista

Lisätiedot

DOB valmennus Data-analyysi. Koneoppiminen. CC by

DOB valmennus Data-analyysi. Koneoppiminen. CC by DOB valmennus Data-analyysi Koneoppiminen CC by 4.0 30.08.2017 Datasta oivalluksia ja bisnestä Data-analytiikan menetelmien valmennusmateriaali Luentopäivän sisältö Johdanto Tiedonlouhinta Koneoppiminen

Lisätiedot

Gradu UASI-hankkeesta

Gradu UASI-hankkeesta Maatalouden tarpeet Metsätalouden tarpeet Kasvitaudit ja rikkataudit Heikki Jyväskylän yliopisto 8.3.2011 Maatalouden tarpeet Metsätalouden tarpeet Kasvitaudit ja rikkataudit 1 Johdanto ja motivointi Maatalouden

Lisätiedot

Tekoäly ja koneoppiminen metsävaratiedon apuna

Tekoäly ja koneoppiminen metsävaratiedon apuna Tekoäly ja koneoppiminen metsävaratiedon apuna Arbonaut Oy ja LUT University 26. marraskuuta 2018 Metsätieteen päivä 2018 Koneoppimisen kohteena ovat lukujen sijasta jakaumat Esimerkki 1 Koneoppimisessa

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof. Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes 11.06.2012 Ohjaaja: TkT Arto Klami Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla

Lisätiedot

Tekoäly muuttaa arvoketjuja

Tekoäly muuttaa arvoketjuja Tekoäly muuttaa arvoketjuja Näin kartoitat tekoälyn mahdollisuuksia projektissasi Harri Puolitaival Harri Puolitaival Diplomi-insinööri ja yrittäjä Terveysteknologia-alan start-up: Likelle - lämpötilaherkkien

Lisätiedot

TIETOJENKÄSITTELYTIEDE

TIETOJENKÄSITTELYTIEDE TIETOJENKÄSITTELYTIEDE Tietojenkäsittelytieteen laitos Exactum (Kumpulan kampus) PL 68 (Gustaf Hällströmin katu 2b) 00014 Helsingin yliopisto Puhelinnumero 02941 911 (vaihde), ohivalinta 02941... http://www.cs.helsinki.fi/

Lisätiedot

Algoritmi III Vierekkäisten kuvioiden käsittely. Metsätehon tuloskalvosarja 7a/2018 LIITE 3 Timo Melkas Kirsi Riekki Metsäteho Oy

Algoritmi III Vierekkäisten kuvioiden käsittely. Metsätehon tuloskalvosarja 7a/2018 LIITE 3 Timo Melkas Kirsi Riekki Metsäteho Oy Algoritmi III Vierekkäisten kuvioiden käsittely Metsätehon tuloskalvosarja 7a/2018 LIITE 3 Timo Melkas Kirsi Riekki Metsäteho Oy Algoritmi III vierekkäisten kuvioiden käsittely Lähtötietoina algoritmista

Lisätiedot

Diskriminanttianalyysi I

Diskriminanttianalyysi I Diskriminanttianalyysi I 12.4-12.5 Aira Hast 24.11.2010 Sisältö LDA:n kertaus LDA:n yleistäminen FDA FDA:n ja muiden menetelmien vertaaminen Estimaattien laskeminen Johdanto Lineaarinen diskriminanttianalyysi

Lisätiedot

UUDET INNOVAATIOT. Professori Heikki Kälviäinen Koulutusohjelman johtaja Laitoksen johtaja

UUDET INNOVAATIOT. Professori Heikki Kälviäinen Koulutusohjelman johtaja Laitoksen johtaja UUDET INNOVAATIOT Professori Heikki Kälviäinen Koulutusohjelman johtaja Laitoksen johtaja Tietojenkäsittelytekniikan professori Konenäön ja hahmontunnistuksen laboratorio Tietotekniikan laitos Teknistaloudellinen

Lisätiedot

Tilanne sekä MS-A0003/4* Matriisilaskenta 5 op

Tilanne sekä MS-A0003/4* Matriisilaskenta 5 op MATEMATIIKKA Mat-1.1210 Matematiikan peruskurssi S1 ei järjestetä enää MS-A0103/4* Differentiaali- ja integraalilaskenta I 5 op sekä MS-A0003/4* Matriisilaskenta 5 op Mat-1.1110 Matematiikan peruskurssi

Lisätiedot

Johdatus tekoälymatematiikkaan (kurssilla Johdatus Watson-tekn

Johdatus tekoälymatematiikkaan (kurssilla Johdatus Watson-tekn Johdatus tekoälymatematiikkaan (kurssilla Johdatus Watson-tekniikkaan ITKA352) Informaatioteknologian tiedekunta Jyväskylän yliopisto 23.3.2018 Tekoälyn historiaa 6 1 Introduction Kuva Fig. lähteestä 1.3

Lisätiedot

Page 1 of 9. Ryhmä/group: L = luento, lecture H = harjoitus, exercises A, ATK = atk-harjoitukset, computer exercises

Page 1 of 9. Ryhmä/group: L = luento, lecture H = harjoitus, exercises A, ATK = atk-harjoitukset, computer exercises Tietotekniikan tarjoama opetus syksyllä 2016 23.5.2016 CS course schedule in autumn 2016 Sari Salmisuo I periodi / period I 12.9. 21.10.2016 viikot/weeks 37-42 II periodi / period II 31.10. 9.12.2016 viikot/weeks

Lisätiedot

ImageRecognition toteutus

ImageRecognition toteutus ImageRecognition toteutus Simo Korkolainen 27 kesäkuuta 2016 Projektin tarkoituksena on tehdä ohjelma, joka opettaa neuroverkon tunnistamaan kuvia backpropagation-algoritmin avulla Neuroverkon opetuksessa

Lisätiedot

Muuttaako tekoäly maailmaa - ja miten? Kansainvälinen Telepäivä

Muuttaako tekoäly maailmaa - ja miten? Kansainvälinen Telepäivä Muuttaako tekoäly maailmaa - ja miten? Kansainvälinen Telepäivä 17.5.2018 Heikki Ailisto Tutkimusprofessori Teknologiantutkimuskeskus VTT Oy Tiivistelmä Tekoäly on hype-käyrän huipulla. Siihen liittyy

Lisätiedot

ELEC-C5210 Satunnaisprosessit tietoliikenteessä

ELEC-C5210 Satunnaisprosessit tietoliikenteessä ELEC-C5210 Satunnaisprosessit tietoliikenteessä Esa Ollila Aalto University, Department of Signal Processing and Acoustics, Finland esa.ollila@aalto.fi http://signal.hut.fi/~esollila/ Kevät 2017 E. Ollila

Lisätiedot

Autamme asiakkaitamme menestymään parantamalla tekemisen luottamustasoa ja läpinäkyvyyttä uusilla innovatiivisilla konsepteilla ja ratkaisuilla.

Autamme asiakkaitamme menestymään parantamalla tekemisen luottamustasoa ja läpinäkyvyyttä uusilla innovatiivisilla konsepteilla ja ratkaisuilla. Celkee Oy:n Missio Autamme asiakkaitamme menestymään parantamalla tekemisen luottamustasoa ja läpinäkyvyyttä uusilla innovatiivisilla konsepteilla ja ratkaisuilla. Tuomme organisaatioiden piilossa olevan

Lisätiedot

Datatähti 2019 loppu

Datatähti 2019 loppu Datatähti 2019 loppu task type time limit memory limit A Summa standard 1.00 s 512 MB B Bittijono standard 1.00 s 512 MB C Auringonlasku standard 1.00 s 512 MB D Binääripuu standard 1.00 s 512 MB E Funktio

Lisätiedot

Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu (aihe-esittely)

Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu (aihe-esittely) Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu (aihe-esittely) Vilma Virasjoki 23.01.2012 Ohjaaja: Jouni Pousi Valvoja: Raimo P. Hämäläinen Työn saa tallentaa

Lisätiedot

Logistinen regressio, separoivat hypertasot

Logistinen regressio, separoivat hypertasot Logistinen regressio, separoivat hypertasot Topi Sikanen Logistinen regressio Aineisto jakautunut K luokkaan K=2 tärkeä erikoistapaus Halutaan mallintaa luokkien vedonlyöntikertoimia (odds) havaintojen

Lisätiedot

Tulevaisuuden ja kehitteillä olevat tekniikat (FET)

Tulevaisuuden ja kehitteillä olevat tekniikat (FET) Tulevaisuuden ja kehitteillä olevat tekniikat (FET) Hoitavatko robotit, mihin tietokone on kadonnut? Pekka Karp Euroopan komissio Tietoyhteiskunnan tekniikat PK - Joensuu 27/05/02 FET= Future and Emerging

Lisätiedot

Tietotekniikan valintakoe

Tietotekniikan valintakoe Jyväskylän yliopisto Tietotekniikan laitos Tietotekniikan valintakoe 2..22 Vastaa kahteen seuraavista kolmesta tehtävästä. Kukin tehtävä arvostellaan kokonaislukuasteikolla - 25. Jos vastaat useampaan

Lisätiedot

Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi

Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi 28.4.2013 Annemari Auvinen (annauvi@st.jyu.fi) Anu Niemi (anniemi@st.jyu.fi) 1 Sisällysluettelo 1 JOHDANTO... 2 2 KÄYTETYT MENETELMÄT...

Lisätiedot

Tiedonsiirron kokonaisoptimointi erilaisten tietoverkkojen yhteiskäytössä

Tiedonsiirron kokonaisoptimointi erilaisten tietoverkkojen yhteiskäytössä Tiedonsiirron kokonaisoptimointi erilaisten tietoverkkojen yhteiskäytössä Juuso Meriläinen 27.11.2015 Juuso Meriläinen Tiedonsiirron kokonaisoptimointi erilaisten tietoverkkojen yhteiskäytössä 1 / 11 Johdanto

Lisätiedot

Simulation model to compare opportunistic maintenance policies

Simulation model to compare opportunistic maintenance policies Simulation model to compare opportunistic maintenance policies Noora Torpo 31.08.18 Ohjaaja/Valvoja: Antti Punkka Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin

Lisätiedot

ACUMEN O2: Verkostot

ACUMEN O2: Verkostot ACUMEN O2: Verkostot OHJELMA MODUULI 4 sisältää: Lyhyt johdanto uranhallintataitojen viitekehykseen VERKOSTOT: työkaluja ja taitoja kouluttajille Partnerit: LUMSA, ELN, BEST, INNOV, MeathPartnership, SYNTHESIS,

Lisätiedot

SFS/SR315 Tekoäly Tekoälyn standardisointi

SFS/SR315 Tekoäly Tekoälyn standardisointi SFS/SR315 Tekoäly Tekoälyn standardisointi Meri Seistola Toiminnanjohtaja, Mediakasvatuskeskus Metka ry SR 315 Tekoäly - Puheenjohtaja: Jarkko Vesa 1 SC42 Artificial Intelligence ISO/IEC JTC1 SC42 Artificial

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:

Lisätiedot

Mitä on konvoluutio? Tutustu kuvankäsittelyyn

Mitä on konvoluutio? Tutustu kuvankäsittelyyn Mitä on konvoluutio? Tutustu kuvankäsittelyyn Tieteenpäivät 2015, Työohje Sami Varjo Johdanto Digitaalinen signaalienkäsittely on tullut osaksi arkipäiväämme niin, ettemme yleensä edes huomaa sen olemassa

Lisätiedot

Σ!3674. Advanced Test Automation for Complex Software-Intensive Systems

Σ!3674. Advanced Test Automation for Complex Software-Intensive Systems Advanced Test Automation for Complex Software-Intensive Systems = Advanced Test Automation for Complex Software- Intensive Systems Pääteemana kompleksisten ja erittäin konfiguroitavien softaintensiivisten

Lisätiedot

Siltaaminen: Piaget Matematiikka Inductive Reasoning OPS Liikennemerkit, Eläinten luokittelu

Siltaaminen: Piaget Matematiikka Inductive Reasoning OPS Liikennemerkit, Eläinten luokittelu Harjoite 2 Tavoiteltava toiminta: Materiaalit: Eteneminen: TUTUSTUTAAN OMINAISUUS- JA Toiminnan tavoite ja kuvaus: SUHDETEHTÄVIEN TUNNISTAMISEEN Kognitiivinen taso: IR: Toiminnallinen taso: Sosiaalinen

Lisätiedot

Alustavia käyttökokemuksia SAS Studiosta. Timo Hurme Maa- ja elintarviketalouden tutkimuskeskus MTT (v. 2015 alusta Luonnonvarakeskus / Luke)

Alustavia käyttökokemuksia SAS Studiosta. Timo Hurme Maa- ja elintarviketalouden tutkimuskeskus MTT (v. 2015 alusta Luonnonvarakeskus / Luke) Alustavia käyttökokemuksia SAS Studiosta Timo Hurme Maa- ja elintarviketalouden tutkimuskeskus MTT (v. 2015 alusta Luonnonvarakeskus / Luke) 19.9.2014 Lyhyesti SAS-koodareille suunnattu uusi käyttöliittymä

Lisätiedot

monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.

monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof. Epätäydellisen preferenssiinformaation hyödyntäminen monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi 15.1.2018 Ohjaaja: Prof. Kai Virtanen Valvoja: Prof. Kai Virtanen Tausta Päätöspuu

Lisätiedot

Viimeistely Ajourien huomiointi puutiedoissa ja lopullinen kuviointi. Metsätehon tuloskalvosarja 5/2018 LIITE 4 Timo Melkas Kirsi Riekki Metsäteho Oy

Viimeistely Ajourien huomiointi puutiedoissa ja lopullinen kuviointi. Metsätehon tuloskalvosarja 5/2018 LIITE 4 Timo Melkas Kirsi Riekki Metsäteho Oy Viimeistely Ajourien huomiointi puutiedoissa ja lopullinen kuviointi Metsätehon tuloskalvosarja 5/2018 LIITE 4 Timo Melkas Kirsi Riekki Metsäteho Oy Viimeistely ajourien huomiointi ja lopullinen kuviointi

Lisätiedot

Johdatus tekoälyn taustalla olevaan matematiikkaan

Johdatus tekoälyn taustalla olevaan matematiikkaan Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 2. luento 10.11.2017 Keinotekoiset neuroverkot Neuroverkko koostuu syöte- ja ulostulokerroksesta

Lisätiedot

matematiikka Tapio Helin Nuorten akatemiaklubi Helsinki 16.02.2015 Matematiikan ja tilastotieteen laitos

matematiikka Tapio Helin Nuorten akatemiaklubi Helsinki 16.02.2015 Matematiikan ja tilastotieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Leipätyönä sovellettu matematiikka Tapio Helin Nuorten akatemiaklubi Helsinki 16.02.2015 Matematiikan ja tilastotieteen laitos Tapio Helin

Lisätiedot

Tietorakenteet ja algoritmit

Tietorakenteet ja algoritmit Tietorakenteet ja algoritmit Rekursio Rekursion käyttötapauksia Rekursio määritelmissä Rekursio ongelmanratkaisussa ja ohjelmointitekniikkana Esimerkkejä taulukolla Esimerkkejä linkatulla listalla Hanoin

Lisätiedot

NBE-E4510 Special Assignment in Biophysics and Biomedical Engineering AND NBE-E4500 Special Assignment in Human. NBE-E4225 Cognitive Neuroscience

NBE-E4510 Special Assignment in Biophysics and Biomedical Engineering AND NBE-E4500 Special Assignment in Human. NBE-E4225 Cognitive Neuroscience Neurotieteen ja lääketieteellisen tekniikan laitos Department of and Biomedical OPETUSOHJELMASTA POISTUNEET KURSSIT (Tfy-99, Becs-114, BECS, NBE)/päivitetty 16.5.2017 COURSES REMOVED FROM THE STUDY PROGRAMME

Lisätiedot

Matematiikka ja tilastotiede. Orientoivat opinnot / 25.8.2015

Matematiikka ja tilastotiede. Orientoivat opinnot / 25.8.2015 Matematiikka ja tilastotiede Orientoivat opinnot / 25.8.2015 Tutkinnot Kaksi erillistä ja peräkkäistä tutkintoa: LuK + FM Laajuudet 180 op + 120 op = 300 op Ohjeellinen suoritusaika 3 v + 2 v = 5 v Tutkinnot

Lisätiedot

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari Konsensusongelma hajautetuissa järjestelmissä Niko Välimäki 30.11.2007 Hajautetut algoritmit -seminaari Konsensusongelma Päätöksen muodostaminen hajautetussa järjestelmässä Prosessien välinen viestintä

Lisätiedot

MATINE-projekti 2500M-0069: Tietotekniset harhautukset (ICT Illusions)

MATINE-projekti 2500M-0069: Tietotekniset harhautukset (ICT Illusions) MATINE-projekti 2500M-0069: Tietotekniset harhautukset (ICT Illusions) Sampsa Rauti Turun yliopisto, Tulevaisuuden teknologioiden laitos MATINE-tutkimusseminaari, 16.11.2017 Esityksen sisältö Tiimi Taustaa

Lisätiedot

Kuva Suomen päätieverkko 1 Moottoritiet on merkitty karttaan vihreällä, muut valtatiet punaisella ja kantatiet keltaisella värillä.

Kuva Suomen päätieverkko 1 Moottoritiet on merkitty karttaan vihreällä, muut valtatiet punaisella ja kantatiet keltaisella värillä. POHDIN projekti TIEVERKKO Tieverkon etäisyyksien minimointi ja esimerkiksi maakaapeleiden kokonaismäärän minimointi sekä ylipäätään äärellisen pistejoukon yhdistäminen reitityksillä toisiinsa niin, että

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

S09 04 Kohteiden tunnistaminen 3D datasta

S09 04 Kohteiden tunnistaminen 3D datasta AS 0.3200 Automaatio ja systeemitekniikan projektityöt S09 04 Kohteiden tunnistaminen 3D datasta Loppuraportti 22.5.2009 Akseli Korhonen 1. Projektin esittely Projektin tavoitteena oli algoritmin kehittäminen

Lisätiedot

TERVEISET OPETUSHALLITUKSESTA

TERVEISET OPETUSHALLITUKSESTA TERVEISET OPETUSHALLITUKSESTA Oppimisen ja osaamisen iloa Uudet opetussuunnitelmalinjaukset todeksi Irmeli Halinen Opetusneuvos Opetussuunnitelmatyön päällikkö OPPIMINEN OPETUS JA OPISKELU PAIKALLISET

Lisätiedot

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI Ohjaamattomassa oppimisessa on tavoitteena muodostaa hahmoista ryhmiä, klustereita, joiden sisällä hahmot ovat jossain mielessä samankaltaisia ja joiden välillä

Lisätiedot

Injektio. Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim.

Injektio. Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim. Injektio Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim. Funktio f on siis injektio mikäli ehdosta f (x 1 ) = f (x 2 ) seuraa, että x 1 = x 2.

Lisätiedot

Tässä luvussa käsitellään optimaalisten piirteiden valintaa, luokittelijan optimointia ja luokittelijan suorituskyvyn arviointia.

Tässä luvussa käsitellään optimaalisten piirteiden valintaa, luokittelijan optimointia ja luokittelijan suorituskyvyn arviointia. 1 Luokittelijan suorituskyvyn optimointi Tässä luvussa käsitellään optimaalisten piirteiden valintaa, luokittelijan optimointia ja luokittelijan suorituskyvyn arviointia. A. Piirteen valinnan menetelmiä

Lisätiedot

Robotit ja tekoäly terveydenhuollon työvälineinä nyt ja tulevaisuudessa työn tutkimukseen perustuva näkökulma

Robotit ja tekoäly terveydenhuollon työvälineinä nyt ja tulevaisuudessa työn tutkimukseen perustuva näkökulma VTT TECHNICAL RESEARCH CENTRE OF FINLAND LTD Robotit ja tekoäly terveydenhuollon työvälineinä nyt ja tulevaisuudessa työn tutkimukseen perustuva näkökulma Mikael Wahlström, VTT Erikoistutkija, valtiot.

Lisätiedot

CHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi

CHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi Tiivistelmä CHERMUG-projekti on kansainvälinen konsortio, jossa on kumppaneita usealta eri alalta. Yksi tärkeimmistä asioista on luoda yhteinen lähtökohta, jotta voimme kommunikoida ja auttaa projektin

Lisätiedot

Näkökulmia tietoyhteiskuntavalmiuksiin

Näkökulmia tietoyhteiskuntavalmiuksiin Näkökulmia tietoyhteiskuntavalmiuksiin Tietotekniikka oppiaineeksi peruskouluun Ralph-Johan Back Imped Åbo Akademi & Turun yliopisto 18. maaliskuuta 2010 Taustaa Tietojenkäsittelytieteen professori, Åbo

Lisätiedot

Taitava taitoharjoittelu kehittymisen tukena Sami Kalaja

Taitava taitoharjoittelu kehittymisen tukena Sami Kalaja Taitava taitoharjoittelu kehittymisen tukena Sami Kalaja Huippu-urheilupäivät 2014 Vierumäki Esityksen sisällöstä Harjoittelun määrästä Näytöt ja mallin seuraaminen Vaihtelun ja monipuolisuuden merkityksestä

Lisätiedot

Graafin 3-värittyvyyden tutkinta T Graafiteoria, projektityö (eksakti algoritmi), kevät 2005

Graafin 3-värittyvyyden tutkinta T Graafiteoria, projektityö (eksakti algoritmi), kevät 2005 Graafin 3-värittyvyyden tutkinta T-79.165 Graafiteoria, projektityö (eksakti algoritmi), kevät 2005 Mikko Malinen, 36474R 29. maaliskuuta, 2005 Tiivistelmä Artikkelissa käydään läpi teoriaa, jonka avulla

Lisätiedot

Geneettiset algoritmit

Geneettiset algoritmit Geneettiset algoritmit Evoluution piirteitä laskennassa Optimoinnin perusteet - Kevät 2002 / 1 Sisältö Geneettisten algoritmien sovelluskenttä Peruskäsitteitä Esimerkkejä funktion ääriarvon etsintä vangin

Lisätiedot

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla. Edistyksen päivät, Helsinki Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla Timo Honkela timo.honkela@helsinki.fi 5.10.2017 Taustaa: Rauhankone-konsepti

Lisätiedot

Kandidaatintyön esittely: Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu

Kandidaatintyön esittely: Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu Kandidaatintyön esittely: Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu Vilma Virasjoki 19.11.2012 Ohjaaja: DI Jouni Pousi Valvoja: Professori Raimo P.

Lisätiedot

Avainsanojen poimiminen Eeva Ahonen

Avainsanojen poimiminen Eeva Ahonen Avainsanojen poimiminen 5.10.2004 Eeva Ahonen Sisältö Avainsanat Menetelmät C4.5 päätöspuut GenEx algoritmi Bayes malli Testit Tulokset Avainsanat Tiivistä tietoa dokumentin sisällöstä ihmislukijalle hakukoneelle

Lisätiedot