Jeremias Penttilä. Koneoppiminen. Tietotekniikan kandidaatintutkielma. 2. elokuuta Jyväskylän yliopisto. Tietotekniikan laitos
|
|
- Anja Turunen
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Jeremias Penttilä Koneoppiminen Tietotekniikan kandidaatintutkielma 2. elokuuta 2015 Jyväskylän yliopisto Tietotekniikan laitos
2 Tekijä: Jeremias Penttilä Yhteystiedot: Työn nimi: Koneoppiminen Title in English: Machine learning Työ: Kandidaatintutkielma Sivumäärä: 22+0 Tiivistelmä: Koneoppiminen on monipuolinen ja tehokas työkalu erilaisiin tehtäviin. Tässä tutkielmassa on tarkoituksena tutustua sekä ohjatun että ohjaamattoman oppimisen yleisimpiin menetelmiin. Tarkoituksena on käsitellä nämä menetelmät yleisellä tasolla niin, että asiasta tietämätön ymmärtää perusperiaatteet miten eri menetelmät toimivat. Tarkempia yksityiskohtia ja matemaattisia algoritmejä ei tulla käsittelemään. Avainsanat: Koneoppiminen, ohjattu oppiminen, ohjaamaton oppiminen, neuroverkot, itseorganisoituvat kartat, klusterointi, adaptive resonance theory, art Abstract: Machine learning is powerfull and versatile tool for a multitude of tasks. The point of this study is to familiarize oneself with a couple of different methods of both supervised and unsupervised machine learning, so that anyone can understand the basic principles behind the different methods. We will not go into details, nor will we explain the mathematical algorithms behind these methods. Keywords: Machine learning, supervised learning, unsupervised learning, neural networks, self-organizing maps, clustering, adaptive resonance theory, art i
3 Kuviot Kuvio 1. Ohjatun oppimisen työnkulku (lähde: Googlen kuvahaku)... 4 Kuvio 2. Esimerkki päätöspuusta... 5 Kuvio 3. Yksinkertainen Bayes-verkko (lähde: Googlen kuvahaku)... 6 Kuvio 4. Markovin piilomalli esimerkki (lähde: Googlen kuvahaku)... 7 Kuvio 5. Optimaalinen hypertaso tulosavaruudessa (lähde: Googlen kuvahaku)... 8 Kuvio 6. K-lähintä naapuria esimerkki (lähde: Googlen kuvahaku)... 9 Kuvio 7. Voronoi-diagrammi ennen Lloydin algoritmia, ja sen jälkeen (lähde:wikipedia, Lloyd s algorithm) Kuvio 8. K-means algoritmi ja DBSCAN-algoritmi sovellettuna samaan pistejoukkoon (lähde: Googlen kuvahaku, DBSCAN vs k-means) Kuvio 9. Neuroverkko-malli Kuvio 10. Itseorganisoituvan kartan opetusprosessi ii
4 Sisältö 1 JOHDANTO KONEOPPIMINEN YLEISESTI OHJATTU OPPIMINEN Päätöspuut Bayes-verkot Markovin mallit Tukivektorikoneet K-lähimmän naapurin algoritmit OHJAAMATON OPPIMINEN Klusterointi K-means klusterointi DBSCAN klusterointi Itseorganisoituvat kartat ja neuroverkot Neuroverkot Itseorganisoituvat kartat Adaptive resonance theory YHTEENVETO LÄHTEET iii
5 1 Johdanto Mitä koneoppiminen on? Onko se scifissä esiintyneitä robotteja, vai jotain maanläheisempää? Tässä tutkimuksessa on tarkoituksena tuoda esille yleisellä tasolla, mitä koneoppiminen on, mitä eri menetelmiä se pitää sisällään ja miten nämä menetelmät eroavat toisistaan. Kun teknologia etenee suurin harppauksin, ja erilaiset enemmän tai vähemmän älykkäät järjestelmät leviävät arkielämään, kasvattaa koneoppiminen tärkeyttään aikaisempaan verrattuna. Koneoppiminen on jo integraalinen, vaikkakin usein piilossa oleva, osa modernia elämää. Esimerkiksi joihinkin valokuva-albumiohjelmiin on tullut automaattinen kasvojentunnistustoiminto, joka perustuu hahmontunnistukseen. Hahmontunnistus ja konenäkö yleisesti ovat yksi tärkeimpiä koneoppimisen tutkimuskohteita. Yksinkertaisempiakin esimerkkejä löytyy, muun muassa sähköpostiohjelmien roskapostifiltterit, jotka skannaavat tulevia posteja ja yrittävät määrittää ovatko ne roskapostia vai ei. Erityisen tärkeässä asemassa koneoppiminen on tiedonlouhintaa tehtäessä. Siinä koneoppimisen avulla pyritään valtavasta tiedon määrästä etsimään yhteyksiä (Kapitanova ja Son 2012). Kuten nähdään, koneoppiminen on integraalinen osa modernia elämää ja ainakin sen yleinen ymmärtäminen on hyödyllistä. Koneoppimisen tutkimisen ja kehittämisen pitkän aikavälin tavoitteena voidaan nähdä todellisen tekoälyn (ts. tekoäly jolla on tietoisuus) saavuttaminen. Tämä ei ole mahdollista ilman koneoppimista. Koneoppiminen on tekoälyn osa-alue, joka voidaan määritellä alaksi, jonka tarkoituksena on luoda algoritmeja, jotka empiiristä dataa, kokemusta ja koulutusta avulla käyttäen mukautuvat muutoksiin halutulla tavalla. Koneoppiminen sisältää osia muun muassa psykologiasta, filosofiasta, tilastotieteistä ja neurobiologiasta (Kapitanova ja Son 2012). Nykyyhteiskunnassa, jossa tieteen eri alojen rajoja pyritään rikkomaan, koneoppiminen on ajankohtainen ja moderni tutkimusalue. Etenkin kun edellä mainitut älykkäät järjestelmät yleistyvät, voi viallinen koneoppimisen tai sen osa-alueen huono toteutus johtaa jopa hengenvaarallisiin tilanteisiin. Esimerkiksi uusien ajoneuvojen ADAS-järjestelmät (engl. advanced driver assistance systems) toimivat paljolti hahmontunnistuksen avulla (Geronimo et al. 2010). Mainitun todellisen tekoälyn saavuttaminen tulisi olemaan tieteellisesti erittäin suuri läpi- 1
6 murto, joka saattaisi aloittaa uuden nopean teknologisen ja tieteellisen kehittymisen aikakauden. Tähän tapahtumaan liittyy myös synkkä puoli: ihmiskunta ei kykene sopeutumaan nopeaan teknologian kehittymiseen. Tätä tapahtumaa kutsutaan teknologiseksi singulariteetiksi. Termi jonka matemaatikko John von Neumann kehitti 1950-luvulla, ja jonka tieteiskirjailija Vernor Vinge toi kuuluisaksi. Tässä tutkimuksessa tarkoituksena on kartoittaa yleisellä tasolla koneoppimisen eri menetelmiä, sen käyttötarkoituksia sekä hyötyjä ja haittoja. Pääpaino pyritään pitämään ohjaamattomassa oppimisessa, mutta koska tarkoituksena on kuvata koneoppimista, niin käydään myös ohjatun oppimisen yleisimpiä menetelmiä läpi. Luvussa 2 käsitellään koneoppimista yleisellä tasolla. Koneoppiminen terminä selvitetään; miten se määritellään, ja mitä se pitää sisällään. Lisäksi käydään läpi lyhyesti muut koneoppimisen menetelmät kuin ohjaamaton ja ohjattu oppiminen. Luvuissa 3 ja 4 käsitellään ohjattu ja ohjaamatton oppiminen tarkemmin läpi. Ohjatusta oppimisesta Käsitellään muutaman yleisimmin käytössä olevan menetelmän nopeasti, ja ohjaamattomassa oppimisessa käydään muutama yleinen menetelmä hieman syvällisemmin läpi. Luvussa 5 vedetään lyhyt yhteenveto työn pääkohdista. 2
7 2 Koneoppiminen yleisesti Kuten johdannossa mainittiin, on koneoppiminen Kapitanova ym. (2012) mukaan kokoelma algoritmeja jotka mukautuvat muutoksiin halutulla tavalla. Tämä saavutetaan luomalla opetteludataa, jossa tiedetään syöte (eli alkutila) ja haluttu lopputulos. Näin tätä dataa käyttämällä luodaan algoritmi, joka päätyy samaan lopputulokseen kaikilla samankaltaisilla syötteillä. Esimerkkinä oikein opetetun roskapostifiltterin tulisi tunnistaa erityyppiset roskapostit aiemman datan perusteella, vaikka ne olisivatkin sisällöltään erilaiset. Ohjatulla oppimisella tarkoitetaan algoritmeja, joille annetaan oppimisdataa jonka lopputulos tiedetään (engl. labeled data). Oppimisdatan avulla algoritmia voidaan muokata niin, että se saavuttaa halutut lopputulokset tietynkaltaisella syötteellä. Ohjaamattomassa oppimisessa oppimisdatalle ei sen sijaan ole annettu lopputulosta (engl. unlabeled data) (Kapitanova ja Son 2012; Kotsiantis, Zaharakis ja Pintelas 2007). Tutkimuksessa selvitetään tarkemmin näiden kahden eroja ja vaatimuksia. Tarkemmin käsitellään vain ohjatun ja ohjaamattoman oppimisen menetelmiä, mutta mainitsemisen arvoisia ovat myös vahvistusoppiminen (engl. reinforcement learning) ja puoliohjattu oppiminen (engl. semi-supervised learning). Vahvistusoppiminen on trial-and-error menetelmällä tapahtuvaa oppimista. Tässä menetelmässä syötteen labelia ei tiedetä etukäteen, mutta poiketen ohjaamattomasta oppimisesta vahvistusoppimisessa saadaan tieto, kuinka hyvä tai oikein on algoritmilla saavutettu lopputulos. Toisinsanottuna algoritmi tietää millon se on tehnyt oikean päätöksen, ja näin se hiljalleen oppii tekemään oikeita päätöksiä myös muunlaisten syötteiden kanssa. (Sutton ja Barto 1998) Puoli-ohjattu koneoppiminen on nimensä mukaisesti yhdistelmä ohjattua ja ohjaamatonta koneoppimista. Tässä menetelmässä pääpaino on ohjaamattomassa oppimisessa, mutta opiskeludatasta osa käsitellään ohjatun oppimisen menetelmin. Näin algoritmia saadaan ohjattua haluttuun suuntaan. Puoli-ohjatulla koneoppimisella voidaan välttää sekä ohjatun että ohjaamattoman oppimisen huonoja puolia, kunhan se vain tehdään tarpeeksi hyvin. (Zhu 2006) 3
8 3 Ohjattu oppiminen Ohjattu koneoppiminen on nimensä mukaisesti ihmisten ohjaamaa oppimista. Tämä onnistuu oppimisdatan avulla opettamalla algoritmille syöte-tulos parien avulla halutunlaista käytöstä. Eli kun oppimisdatassa tiedetään sekä syöte että tulos, tutkimusdatan syötteistä ei tiedetä tulosta. Näin oppimisdatan avulla luodaan luokittimia (engl. classifiers), joiden avulla jokainen tutkimusdatan syöte voidaan yleistää yhteen luokittimeen, ja näin ollen saadaan tulos. Tällaisen oppimisdatan käyttö aiheuttaa myös yhden suurimmista ohjatun oppimisen ongelmista, miten oppimisdata luodaan? Oppimisdatan Luominen on työläs ja hidas prosessi ja jos se tehdään huonosti, voi se johtaa koneoppimisalgoritmin huonoon tai väärään opettamiseen, minkä seurauksena se ei toimi halutulla tavalla tai se toimiivajaavaisesti. Oppimisdata usein hankitaan satunnaisotanalla oikean maailman datasta, jolloin siinä saattaa olla mahdottomia arvoja (joko puuttuvia tai vajaita) tai tutkimuksen kannalta merkityksettömiä arvoja. (Kapitanova ja Son 2012; Kotsiantis, Zaharakis ja Pintelas 2007) Kuvio 1. Ohjatun oppimisen työnkulku (lähde: Googlen kuvahaku) Kuvassa 1 näkyy ohjatun oppimisen tavanomainen työnkulu. Aluksi hankitaan dataa joka luokitellaan, ja jolla algoritmia opetetaan. Tämän jälkeen hankitaan uutta dataa, jota ei käsitellä mitenkään ja sillä testataan luotua algoritmia. Tulokset tarkastetaan, ja tarvittaessa 4
9 algoritmia opetetaan lisää kunnes saavutaan halutunlaiseen lopputulokseen. 3.1 Päätöspuut Kuvio 2. Esimerkki päätöspuusta Päätöspuut (engl. decision trees, myös classification trees sekä regression trees) ovat ehkä yksinkertaisin malli ohjatusta koneoppimisesta, mutta se on myös yksi toimivimpia. Päätöspuut ovat yksinkertaisia kuvassa 2 esitetyn kaltaisia binääripuita, joiden avulla järjestelmä tekee päätöksiä. Yksittäiset päätöspuut eivät sinänsä ole oppivia järjestelmiä, koska ne pysyvät staattisina eivätkä muutu ajan myötä, mutta ottamalla mukaan useita puita (metsät) ja soveltamalla erilaisia menetelmiä valintojen tekemiseen, puiden painottamiseen ja uusien puiden luomiseen saavutetaan oppiva järjestelmä (Kapitanova ja Son 2012). Esimerkiksi kuvassa 2 oleva oikeanpuoleinen puu on oppiva mikäli todennäköisyys muuttuu päätösten perusteella. Päätöspuut ovat erityisen toimivia yksinkertaisissa järjestelmissä, mutta laajemmissa järjestelmissä ne kannattaa korvata muilla menetelmillä. 3.2 Bayes-verkot Bayes-verkot (engl. Bayesian networks) ovat graafiteoriaan ja todennäköisyyslaskentaan perustuvia malleja. Bayes-verkot ovat pohjimmiltaan melko yksinkertaisia, kuvan 3 mukaisia suunnattuja syklittomia verkkoja. Bayes-verkot toimivat siten, että edellisen kuvan mukaan jos henkilöllä on päänsärky joka johtaa koomaan, on hänellä todennäköisesti aivokasvain. 5
10 Kuvio 3. Yksinkertainen Bayes-verkko (lähde: Googlen kuvahaku) Nämä kausaalisuhteet eivät ole absoluuttisia: vaikka henkilöllä olisi ollut päänsärky ja kooma, ei hänellä välttämättä ole aivokasvainta. Tämän kaltaisia (mutta huomattavasti laajempia) graafeja voidaan käyttää koneoppimisessa ja päätöksenteossa. Koneoppimisen osalta Bayes-verkkoja käytetään etenkin silloin, kun halutaan kerätä tietoa tuntemattomasta systeemistä. Eli aloitetaan pienella tai olemattomalla puulla ja lähdetään laajentamaan sitä (Kapitanova ja Son 2012; Charniak 1991). Charniakin (1991) artikkeli Bayesian networks without tears on erinomainen perusteiden opiskeluun. 3.3 Markovin mallit Markovin mallit (engl. Markov models) ovat stokastisia prosesseja joilla ei ole muistia. Stokastiset prosessit ovat prosesseja, joilla on jokin tila joka vaihtuu sattumanvaraisesti satunnaisin ajoin. Markovin prosessissa prosessi ei muista aiempaa tilaa, ja tulos on riippuva vain nykytilasta. Esimerkiksi nopan heittäminen on Markovin prosessi, koska lopputulos ei riipu aiemman heiton tuloksesta. Markovin malleja ei itsessään käytetä koneoppimisessa, mutta sen johdannaista Markovin piilomallia (engl. Hidden Markov model) käytetään. Se eroaa normaalista mallista siten, että siinä prosessin tila ja siirtymät ovat tuntemattomia, mutta jokaisen suoritetun siirtymän jälkeen nähdään tulos. 6
11 Kuvio 4. Markovin piilomalli esimerkki (lähde: Googlen kuvahaku) Esimerkiksi kuvassa 4 tilat c i ovat piilotettuja, mutta tulokset y i tiedetään. Vaikka Markovin piilomalleissa ainoastaan nykyhetkellä on vaikutusta tulokseen, riippuvat tilat aiemmasta tilasta. Tämä näkyy kuvassa 4 nuolina tilojen välillä. Markovin piilomallien lisäksi on olemassa vielä Markovin puoli-piilomallit (engl. Hidden Semi-Markov model), joita ei tässä tutkimuksessa käsittele. Markovin mallit ovat erityisen toimivia kun käsitellään ajasta riippuvaa dataa. Esimerkiksi puheentunnistus, jossa yksittäiset äänet ovat merkityksettömiä, mutta missä useiden äänteiden yhdistelmät (ts. useiden tilojen tulokset) ovat merkityksellisiä. (Cortes ja Vapnik 1995) 3.4 Tukivektorikoneet Tukivektorikoneet (engl. Support vector machines, svm) ovat hyvin teoreettinen koneoppimismenetelmä. Toisin kuin useat muut koneoppimisalgoritmit, tukivektorikoneet on kehitelty suoraan tilastopohjaisen oppimisteorian mukaan (engl. Statistical learning theory), eikä käytännön menetelmien pohjalta. Tästä seuraa, että näihin algoritmeihin sisältyy oletuksena lupaus niiden toimivuudesta. Tukivektorikoneet ovat matemaattisia algoritmeja datan luokitteluun ja näin ne soveltuvat erinomaisesti muun muassa tekstintunnistamiseen ja konenäköön. Lyhyesti sanottuna tukivektorikoneet toimivat yhdistämällä syötteen yhteen arvojoukkoon moniulotteisessa avaruudessa. Kuvassa 5 näkyy kaksi arvojoukkoa tulosavaruudessa. Itse 7
12 Kuvio 5. Optimaalinen hypertaso tulosavaruudessa (lähde: Googlen kuvahaku) syötteen yhdistäminen tulokseen ei ole hankalaa, mutta tulosavaruuden arvojoukkojen erottelu toisista on. Tukivektorikoneet tekevät nimenomaan tätä tehtävää, ne erottelevat tulsoavaruuden arvojoukot toisistaan mahdollisimman isolla marginaalilla. Kuvassa katkoviivoilla merkittyjä vektoreita kutsutaan tukivektoreiksi, joista menetelmä saakin nimensä (Cortes ja Vapnik 1995). 3.5 K-lähimmän naapurin algoritmit K-lähimmän naapurin algoritmit (engl. k-nearest neighbor, k-nn) ovat yksinkertaisia algoritmeja datan luokitteluun. Esimerkiksi jos verkkokauppa haluaisi luoda tuotteita joista asiakas voisi olla kiinnostunut, onnistuisi se valitsemalla K:n arvoksi esimerkiksi 10 ja näin etsimällä 10 lähintä naapuria (tässä yhteydessä toista asiakasta, joiden käyttäytyminen on lähellä luokiteltavaa asiakasta). Tarkkailemalla näiden naapurien ostoksia ja toimintaa voidaan luoda suositus-lista. Esimerkin mukaan k-lähimmän naapurin algoritmeja voi soveltaa useisiin eri tilanteisiin, erityisesti luokittelutehtäviin. Näistä algoritmeista on olemassa useita erilaisia 8
13 variaatioita; esimerkiksi etäisyyspainotettu versio (engl. Distance weighted k-nn). (Bhatia ja Vandana 2010) Kuvio 6. K-lähintä naapuria esimerkki (lähde: Googlen kuvahaku) Kuvassa 6 näkyy yksinkertainen esimerkki k-lähimmän naapurin algoritmista, kun halutaan tietää onko X q positiivinen vai negatiivinen silloin kun k=5. Kun viidestä lähimmästä naapurista kolme on negatiivisia, asetetaan myös X q negatiiviseksi. 9
14 4 Ohjaamaton oppiminen Ohjaamaton oppiminen on nimensä mukaisesti ohjatun oppimisen vastakohta. Kun ohjatussa oppimisessa algoritmia ohjataan haluttuun suuntaan, niin annetaaan ohjaamattomassa oppimisessa algoritmin saapua omiin päätöksiin ilman ulkopuolista avustusta. Toisin kuin ohjattu oppiminen, ohjaamaton oppiminen ei käytä syöte-tulos -pareja (engl. labeled data) oppimiseen ja näin se ei kärsi ohjatun oppimisen suurimmasta ongelmasta, eli oppimisdatan luomisesta. Tämä tosin luo ohjaamattoman oppimisen suurimman ongelman/riskin, joka on oikeanlaisen algoritmin valitseminen. Algoritmin valinnalla on tässä yhteydessä vielä suurempi tärkeys kuin ohjatun oppimisen yhteydessä. (Kapitanova ja Son 2012) Kun ohjatun oppimisen tavoitteena on luokitella dataa halutulla tavalla, niin ohjaamattoman oppimisen tavoitteena on etsiä piilossa olevia riippuvuuksia datasta. Näin ollen se on hyvin lähellä tiedonlouhintaa. 4.1 Klusterointi Klusterointialgoritmit ovat yleisimpiä ohjaamattoman oppimisen menetelmistä, ja yksi laajimpia. Valtaosa ohjaamattomasta oppimisesta on erilaisia klusterointialgoritmeja. Yksinkertaisesti ne perustuvat klusterointihypoteesiin, jonka mukaan samaan luokkaan kuuluvat objektit käyttäytyvät samalla tavalla tutkittavan parametrin puitteissa. Esimerkiksi 2-ulotteisessa avaruudessa samaan luokkaan kuuluvat oliot (jatkossa pisteet) muodostavat silminnähtäviä klustereita. Yleisesti klusterianalyysi tehdäänkin juuri moniulotteissa avaruudessa sijaitseviin pisteisiin. (Kapitanova ja Son 2012; Witten ja Frank 2005) Huom. vaikka aikaisemmin mainitut k-lähimmän naapurin algoritmit ovat periaatteessa klusterointialgoritmeja, eivät ne kuulu ohjaamattomaan oppimiseen K-means klusterointi K-means klusterointi on klassinen esimerkki klusterointialgoritmista. Ensin siinä selvitetään kuinka monta klusteria datasta halutaan luoda, eli k:n arvo. Tämän jälkeen k pistettä vali- 10
15 taan satunnaisesti toimimaan jokaisen klusterin keskipisteenä. Lopuksi jäljelle jäävät pisteet liitetään lähimpään klusteriin. Tällaisessa muodossa tämä algoritmi on todella yksinkertainen. Pisteet vain liitetään suoraan lähimpään klusteriin, näin syntyviä klustereita kutsutaan Voronoi-soluiksi jotka muodostavat Voronoi-diagrammin. K-means klusteroinnissa optimaalisen ratkaisun löytäminen on NP-kova ongelma. Näin ollen k-means klusteroinnissa käytetään heuristisia algoritmejä, joista ehkä yleisin on Lloydin algoritmi. (Kapitanova ja Son 2012) Aluksi sattumanvaraisia pisteitä käyttämällä luodaan prototyyppi klusterit, joihin sitten sovelletaan Lloydin algoritmia. Tämä algoritmi laskee klustereille uudet keskipisteet. Tätä jatketaan niin kauan, että päästään haluttuun lopputulokseen. Kuvassa 7 näkyy ensimmäinen Voronoi-diagrammi, ja lopputulos 15 iteraation jälkeen. Kuvio 7. Voronoi-diagrammi ennen Lloydin algoritmia, ja sen jälkeen (lähde:wikipedia, Lloyd s algorithm) K-means klusterointialgoritmista on olemassa useita eri versioita, jotka muun muassa nopeuttavat sen toimintaa. K-means klusterointi on yksinkertainen ja helppo algoritmi, joka toimii todella hyvin tietynlaisiin datajoukkoihin, mutta esimerkiksi esiintymistiheyteen perustuvissa klustereissa se voi leikata klustereita osiin (Kapitanova ja Son 2012; Witten ja Frank 2005). Se on riippuvainen k:n arvoista ja ylimääräinen tai virheellinen tieto (engl. noise) häiritsee sen toimintaa helposti. Lisäksi k-means algoritmin toimintaa häiritsee poikkeavat tai reunoilla olevat tulokset (engl. outliers). 11
16 4.1.2 DBSCAN klusterointi Kun k-means klusterointi on pisteiden välisiin etäisyyksiin perustuva algoritmi, on toinen paljon käytetty menetelmä tiheyteen perustuva klusterointi. Näistä tiheysklusterointi algoritmeistä käytetyin on DBSCAN (Kapitanova ja Son 2012). Kun k-means klusterointialgoritmissa luodaan haluttu määrä tasaisesti hajaantuneita ja samankokoisia klustereita tavoitteena luokitella dataa. Esiintymistiheyteen perustuvat algoritmit toimivat eritavalla. Sen sijaan ne eivät luokittele dataa haluttuihin luokkiin, vaan etsivät datasta jo olemassa olevia luokkia. Kuvassa 8 näkyy vertailu k-means algoritmin ja DBSCAN-algoritmin välillä, kun pistejoukko on sama. Kuvassa k-means -algoritmi hakee kaksi haluttua klusteria, kun DBSCAN-algoritmi löytää vain yhden klusterin. koska kuvan pisteiden (datan) esiintymistiheys on sama pistejoukossa, DBSCAN käsittelee pisteet vain yhtenä klusterina. Tämän ansiosta DBSCAN pystyy löytämään muunmuassa epälineaarisia klustereita. Kuvio 8. K-means algoritmi ja DBSCAN-algoritmi sovellettuna samaan pistejoukkoon (lähde: Googlen kuvahaku, DBSCAN vs k-means) 4.2 Itseorganisoituvat kartat ja neuroverkot Jotta itseorganisoituvat kartat voidaan käydä läpi, selvitämme lyhyesti neuroverkkojen toimintaperiaatteen. 12
17 4.2.1 Neuroverkot Kuvio 9. Neuroverkko-malli Neuroverkot ovat laskennallinen malli, joka perustuu ihmisten keskushermoston rakenteeseen. Siinä luodaan joukko keinotekoisia neuroneita, jotka ovat kytketty toisiinsa. Neuroverkot ovat kuvan 9 mukaisesti rakennettuja verkkoja, joissa vihreät pallot ovat syötekerros, siniset pallot ovat piilotettu kerros ja keltaiset pallot ovat tuloskerros. Kuvassa esitetty malli on eteenpäin kytketty monikerroksinen perseptroniverkko. Neuroverkkojen opettaminen tapahtuu siten, että ne löytävät opetusdatasta alkioiden välisiä merkitseviä riippuvuuksia. Se että verkko nimenomaan löytää merkitsevät riippuvuudet saadaan aikaiseksi valitsemalla opetusdata huolellisesti. Jos esimerkiksi halutaan kameran lukevan auton rekisterikilven, opetusdatassa ei ole muita kuvia kuin rekisterikilpiä. Mikäli muita kuvia lisätään opetusdataan, voi verkko valita väärät merkitsevät riippuvuudet. Itse oppiminen tapahtuu niin, että opetusdataa käsiteltäessä verkon neuronien välisten reittien painoarvot muuttuvat. Lopulta jos opettaminen on mennyt oikein, pitäisi verkon päätyä samaan tulokseen samankaltaisilla syötteillä. Kuvassa 9 olevassa mallissa on vain yksi piilotettu kerros, mutta todellisuudessa niitä voi olla useita. (Haykin 1994) 13
18 4.2.2 Itseorganisoituvat kartat Itseorganisoituvat kartat (engl. self organizing map, SOM myös Kohonen network, Kohonen map) ovat Teuvo Kohosen 1980-luvulla luoma neuroverkkomalli. Yksinkertaistettuna se toimii projektoimalla moniulotteisen datan yleensä 2-ulotteiseen avaruuteen siten, että data ei menetä keskeistä informaatiota. (Haykin 1994) Esimerkiksi valitaan verkko, jossa on kuusi syötettä ja kaksi tulos neuronia. Nämä neuronit ja syötteet projisoidaan kaksi-ulotteiseen avaruuteen (kuva 10). Nyt syötteistä yksi valitaan satunnaisesti (keltainen syöte) ja se ajetaan neuroverkon läpi. Itseorganisoituvissa kartoissa vain yksi tulosneuroni voi olla kerrallaan aktiivinen. Tätä neuronia kutsutaan nimellä voittajaneuroni (engl. winner neutron, winner-takes-all neutron). Tämä neuroni siirretään sitten lähemmäksi aktiivista syötettä. Tulosneuronit on liitetty toisiinsa siten, että vaikka vain yksi neuroni on aktiivinen molempia siirretään samaan suuntaan. Ei-aktiivisille neutroneille tämä siirto on pienempi mitä kauempana se on voittajaneuronista. Tätä prosessia toistetaan niin kauan että kaikki syötteet on käyty läpi (tässä tapauksessa kuusi kertaa). Kun kaikki syötteet on käyty läpi, luokitellaan ne lähimmän tulosneuronin mukaan. Eli esimerkissä saimme kaksi erillistä luokkaa, joita kuvaa sininen ja vihreä tulosneuroni. Kuvio 10. Itseorganisoituvan kartan opetusprosessi Esimerkin mukaisesti tämä menetelmä luo moniulotteisesta datasta halutun määrän luok- 14
19 kia, jotka esitetään yleensä 2-ulotteisessa avaruudessa. Tästä menetelmästä on luotu useita eri variaatioita, ja tämä onkin yksi käytetyimpiä ohjaamattoman oppimisen menetelmistä. On huomioitava, että yksinkertaisilla syötteillä itseorganisoituvat kartat käyttäytyvät hyvin samankaltaisesti k-means -klusterointialgoritmin kanssa, mutta syötteiden ominaisuuksien määrän kasvaessa menetelmien erot tulevat ilmi. 4.3 Adaptive resonance theory Adaptive Reconanse Theory (jatkossa ART) on itseorganisoituvien karttojen tapaan eräs neuroverkkojen implementaatio. Se pohjautuu kilpailevaan oppimiseen (engl. competitive learning), jossa neuronit kilpailevat siitä, kuka saa lähettää dataa eteenpän. Tämä johtaa neuronien erikoistumiseen ajan kuluessa. ART luotiin pyrkimyksenä päästä eroon sekä kilpailevan oppimisen että itseorganisoituvien karttojen ongelmista ja ratkaisemaan stabiilisuusmukautuvuus -dilemma (engl. stability-plasticity dilemma). Tämä dilemma kuvaa ongelmaa oppivissa järjestelmissä, kun pitäisi oppia uutta vanhaa unohtamatta; mukautuvuus tarkoittaa järjestelmän kykyä mukautua uuteen tietoon ja stabiliteetti kykyä säilyttää vanha tieto. (Grossberg 2013) Alunperin ART-malli luotiin selittämään aivojen oppimisprosessia. Soveltamalla sitä keinotekoisiin neuroverkkoihin saadaan aikaan oppivia järjestelmiä, jotka ovat erityisen toimivia kun halutaan järjestelmä jonka pitää oppia uutta vanhaa unohtamatta. Tässä annetaan usein esimerkki ihmisaivoista: ihmiset tunnistavat vanhemmansa jopa vuosien jälkeen huolimatta siitä, että he ovat oppineet useita uusia kasvoja vuosien saatossa. Tämänkaltainen uuden oppiminen ei ole mahdollista valtaosalla koneoppimismalleista. ART-malleja on useita, joista tällä hetkellä käytetyin on ARTMAP. Se pohjautuu ART1 ja ART2 -malleihin. (Grossberg 2013) ART1 on ensimmäinen ja yksinkertaisin luotu malli; se hyväksyy ainoastaan binäärisiä syötteitä. Se toimii yksinkertaisesti siten, että jokainen syöte yritetään sitoa olemassa olevaan luokkaan. Mikäli olemassa olevaa luokka ei löydy niin sidotaan tämä syöte vapaana olevaan tulosneuroniin. Koska luokat ovat tuloskerroksen neuroneita (huom. vain yksi tulosneuroni voi olla aktiivinen kerrallaan, joten yksi tulosneuroni kuvaa yhtä luokkaa), niin järjestelmän 15
20 kokonaismuistikapasiteetti on tulosneuronien lukumäärä. Mikäli syöte on uuteen luokkaan kuuluva, mutta yhtään vapaata neuronia ei ole niin syöte hylätään. Tämä on välttämätöntä jotta jo opittu tieto ei häviä. ART-malleissa on lisäksi niille ominainen vigilance-arvo. Tämä arvo kuvaa sitä, kuinka spesifejä luokat ovat. Esimerkiksi ART-verkko, joka tunnistaa esineitä kuvista voi luokitella auton ja moottoripyörän molemmat kulkuvälineiksi tai se voi luokitella ne omiin luokkiinsa (auto moottoripyörä). Näistä ensimmäinen on huomattavasti geneerisempi muisto, ja näin sen vigilance-arvo on pienempi. (Postma ja Hudson 1995) 16
21 5 Yhteenveto Koneoppiminen on arkipäivää. Se on monipuolinen työkalu, kun tarvitaan järjestelmä joka kykenee luokittelemaan syötetietoja joko ihmisen avustuksella tai ilman. Tässä tutkielmassa on esitelty ohjaamattoman ja ohjatun oppimisen muutamia yleisimpiä menetelmiä tarkastellen niiden toimintaa ja vahvuuksia. Ohjatun oppimisen osalta käytiin läpi muutama yleisemmin käytössä oleva menetelmä. Nämä olivat verrattain yksinkertaisia menetelmiä rajoittunein ominaisuuksin. Tutkimuksessa kävi ilmi, että ohjatun oppimisen menetelmät ovat erinomaisia selkeisiin tehtäviin ja ongelmiin. Esimerkkinä käytetty roskapostifiltteri on erinomainen sovelluskohde ohjatulle oppimiselle. Ohjamaattomasta oppimisesta käsiteltiin muutamia klusterointimenetelmiä, itseorganisoituvia karttoja ja ART-malleja. Näistä kaikki ovat yleisessä käytössä. Klusterointialgorimeista käsiteltiin vain kaksi, mutta niitä löytyy huomattavasti enemmän. Neuroverkkoa ei kokonaisuutena käsitelty selitystä lukuunottamatta, mutta sen kaksi eri implementaatiota käytiin läpi. Ohjaamattoman oppimisen menetelmä ovat todella monipuolisia ja tehokkaita työkaluja monimutkaisiin luokittelutehtäviin. Näistä menetelmistä etenkin ART:llä, ja sen muunnoksilla, on hyvin ihmismäinen oppimisprosessi ja käsittelykyky. Kuten aikaisemmin mainittiinkin on ART kehitetty selittämään matemaattisesti ihmisten oppimista. Tätä tutkielmaa voisi laajentaa huomattavasti, ja tarkoituksena onkin laajentaa se pro gradu - tutkielmaksi, jossa tarkoituksena on tutkia/selvittää koneoppimisen soveltamista tietoturvallisuuteen. Erityiseti anomaliteettien havaitsemiseen; esimerkiksi aiemmin tuntemattomien uhkien havaitseminen, joka voidaan tehdä vain normaalista poikkeavan käytöksen havaitsemisella. 17
22 Lähteet Bhatia, Nitin, ja Vandana Survey of nearest neighbor techniques. International Journal of Computer Science and Information Security 8 (2): Charniak, Eugene Bayesian networks without tears. AI magazine 12 (4): 50. Cortes, Corinna, ja Vladimir Vapnik Support-vector networks. Machine Learning 20 (3): Geronimo, David, Antonio M Lopez, Angel Domingo Sappa ja Thorsten Graf Survey of pedestrian detection for advanced driver assistance systems. IEEE Transactions on Pattern Analysis and Machine Intelligence 32 (7): Grossberg, S Adaptive resonance theory. Scholarpedia 8 (5): Haykin, Simon Neural networks: a comprehensive foundation. Prentice Hall PTR. Kapitanova, Krasimira, ja Sang H Son Machine Learning Basics. Teoksessa Intelligent Sensor Networks: The Integration of Sensor Networks, Signal Processing and Machine Learning, CRC Press. Kotsiantis, Sotiris B, ID Zaharakis ja PE Pintelas Supervised machine learning: A review of classification techniques. Teoksessa Emerging Artificial Intelligence Applications in Computer Engineering, IOS Press. Postma, Eric O, ja Patrick TW Hudson Adaptive resonance theory. Teoksessa Artificial Neural Networks, Springer. Sutton, Richard S., ja Andrew G. Barto Introduction to Reinforcement Learning. 1st. MIT Press. Witten, Ian H, ja Eibe Frank Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann. Zhu, Xiaojin Semi-supervised learning literature survey. Technical report TR1530. Computer Science, University of Wisconsin-Madison. 18
TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)
JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
LisätiedotJohdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]
Johdatus tekoälyyn Luento 6.10.2011: Koneoppiminen Patrik Hoyer [ Kysykää ja kommentoikaa luennon aikana! ] Koneoppiminen? Määritelmä: kone = tietokone, tietokoneohjelma oppiminen = ongelmanratkaisukyvyn
LisätiedotNeuroverkkojen soveltaminen vakuutusdatojen luokitteluun
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään
LisätiedotTee-se-itse -tekoäly
Tee-se-itse -tekoäly Avainsanat: koneoppiminen, tekoäly, neuroverkko Luokkataso: 6.-9. luokka, lukio, yliopisto Välineet: kynä, muistilappuja tai kertakäyttömukeja, herneitä tms. pieniä esineitä Kuvaus:
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS NEUROVERKOT TURINGIN KONE (TAI TAVALLINEN OHJELMOINTI) VAIN YKSI LASKENNAN MALLI ELÄINTEN HERMOSTOSSA LASKENTA ERILAISTA: - RINNAKKAISUUS - STOKASTISUUS (SATUNNAISUUS) - MASSIIVINEN
LisätiedotTekoäly ja alustatalous. Miten voit hyödyntää niitä omassa liiketoiminnassasi
Tekoäly ja alustatalous Miten voit hyödyntää niitä omassa liiketoiminnassasi AI & Alustatalous AI Digitaalisuudessa on 1 ja 0, kumpia haluamme olla? Alustatalouden kasvuloikka Digitaalisen alustatalouden
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS NEUROVERKOT TURINGIN KONE (TAI TAVALLINEN OHJELMOINTI) VAIN YKSI LASKENNAN MALLI ELÄINTEN HERMOSTOSSA LASKENTA ERILAISTA: - RINNAKKAISUUS - STOKASTISUUS (SATUNNAISUUS) - MASSIIVINEN
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS NEUROVERKOT TURINGIN KONE (TAI TAVALLINEN OHJELMOINTI) VAIN YKSI LASKENNAN MALLI ELÄINTEN HERMOSTOSSA LASKENTA ERILAISTA: - RINNAKKAISUUS - STOKASTISUUS (SATUNNAISUUS) - MASSIIVINEN
LisätiedotE. Oja ja H. Mannila Datasta Tietoon: Luku 2
2. DATASTA TIETOON: MITÄ DATAA; MITÄ TIETOA? 2.1. Data-analyysin ongelma Tulevien vuosien valtava haaste on digitaalisessa muodossa talletetun datan kasvava määrä Arvioita: Yhdysvaltojen kongressin kirjasto
LisätiedotJohdatus tekoälyn taustalla olevaan matematiikkaan
Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 3.11.2017 Mitä tekoäly on? Wikipedia: Tekoäly on tietokone tai tietokoneohjelma, joka kykenee älykkäiksi
LisätiedotIntroduction to Machine Learning
Introduction to Machine Learning Aki Koivu 27.10.2016 HUMAN HEALT H ENVIRONMENTAL HEALT H 2016 PerkinElmer Miten tietokone oppii ennustamaan tai tekemään päätöksiä? Historia tiivistettynä Machine Learning
LisätiedotLuku 2. Datasta tietoon: mitä dataa? mitä tietoa?
1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö
LisätiedotKognitiivinen mallintaminen. Nelli Salminen
Kognitiivinen mallintaminen Neuraalimallinnus 24.11. Nelli Salminen nelli.salminen@tkk.fi Tällä kerralla ohjelmassa vielä perseptronista ja backpropagationista kilpaileva oppiminen, Kohosen verkko oppimissääntöjen
LisätiedotKoneoppiminen ja tekoäly suurten tietomassojen käsittelyssä yleensä ja erityisesti sovellettuina satelliittidatan käyttöön metsien arvioinnissa
Koneoppiminen ja tekoäly suurten tietomassojen käsittelyssä yleensä ja erityisesti sovellettuina satelliittidatan käyttöön metsien arvioinnissa Metsätieteen päivä 26.11.2018 Jorma Laaksonen, vanhempi yliopistonlehtori
LisätiedotTekoäly ja sen soveltaminen yrityksissä. Mika Rantonen
Tekoäly ja sen soveltaminen yrityksissä Mika Rantonen Tekoäly- paljon puhetta, mistä kyse? Lyhyesti sanottuna: tekoäly on sellaista koneen tekemää toimintaa, joka ihmisen tekemänä olisi älykästä Otetaan
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Johdatus monimuuttujamenetelmiin Luennot 30.10.13.12.-18 Tiistaina klo 12-14 (30.10., BF119-1) Keskiviikkoisin klo 10-12 (MA101,
LisätiedotTiedonlouhinta ja sen mahdollisuudet
Tiedonlouhinta ja sen mahdollisuudet Henry Joutsijoki Sisältö Johdanto Tiedonlouhinta Koneoppiminen ja tiedonlouhinta Tiedonlouhinnan tulevaisuus Alustusta Nyky-yhteiskunnassamme käsitteet tehokkuus, nopeus,
LisätiedotTällä kerralla ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus Kertausta: Perseptronin oppimissääntö
Tällä kerralla ohjelmassa Kognitiivinen mallintaminen Neuraalimallinnus 19.2. Nelli Salminen nelli.salminen@helsinki.fi D433 vielä perseptronista ja backpropagationista kilpaileva oppiminen, Kohosen verkko
LisätiedotÄlykäs datan tuonti kuljetusongelman optimoinnissa. Antoine Kalmbach
Älykäs datan tuonti kuljetusongelman optimoinnissa Antoine Kalmbach ane@iki.fi Sisällys Taustaa Kuljetusongelma Datan tuominen vaikeaa Teoriaa Tiedostojen väliset linkit Mikä sarake on mikäkin? Ratkaisutoteutus
LisätiedotT DATASTA TIETOON
TKK / Informaatiotekniikan laboratorio Syyslukukausi, periodi II, 2007 Erkki Oja, professori, ja Heikki Mannila, akatemiaprofessori: T-61.2010 DATASTA TIETOON TKK, Informaatiotekniikan laboratorio 1 JOHDANTO:
LisätiedotTekoäly liiketoiminnassa. Tuomas Ritola CEO, selko.io
Tekoäly liiketoiminnassa Tuomas Ritola CEO, selko.io Selko.io Automaattista teknisen tekstin luokittelua ja analysointia, eli tekoälyä tekstidatalle. Päivän agenda: Tekoäly. Muotisana? Strategia? Uhka?
LisätiedotOppijan saama palaute määrää oppimisen tyypin
281 5. KONEOPPIMINEN Älykäs agentti voi joutua oppimaan mm. seuraavia seikkoja: Kuvaus nykytilan ehdoilta suoraan toiminnolle Maailman relevanttien ominaisuuksien päätteleminen havaintojonoista Maailman
LisätiedotTiedonlouhinta rakenteisista dokumenteista (seminaarityö)
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/
Lisätiedotjens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor
T-1.81 Luonnollisten kielten tilastollinen käsittely Vastaukset 11, ti 8.4., 1:1-18: Klusterointi, Konekääntäminen. Versio 1. 1. Kuvaan 1 on piirretty klusteroinnit käyttäen annettuja algoritmeja. Sanojen
LisätiedotJUHTA ja VAHTI juhlatilaisuus, Tietojärjestelmien tulevaisuudesta tekoälyn kehityksen näkökulmasta. Timo Honkela.
JUHTA ja VAHTI juhlatilaisuus, 2017 Tietojärjestelmien tulevaisuudesta tekoälyn kehityksen näkökulmasta Timo Honkela timo.honkela@helsinki.fi 31. lokakuuta 2017 Ihmisestä ja ihmisyhteisöistä Kuva:/skylgroup.com/communities--socities/
LisätiedotJohdatus tekoälyn taustalla olevaan matematiikkaan
Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 3. luento 17.11.2017 Neuroverkon opettaminen (ohjattu oppiminen) Neuroverkkoa opetetaan syöte-tavoite-pareilla
LisätiedotTarvitseeko informaatioteknologia matematiikkaa?
Tarvitseeko informaatioteknologia matematiikkaa? Oulun yliopisto Matemaattisten tieteiden laitos 1 Kyllä kai IT matematiikkaa tarvitsee!? IT ja muu korkea teknologia on nimenomaan matemaattista teknologiaa.
LisätiedotLaskut käyvät hermoille
Laskut käyvät hermoille - Miten ja miksi aivoissa lasketaan todennäköisyyksiä Aapo Hyvärinen Matematiikan ja tilastotieteen laitos & Tietojenkäsittelytieteen laitos Helsingin Yliopisto Tieteen päivät 13.1.2011
LisätiedotTekoäly tukiäly. Eija Kalliala, Marjatta Ikkala
Tekoäly tukiäly Eija Kalliala, Marjatta Ikkala 29.11.2018 Mitä on tekoäly? Unelma koneesta, joka ajattelee kuin ihminen Hype-sana, jota kuulee joka paikassa Väärinymmärretty sana -> vääriä odotuksia, pelkoja
LisätiedotKaksiluokkainen tapaus, lineaarinen päätöspinta, lineaarisesti erottuvat luokat
1 Tukivektoriluokittelija Tukivektorikoneeseen (support vector machine) perustuva luoikittelija on tilastollisen koneoppimisen teoriaan perustuva lineaarinen luokittelija. Perusajatus on sovittaa kahden
LisätiedotPoikkeavuuksien havainnointi (palvelinlokeista)
Poikkeavuuksien havainnointi (palvelinlokeista) TIES326 Tietoturva 2.11.2011 Antti Juvonen Sisältö IDS-järjestelmistä Datan kerääminen ja esiprosessointi Analysointi Esimerkki Lokidatan rakenne Esikäsittely,
LisätiedotTekoäly tänään , Vadim Kulikov (Helsingin Yliopisto)
Tekoäly tänään 6.6.2017, Vadim Kulikov (Helsingin Yliopisto) Lyhyesti: kehitys kognitiotieteessä Representationalismi, Kognitio on symbolien manipulointia. Symbolinen tekoäly. Sääntöpohjaiset järjestelmät
LisätiedotALGORITMIT & OPPIMINEN
ALGORITMIT & OPPIMINEN Mitä voidaan automatisoida? Mikko Koivisto Avoimet aineistot tulevat Tekijä: Lauri Vanhala yhdistä, kuvita, selitä, ennusta! Tekijä: Logica Mitä voidaan automatisoida? Algoritmi
LisätiedotKombinatorinen optimointi
Kombinatorinen optimointi Sallittujen pisteiden lukumäärä on äärellinen Periaatteessa ratkaisu löydetään käymällä läpi kaikki pisteet Käytännössä lukumäärä on niin suuri, että tämä on mahdotonta Usein
LisätiedotTilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
LisätiedotTekstuurintunnistuksen lyhyt oppimäärä. Ts. pari tapaa erottaa tiiliseinä pensaasta.
Tekstuurintunnistuksen lyhyt oppimäärä Ts. pari tapaa erottaa tiiliseinä pensaasta. Mitä on tekstuuri? Vaikea määritellä, mutta: Pintakuvio Ornamentti tuntu kuviointi Miksi tämän pitäisi kiinnostaa? (Maantienmerkkausrobotti)
LisätiedotPuheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting
Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018 Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex Puheentunnistus Yleisesti Puheentunnistus Yleisesti Puheentunnistus
LisätiedotKognitiivinen mallintaminen Neuraalimallinnus, luento 1
Kognitiivinen mallintaminen Neuraalimallinnus, luento 1 Nelli Salminen nelli.salminen@helsinki.fi D433 Neuraalimallinnuksen osuus neljä luentokertaa, muutokset alla olevaan suunnitelmaan todennäköisiä
LisätiedotKONEOPPIMISEN HYÖDYNTÄMINEN: AUTOMAATTINEN TIKETTIEN KÄSITTELY. Esa Sairanen
KONEOPPIMISEN HYÖDYNTÄMINEN: AUTOMAATTINEN TIKETTIEN KÄSITTELY Esa Sairanen 29.03.2017 Sisältö Taustaa Tavoite Mitä on koneoppiminen? Azure Machine Learning koneoppimismenetelmiä Projektin vaiheet Data
LisätiedotOngelma(t): Miten digitaalista tietoa voidaan toisintaa ja visualisoida? Miten monimutkaista tietoa voidaan toisintaa ja visualisoida?
Ongelma(t): Miten digitaalista tietoa voidaan toisintaa ja visualisoida? Miten monimutkaista tietoa voidaan toisintaa ja visualisoida? 2 Tieto on koodattu aikaisempaa yleisemmin digitaaliseen muotoon,
LisätiedotTänään ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus laskarit. Ensi kerralla (11.3.)
Tänään ohjelmassa Kognitiivinen mallintaminen Neuraalimallinnus 26.2. Nelli Salminen nelli.salminen@helsinki.fi D433 autoassosiaatio, attraktorin käsite esimerkkitapaus: kolme eri tapaa mallintaa kategorista
LisätiedotDOB valmennus Data-analyysi. Koneoppiminen. CC by
DOB valmennus Data-analyysi Koneoppiminen CC by 4.0 30.08.2017 Datasta oivalluksia ja bisnestä Data-analytiikan menetelmien valmennusmateriaali Luentopäivän sisältö Johdanto Tiedonlouhinta Koneoppiminen
LisätiedotGradu UASI-hankkeesta
Maatalouden tarpeet Metsätalouden tarpeet Kasvitaudit ja rikkataudit Heikki Jyväskylän yliopisto 8.3.2011 Maatalouden tarpeet Metsätalouden tarpeet Kasvitaudit ja rikkataudit 1 Johdanto ja motivointi Maatalouden
LisätiedotTekoäly ja koneoppiminen metsävaratiedon apuna
Tekoäly ja koneoppiminen metsävaratiedon apuna Arbonaut Oy ja LUT University 26. marraskuuta 2018 Metsätieteen päivä 2018 Koneoppimisen kohteena ovat lukujen sijasta jakaumat Esimerkki 1 Koneoppimisessa
LisätiedotTilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
LisätiedotRyhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.
Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes 11.06.2012 Ohjaaja: TkT Arto Klami Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla
LisätiedotTekoäly muuttaa arvoketjuja
Tekoäly muuttaa arvoketjuja Näin kartoitat tekoälyn mahdollisuuksia projektissasi Harri Puolitaival Harri Puolitaival Diplomi-insinööri ja yrittäjä Terveysteknologia-alan start-up: Likelle - lämpötilaherkkien
LisätiedotTIETOJENKÄSITTELYTIEDE
TIETOJENKÄSITTELYTIEDE Tietojenkäsittelytieteen laitos Exactum (Kumpulan kampus) PL 68 (Gustaf Hällströmin katu 2b) 00014 Helsingin yliopisto Puhelinnumero 02941 911 (vaihde), ohivalinta 02941... http://www.cs.helsinki.fi/
LisätiedotAlgoritmi III Vierekkäisten kuvioiden käsittely. Metsätehon tuloskalvosarja 7a/2018 LIITE 3 Timo Melkas Kirsi Riekki Metsäteho Oy
Algoritmi III Vierekkäisten kuvioiden käsittely Metsätehon tuloskalvosarja 7a/2018 LIITE 3 Timo Melkas Kirsi Riekki Metsäteho Oy Algoritmi III vierekkäisten kuvioiden käsittely Lähtötietoina algoritmista
LisätiedotDiskriminanttianalyysi I
Diskriminanttianalyysi I 12.4-12.5 Aira Hast 24.11.2010 Sisältö LDA:n kertaus LDA:n yleistäminen FDA FDA:n ja muiden menetelmien vertaaminen Estimaattien laskeminen Johdanto Lineaarinen diskriminanttianalyysi
LisätiedotUUDET INNOVAATIOT. Professori Heikki Kälviäinen Koulutusohjelman johtaja Laitoksen johtaja
UUDET INNOVAATIOT Professori Heikki Kälviäinen Koulutusohjelman johtaja Laitoksen johtaja Tietojenkäsittelytekniikan professori Konenäön ja hahmontunnistuksen laboratorio Tietotekniikan laitos Teknistaloudellinen
LisätiedotTilanne sekä MS-A0003/4* Matriisilaskenta 5 op
MATEMATIIKKA Mat-1.1210 Matematiikan peruskurssi S1 ei järjestetä enää MS-A0103/4* Differentiaali- ja integraalilaskenta I 5 op sekä MS-A0003/4* Matriisilaskenta 5 op Mat-1.1110 Matematiikan peruskurssi
LisätiedotJohdatus tekoälymatematiikkaan (kurssilla Johdatus Watson-tekn
Johdatus tekoälymatematiikkaan (kurssilla Johdatus Watson-tekniikkaan ITKA352) Informaatioteknologian tiedekunta Jyväskylän yliopisto 23.3.2018 Tekoälyn historiaa 6 1 Introduction Kuva Fig. lähteestä 1.3
LisätiedotPage 1 of 9. Ryhmä/group: L = luento, lecture H = harjoitus, exercises A, ATK = atk-harjoitukset, computer exercises
Tietotekniikan tarjoama opetus syksyllä 2016 23.5.2016 CS course schedule in autumn 2016 Sari Salmisuo I periodi / period I 12.9. 21.10.2016 viikot/weeks 37-42 II periodi / period II 31.10. 9.12.2016 viikot/weeks
LisätiedotImageRecognition toteutus
ImageRecognition toteutus Simo Korkolainen 27 kesäkuuta 2016 Projektin tarkoituksena on tehdä ohjelma, joka opettaa neuroverkon tunnistamaan kuvia backpropagation-algoritmin avulla Neuroverkon opetuksessa
LisätiedotMuuttaako tekoäly maailmaa - ja miten? Kansainvälinen Telepäivä
Muuttaako tekoäly maailmaa - ja miten? Kansainvälinen Telepäivä 17.5.2018 Heikki Ailisto Tutkimusprofessori Teknologiantutkimuskeskus VTT Oy Tiivistelmä Tekoäly on hype-käyrän huipulla. Siihen liittyy
LisätiedotELEC-C5210 Satunnaisprosessit tietoliikenteessä
ELEC-C5210 Satunnaisprosessit tietoliikenteessä Esa Ollila Aalto University, Department of Signal Processing and Acoustics, Finland esa.ollila@aalto.fi http://signal.hut.fi/~esollila/ Kevät 2017 E. Ollila
LisätiedotAutamme asiakkaitamme menestymään parantamalla tekemisen luottamustasoa ja läpinäkyvyyttä uusilla innovatiivisilla konsepteilla ja ratkaisuilla.
Celkee Oy:n Missio Autamme asiakkaitamme menestymään parantamalla tekemisen luottamustasoa ja läpinäkyvyyttä uusilla innovatiivisilla konsepteilla ja ratkaisuilla. Tuomme organisaatioiden piilossa olevan
LisätiedotDatatähti 2019 loppu
Datatähti 2019 loppu task type time limit memory limit A Summa standard 1.00 s 512 MB B Bittijono standard 1.00 s 512 MB C Auringonlasku standard 1.00 s 512 MB D Binääripuu standard 1.00 s 512 MB E Funktio
LisätiedotEpätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu (aihe-esittely)
Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu (aihe-esittely) Vilma Virasjoki 23.01.2012 Ohjaaja: Jouni Pousi Valvoja: Raimo P. Hämäläinen Työn saa tallentaa
LisätiedotLogistinen regressio, separoivat hypertasot
Logistinen regressio, separoivat hypertasot Topi Sikanen Logistinen regressio Aineisto jakautunut K luokkaan K=2 tärkeä erikoistapaus Halutaan mallintaa luokkien vedonlyöntikertoimia (odds) havaintojen
LisätiedotTulevaisuuden ja kehitteillä olevat tekniikat (FET)
Tulevaisuuden ja kehitteillä olevat tekniikat (FET) Hoitavatko robotit, mihin tietokone on kadonnut? Pekka Karp Euroopan komissio Tietoyhteiskunnan tekniikat PK - Joensuu 27/05/02 FET= Future and Emerging
LisätiedotTietotekniikan valintakoe
Jyväskylän yliopisto Tietotekniikan laitos Tietotekniikan valintakoe 2..22 Vastaa kahteen seuraavista kolmesta tehtävästä. Kukin tehtävä arvostellaan kokonaislukuasteikolla - 25. Jos vastaat useampaan
LisätiedotSovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi
Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi 28.4.2013 Annemari Auvinen (annauvi@st.jyu.fi) Anu Niemi (anniemi@st.jyu.fi) 1 Sisällysluettelo 1 JOHDANTO... 2 2 KÄYTETYT MENETELMÄT...
LisätiedotTiedonsiirron kokonaisoptimointi erilaisten tietoverkkojen yhteiskäytössä
Tiedonsiirron kokonaisoptimointi erilaisten tietoverkkojen yhteiskäytössä Juuso Meriläinen 27.11.2015 Juuso Meriläinen Tiedonsiirron kokonaisoptimointi erilaisten tietoverkkojen yhteiskäytössä 1 / 11 Johdanto
LisätiedotSimulation model to compare opportunistic maintenance policies
Simulation model to compare opportunistic maintenance policies Noora Torpo 31.08.18 Ohjaaja/Valvoja: Antti Punkka Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin
LisätiedotACUMEN O2: Verkostot
ACUMEN O2: Verkostot OHJELMA MODUULI 4 sisältää: Lyhyt johdanto uranhallintataitojen viitekehykseen VERKOSTOT: työkaluja ja taitoja kouluttajille Partnerit: LUMSA, ELN, BEST, INNOV, MeathPartnership, SYNTHESIS,
LisätiedotSFS/SR315 Tekoäly Tekoälyn standardisointi
SFS/SR315 Tekoäly Tekoälyn standardisointi Meri Seistola Toiminnanjohtaja, Mediakasvatuskeskus Metka ry SR 315 Tekoäly - Puheenjohtaja: Jarkko Vesa 1 SC42 Artificial Intelligence ISO/IEC JTC1 SC42 Artificial
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:
LisätiedotMitä on konvoluutio? Tutustu kuvankäsittelyyn
Mitä on konvoluutio? Tutustu kuvankäsittelyyn Tieteenpäivät 2015, Työohje Sami Varjo Johdanto Digitaalinen signaalienkäsittely on tullut osaksi arkipäiväämme niin, ettemme yleensä edes huomaa sen olemassa
LisätiedotΣ!3674. Advanced Test Automation for Complex Software-Intensive Systems
Advanced Test Automation for Complex Software-Intensive Systems = Advanced Test Automation for Complex Software- Intensive Systems Pääteemana kompleksisten ja erittäin konfiguroitavien softaintensiivisten
LisätiedotSiltaaminen: Piaget Matematiikka Inductive Reasoning OPS Liikennemerkit, Eläinten luokittelu
Harjoite 2 Tavoiteltava toiminta: Materiaalit: Eteneminen: TUTUSTUTAAN OMINAISUUS- JA Toiminnan tavoite ja kuvaus: SUHDETEHTÄVIEN TUNNISTAMISEEN Kognitiivinen taso: IR: Toiminnallinen taso: Sosiaalinen
LisätiedotAlustavia käyttökokemuksia SAS Studiosta. Timo Hurme Maa- ja elintarviketalouden tutkimuskeskus MTT (v. 2015 alusta Luonnonvarakeskus / Luke)
Alustavia käyttökokemuksia SAS Studiosta Timo Hurme Maa- ja elintarviketalouden tutkimuskeskus MTT (v. 2015 alusta Luonnonvarakeskus / Luke) 19.9.2014 Lyhyesti SAS-koodareille suunnattu uusi käyttöliittymä
Lisätiedotmonitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.
Epätäydellisen preferenssiinformaation hyödyntäminen monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi 15.1.2018 Ohjaaja: Prof. Kai Virtanen Valvoja: Prof. Kai Virtanen Tausta Päätöspuu
LisätiedotViimeistely Ajourien huomiointi puutiedoissa ja lopullinen kuviointi. Metsätehon tuloskalvosarja 5/2018 LIITE 4 Timo Melkas Kirsi Riekki Metsäteho Oy
Viimeistely Ajourien huomiointi puutiedoissa ja lopullinen kuviointi Metsätehon tuloskalvosarja 5/2018 LIITE 4 Timo Melkas Kirsi Riekki Metsäteho Oy Viimeistely ajourien huomiointi ja lopullinen kuviointi
LisätiedotJohdatus tekoälyn taustalla olevaan matematiikkaan
Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 2. luento 10.11.2017 Keinotekoiset neuroverkot Neuroverkko koostuu syöte- ja ulostulokerroksesta
Lisätiedotmatematiikka Tapio Helin Nuorten akatemiaklubi Helsinki 16.02.2015 Matematiikan ja tilastotieteen laitos
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Leipätyönä sovellettu matematiikka Tapio Helin Nuorten akatemiaklubi Helsinki 16.02.2015 Matematiikan ja tilastotieteen laitos Tapio Helin
LisätiedotTietorakenteet ja algoritmit
Tietorakenteet ja algoritmit Rekursio Rekursion käyttötapauksia Rekursio määritelmissä Rekursio ongelmanratkaisussa ja ohjelmointitekniikkana Esimerkkejä taulukolla Esimerkkejä linkatulla listalla Hanoin
LisätiedotNBE-E4510 Special Assignment in Biophysics and Biomedical Engineering AND NBE-E4500 Special Assignment in Human. NBE-E4225 Cognitive Neuroscience
Neurotieteen ja lääketieteellisen tekniikan laitos Department of and Biomedical OPETUSOHJELMASTA POISTUNEET KURSSIT (Tfy-99, Becs-114, BECS, NBE)/päivitetty 16.5.2017 COURSES REMOVED FROM THE STUDY PROGRAMME
LisätiedotMatematiikka ja tilastotiede. Orientoivat opinnot / 25.8.2015
Matematiikka ja tilastotiede Orientoivat opinnot / 25.8.2015 Tutkinnot Kaksi erillistä ja peräkkäistä tutkintoa: LuK + FM Laajuudet 180 op + 120 op = 300 op Ohjeellinen suoritusaika 3 v + 2 v = 5 v Tutkinnot
LisätiedotKonsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari
Konsensusongelma hajautetuissa järjestelmissä Niko Välimäki 30.11.2007 Hajautetut algoritmit -seminaari Konsensusongelma Päätöksen muodostaminen hajautetussa järjestelmässä Prosessien välinen viestintä
LisätiedotMATINE-projekti 2500M-0069: Tietotekniset harhautukset (ICT Illusions)
MATINE-projekti 2500M-0069: Tietotekniset harhautukset (ICT Illusions) Sampsa Rauti Turun yliopisto, Tulevaisuuden teknologioiden laitos MATINE-tutkimusseminaari, 16.11.2017 Esityksen sisältö Tiimi Taustaa
LisätiedotKuva Suomen päätieverkko 1 Moottoritiet on merkitty karttaan vihreällä, muut valtatiet punaisella ja kantatiet keltaisella värillä.
POHDIN projekti TIEVERKKO Tieverkon etäisyyksien minimointi ja esimerkiksi maakaapeleiden kokonaismäärän minimointi sekä ylipäätään äärellisen pistejoukon yhdistäminen reitityksillä toisiinsa niin, että
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotS09 04 Kohteiden tunnistaminen 3D datasta
AS 0.3200 Automaatio ja systeemitekniikan projektityöt S09 04 Kohteiden tunnistaminen 3D datasta Loppuraportti 22.5.2009 Akseli Korhonen 1. Projektin esittely Projektin tavoitteena oli algoritmin kehittäminen
LisätiedotTERVEISET OPETUSHALLITUKSESTA
TERVEISET OPETUSHALLITUKSESTA Oppimisen ja osaamisen iloa Uudet opetussuunnitelmalinjaukset todeksi Irmeli Halinen Opetusneuvos Opetussuunnitelmatyön päällikkö OPPIMINEN OPETUS JA OPISKELU PAIKALLISET
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI Ohjaamattomassa oppimisessa on tavoitteena muodostaa hahmoista ryhmiä, klustereita, joiden sisällä hahmot ovat jossain mielessä samankaltaisia ja joiden välillä
LisätiedotInjektio. Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim.
Injektio Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim. Funktio f on siis injektio mikäli ehdosta f (x 1 ) = f (x 2 ) seuraa, että x 1 = x 2.
LisätiedotTässä luvussa käsitellään optimaalisten piirteiden valintaa, luokittelijan optimointia ja luokittelijan suorituskyvyn arviointia.
1 Luokittelijan suorituskyvyn optimointi Tässä luvussa käsitellään optimaalisten piirteiden valintaa, luokittelijan optimointia ja luokittelijan suorituskyvyn arviointia. A. Piirteen valinnan menetelmiä
LisätiedotRobotit ja tekoäly terveydenhuollon työvälineinä nyt ja tulevaisuudessa työn tutkimukseen perustuva näkökulma
VTT TECHNICAL RESEARCH CENTRE OF FINLAND LTD Robotit ja tekoäly terveydenhuollon työvälineinä nyt ja tulevaisuudessa työn tutkimukseen perustuva näkökulma Mikael Wahlström, VTT Erikoistutkija, valtiot.
LisätiedotCHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi
Tiivistelmä CHERMUG-projekti on kansainvälinen konsortio, jossa on kumppaneita usealta eri alalta. Yksi tärkeimmistä asioista on luoda yhteinen lähtökohta, jotta voimme kommunikoida ja auttaa projektin
LisätiedotNäkökulmia tietoyhteiskuntavalmiuksiin
Näkökulmia tietoyhteiskuntavalmiuksiin Tietotekniikka oppiaineeksi peruskouluun Ralph-Johan Back Imped Åbo Akademi & Turun yliopisto 18. maaliskuuta 2010 Taustaa Tietojenkäsittelytieteen professori, Åbo
LisätiedotTaitava taitoharjoittelu kehittymisen tukena Sami Kalaja
Taitava taitoharjoittelu kehittymisen tukena Sami Kalaja Huippu-urheilupäivät 2014 Vierumäki Esityksen sisällöstä Harjoittelun määrästä Näytöt ja mallin seuraaminen Vaihtelun ja monipuolisuuden merkityksestä
LisätiedotGraafin 3-värittyvyyden tutkinta T Graafiteoria, projektityö (eksakti algoritmi), kevät 2005
Graafin 3-värittyvyyden tutkinta T-79.165 Graafiteoria, projektityö (eksakti algoritmi), kevät 2005 Mikko Malinen, 36474R 29. maaliskuuta, 2005 Tiivistelmä Artikkelissa käydään läpi teoriaa, jonka avulla
LisätiedotGeneettiset algoritmit
Geneettiset algoritmit Evoluution piirteitä laskennassa Optimoinnin perusteet - Kevät 2002 / 1 Sisältö Geneettisten algoritmien sovelluskenttä Peruskäsitteitä Esimerkkejä funktion ääriarvon etsintä vangin
LisätiedotEdistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.
Edistyksen päivät, Helsinki Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla Timo Honkela timo.honkela@helsinki.fi 5.10.2017 Taustaa: Rauhankone-konsepti
LisätiedotKandidaatintyön esittely: Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu
Kandidaatintyön esittely: Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu Vilma Virasjoki 19.11.2012 Ohjaaja: DI Jouni Pousi Valvoja: Professori Raimo P.
LisätiedotAvainsanojen poimiminen Eeva Ahonen
Avainsanojen poimiminen 5.10.2004 Eeva Ahonen Sisältö Avainsanat Menetelmät C4.5 päätöspuut GenEx algoritmi Bayes malli Testit Tulokset Avainsanat Tiivistä tietoa dokumentin sisällöstä ihmislukijalle hakukoneelle
Lisätiedot