Oppijan saama palaute määrää oppimisen tyypin

Samankaltaiset tiedostot
KOMPLEKSISET PÄÄTÖKSET

Yleisesti, kun mahdollisilla vastauksilla v i. on todennäköisyydet P(v i. ),, P(v n. )) = i=1,,n. -P(v i

Pinot, jonot, yleisemmin sekvenssit: kokoelma peräkkäisiä alkioita (lineaarinen järjestys) Yleisempi tilanne: alkioiden hierarkia

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

Yleisesti, kun mahdollisilla vastauksilla v i on todennäköisyydet P(v i ), niin H(P(v 1 ),, P(v n )) = i=1,,n - P(v i ) log 2 P(v i )

Älykäs datan tuonti kuljetusongelman optimoinnissa. Antoine Kalmbach

Viikko 1: Johdantoa Matti Kääriäinen

AVL-puut. eräs tapa tasapainottaa binäärihakupuu siten, että korkeus on O(log n) kun puussa on n avainta

Algoritmit 1. Luento 12 Ke Timo Männikkö

Algoritmit 2. Luento 2 Ke Timo Männikkö

Tietorakenteet, laskuharjoitus 7, ratkaisuja

TIE448 Kääntäjätekniikka, syksy Antti-Juhani Kaijanaho. 9. marraskuuta 2009

811312A Tietorakenteet ja algoritmit, , Harjoitus 7, ratkaisu

Hakupuut. tässä luvussa tarkastelemme puita tiedon tallennusrakenteina

Johdatus tekoälyyn. Luento : Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

Algoritmit 2. Luento 2 To Timo Männikkö

Datatähti 2019 loppu

A TIETORAKENTEET JA ALGORITMIT

Tehtävän V.1 ratkaisuehdotus Tietorakenteet, syksy 2003

Algoritmit 2. Luento 9 Ti Timo Männikkö

Algoritmit 1. Luento 12 Ti Timo Männikkö

811312A Tietorakenteet ja algoritmit III Lajittelualgoritmeista

58131 Tietorakenteet ja algoritmit (kevät 2016) Ensimmäinen välikoe, malliratkaisut

Tietorakenteet ja algoritmit

805306A Johdatus monimuuttujamenetelmiin, 5 op

811312A Tietorakenteet ja algoritmit V Verkkojen algoritmeja Osa 2 : Kruskalin ja Dijkstran algoritmit

58131 Tietorakenteet (kevät 2009) Harjoitus 9, ratkaisuja (Antti Laaksonen)

811120P Diskreetit rakenteet

2. Seuraavassa kuvassa on verkon solmujen topologinen järjestys: x t v q z u s y w r. Kuva 1: Tehtävän 2 solmut järjestettynä topologisesti.

Algoritmit 2. Luento 6 To Timo Männikkö

Algoritmit 2. Luento 7 Ti Timo Männikkö

Epädeterministisen Turingin koneen N laskentaa syötteellä x on usein hyödyllistä ajatella laskentapuuna

ALGORITMIT & OPPIMINEN

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2

Algoritmit 1. Luento 7 Ti Timo Männikkö

Sovellettu todennäköisyyslaskenta B

Tietorakenteet ja algoritmit

v 1 v 2 v 3 v 4 d lapsisolmua d 1 avainta lapsen v i alipuun avaimet k i 1 ja k i k 0 =, k d = Sisäsolmuissa vähint. yksi avain vähint.

Laskennallinen data-analyysi II

Ohjelmoinnin perusteet Y Python

Stabiloivat synkronoijat ja nimeäminen

Määrittelydokumentti

Johdatus graafiteoriaan

Diskriminanttianalyysi I

811312A Tietorakenteet ja algoritmit, , Harjoitus 5, Ratkaisu

Turingin koneen laajennuksia

Johdatus tekoälyn taustalla olevaan matematiikkaan

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

Algoritmit 2. Luento 13 Ti Timo Männikkö

58131 Tietorakenteet Erilliskoe , ratkaisuja (Jyrki Kivinen)

3. Hakupuut. B-puu on hakupuun laji, joka sopii mm. tietokantasovelluksiin, joissa rakenne on talletettu kiintolevylle eikä keskusmuistiin.

58131 Tietorakenteet (kevät 2009) Harjoitus 6, ratkaisuja (Antti Laaksonen)

Avainsanojen poimiminen Eeva Ahonen

1.1 Pino (stack) Koodiluonnos. Graafinen esitys ...

T : Max-flow / min-cut -ongelmat

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset

Algoritmit 2. Luento 6 Ke Timo Männikkö

Kysymyksiä koko kurssista?

Matriisit ovat matlabin perustietotyyppejä. Yksinkertaisimmillaan voimme esitellä ja tallentaa 1x1 vektorin seuraavasti: >> a = 9.81 a = 9.

811312A Tietorakenteet ja algoritmit Kertausta kurssin alkuosasta

Johdatus diskreettiin matematiikkaan Harjoitus 5, Ratkaise rekursioyhtälö

KONEOPPIMISEN HYÖDYNTÄMINEN: AUTOMAATTINEN TIKETTIEN KÄSITTELY. Esa Sairanen

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 2. helmikuuta 2012

Numeeriset menetelmät

Testaa: Vertaa pinon merkkijono syötteeseen merkki kerrallaan. Jos löytyy ero, hylkää. Jos pino tyhjenee samaan aikaan, kun syöte loppuu, niin

KESKEISET SISÄLLÖT Keskeiset sisällöt voivat vaihdella eri vuositasoilla opetusjärjestelyjen mukaan.

Numeeriset menetelmät TIEA381. Luento 8. Kirsi Valjus. Jyväskylän yliopisto. Luento 8 () Numeeriset menetelmät / 35

Osakesalkun optimointi. Anni Halkola Turun yliopisto 2016

Introduction to Machine Learning

Algoritmi on periaatteellisella tasolla seuraava:

811312A Tietorakenteet ja algoritmit Kertausta kurssin alkuosasta

811312A Tietorakenteet ja algoritmit, , Harjoitus 5, Ratkaisu

Uolevin reitti. Kuvaus. Syöte (stdin) Tuloste (stdout) Esimerkki 1. Esimerkki 2

Hohde Consulting 2004

TILASTOLLINEN OPPIMINEN

Ohjelmoinnin perusteet Y Python

Matriisit ja vektorit Matriisin käsite Matriisialgebra. Olkoon A = , B = Laske A + B, , 1 3 3

T Syksy 2002 Tietojenkäsittelyteorian perusteet Harjoitus 8 Demonstraatiotehtävien ratkaisut

1. Mitä tehdään ensiksi?

Tekoäly ja alustatalous. Miten voit hyödyntää niitä omassa liiketoiminnassasi

58131 Tietorakenteet ja algoritmit Uusinta- ja erilliskoe ratkaisuja (Jyrki Kivinen)

Nopea kertolasku, Karatsuban algoritmi

Analyysi, staattinen mallintaminen, kohdealueen malli ja luokkakaavio

Ohjelmoinnin perusteet Y Python

hyvä osaaminen

Algoritmit 2. Luento 14 Ke Timo Männikkö

58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia

Tiedonlouhinta ja sen mahdollisuudet

Binäärihaun vertailujärjestys

2.2. Kohteiden konstruktiivinen avaruusgeometrinen esitys

Puhesynteesin perusteet Luento 5: unit selection -synteesi

Ennustaminen ARMA malleilla ja Kalmanin suodin

Matematiikka vuosiluokat 7 9

Luento 5. Timo Savola. 28. huhtikuuta 2006

Harjoitus 7 -- Ratkaisut

Algoritmit 1. Demot Timo Männikkö

Testaus käsite. Sekalaista testausasiaa. Testauksen käsitteestä. Kattavuusmitat. Jos ajatellaan, että testaus = V&V, voidaan erottaa:

on rekursiivisesti numeroituva, mutta ei rekursiivinen.

7.4 Sormenjälkitekniikka

JOHDATUS TEKOÄLYYN TEEMU ROOS

Transkriptio:

281 5. KONEOPPIMINEN Älykäs agentti voi joutua oppimaan mm. seuraavia seikkoja: Kuvaus nykytilan ehdoilta suoraan toiminnolle Maailman relevanttien ominaisuuksien päätteleminen havaintojonoista Maailman muuttumisen seuraaminen ja toimintojen vaikutukset Maailman mahdollisten tilojen hyötyarviot Toimintojen arvottaminen Maalitilojen tunnistaminen hyödyn maksimoimiseksi 282 Oppijan saama palaute määrää oppimisen tyypin Ohjatussa oppimisessa (supervised l.) tavoitteena on oppia kuvaus syötteiltä tuloksille annettujen esimerkkien perusteella Ohjaamattomassa oppimisessa (unsupervised l.) annettuja syötteitä pyritään ryhmittelemään samankaltaisiin ryhmiin ilman erillisiä tulosarvoja Palauteoppimisessa (reinforcement l.) oppija saa (ohjattua oppimista epämääräisempää) palautetta, jonka perusteella sen tulee oppia syötteistä Tietämyksenesitys määrää vahvasti oppimisalgoritmin toiminnan 1

283 Induktiivinen oppiminen Ohjatussa oppimisessa tavoitteena on oppia tuntematon funktio f annettuna esimerkkejä (x, f(x)), missä x on syöte(vektori) Induktiivisessa inferenssissä tuloksena on hypoteesi h, joka on oppijan approksimaatio f:stä Tavoiteltava hypoteesi yleistää (generalize) esimerkkien perusteella uusien tapausten ennustamiseksi Hypoteesi valitaan hypoteesiluokasta H Esimerkiksi kun sekä arvot x ja f(x) ovat reaalilukuja, niin H voi olla mm. korkeintaan astetta k olevat polynomit: 3x 2 + 2, x 17-4x 3 284 f(x) x Konsistentti hypoteesi on annetun aineiston kanssa yhtäpitävä Mikä valita mahdollisesti monista konsistenteista hypoteeseistä? Occamin partaveitsen (Occam's / Ockham's razor) mukaan yksinkertaisin hypoteeseistä on paras Yksinkertaisuuden määritteleminen? 2

285 Hypoteesiluokka ei aina sisällä konsistenttia hypoteesiä Toisaalta (paremman yleistyskyvyn nimissä) voi olla järkevää vaihtaa sovituksen tarkkuutta hypoteesin yksinkertaisuuteen Ts., tyytyä huonommin annettuun aineistoon sopivaan hypoteesiin, joka kuitenkin on yksinkertainen Hypoteesiluokka on rajoitettava, jotta hyvin aineistoon sopivan hypoteesin löytäminen olisi laskennallisesti tehokasta Koneoppiminen keskittyykin melko yksinkertaisten tietämyksen esitysmuotojen oppimiseen 286 Päätöspuiden oppiminen Päätöspuun (decision tree) syöte on attribuuttiarvoin ilmaistu olion tai tilanteen kuvaus Tuloksena on päätös ennuste syötettä vastaavalle tulosarvolle Jos tulosarvot ovat diskreettejä, niin puu luokittelee syötteet Jatkuva-arvoisen funktion oppimista nimitetään regressioksi Syötteen käsittelemiseksi se ohjataan puun juuresta lähtien sisäsolmujen polkua aina lehteen, johon liittyvä päätös on syötteen tulosarvo Sisäsolmuihin liittyy attribuuttiarvon testi, jonka mukaan käsiteltävä tapaus ohjataan eteenpäin puussa 3

Asiakkaita? Tyhjä Jokunen Täysi Vaihda Odotusaika? 287 Vaihda > 60 Vaihtoehto? 60-30 30-10 Nälkä? 10-0 Varaus? Baari? Pe / La? Vaihda Vaihtoehto? Sataa? Vaihda Vaihda 288 (Kohtuullisen kokoinen) päätöspuu on helposti ymmärrettävä tietämyksen esitysmuoto Käytännössä tärkeä, heuristisesti opittavissa Edellisen esimerkin päätöspuu vastaa päätöstä siitä kannattaako ravintolaan jäädä odottamaan pöytää Sen ilmaisema predikaatti on s: (s) (P 1 (s) P n (s)), missä kukin ehdoista P i (s) on puun polkua juuresta lehteen vastaavien testien konjunktio Eksponentiaalisen kokoisella päätöspuulla voidaan ilmaista mikä tahansa Boolen funktio 4

289 Yleensä funktion esittämiseen riittää eksponentiaalista kokoa pienempi puu Eräät funktiot ovat kuitenkin vaikeita ilmaista päätöspuin, esim. xor ja maj vaativat eksponentiaalisen kokoisen puun Päätöspuut, kuten kaikki muutkin tietämyksen esitysmuodot, soveltuvat hyvin joidenkin funktioiden kuvaamiseen ja huonommin toisten n:n muuttujan Boolen funktion totuustaulussa on 2 n riviä, joten eri funktioita on 2 2n kappaletta Esim. n = 6 2 2n > 18 10 18, joten konsistentin hypoteesin löytäminen on haastavaa 290 Päätöspuiden osittava oppiminen Algoritmin syöte on opetusjoukko (training set), joka koostuu joukosta esimerkkejä (X, y), missä X on attribuuttiarvojen vektori ja y on arvoihin liitetty luokka-arvo Konsistentti puu jossa on oma juuri-lehti-polku kutakin opetusesimerkkiä kohden voitaisiin rakentaa helposti Tällöin ei kuitenkaan saavutettaisi yleistyskykyä Occamin partaveistä noudattaen meidän tulisi etsiä pienin opetusjoukon kanssa konsistentti puu, mutta pienimmän konsistentin puun löytäminen on laskennallisesti tehotonta (NPkovaa) 5

291 Menestyksekkäät päätöspuiden oppimisalgoritmit perustuvat heuristiseen pienehkön puun löytämiseen Lähtökohtana on valita tärkeimmät attribuutit ensin Koska tavoitteena on tapausten luokittelu, niin attribuutti on tärkeä, kun sen vaikutus luokittelussa on suuri Päätöspuun muodostaminen itsessään voidaan tehdä rekursiivisella algoritmilla Ensin valitaan puun juureen se attribuutti, joka osoittautuu parhaaksi, jaetaan opetusaineisto tämän attribuutin arvojen perusteella ja jatketaan puun muodostamista alipuista samalla periaatteella 292 Tree growconstree( Attrs A, Exs S ) { if ( all examples in S have class C ) return an one-leaf tree labeled by C; else { select an attribute a from A; partition S into S 1,..., S k by the value of a; for (i = 1; I <= k; i++ ) T i = growconstree( A-{a}, S i ); return a tree T that has a in its root and T i as its i-th subtree; } } 6

293 Jos algoritmi joutuu valitsemaan puun tyhjälle esimerkkien joukolle (opetusaineiston jaon yhteydessä), niin puuksi valitaan lehti, jonka ennustama luokka on koko opetusaineiston yleisin Jos taas attribuutit loppuvat kesken s.e. jäljellä olevassa aineistossa on vielä useamman luokan edustajia, niin aineisto on keskenään ristiriitainen l. kohinainen (noisy) Kohina voi olla seurausta riittämättömistä tilannetta kuvaavista attribuuteista tai se voi olla sovellusalueen aitoa epädeterminismiä Yleisimmän luokan ennustaminen on yksinkertainen tapa toimia tässä tilanteessa 7