Parametrien oppiminen

Samankaltaiset tiedostot
= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

TILASTOLLINEN OPPIMINEN

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

8. laskuharjoituskierros, vko 11, ratkaisut

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

S Laskennallinen systeemibiologia

1. Valitaan tilanteeseen sopiva stokastinen malli. 2. Sovitetaan malli havaittuun dataan (estimoidaan mallin parametrit).

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Osa 2: Otokset, otosjakaumat ja estimointi

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Markov-ketjun hetkittäinen käyttäytyminen

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Luento 6 Luotettavuus Koherentit järjestelmät

Tilastollinen päättely II, kevät 2017 Harjoitus 3B

Gaussinen vaikutuskaavio Tommi Gustafsson 45434f Tfy IV

Tilastolliset menetelmät

JOHDATUS TEKOÄLYYN LUENTO 4.

TILASTOT: johdantoa ja käsitteitä

n = 100 x = %:n luottamusväli µ:lle Vastaus:

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Tilastolliset menetelmät: Tilastolliset testit

Luento 7 Luotettavuus Koherentit järjestelmät

Tilastolliset luottamusvälit

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Sovellettu todennäköisyyslasku A

EX1 EX 2 EX =

Tilastollinen todennäköisyys

Johdatus regressioanalyysiin. Johdatus regressioanalyysiin. Johdatus regressioanalyysiin: Mitä opimme? 2/3

Mat Tilastollisen analyysin perusteet, kevät 2007

Markov-ketjun hetkittäinen käyttäytyminen

Mallipohjainen klusterointi

RATKAISUT x 2 3 = x 2 + 2x + 1, eli 2x 2 2x 4 = 0, joka on yhtäpitävä yhtälön x 2 x 2 = 0. Toisen asteen yhtälön ratkaisukaavalla saadaan

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen.

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

Yleisesti, kun mahdollisilla vastauksilla v i on todennäköisyydet P(v i ), niin H(P(v 1 ),, P(v n )) = i=1,,n - P(v i ) log 2 P(v i )

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

Inversio-ongelmien laskennallinen peruskurssi Luento 11 12

Diskreetin Matematiikan Paja Ratkaisuja viikolle 4. ( ) Jeremias Berg. n(n + 1) 2. k =

Otantajakauman käyttö päättelyssä

Sovellettu todennäköisyyslaskenta B

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia.

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Yhden selittäjän lineaarinen regressiomalli

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen

Ehdollinen todennäköisyys

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

Tilastolliset menetelmät: Varianssianalyysi

Luento 6 Luotettavuus Koherentit järjestelmät

Harjoitukset 1 : Tilastokertaus

811312A Tietorakenteet ja algoritmit , Harjoitus 1 ratkaisu

2 avulla. Derivaatta on nolla, kun. g( 3) = ( 3) 2 ( 3) 5 ( 3) + 6 ( 3) = 72 > 0. x =

T Luonnollisten kielten tilastollinen käsittely

Mat Tilastollisen analyysin perusteet, kevät 2007

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

BM20A Integraalimuunnokset Harjoitus 8

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS

3.2 Sijaintiluvut. MAB5: Tunnusluvut

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Luku 7. Parametrien estimointi. 7.1 Parametriset jakaumat. Lasse Leskelä Aalto-yliopisto 29. marraskuuta 2017

6.1 Riippumattomat satunnaismuuttujat

Epäyhtälöoppia matematiikkaolympialaisten tehtäviin

1. TILASTOLLINEN HAHMONTUNNISTUS

4.3 Signaalin autokorrelaatio

Tietorakenteet, laskuharjoitus 10, ratkaisuja. 1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

Yhden selittäjän lineaarinen regressiomalli: Lisätiedot. Yhden selittäjän lineaarinen regressiomalli

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Sovellettu todennäköisyyslaskenta B

Teoria. Tilastotietojen keruu

9. laskuharjoituskierros, vko 12-13, ratkaisut

Markov-prosessit (Jatkuva-aikaiset Markov-ketjut)

SMG-4200 Sähkömagneettisten järjestelmien lämmönsiirto Ehdotukset harjoituksen 6 ratkaisuiksi

Tehtäviä neliöiden ei-negatiivisuudesta

Tunnuslukuja 27 III TUNNUSLUKUJA

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslaskenta B 5. harjoitukset / Ratkaisut Aiheet: Jatkuvia jakaumia Avainsanat: Jatkuvia jakaumia

Tilastolliset menetelmät: Tilastolliset testit

Transkriptio:

38 Parametrie oppimie Tilastollise malli (Bayes-verkko rakee o kiiitetty, se umeeriste parametrie (ehdolliste todeäköisyyksie arvot pyritää määräämää Oletamme havaitoe oleva täydellisiä; s.o., okaise datapistee sisältävä arvot kaikille muuttuille Jos makeissäkkie salmiakki-hedelmä-karkkie osuudet voivat olla mielivaltaisia, ii hypoteesea oki atkumo Salmiakkimakeiste suhteellie osuus säkissä o aiut parametri a sitä vastaava hypoteesi o h Bayes-verkkoo tarvitaa vai yhtä satuaismuuttuaa (Maku, olla o mahdolliset arvot salmiakki (t. a hedelmä (t. -, vastaava solmu 39 Avataa kääreestä karkkia, oista s kpl o salmiakkia a h kpl o hedelmää Oletetaa kaikkie sekoitussuhteide oleva yhtä todeäköisiä a priori maksimiuskottavuude meetelmä P(d h = =,, P(d h = s ( - h Samaa maksimaalise uskottavuude hypoteesii päädytää maksimoimalla uskottavuude logaritmia (log likelihood L(d h = log P(d h = =,, log P(d h = s log + h log( -

30 Näi tulo yli aieisto vaihtuu summaksi, oka yleesä o helpompi maksimoida Derivoimalla L : suhtee a etsimällä ollakohta saadaa selville : maksimiuskottavuude arvo dl(d h /d = s/ h/( - = 0 = s/(s + h = s/ Maksimaalise uskottavuude hypoteesi h ML saoo säkissä olevie salmiakkie osuude oleva sama kui mitä avatuista karkeista o havaittu Edellä kuvattua meetelmää voidaa käyttää yleisesti (useammaki parametri arvoe selvittämiseksi 3 Meetelmä merkittävä ogelma: os otai tapahtumaa ei ole havaittu laisikaa (pieessä havaitoaieistossa, ii h ML ataa sille todeäköisyyde olla Muutetaa esim. site, että riippue karki mausta se kääritää probabilistise sääö perusteella oko puaisee tai vihreää paperii Maku P(salmiakki Kääre Maku salmiakki hedelmä P(puaie

3 Nyt todeäköisyysmallissa o kolme parametria,, a Bayes-verko stadardisematiika perusteella voidaa laskea tapahtumie todeäköisyyksiä; esim. P(Maku = salmiakki, Kääre = vihreä h,, = P(Maku = salmiakki h,, P(Kääre = vihreä Maku = salmiakki, h,, = ( - Avaamme yt makeista, oista s o salmiakkia a h hedelmää, oide käärepaperie värie lkm:t ovat p s, v s, p h a v h Tämä aieisto uskottavuus P(d h,, o s ( - h ps ( - vs ph ( - vh 33 Otetaa logaritmi edellisestä: L = [s log + h log( - ] + [p s log + v s log( ] + [p h log + v h log( ] Parametrie suhtee derivoimalla a hakemalla ollakohta saadaa L/ = s/ h/( - = 0 = s/(s + h L/ = p s / -v s /( - = 0 = p s /(p s + v s L/ = p h / v h /( - = 0 = p h /(p h + v h : arvo o kute eeki a : arvo o puaise käärepaperi osuus salmiakkikarkkie oukossa ( vast. Näi oppimisogelma akaatuu erillisiksi oppimistehtäviksi kulleki parametrille 3

34 Naiivi Bayes Luokkamuuttua C o Bayes-verko uuri a attribuutit X i ovat se lehtiä Naiivi oletus o, että attribuutit ovat ehdollisesti riippumattomia toisistaa aettua luokka Ku käytössä o Boole muuttuat, ii parametrit ovat = P(C = true i = P(X i = true C = true i = P(X i = true C = false Näide arvot löydetää kute edellä Ku verkko o opetettu, ii havaito [x,, x ], oka luokkamuuttua C arvo o tutemato, voidaa luokitella P(C x,, x = P(C i P(x i C 35 Jatkuva-arvoiset muuttuat Tarkastellaa yhde muuttua Gaussise tiheysfuktio parametrie oppimista Aieisto siis tuottaa ( x P( x e Malli parametrit ovat keskiarvo a haota Olkoot havaitut arvot x,, x Nyt uskottavuude logaritmi o L log ( log e ( x log ( x 4

36 Osittaisderivaattoe ollakohdat: L L 3 ( x 0 ( x 0 Siis keskiarvo maksimaalise uskottavuude arvo o havaitoe keskiarvo a haoa vastaava arvo o variassi eliöuuri Jällee saatii siis ituitiivisesti oikeat arvot x ( x 337 Yhteeveto Tekoäly o todella laaa tutkimuskettä, myös metodologisesti Merkittävää kehitystä tutkimuksessa tapahtuu päivittäi Probabilistie lähestymie o aaut ohi loogise suutaukse Näyttäviä demostraatioita meetelmie mahdollisuuksista saadaa kiihtyvällä tahdilla Myös vähemmälle ulkisuudelle äävät arkisovellukset lisäätyvät Fyysise ageti iteraktio toimitaympäristösä sekä ihmiste kassa kaipaa vielä edistysaskelia 5