1 Bayesin teoreeman käyttö luokittelijana

Samankaltaiset tiedostot
T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

T Luonnollisten kielten tilastollinen käsittely Vastaukset 10, ti , 8:30-10:00 Sanojen merkitysten erottelu, Versio 1.

1. TILASTOLLINEN HAHMONTUNNISTUS

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Bayesilainen päätöksenteko / Bayesian decision theory

T Luonnollisten kielten tilastollinen käsittely

805306A Johdatus monimuuttujamenetelmiin, 5 op

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Ominaisarvo ja ominaisvektori

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

MS-A0004/A0006 Matriisilaskenta

T Luonnollisen kielen tilastollinen käsittely Vastaukset 8, ti , 8:30-10:00 Tilastolliset yhteydettömät kieliopit, Versio 1.

Luento 9: Yhtälörajoitukset optimoinnissa

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

2. laskuharjoituskierros, vko 5, ratkaisut

Sovellettu todennäköisyyslaskenta B

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

a) Sievennä lauseke 1+x , kun x 0jax 1. b) Aseta luvut 2, 5 suuruusjärjestykseen ja perustele vastauksesi. 3 3 ja

30A02000 Tilastotieteen perusteet

5 OMINAISARVOT JA OMINAISVEKTORIT

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset

Johdatus lukuteoriaan Harjoitus 2 syksy 2008 Eemeli Blåsten. Ratkaisuehdotelma

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Tehtäväsarja I Seuraavat tehtävät liittyvät kurssimateriaalin lukuun 7 eli vapauden käsitteeseen ja homogeenisiin

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

JOHDATUS TEKOÄLYYN TEEMU ROOS

4. Lasketaan transienttivirrat ja -jännitteet kuvan piiristä. Piirielimien arvot ovat C =

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

SGN-2500 Johdatus hahmontunnistukseen 2007 Luennot 4 ja 5

MAB3 - Harjoitustehtävien ratkaisut:

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

Lineaarinen toisen kertaluvun yhtälö

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen

Lineaarialgebra ja matriisilaskenta II Syksy 2009 Laskuharjoitus 1 ( ) Ratkaisuehdotuksia Vesa Ala-Mattila

Bayes-mallinnus siltana teorian ja empiirisen evidenssin välillä

Käänteismatriisin ominaisuuksia

Esimerkki 19. Esimerkissä 16 miniminormiratkaisu on (ˆx 1, ˆx 2 ) = (1, 0).

Johdatus tekoälyyn. Luento : Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

Lineaarikuvausten. Lineaarikuvaus. Lineaarikuvauksia. Ydin. Matriisin ydin. aiheita. Aiheet. Lineaarikuvaus. Lineaarikuvauksen matriisi

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2018 Insinöörivalinnan matematiikan koe, , Ratkaisut (Sarja A)

MATEMATIIKAN KOE, PITKÄ OPPIMÄÄRÄ HYVÄN VASTAUKSEN PIIRTEITÄ

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

Sanaluokkajäsennystä rinnakkaisilla transduktoreilla

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

Mat Sovellettu todennäköisyyslasku A

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

ABHELSINKI UNIVERSITY OF TECHNOLOGY

2.3 Juurien laatu. Juurien ja kertoimien väliset yhtälöt. Jako tekijöihin. b b 4ac = 2

MATEMATIIKAN KOE, LYHYT OPPIMÄÄRÄ HYVÄN VASTAUKSEN PIIRTEITÄ

Kaksiluokkainen tapaus, lineaarinen päätöspinta, lineaarisesti erottuvat luokat

2. Teoriaharjoitukset

Harjoitus 5 -- Ratkaisut

7. Olemassaolo ja yksikäsitteisyys Galois n kunta GF(q) = F q, jossa on q alkiota, määriteltiin jäännösluokkarenkaaksi

VEKTORIANALYYSIN HARJOITUKSET: VIIKKO 4

LUKUTEORIA A. Harjoitustehtäviä, kevät (c) Osoita, että jos. niin. a c ja b c ja a b, niin. niin. (e) Osoita, että

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2

Matriisilaskenta Luento 16: Matriisin ominaisarvot ja ominaisvektorit

Vapaus. Määritelmä. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee:

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Ominaisvektoreiden lineaarinen riippumattomuus

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

jens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Ominaisarvo ja ominaisvektori

T Luonnollisen kielen tilastollinen käsittely Vastaukset 5, ti , 8:30-10:00 N-grammikielimallit, Versio 1.1

Tehtäväsarja I Kerrataan lineaarikuvauksiin liittyviä todistuksia ja lineaarikuvauksen muodostamista. Sarjaan liittyvät Stack-tehtävät: 1 ja 2.

Avainsanojen poimiminen Eeva Ahonen

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

JOHDATUS TEKOÄLYYN TEEMU ROOS

J. Virtamo Jonoteoria / Prioriteettijonot 1

MATEMATIIKAN JA TILASTOTIETEEN LAITOS Analyysi I Harjoitus alkavalle viikolle Ratkaisuehdotuksia (7 sivua) (S.M)

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

lnx x 1 = = lim x = = lim lim 10 = x x0

Poisson-prosessien ominaisuuksia ja esimerkkilaskuja

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ominaisarvo-hajoitelma ja diagonalisointi

Tilastollinen aineisto Luottamusväli

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Matematiikan tukikurssi, kurssikerta 5

vkp 4*(1+0)/(32-3)-1= vkp 2*(1+0)/(32-3)=

Numeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33

Sovellettu todennäköisyyslaskenta B

Reaalifunktioista 1 / 17. Reaalifunktioista

LU-hajotelma. Esimerkki 1 Matriisi on yläkolmiomatriisi ja matriisi. on alakolmiomatriisi. 3 / 24

JOHDATUS TEKOÄLYYN TEEMU ROOS

MAB3 - Harjoitustehtävien ratkaisut:

4 Korkeamman kertaluvun lineaariset differentiaaliyhtälöt

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Transkriptio:

1 Bayesin teoreeman käyttö luokittelijana Bayesin kaavan mukaan merkityksen kontekstille c ehdollistettu todennäkköisyys voidaan määrittää alla olevan yhtälön perusteella: P ( c) = P (c )P ( ) P (c) (1) Tämä yhtälö voidaan tulkita sanoin seuraavasti. Todennäköisyys, että on se luokka, joka kuvaa kontekstia c on sama kuin todennäköisyys sille, että konteksti c löytyy luokasta kertaa luokan esiintymisen todennäköisyys jaettuna kontekstin c esiintymisen (priori) todennäköisyydellä. 1.1 Naiivi bayesluokitin Yhtälö 1 voidaan yksinkertaistaa ns. naiiviksi olettamalla, että konteksti c koostuu piirteistä w i, jotka ovat toisistaan riippumattomia. Tämän olettamuksen perusteella saadaan yhtälö s = argmax P (c )P ( ) (2) N 1 s = argmax(p ( ) P (w i )) (3) Nyt yhtälössä (3) esiintyvä w i kuvaa jonkin piirteen esiintymistodennäköisyyttä kontekstissa c ehdolla (luokassa). Yhtälöissä esiintyvä s kuvaa luokituksen tulosta eli luokkaa mihin tutkittava näyte bayesiläisen todennäköisyyden mukaan kuuluu. Edellä esitetty yhtälö voidaan kirjoittaa myös logaritmimuotoon seuraavasti: i=0 N 1 s = argmax(log P ( ) + log P (w i )) (4) 1.2 Naivin bayesluokittimen käyttäminen Olkoon, että bayesluokittimemme tuntee 32 sanaa (N l = 32). Nämä sanat on saatu kahdeksasta lauseesta, joista kolme on lauseita jotka ovat mielestämme kiinnostavia (merk. iin ) ja loput viisi ovat roskaa (merk. s rosk ). Näin ollen bayesluokittimemme voisi pitää sisällään seuraavaa tietoa luokasta s roska : i=0 1

sana 1 2 3 4 5 esiintymiskerrat yht. hello 1 0 0 1 1 3 china 0 0 0 0 0 0 girl 1 0 0 1 1 3 viagra 1 1 1 1 0 4 thomas 0 0 0 0 0 0......... ja vastavasti tietoa luokasta iin : sana 1 2 3 esiintymiskerrat yht. hello 1 1 0 2 china 0 1 0 1 girl 0 0 1 1 viagra 0 0 0 0 thomas 1 1 0 2......... Nyt haluamme tutkia, ovatko seuraavat tuntemattomat lauseet yllä olevan luokittimemme perusteella roskaa vai kiinnostavia. a) w = {hello, thomas, can, you, buy, me, a, drink} b) w = {hello, do, you, need, a, viagra} Ennen kuin voimme tutkia lauseiden kiinnostavuutta, tulee meidän määrittää mitä on todennäköisyys P (w i ) eli piirteen w i todennäköisyys luokassa. Esimerkkimme tapauksessa todennäköisyys voidaan tulkita seuraavasti: mikä on kontekstissa esiintyvän sanan w i esiintymisen todennäköisyys luokassa? Nyt määritetään, että P (w i ) = C(w i ) + λ C( ) + N l λ (5) missä C(w i ) on sanan w i esiintymisen lukumäärä luokassa ja termi λ on menetelmän käyttäjän määrittämä arvo, joka kuvaa prioriuskomuksen vahvuutta. Termin tarkoituksena on estää tilanne, jossa jonkin sanan esiintymistodennköisyys olisi nolla. Termi C( ) on arvo, joka kertoo kuinka monta opetusnäytettä kuuluu luokkaan. Edellisessä yhtälössä esiintyvä N l on luku, joka kuvaa sitä kuinka monta erillistä sanaa luokittimemme tunnistaa. a) Nyt lauseemme on muotoa w = {hello, thomas, can, you, buy, me, a, drink}. Olkoon prioriuskomuksemme vahvuus λ = 0.5. Tutkitaan ensin, kuuluuko lause luokkaan s rosk. Sovelletaan yhtälöitä 2 ja 5 sekä edellä esi- 2

tettyä taulukkoa. Näiden perusteella saadaan sanojen esiintymistodennäköisyyksiksi P (hello s rosk ) = 3 + 0.5 P (thomas s rosk ) = 0 + 0.5 P (can s rosk ) = P (you s rosk ) =... = P (drink s rosk ) = 0 + 0.5 lause kuuluu luokkaan s rosk : s rosk = 5 8 P (hello s rosk)... P (drink s rosk ) s rosk = 5 8 3.5 21 0.57 21 7 s rosk = 4.51839 10 13 Seuraavaksi laskemme todennäköisyyden, että lause kuuluu luokkaa iin. Nyt sanojen esiintymistodennäköisyydet ovat P (hello iin ) = 2 + 0.5 P (thomas iin ) = 2 + 0.5 P (can iin ) = P (you iin ) =... = P (drink iin ) = 0 + 0.5 lause kuuluu luokkaan iin : iin = 3 8 P (hello iin)... P (drink iin ) iin = 3 8 2.5 19 2.5 19 0.56 19 6 iin = 2.15626 10 12 Koska iin > s rosk päättelemme, että lauseen w luokitus s on kiinnostava. 3

b) Nyt lauseemme on muotoa w = {hello, do, you, need, a, viagra} Tutkitaan ensin, että kuuluuko lause luokkaan s rosk. Sovelletaan yhtälöitä 2 ja 5 sekä edellä esitettyä taulukkoa. Näiden perusteella saadaan sanojen esiintymistodennäköisyyksiksi P (hello s rosk ) = 3 + 0.5 P (do s rosk ) = 0 + 0.5 P (you s rosk ) = P (need s rosk ) = P (a s rosk ) = 0 + 0.5 P (viagra s rosk ) = 4 + 0.5 lause kuuluu luokkaan s rosk : s rosk = 5 8 P (hello s rosk)... P (viagra s rosk ) s rosk = 5 8 3.5 21 0.54 21 4.5 4 21 s rosk = 0.0430 10 6 Seuraavaksi laskemme todennäköisyyden, että lause kuuluu luokkaa iin. Nyt sanojen esiintymistodennäköisyydet ovat P (hello iin ) = 2 + 0.5 P (do iin ) = 0 + 0.5 P (you iin ) = P (need iin ) = P (a iin ) = 0 + 0.5 P (viagra iin ) = 0 + 0.5 lause kuuluu luokkaan iin : iin = 3 8 P (hello iin)... P (viagra iin ) iin = 3 8 2.5 19 0.55 19 5 iin = 0.00166 10 6 4

Koska s rosk > iin päättelemme, että lauseen w luokitus s on roskaa. 5