Kevät 2003 Timo Honkela ja Kris- ta Lagus
|
|
- Anton Virtanen
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Luonnollisen kielen tilastollinen käsittely T (3 ov) L Kevät 2003 Timo Honkela ja Kris- Luennot: ta Lagus Laskuharjoitukset: Vesa Siivola Luentokalvot: Krista Lagus ja Timo Honkela
2 10. Probabilistinen jäsentäminen ja PCFG:t Mikä on PCFG Lauseen todennäköisyyden laskeminen Inside-algoritmi Todennäköisimmän jäsennyksen etsiminen PCFG:n estimointi (P)CFG:n ongelmia Probabilistinen leksikalisoitu CFG
3 10. Probabilistinen jäsentäminen ja PCFG:t PCFG=Probabilistic Context Free Grammar Todennäköisyyksiin perustuva yhteysvapaa (kontekstivapaa) kielioppi Motivaatio Tähän asti kielen säännönmukaisuuksia kuvattu vain sanatasolla (ngrammimallit) tai sanakategoriatasolla (sanaluokat ja HMM) Sekventiaalisten riippuvuuksien lisäksi muunkinlaisia ilmiöitä, esim. rekursiivisia. Esim. The velocity of the seismic waves rises to... P( waves rises ) on hyvin pieni esim. sanaluokkiin perustuvalla HMMtaggerilla, koska yksiköllistä verbimuotoa harvoin edeltää monikollinen substantiivi (yleensä sitä edeltää yksiköllinen substantiivi, verbin subjekti; ilmiötä kutsutaan nimellä verb agreement ). 3
4 Motivaatio, jatkoa Keskeinen havainto: yksittäisten sanojen sijaan riippuvuudet voidaan ehkä paremmin kuvata suurempien kokonaisuuksien välillä oletetaan hierarkkinen rakenne myös lauseiden tai virkkeiden sisällä. (Hierarkkisuus yleisemmällä tasolla: dokumentti, kappale, lause, sana, kirjain, veto). Vastaavaa hierarkkisuutta myös muualla kuin kielessä, esim. konenäön hahmontunnistusongelmat, joihin myös voidaan soveltaa syntaktisia hahmontunnistusmenetelmiä. 4
5 Lauseen hierarkkinen rakenne Seuraavassa on esimerkki lauseen sisäisestä hierarkkisesta rakenteesta (kirjan kuva 11.2). Voidaan ajatella että riippuvuus on tässä peräkkäiden rakenneosien NP SG ja V P SG välillä. 5
6 10.1 Mikä on PCFG CFG:n luonteva laajennus: CFG, jonka sääntöihin on liitetty laukeamistodennäköisyydet. [CFG = kontekstivapaa kielioppi] PCFG on probabilististen kielioppien eräs alalaji, ts. vain eräs tapa mallintaa hierarkkista rakennetta probabilistisesti. Tekemällä erilaisia riippumattomuusoletuksia päädytään erilaiseen malliperheeseen. 6
7 PCFG:n osat PCFG koostuu seuraavista osista: terminaalisymbolien joukko, ei-terminaalisymbolien joukko, joukko korvaussääntöjä N i γ j jossa γ j on terminaali- ja ei-terminaalisymboleista koostuva jono Kullekin säännölle ehdollinen laukeamistodennäköisyys: P (N i γ j N i ) = 1 (1) j 7
8 Notaatiota G kielioppi L G kieli jonka kielioppi G tuottaa t jäsennyspuu tulostus(t) jäsennyspuun t jäsentämä sanajono {N 1,..., N n } ei-terminaalisymbolien aakkosto (N 1 on alkusymboli) {w 1,..., w V } terminaalisymbolien aakkosto w 1... w m jäsennettävä lause (sanajono) Npq j ei-terminaalisymboli N j kattaa jonossa positiot p:stä q:hun. 8
9 Riippumattomuusoletukset PCFG:ssä korvaussäännön tn on ehdollinen ainoastaan sille, missä ei-terminaalissa nyt ollaan, eli N i. Tarkastellaan tarkemmin riippumattomuusoletuksia, joita tässä tehdään. Rakenteellinen paikkariippumattomuus: alipuun tn ei riipu siitä, missä osassa isompaa puuta alipuu sijaitsee (vrt. HMM:n ajallinen stationaarisuus). Leksikaalinen kontekstiriippumattomuus: alipuun tn ei riipu alipuuhun kuulumattomista kontekstin sanoista. Riippumattomuus esivanhemmista: Alipuun tn ei riipu siitä, mitä sääntöjä käyttäen alipuu generoitiin. 9
10 Huomioita probabilistisesta kieliopista Antaa probabilistisen mallin kielen generoinnille. Arvioi kunkin jäsennyksen todennäköisyyden. Kattavissa kieliopeissa yhdelle lauseelle yleensä hyvin monta mahdollista jäsennystä, jopa tuhansia per lause. Prob. kielioppi (esim. PCFG-malliperhettä käyttäen opittu) ei yritäkään jakaa lauseita ei-kieliopillisiin ja kieliopillisiin. Virheelliset lauseet vain ovat paljon epätodennäköisempiä. Jos dataa on riittävästi, PCFG:llä kieliopin oppiminen mahdollista ilman negatiivista evidenssiä (ei-kieliopillisia lauseita). 10
11 Peruskysymykset PCFG:lle Lauseen todennäköisyyden laskeminen Todennäköisimmän jäsennyksen valinta lauseelle PCFG:n parametrien estimointi joko jäsennetystä (ohjattu oppiminen) tai jäsentämättömästä datasta (ohjaamaton oppiminen) 11
12 Chomskyn normaalimuoto Keskitytään tästedes kontekstivapaisiin kielioppeihin, jotka ovat Chomskyn normaalimuodossa eli säännöt ovat binäärisiä tai unaarisia: N i N j N k N i w j PCFG:n parametrien määrät ovat tällöin: P (N j N r N s G) P (N j w k G) Jos n ei-terminaalia, n 3 parametria Jos V terminaalia, nv parametria Kaikille j pätee lisäksi: P (N j N r N s ) + r,s k P (N j w j ) = 1 (2) Tämä johtuu siitä että yo. parametrit ovat ehdollisia todennäköisyyksiä ehdolla N j. 12
13 Chomskyn hierarkia kielille Yhteys-/kontekstivapaus on eräs kielen kompleksisuutta kuvaava taso. Chomsky jakaa kielet seuraavanlaiseen kompleksisuushierarkiaan: (Taulukko on kirjasta Jurafsky & Martin, s. 479) Tässä A on yksittäinen ei-terminaalisymboli ja α, β ja γ ovat mitä tahansa terminaalien ja ei-terminaalien jonoja. Tyyppi Nimi Sääntörunko 0 Turing-ekvivalentti α β s.e. α ɛ 1 Kontekstiherkkä αaβ αγβ s.e. γ ɛ 2 Kontekstivapaa A γ 3 Säännöllinen A xb tai A x 13
14 Chomskyn hierarkia kielille, selitykset Tyyppi 0 vastaavat niitä kieliä, joiden symbolijonot voidaan tuottaa (listata) Turing-koneella. Ainoa rajoitus säännöille on, että tyhjästä ei voi nyhjästä. Kontekstiherkät kielet muuntavat symbolin toiseksi riippuen sen oikean- ja vasemmanpuoleisesta kontekstista. Sääntöjen on myös tuotettava jotakin. Kontekstivapaissa kielissä ei-terminaalisymboli voidaan korvata millä tahansa ei-terminaalien ja terminaalien jonolla (mukaanlukien tyhjä jono). Näitä toteuttavat esim. lauserakennekieliopit. Säännölliset kielet ovat ekvivalentteja säännöllisten lausekkeiden (regular expressions) kanssa. Ne voivat olla oikea- tai vasenkätisesti lineaarisia. Niitä toteuttavat esim. äärelliset tilakoneet. 14
15 Yhtäläisyys HMM:n ja PRG:n välillä PRG = probabilistic regular grammar, eli todennäköisyyksiä hyödyntävä säännöllinen kielioppi. Esimerkkilause P(John decided to bake a) saisi luultavasti korkean todennäköisyyden HMM:ssä (koska se on järkevä sanajono) mutta matalan PRG:ssä (koska ei ole kokonainen lause). PRG voidaan kuitenkin implementoida HMM:n avulla lisäämällä HMM:ään alkutilan lisäksi lopputila, joka vastaa lauseen päättymistä. 15
16 10.2 Lauseen todennäköisyyden laskeminen P (w 1m G) = t = P (w 1m, t G) (3) t,tulostus(t)=w 1m P (t G)g (4) jossa t on kieliopin G säännöillä tuotettu jäsennyspuu lauseelle w 1m. 16
17 Esimerkki lauseen todennäköisyyden laskemisesta Oletetaan että t:n aikaansaamiseksi sovellettiin G:n sääntöjä s i,s k, ja s a ja tulostuksena oli sanajono w pq. Tällöin P (t G) = P (s i s k s a ) = P (s i, s k, s a ) = P (s a s i, s k )P (s k s i )P (s i ) = P (s a )P (s k )P (s i ) Ylläolevassa kaikki tn:t ovat ehdollisia kieliopille G, joten tämä on jätetty merkitsemättä. Eli P (w pq G) on niiden G:n sääntöjen todennäköisyyksien tulo joita t:n muodostamiseksi sovellettiin. Yleisessä tapauksessa ei kannata (laskennallisista syistä) summata yli kaikkien mahdollisten jäsennysten. Samoin kuin HMM:llä mahdollisia polkuja on liikaa. Ongelma voidaan paloitella osaongelmiksi, ratkaista palat kerrallaan ja vierittää palojen tuloksia eteenpäin. 17
18 10.3 Inside-algoritmi Inside-algoritmi vastaa HMM:ien forward-algoritmia ja sillä voidaan laskea lauseen todennäköisyys. b j (p, q) tarkoittaa N j :n alla olevan alipuun, joka kattaa sanajonon w pq, tn:n laskemista Perustapaus: lasketaan tn, kun muunnetaan ei-terminaali terminaaliksi: b j (k, k) = (w k N j kk, G) Induktioaskel: tn, kun muunnetaan ei-terminaali kahdeksi ei-terminaaliksi: oletetaan sääntö N j N r N s ja jonon jako w pq = w pd w dq Tällöin b j (p, q) = q 1 r,s d=p b r(p, d) b s (d + 1, q) Eli samalla, kun puu jakautuu kahdeksi osapuuksi, jono w pq jaetaan kahtia, ja rekursiivisesti sovelletaan induktioaskelta kumpaankin osapuuhun. 18
19 Lisäksi summataan yli kaikkien mahdollisten jonon jakojen ja kaikkien eiterminaalisymbolien nimien, jotka voidaan muuntaa N j :stä kieliopissa G. Inside-todennäköisyydet voidaan laskea tehokkaasti alhaalta ylös (bottomup). 19
20 10.4 Todennäköisimmän jäsennyksen etsiminen Todennäköisimmän jäsennyksen etsimiseen (samoin kuin HMM:llä) voidaan soveltaa Viterbi-tyypistä algoritmia. Tämä on kompleksisuudeltaan O(n 3 m 3 ) jossa m on jonon pituus ja n eiterminaalien lukumäärä kieliopissa. 20
21 10.5 PCFG:n estimointi Annettuna sääntöjoukko: Tapaus 1: Jokin olemassaoleva CFG, joka hyväksyy koko aineiston. Tapaus 2: Kaikkien mahdollisten sääntöjen joukko. Tapaus 3: Kaikkien mahdollisten sääntöjen joukko paitsi, että oletetaan valmiiksi jotakin rakennetta, esim. jokin ei-terminaalisymbolien osajoukko varattu generoimaan pelkästään terminaalisymboleja. 21
22 Estimointi, kun käytettävissä jäsennettyä aineistoa Annettuna sääntöjoukon Tapaus 1 sekä puupankki (treebank) eli suuri määrä jäsennettyä aineistoa. Lasketaan suoraan sääntöjen soveltamiskertoja ja normalisoidaan. ML-estimaatti: Count(α β) P (α β) = Count(α) 22
23 Estimointi, kun käytettävissä vain jäsentämätöntä aineistoa Sääntöjoukon tapaus 1: Jäsennetään aineisto annetulla CFG:llä ja tämän jälkeen kuten edellä. Käytännössä jäsennykset moniselitteisiä: yhden jäsennyksen sijaan painotetaan eri jäsennyksiä niiden tn:llä. Sääntöjoukon tapaukset 2 ja 3: Kuten HMM:llä, sovelletaan erästä EM-algoritmia, Inside-Outside-algoritmia, joka muistuttaa forward-backward-algoritmia. 23
24 Estimointialgoritmi Mallin ML-estimointi: maksimoidaan datan todennäköisyys. Parametreja ovat sääntöjen tn:t. Perusperiaate: Alustus esim. satunnaisilla parametreilla. Vaihe 1: Sovelletaan tämänhetkistä mallia (PCFG:tä) datan tn:n laskemiseen ja samalla pidetään kirjaa siitä, kuinka paljon mitäkin sääntöä käytettiin. Vaihe 2: Päivitetään sääntöjen tn:t vaiheen 1 kirjanpidon perusteella. Toistetaan vaiheita 1 ja 2. 24
25 Ongelmia probabilistisen kieliopin ei-ohjatussa oppimisessa Ongelman kompleksisuus ja tästä johtuva estimoinnin hitaus. Jokaiselle lauseelle jokainen iteraatio on kompleksisuudeltaan O(m 3 n 3 ), jossa m on lauseen pituus ja n ei-terminaalien määrä lauseessa. Kustannusfunktion lokaalit minimit ovat hyvin todennäköisiä. Esim. yksinkertaisella keinotekoisella PCFG:stä generoidulla aineistolla estimoitaessa 300 eri ajolla päädyttiin jokaisella eri lokaaliin minimiin. Alustuksella on siis hyvin suuri vaikutus. Mallien koko kasvaa helposti suureksi, koska mallin kokoa ei kustannusfunktiossa mitenkään huomioida. Ratkaisu: kustannusfunktion vaihto sellaiseksi, joka huomioi myös mallin koon. Perusteltuja lähestymistapoja tähän ovat MDL ja Bayesilainen estimointi. Ei-terminaaleilla, joita malli oppii, ei välttämättä ole mitään tekemistä lingvistisen teorian ei-terminaalien kanssa. 25
26 10.6 (P)CFG:n ongelmia Säännön soveltamisen todennäköisyys ei riipu siitä, missä kohtaa koko puuta alipuu sijaitsee (P)CFG ei huomioi leksikaalista kontekstia 26
27 Säännön soveltamisen todennäköisyys ei riipu siitä, missä kohtaa koko puuta alipuu sijaitsee. CFG:n riippumattomuusoletukset säännön soveltaminen riippuu vain senhetkisestä ei-terminaalisymbolista. Kuitenkin esim. englannissa pronominilausekkeen esiintymistn riippuu voimakkaasti sijainnista koko lauseessa: Väitelauseiden subjektina pronominin P=91% (loput 9% leksikaalisia), kun taas objektina P=34% (loput 66% leksikaalisia). Usein lauseen alkupäässä viitataan siihen mitä jo tiedetään aiemman keskustelun pohjalta ja loppupäässä tuodaan ilmi ko. asiaa koskevaa uutta tietoa: Presidentti Tarja Halonen aloitti kautensa maakuntakierroksella. Hän tapasi ensin Joensuun kaupungin johtavia virkamiehiä ja jatkoi... Ongelma ratkeaisi, jos P(NP Pronomini) ja P(NP Nomini) ehdollistettaisiin sillä, onko NP subjekti- vai objektipositiossa. Mutta juuri tätä eivät PCFG:n riippumattomuusoletukset salli. 27
28 (P)CFG ei huomioi leksikaalista kontekstia Englannissa prepositiolausekkeen kiinnittymisongelma: I shot an elephant in my pyjamas USA sent more than 10,000 soldiers into Afghanistan Sotilaiden lähettämisen tapauksessa leksikaalinen tieto eli että kyseessä on send-verbi ja into-prepositio auttavat disambiguoimaan esimerkin. Elefanttiesimerkkiin saatetaan tarvita maailmantietoa: elefantit eivät yleensä käytä yöpukuja paitsi saduissa. Suomessa vastaavanlainen monitulkintaisuus: Ammuin elefantin yöpuvussa Ammuin elefantin jolla oli päällään yöpuku. Ammuin yöpukusillani elefantin. 28
29 Vastaava ilmiö: Koordinaatiomonitulkintaisuus: dogs in houses and cats 1. dogs in [NP houses and cats] 2. [NP dogs in houses] and cats Semanttinen preferointi: koirat eivät mahdu kissoihin, joten 2. vaihtoehto olisi oikea. (P)CFG:ssä kuitenkin ylläoleviin lukutapoihin sovellettavat säännöt ovat rakenteisesti identtisiä, eli ei kykene preferoimaan vaihtoehtoja. 29
30 Joitain havaintoja toimivuudesta englannille: PCFG:n ennustuskyky tavallisesti parempi kuin HMM:n, kun sama määrä parametrejä. Englannille PCFG yleensä huonompi kielimalli kuin n-grammimalli. Johtuu siitä, ettei kontekstin leksikaalista tietoa huomioida (riippumattomuusoletukset). Puhdas PCFG ei siis ole hyvä, mutta ehdollistaminen leksikaalisella tiedolla tai puun rakennekontekstilla voi parantaa tulosta. 30
31 Onko PCFG aito kielimalli? Jotta PCFG olisi aito kielimalli, täytyisi päteä: w L = t P (t) = 1 eli kieliopin tuottamien lauseiden saaman todennäköisyysmassan pitäisi olla 1. Kuitenkin tämän toteutuminen edellyttää, että mallissa ei ole mahdollisuutta äärettömään rekursioon. Jos ääretön rekursio on mahdollista, osa tnmassasta katoaa sinne, eikä päädy koskaan kielen lauseiksi. 31
32 Esimerkki Tarkastellaan esimerkiksi kielioppia: S raparperi, P=1/3 S S S, P = 2/3 Tässä suuri osa eli noin 42% jäsennysten tn-massasta katoaa äärettömään rekursioon. Kyseessä on epäkonsistentti tn-jakauma. 32
33 Ongelmattomia tapauksia Todennäköisyysmassan katoaminen rekursiossa ei ole ongelma, kun etsitään todennäköisin jäsennys annetulle lauseelle, vertaillaan kahden lauseen tn:ää annetussa kieliopissa tai estimoidaan PCFG:n parametrit jäsennetystä korpuksesta (Chi & Geman, 1998) 33
34 Ongelmallisia tapauksia Todennäköisyysmassan katoaminen on ongelma, kun tehdään vertailuja eri kielioppien/kielimallien välillä, siis kun: lasketaan jonkin lauseen tn tässä kieliopissa ja verrataan tn:ään jossain toisessa kieliopissa (jossa tn-massa kokonaan tai sen erisuuri osuus kieliopin lauseilla), estimoidaan PCFG:n parametrit ohjaamattomasti toisin sanoen jäsentämättömästä korpuksesta, tai tehdään mallin valintaa eli vertaillaan eri CFG:n sääntöjoukkoja 34
35 10.7 Probabilistinen leksikalisoitu CFG Leksikalisointi tarkoittaa sanatiedon ottamista huomioon. Menetelmä: Jokaiseen ei-terminaalisymboli N i jäsennyspuussa t liitetään ko. alipuun pääsana (head) (Charniak 1997, Collins 1999) CFG:ssä jokaisen säännön kohdalle merkitään, mikä säännön oikealla puolella olevista symboleista on päätytär ts. sisältää pääsymbolin (esim. NN on NP:n päätytär). Päätyttären valinta suoraviivaista oppikirjalauseille, mutta yleisesti ottaen hankalaa (lingvistiikan kirjat saattavat spesifioida säännöt tämän tekemiseen kyseiselle kielelle). 35
36 Puuesimerkki 36
37 Attribuuttikieliopeista Kielioppia, jossa jokaisella ei-terminaalinoodilla on myös jokin terminaalisymboliarvo, kutsutaan myös attribuuttikieliopiksi. PCFG:ssä jokaista päätyttären mahdollista arvoa on varten oma todennäköisyys (ts. oma sääntö). Periaatteessa siis esim: V P (dumped) V BD(dumped)NP (sacks)p P (into)[ ] V P (dumped) V BD(dumped)NP (cats)p P (into)[ ] V P (dumped) V BD(dumped)NP (hats)p P (into)[ ] V P (dumped) V BD(dumped)NP (sacks)p P (above)[ ] Käytännössä mikään aineisto ei riitä näin valtavan mallin estimointiin tehdään taas tiettyjä riippumattomuusoletuksia, joiden avulla ryhmitellään (sidotaan) osa todennäköisyyksistä samoiksi. Esim. voidaan käyttää leksikalisointia vain säännön vasemmalla puolella: V P (dumped) V BD NP P P 37
38 Eri tilastolliset jäsentimet eroavat toisistaan siinä, minkälaisia riippumattomuusoletuksia niissä tehdään. Suuremmasta sääntömäärästä johtuen leksikalisoidun PCFG:n estimointi ohjaamattomalla (ilman jäsennettyä dataa) oppimisella käytännössä mahdotonta, ainakin toistaiseksi. 38
5. Kontekstitieto ja yhteisesiintyminen
5. Kontekstitieto ja yhteisesiintyminen Kontekstin tärkeys kielen tulkinnassa: esimerkiksi monitulkintaisuudet ( Aloitin alusta, Alusta kovalevy!, Näin monta alusta, Minä näin monta alusta ) Chomskyn hierarkia
T Luonnollisen kielen tilastollinen käsittely Vastaukset 8, ti , 8:30-10:00 Tilastolliset yhteydettömät kieliopit, Versio 1.
T-61.281 Luonnollisen kielen tilastollinen käsittely astaukset 8, ti 16.3.2004, 8:30-10:00 Tilastolliset yhteydettömät kielioit, ersio 1.0 1. Jäsennysuun todennäköisyys lasketaan aloittelemalla se säännöstön
T Syksy 2002 Tietojenkäsittelyteorian perusteet Harjoitus 8 Demonstraatiotehtävien ratkaisut
T-79.148 Syksy 2002 Tietojenkäsittelyteorian perusteet Harjoitus 8 Demonstraatiotehtävien ratkaisut 4. Tehtävä: Laadi algoritmi, joka testaa onko annetun yhteydettömän kieliopin G = V, Σ, P, S tuottama
S BAB ABA A aas bba B bbs c
T-79.148 Kevät 2003 Tietojenkäsittelyteorian perusteet Harjoitus 8 Demonstraatiotehtävien ratkaisut 4. Tehtävä: Laadi algoritmi, joka testaa onko annetun yhteydettömän kieliopin G = V, Σ, P, S) tuottama
Chomskyn hierarkia ja yhteysherkät kieliopit
Chomskyn hierarkia ja yhteysherkät kieliopit Laskennan teorian opintopiiri Tuomas Hakoniemi 21. helmikuuta 2014 Käsittelen tässä laskennan teorian opintopiirin harjoitustyössäni muodollisten kielioppien
JOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS LUONNOLLISEN KIELEN KÄSITTELY (NATURAL LANGUAGE PROCESSING, NLP) TEKOÄLYSOVELLUKSET, JOTKA LIITTYVÄT IHMISTEN KANSSA (TAI IHMISTEN VÄLISEEN) KOMMUNIKAATIOON, OVAT TEKEMISISSÄ
Kontekstittomat jäsennysmenetelmät
Kontekstittomat jäsennysmenetelmät Yleistä, kontekstittomat kieliopit, kokoava ja osittava jäsentäminen Lili Aunimo lili.aunimo@helsinki.fi Helsingin yliopisto Kieliteknologia Lili Aunimo Kontekstittomat
Luonnollisen kielen tilastollinen käsittely. T (3 ov) L. Kevät 2004 Timo Honkela ja Kris- ta Lagus
Luonnollisen kielen tilastollinen käsittely T-61.281 (3 ov) L Kevät 2004 Timo Honkela ja Kris- Luennot: ta Lagus Laskuharjoitukset: Vesa Siivola 1. Markov-mallit........................ 3 1.1 Näkyvät Markov-mallit...............
Yhteydettömät kieliopit [Sipser luku 2.1]
Yhteydettömät kieliopit [ipser luku 2.1] Johdantoesimerkkinä tarkastelemme kieltä L = { a n b m a n n > 0, m > 0 }, joka on yhteydetön (mutta ei säännöllinen). Vastaavan kieliopin ytimenä on säännöt eli
T Syksy 2006 Tietojenkäsittelyteorian perusteet T Harjoitus 7 Demonstraatiotehtävien ratkaisut
T-79.1001 Syksy 2006 Tietojenkäsittelyteorian perusteet T Harjoitus 7 Demonstraatiotehtävien ratkaisut Lemma (Säännöllisten kielten pumppauslemma). Olkoon A säännöllinen kieli. Tällöin on olemassa n 1
9.5. Turingin kone. Turingin koneen ohjeet. Turingin kone on järjestetty seitsikko
9.5. Turingin kone Turingin kone on järjestetty seitsikko TM = (S, I, Γ, O, B, s 0, H), missä S on tilojen joukko, I on syöttöaakkosto, Γ on nauha-aakkosto, I Γ, O on äärellinen ohjeiden joukko, O S Γ
Vasen johto S AB ab ab esittää jäsennyspuun kasvattamista vasemmalta alkaen:
Vasen johto S AB ab ab esittää jäsennyspuun kasvattamista vasemmalta alkaen: S A S B Samaan jäsennyspuuhun päästään myös johdolla S AB Ab ab: S A S B Yhteen jäsennyspuuhun liittyy aina tasan yksi vasen
8. Kieliopit ja kielet
8. Kieliopit ja kielet Suomen kielen sanoja voidaan yhdistellä monella eri tavalla. Kielioppi määrää sen, milloin sanojen yhdistely antaa oikein muodostetun lauseen. "Mies räpyttää siipiään" on kieliopillisesti
TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 2. helmikuuta 2012
TIEA241 Automaatit ja, kevät 2012 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 2. helmikuuta 2012 Sisällys Sisällys Chomskyn hierarkia kieli säännöllinen kontekstiton kontekstinen rekursiivisesti lueteltava
Luonnollisen kielen tilastollinen käsittely. T (3 ov) L. Kevät Luentokalvot: Krista Lagus (päivityksiä: Timo Honkela)
Luonnollisen kielen tilastollinen käsittely T-61.281 (3 ov) L Kevät 2004 Luennot: Laskuharjoitukset: Timo Honkela Vesa Siivola Luentokalvot: Krista Lagus (päivityksiä: Timo Honkela) 10. Sanaluokkien taggaus
Rajoittamattomat kieliopit (Unrestricted Grammars)
Rajoittamattomat kieliopit (Unrestricted Grammars) Laura Pesola Laskennanteorian opintopiiri 13.2.2013 Formaalit kieliopit Sisältävät aina Säännöt (esim. A -> B C abc) Muuttujat (A, B, C, S) Aloitussymboli
Sanaluokkajäsennystä rinnakkaisilla transduktoreilla
Sanaluokkajäsennystä rinnakkaisilla transduktoreilla Nykykielten laitos FIN-CLARIN-seminaarissa 4. marraskuuta 2010 Sanaluokkajäsennys Mr. Gelbert also has fun with language. NNP NNP RB VBZ NN IN NN. Sanaluokkajäsennin
uv n, v 1, ja uv i w A kaikilla
2.8 Säännöllisten kielten rajoituksista Kardinaliteettisyistä on oltava olemassa (paljon) ei-säännöllisiä kieliä: kieliä on ylinumeroituva määrä, säännöllisiä lausekkeita vain numeroituvasti. Voidaanko
Pinoautomaatit. TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 6. kesäkuuta 2013 TIETOTEKNIIKAN LAITOS. Pinoautomaatit.
TIEA241 Automaatit ja kieliopit, kesä 2013 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 6. kesäkuuta 2013 Sisällys Aikataulumuutos Tämänpäiväinen demotilaisuus on siirretty maanantaille klo 14:15 (Ag Delta).
TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 31. maaliskuuta 2011
TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 31. maaliskuuta 2011 Sisällys Sisällys Chomskyn hierarkia kieli säännöllinen kontekstiton kontekstinen rekursiivisesti
Laskennan mallit (syksy 2010) Harjoitus 8, ratkaisuja
582206 Laskennan mallit (syksy 2010) Harjoitus 8, ratkaisuja 1. Tarkastellaan yhteydetöntä kielioppia S SAB ε A aa a B bb ε Esitä merkkijonolle aa kaksi erilaista jäsennyspuuta ja kummallekin siitä vastaava
FORMAALI SYSTEEMI (in Nutshell): aakkosto: alkeismerkkien joukko kieliopin määräämä syntaksi: sallittujen merkkijonojen rakenne, formaali kuvaus
FORMAALI SYSTEEMI (in Nutshell): Formaali kieli: aakkosto: alkeismerkkien joukko kieliopin määräämä syntaksi: sallittujen merkkijonojen rakenne, formaali kuvaus esim. SSM:n tai EBNF:n avulla Semantiikka:
TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 29. toukokuuta 2013
TIEA241 Automaatit ja kieliopit, kesä 2013 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 29. toukokuuta 2013 Sisällys Chomskyn hierarkia (ja muutakin) kieli LL(k) LR(1) kontekstiton kontekstinen rekursiivisesti
TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 16. marraskuuta 2015
ja ja TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho NFA:ksi TIETOTEKNIIKAN LAITOS 16. marraskuuta 2015 Sisällys ja NFA:ksi NFA:ksi Kohti säännöllisiä lausekkeita ja Nämä tiedetään:
TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 31. maaliskuuta 2011
TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 31. maaliskuuta 2011 Sisällys Sisällys Chomskyn hierarkia kieli säännöllinen kontekstiton kontekstinen rekursiivisesti
M =(K, Σ, Γ,, s, F ) Σ ={a, b} Γ ={c, d} = {( (s, a, e), (s, cd) ), ( (s, e, e), (f, e) ), (f, e, d), (f, e)
Tik-79.148 Kevät 2001 Tietojenkäsittelyteorian perusteet Laskuharjoitus 7 Demonstraatiotehtävien ratkaisut 1. Pinoautomaatti M = K Σ Γ s F missä K Σ s ja F on määritelty samalla tavalla kuin tilakoneellekin.
8. Kieliopit ja kielet 1 / 22
8. Kieliopit ja kielet 1 / 22 Luonnollinen kieli Suomen kielen sanoja voidaan yhdistellä monella eri tavalla. Kielioppi määrää sen, milloin sanojen yhdistely antaa oikein muodostetun lauseen. "Mies räpyttää
(0 1) 010(0 1) Koska kieli on yksinkertainen, muodostetaan sen tunnistava epädeterministinen q 0 q 1 q 2 q3
T-79.48 Tietojenkäsittelyteorian perusteet Tentti 25..23 mallivastaukset. Tehtävä: Kuvaa seuraavat kielet sekä säännölisten lausekkeiden että determinististen äärellisten automaattien avulla: (a) L = {w
4. Tehtävässä halutaan todistaa seuraava ongelma ratkeamattomaksi:
T-79.148 Kevät 2004 Tietojenkäsittelyteorian perusteet Harjoitus 12 Demonstraatiotehtävien ratkaisut 4. Tehtävässä halutaan todistaa seuraava ongelma ratkeamattomaksi: Hyväksyykö annettu Turingin kone
jäsentäminen TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho 26. marraskuuta 2015 TIETOTEKNIIKAN LAITOS
TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 26. marraskuuta 2015 Sisällys Tunnistamis- ja jäsennysongelma Olkoon G = (N, Σ, P, S) kontekstiton kielioppi ja
TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 3. lokakuuta 2016
TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 3. lokakuuta 2016 Sisällys n tunnistin Jay : An Efficient Context-Free Parsing Algorithm. Communications of the
Muodolliset kieliopit
Muodolliset kieliopit Luonnollisen kielen lauseenmuodostuksessa esiintyy luonnollisia säännönmukaisuuksia. Esimerkiksi, on jokseenkin mielekästä väittää, että luonnollisen kielen lauseet koostuvat nk.
Testaa: Vertaa pinon merkkijono syötteeseen merkki kerrallaan. Jos löytyy ero, hylkää. Jos pino tyhjenee samaan aikaan, kun syöte loppuu, niin
Yhteydettömien kielioppien ja pinoautomaattien yhteys [Sipser s. 117 124] Todistamme, että yhteydettömien kielioppien tuottamat kielet ovat tasan samat kuin ne, jotka voidaan tunnistaa pinoautomaatilla.
Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä
Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä olevilla komponenteilla? Voisiko jollakin ohjelmointikielellä
Pinoautomaatit. TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 6. lokakuuta 2016 TIETOTEKNIIKAN LAITOS
.. TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 6. lokakuuta 2016 Sisällys. Harjoitustehtävätilastoja Tilanne 6.10.2016 klo 8:28 passed potential redo submitters
TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015
TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 30. marraskuuta 2015 Sisällys t Väitöstilaisuus 4.12.2015 kello 12 vanhassa juhlasalissa S212 saa tulla 2 demoruksia
TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 12. kesäkuuta 2013
TIEA241 Automaatit ja kieliopit, kevät 2012 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 12. kesäkuuta 2013 Sisällys t Chomskyn hierarkia (ja vähän muutakin) kieli säännöllinen LL(k) LR(1) kontekstiton
Luonnollisen päättelyn luotettavuus
Luonnollisen päättelyn luotettavuus Luotettavuuden todistamiseksi määrittelemme täsmällisesti, milloin merkkijono on deduktio. Tässä ei ole sisällytetty päättelysääntöihin iteraatiosääntöä, koska sitä
Turingin koneet. Sisällys. Aluksi. Turingin koneet. Turingin teesi. Aluksi. Turingin koneet. Turingin teesi
TIEA241 Automaatit ja kieliopit, kevät 2012 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 17. kesäkuuta 2013 Sisällys Chomskyn hierarkia (ja vähän muutakin) kieli säännöllinen LL(k) LR(1) kontekstiton kontekstinen
1. Markov-mallit. 1.1 Näkyvät Markov-mallit (Markov-ketjut)
1. Markov-mallit 1.1 Näkyvät Markov-mallit (Markov-ketjut) Olkoon X jono satunnaismuuttujia X = (X 1,..., X t ), ja olkoon satunnaismuuttujien arvot joukosta S = {s 1,..., s N }. Jono on ns. Markovin ketju,
11.4. Context-free kielet 1 / 17
11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä
5.3 Ratkeavia ongelmia
153 5.3 Ratkeavia ongelmia Deterministisen äärellisten automaattien (DFA) hyväksymisongelma: hyväksyykö annettu automaatti B merkkijonon w? Ongelmaa vastaava formaali kieli on A DFA = { B, w B on DFA,
Laskennan teoria (kevät 2006) Harjoitus 3, ratkaisuja
581336 Laskennan teoria (kevät 2006) Harjoitus 3, ratkaisuja 1. S! axc X! axc X! by c Y! by c Y! " 2. (a) Tehtävänä on konstruoida rajoittamaton kielioppi, joka tuottaa kielen f0 n 1 n jn 1g. Vaihe1: alkutilanteen
Luku 6. Dynaaminen ohjelmointi. 6.1 Funktion muisti
Luku 6 Dynaaminen ohjelmointi Dynaamisessa ohjelmoinnissa on ideana jakaa ongelman ratkaisu pienempiin osaongelmiin, jotka voidaan ratkaista toisistaan riippumattomasti. Jokaisen osaongelman ratkaisu tallennetaan
Säännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet
TIEA241 Automaatit ja kieliopit, kesä 2013 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 24. toukokuuta 2013 Sisällys Formaalit kielet On tapana sanoa, että merkkijonojen joukko on (formaali) kieli. Hieman
Turingin koneen laajennuksia
Turingin koneen laajennuksia Turingin koneen määritelmään voidaan tehdä erilaisia muutoksia siten että edelleen voidaan tunnistaa tasan sama luokka kieliä. Moniuraiset Turingin koneet: nauha jakautuu k
on rekursiivisesti numeroituva, mutta ei rekursiivinen.
6.5 Turingin koneiden pysähtymisongelma Lause 6.9 Kieli H = { M pysähtyy syötteellä w} on rekursiivisesti numeroituva, mutta ei rekursiivinen. Todistus. Todetaan ensin, että kieli H on rekursiivisesti
Attribuuttikieliopit
TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 3. toukokuuta 2011 Sisällys t Chomskyn hierarkia kieli säännöllinen kontekstiton kontekstinen rekursiivisesti
Algoritmit 2. Luento 13 Ti Timo Männikkö
Algoritmit 2 Luento 13 Ti 30.4.2019 Timo Männikkö Luento 13 Simuloitu jäähdytys Merkkijonon sovitus Horspoolin algoritmi Ositus ja rekursio Rekursion toteutus Algoritmit 2 Kevät 2019 Luento 13 Ti 30.4.2019
Tilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
Tehtävä 1. Oletetaan että uv on neliö ja (u, v) = 1. Osoita, että kumpikin luvuista u ja v on. p 2j i. p j i
JOHDATUS LUKUTEORIAAN (syksy 07) HARJOITUS 8, MALLIRATKAISUT Tehtävä. Oletetaan että uv on neliö ja (u, v) =. Osoita, että kumpikin luvuista u ja v on neliö. Ratkaisu. Olkoon p i alkuluku, joka jakaa luvun
1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.
Algoritmien DP ja MF vertaileminen tapahtuu suoraviivaisesti kirjoittamalla kummankin leskimääräinen kustannus eksplisiittisesti todennäköisyyksien avulla. Lause T MF ave = 1 + 2 1 i
TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 10. kesäkuuta 2013
TIEA241 Automaatit ja kieliopit, kesä 2013 etenevä Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 10. kesäkuuta 2013 Sisällys etenevä etenevä Chomskyn hierarkia (ja muutakin) kieli säännöllinen LL(k) LR(1)
T Luonnollisen kielen tilastollinen käsittely Vastaukset 5, ti , 8:30-10:00 N-grammikielimallit, Versio 1.1
T-6.28 Luonnollisen kielen tilastollinen käsittely Vastaukset 5, ti 24.2.2004, 8:30-0:00 N-grammikielimallit, Versio.. Alla on erään henkilön ja tilaston estimaatit sille, miten todennäköistä on, että
Englannin lausekerakenteita ja taulukkojäsentäminen
Englannin lausekerakenteita ja taulukkojäsentäminen Kontekstittomat jäsennysmenetelmät Lili Aunimo lili.aunimo@helsinki.fi Helsingin yliopisto Kieliteknologia Lili Aunimo Englannin lausekerakenteita ja
Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly
Bayesin pelit Kalle Siukola MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly 12.10.2016 Toistetun pelin esittäminen automaatin avulla Ekstensiivisen muodon puu on tehoton esitystapa, jos peliä
Yhteydettömän kieliopin jäsennysongelma
Yhteydettömän kieliopin jäsennysongelma Yhteydettömän kieliopin jäsennysongelmalla tarkoitetaan laskentaongelmaa Annettu: yhteydetön kielioppi G, merkkijono w Kysymys: päteekö w L(G). Ongelma voidaan periaatteessa
TIEA341 Funktio-ohjelmointi 1, kevät 2008
TIEA34 Funktio-ohjelmointi, kevät 2008 Luento 3 Antti-Juhani Kaijanaho Jyväskylän yliopisto Tietotekniikan laitos 2. tammikuuta 2008 Ydin-Haskell: Syntaksi Lausekkeita (e) ovat: nimettömät funktiot: \x
TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 19. syyskuuta 2016
TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 19. syyskuuta 2016 Sisällys Neuvoja opintoihin tee joka päivä ainakin vähän uskalla mennä epämukavuusalueelle en
Säännöllisen kielen tunnistavat Turingin koneet
186 Säännöllisen kielen tunnistavat Turingin koneet Myös säännöllisen kielen hyväksyvien Turingin koneiden tunnistaminen voidaan osoittaa ratkeamattomaksi palauttamalla universaalikielen tunnistaminen
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat
Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
Hahmon etsiminen syotteesta (johdatteleva esimerkki)
Hahmon etsiminen syotteesta (johdatteleva esimerkki) Unix-komennolla grep hahmo [ tiedosto ] voidaan etsia hahmon esiintymia tiedostosta (tai syotevirrasta): $ grep Kisaveikot SM-tulokset.txt $ ps aux
Mat Lineaarinen ohjelmointi
Mat-2.34 Lineaarinen ohjelmointi..27 Luento 5 Simplexin implementaatioita (kirja 3.2-3.5) Lineaarinen ohjelmointi - Syksy 27 / Luentorunko (/2) Simplexin implementaatiot Naiivi Revised Full tableau Syklisyys
811312A Tietorakenteet ja algoritmit, 2014-2015, Harjoitus 7, ratkaisu
832A Tietorakenteet ja algoritmit, 204-205, Harjoitus 7, ratkaisu Hajota ja hallitse-menetelmä: Tehtävä 7.. Muodosta hajota ja hallitse-menetelmää käyttäen algoritmi TULOSTA_PUU_LASKEVA, joka tulostaa
Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari
Konsensusongelma hajautetuissa järjestelmissä Niko Välimäki 30.11.2007 Hajautetut algoritmit -seminaari Konsensusongelma Päätöksen muodostaminen hajautetussa järjestelmässä Prosessien välinen viestintä
Kieli merkitys ja logiikka
Luento 10 Kieli merkitys ja logiikka Predikaattilogiikka Kielen oppimisen ongelma Ärsykkeen heikkous Luento 10: Kielen oppimisen ongelma Merge Merge Kombinatorinen luovuus: symboleita yhdistelemällä voidaan
Kieli merkitys ja logiikka
Assosiaatiot, konstituentit Kieli merkitys ja logiikka Luento 5: Assosiaatiot, konstituentit Luento 5 125-134,, Konstituentit 104-107, Turingin kone Huom! Lukua 5.2, Assosiationismin teoriaa, ja siihen
Mallipohjainen klusterointi
Mallipohjainen klusterointi Marko Salmenkivi Johdatus koneoppimiseen, syksy 2008 Luentorunko perjantaille 5.12.2008 Johdattelua mallipohjaiseen klusterointiin, erityisesti gaussisiin sekoitemalleihin Uskottavuusfunktio
Algoritmit 2. Luento 8 To Timo Männikkö
Algoritmit 2 Luento 8 To 4.4.2019 Timo Männikkö Luento 8 Algoritmien analysointi Algoritmien suunnittelu Rekursio Osittaminen Rekursioyhtälöt Rekursioyhtälön ratkaiseminen Master-lause Algoritmit 2 Kevät
jens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor
T-1.81 Luonnollisten kielten tilastollinen käsittely Vastaukset 11, ti 8.4., 1:1-18: Klusterointi, Konekääntäminen. Versio 1. 1. Kuvaan 1 on piirretty klusteroinnit käyttäen annettuja algoritmeja. Sanojen
Äärellisten automaattien ja säännöllisten kielten ekvivalenssi
Äärellisten automaattien ja säännöllisten kielten ekvivalenssi Osoitamme seuraavan keskeisen tuloksen: Lause 1.8: [Sipser Thm. 1.54] Kieli on säännöllinen, jos ja vain jos jokin säännöllinen lauseke esittää
815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset
815338A Ohjelmointikielten periaatteet 2015-2016. Harjoitus 2 vastaukset Harjoituksen aiheena on BNF-merkinnän käyttö ja yhteys rekursiivisesti etenevään jäsentäjään. Tehtävä 1. Mitkä ilmaukset seuraava
1. Osoita, että joukon X osajoukoille A ja B on voimassa toinen ns. de Morganin laki (A B) = A B.
HY / Avoin yliopisto Johdatus yliopistomatematiikkaan, kesä 2015 Harjoitus 3 Ratkaisuehdotuksia Tehtäväsarja I Seuraavissa tehtävissä harjoitellaan muun muassa kahden joukon osoittamista samaksi sekä joukon
Algoritmit 1. Luento 2 Ke Timo Männikkö
Algoritmit 1 Luento 2 Ke 11.1.2017 Timo Männikkö Luento 2 Algoritmin esitys Algoritmien analysointi Suoritusaika Asymptoottinen kertaluokka Peruskertaluokkia NP-täydelliset ongelmat Algoritmit 1 Kevät
Tarkastelemme ensin konkreettista esimerkkiä ja johdamme sitten yleisen säännön, joilla voidaan tietyissä tapauksissa todeta kielen ei-säännöllisyys.
Ei-säännöllisiä kieliä [Sipser luku 1.4] Osoitamme, että joitain kieliä ei voi tunnistaa äärellisellä automaatilla. Tulos ei sinänsä ole erityisen yllättävä, koska äärellinen automaatti on äärimmäisen
Dynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
Sana rakenteen kategoriana (A. Radford: Transformational Grammar. A First Course)
Sanaluokista Lauseet eivät ole mitä tahansa äännejonoja; niillä on hierarkkinen konstituenttirakenne, jossa äänteet muodostavat sanoja, sanat lausekkeita ja lausekkeet lauseita. konstituentit kuuluvat
Algoritmit 2. Luento 6 To Timo Männikkö
Algoritmit 2 Luento 6 To 28.3.2019 Timo Männikkö Luento 6 B-puun operaatiot Nelipuu Trie-rakenteet Standarditrie Pakattu trie Algoritmit 2 Kevät 2019 Luento 6 To 28.3.2019 2/30 B-puu 40 60 80 130 90 100
9. N-grammi-kielimallit
9. N-grammi-kielimallit 9.1 Tilastollinen mallinnus 1. Otetaan dataa (generoitu tuntemattomasta tn-jakaumasta) 2. Tehdään estimaatti jakaumasta datan perusteella 3. Tehdään päätelmiä uudesta datasta jakaumaestimaatin
Pelaisitko seuraavaa peliä?
Lisätehtävä 1 seuraavassa on esitetty eräs peli, joka voidaan mallintaa paramterisena tilastollisena mallina tehtävänä on selvittää, kuinka peli toimii ja näyttää mallin takana oleva apulause (Tehtävä
Chomskyn hierarkia. tyyppi 0 on juuri esitelty (ja esitellään kohta lisää) tyypit 2 ja 3 kurssilla Ohjelmoinnin ja laskennan perusmallit
Chomskyn hierarkia Noam Chomskyn vuonna 1956 esittämä luokittelu kieliopeille niiden ilmaisuvoiman mukaan tyyppi kieli kielioppi tunnistaminen 0 rekurs. lueteltava rajoittamaton Turingin kone 1 kontekstinen
4.0.2 Kuinka hyvä ennuste on?
Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki
Mat Lineaarinen ohjelmointi
Mat-.34 Lineaarinen ohjelmointi 9..7 Luento Kokonaislukuoptimoinnin algoritmeja (kirja.-.) Lineaarinen ohjelmointi - Syksy 7 / Luentorunko Gomoryn leikkaava taso Branch & Bound Branch & Cut Muita menetelmiä
1. Universaaleja laskennan malleja
1. Universaaleja laskennan malleja Laskenta datan käsittely annettuja sääntöjä täsmällisesti seuraamalla kahden kokonaisluvun kertolasku tietokoneella, tai kynällä ja paperilla: selvästi laskentaa entä
Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
Johdatus matematiikkaan
Johdatus matematiikkaan Luento 7 Mikko Salo 11.9.2017 Sisältö 1. Funktioista 2. Joukkojen mahtavuus Funktioista Lukiomatematiikassa on käsitelty reaalimuuttujan funktioita (polynomi / trigonometriset /
Jäsennys. TIEA341 Funktio ohjelmointi 1 Syksy 2005
Jäsennys TIEA341 Funktio ohjelmointi 1 Syksy 2005 Muistutus: Laskutehtävä ja tulos data Laskutehtava = Luku Double Yhteen Laskutehtava Laskutehtava Vahennys Laskutehtava Laskutehtava Tulo Laskutehtava
Automaatit. Muodolliset kielet
Automaatit Automaatit ovat teoreettisia koneita, jotka käsittelevät muodollisia sanoja. Automaatti lukee muodollisen sanan kirjain kerrallaan, vasemmalta oikealle, ja joko hyväksyy tai hylkää sanan. Täten
Kevät 2003 Timo Honkela ja Kris- ta Lagus
Luonnollisen kielen tilastollinen käsittely T-61.281 (3 ov) L Kevät 2003 Timo Honkela ja Kris- Luennot: ta Lagus Laskuharjoitukset: Vesa Siivola Luentokalvot: Krista Lagus (päivityksiä: Timo Honkela) 8.
JOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS KUINKA RIKASTUA NAIVI BAYES FROM: "MARGARETTA NITA" SUBJECT: SPECIAL OFFER : VIAGRA ON SALE AT $1.38!!! X-BOGOSITY: YES, TESTS=BOGOFILTER, SPAMICITY=0.99993752,
1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
11. laskuharjoituskierros, vko 15, ratkaisut
11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa
Viikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi
Viikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 29-31.10.2008. 1 Tällä viikolla 1. Käytännön järjestelyistä 2. Kurssin sisällöstä ja aikataulusta 3. Johdantoa Mitä koneoppiminen
Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin
Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:
Laskennan mallit (syksy 2009) Harjoitus 11, ratkaisuja
582206 Laskennan mallit (syksy 2009) Harjoitus 11, ratkaisuja 1. Seuraavissa laskennoissa tilat on numeroitu sarakkeittain ylhäältä alas jättäen kuitenkin hyväksyvä tila välistä. Turingin koneen laskenta
Kieli merkitys ja logiikka. 4: Luovuus, assosiationismi. Luovuus ja assosiationismi. Kielen luovuus. Descartes ja dualismi
Luovuus ja assosiationismi Kieli merkitys ja logiikka 4: Luovuus, assosiationismi Käsittelemme ensin assosiationismin kokonaan, sen jälkeen siirrymme kombinatoriseen luovuuteen ja konstituenttimalleihin
5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3
Mat-.9 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Verkot todennäköisyyslaskennassa Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut Kertymäfunktio, Momentit, Odotusarvo,
MS-A0004/A0006 Matriisilaskenta
4. MS-A4/A6 Matriisilaskenta 4. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto..25 Tarkastellaan neliömatriiseja. Kun matriisilla kerrotaan vektoria, vektorin