Englannin lausekerakenteita ja taulukkojäsentäminen

Samankaltaiset tiedostot
Kontekstittomat jäsennysmenetelmät

Piirrerakennekielioppien jäsentäminen ja ProFIT

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

811312A Tietorakenteet ja algoritmit Kertausta jälkiosasta

Algoritmit 1. Luento 7 Ti Timo Männikkö

Datatähti 2019 loppu

Algoritmit 1. Luento 8 Ke Timo Männikkö

811312A Tietorakenteet ja algoritmit Kertausta jälkiosasta

Algoritmit 1. Luento 9 Ti Timo Männikkö

Kurssikoe on maanantaina Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

Yhteydettömät kieliopit [Sipser luku 2.1]

58131 Tietorakenteet (kevät 2009) Harjoitus 6, ratkaisuja (Antti Laaksonen)

58131 Tietorakenteet ja algoritmit Uusinta- ja erilliskoe ratkaisuja (Jyrki Kivinen)

Graafit ja verkot. Joukko solmuja ja joukko järjestämättömiä solmupareja. eli haaroja. Joukko solmuja ja joukko järjestettyjä solmupareja eli kaaria

Algoritmit 2. Luento 11 Ti Timo Männikkö

Pinoautomaatit. TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 6. lokakuuta 2016 TIETOTEKNIIKAN LAITOS

Eräs keskeinen algoritmien suunnittelutekniikka on. Palauta ongelma johonkin tunnettuun verkko-ongelmaan.

jäsentäminen TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho 26. marraskuuta 2015 TIETOTEKNIIKAN LAITOS

2. Seuraavassa kuvassa on verkon solmujen topologinen järjestys: x t v q z u s y w r. Kuva 1: Tehtävän 2 solmut järjestettynä topologisesti.

JOHDATUS TEKOÄLYYN TEEMU ROOS

Apuverbit HPSG:ssa ja ProFITissa

58131 Tietorakenteet Erilliskoe , ratkaisuja (Jyrki Kivinen)

Miten käydä läpi puun alkiot (traversal)?

58131 Tietorakenteet ja algoritmit (syksy 2015) Toinen välikoe, malliratkaisut

TKT20001 Tietorakenteet ja algoritmit Erilliskoe , malliratkaisut (Jyrki Kivinen)

Induktiotodistus: Tapaus n = 0 selvä; ol. väite pätee kun n < m.

13 Lyhimmät painotetut polut

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 3. lokakuuta 2016

Oikeasta tosi-epätosi -väittämästä saa pisteen, ja hyvästä perustelusta toisen.

.. X JOHDATUS TEKOÄLYYN TEEMU ROOS

Attribuuttikieliopit

Tietorakenteet, laskuharjoitus 7, ratkaisuja

Esimerkkejä polynomisista ja ei-polynomisista ongelmista

Jäsennys. TIEA341 Funktio ohjelmointi 1 Syksy 2005

Verkon värittämistä hajautetuilla algoritmeilla

Pinot, jonot, yleisemmin sekvenssit: kokoelma peräkkäisiä alkioita (lineaarinen järjestys) Yleisempi tilanne: alkioiden hierarkia

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä

58131 Tietorakenteet ja algoritmit (kevät 2013) Kurssikoe 2, , vastauksia

Algoritmi on periaatteellisella tasolla seuraava:

Täydentäviä muistiinpanoja kontekstittomien kielioppien jäsentämisestä

Puiden karakterisointi

58131 Tietorakenteet (kevät 2009) Harjoitus 11, ratkaisuja (Topi Musto)

Johdatus graafiteoriaan

V. V. Vazirani: Approximation Algorithms, luvut 3-4 Matti Kääriäinen

Yhteydettömän kieliopin jäsennysongelma

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015

3. Hakupuut. B-puu on hakupuun laji, joka sopii mm. tietokantasovelluksiin, joissa rakenne on talletettu kiintolevylle eikä keskusmuistiin.

58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia

811312A Tietorakenteet ja algoritmit V Verkkojen algoritmeja Osa 2 : Kruskalin ja Dijkstran algoritmit

Täydentäviä muistiinpanoja jäsennysalgoritmeista

S BAB ABA A aas bba B bbs c

Ratkaisu. Tulkitaan de Bruijnin jonon etsimiseksi aakkostossa S := {0, 1} sanapituudelle n = 4. Neljän pituisia sanoja on N = 2 n = 16 kpl.

811312A Tietorakenteet ja algoritmit V Verkkojen algoritmeja Osa1 : Leveys- ja syvyyshaku

Paikkatiedon käsittely 6. Kyselyn käsittely

Algoritmit 1. Luento 13 Ti Timo Männikkö

v 1 v 2 v 3 v 4 d lapsisolmua d 1 avainta lapsen v i alipuun avaimet k i 1 ja k i k 0 =, k d = Sisäsolmuissa vähint. yksi avain vähint.

Algoritmit 1. Luento 14 Ke Timo Männikkö

T Syksy 2002 Tietojenkäsittelyteorian perusteet Harjoitus 8 Demonstraatiotehtävien ratkaisut

Tehtävän V.1 ratkaisuehdotus Tietorakenteet, syksy 2003

Hakupuut. tässä luvussa tarkastelemme puita tiedon tallennusrakenteina

Silmukkaoptimoinnista

Algoritmit 2. Luento 12 Ke Timo Männikkö

A TIETORAKENTEET JA ALGORITMIT

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 16. helmikuuta 2012

TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 29. toukokuuta 2013

811312A Tietorakenteet ja algoritmit, , Harjoitus 5, Ratkaisu

14. Luennon sisältö. Kuljetustehtävä. Verkkoteoria ja optimointi. esimerkki. verkkoteorian optimointitehtäviä verkon virittävä puu lyhimmät polut

JOHDATUS TEKOÄLYYN TEEMU ROOS

TIE448 Kääntäjätekniikka, syksy Antti-Juhani Kaijanaho. 9. marraskuuta 2009

Harjoitus 4 ( )

Diskreetit rakenteet

AVL-puut. eräs tapa tasapainottaa binäärihakupuu siten, että korkeus on O(log n) kun puussa on n avainta

Laskennan mallit (syksy 2010) 2. kurssikoe, ratkaisuja

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 26. tammikuuta 2012

j(j 1) = n(n2 1) 3 + (k + 1)k = (k + 1)(k2 k + 3k) 3 = (k + 1)(k2 + 2k + 1 1)

Algoritmit 1. Luento 1 Ti Timo Männikkö

Algoritmit 2. Luento 6 Ke Timo Männikkö

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen

Pienin virittävä puu (minimum spanning tree)

Mat Lineaarinen ohjelmointi

Algoritmit 2. Luento 10 To Timo Männikkö

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 16. marraskuuta 2015

Kuva maailmasta Pakettiverkot (Luento 1)

Dynaaminen ohjelmointi ja vaikutuskaaviot

Laskennan mallit (syksy 2010) Harjoitus 8, ratkaisuja

TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 10. kesäkuuta 2013

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 12. kesäkuuta 2013

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 29. huhtikuuta 2011

Algoritmit 1. Luento 10 Ke Timo Männikkö

811312A Tietorakenteet ja algoritmit, , Harjoitus 5, Ratkaisu

2. Yhteydettömät kielet

Vasen johto S AB ab ab esittää jäsennyspuun kasvattamista vasemmalta alkaen:

isomeerejä yhteensä yhdeksän kappaletta.

Stabilointi. Marja Hassinen. p.1/48

Algoritmit 2. Luento 4 Ke Timo Männikkö

PARITUS KAKSIJAKOISESSA

T Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet )

A TIETORAKENTEET JA ALGORITMIT

Talousmatematiikan perusteet: Luento 7. Derivointisääntöjä Yhdistetyn funktion derivointi

Transkriptio:

Englannin lausekerakenteita ja taulukkojäsentäminen Kontekstittomat jäsennysmenetelmät Lili Aunimo lili.aunimo@helsinki.fi Helsingin yliopisto Kieliteknologia Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.1/16 2005-03-22

Kertausta Viime luennolla kontekstittomat kieliopit osittava ja kokoava jäsennys Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.2/16 2005-03-22

Englannin lausekerakenteita ks. Wilcockin kalvot Substantiivilauseke komplementti (complement) vs. modifioija (modifier) välitaso: substantiiviryhmä, NG Adjektiivilauseke komplementti (complement) vs. modifioija (modifier) välitaso: adjektiiviryhmä, AG Yleistetyt lausekerakennesäännöt Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.3/16 2005-03-22

Transformaatiokielioppi determiner (määre), komplementti, adjunkti Substantiivilausekkeet N -> (D) N (Määresääntö) N -> N PP* (Adjunktisääntö) N -> N (PP) (Komplementtisääntö) Adjektiivitiivilausekkeet A -> (D) A (Määresääntö) A -> A PP* (Adjunktisääntö) A -> A (PP) (Komplementtisääntö) Yeleistetyt säännöt X -> (D) X (Määresääntö) X -> X PP* (Adjunktisääntö) X -> Y (PP) (Komplementtisääntö) Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.4/16 2005-03-22

Taulukkojäsentäminen Tehokasta jäsentämistä Välituloksien tallentaminen: löydetyt rakenteet tutkitut hypoteesit Esim: nurses uudelleenkirjoitetaan yhä uudelleen NP:ksi viime luennon kokoavan jäsennysalgoritmin simulaatiossa (kalvo 1.16, 1.18) employed uudelleenkirjoitetaan yhä uudelleen V:ksi osittavan jäsennysalgoritmin simulaatiossa (kalvo 1.22,puu) NP yritetään uudelleenkirjoittaa yhä uudelleen kokoavan jäsennysalgoritmin simulaatiossa (esim. kalvo 1.14, 1.18) VP yritetään uudelleenkirjoittaa died yhä uudelleen (1.22, puu) Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.5/16 2005-03-22

Jäsentäminen etsintäongelmana ks. Gazdar:in kalvot 13: parsing and search epädeterministisyys moniselitteisyys agenda syvyyssuuntainen haku, agenda: pino leveyssuuntainen haku, agenda: jono Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.6/16 2005-03-22

WFST, taulukko,jäsentäminen Tietorakenteet: well-formed substring table, WFST (hyvinmuodostettujen osajonojen taulu) tallentaa löydetyt rakenteet well-formed substring chart (hyvinmuodostettujen osajonojen taulukko) tallentaa myös tutkitut hypoteesit Jäsentäminen taulukkoa hyödyntäen: Alustus Sääntöjen kutsuminen kokoava osittava Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.7/16 2005-03-22

WFST Puu sopii esittämään yksikäsitteistä valmista jäsennystä. Ongelmia: moniselitteisyys osittaiset rakenteet, jotka ehkä ovat valmiin puun osia virheelliset tai keskeneräiset syötevirkkeet (ks. Arnoldin kalvot, kohta The Inadequacy of Trees) WFST on: suunnattu syklitön verkko (ero puuhun: solmulla voi olla useita isäsolmuja) Gazdarin kalvot 13: WFST WFST voidaan esittää joukkona triplettejä kompleksisuus O(n 3 ), missä n on syötevirkkeen pituus, vrt. yksinkertaisempien algoritmien eksponentiaaliseen kompleksisuuteen: O(x n ) Huom. O(n 3 ) vain kun etsitään ensimmäinen jäsennys. Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.8/16 2005-03-22

WFST moniselitteisyys, Arnoldin kalvot: Local Ambiguity vähemmän informaatiota kuin puussa, Arnoldin kalvot: Local Ambiguity, Chart 3 Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.9/16 2005-03-22

Aktiivinen taulukko WFST ei sisällä tietoa yritetyistä hypoteeseista Gazdarin kalvot Chart Parsing, The Active Chart sallitaan syklit jos kaaren lähtö- ja tulosolmu on sama muutetaan kaarien nimet kategoriasymboleista pisteen sisältäviksi lausekerakennesäännöiksi, ks. Arnoldin kalvot Active Edges (Dotted Rules) aktiiviset ja epäaktiiviset kaaret (active and inactive edges) Taulukko voidaan esittää joukkona triplettejä, esim.: <0,2,S -> NP.VP> taulukkojäsentimet Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.10/16 2005-03-22

Jäsentäminen Taulukkojäsentämisen perussääntö (The Fundamental Rule of Chart Parsing) Deklaratiivinen Jäsennysmenetelmiä: Alustus Sääntöjen kutsuminen. Tämä vaihe voi toteuttaa jäsentämisen esim. kokoavasti, osittavasti tai kumpaakin strategiaa yhdistävästi. Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.11/16 2005-03-22

Perussääntö ks. Gazdarin kalvot: The Fundamental Rule of Chart Parsing Esim. <1,2,S -> NP.VP> <i,j,a -> W1. B W2> <2,3,VP -> V.> <j,k,b -> W3.> <1,3,S -> NP VP.> <i,k,a -> W1 B. W2> A = S B = VP W1 = NP W2 = tyhjä W3 = V Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.12/16 2005-03-22

Alustus Gazdarin kalvot: Initialisation Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.13/16 2005-03-22

Sääntöjen kutsuminen Gazdarin kalvot Rule Invocation Kokoava vasen-kulma (left-corner) jäsennys Osittava Alustusvaiheessa lisää sääntö <0,0,A ->.W>, missä A on koko taulukon yli kulkeva kaari ja W on symbolimerkkijono (mahdollisesti tyhjä). Esim: <0,0,S ->.NP VP> Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.14/16 2005-03-22

Yhteenveto WFST on asyklinen verkko, johon voi tallentaa välitulokset. Taulukot ovat verkkoja, joihin voi tallentaa välitulokset ja hypoteesit. Taulukko koostuu joukosta kaaria kuvaavia triplettejä. Epäaktiivinen kaari on tulos. Aktiivinen kaari on hypoteesi. Taulukkojäsentämistä ohjaa perussääntö. Taulukkotietorakenne ei ota kantaa jäsennys- ja etsintästrategiaan. Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.15/16 2005-03-22

Seuraavalla luennolla Alikategorisointi Lausekkeen pää Kompositionaalinen semantiikka Lili Aunimo Englannin lausekerakenteita ja taulukkojäsentäminen p.16/16 2005-03-22