uv n, v 1, ja uv i w A kaikilla

Samankaltaiset tiedostot
ICS-C2000 Tietojenkäsittelyteoria. Tähän mennessä: säännölliset kielet. Säännöllisten kielten pumppauslemma M :=

ICS-C2000 Tietojenkäsittelyteoria

Rajoittamattomat kieliopit

Chomskyn hierarkia ja yhteysherkät kieliopit

T Syksy 2002 Tietojenkäsittelyteorian perusteet Harjoitus 8 Demonstraatiotehtävien ratkaisut

4. Tehtävässä halutaan todistaa seuraava ongelma ratkeamattomaksi:

(0 1) 010(0 1) Koska kieli on yksinkertainen, muodostetaan sen tunnistava epädeterministinen q 0 q 1 q 2 q3

Automaatit. Muodolliset kielet

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 31. maaliskuuta 2011

S BAB ABA A aas bba B bbs c

T Syksy 2006 Tietojenkäsittelyteorian perusteet T Harjoitus 7 Demonstraatiotehtävien ratkaisut

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 19. tammikuuta 2012

Yhteydettömät kieliopit [Sipser luku 2.1]

Olkoon G = (V,Σ,P,S) yhteydetön kielioppi. Välike A V Σ on tyhjentyvä, jos A. NULL := {A V Σ A ε on G:n produktio};

6.5 Turingin koneiden pysähtymisongelma Lause 6.9 Kieli. H = {c M w M pysähtyy syötteellä w}

Testaa: Vertaa pinon merkkijono syötteeseen merkki kerrallaan. Jos löytyy ero, hylkää. Jos pino tyhjenee samaan aikaan, kun syöte loppuu, niin

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 19. syyskuuta 2016

Vasen johto S AB ab ab esittää jäsennyspuun kasvattamista vasemmalta alkaen:

Täydentäviä muistiinpanoja Turingin koneiden vaihtoehdoista

Äärellisten automaattien ja säännöllisten kielten ekvivalenssi

Säännöllisten kielten sulkeumaominaisuudet

Pinoautomaatit. Pois kontekstittomuudesta

M = (Q, Σ, Γ, δ, q 0, q acc, q rej )

Mutta esimerkiksi 0-kertaisesti pumpattaessa: Siten L ei voi olla säännöllinen.

2. Yhteydettömät kielet

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 12. marraskuuta 2015

Säännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet

8. Kieliopit ja kielet

Esimerkki 2.28: Tarkastellaan edellisen sivun ehdot (1) (3) toteuttavaa pinoautomaattia, jossa päätemerkit ovat a, b ja c ja pinoaakkoset d, e ja $:

Kertausta 1. kurssikokeeseen

Pinoautomaatit. TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 6. kesäkuuta 2013 TIETOTEKNIIKAN LAITOS. Pinoautomaatit.

Rajoittamattomat kieliopit (Unrestricted Grammars)

Yhteydettömän kieliopin jäsennysongelma

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 16. marraskuuta 2015

M =(K, Σ, Γ,, s, F ) Σ ={a, b} Γ ={c, d} = {( (s, a, e), (s, cd) ), ( (s, e, e), (f, e) ), (f, e, d), (f, e)

TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 29. toukokuuta 2013

1. Universaaleja laskennan malleja

Osoitamme, että jotkut kielet eivät ole säännöllisiä eli niitä ei voi tunnistaa äärellisellä automaatilla.

Laskennan mallit (syksy 2010) Harjoitus 8, ratkaisuja

TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 10. kesäkuuta 2013

Laskennan mallit (syksy 2010) Harjoitus 4, ratkaisuja

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 9. lokakuuta 2016

DFA:n käyttäytyminen ja säännölliset kielet

ICS-C2000 Tietojenkäsittelyteoria Kevät 2016

Ei-yhteydettömät kielet [Sipser luku 2.3]

Kaikki mitä olet aina halunnut tietää pumppauslemmoista, mutta mitä et ole kehdannut kysyä

jäsentäminen TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho 26. marraskuuta 2015 TIETOTEKNIIKAN LAITOS

8. Kieliopit ja kielet 1 / 22

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 2. helmikuuta 2012

jäsennyksestä TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho 29. syyskuuta 2016 TIETOTEKNIIKAN LAITOS Kontekstittomien kielioppien

Rekursiivinen Derives on periaatteessa aivan toimiva algoritmi, mutta erittäin tehoton. Jos tarkastellaan esim. kieliopinpätkää

Algoritmin määritelmä [Sipser luku 3.3]

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 16. toukokuuta 2011

Tarkastelemme ensin konkreettista esimerkkiä ja johdamme sitten yleisen säännön, joilla voidaan tietyissä tapauksissa todeta kielen ei-säännöllisyys.

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 26. tammikuuta 2012

Muita universaaleja laskennan malleja

5.3 Ratkeavia ongelmia

Pinoautomaatit. TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 6. lokakuuta 2016 TIETOTEKNIIKAN LAITOS

δ : (Q {q acc, q rej }) (Γ k {, }) Q (Γ k {, }) {L, R}.

TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 22. toukokuuta 2013

Yllä osoitettiin, että säännöllisten kielten joukko on suljettu yhdisteen

Hahmon etsiminen syotteesta (johdatteleva esimerkki)

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 31. maaliskuuta 2011

Jos sekaannuksen vaaraa ei ole, samastamme säännöllisen lausekkeen ja sen esittämän kielen (eli kirjoitamme R vaikka tarkoitammekin L(R)).

Säännöllisten operaattoreiden täydentäviä muistiinpanoja

5 Kontekstittomat kielet ja pinoautomaatit

on rekursiivisesti numeroituva, mutta ei rekursiivinen.

Muodolliset kieliopit

9.5. Turingin kone. Turingin koneen ohjeet. Turingin kone on järjestetty seitsikko

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 3. joulukuuta 2015

vaihtoehtoja TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho 13. lokakuuta 2016 TIETOTEKNIIKAN LAITOS

Säännöllisen kielen tunnistavat Turingin koneet

Σ on numeroituvasti ääretön. Todistus. Muodostetaan bijektio f : N Σ seuraavasti. Olkoon

Output. Input Automaton

Vaihtoehtoinen tapa määritellä funktioita f : N R on

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 5. marraskuuta 2015

Rekursio. Funktio f : N R määritellään yleensä antamalla lauseke funktion arvolle f (n). Vaihtoehtoinen tapa määritellä funktioita f : N R on

Muunnelmia Turingin koneista sekä muita vaihtoehtoisia malleja

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 12. lokakuuta 2016

Turingin koneen laajennuksia

2.6 SÄÄNNÖLLISET LAUSEKKEET Automaattimalleista poikkeava tapa kuvata yksinkertaisia kieliä. Olkoot A ja B aakkoston Σ kieliä. Perusoperaatioita:

11.4. Context-free kielet 1 / 17

ICS-C2000 Tietojenkäsittelyteoria

Kielenä ilmaisten Hilbertin kymmenes ongelma on D = { p p on polynomi, jolla on kokonaislukujuuri }

jäsentämisestä TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho 27. marraskuuta 2015 TIETOTEKNIIKAN LAITOS

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 12. tammikuuta 2012

ICS-C2000 Tietojenkäsittelyteoria Kevät 2016

TKT20005 Laskennan mallit (syksy 2018) Kurssikoe, malliratkaisut

Laskennan rajoja. TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 10. joulukuuta 2015 TIETOTEKNIIKAN LAITOS.

Kontekstittomien kielten jäsentäminen Täydentäviä muistiinpanoja TIEA241 Automaatit ja kieliopit, syksy 2016

Pysähtymisongelman ratkeavuus [Sipser luku 4.2]

Formalisoimme nyt edellä kuvatun laskennan.

ongelma A voidaan ratkaista ongelman B avulla, joten jossain mielessä

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 20. lokakuuta 2016

Johdatus matemaattiseen päättelyyn

Miten osoitetaan joukot samoiksi?

Automaattiteoria diskreetin signaalinkäsittelyn perusmallit ja -menetelmät ( diskreettien I/O-kuvausten yleinen teoria)

Cantorin joukon suoristuvuus tasossa

Laskennan teoria (kevät 2006) Harjoitus 3, ratkaisuja

Turingin koneet. Sisällys. Aluksi. Turingin koneet. Turingin teesi. Aluksi. Turingin koneet. Turingin teesi

Transkriptio:

2.8 Säännöllisten kielten rajoituksista Kardinaliteettisyistä on oltava olemassa (paljon) ei-säännöllisiä kieliä: kieliä on ylinumeroituva määrä, säännöllisiä lausekkeita vain numeroituvasti. Voidaanko löytää konkreettinen, mielenkiintoinen esimerkki kielestä, joka ei olisi säännöllinen? Helposti. Säännöllisten kielten perusrajoitus: äärellisillä automaateilla on vain rajallinen muisti. Siten ne eivät pysty ratkaisemaan ongelmia, joissa vaaditaan mielivaltaisen suurten lukujen tarkkaa muistamista. Esimerkki: sulkulausekekieli L match = {( k ) k k 0}. Formalisointi: pumppauslemma. Lemma 2.6 (Pumppauslemma) Olkoon A säännöllinen kieli. Tällöin on olemassa sellainen n 1, että mikä tahansa x A, x n, voidaan jakaa osiin x = uvw siten, että uv n, v 1, ja uv i w A kaikilla i = 0, 1, 2,... Todistus. Olkoon M jokin A:n tunnistava deterministinen äärellinen automaatti, ja olkoon n M:n tilojen määrä. Tarkastellaan M:n läpikäymiä tiloja syötteellä x A, x n. Koska M jokaisella x:n merkillä siirtyy tilasta toiseen, sen täytyy kulkea jonkin tilan kautta (ainakin) kaksi kertaa itse asiassa jo x:n n:n ensimmäisen merkin aikana. Olkoon q ensimmäinen toistettu tila. Olkoon u M:n käsittelemä x:n alkuosa sen tullessa ensimmäisen kerran tilaan q, v se osa v x:stä jonka M käsittelee ennen ensimmäistä u q w paluutaan q:hun, ja w loput x:stä. Tällöin on uv n, v 1, ja uv i w A kaikilla i = 0, 1, 2,... u Esimerkki. Tarkastellaan em. sulkulausekekieltä (merk. ( = a, ) = b): q v w L = L match = {a k b k k 0}. Oletetaan, että L olisi säännöllinen. Tällöin pitäisi pumppauslemman mukaan olla jokin n 1, jota pitempiä L:n merkkijonoja voidaan pumpata. Valitaan x = a n b n, jolloin x = 2n > n. Lemman mukaan x voidaan jakaa pumpattavaksi osiin x = uvw, uv n, v 1; siis on oltava u = a i, v = a j, w = a n (i+j) b n, i + j n, j 1. Mutta esimerkiksi 0-kertaisesti pumpattaessa: uv 0 w = a i a n (i+j) b n = a n j b n L. Siten L ei voi olla säännöllinen. 3. KIELIOPIT JA MERKKIJONOJEN TUOTTAMINEN Kielioppi = muunnossysteemi merkkijonojen (kielen sanojen ) tuottamiseen tietystä lähtöjonosta alkaen, osajonoja toistuvasti annettujen sääntöjen mukaan uudelleenkirjoittamalla. Kielioppi on yhteydetön, jos kussakin uudelleenkirjoitusaskelessa korvataan yksi erityinen muuttujat. välikesymboli jollakin siihen liitetyllä korvausjonolla, ja korvaus voidaan aina tehdä symbolia ympäröivän merkkijonon rakenteesta riippumatta. Sovelluksia: rakenteisten tekstien kuvaaminen (esim. ohjelmointikielten BNF-syntaksikuvaukset, XML:n DTD/Schema-määrittelyt), yleisemmin rakenteisten olioiden kuvaaminen (esim. syntaktinen hahmontunnistus).

Yhteydettömillä kieliopeilla voidaan kuvata (tuottaa) myös ei-säännöllisiä kieliä. Esimerkki: yhteydetön kielioppi kielelle L match (lähtösymboli S): (i) S ε, (ii) S (S). Esimerkiksi merkkijonon ((())) tuottaminen: S (S) ((S)) (((S))) (((ε))) = ((())). Toinen esimerkki: kielioppi C-tyyppisen ohjelmointikielen aritmeettisille lausekkeille (yksinkertaistettu). E T E + T T F T F F a (E). Esimerkiksi lausekkeen (a + a) a tuottaminen: E T T F F F (E) F (E + T) F (T + T) F (F + T) F (a + T) F (a + F) F (a + a) F (a + a) a. Määritelmä 3.1 Yhteydetön kielioppi on nelikko missä V on kieliopin aakkosto; = (V, Σ, P, S), Σ V on kieliopin päätemerkkien joukko; sen komplementti N = V Σ on kieliopin välikemerkkien t. -symbolien joukko; P N V on kieliopin sääntöjen t. produktioiden joukko; S N on kieliopin lähtösymboli. Produktiota (A, ω) P merkitään tavallisesti A ω. Merkkijono γ V tuottaa t. johtaa suoraan merkkijonon γ V kieliopissa, merkitään γ γ jos voidaan kirjoittaa γ = αaβ, γ = αωβ (α, β, ω V, A N), ja kieliopissa on produktio A ω. Jos kielioppi on yhteydestä selvä, voidaan merkitä γ γ. Merkkijono γ V tuottaa t. johtaa merkkijonon γ V kieliopissa, merkitään γ γ jos on olemassa jono V :n merkkijonoja γ 0, γ 1,...,γ n (n 0), siten että γ = γ 0 γ 1... γ n = γ. Erikoistapauksena n = 0 saadaan γ γ millä tahansa γ V. Jälleen, jos on yhteydestä selvä, voidaan merkitä γ γ.

Esimerkiksi tasapainoisten sulkujonojen muodostaman kielen L match = {( k ) k k 0} tuottaa kielioppi Merkkijono γ V on kieliopin lausejohdos, jos on S γ. Pelkästään päätemerkeistä koostuva :n lausejohdos x Σ on :n lause. Kieliopin tuottama t. kuvaama kieli koostuu :n lauseista: L() = {x Σ S x}. Formaali kieli L Σ on yhteydetön, jos se voidaan tuottaa jollakin yhteydettömällä kieliopilla. match = ({S, (, )}, {(, )}, {S ε, S (S)}, S). Yksinkertaisten aritmeettisten lausekkeiden muodostaman kielen L expr tuottaa kielioppi missä expr = (V, Σ, P, E), V = {E, T, F, a, +,, (, )}, Σ = {a, +,, (, )}, P = {E T, E E + T, T F, T T F, F a, F (E)}. Toinen kielioppi kielen L expr tuottamiseen on missä V = {E, a, +,, (, )}, Σ = {a, +,, (, )}, P expr = (V, Σ, P, E), = {E E + E, E E E, E a, E (E)}. Huom: Vaikka kielioppi expr näyttää yksinkertaisemmalta kuin kielioppi expr, sen ongelmana on ns. rakenteellinen moniselitteisyys, mikä on monesti ei-toivottu ominaisuus. Vakiintuneita merkintätapoja Välikesymboleita: A, B, C,...,S, T. Päätemerkkejä: kirjaimet a, b, c,...,s, t; numerot 0, 1,...,9; erikoismerkit; lihavoidut tai alleviivatut varatut sanat (if, for, end,... ). Mielivaltaisia merkkejä (kun välikkeitä ja päätteitä ei erotella): X, Y, Z. Päätemerkkijonoja: u, v, w, x, y, z. Sekamerkkijonoja: α, β, γ,...,ω.

Produktiot, joilla on yhteinen vasen puoli A, voidaan kirjoittaa yhteen: joukon sijaan kirjoitetaan A ω 1, A ω 2,... A ω k A ω 1 ω 2... ω k. Kielioppi esitetään usein pelkkänä sääntöjoukkona: A 1 ω 11... ω 1k1 A 2 ω 21... ω 2k2. A m ω m1... ω mkm. Tällöin päätellään välikesymbolit edellisten merkintäsopimusten mukaan tai siitä, että ne esiintyvät sääntöjen vasempina puolina; muut esiintyvät merkit ovat päätemerkkejä. Lähtösymboli on tällöin ensimmäisen säännön vasempana puolena esiintyvä välike; tässä siis A 1. Eräitä konstruktioita Olkoon L(T) välikkeestä T johdettavissa olevien päätejonojen joukko. Olkoon meillä produktiokokoelma P, jossa ei esiinny välikettä A, ja jolla B:stä voidaan johtaa L(B) (ja vastaavasti C:stä L(C)). Lisäämällä P:hen jokin seuraavista produktioista saadaan uusia kieliä: produktio kieli A B C A BC A AB ɛ (vasen rekursio) tai A BA ɛ (oikea rekursio) yhdiste L(A) = L(B) L(C) katenaatio L(A) = L(B)L(C), ja Kleenen sulkeuma L(A) = L(B) Välikkeiden keskeisupotus on yhteydettömille kieliopeille ominainen konstruktio, joka tekee usein (muttei aina) kielestä epäsäännöllisen: lisäämällä produktio A BAC ɛ saadaan L(A) = L(B) i L(C) i. i=0 3.2 Säännölliset kielet ja yhteydettömät kieliopit Yhteydettömillä kieliopeilla voidaan siis kuvata joitakin ei-säännöllisiä kieliä (esimerkiksi kielet L match ja L expr ). Osoitetaan, että myös kaikki säännölliset kielet voidaan kuvata yhteydettömillä kieliopeilla. Yhteydettömät kielet ovat siten säännollisten kielten aito yliluokka. Yhteydetön kielioppi on oikealle lineaarinen, jos sen kaikki produktiot ovat muotoa A ab tai A ε, ja vasemmalle lineaarinen, jos sen kaikki produktiot ovat muotoa A Ba tai A ε. Osoittautuu, että sekä vasemmalle että oikealle lineaarisilla kieliopeilla voidaan tuottaa täsmälleen säännölliset kielet, minkä takia näitä kielioppeja nimitetään myös yhteisesti säännöllisiksi. Todistetaan tässä väite vain oikealle lineaarisille kieliopeille.

Lause 3.1 Jokainen säännöllinen kieli voidaan tuottaa oikealle lineaarisella kieliopilla. Todistus. Olkoon L aakkoston Σ säännöllinen kieli, ja olkoon M = (Q, Σ, δ, q 0, F) sen tunnistava (deterministinen tai epädeterministinen) äärellinen automaatti. Muodostetaan kielioppi M, jolla on L( M ) = L(M) = L. Kieliopin M pääteaakkosto on sama kuin M:n syöteaakkosto Σ, ja sen välikeaakkostoon otetaan yksi välike A q kutakin M:n tilaa q kohden. Kieliopin lähtösymboli on A q0, ja sen produktiot vastaavat M:n siirtymiä: (i) kutakin M:n lopputilaa q F kohden kielioppiin otetaan produktio A q ε; (ii) kutakin M:n siirtymää q a q (so. q δ(q, a)) kohden kielioppiin otetaan produktio A q aa q. Konstruktion oikeellisuuden tarkastamiseksi merkitään välikkeestä A q tuotettavien päätejonojen joukkoa L(A q ) = {x Σ A q M x}. Induktiolla merkkijonon x pituuden suhteen voidaan osoittaa, että kaikilla q on Erityisesti on siis x L(A q ) joss (q, x) (q f, ε) jollakin q f F. M L( M ) = L(A q0 ) = {x Σ (q 0, x) (q f, ε) M jollakin q f F } = L(M) = L. Esimerkki. Automaatti: a, b b b Lause 3.2 Jokainen oikealle lineaarisella kieliopilla tuotettava kieli on säännöllinen. Todistus. Olkoon = (V, Σ, P, S) oikealle lineaarinen kielioppi. Muodostetaan kielen L() tunnistava epädeterministinen äärellinen automaatti M = (Q, Σ, δ, q S, F) seuraavasti: M :n tilat vastaavat :n välikkeitä: Vastaava kielioppi: A 1 aa 1 ba 1 ba 2 A 2 ε ba 2. Q = {q A A V Σ}. M :n alkutila on lähtösymbolia S vastaava tila q S. M :n syöteaakkosto on :n pääteaakkosto Σ. M :n siirtymäfunktio δ jäljittelee :n produktioita siten, että kutakin produktiota A ab kohden automaatissa on siirtymä a q A qb (so. q B δ(q A, a)).

M :n lopputiloja ovat ne tilat, joita vastaaviin välikkeisiin liittyy :ssä ε-produktio: F = {q A Q A ε P}. Konstruktion oikeellisuus voidaan jälleen tarkastaa induktiolla :n tuottamien ja M :n hyväksymien merkkijonojen pituuden suhteen.