TIEA24 Automaatit ja kieliopit, syksy 206 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 9. lokakuuta 206
Sisällys
Kolme laskennan mallia kuvitteellisia (abstrakteja) koneita eli automaatteja lukevat syötteen vastaavat kyllä tai ei merkkijonotulostus ym. mahdollista mutta sivuutetaan tällä kurssilla interaktiivisuus sivuutetaan tällä kurssilla erona käytettävissä oleva muisti
Automaatit etukäteen rajattu muistin kapasiteetti pino äärellinen muisti lisäksi LIFO-periaatteella toimiva rajoittamaton pinomuisti Turingin koneet / RA-koneet äärellinen muisti lisäksi rajoittamaton nauhamuisti / hajasaantimuisti Korjattu 9.0.206 klo 8:40. Korjaus merkitty punaisella.
Äärelliset tehokas merkkijonohaku, jos haku kohdistetaan isoon valmistelemattomaan aineistoon hakuehto on monimutkaisempi kuin pelkkä sana tai fraasi regexpit (takaisinviittauksia lukuunottamatta) käännettävissä äärellisiksi automaateiksi verkkoprotokollien mallinnukseen Ks. esim. RFC 350, sivu 5 pelin NPC:iden toiminnan ohjelmointi 2 variantteja käytössä mm. suomen kielen oikeinkirjoituksen tarkistimissa 2 Ks. esim. Alexander Nareyek: AI in Computer Games. Queue (0), 59 65, 2004.
Automaatit ja kieliopit Kielioppityyppi yleinen kielioppi (tyyppi 0) kontekstiton kielioppi (tyyppi 2) säännollinen kielioppi (tyyppi 3) Automaattityyppi Turingin kone pinoautomaatti äärellinen automaatti
Käsiteanalyysiä Tarkastellaan koodilukkoa äärellisenä automaattina.
Deterministinen äärellinen automaatti (DFA) Deterministisen äärellisen automaatin 3 kuvaukseen kuuluu automaatille mahdollisesti tulevien ärsykkeiden (merkit) luettelo automaatin tilojen luettelo yhden tilan merkitseminen alkutilaksi mahdollisesti joidenkin tilojen merkitseminen hyväksyviksi (eli lopputiloiksi) siirtymien (tilasta toiseen) luettelointi siirtymään liittyy aina jokin merkki jokaisesta tilasta lähtee täsmälleen yksi siirtymä per merkki 3 engl. deterministic finite automaton, deterministic finite-state machine
Äärellinen automaatti graafisesti hyväksyvä tila esitetään kaksoisviivalla ympyröitynä muut tilat esitetään yhdellä viivalla ympyöritynä alkutila merkitään piirtämällä siihen ei-mistään tuleva nuoli alkutila voi olla hyväksyvä tila! tilasiirtymä esitetään merkillä varustettuna nuolena tilasta toiseen q 0 tilasiirtymä a q q 2 alkutila muu tila hyväksyvä tila
Huomaa graafiesityksestä Koska jokaisesta tilasta on täsmälleen yksi siirtymä jokaiselle merkille, pitäisi periaatteessa myös jokaisesta ympyrästä olla nuoli jokaiselle merkille. Käytännössä usein jätetään osa nuolista merkitsemättä. Tulkintasääntö Jos automaatin graafiesityksessä ei ole näkyviin piirretty kaikkia tilasiirtymiä, vievät puuttuvat siirtymät ns. hylkäystilaan tila joka ei ole hyväksyvä ja josta kaikki siirtymät vievät takaisin siihen itseensä. Hylkäystilaa ei yleensä piirretä näkyviin.
Äärellinen automaatti siirtymätaulukkona kaksiulotteinen taulukko sarakkeilla merkit riveillä tilat alkutila merkitään nuolella lopputilat merkitään tähdellä taulukon rivillä q ja sarakkeella c on tila q tulkitaan siirtymäksi tilasta q merkillä c tilaan q Myös mahdollinen hylkäystila ja siirtymät siihen on merkittävä näkyviin.
JFLAP http://www.jflap.org/ automaattien piirtämiseen ja kokeiluun melko kankea mutta toimii käyttäminen vapaaehtoista HUOM! Se, että JFLAP antaa piirtää jonkinlaisen automaatin ei takaa, että ko. automaatti täyttää tällä kurssilla asetetut määritelmät! JFLAPissa on käytössä hieman laajempi DFA:n määritelmä kuin tällä kurssilla lataa versio 7 ohjelman kotisivuilta ei ole valmiiksi asennettu mikroluokkiin käynnistyy komentoriviltä komennolla java -jar JFLAP.jar vaihda Preferences Set the empty string character ε:ksi
Matemaattinen määritelmä Määritelmä Viisikko (Q, Σ, δ, q 0, F) on deterministinen äärellinen automaatti (DFA), jos Q on äärellinen (tilojen) joukko, Σ on äärellinen, epätyhjä joukko (merkistö), δ : Q Σ Q pätee (siirtymäfunktio), q 0 Q pätee (alkutila) ja F Q pätee (hyväksyvät tilat). Huomioita Olennaista on, että kyseessä on viisikko, jonka alkioilla on mainitut ominaisuudet. Yllä käytetyt merkinnät Q, Σ, δ, q 0 ja F ovat vakiintuneita, mutta asia ei muutu miksikään, vaikka merkinnät vaihtaisi toisiksi.
Äärellisen automaatin käyttäytyminen Automaatti käynnistyy alkutilassaan. Kun automaatille tulee ärsyke (syötemerkki), se siirtyy nykyisestä tilasta seuraavaan. Käytännössä automaatin siirtyminen tilaan voi herättää jonkin toiminnan (sivuvaikutus). Teoriassa sivuvaikutukset sivuutetaan. Teoriassa ja tietyissä sovelluksissa automaatin ajatellaan tarkastavan (äärellisiä) merkkijonoja. Automaatille annetaan syötteeksi merkkijono siten, että kukin merkki annetaan vuorollaan automaatille ärsykkeeksi. Kun syötejono päättyy, merkkijonon luokka määräytyy silloisen tilan mukaan. Automaatti hyväksyy merkkijonon, jos päättymishetken tila oli hyväksyvä, ja muuten hylkää sen.
Esimerkki taululla 0 0 2 0 0 3 0 0 0 2 3 0 2 0 3 3 2 w = 000 v = 00 u = 000
Automaatin ymmärtäminen Automaatin tilat ovat automaatin muisti: Se, että automaatti on jossakin tilassa, kertoo jotain siitä, minkälainen syötteenä oleva merkkijono on tähän asti ollut. Kannattaa aina selvittää, mitä kukin tila automaatille kertoo! Aiemmin tuntemattoman automaatin toiminnan selvittämisessä tilojen muistitehtävän selvittäminen on erittäin tärkeä!
Minkälaiset merkkijonot tämä automaatti hyväksyy? 0 0 2 0 0 0 3
(merkkijonokäsittely) DFA koodataan yleensä silmukaksi, joka käy syötemerkkijonon läpi merkki kerrallaan. Tiloille annetaan numerot. Kulloinkin voimassa oleva tila tallennetaan muuttujaan. Iteraation alussa hypätään switch case-rakenteella tilamuuttujan osoittamaan tilaan. Kunkin tilan kohdalla valitaan syötemerkin perusteella, mikä tila laitetaan muuttujaan seuraavaksi. Syötteen loputtua katsotaan, ollaanko hyväksyvässä tilassa vai ei.
Vaihtoehtoisia ratkaisuja Switch casen sijasta voidaan käyttää taulukkoa, josta luetaan seuraavan tilan numero. Ei suoraan mahdollista tilasta riippuvan sivuvaikutuksen koodausta. Tilamuuttujan sijasta käytetään goto-lausetta tilasiirtymän toteuttamiseen. Tämä on yksi harvoista tilanteista, joissa goton käytössä on järkeä. Ei sovellu kieliin, joissa ei ole goto-lausetta... Tilamuuttujan ja silmukan sijasta koodataan kukin tila omaksi aliohjelmakseen. Tilasiirtymä toteutetaan funktiokutsulla. ÄLÄ KÄYTÄ kielissä, jotka eivät takaa ns. häntäkutsun poistoa Mm. C, C++, Java eivät sovellu. Kätevä temppu funktiokielissä (Scheme, Haskell, ML).
Automaatti oliona Ärsykkeenä metodikutsu. Tila tallennetaan attribuutiksi. Tilasiirtymät voidaan toteuttaa switch-case- tai taulukkoperiaatteella.
Esimerkkiohjelman automaatti 0 0 2 0 0 3 0 0 0 2 3 0 2 0 3 3 2