Johdatus kieliteknologiaan Luku 5: Vuorovaikutus luonnollisella kielellä ihmisen ja koneen välillä

Samankaltaiset tiedostot
Johdatus kieliteknologiaan Luku 5: Vuorovaikutus luonnollisella kielellä ihmisen ja koneen

Johdatus kieliteknologiaan Luku 6: Kielenoppimisen ja -opettamisen kieliteknologia

Alkukartoitus Opiskeluvalmiudet

Kielen ymmärtäminen kieliteknologian näkökulmasta. Kimmo Koskenniemi täysinpalvellut kieliteknologian professori Helsingin yliopisto

Johdatus Ohjelmointiin

Luonnollisella kielellä keskustelevat järjestelmät

Tietotekniikan valintakoe

Se mistä tilasta aloitetaan, merkitään tyhjästä tulevalla nuolella. Yllä olevassa esimerkissä aloitustila on A.

Eväitä yhteistoimintaan. Kari Valtanen Lastenpsykiatri, VE-perheterapeutti Lapin Perheklinikka Oy

Yllättävän, keskustelun aikana puhkeavan ristiriidan käsittely

PUHUMINEN Harjoit- Osaa KUULLUN YMMÄRTÄMINEN Harjoit-Osaa. pvm pvm pvm pvm TAITOTASO A1 Suppea viestintä kaikkien tutuimmissa tilanteissa

Oppilas keskustelee ryhmässä ja tuo esille mielipiteitään. Oppilas osallistuu luokan ja koulun ilmaisuesityksiin. Oppilas harjoittelee

TIEDONHAKU INTERNETISTÄ

Selkosanakirja sdfghjklöäzxcvbnmqwertyuiopåasdfghjklöäzxcvbnmq. Tietokoneet. wertyuiopåasdfghjklöäzxcvbnmqwertyuiopåasdfghjk 1.4.

MONOGRAFIAN KIRJOITTAMINEN. Pertti Alasuutari

Sairastuneiden ja omaisten kanssa keskusteleminen

Lisää pysähtymisaiheisia ongelmia

Tervetuloa selkoryhmään!

Juttutuokio Toimintatapa opettajan ja lapsen välisen vuorovaikutuksen tueksi

Englanti. 3. luokan keskeiset tavoitteet

3. Muuttujat ja operaatiot 3.1

Seuraavat kysymykset koskevat erilaisia tekijöitä, jotka liittyvät digitaaliseen mediaan ja digitaalisiin laitteisiin kuten pöytätietokoneet,

Rekursiolause. Laskennan teorian opintopiiri. Sebastian Björkqvist. 23. helmikuuta Tiivistelmä

SUBSTANTIIVIT 1/6. juttu. joukkue. vaali. kaupunki. syy. alku. kokous. asukas. tapaus. kysymys. lapsi. kauppa. pankki. miljoona. keskiviikko.

The OWL-S are not what they seem

Pia Hägglund, Pohjanmaan tulkkikeskus. Monikulttuurisuus ja perehdyttäminen

Perusarkkitehtuurin ja vuorovaikutuksen mallintamisen perusteita.

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting

AIKUISVÄESTÖN HYVINVOINTIMITTARI Minun elämäntilanteeni

Etäkoulu Kulkurin tieto- ja viestintätekniikan opetussuunnitelma

Sisällys. 3. Muuttujat ja operaatiot. Muuttujat ja operaatiot. Muuttujat. Operaatiot. Imperatiivinen laskenta. Muuttujat. Esimerkkejä: Operaattorit.

SUOMI L3-KIELEN OSAAMISTASON KUVAUKSET yläkoulu ja lukio

KIRJASTO. Lämmittely. Selitä sana. lainata varata kaukolaina palauttaa maksaa sakkoa. myöhästymismaksu. printata tulostaa.

Täydentäviä muistiinpanoja laskennan rajoista

Linkkitekstit. Kaikkein vanhin WWW-suunnitteluohje:

Systemaattinen apina ja miten se tehdään fmbt:llä


Perusopetuksen tieto ja viestintätekniikan käytön taitotavoitteet

Lefkoe Uskomus Prosessin askeleet

Siltaaminen: Piaget Matematiikka Inductive Reasoning OPS Liikennemerkit, Eläinten luokittelu

Johdatus kieliteknologiaan Luku 5: Kielen kääntämisen apuvälineet ja automaattinen kielen kääntäminen

Puhumaan oppii vain puhumalla.

Kiinan kursseilla 1 2 painotetaan suullista kielitaitoa ja kurssista 3 alkaen lisätään vähitellen myös merkkien lukemista ja kirjoittamista.

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 31. maaliskuuta 2011

Ohjelmointi 1. Kumppanit

Yhtälönratkaisusta. Johanna Rämö, Helsingin yliopisto. 22. syyskuuta 2014

ARVI-järjestelmän ohje arvioinnin syöttäjälle

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Berlitzin taitotaso 1 CEF-taso A 1

etunimi, sukunimi ja opiskelijanumero ja näillä

Puheenkäsittelyn menetelmät

Oppimistavoitematriisi

10 yleistä hakukoneoptimointivirhettä

Seuraavat kysymykset koskevat erilaisia tekijöitä, jotka liittyvät digitaaliseen mediaan ja digitaalisiin laitteisiin kuten pöytätietokoneet,

LoCCaM Riistakamerasovellus. Dimag Ky dimag.fi

Laskennan rajoja. TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 20. kesäkuuta 2013 TIETOTEKNIIKAN LAITOS.

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 12. lokakuuta 2016

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

Hannu Mäkiö. kertolasku * jakolasku / potenssiin korotus ^ Syöte Geogebran vastaus

How to prepare for the 7th grade entrance exam? Kuinka lukea englannin linjan soveltuvuuskokeisiin?

Eye Pal Solo. Käyttöohje

SISÄLTÖ. Kehitä kuuntelutaitojasi Tarkista, kuulitko oikein Hyvät sanat avaavat korvat Kasvokkain

E-kirjan kirjoittaminen

KIELENOPPIJOITA TIEDONHANKINTA KESKIÖSSÄ KUUNTELEMALLA OPPIJA (AUDITIIVINEN) KIELEN KÄYTTÖ, VUOROVAIKUTUS NÄKEMÄLLÄ

KESKUSTELUTEHTÄVIÄ MATKUSTUS

naisille, jotka (työ)elämän neuvotteluissa.

1. Universaaleja laskennan malleja

Mistä on kyse ja mitä hyötyä ne tuovat?

HOW-TO: Kuinka saan yhdistettyä kaksi tulospalvelukonetta keskenään verkkoon? [Windows XP]

Kuinka tasa-arvoinen ruotsinsuomalainen nainen/mies on kotona?

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset

Turingin testin historia

ELM GROUP 04. Teemu Laakso Henrik Talarmo

Office ohjelmiston asennusohje

Luku 5 Kertaus. Tehtävä 1 Kerratkaa oppimanne asiat yhdessä keskustellen.

Lausuminen kertoo sanojen määrän

Käsitteistä. Reliabiliteetti, validiteetti ja yleistäminen. Reliabiliteetti. Reliabiliteetti ja validiteetti

Johdatus rakenteisiin dokumentteihin

Webinaarin osallistujan ohje

Kiipulan ammattiopisto. Liiketalous ja tietojenkäsittely. Erja Saarinen

Oppimistavoitematriisi

Laskennan rajoja. TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 6. maaliskuuta 2012 TIETOTEKNIIKAN LAITOS.

Järjestelmän asetukset. Asetustiedostojen muokkaaminen. Pääkäyttäjä eli root. Järjestelmänhallinnan työkalut

RATKAISUKESKEINEN TYÖSKENTELY ASIAKASTYÖSSÄ 1-2. Lasse Salmi

ILMO ilmoittautumisjärjestelmän käyttöohje. Toimi näin:

Tiivistelmä ostamisesta ja Suomalaisen Työn Liiton merkeistä Jokke Eljala

ARVO - verkkomateriaalien arviointiin

3. Laskennan vaativuusteoriaa

Harjoitustyön testaus. Juha Taina

Johdatus kieliteknologiaan Luku 5: Kielen kääntämisen apuvälineet ja automaattinen kielen kääntäminen

Minä luen sinulle. Tietoa ja vinkkejä lukuhetken järjestäjälle

Musiikkipäiväkirjani: Maalataan, kirjoitetaan ja luetaan musiikkia (PWR1) Valitaan värejä, kuvia tai symboleja erilaisille äänille.

Jos olet jo kirjautunut palveluun, näin pääset tilillesi: Anna sähköpostiosoitteesi ja salasanasi. Napsauta Sisäänkirjautuminen.

vaihtoehtoja TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho 13. lokakuuta 2016 TIETOTEKNIIKAN LAITOS

Tekstinkäsittelyn jatko. KSAO Liiketalous 1

Verkosta virtaa Vertaisopastajan opas. Vinkkejä vapaaehtoistyöhön laitteiden ja netin käytön vertaisopastajana

Palaute kirjasta: Copyright 2011 Talentum Media Oy ja tekijät. Kansi: Sanna-Reeta Meilahti Taitto: NotePad Ay,

HAAGA-HELIA ammattikorkeakoulu Lomakkeen tekeminen Google Docsilla

Laskennan rajoja. TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 10. joulukuuta 2015 TIETOTEKNIIKAN LAITOS.

Transkriptio:

Johdatus kieliteknologiaan Luku 5: Vuorovaikutus luonnollisella kielellä ihmisen ja koneen välillä Kimmo Koskenniemi 21. marraskuuta 2005 Sisältö 1 Yleistä 1 1.1 Miksi ylipäätänsä keskustella koneen kanssa?....................... 2 1.2 Keskustelu puhuen vai kirjoittaen?............................. 2 1.3 Koneen ja ihmisen yhteispeli................................ 3 2 Erilaisia vuorovaikutussovelluksia 3 2.1 Jutustelu koneen kanssa................................... 3 2.2 Laitteiden ohjaaminen ja sanelu.............................. 4 2.3 Tietokantaliitäntä ja senkaltaiset sovellukset........................ 4 2.4 Puheohjatut palvelut.................................... 5 3 Keskustelujärjestelmien menetelmät 5 3.1 Äärellistilainen vuorovaikutus............................... 5 3.2 Kehyksiin pohjautuva vuorovaikutus............................ 5 3.3 Agentteihin perustuva vuorovaikutus............................ 6 4 Vuorovaikutuksen kieliteknologiaa 6 5 Kysymys vastaus -järjestelmät 6 1 Yleistä Keskustelu tietokoneen kanssa, siis ihmisen ja tietokoneen välinen luonnollisella kielellä tapahtuva vuorovaikutus, on monella tavalla kiehtova haastava asia. Sitä voidaan kuitenkin tarkastella monelta taholta, eikä kyse ole vain yhdestä asiasta. 1

1.1 Miksi ylipäätänsä keskustella koneen kanssa? Tietokoneen käyttämisestä on tullut miljoonien arkipäivää, mutta koneen kanssa ei varsinaisesti keskustella, vaan sitä komennetaan näppäimillä tai hiirellä osoittamalla. Useat arkipäivän sovelluksista soveltuvatkin aivan hyvin näin ohjattaviksi. Tekstinkäsittelyssä näppäimistö on luonteva tapa syöttää tekstiä ja muotoilun virittämiseksi lopputuloksen näkeminen ruudulla ja tarvittavien kirjasintyylien ja muun muotoilun valitsemiseen hiiren avulla on totuttu. Yhtä lailla sähköpostin lukeminen on ohjattavissa näppäimillä ja hiirtä napsauttamalla, eikä verkkoselaimenkaan käyttö ole näillä keinoin mitenkään ongelmallista. Tarve luonnollisen kielen käyttämiseen vuorovaikutuksessa ei siten ole ilmeinen, vaan voi syntyä kahdesta syystä: (1) käyttäjä on poissa työpöytänsä äärestä ja hänellä on mukanaan vain niin pieni laite, että siinä ei ole kunnon näppäimistöä, hiirtä eikä isoa ruutua, tai (2) sovellus on aidosti mutkikkaampi ja erilainen kuin yllä mainitut vakiosovellukset. Edellinen tilanne koskee luonnollisesti matkapuhelinta, joka on pieni ja sille on hankala tehdä mitään muuta kuin puhua sille ja kuunnella sieltä puhetta. Useimmat sovellukset ovat luontaisesti vuorovaikutteisia, jos niitä ohjataan puheella. Näin siksi, että puheentunnistus on jonkin verran satunnaisesti epävarmaa ja on tarvetta varmistaa tulkintoja, mutta myös siksi että ihmiset eivät osaa eivätkä halua olla niin systemaattisia ja tarkkoja kysymyksissään ja vastauksissaan, kuin perinteinen tietojenkäsittely edellyttäisi. Ihmiset yksinkertaisesti turhautuisivat, jos heitä pakotettaisiin etenemään puheessaan yhtä kaavamaisesti kuin, mihin he ovat tottuneet graafisen käyttöliittymän kanssa. Yksi syy on siis yksinkertaisesti puheen käyttäminen koneen kanssa. Toinen mahdollinen syy luonnollista kieltä käyttävään vuorovaikutukseen koneiden kanssa on tehtävän laatu. Jos mahdollisuuksia on liian paljon, ei graafisella liitännällä ehkä ole helppo tuoda niitä tarjolle. Internetin hakukoneet toimivat monissa tehtävissä loistavasti kiinteillä hakuavainmilla, esim. nimillä, täysin ilman luonnollisella kielellä käytävää keskustelua. Toisia asioita puolestaan ei voisi ajatella löydettävän ilman useampivaiheista tarkentelua tai pidempää sanallista selitystä.. Matkapuhelimen lisäksi on monia erityisiä tehtäviä, joissa tekijän kädet ovat sidotut muuhun, eivätkä ole vapaana näppäimiin ja hiireen, vaikka sellaiset olisivat muuten saatavilla. Oman erityisen kenttänsä muodostavat vammaissovellukset. Sokealle tai näkövammaiselle ei ruudusta välttämättä ole apua, mutta puhe toimii ongelmitta suuntaan ja toiseen. 1.2 Keskustelu puhuen vai kirjoittaen? Ihminen voi keskustella tietokoneen kanssa joko tekstin tai puheen muodossa. Teknisesti olisi helpompaa toteuttaa vuorovaikutusta, jossa ihminen kirjoittaa vuorosanansa näppäimistöllä ja lukee koneen vastaukset tekstinä ruudulta. Käyttäjälle näppäily voi olla vaivalloisempaa, mutta viesti menee koneelle tarkasti sellaisena, kuin käyttäjä on sen näppäillyt. Puheentunnistus ja puhesynteesi ovat toki vaivalloisia toteutettavaksi. Vaikka sellaisia toimintoja onkin saatavilla, ihmiset eivät silti aina halua puhua koneelle. Esimerkiksi toimistossa ja kotonakin, on muita kuulemassa, ja puhekäyttöliittymä olisi kiusallinen ja moni mieluummin tekisi työtään omassa rauhassaan ilman, että muut kuulevat mitä ollaan tekemässä. Keskustelu puhumalla on luontevampaa kuin kirjoittamalla. Puheella on helppo antaa täydentäviä varsinkin lyhyitä ohjeita, lisäkysymyksiä, myöntäviä ja kieltäviä vastauksia ym. Puhe on aina vaihtelevaa, puhesignaali vähän epämääräistä ja siitäkin syystä puheentunnistus on jonkin verran epätarkkaa. Puhetta ei myöskään suunnitella niin huolellisesti kuin kirjallisa esitystä, joten usen sanotaan vain osa tarvittavasta asiasta ja sekin ehkä monitulkintaisesti. Puhekeskusteluun liitty siten olennaisesti tarvetta antaa erilaista palutetta ja herätettä tarvittavan asian edistämiseksi. 2

1.3 Koneen ja ihmisen yhteispeli Ollakseen ihmiselle miellyttävää, keskustelun tulee edetä tarkoituksenmukaisesti ja sujuvasti. Erityisen tärkeää on sopiva annostelu. Koneen tulee antaa ohjeita, tietoja ja vastauksia kohtuullisen kokoisia määriä kerrallaan ja tarpeem mukaan. Vaikka puheentunnistus on nykyisellään aina epätarkka, tätä epävarmuutta ei voida ratkaista pelkästään sillä, että käyttyäjän jokaisen vuorosanan jälkeen kone tarkistaa, onko se kuullut oikein. Käyttäjät nimittäin luultavasti hermostuvat tällaisesta ja pian luopuvat koko yrityksestä käyttää palvelua, joka ei tunnu pääsevän eteenpäin. Varmistuksen tuleekin usen olla epäsuoraa siten, että kone ei suinkaan kysy, sanoiko käyttäjä tietyllä tavalla, vaan varmistuksen voi myös sisällyttää epäsuorasti seuraaviin vuorosanoihin. Vuorovaikutusta on tapana kuvata siten, että meillä on kaksi keskustelevaa osapuolta ja kummallakin oma sisäinen tilansa, joka vähitellen muuttuu keskustelun kuluessa. Osapuolet eivät tiedä toistensa tiloja tarkalleen, mutta muodostavat oman likimääräisen arvioinsa toisen osapuolen tilasta, johon ne perustavat ratkaisunsa siitä, mitä seuraavaksi kannattaisi sanoa. Sisäiseen tilaan voidaan sisällyttää kaikenlaista: keskustelun historiaa, tähän mennessä koottua tietoa, käsitystä toisen kumppanin tilasta sekä erilaisia uskomuksia ja tietoja ympäröivästä maailmasta tai keskustelun kohteena olevasta teemasta. 2 Erilaisia vuorovaikutussovelluksia On ehkä hyödyllistä tarkastella myös sitä, millaista luonnollista kieltä käyttävä vuorovaikutus koneen kanssa voisi olla ja millaisia tarkoituksia varten sitä on kehitelty. 2.1 Jutustelu koneen kanssa Tietokoneohjelmoinnin teoreettisen kehittäjän Alan Turingin mielessä liikkui jo ennen varsinaisten kunnollisten tietokoneiden rakentamista kysymys siitä, vosiko tietokone keskustella kuten ihminen. Häneltä on peräisin (v. 1950 julkaistu) nyttemmin Turingin testin nimellä kulkeva koe, jolla pyritään arvioimaan keskustelevien tietokoneohjelmien hyvyyttä. Testi koskee nimenomaan vapaampaa, (mutta joskus tiettyyn aihepiiriin ehkä rajautuvaa) keskustelua. Tietokoneelle ohjelmoidun keskustelijan hyvyyttä arvioidaan sillä, kuinka varmasti tai todennäköisesti ulkopuolinen kyselijä voi erottaa oikean ihmisen tästä koneesta. Mittarina voidaan käyttää aikaa, jonka tällainen kyselijä tarvitseee saavuttaakseen tietyn onnistumisen asteen arvauksessaa. Turingin testin perusteella on vuodesta 1991 järjestetty vakavahenkisiä kilpailuja, joissa jaetaan joka vuosi ns. Loebnerin palkinto Turingin testissä parhaiten selviytyneelle tietokoneohjelmalle, ks. esim. http://www.loebner.net/prizef/loebner-prize.html Ennen näitä vuosittain järjestettäviä kilpailuita tehtiin muutamia samanhenkisiä ohjelmia, joiden sanotaan harhauttaneen käyttäjiä luulemaan ohjelmaa inhimiliseksi keskustelukumppaniksi. Tunnetuin näistä on Joseph Weizenbaumin ELIZA vuodelta 1966, josta on nykyäänkin on verkossa saatavissa uudelleen toteutettuja demoja ja lukuisia muunnelmia. ELIZA jäljitteli Rogerin oppisuunnan psykoterapeuttia eli käyttäjän odotettiin kertovan sille omista huolistaan, mutta ohjelman odotettiin vain hienovaraisesti auttavan ihmistä etenemään keskustelussa. ELIZA oli varsin yksinkertainen tietokoneohjelma ja sen menestys perustui enemmän siihen, että yhteistyöhön halukas ihminen tuotti omissa repliikeissään pääosan keskustelun materiaalista, jota ohjelma sitten syötti takaisin vähän valikoiden ja muunnellen. ELIZAn mallin mukaan on tuotettu paljon samantapaisia ohjelmia, (ks. yllämainittu verkko-osoite). 3

2.2 Laitteiden ohjaaminen ja sanelu Autoa ajettaessa pitäisi silmien olla tarkkaavaisesti seuraamassa liikennettä ja käsien kiinni ohjauspyörässä, mutta joitakin autossa olevia laitteita pitäisi silti voida käyttää. Hammaslääkärin tuolissa on myös paljon toimtoja, joita ei voi käsin käyttää samalla, kun molemmat kädet ovat kiinni instrumenteissa. Näihin tarkoituksiin puhekäyttöliittymä on mahdollinen ja tarkoituksenmukainen. Liitännässä tarvittava kieli voi olla hyvin redusoitua ja koostua rajallisesta määrästä etukäteen tiedettyjä komentoja. Laitteen ei tarvitse yksikertaisimmillaan oikeastaan muuta kuin toimia komennon mukaan. Vaativammissa sovelluksissa toki tarvitaan palautettakin. Tekstinkäsittelyä voidaan periaatteessa tehdä pelkästään äänen avulla. Silloin käyttäjän täytyy voida suorittaa kaikki muotolua ja korjailua koskevat komennot puheen avulla. Näiden toimintojen ohjaamista on toteutettu myös siten, että olemassa olevaa tekstinkäsittelyohjelmaa komennetaan sanallisilla komennoilla, jolloin palaute tulee ruudulla näkyvinä valikkoina samaan tapaan kuin näppäimiäkin käytettäessä. Siten yksittäiset hiiren napsautukset tai näppäilyt on vain korvattu saman toiminnon laukaisevalla komentosanalla. Laitteiden ja ohjelmien ohjaaminen voi tietysti olla tätä paljon monimutkaisempaa ja hienojakoisempaa, jolloin se muistuttaa tuonnempana lueteltavia sovelluksia. Tarkastellaan vielä esimerkiksi sitä, miten sokea voisi lukea päivän lehden. Puhesynteesillä tekstin voi saada ääneksi, mutta ei kukaan halua (eikä ehkä edes voi) lukea koko lehteä alusta loppuun. Sivujen silmäilyn sijasta tarvitaan paljonkin keskustelua. Koneen pitäisi varmaan varautua tarjoamaan vaihtoehtoja, esimerkiksi etusivua tai lehden eri osastoja. Ehkä isommista uutisista voisi tarjota otsikot ja antaa käyttäjän pyytää lisää niistä uutisista, jotka kiinnostavat. Jotkut kohdat, esimerkiksi taulukot ovat tekstissä oma haasteensa vuorovaikutukselle. Ei ole aivan selvää, miten puheen avulla voidaan välittää kuulijalle käsitys siitä, mitä taulukossa on nähtävissä. Tuskin yksi taitavakaan läpilukeminen voi riittää taulukon hahmottamiseen, vaan sellaisia varten täytyisi kai kehittää oma dialoginsa, jossa käyttäjä voi kysellä useilla tavoilla taulukon sisältöä. 2.3 Tietokantaliitäntä ja senkaltaiset sovellukset Eräs vanhimmista vuorovaikutteisisa sovelluksista on tietokantakysely. Siinäkin ihminen hoitaa kielen käytön ja kone vastaa tuloksilla. Ensimmäinen tämän lajin ohjelma lienee William Woodsin ATNkielioppiin (Augmented Transition Networks) perustuva LUNAR. Siinä oli taustalla Apollo-ohjelman kuukivien analyysien tietokanta, johon saattoi kohdistaa englanninkielisä kysymyksiä. Vastaukset olivat tyypillisesti lukumääriä tai näytteiden numeroiden luetteloita. Samaan tyyppiin tietokantojen käyttöliittymien kanssa voisi lukea sellaisiakin ohjelmia, joissa ei ole tietokantaa, vaan ohjelmallista tietämystä, esim. aritmetiikasta. Esimerkiksi Daniel Bobrowin v. 1968 raportoima STUDENT -niminen ohjelma osasi analysoida englanninkielisiä lauseita, joissa oli aritmeettisia suhteita ja tehdä niistä yhtälöitä, jotka se ratkaisi. Kokeilkaapa itse esim. seuraavaa, jonka STUDENT tiettävästi osasi: Mary is twice as old as Ann was when Mary was as old as Ann is now. If Mary is 24 years old, how old is Ann? STUDENT-ohjelma luultavasti ohitti syötteestä kaiken, mitä se ei voinut tunnistaa ja se oli varautunut tunnistamaan vain sellaisia osia ja jaksoja, joista voitiin muodostaa yhtälö, esim. M2 = 2 * A1 (Maryn ikä nyt on 2 * Annin ikä silloin), M2 = 24 (Mary on nyt 24 vuotias), M1 = A2 (Mary oli silloin yhtä vanha kuin Ann nyt), M2 - M1 = A2 - A1 (yleistä tietoa siitä, että he vanhenevat samaa tahtia). Neljä yhtälöä ja neljä tuntematonta on ratkeava yhtälöryhmä. 4

2.4 Puheohjatut palvelut Tyypillisiä puheojattuja sovelluksia ovat erilaiset aikatauluneuvonnat ja lipun tilaamiseen sovelletutu järjestelmät. Näistä eräs vanhimmista jäljitteli lentolippua myyvää matkatoimiston virkailijaa. Asiakkaan oletettiin haluavan ostaa lentolipun ja ohjelman tehtävänä oli kysellä asiakkaalta lippua varten tarvittavat tiedot kuten mistä ja minne, lähtöpäivä ja aika jne. Tyypillisesti asiakas saattoi oma-alotteisesti vastata enempäänkin kuin, mitä kysyttiin tai eri kysymykseen. Ohjelma keräsi tietoja ja kun kaikki tiedot oli saatu kokoon, lippu oli valmis myytäväksi. (Vrt. (Bobrow et al. 1977).) 3 Keskustelujärjestelmien menetelmät Vuorovakutteisten luonnollisen kielen keskustelujärjestelmien toteutukset perustuvat yksinkertaisempiin tai vaativampiin perusmalleihin. 3.1 Äärellistilainen vuorovaikutus Yksinkertaisimmillaan ihmisen ja koneen vuorovaikutus puheen avulla voi olla melko pelkistettyä. Esimerkiksi puheohjatulle puhelinvaihteelle sanotaan vain halutun henkilön nimi, jonka jälkeen vuorovaikutus on yleensä ohi ja vaihde yhdistää puhelun tuolle henkilölle. Äärellistilainen keskustelujärjestelmä pystyy tähän ja hieman yleisempään käsittelyyn, jossa keskustelu etenee yhden askeleen kerrallaan. Toimintaa voidaan havainnollistaa äärellistilaisella automaatilla, jonka siirtymistä tilasta toiseen kyseiset puheviestit ohjaavat. Yhdellä kertaa käyttäjän odotetaan sanovan yhden asian, ei enempää eikä mitään muuta. Jos siis kysytään, minne halutaan matkustaa, käyttäjän ei pidä kiiruhtaa asioiden edelle ja kertoa lisäksi, milloin haluaisi olla perillä. Riippuu siten sovelluksesta, kuinka hyvin käyttäjät voivat sopeutua tällaiseen vuoropuheluun. Puhelinvaihteen kanssa ei varmaan tule isoja ongelmia vaikka sovelletaan äärimmäisen yksinkertaista dialogin mallia. Sen sijaan esimerkiksi matkalippujen tilaamisessa käyttäjän lienee vaikeaa sopeutua näin suoraviivaiseen malliin, koska matkan koostaminen on aika mutkikas tehtävä, eikä käyttäjälle ole ilmeistä, mitä pitää tai saa sanoa kulloinkin. Käyttäjä itsekin vasta sommittelee ja suunnittelee matkaansa, eli kyse ei hänelle ole vain tietojen antamisesta. Äärellistilaiseen malliin liittyvä puheentunnistus on hyvin suoraviivaista: tilasiirtymät liittyvät kiinteisiin sanoihin tai fraaseihin, joiden vaihtoehdot ovat etukäteen tiedossa. Käyttäjän vuorosanaa verrataan näihin etukäteen varastoituihin vaihtoehtoihin ja valitaan niistä todennäköisin. (McTear 2002, s. 92 93, kohta 2.1 ja s. 96 98, kohta 3.1) 3.2 Kehyksiin pohjautuva vuorovaikutus Kehyksiin (frame) perustuva vuorovaikutus pyrkii hallitsemaan kattavammin koko keskustelutehtävän etenemistä. Tyypillisesti tarvitaan joukko tietoja, esim. lentolipun ostamista varten minne matkustetaan ja milloin sekä palataanko takaisin ja milloin. Käyttäjän puheesta pyritään noukkimaan esille jaksoja, jotka täyttäisivät tätä kehystä eli lokerikkoa, esim. juuri paikannimiä sopivan preposition kanssa tai sopivassa sijamuodossa tai vastaavasti päivämääriä ja kellonaikoja sekä lähtemistä tai saapumista koskevia ilmauksia (concept spotting). Niinpä suomenkielinen käyttäjän vuorosana minun olisi tarkoitus oikeastaan matkustaa Tukholmaan kokoukseen, jossa minulla on esitelmä voi järjestelmän kannalta redusoitua muotoon... Tukholmaan... Parhaassa tapauksessa yhdestä vuorosanasta voidaan saada irti useampikin hyödyllinen osanen. Kehyksen täyttyminen ja vielä vajaana olevat lokerot ohjaavat järjestelmän palautetta, jonka tarkoituksena on saada käyttäjältä puuttuvat tiedot. Koneen vuorosanat voivat silloin olla joustavan tuntuisia käyttä- 5

jän on helppo sopeutua dialogin kulkuun. (McTear 2002, s. 93 94, kohta 2.2 ja s. 98 100, kohta 3.2) 3.3 Agentteihin perustuva vuorovaikutus Edellä mainitut keskustelujärjestelmien tyypit ovat molemmat tarkkarajaisia sen suhteen, minkälaisiin repliikkeihin ne reagoivat. Kumpikin laji tietää vain siitä tehtävästä, jota varten ne nimenomaan on laadittu. Agenttipohjaisten järjestelmien ajatellaan tuntevan paitsi oman tehtävänsä, tietävän jossakin määrin ympäristöstään, jossa on toisia agentteja, jotka tekevät toisenlaisia tehtäviä. Kun yhdelle agentille tulee kysymys, joka menee sen toimialueen ulkopuolelle, agentin oletetaan ymmärtävän muista sen verran, että voivat tehdä valistuneita arvauksia siitä, mikä toinen agentti voisi olla asiakkaalle kenties hyödyllinen. Karkeasti ottaen kysymys on siitä, että tällainen järjestelmä (tai siinä oleva agentti) pyrkii olemaan hyödyllinen silloinkin, kun agentilta kysytään asioita, jotka eivät sille kuulu. (McTear 2002, s. 94, kohta 2.3 ja s. 100 103, kohta 3.3) 4 Vuorovaikutuksen kieliteknologiaa Tarvittavia tekniikoita voivat olla seuraavat: Puheentunnistus joko siinä muodossa että tunnistetaan vakiosanoja tai -fraaseja tai sitten sanoista yksinkertaisella kieliopilla yhdisteltävissä olevia lausekkeita. Näiden täydennyksenä sanojen tai lausekkeiden tunnistamista muun viestin keskeltä (word spotting, concept spotting). Yksinkertaistettuja kielioppeja ja jäsentimiä. Näitä tarvitaan kuvaamaan kyseisen tehtävän kannalta relevantti osa käyttäjän vuorosanoista. Dialogin hallinta, eli päätteleminen miten käyttäjän syöte muuttaa tilaa ja mitä seuraavaksi pitäisi tehdä. Suunnittelua siitä, minkä kokoinen annos olisi hyödyllisintä sijoittaa seuraavaan repliikkiin. Lauseiden ja vastausten generointi sanalliseen asuun em. suunnitelmasta. Puhesynteesi käsitteestä puheeksi (eikä niinkään tekstistä puheeksi) -muotoisena. Kerättyjen ja pääteltyjen tietojen varmistamisen ja tarkistamisen menettelytavat ja mitä tehdään, kun yritykset tulkita käyttäjän puheenvuoroa epäonnistuvat eli valistuneet arvaukset siitä, mistä suunnilleen saattaisi olla kyse, jne. 5 Kysymys vastaus -järjestelmät Kysymyksiin vastaava tietokoneohjelma on sukua toisaalta tiedonhakutehtävälle ja toisaalta dialogisovelluksille. Varsinaista dialogia niissä ei tarvitse olla, vaan yhteen kysymykseen riittää yksi vastaus. Yleensä tehtävä voidaan ajatella esimerkiksi sellaisena, että meillä on käytettävissä runsaasti dokumentteja, joissa on tietyltä alueelta oikeata tietoa. Tältä alueelsta järjestelmä pyrkii antamaan vastauksia ja vastaukset perustuvat vain siihen tekstiin, joka dokumenteissa on, vaikkakin tekstejä voidaan lyhennellä ja leikellä sopivamman vastauksen tuottamiseksi. Vastausjärjestelmäksi ei riitä tiedonhaku eli sellaisten dokumenttien löytäminen, jotka ovat relevantteja asian suhteen. Pitäisi löytää dokumentti, jossa on vastaus esitettyyn kysymykseen ja lisäksi eristää vastaus dokumentista. (McTear 2002, luku 31, ss. 560 582) 6

Viitteet Daniel G. Bobrow, Ronald M. Kaplan, Martin Kay, Donald A. Norman, Henry S. Thompson and Terry Winograd, GUS, A Frame-Driven Dialog System, Artificial Intelligence 8(2), pp. 155-173, 1977. Jonathan Harrington and Steve Cassidy, Techniques in Speech Acoustics, Kluwer Academic Publishers, 1999. Daniel Jurafsky and James H. Martin, Speech and Language Processing, Prentice Hall, NJ, 2000. Timo Lahtinen, Automatic indexing: an approach using an index term corpus and combining linguistic and statistical evidence, Publications, No. 34, Department of General Linguistics, University of Helsinki, 2000. Michael F. McTear, Spoken Dialogue Technology: Enabling the Conversational User Interface, ACM Computing Surveys, Vol 34, No. 1, March 2002, pp. 90 169. Michael F. McTear, Spoken Dialogue Technology: Towards the Conversational User Interface, Springer, 2004. Ruslan Mitkov (ed.), The Oxford Handbook of Computational Linguistics, Oxford University Press, 2003. Lawrence Rabiner and Biing-Hwang Juang, Fundamentals of Speech Recognition, Prentice Hall, NJ, 1993. 7