Kommunikaatio MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly 2.11.2016 Visa Linkiö The document can be stored and made available to the public on the open internet pages of Aalto University. All other rights are reserved.
Kommunikaatio Doing by talking: Kommunikaatiolla pyritään muuttamaan toisen pelaajan toimintaa Talking by doing: Oma toiminta paljastaa toiselle pelaajalle uutta informaatiota
Doing by talking
Doing by talking: Cheap talk Kommunikaatiolla ei hintaa Mahdollisuus kommunikoida ennen pelaamista
Doing by talking: Cheap talk Yhteistyöpeli B: Öljy B: Rakennus A: Öljy 1,1 0,0 A: Rakennus 0,0 1,1 Herra Kalaisa (A) ja Rouva Varjoisa (B) valitsevat konsultointialaa. He ovat vanhoja tuttuja, joilla on toisiaan täydentävät taidot.
Doing by talking: Cheap talk Yhteistyöpeli B: Öljy B: Rakennus A: Öljy 1,1 0,0 A: Rakennus 0,0 1,1 A kommunikoi B:lle aikovansa öljyalalle. Viesti on sitova (self-committing) ja paljastava (self-revealing), koska A:n kannattaa nyt valita öljyala ja B tietää A:n aikeen Myös B:n kannattaa nyt valita öljyala Kommunikaatio vaikuttaa peliin (revealing equilibrium)
Doing by talking: Cheap talk Vangin Dilemma B: Vasikoi B: Hiljaa A: Vasikoi -3,-3 0,-5 A: Hiljaa -5,0-1,-1 Herra Kalaisa (A) ja Rouva Varjoisa (B) ovat syytettyinä öljynporausalalla tapahtuneesta huijauksesta
Doing by talking: Cheap talk Vangin Dilemma B: Vasikoi B: Hiljaa A: Vasikoi -3,-3 0,-5 A: Hiljaa -5,0-1,-1 A kommunikoi B:lle aikovansa olla hiljaa. A toivoo saavansa B:n olemaan hiljaa B tietää, että A:n kannattaa silti vasikoida Viesti ei ole sitova eikä paljastava Kumpikin vasikoi => -3,-3 Kommunikaatio ei vaikuta peliin (babbling equilibrium)
Talking by doing
Talking by doing: Signalointipeli Laajennettu peli, jossa B:llä epätäydellinen informaatio Luontoäiti valitsee pelin yleisesti tunnetusta jakaumasta Pelaaja A tietää, mikä peli on valittu, pelaaja B ei A pelaa ensin Kuinka pelaaja B arvaa pelattavan pelin? A tietää, että B yrittää arvata peliä A:n valinnan perusteella
Talking by doing: Signalointipeli Esimerkki Peli 1 B: L B: R A: U 4,-4 1,-1 A: D 3,-3 0,0 Peli 2 B: L B: R A: U 1,-1 3,-3 A: D 2,-2 5,-5 Herra Kalaisa (A) ja Rouva Varjoisa (B) opiskelevat vankilassa peliteoriaa muiden talousrikollisten kanssa Pelit 1 ja 2 yhtä todennäköisiä Pelissä 1 A:lla paremmat tuotot valitsemalla U Pelissä 2 A:lla paremmat tuotot valitsemalla D
Talking by doing: Signalointipeli Esimerkki Peli 1 B: L B: R A: U 4,-4 1,-1 A: D 3,-3 0,0 Peli 2 B: L B: R A: U 1,-1 3,-3 A: D 2,-2 5,-5 Oletetaan, että A valitsee pelissä 1 U ja pelissä 2 D B:n parhailla vasteilla saadaan (U,R) ja (D,L) Tällöin A:n odotettu tuotto 0.5*1 + 0.5*2 = 1.5
Talking by doing: Signalointipeli Esimerkki Peli 1 B: L B: R A: U 4,-4 1,-1 A: D 3,-3 0,0 Peli 2 B: L B: R A: U 1,-1 3,-3 A: D 2,-2 5,-5 Mitä jos A pelaakin aina D? Jos B toimii kuten edellä, päädytään aina pelaamaan (D,L) Tällöin A:n odotettu tuotto on aiempaa parempi 0.5*3 + 0.5*2 = 2.5 > 1.5 Hyödyntämällä informaatiotaan A voi menettää sen suoman edun
Puhetoimitus Puhetoimitus tai puheakti (speech-act theory, Austin 1962) Lausuma, joka ei totea asiantiloja vaan muuttaa niitä Puhetoimituksen tekijällä oltava valtuudet kyseiseen toimeen Esimerkki: Julistan teidät aviopuolisoiksi. Esimerkki: Lyön 5 :sta vetoa, että... ja Sovittu.
Puhetoimitus Doing by talking ja talking by doing pohjautuvat peliteoriaan Toimivat sekä yhteistyö- että kilpailutilanteissa Puhetoimitus pohjautuu filosofiaan ja lingvistiikkaan Toimii yhteistyötilanteissa Puheella muutetaan asioita => Muistuttaa doing by talking yhteistyöpeliä
Keskustelun periaatteet Ihmiset pyrkivät ymmärtämään ja tulemaan ymmärretyiksi => yhteistyö Keskustelun periaatteet (Grice 1967) 1. Määrä: puhuja ei saa kertoa liikaa eikä liian vähän 2. Laatu: puhuja uskoo kertomaansa 3. Yhtenäisyys: puhuja pysyy asiassa 4. Tapa: puhuja välttää moniselitteisyyttä Kuulija olettaa puhujan noudattavan näitä periaatteita
Keskustelun periaatteet Esimerkki Väite: New Yorkissa joku pahoinpidellään 10min välein. Merkitään mahdollisia tulkintoja s: Eri henkilö pahoinpidellään 10min välein t: Sama henkilö pahoinpidellään 10min välein Kuvataan laajennettuna pelinä, jossa Luontoäiti N valitsee todellisen tilanteen vaihtoehtojen s ja t välillä. A tietää Luontoäidin valinnan ja haluaa kommunikoida sen B:lle sanomalla p: Joku pahoinpidellään 10min välein. q: Eri henkilö pahoinpidellään 10min välein. r: Sama henkilö pahoinpidellään 10min välein.
Keskustelun periaatteet Esimerkki s: Eri henkilö pahoinpidellään 10min välein t: Sama henkilö pahoinpidellään 10min välein p: Joku pahoinpidellään 10min välein. q: Eri henkilö pahoinpidellään 10min välein. r: Sama henkilö pahoinpidellään 10min välein. A pyrkii kommunikoimaan informaation mahdollisimman kompaktisti (Grice, määrän periaate). => Suurin tuotto, kun A sanoo p ja B ymmärtää merkityksen. => Pienin tuotto, kun B ei ymmärrä merkitystä oikein.
Keskustelun periaatteet Esimerkki s: Eri henkilö pahoinpidellään 10min välein t: Sama henkilö pahoinpidellään 10min välein p: Joku pahoinpidellään 10min välein. q: Eri henkilö pahoinpidellään 10min välein. r: Sama henkilö pahoinpidellään 10min välein. Tasapainoja: 1. A sanoo q, kun s, ja r, kun t. 2. A sanoo p, kun s, ja r, kun t. B olettaa s kuullessaan p. => Kumpikin luonnollisia ihmiselle
Sovelluskohteet Älykkäät dialogijärjestelmät keskustelu ihmisten kanssa luonnollisilla kielillä Työnkulun ohjausjärjestelmät Monimutkaiset vuorovaikutukset ihmisorganisaatioiden sisällä ja välillä Agenttien välinen kommunikointi Keskustelun periaatteille pohjautuvia ohjelmointikieliä on ehdotettu Tällöin ohjelmointi siirtyisi olio-ohjelmoinnista kohti agenttiohjelmointia (ks. rationaalinen ohjelmointi)
Terminologia Doing by talking = Kommunikaatiolla pyritään vaikuttamaan muiden pelaajien toimintaan Talking by doing = Valinnoilla voidaan kommunikoida uutta tietoa muille pelaajille Cheap talk = Maksuton kommunikointi Sitova (self-committing) = Viestin lähettäminen (olettaen, että lähettäjä uskoo vastaanottajan uskovan sen) määrää lähettäjän optimaalisen valinnan Paljastava (self-revealing) = Vistin lähettäminen paljastaa lähettäjän tulevan valinnan Revealing equilibrium = Tasapaino, joka saavutetaan, kun lähetetään sitova ja paljastava viesti Babbling equlibrium = Tasapaino, joka saavutetaan, kun lähetetyt viestit jätetään huomiotta Signalointipeli (signaling game) = Kahden pelaajan laajennettu peli, jossa toisella pelaajalla on epätäydellinen informaatio Puhetoimitus, puheakti (speech-act theory) = Lausuma, joka ei totea asiantiloja vaan muuttaa niitä Gricen keskustelun periaatteet (Gricean maxims) = Periaatteet, joita puhujan oletetaan noudattavan tullakseen ymmärretyksi Rationaalinen ohjelmointi (rational programming) = Ohjelmointikieleen sisällytetään rationaalisuutta mm. hyödyntäen puhetoimitusteoriaa
Kotitehtävä: Spencen signalointipeli Herra Kalaisa päättää kouluttautua uudelle alalle. Luontoäiti on arponut hänelle hyvät tai huonot taidot kyseiselle alalle. Analysoi Spencen signalointipelin (kirjan s. 228/241) avulla, pitäisikö Herra Kalaisan hakeutua helppoon vai vaativaan koulutusohjelmaan. Halutessasi voit myös spekuloida, mikä on Herra Kalaisan tarinan opetus.