Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Samankaltaiset tiedostot
Opettaminen ja oppiminen

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Johdanto peliteoriaan Kirja kpl. 2

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Yhteistyötä sisältämätön peliteoria jatkuu

Nollasummapelit ja bayesilaiset pelit

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Yhteistyötä sisältämätön peliteoria

Signalointi: autonromujen markkinat

PELITEORIAN PERUSTEITA

Pohdiskeleva ajattelu ja tasapainotarkennukset

Signalointi: kustannukseton signalointi (halpa puhe)

SEKASTRATEGIAT PELITEORIASSA

Paljonko maksat eurosta -peli

Luento 5: Peliteoriaa

Pelien teoriaa: tasapainokäsitteet

Peliteoria luento 1. May 25, Peliteoria luento 1

Informaatio ja Strateginen käyttäytyminen

Fuusio vai konkurssi? Hintakilpailun satoa

Peliteoria luento 2. May 26, Peliteoria luento 2

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Peliteoria luento 3. May 27, Peliteoria luento 3

12 Oligopoli ja monopolistinen kilpailu

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Helpon suomen alkeet. Miten puhua niin, että kielenoppijakin ymmärtää? Salla Kurhila & Taija Udd, Suomen kieli ja kulttuuri, Helsingin yliopisto

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Investointimahdollisuudet ja niiden ajoitus

Luento 5: Peliteoria

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Luento 8. June 3, 2014

Yleinen tietämys ja Nashin tasapaino

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

Luento 9. June 2, Luento 9

Projektin arvon määritys

LukiMat verkkopalvelu % Niilo%Mäki%Ins0tuu3%

-kunniavieras tai troubleshoooter: kriittinen onnistuminen. Jos pelinjohtaja ei tunnista kumpiakaan, eivät hahmot voi onnistua kriittisesti.

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Y56 laskuharjoitukset 6

Diskreettiaikainen dynaaminen optimointi

Virtuaalinen flirttailupeli tytöille!

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

Asiakkaan kohtaaminen ja vuorovaikutus

URN: NBN:fi-fe

Agentit ja semanttinen web. Pekka Halonen

Sekastrategiat ja intensiiviyhteensopivuus

Winter Tour 2014 PariScramble Open Sports Coach -golfsimulaattorissa

Tietotekniikan laitoksen uusi linja

Peliteoria ja kalatalous YE4

Päämies-agentti-malli ja mekanismisuunnittelu

Tietämisestä ja uskomisesta

Board Game Lab. 7 Pelimekaniikat ja -systeemit. Materiaalit CC-BY 4.0 Mikko Lampi

Projektin arvon aleneminen

Evolutiivisesti stabiilin strategian oppiminen

Hintakilpailu lyhyellä aikavälillä

Tietoteoria. Tiedon käsite ja logiikan perusteita. Monday, January 12, 15

SISÄLTÖ Xbox LIVE... 2 OHJAUSKOMENNOT... 2 PELIN ALOITTAMINEN... 3 PELINÄYTTÖ... 4 ASIAKASTUKI... 5

Haitallinen valikoituminen: Kahden tyypin malli

Pelit matematiikan opetuksessa

Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17)

Berlitzin taitotaso 1 CEF-taso A 1

Tietotekniikan koulutusohjelman suuntautumisvaihtoehdot

Johdatus go-peliin. 25. joulukuuta 2011

Uusien keksintöjen hyödyntäminen

Winter Tour 2015 PariScramble Open ja Personal Open

Opettajatuutorointi-kurssin syksyn 2006 kyselyjen tulokset

SUBSTANTIIVIT 1/6. juttu. joukkue. vaali. kaupunki. syy. alku. kokous. asukas. tapaus. kysymys. lapsi. kauppa. pankki. miljoona. keskiviikko.

KODU. Lumijoen peruskoulu

Joonas Pihlajamaa Johtaja, Oikotie Työpaikat

Board Game Lab. 4 Teema. Materiaalit CC-BY 4.0 Mikko Lampi

Tavoite Opiskelija osaa käyttää englannin kielen rakenteita, hallitsee kielen perusilmaukset ja ymmärtää opiskelijan arkielämään liittyvää kieltä

Evolutiivinen stabiilisuus populaation

Harjoitussuunnitelma viikko 14 Potkaiseminen II

Trafficars - Ruuhkaara

CODEONLINE. Monni Oo- ja Java-harjoituksia. Version 1.0

Onnistut yrittämässäsi, mutta jokin täysin epäolennainen. vikaan.

JOHDATUSTA PELITEORIAAN

YSILUOKKA. Tasa-arvo yhteiskunnassa ja työelämässä

Harjoitussuunnitelma viikko 15 Sisäsyrjäpotku I

Dynaaminen hintakilpailu ja sanattomat sopimukset

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

KIELENOPPIJOITA TIEDONHANKINTA KESKIÖSSÄ KUUNTELEMALLA OPPIJA (AUDITIIVINEN) KIELEN KÄYTTÖ, VUOROVAIKUTUS NÄKEMÄLLÄ

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Moraalinen uhkapeli: laajennuksia ja sovelluksia

Luonnollisella kielellä keskustelevat järjestelmät

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

ISBN ISBN (sähkökirja) BALTO print Anna palautetta:

Task list Submit code Submissions Messages Scoreboard View queue Edit contest

Jypelin käyttöohjeet» Miten voin liittää törmäyksiin tapahtumia?

Kehitysvammaliitto ry. RATTI-hanke. Haluan lähteä kaverin luokse viikonlopun viettoon ja olla poissa ryhmäkodista koko viikonlopun.

b) Arvonnan, jossa 50 % mahdollisuus saada 15 euroa ja 50 % mahdollisuus saada 5 euroa.

suunnattua joukkoviestintää. Tunnistettavan lähettäjän tarkoituksena on yleisön suostuttelu tai yleisöön vaikuttaminen.

Palveluverkkotyöryhmä. Viestintä

Paljastetut preferenssit ja peliteoria. Ks. esim. Grüne-Yanoff & Lehtinen (tulossa) tai Hausman 2000, 2005, Guala 2006

Yhdistyspäivä

Luento 5: Peliteoriaa

Strategiset valinnat. Taloustieteen perusteet Matti Sarvimäki

Transkriptio:

Kommunikaatio MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly 2.11.2016 Visa Linkiö The document can be stored and made available to the public on the open internet pages of Aalto University. All other rights are reserved.

Kommunikaatio Doing by talking: Kommunikaatiolla pyritään muuttamaan toisen pelaajan toimintaa Talking by doing: Oma toiminta paljastaa toiselle pelaajalle uutta informaatiota

Doing by talking

Doing by talking: Cheap talk Kommunikaatiolla ei hintaa Mahdollisuus kommunikoida ennen pelaamista

Doing by talking: Cheap talk Yhteistyöpeli B: Öljy B: Rakennus A: Öljy 1,1 0,0 A: Rakennus 0,0 1,1 Herra Kalaisa (A) ja Rouva Varjoisa (B) valitsevat konsultointialaa. He ovat vanhoja tuttuja, joilla on toisiaan täydentävät taidot.

Doing by talking: Cheap talk Yhteistyöpeli B: Öljy B: Rakennus A: Öljy 1,1 0,0 A: Rakennus 0,0 1,1 A kommunikoi B:lle aikovansa öljyalalle. Viesti on sitova (self-committing) ja paljastava (self-revealing), koska A:n kannattaa nyt valita öljyala ja B tietää A:n aikeen Myös B:n kannattaa nyt valita öljyala Kommunikaatio vaikuttaa peliin (revealing equilibrium)

Doing by talking: Cheap talk Vangin Dilemma B: Vasikoi B: Hiljaa A: Vasikoi -3,-3 0,-5 A: Hiljaa -5,0-1,-1 Herra Kalaisa (A) ja Rouva Varjoisa (B) ovat syytettyinä öljynporausalalla tapahtuneesta huijauksesta

Doing by talking: Cheap talk Vangin Dilemma B: Vasikoi B: Hiljaa A: Vasikoi -3,-3 0,-5 A: Hiljaa -5,0-1,-1 A kommunikoi B:lle aikovansa olla hiljaa. A toivoo saavansa B:n olemaan hiljaa B tietää, että A:n kannattaa silti vasikoida Viesti ei ole sitova eikä paljastava Kumpikin vasikoi => -3,-3 Kommunikaatio ei vaikuta peliin (babbling equilibrium)

Talking by doing

Talking by doing: Signalointipeli Laajennettu peli, jossa B:llä epätäydellinen informaatio Luontoäiti valitsee pelin yleisesti tunnetusta jakaumasta Pelaaja A tietää, mikä peli on valittu, pelaaja B ei A pelaa ensin Kuinka pelaaja B arvaa pelattavan pelin? A tietää, että B yrittää arvata peliä A:n valinnan perusteella

Talking by doing: Signalointipeli Esimerkki Peli 1 B: L B: R A: U 4,-4 1,-1 A: D 3,-3 0,0 Peli 2 B: L B: R A: U 1,-1 3,-3 A: D 2,-2 5,-5 Herra Kalaisa (A) ja Rouva Varjoisa (B) opiskelevat vankilassa peliteoriaa muiden talousrikollisten kanssa Pelit 1 ja 2 yhtä todennäköisiä Pelissä 1 A:lla paremmat tuotot valitsemalla U Pelissä 2 A:lla paremmat tuotot valitsemalla D

Talking by doing: Signalointipeli Esimerkki Peli 1 B: L B: R A: U 4,-4 1,-1 A: D 3,-3 0,0 Peli 2 B: L B: R A: U 1,-1 3,-3 A: D 2,-2 5,-5 Oletetaan, että A valitsee pelissä 1 U ja pelissä 2 D B:n parhailla vasteilla saadaan (U,R) ja (D,L) Tällöin A:n odotettu tuotto 0.5*1 + 0.5*2 = 1.5

Talking by doing: Signalointipeli Esimerkki Peli 1 B: L B: R A: U 4,-4 1,-1 A: D 3,-3 0,0 Peli 2 B: L B: R A: U 1,-1 3,-3 A: D 2,-2 5,-5 Mitä jos A pelaakin aina D? Jos B toimii kuten edellä, päädytään aina pelaamaan (D,L) Tällöin A:n odotettu tuotto on aiempaa parempi 0.5*3 + 0.5*2 = 2.5 > 1.5 Hyödyntämällä informaatiotaan A voi menettää sen suoman edun

Puhetoimitus Puhetoimitus tai puheakti (speech-act theory, Austin 1962) Lausuma, joka ei totea asiantiloja vaan muuttaa niitä Puhetoimituksen tekijällä oltava valtuudet kyseiseen toimeen Esimerkki: Julistan teidät aviopuolisoiksi. Esimerkki: Lyön 5 :sta vetoa, että... ja Sovittu.

Puhetoimitus Doing by talking ja talking by doing pohjautuvat peliteoriaan Toimivat sekä yhteistyö- että kilpailutilanteissa Puhetoimitus pohjautuu filosofiaan ja lingvistiikkaan Toimii yhteistyötilanteissa Puheella muutetaan asioita => Muistuttaa doing by talking yhteistyöpeliä

Keskustelun periaatteet Ihmiset pyrkivät ymmärtämään ja tulemaan ymmärretyiksi => yhteistyö Keskustelun periaatteet (Grice 1967) 1. Määrä: puhuja ei saa kertoa liikaa eikä liian vähän 2. Laatu: puhuja uskoo kertomaansa 3. Yhtenäisyys: puhuja pysyy asiassa 4. Tapa: puhuja välttää moniselitteisyyttä Kuulija olettaa puhujan noudattavan näitä periaatteita

Keskustelun periaatteet Esimerkki Väite: New Yorkissa joku pahoinpidellään 10min välein. Merkitään mahdollisia tulkintoja s: Eri henkilö pahoinpidellään 10min välein t: Sama henkilö pahoinpidellään 10min välein Kuvataan laajennettuna pelinä, jossa Luontoäiti N valitsee todellisen tilanteen vaihtoehtojen s ja t välillä. A tietää Luontoäidin valinnan ja haluaa kommunikoida sen B:lle sanomalla p: Joku pahoinpidellään 10min välein. q: Eri henkilö pahoinpidellään 10min välein. r: Sama henkilö pahoinpidellään 10min välein.

Keskustelun periaatteet Esimerkki s: Eri henkilö pahoinpidellään 10min välein t: Sama henkilö pahoinpidellään 10min välein p: Joku pahoinpidellään 10min välein. q: Eri henkilö pahoinpidellään 10min välein. r: Sama henkilö pahoinpidellään 10min välein. A pyrkii kommunikoimaan informaation mahdollisimman kompaktisti (Grice, määrän periaate). => Suurin tuotto, kun A sanoo p ja B ymmärtää merkityksen. => Pienin tuotto, kun B ei ymmärrä merkitystä oikein.

Keskustelun periaatteet Esimerkki s: Eri henkilö pahoinpidellään 10min välein t: Sama henkilö pahoinpidellään 10min välein p: Joku pahoinpidellään 10min välein. q: Eri henkilö pahoinpidellään 10min välein. r: Sama henkilö pahoinpidellään 10min välein. Tasapainoja: 1. A sanoo q, kun s, ja r, kun t. 2. A sanoo p, kun s, ja r, kun t. B olettaa s kuullessaan p. => Kumpikin luonnollisia ihmiselle

Sovelluskohteet Älykkäät dialogijärjestelmät keskustelu ihmisten kanssa luonnollisilla kielillä Työnkulun ohjausjärjestelmät Monimutkaiset vuorovaikutukset ihmisorganisaatioiden sisällä ja välillä Agenttien välinen kommunikointi Keskustelun periaatteille pohjautuvia ohjelmointikieliä on ehdotettu Tällöin ohjelmointi siirtyisi olio-ohjelmoinnista kohti agenttiohjelmointia (ks. rationaalinen ohjelmointi)

Terminologia Doing by talking = Kommunikaatiolla pyritään vaikuttamaan muiden pelaajien toimintaan Talking by doing = Valinnoilla voidaan kommunikoida uutta tietoa muille pelaajille Cheap talk = Maksuton kommunikointi Sitova (self-committing) = Viestin lähettäminen (olettaen, että lähettäjä uskoo vastaanottajan uskovan sen) määrää lähettäjän optimaalisen valinnan Paljastava (self-revealing) = Vistin lähettäminen paljastaa lähettäjän tulevan valinnan Revealing equilibrium = Tasapaino, joka saavutetaan, kun lähetetään sitova ja paljastava viesti Babbling equlibrium = Tasapaino, joka saavutetaan, kun lähetetyt viestit jätetään huomiotta Signalointipeli (signaling game) = Kahden pelaajan laajennettu peli, jossa toisella pelaajalla on epätäydellinen informaatio Puhetoimitus, puheakti (speech-act theory) = Lausuma, joka ei totea asiantiloja vaan muuttaa niitä Gricen keskustelun periaatteet (Gricean maxims) = Periaatteet, joita puhujan oletetaan noudattavan tullakseen ymmärretyksi Rationaalinen ohjelmointi (rational programming) = Ohjelmointikieleen sisällytetään rationaalisuutta mm. hyödyntäen puhetoimitusteoriaa

Kotitehtävä: Spencen signalointipeli Herra Kalaisa päättää kouluttautua uudelle alalle. Luontoäiti on arponut hänelle hyvät tai huonot taidot kyseiselle alalle. Analysoi Spencen signalointipelin (kirjan s. 228/241) avulla, pitäisikö Herra Kalaisan hakeutua helppoon vai vaativaan koulutusohjelmaan. Halutessasi voit myös spekuloida, mikä on Herra Kalaisan tarinan opetus.