LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

Samankaltaiset tiedostot
Pohdiskeleva ajattelu ja tasapainotarkennukset

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Johdanto peliteoriaan Kirja kpl. 2

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Pelien teoriaa: tasapainokäsitteet

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Yhteistyötä sisältämätön peliteoria

Yhteistyötä sisältämätön peliteoria jatkuu

Luento 5: Peliteoriaa

Nollasummapelit ja bayesilaiset pelit

PELITEORIAN PERUSTEITA

Luento 8. June 3, 2014

Tasapaino epätäydellisen tiedon peleissä

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Peliteoria luento 3. May 27, Peliteoria luento 3

Luento 5: Peliteoriaa

SEKASTRATEGIAT PELITEORIASSA

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Evolutiivisesti stabiilin strategian oppiminen

Toistetun haukka-kyyhky -pelin numeerinen analysointi

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Luento 5: Peliteoria

Peliteoria luento 2. May 26, Peliteoria luento 2

Sekastrategia ja Nash-tasapainon määrääminen

Luento 7. June 3, 2014

Yleinen tietämys ja Nashin tasapaino

ESS oppiminen ja sen simulointi

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Signalointi: autonromujen markkinat

Prospektiteoria. Systeemianalyysin. Antti Toppila. Esitelmä 4 3. helmikuuta laboratorio Aalto-yliopiston TKK

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Epätäydellisen tiedon jatkuvat pelit

Sekastrategiat ja intensiiviyhteensopivuus

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari

Prof. Marko Terviö Assist. Jan Jääskeläinen

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Tilastollisia peruskäsitteitä ja Monte Carlo

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Dynaaminen hintakilpailu ja sanattomat sopimukset

Prof. Marko Terviö Assist. Jan Jääskeläinen

JOHDATUSTA PELITEORIAAN

Bayesilainen päätöksenteko / Bayesian decision theory

Tietoteoria. Tiedon käsite ja logiikan perusteita. Monday, January 12, 15

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.

Väitöskirja implementaatioteoriasta *

Opettaminen ja oppiminen

Strategiset valinnat Taloustieteen perusteet Matti Sarvimäki. A. Peliteorian alkeet. Johdanto. Johdanto 15/09/19

Luento 9. June 2, Luento 9

Mikrotalousteoria 2, 2008, osa IV

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

Paljonko maksat eurosta -peli

Strategiset valinnat. Taloustieteen perusteet Matti Sarvimäki

Rationaalisen valinnan teoria

Äärellisten mallien teoria

Taloustieteen Nobel peliteorian kehittäjille

Hex-pelin matematiikkaa

b) Arvonnan, jossa 50 % mahdollisuus saada 15 euroa ja 50 % mahdollisuus saada 5 euroa.

Peliteoria luento 1. May 25, Peliteoria luento 1

Prof. Marko Terviö Assist. Jan Jääskeläinen

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Peliteoria ja kalatalous YE4

3. Kirjoita seuraavat joukot luettelemalla niiden alkiot, jos mahdollista. Onko jokin joukoista tyhjä joukko?

Dynaaminen hintakilpailu ja sanattomat (epäsuorat) sopimukset osa II

Haitallinen valikoituminen: Kahden tyypin malli

Luku 29 Peliteoria. Käsittelemme aluksi peliteorian peruskäsitteitä ja sanastoa, sitten katsomme itse pelejä.

Pelaajien lukumäärä: suositus 3 4 pelaajaa; peliä voi soveltaa myös muille pelaajamäärille

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Luento 3: Bayesiläiset pelit

Luento 6. June 1, Luento 6

Tutkimuksia pelien ja mekanismien suunnittelun teoriasta *

Päätöksentekomenetelmät

Eero Hyvönen Helsingin yliopisto

Y56 laskuharjoitukset 6

Äärellisten mallien teoria

Markov-kustannusmallit ja kulkuajat

Informaatio ja Strateginen käyttäytyminen

VAASAN YLIOPISTO TALOUSMATEMATIIKKA Päätöksenteko epävarmuuden vallitessa Prof. Ilkka Virtanen TENTTI

Päätöksentekomenetelmät

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Markkinoitten mallintaminen ja Internet-markkinat

Pelit matematiikan opetuksessa

V. V. Vazirani: Approximation Algorithms, luvut 3-4 Matti Kääriäinen

Determinoiruvuuden aksiooma

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Ei-yhteydettömät kielet [Sipser luku 2.3]

Onnistut yrittämässäsi, mutta jokin täysin epäolennainen. vikaan.

Geneettiset algoritmit

Probabilistiset mallit (osa 1) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 1 Jorma Merikoski Tampereen yliopisto

Luku 14 Kuluttajan ylijäämä

YSILUOKKA. Tasa-arvo yhteiskunnassa ja työelämässä

Hintakilpailu lyhyellä aikavälillä

oppimispeli esi- ja alkuopetusikäisten lasten matemaattisten taitojen tukemiseen

T Privacy amplification

monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.

Blackjack on korttipeli, jossa pelaajan tavoitteena on voittaa pelinhoitaja.

(iv) Ratkaisu 1. Sovelletaan Eukleideen algoritmia osoittajaan ja nimittäjään. (i) 7 = , 7 6 = = =

Transkriptio:

LAAJENNETUN MUODON RATIONALISOITUVUUS 3.3.2010

Pähkinänkuoressa: Laajennetun muodon rationalisoituvuus Laajennetun muodon peli (Extensive Form Game) Laajennetun muodon pelin tasapainokäsitteitä. Tosimaailman ja teorian yhteentörmäys: Käyttäytyvätkö pelaajat irrationaalisesti? Aumannin (1995) ratkaisu ongelmaan: Ihan rationaalisia ovat sittenkin. 2

Laajennetun muodon peli Määritelmä. Laajennetun muodon peli määrittelee: (1) Pelin pelaajat, (2a) koska pelaajat tekevät päätöksensä, (2b) mitä pelaajat voivat päättää, (2c) mitä pelaajat tietävät päättäessään ja (3) saatavat hyödyt pelaajalle päätöskombinaation lopussa. Laajennetun muodon peli sisältää enemmän informaatiota kuin normaalimuotoinen peli, sillä pelaajilla on mahdollisuus päivittää tietoaan pelin edetessä. 3

Takaperininduktio ja dominoidut strategiat Takaperininduktio täydellisen muistin (perfect information) pelissä: Valitaan jokin päättymissolmu τ T. Maksimoidaan τ:n äitisolmun päätöshyötyä viimeisen päätöksen tekevän pelaajan mielessä. Karsitaan muut paitsi optimaalinen oksa pois ja asetetaan hyöty äitisolmulle. Aloitetaan alusta ja jatketaan, kunnes jäljellä on ainoastaan takaperininduktioratkaisu. Gintis, s. 103. 4

Takaperininduktio ja dominoidut strategiat Takaperininduktiossa poistetaan aina (heikosti) dominoidut ratkaisut kussakin osapelissä. Takaperininduktio voi siten eliminoida myös Nash-tasapainoja. Eliminoimalla edellisen sivun esimerkissä vaihtoehto ww poistetaan epäuskottava uhkaus. Yleisesti ottaen voidaan sanoa takaperininduktion poistavan epäuskottavia uhkauksia. 5

Osapelitäydellisyys Määritelmä. Laajennetun muodon pelin osapeli: Alkaa päätössolmusta n, joka on oma informaatiojoukkonsa. Sisältää kaikki puussa n:ää seuraavat solmut. Ei leikkaa yhtään informaatiojoukkoa. Määritelmä. Nash-tasapaino on osapelitäydellinen, jos se muodostaa tasapainon jokaisessa osapelissä. 6

Osapelitäydellisyys ja uskottava uhkaus Oheisella pelillä on puhtaiden strategioiden osapelitäydellinen Nash-tasapaino Rr. Samaan päädytään takaperininduktiolla. Pelissä on myös toinen Nashtasapaino (Ll), jota Bob mieluusti pelaisi. Jos Bob saa jotenkin uskoteltua Alicelle pelaavansa l:ää, Alicen paras vaste on pelata L:ää. 7

Yllätyskoe Ryhmä peliteoreetikoita osallistuu viisipäiväiselle kurssille. He saavat tietää etukäteen, että kurssilla järjestetään yhtenä päivänä yllätyskoe. He järkeilevät, että koetta ei varmasti järjestetä perjantaina, sillä silloin se ei olisi yllätys. Toisaalta torstainakaan se ei tällöin enää olisi yllätys. Näin jatkaen järkeilyään he päätyvät johtopäätökseen, että koetta ei järjestetä ollenkaan. Tiistaina heidän eteensä kuitenkin pannaan koepaperi ja he yllättyvät perin juurin. Löytyy kirjallisuudesta sekä The Surprise Examination että The Hanging Paradox -nimellä. 8

CKL Yhteinen tietämys loogisuudesta Yllätyskoe on esimerkki paradoksaalisesta tilanteesta, jossa takaperininduktio ei onnistu järkeilemään lopputulosta oikein. CKL (Common knowledge of Logicality) määritellään siten, että toimija i 1 tietää, että toimija i 2 tietää, että... tietää, että toimija i k on looginen, missä toimijat i = 1,, n ja osajoukko i 1,, i k [1,, n]. CKL vaikuttaa harmittomalta loogisuuden laajennokselta, mutta se voi olla väärässä. Yllätyskokeessa opettaja järjestää kokeen, vaikka CKL on sulkenut pois tämän vaihtoehdon. 9

Toistettu vangin ongelma Alice ja Bob pelaavat seuraavaksi oheista peliä 100 kierrosta. Takaperininduktio ennustaa, että kummatkin pettävät jo ensimmäisellä kierroksella. Tositilanteessa (myös kokeellisesti havaittu) pelaajat kuitenkin tekevät yhteistyötä arviolta 95 kierrosta. Vaikka CKR (Common Knowledge of Rationality) estää tämän, romuttuu CKR kuitenkin heti pelaajan valitessa ensimmäistä kertaa C:n. CKR:n romuttuminen ei kuitenkaan estä pelaajia toimimasta rationaalisesti ja soveltamasta esimerkiksi Tit-for-Tat-strategiaa. C D C 3, 3 0, 4 D 4, 0 1, 1 10

Tuhatjalkaispeli Pelissä (The Centipede Game) pelaaja A aloittaa. A voi joko tehdä yhteistyötä (C) tai kotiuttaa (D). Jos A kotiuttaa, peli loppuu siihen. Jos A tekee yhteistyötä, luonto antaa A:lle yhden lisää ja vuoro siirtyy B:lle. 2, 2 3, 2 3, 3 4, 3 51, 51 52, 51 A B A B A B C C C C C C C 52, 52 D D D D D D 4, 0 1, 4 5, 1 2, 5 53, 49 50, 53 11

CKR vastaan takaperininduktio Aumann (1995) todistaa, että CKR implikoi takaperininduktiota. Toisaalta näin ollen voidaan osoittaa, että kaikissa äärellisissä laajennetun muodon peleissä, joissa on yksi osapelitäydellinen Nash-tasapaino, CKR pätee ainoastaan takaperininduktiopolun varrella. Tuhatjalkaispelin tapauksessa näin on ainoastaan ensimmäisen solmun kohdalla. 12

Miten toistettua vangin ongelmaa tulisi pelata? Oheisessa vaihepelissä T > R > P > S. Peliä pelataan sata kierrosta tai kunnes toinen pettää. Päätellään todennäköisyys g k, että toinen pelaaja pettää kierroksella k. Muodostetaan vielä G m = g 1 + +g m. Oma hyöty maksimoituu maksimoimalla funktiota m 1 C D C R, R S, T D T, S P, P π m = i 1 R + S g i + m 1 R + P g m + m 1 R + T (1 G m ) i=1 Yhteistyöstä tuleva hyöty Toisen pettämisestä tuleva hyöty Omasta pettämisestä tuleva hyöty 13

Tiedon täsmällisyys Edellisen kalvon malli on voimaton sen edessä, miten pelaajien priori-todennäköisyydet tulisi estimoida. Miten peliä tulisi pelata riippuu siis siitä, miten oletamme muiden pelaavan ja miten oletamme heidän olettavan meidän olettavan. Onko tässä sitten mitään järkeä? 14

Takaperininduktio ja laajennetun muodon CKR Aumann (1995) todistaa, että CKR yleisessä täydellisen muistin laajennetun muodon pelissä on mahdollista vain takaperininduktiopolun varrella. Voidaan kirjoittaa: CKR I, mikä tarkoittaa, että CKR on takaperininduktiolla saavutettujen polkujen osajoukko. Tämä ei siis väitä, että rationaaliset pelaajat aina pelaisivat osapelitäydellistä tasapainoa. Tämä tahtoo sanoa, että CKR-polulta hyppäämisessä ei ole mitään irrationaalista. 15

Rationaalisuus ja laajennetun muodon CKR Aumannin idea herätti paljon vastustusta. Jos rationaalinen pelaaja poikkeaa BItasapainopolulta, eikö hän tällöin pelaa irrationaalisesti? Pelaaja pelaa tällöin CKR:ää vastaan, mutta ei rationaalisuuden vastaisesti. CKR ei ole bayesiläisen rationaalisuuden laajennus. Se on pikemminkin tehokas otaksunta monen bayesiläisen toimijan yli. 16

Mitä tästä jäi käteen? Laajennetun muodon pelejä voi tarkastella takaperininduktiolla. Takaperininduktio johtaa kuitenkin usein eri tulokseen kuin kokeellisesti on havaittu ja pelaajat eivät pelaakaan aina osapelitäydellisiä Nash-tasapainoja. Tämä antaa osviittaa siitä, että yleinen tietämys rationaalisuudesta (CKR) ei pidä paikkaansa eli pelaajat eivät olisikaan rationaalisia. Onneksi rationaalisuusoletusta ei tarvitse hylätä, vaan sen sijaan CKR:ssä ja takaperiniduktiossa on korjailtavaa. 17

Kirjallisuutta Herbert Gintis (2009), The Bounds of Reason Game Theory and the Unification of the Behavioral Sciences. Princeton University Press. Robert Gibbons (1992), A Primer in Game Theory. Prentice Hall. Drew Fudenberg ja Jean Tirole (1991), Game Theory. The MIT Press. Robert Aumann ja Adam Brandenburger (1995). Epistemic Conditions for Nash Equilibrium. Econometrica, vol. 63, no. 5, 1161-1180. 18

Kotitehtävä KT 13.1. Liitteessä (1) on esitetty erilaisten räsy-pelien (räsypokka jne.) yleisyys. Iterated prisoners dilemma on listan hännillä. Konstruoi toistettuun vangin ongelmaan pohjautuva peli. Ota vastauksessasi huomioon ainakin seuraavat asiat: Pelin laajennetun muodon mukainen määrittely. Pohdi pelin hyötyjen muotoa. Peli on kahdella pelaajalla hieman tylsä. Miten esimerkiksi kolmen pelaajan peli toimisi? Miten pelissä käy? Pohdi rationaalisten pelaajien toimintaa. 19

Liite 1. Frequency of strip versions of various games XKCD-nettisarjakuva, http://xkcd.com/696/ 20