LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

LAAJENNETUN MUODON RATIONALISOITUVUUS 3.3.2010

Pähkinänkuoressa: Laajennetun muodon rationalisoituvuus Laajennetun muodon peli (Extensive Form Game) Laajennetun muodon pelin tasapainokäsitteitä. Tosimaailman ja teorian yhteentörmäys: Käyttäytyvätkö pelaajat irrationaalisesti? Aumannin (1995) ratkaisu ongelmaan: Ihan rationaalisia ovat sittenkin. 2

Laajennetun muodon peli Määritelmä. Laajennetun muodon peli määrittelee: (1) Pelin pelaajat, (2a) koska pelaajat tekevät päätöksensä, (2b) mitä pelaajat voivat päättää, (2c) mitä pelaajat tietävät päättäessään ja (3) saatavat hyödyt pelaajalle päätöskombinaation lopussa. Laajennetun muodon peli sisältää enemmän informaatiota kuin normaalimuotoinen peli, sillä pelaajilla on mahdollisuus päivittää tietoaan pelin edetessä. 3

Takaperininduktio ja dominoidut strategiat Takaperininduktio täydellisen muistin (perfect information) pelissä: Valitaan jokin päättymissolmu τ T. Maksimoidaan τ:n äitisolmun päätöshyötyä viimeisen päätöksen tekevän pelaajan mielessä. Karsitaan muut paitsi optimaalinen oksa pois ja asetetaan hyöty äitisolmulle. Aloitetaan alusta ja jatketaan, kunnes jäljellä on ainoastaan takaperininduktioratkaisu. Gintis, s. 103. 4

Takaperininduktio ja dominoidut strategiat Takaperininduktiossa poistetaan aina (heikosti) dominoidut ratkaisut kussakin osapelissä. Takaperininduktio voi siten eliminoida myös Nash-tasapainoja. Eliminoimalla edellisen sivun esimerkissä vaihtoehto ww poistetaan epäuskottava uhkaus. Yleisesti ottaen voidaan sanoa takaperininduktion poistavan epäuskottavia uhkauksia. 5

Osapelitäydellisyys Määritelmä. Laajennetun muodon pelin osapeli: Alkaa päätössolmusta n, joka on oma informaatiojoukkonsa. Sisältää kaikki puussa n:ää seuraavat solmut. Ei leikkaa yhtään informaatiojoukkoa. Määritelmä. Nash-tasapaino on osapelitäydellinen, jos se muodostaa tasapainon jokaisessa osapelissä. 6

Osapelitäydellisyys ja uskottava uhkaus Oheisella pelillä on puhtaiden strategioiden osapelitäydellinen Nash-tasapaino Rr. Samaan päädytään takaperininduktiolla. Pelissä on myös toinen Nashtasapaino (Ll), jota Bob mieluusti pelaisi. Jos Bob saa jotenkin uskoteltua Alicelle pelaavansa l:ää, Alicen paras vaste on pelata L:ää. 7

Yllätyskoe Ryhmä peliteoreetikoita osallistuu viisipäiväiselle kurssille. He saavat tietää etukäteen, että kurssilla järjestetään yhtenä päivänä yllätyskoe. He järkeilevät, että koetta ei varmasti järjestetä perjantaina, sillä silloin se ei olisi yllätys. Toisaalta torstainakaan se ei tällöin enää olisi yllätys. Näin jatkaen järkeilyään he päätyvät johtopäätökseen, että koetta ei järjestetä ollenkaan. Tiistaina heidän eteensä kuitenkin pannaan koepaperi ja he yllättyvät perin juurin. Löytyy kirjallisuudesta sekä The Surprise Examination että The Hanging Paradox -nimellä. 8

CKL Yhteinen tietämys loogisuudesta Yllätyskoe on esimerkki paradoksaalisesta tilanteesta, jossa takaperininduktio ei onnistu järkeilemään lopputulosta oikein. CKL (Common knowledge of Logicality) määritellään siten, että toimija i 1 tietää, että toimija i 2 tietää, että... tietää, että toimija i k on looginen, missä toimijat i = 1,, n ja osajoukko i 1,, i k [1,, n]. CKL vaikuttaa harmittomalta loogisuuden laajennokselta, mutta se voi olla väärässä. Yllätyskokeessa opettaja järjestää kokeen, vaikka CKL on sulkenut pois tämän vaihtoehdon. 9

Toistettu vangin ongelma Alice ja Bob pelaavat seuraavaksi oheista peliä 100 kierrosta. Takaperininduktio ennustaa, että kummatkin pettävät jo ensimmäisellä kierroksella. Tositilanteessa (myös kokeellisesti havaittu) pelaajat kuitenkin tekevät yhteistyötä arviolta 95 kierrosta. Vaikka CKR (Common Knowledge of Rationality) estää tämän, romuttuu CKR kuitenkin heti pelaajan valitessa ensimmäistä kertaa C:n. CKR:n romuttuminen ei kuitenkaan estä pelaajia toimimasta rationaalisesti ja soveltamasta esimerkiksi Tit-for-Tat-strategiaa. C D C 3, 3 0, 4 D 4, 0 1, 1 10

Tuhatjalkaispeli Pelissä (The Centipede Game) pelaaja A aloittaa. A voi joko tehdä yhteistyötä (C) tai kotiuttaa (D). Jos A kotiuttaa, peli loppuu siihen. Jos A tekee yhteistyötä, luonto antaa A:lle yhden lisää ja vuoro siirtyy B:lle. 2, 2 3, 2 3, 3 4, 3 51, 51 52, 51 A B A B A B C C C C C C C 52, 52 D D D D D D 4, 0 1, 4 5, 1 2, 5 53, 49 50, 53 11

CKR vastaan takaperininduktio Aumann (1995) todistaa, että CKR implikoi takaperininduktiota. Toisaalta näin ollen voidaan osoittaa, että kaikissa äärellisissä laajennetun muodon peleissä, joissa on yksi osapelitäydellinen Nash-tasapaino, CKR pätee ainoastaan takaperininduktiopolun varrella. Tuhatjalkaispelin tapauksessa näin on ainoastaan ensimmäisen solmun kohdalla. 12

Miten toistettua vangin ongelmaa tulisi pelata? Oheisessa vaihepelissä T > R > P > S. Peliä pelataan sata kierrosta tai kunnes toinen pettää. Päätellään todennäköisyys g k, että toinen pelaaja pettää kierroksella k. Muodostetaan vielä G m = g 1 + +g m. Oma hyöty maksimoituu maksimoimalla funktiota m 1 C D C R, R S, T D T, S P, P π m = i 1 R + S g i + m 1 R + P g m + m 1 R + T (1 G m ) i=1 Yhteistyöstä tuleva hyöty Toisen pettämisestä tuleva hyöty Omasta pettämisestä tuleva hyöty 13

Tiedon täsmällisyys Edellisen kalvon malli on voimaton sen edessä, miten pelaajien priori-todennäköisyydet tulisi estimoida. Miten peliä tulisi pelata riippuu siis siitä, miten oletamme muiden pelaavan ja miten oletamme heidän olettavan meidän olettavan. Onko tässä sitten mitään järkeä? 14

Takaperininduktio ja laajennetun muodon CKR Aumann (1995) todistaa, että CKR yleisessä täydellisen muistin laajennetun muodon pelissä on mahdollista vain takaperininduktiopolun varrella. Voidaan kirjoittaa: CKR I, mikä tarkoittaa, että CKR on takaperininduktiolla saavutettujen polkujen osajoukko. Tämä ei siis väitä, että rationaaliset pelaajat aina pelaisivat osapelitäydellistä tasapainoa. Tämä tahtoo sanoa, että CKR-polulta hyppäämisessä ei ole mitään irrationaalista. 15

Rationaalisuus ja laajennetun muodon CKR Aumannin idea herätti paljon vastustusta. Jos rationaalinen pelaaja poikkeaa BItasapainopolulta, eikö hän tällöin pelaa irrationaalisesti? Pelaaja pelaa tällöin CKR:ää vastaan, mutta ei rationaalisuuden vastaisesti. CKR ei ole bayesiläisen rationaalisuuden laajennus. Se on pikemminkin tehokas otaksunta monen bayesiläisen toimijan yli. 16

Mitä tästä jäi käteen? Laajennetun muodon pelejä voi tarkastella takaperininduktiolla. Takaperininduktio johtaa kuitenkin usein eri tulokseen kuin kokeellisesti on havaittu ja pelaajat eivät pelaakaan aina osapelitäydellisiä Nash-tasapainoja. Tämä antaa osviittaa siitä, että yleinen tietämys rationaalisuudesta (CKR) ei pidä paikkaansa eli pelaajat eivät olisikaan rationaalisia. Onneksi rationaalisuusoletusta ei tarvitse hylätä, vaan sen sijaan CKR:ssä ja takaperiniduktiossa on korjailtavaa. 17

Kirjallisuutta Herbert Gintis (2009), The Bounds of Reason Game Theory and the Unification of the Behavioral Sciences. Princeton University Press. Robert Gibbons (1992), A Primer in Game Theory. Prentice Hall. Drew Fudenberg ja Jean Tirole (1991), Game Theory. The MIT Press. Robert Aumann ja Adam Brandenburger (1995). Epistemic Conditions for Nash Equilibrium. Econometrica, vol. 63, no. 5, 1161-1180. 18

Kotitehtävä KT 13.1. Liitteessä (1) on esitetty erilaisten räsy-pelien (räsypokka jne.) yleisyys. Iterated prisoners dilemma on listan hännillä. Konstruoi toistettuun vangin ongelmaan pohjautuva peli. Ota vastauksessasi huomioon ainakin seuraavat asiat: Pelin laajennetun muodon mukainen määrittely. Pohdi pelin hyötyjen muotoa. Peli on kahdella pelaajalla hieman tylsä. Miten esimerkiksi kolmen pelaajan peli toimisi? Miten pelissä käy? Pohdi rationaalisten pelaajien toimintaa. 19

Liite 1. Frequency of strip versions of various games XKCD-nettisarjakuva, http://xkcd.com/696/ 20