Pohdiskeleva ajattelu ja tasapainotarkennukset

Pohdiskeleva ajattelu ja tasapainotarkennukset Sanna Hanhikoski 24.3.2010

Sisältö Pohdiskeleva ajattelu Nashin tasapainotarkennukset Täydellinen tasapaino Täydellinen bayesiläinen tasapaino Vaiheittainen tasapaino Lokaalin parhaan vasteen kriteeri

Pohdiskeleva ajattelu (reflective reason) Pohdiskelevan ajattelun (tai päättelyn) hyväksikäyttö ennustamaan yksilön pelaamista Oletetaan että päädytään Nashin tasapainoratkaisuun Usein useita Nashin tasapainoratkaisuja joista kuitenkin vain osaa järkevät (reasonable) henkilöt pelaavat

Nashin tasapainotarkennukset (Nash equilibria refinement) Kriteerit jotka pätevät ainoastaan järkeville Nashin tasapainoille Pohdiskeleva ajattelu eli epävirallinen tieto siitä kuinka rationaaliset yksilöt pelaavat Useita erilaisia kriteerejä Perinteiset perustuvat osapelitäydellisyyteen

Osapelitäydellinen tasapaino (subgame-perfect equilibrium) Osapeli alkaa solmusta jossa siihenastisen pelin tapahtumat yleisesti tiedossa Osapelitäydellinen tasapaino on pelin osasta löytyvä Nashin tasapaino

Täydellinen tasapaino (Perfect equilibrium) Jos on mahdollista että pelaaja tekee virheen, kaikissa päätössolmuissa vieraillaan positiivisella todennäköisyydellä NE σ on täydellinen jos kaikilla δ > 0 on olemassa ε > 0 s.e. tasapaino säilyy δ päässä σ:ta kun jokin pelin tapahtuma heiluu ε verran L 1,5 Alice l 0, 0 R Bob r 2, 1

Täydellinen bayesiläinen tasapaino (Perfect bayesian equilibrium) 1. Jokaisessa informaatiojoukossa pelaajalla on uskomus siitä missä solmussa ollaan 2. Pelaaja maksimoi odotetun hyötynsä uskomuksensa mukaisesti 3. Niissä informaatiotiloissa, jotka ovat tasapainopolulla, uskomukset päivittyvät toisten pelaajien siihenastisista päätöksistä ja tasapainostrategioista 4. Niissä informaatiotiloissa, joiden saavuttamisen todennäköisyys on nolla, uskomukset päivittyvät toisten pelaajien siihenastisista päätöksistä ja tasapainostrategioista ELI: Nashin tasapaino on täydellinen bayesilainen jos johdonmukaiset uskomukset auttavat pelaajaa tuoton maksimoinnissa Lähde: Gibbons, R. A Primer in Game Theory. Prentice Hall, 1992.

Täydellinen bayesiläinen tasapaino (Perfect bayesian equilibrium) Osapelitäydellinen Nashin tasapaino (L, L, r) Vaatimukset 1-3 täyttyy, kaikki informaatiojoukot tasapainopolulla (joten 4 ei tarvita), joten täydellinen bayesiläinen tasapaino Jos p=0 ja tarkastellaan Nash tasapainoa (R,L,l), vaatimukset 1-3 toteutuvat koska pelaajilla uskomukset ja toimivat optimaalisesti niiden mukaan. Ei kuitenkaan osapelitäydellinen Bobin uskomus ja Alicen strategia ristiriidassa Bobin informaatiojoukko ei tasapainopolulla Vaatimus 4 pakottaa Bobin uskomusten perustuvan Alicen strategiaan 1,2,1 L Carol L Alice R R p 1-p Bob l r l r 2,0,0 3,3,3 0,1,2 0,1,1 Lähde: Gibbons, R. A Primer in Game Theory. Prentice Hall, 1992.

Vaiheittainen tasapaino (Sequential equilibrium) Vastaava kuin täydellinen bayesiläinen tasapaino, mutta joissakin sovelluksissa toimivampi Arvostus eli (strategia, uskomus) Ei käytä ei-tasapainopolulla sattumanvaraisia arvostuksia vaan aiheuttaa strategiassa häiriöitä Ja vaatii että informaatiojoukon arvostus eitasapainopolulla on raja-arvostus kun häiriö lähenee nollaa Eli yhden solmun informaatiojoukossa ei mahdollista vaihtaa strategiaa kesken kaiken Uskomukset oltava järkeviä Lähde :Kreps,D.M, Wilson, R. Sequential Equilibria. Econometrica 50(1982)4

Esimerkki-vaiheittainen tasapaino 1/2 Nashin tasapainot Ll ja Rr Arvostus (( ) ({ LM} )) ( ) = 1( ) 2( { LM} ) β, µ β 0, β,, µ, Termi 1: todennäköisyysjakauma Alicen strategioiden yli Termi 2: todennäköisyysjakauma Bobin strategioiden yli kun Alice valinnut L tai M Termi 3: Bobin uskomus kun saa pelata M dominoitu oletetaan että sen pelaamisen todennäköisyys on nolla Alice R 2,2 L M p Bob 1-p l r l r 3,1 1,0 0,0 0,1 Lähde: Oslon yliopiston kurssin Topics in microeconomics esimerkki

Esimerkki-vaiheittainen tasapaino 2/2 µ ({ LM} )( L) Uskomus Bayesin säännöstä µ ({ })( M ) Näillä uskomuksilla Bobin strategia on osa vaiheittaista tasapainoa jos valitsee l todennäköisyydellä 1 Vastaavasti Alicen strategia on osa vaiheittaista tasapainoa jos valitsee L todennäköisyydellä 1 Eräs vaiheittainen tasapaino ( ) = 1( ) 2( { LM} ) (( 1, 0, 0 ), ( 1, 0 )), ( 1, 0) =, (( 0,, ), ({ LM, })) ( ) β µ β β µ 3,1 L β1 ( 0/ )( L) ( 0/ )( L) + β ( 0/ )( M), = = 1 β L, M = 0 1 1 Alice p Bob 1-p l r l r R M 2,2 1,0 0,0 0,1

Lokaalin parhaan vasteen kriteeri (Local best response criterion) Gintisin esittelemä tasapainotarkennus Käyttää etuperin induktiota: pelaaja päättelee toisten pelaajien siirrot tulevaisuudessa perustuen siihen että on päästy tiettyyn solmuun ja että toiset ovat rationaalisia Nashin tasapaino σ on LBR tasapaino jos oletukset tukevat tasapainoon σ päätymistä Oletukset: jos useita vaihtoehtoja pelaaja valitsee suurimman tuoton pelaaja rajoittuu tarkastelemaan muiden käytöstä vain Nashin tasapainoon johtavalla polulla

Esimerkki LBR kriteeri Nash tasapainot (R,r) ja (L,σ B ), jossa σ B (r) ½ Alice Bobin informaatiojoukossa ainoa Nash tasapaino on (R,r) Alice olettaa Bobin valitsevan r johon paras vaste on R L 1,5 l R Bob r Bob olettaa Alicen valitsevan R johon paras vaste on r 0, 0 2, 1 (R,r) on ainoa LBR tasapaino

LBR vastaan täydellinen bayesiläinen 1/2 Nash tasapainot Rbr, Rσ A σ B (σ A (b) ½ja σ B (l) ½) ja Mbl Carol R 1,0,0 Kaikki osapelitäydellisiä ja täydellisiä bayesiläisiä tasapainoja Alice L M Rbr on täydellinen bayesiläinen b a b a Bob jos Bob uskoo että Alice valitsi a vähintään todennäköisyydellä ⅔ 0,1,0 0,0,0 l r l r ei vaiheittainen koska jos Alice saa pelata valitsee b 2,2,2 0,0,0 0,0,0 0,0,1

LBR vastaan täydellinen bayesiläinen 2/2 Rbr ei LBR Carole saa 1 jos valitsee R, valitsemalla M suurempi tuotto L Carol R M 1,0,0 Jos Alice saa pelata niin valitsee järkevänä b b Alice a b a Bob Jos Bob saa pelata (koska Carol valinnut M ja Alice b) paras vaste l Mbl on ainoa LBR tasapaino 0,1,0 0,0,0 l r 2,2,2 0,0,0 l r 0,0,0 0,0,1

Vaiheittainen vs. LBR Nash tasapainot M ja N Tasapaino M vaiheittainen N ei täydellinen bayesiläinen Ainut NE jossa Carol pelaa on N jolloin valitsee l Paras vaste Bobilta on a Alice olettaa että l ja a valittu jolloin kannattaa valita D Dal on LBR Alice A Bob a D d Carol l r l r 4,4,4 1,1,1 5,5,0 2,2,2 {(,, ( ) ) 1 l 1 l 0 l 3} (, ( 1 ), ) 1 a a a 1 M = A a pl+ p r p { 2 } N = D p a+ p d l p 3,3,0

Päättelystä Puutteellinen päättely (insufficient reason) Pelissä, jossa Bobin informaatiojoukon haarat symmetrisiä, ei voi päätellä kummassa haarassa ollaan Alicen päätöksen jälkeen Rehellinen vuorovaikutus (honest communication) Pelaajat sopivat siirroista etukäteen ja pitävät lupauksensa jos lupauksen rikkominen ei kannata

Lopuksi Nashin tasapainotarkennukset pyrkivät karsimaan tasapainoista pois järjettömät ratkaisut Perustuu pohdiskelevaan ajatteluun kuinka rationaaliset yksilöt pelaavat LBR kriteeri on Gintisin esittelemä uusi tasapainotarkennus Perustuu etuperin induktion käyttöön tasapainopolulla Pelin ainoa NE on sekä osapelitäydellinen että LBR

Kotitehtävä Etsi viereisen pelin Nash tasapainot Mitkä niistä ovat osapelitäydellisiä, täydellisiä bayesiläisiä ja LBR tasapainoja? Perustele lyhyesti vastauksesi Alice R 2,2 L M p Bob 1-p l r l r 4,1 0,0 3,0 0,1