Rationalisoituvuus ja yleinen tieto rationaalisuudesta
Keskeiset termit: Rationalizability rationalisoituvuus ratkaisukonsepti peliteoriassa Rationalizable rationalisoituva Rationality rationaalisuus pelaajat maksimoivat omaa hyötyään, uskomuksensa suhteen Epistemic game episteminen peli peli joka tutkii tietoteoriaa Common knowledge yleinen tietämys Common knowledge of rationality: CKR
Episteminen peli Episteminen: liittyy tietoteoriaan Koostuu: normaalimuotoisesta pelistä Pelaajista i = 1,,n (muut pelaajat kuin i: i ) Strategiajoukoista S i Tuotoista i Joukko mahdollisista tiloista Tieto osioista P i ja subjektiivisistä priorista p i Tiloista, jotka määräävät käytetyn strategiaprofiilin s=s( )
Epistemiset pelit, jatk. P i = joukko tiloista, jotka ovat todennäköiset i:n mielestä (P i todennäköisyysoperaattori) E = tapaus/tapahtuma (event) Pelaaja i tuntee tapahtuman E tilassa jos P i K i : tieto operaattori, K i E: tapahtuma, jolloin i tuntee E:n Esim. tapahtuma E: sataa jossain päin Helsingissä Tila : Ilkka kävelee Kampissa, jossa sataa Kamppi on Helsingissä E Jokaisessa tilassa P A joka Ilkka luulee olevan mahdollinen, sataa Helsingissä P A E Ilkka tietää että sataa Helsingissä Kuitenkin P A E, koska voi olla toinen tila E jossa sataa Kalliossa muttei Kampissa
Epistemiset pelit, jatk. Pelaaja i:n uskomus (conjecture) i määrittää uskomukset muiden pelaajien suhteen tilassa i on Bayesiläisen rationaalinen jos s i ) maksimoi tuoton i (s i, i ), jossa i (s i, i )= s i S i i (s i i (s i,s i ) i on Bayesiläisen rationaalinen episemisessä pelissä G jos hänen puhtaille strategioille pätee kaikissa : i (s i ), i ) i (s i, i ), s i S i
Esimerkki: episteminen sukupuolten taistelu Violetta n o Alfredo n 3,1 0,0 o 0,0 1,3
Esimerkki, jatk. Violettalla on 4 eri tyyppiä (V i, i = 1,,4): V 1 pelaa t 1 =o, luulee A:n pelaavan o V 2 pelaa t 2 =n, luulee A:n pelaavan n V 3 pelaa t 3 =n, luulee A:n pelaavan sekastrategian paras vaste (best response) V 4 pelaa t 4 =o, luulee A:n pelaavan sekastrategian paras vaste Alfredolla vastaavat tyypit (A i ), strategiat (s i ) ja liittyvät uskomukset Pelin mahdollien tila on ij =(A i,v j,s i,t j ), i,j =1,,4 Esim. E ia on tapus jossa Alfredon typpi on A i, ja Alfredon tieto osio on {E ia, i=1,,4} Molemmat pelaajat ovat Bayesiläisen rationaalisia pelin jokaisessa tilassa, koska jokainen strategia on paras vaste liittyviin uskomuksiin NE: ii, (oikeat uskomukset kun i=1,2), ei sekastrategia NE:tä
Dominoitujen strategioiden eliminointi i:n strategia s i dominoi s i vahvasti (s on aina parempi kuin s ), jos kaikille s i pätee: i (s i, s i ) > i (s i, s i ) s i dominoi s i heikosti (s on aina väh. yhtä hyvä ja joskus parempi), jos kaikille s i pätee: i (s i,s i ) i (s i,s i ) ja epäyhtälö on aito jollekin s i Voi olla ettei mikään puhdas strategia s dominoi s:ää vahvasti, mutta joku sekastrategia dominoi vahvasti
Dominoitujen strategioiden iteratiivinen eliminointi, esimerkki L C R L C R U 0,2 3,1 2,3 M 1,4 2,1 4,1 M 1,4 2,1 4,1 D 2,1 4,4 3,2 D 2,1 4,4 3,2 L C L C C M 1,4 2,1 D 2,1 4,4 D 4,4 D 2,1 4,4
Rationalisoituvuus, rationalisoituvat strategiat Rationaalinen pelaaja ei koskaan pelaisi vahvasti dominoitua strategiaa Saadakseen tietää mitä rationaalinen pelaaja tekee, pitää eliminoida ei rationaaliset strategiat Mitä jää jäljelle kutsutaan rationalisoituvaksi Rationalisoituva tasapaino (Rationalizable equilibrium) Kaikki NE:t ovat rationalisoituvat Dominoitujen strategioiden iteratiivinen eliminointi jättää jäljelle kaikki mahdolliset rationalisoituvat strategiat
Esimerkki: matching pennies A Jokainen puhdas strategia on rationalisoituva NE:t vain sekastrategioilla P(A)=P(B)=0,5 B A 1,1 1, 1 B 1, 1 1,1
Yhdenmukaisuus (Consistency) Pelaaja i:n uskomukset i ovat ensimmäisen asteen yhdenmukaiset (first order consistent) jos ne asettavat positiiviset todennäköisyydet vain niihin j:n strategioihin jotka antavat parhaat tulokset j:lle jonkun todennäköisyysjakauman S j :n suhteen Samalla tavalla, jos i asettaa positiiviset todennäköisyydet pariin s j, s k, koska i tietää että j tietää k:n olevan rationaalinen, i tietää että j:n uskomukset ovat 1. asteen yhdenmukaiset, ja siksi asettaa positiiviset todennäköisyydet vain niihin pareihin s j,s k, joissa j on 1. asteen yhdenmukainen ja j asettaa positiivisen todennäköisyyden s k :n i on toisen asteen yhdenmukainen
Yhdenmukaisuus jatk. Voi määrittää r:n asteen yhdenmukaisuus Uskomus joka on r:n asteen yhdenmukainen kaikilla r:n arvoilla on yhdenmukainen (consistent) Strategia joukko s 1,, s n on rationalisoituva jos löytyy yhdenmukainen joukko uskomuksia 1,, n, jotka asettavat positiivisen todennäköisyyden joukkoon s 1,,s n
Yleinen tietämys rationaalisuudesta Määritelmä: K 1 i=[( j i) i (s j ) > 0 s j B j (S j )], missä B on j:n puhtaiden strategioiden joukko joka on paras vaste johonkin sekastrategiaprofiiliin K 1 ion tapaus, jolloin i uskoo että pelaaja j valitsee s j vain jos s j on paras vaste j:lle Eli i tietää muiden pelaajien olevan rationaalisia Yleinen määritelmä: K r i= K r 1 i [( j i) i (s j ) > 0 s j B_j(K r 1 j)] K 2 ion siis tilanne, jossa i tietää että kaikki pelaajat tietävät että jokainen pelaaja on rationaalinen K r ion vastaava tilanne, jossa on r kpl tietävät että kaikki
Yleinen tietämys rationaalisuudesta, jatk. Merkitään K r = i K r i jos K r, sanotaan että on r:n asteen yleinen tietämys Lopuksi, tapaus yleinen tietämys rationaalisuudesta (CKR) määritellään: K = n r 1 K r Kaikki tietävät että kaikki tietävät että kaikki tietävät että [ ] kaikki tietävät että kaikki ovat rationaalisia Epistemisessä pelissä ei voi olettaa CKR:ää CKR ei ole pelaajien tai pelin informaatiorakenteen ominaisuus Ei ole mitään ei rationaalista CKR:n puutteessa
Rationalisoituvuus ja yleinen tietämys rationaalisuudesta Merkitään S r :llä joukko niistä puhtaista strategioista, jotka kestävät r kpl epärationalisoituvien strategioiden iteratiivista eliminointia i:n rationalisoituvat strategiat On olemassa joku r > 0 jolle pätee: S r i = S r 1 i, ja mille tahansa l:lle: S r i= S r+l i Teoreema: jos on r:n asteen yleinen tietämys tilassa ja i asettaa :ssa positiiviset todennäköisyydet s i :n, s i kestää r kpl iteratiivista eliminointia
Esimerkki: Beauty contest Pelaajat valitsevat luvun 0:n ja 100:n välillä, luku joka on lähimpänä 2/3 kaikkien lukujen aritmeettisesta keskiarvosta voittaa Ensin eliminoidaan kaikki epärationalisoituvat strategiat 67 100, jäljelle jää 0 66 Seuraavasti eliminoidaan luvut 45 66, jne. Dominoitujen strategioiden eliminointi antaa ainoaksi rationalisoituvaksi strategiaksi 0 (jos sallitaan kaikki reaaliluvut)
Beauty contest, jatk. Pelaaja voittaa käyttämällä yhtä iterointikertaa enemmän kuin vastapelaajat Ei pidä ajatella kuinka monta iterointia muut pystyvät tehdä, vaan pikemminkin miten monta iterointia vastapelaajat luulevat että muut pelaajat tekevät Pelaajat käyttävät yleensä jonkun tason iteroitua dominanssia, väh. 10% käyttää jotain korkeamman tason (2 4) dominanssia, tasojen mediaani on 2 (Camerer 2003) Numeroiden keskiarvo on testeissä ollut 35 (2 3 iterointia) Testi tässä kurssissa antoi keskiarvon ~9 Kurssilaiset käyttivät n. 3 iterointikertaa enemmän (6kpl)
Toinen esimerkki: matkustajan dilemma (Traveler s dilemma) 2 liikemiestä ovat liikematkalla ja heidän lentojensa kuitit ovat hukassa Heidän esimiehensä pyytää molempien ilmoittavan toisistaan riippumatta rahasumman 2:n ja n:n dollarin välillä Jos he ilmoittavat saman summan, molemmat saavat kyseisen summan takaisin Jos he ilmoittavat eri summat, molemmat saavat pienemmän summan ja lisäksi sen summan ilmoittaja saa 2$ bonusta rehellisyydestä ja toinen saa 2$ vähemmän huijausyrityksestä Seuraavaksi esimerkki pelistä jossa n=5
Matkustajan dilemma, jatk. s 2 s 3 s 4 s 5 s 2 2,2 4,0 4,0 4,0 s 3 0,4 3,3 5,1 5,1 s 4 0,4 1,5 4,4 6,2 s 5 0,4 1,5 2,6 5,5 s 4 dominoi s 5 :ta heikosti, mutta sekastrategia s 4 + (1 )s 2 dominoi vahvasti kun 0 < < ½ s 5 eliminoidaan pois Sitten s 4 on dominoitu sekastrategiasta s 2 + (1 )s 3 s 4 pois Sitten s 2 dominoi s 3 :a vahvasti, ja s 3 :a voidaan vielä eliminoida s 2 ainoa strategia joka kestää dominoitujen strategioiden eliminointi s 2 ainoa rationalisoituva strategia ja ainoa NE
Matkustajan dilemma, jatk. Onko tulos uskottava tosielämässä? Jos n=100, rationalisoituva strategia on sama 2,2, mutta esim. strategiat s>92 antaisivat vähintään tuloksen 90 Jutun syyllinen on yleinen tietämys rationaalisuudesta, joka on ainoa kyseenalainen oletus jota tehtiin rationalisoituvuuden määrittelyssä Ei ole epärationaalista valita joku muu strategia kuin 2,2, mutta se ei olisi linjassa CKR:n kanssa
Muuta pohdittavaa Mitä ihminen tietää että hän tietää? Miten hän voi tietää mitä muut tietävät? Onko yleinen tietämys (esim. rationaalisuudesta) pelaajien hyväksi?
TACK!
Kotitehtävä 1: Sukupuolten taistelu rahanpoltolla Kuten tavallinen sukup.taistelu, mutta Alfredo sanoo ensin: voin polttaa yhden (tuotostani) ennen kuin valitsen, jos haluan antaisi Alfredolle 1 vähemmän tuotoissa Peli normaalimuodossa: nn no on oo en 3,1 3,1 0,0 0,0 eo 0,0 0,0 1,3 1,3 pn 2,1 1,0 2,1 1,0 po 1,0 0,3 1,0 0,3 esim. on : Violetta valitsee oopperan jos Alfredo polttaa yhden ja nyrkkeilyn jos hän ei polta esim. en : Alfredo ei polta, valitsee nyrkkeilyn; po : Alfredo polttaa yhden ja valitsee oopperan
Kotitehtävä 1, jatk. Ratkaise peli eliminoinnilla heikosti dominoidut strategiat Onko tulos uskottava? Jos ei, mistä se voisi johtua?
Kotitehtävä 2 a) Todista että ja/tai selitä miksi: peleissä joissa on NE:t täysin sekastrategioilla (ei NE:tä puhtailla strategioilla), pelin kaikki strategiat ovat rationalisoituvat tai b) Todista että jokainen NE puhtailla strategioilla on myös rationalisoituva tasapaino