Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Samankaltaiset tiedostot
SEKASTRATEGIAT PELITEORIASSA

Peliteoria luento 3. May 27, Peliteoria luento 3

Sekastrategiat ja intensiiviyhteensopivuus

Pelien teoriaa: tasapainokäsitteet

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

PELITEORIAN PERUSTEITA

Sekastrategia ja Nash-tasapainon määrääminen

Pohdiskeleva ajattelu ja tasapainotarkennukset

Johdanto peliteoriaan Kirja kpl. 2

Peliteoria luento 2. May 26, Peliteoria luento 2

Luento 8. June 3, 2014

Luento 7. June 3, 2014

Luento 5: Peliteoriaa

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Luento 5: Peliteoriaa

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Yhteistyötä sisältämätön peliteoria jatkuu

Nollasummapelit ja bayesilaiset pelit

Yleinen tietämys ja Nashin tasapaino

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Tasapaino epätäydellisen tiedon peleissä

Yhteistyötä sisältämätön peliteoria

JOHDATUSTA PELITEORIAAN

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Signalointi: autonromujen markkinat

Peliteoria luento 1. May 25, Peliteoria luento 1

Epätäydellisen tiedon jatkuvat pelit

Evolutiivinen stabiilisuus populaation

Mikrotalousteoria 2, 2008, osa IV

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Luento 5: Peliteoria

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Luento 9. June 2, Luento 9

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Johdatus peliteoriaan

Dynaaminen hintakilpailu ja sanattomat sopimukset

Reaalifunktioista 1 / 17. Reaalifunktioista

Paljonko maksat eurosta -peli

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

Nollasummapelit ja muut yleisemmät summapelit

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Opettaminen ja oppiminen

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

V. POTENSSISARJAT. V.1. Abelin lause ja potenssisarjan suppenemisväli. a k (x x 0 ) k M

Tietoteoria. Tiedon käsite ja logiikan perusteita. Monday, January 12, 15

Lyhyen aikavälin hintakilpailu 2/2

Johdatus matematiikkaan

Ensimmäinen induktioperiaate

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Ensimmäinen induktioperiaate

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

Luento 2: Strategiset pelit

Prof. Marko Terviö Assist. Jan Jääskeläinen

Nashin tasapainon löytämisen laskennallinen vaativuus

Evolutiivisesti stabiilin strategian oppiminen

Y56 laskuharjoitukset 6

Ongelma 1: Mistä joihinkin tehtäviin liittyvä epädeterminismi syntyy?

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Peliteoria ja huutokauppamekanismit

Valitse vain 6 tehtävää! Kaikkiin tehtäviin tarvittavat välivaiheet esille!

Tehtäväsarja I Seuraavissa tehtävissä harjoitellaan erilaisia todistustekniikoita. Luentokalvoista 11, sekä voi olla apua.

Luento 2: Strategiset pelit, Nash-tasapaino, Bertrand, Cournot & Hotelling

Ongelma 1: Mistä joihinkin tehtäviin liittyvä epädeterminismi syntyy?

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

Hintakilpailu lyhyellä aikavälillä

Kuvio 1 Tasapaino (Equilibrium) on suljettujen ja avointen tietorakenteiden dynaaminen suhde

Luento 6. June 1, Luento 6

Avainsanat: peli, matematiikka, polynomi, yhteen- ja vähennyslasku, kertolasku

Matematiikan tukikurssi, kurssikerta 2

SUBSTANTIIVIT 1/6. juttu. joukkue. vaali. kaupunki. syy. alku. kokous. asukas. tapaus. kysymys. lapsi. kauppa. pankki. miljoona. keskiviikko.

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Prof. Marko Terviö Assist. Jan Jääskeläinen

Johdatus matematiikkaan

Kvanttimekaniikan tulkinta

ESITYS Kulttuuri / Voittava pelaaminen

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Karteesinen tulo. Olkoot A = {1, 2, 3, 5} ja B = {a, b, c}. Näiden karteesista tuloa A B voidaan havainnollistaa kuvalla 1 / 21

Kesällä 2018 pelataan taas kortteliliigaa ilmoittaudu mukaan!

Luku 29 Peliteoria. Käsittelemme aluksi peliteorian peruskäsitteitä ja sanastoa, sitten katsomme itse pelejä.

Pääasiallisena lähteenä: Motwani, R., Raghavan, P.: Randomized algorithms. Cambridge: Cambridge University Press, 1997,

Taloustieteen Nobel peliteorian kehittäjille

Tervetuloa! Mä asun D-rapussa. Mun asunto on sellainen poikamiesboksi.

KICK ASS! FACEBOOK-MARKKINOINNILLA MATKAILULIIKETOIMINTA KASVUUN

Peliteoria ja kalatalous YE4

Vaihtoehtoinen tapa määritellä funktioita f : N R on

Luento 3: Bayesiläiset pelit

Rekursio. Funktio f : N R määritellään yleensä antamalla lauseke funktion arvolle f (n). Vaihtoehtoinen tapa määritellä funktioita f : N R on

Matematiikassa väitelauseet ovat usein muotoa: jos P on totta, niin Q on totta.

Kesällä 2018 pelataan taas kortteliliigaa ilmoittaudu mukaan!

Todistusmenetelmiä Miksi pitää todistaa?

Matematiikan tukikurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Strategiset valinnat Taloustieteen perusteet Matti Sarvimäki. A. Peliteorian alkeet. Johdanto. Johdanto 15/09/19

Dynaaminen hintakilpailu ja sanattomat (epäsuorat) sopimukset osa II

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Valitsemalla sopivat alkiot joudutaan tämän määritelmän kanssa vaikeuksiin, jotka voidaan välttää rakentamalla joukko oppi aksiomaattisesti.

Transkriptio:

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Keskeiset termit: Rationalizability rationalisoituvuus ratkaisukonsepti peliteoriassa Rationalizable rationalisoituva Rationality rationaalisuus pelaajat maksimoivat omaa hyötyään, uskomuksensa suhteen Epistemic game episteminen peli peli joka tutkii tietoteoriaa Common knowledge yleinen tietämys Common knowledge of rationality: CKR

Episteminen peli Episteminen: liittyy tietoteoriaan Koostuu: normaalimuotoisesta pelistä Pelaajista i = 1,,n (muut pelaajat kuin i: i ) Strategiajoukoista S i Tuotoista i Joukko mahdollisista tiloista Tieto osioista P i ja subjektiivisistä priorista p i Tiloista, jotka määräävät käytetyn strategiaprofiilin s=s( )

Epistemiset pelit, jatk. P i = joukko tiloista, jotka ovat todennäköiset i:n mielestä (P i todennäköisyysoperaattori) E = tapaus/tapahtuma (event) Pelaaja i tuntee tapahtuman E tilassa jos P i K i : tieto operaattori, K i E: tapahtuma, jolloin i tuntee E:n Esim. tapahtuma E: sataa jossain päin Helsingissä Tila : Ilkka kävelee Kampissa, jossa sataa Kamppi on Helsingissä E Jokaisessa tilassa P A joka Ilkka luulee olevan mahdollinen, sataa Helsingissä P A E Ilkka tietää että sataa Helsingissä Kuitenkin P A E, koska voi olla toinen tila E jossa sataa Kalliossa muttei Kampissa

Epistemiset pelit, jatk. Pelaaja i:n uskomus (conjecture) i määrittää uskomukset muiden pelaajien suhteen tilassa i on Bayesiläisen rationaalinen jos s i ) maksimoi tuoton i (s i, i ), jossa i (s i, i )= s i S i i (s i i (s i,s i ) i on Bayesiläisen rationaalinen episemisessä pelissä G jos hänen puhtaille strategioille pätee kaikissa : i (s i ), i ) i (s i, i ), s i S i

Esimerkki: episteminen sukupuolten taistelu Violetta n o Alfredo n 3,1 0,0 o 0,0 1,3

Esimerkki, jatk. Violettalla on 4 eri tyyppiä (V i, i = 1,,4): V 1 pelaa t 1 =o, luulee A:n pelaavan o V 2 pelaa t 2 =n, luulee A:n pelaavan n V 3 pelaa t 3 =n, luulee A:n pelaavan sekastrategian paras vaste (best response) V 4 pelaa t 4 =o, luulee A:n pelaavan sekastrategian paras vaste Alfredolla vastaavat tyypit (A i ), strategiat (s i ) ja liittyvät uskomukset Pelin mahdollien tila on ij =(A i,v j,s i,t j ), i,j =1,,4 Esim. E ia on tapus jossa Alfredon typpi on A i, ja Alfredon tieto osio on {E ia, i=1,,4} Molemmat pelaajat ovat Bayesiläisen rationaalisia pelin jokaisessa tilassa, koska jokainen strategia on paras vaste liittyviin uskomuksiin NE: ii, (oikeat uskomukset kun i=1,2), ei sekastrategia NE:tä

Dominoitujen strategioiden eliminointi i:n strategia s i dominoi s i vahvasti (s on aina parempi kuin s ), jos kaikille s i pätee: i (s i, s i ) > i (s i, s i ) s i dominoi s i heikosti (s on aina väh. yhtä hyvä ja joskus parempi), jos kaikille s i pätee: i (s i,s i ) i (s i,s i ) ja epäyhtälö on aito jollekin s i Voi olla ettei mikään puhdas strategia s dominoi s:ää vahvasti, mutta joku sekastrategia dominoi vahvasti

Dominoitujen strategioiden iteratiivinen eliminointi, esimerkki L C R L C R U 0,2 3,1 2,3 M 1,4 2,1 4,1 M 1,4 2,1 4,1 D 2,1 4,4 3,2 D 2,1 4,4 3,2 L C L C C M 1,4 2,1 D 2,1 4,4 D 4,4 D 2,1 4,4

Rationalisoituvuus, rationalisoituvat strategiat Rationaalinen pelaaja ei koskaan pelaisi vahvasti dominoitua strategiaa Saadakseen tietää mitä rationaalinen pelaaja tekee, pitää eliminoida ei rationaaliset strategiat Mitä jää jäljelle kutsutaan rationalisoituvaksi Rationalisoituva tasapaino (Rationalizable equilibrium) Kaikki NE:t ovat rationalisoituvat Dominoitujen strategioiden iteratiivinen eliminointi jättää jäljelle kaikki mahdolliset rationalisoituvat strategiat

Esimerkki: matching pennies A Jokainen puhdas strategia on rationalisoituva NE:t vain sekastrategioilla P(A)=P(B)=0,5 B A 1,1 1, 1 B 1, 1 1,1

Yhdenmukaisuus (Consistency) Pelaaja i:n uskomukset i ovat ensimmäisen asteen yhdenmukaiset (first order consistent) jos ne asettavat positiiviset todennäköisyydet vain niihin j:n strategioihin jotka antavat parhaat tulokset j:lle jonkun todennäköisyysjakauman S j :n suhteen Samalla tavalla, jos i asettaa positiiviset todennäköisyydet pariin s j, s k, koska i tietää että j tietää k:n olevan rationaalinen, i tietää että j:n uskomukset ovat 1. asteen yhdenmukaiset, ja siksi asettaa positiiviset todennäköisyydet vain niihin pareihin s j,s k, joissa j on 1. asteen yhdenmukainen ja j asettaa positiivisen todennäköisyyden s k :n i on toisen asteen yhdenmukainen

Yhdenmukaisuus jatk. Voi määrittää r:n asteen yhdenmukaisuus Uskomus joka on r:n asteen yhdenmukainen kaikilla r:n arvoilla on yhdenmukainen (consistent) Strategia joukko s 1,, s n on rationalisoituva jos löytyy yhdenmukainen joukko uskomuksia 1,, n, jotka asettavat positiivisen todennäköisyyden joukkoon s 1,,s n

Yleinen tietämys rationaalisuudesta Määritelmä: K 1 i=[( j i) i (s j ) > 0 s j B j (S j )], missä B on j:n puhtaiden strategioiden joukko joka on paras vaste johonkin sekastrategiaprofiiliin K 1 ion tapaus, jolloin i uskoo että pelaaja j valitsee s j vain jos s j on paras vaste j:lle Eli i tietää muiden pelaajien olevan rationaalisia Yleinen määritelmä: K r i= K r 1 i [( j i) i (s j ) > 0 s j B_j(K r 1 j)] K 2 ion siis tilanne, jossa i tietää että kaikki pelaajat tietävät että jokainen pelaaja on rationaalinen K r ion vastaava tilanne, jossa on r kpl tietävät että kaikki

Yleinen tietämys rationaalisuudesta, jatk. Merkitään K r = i K r i jos K r, sanotaan että on r:n asteen yleinen tietämys Lopuksi, tapaus yleinen tietämys rationaalisuudesta (CKR) määritellään: K = n r 1 K r Kaikki tietävät että kaikki tietävät että kaikki tietävät että [ ] kaikki tietävät että kaikki ovat rationaalisia Epistemisessä pelissä ei voi olettaa CKR:ää CKR ei ole pelaajien tai pelin informaatiorakenteen ominaisuus Ei ole mitään ei rationaalista CKR:n puutteessa

Rationalisoituvuus ja yleinen tietämys rationaalisuudesta Merkitään S r :llä joukko niistä puhtaista strategioista, jotka kestävät r kpl epärationalisoituvien strategioiden iteratiivista eliminointia i:n rationalisoituvat strategiat On olemassa joku r > 0 jolle pätee: S r i = S r 1 i, ja mille tahansa l:lle: S r i= S r+l i Teoreema: jos on r:n asteen yleinen tietämys tilassa ja i asettaa :ssa positiiviset todennäköisyydet s i :n, s i kestää r kpl iteratiivista eliminointia

Esimerkki: Beauty contest Pelaajat valitsevat luvun 0:n ja 100:n välillä, luku joka on lähimpänä 2/3 kaikkien lukujen aritmeettisesta keskiarvosta voittaa Ensin eliminoidaan kaikki epärationalisoituvat strategiat 67 100, jäljelle jää 0 66 Seuraavasti eliminoidaan luvut 45 66, jne. Dominoitujen strategioiden eliminointi antaa ainoaksi rationalisoituvaksi strategiaksi 0 (jos sallitaan kaikki reaaliluvut)

Beauty contest, jatk. Pelaaja voittaa käyttämällä yhtä iterointikertaa enemmän kuin vastapelaajat Ei pidä ajatella kuinka monta iterointia muut pystyvät tehdä, vaan pikemminkin miten monta iterointia vastapelaajat luulevat että muut pelaajat tekevät Pelaajat käyttävät yleensä jonkun tason iteroitua dominanssia, väh. 10% käyttää jotain korkeamman tason (2 4) dominanssia, tasojen mediaani on 2 (Camerer 2003) Numeroiden keskiarvo on testeissä ollut 35 (2 3 iterointia) Testi tässä kurssissa antoi keskiarvon ~9 Kurssilaiset käyttivät n. 3 iterointikertaa enemmän (6kpl)

Toinen esimerkki: matkustajan dilemma (Traveler s dilemma) 2 liikemiestä ovat liikematkalla ja heidän lentojensa kuitit ovat hukassa Heidän esimiehensä pyytää molempien ilmoittavan toisistaan riippumatta rahasumman 2:n ja n:n dollarin välillä Jos he ilmoittavat saman summan, molemmat saavat kyseisen summan takaisin Jos he ilmoittavat eri summat, molemmat saavat pienemmän summan ja lisäksi sen summan ilmoittaja saa 2$ bonusta rehellisyydestä ja toinen saa 2$ vähemmän huijausyrityksestä Seuraavaksi esimerkki pelistä jossa n=5

Matkustajan dilemma, jatk. s 2 s 3 s 4 s 5 s 2 2,2 4,0 4,0 4,0 s 3 0,4 3,3 5,1 5,1 s 4 0,4 1,5 4,4 6,2 s 5 0,4 1,5 2,6 5,5 s 4 dominoi s 5 :ta heikosti, mutta sekastrategia s 4 + (1 )s 2 dominoi vahvasti kun 0 < < ½ s 5 eliminoidaan pois Sitten s 4 on dominoitu sekastrategiasta s 2 + (1 )s 3 s 4 pois Sitten s 2 dominoi s 3 :a vahvasti, ja s 3 :a voidaan vielä eliminoida s 2 ainoa strategia joka kestää dominoitujen strategioiden eliminointi s 2 ainoa rationalisoituva strategia ja ainoa NE

Matkustajan dilemma, jatk. Onko tulos uskottava tosielämässä? Jos n=100, rationalisoituva strategia on sama 2,2, mutta esim. strategiat s>92 antaisivat vähintään tuloksen 90 Jutun syyllinen on yleinen tietämys rationaalisuudesta, joka on ainoa kyseenalainen oletus jota tehtiin rationalisoituvuuden määrittelyssä Ei ole epärationaalista valita joku muu strategia kuin 2,2, mutta se ei olisi linjassa CKR:n kanssa

Muuta pohdittavaa Mitä ihminen tietää että hän tietää? Miten hän voi tietää mitä muut tietävät? Onko yleinen tietämys (esim. rationaalisuudesta) pelaajien hyväksi?

TACK!

Kotitehtävä 1: Sukupuolten taistelu rahanpoltolla Kuten tavallinen sukup.taistelu, mutta Alfredo sanoo ensin: voin polttaa yhden (tuotostani) ennen kuin valitsen, jos haluan antaisi Alfredolle 1 vähemmän tuotoissa Peli normaalimuodossa: nn no on oo en 3,1 3,1 0,0 0,0 eo 0,0 0,0 1,3 1,3 pn 2,1 1,0 2,1 1,0 po 1,0 0,3 1,0 0,3 esim. on : Violetta valitsee oopperan jos Alfredo polttaa yhden ja nyrkkeilyn jos hän ei polta esim. en : Alfredo ei polta, valitsee nyrkkeilyn; po : Alfredo polttaa yhden ja valitsee oopperan

Kotitehtävä 1, jatk. Ratkaise peli eliminoinnilla heikosti dominoidut strategiat Onko tulos uskottava? Jos ei, mistä se voisi johtua?

Kotitehtävä 2 a) Todista että ja/tai selitä miksi: peleissä joissa on NE:t täysin sekastrategioilla (ei NE:tä puhtailla strategioilla), pelin kaikki strategiat ovat rationalisoituvat tai b) Todista että jokainen NE puhtailla strategioilla on myös rationalisoituva tasapaino