Pohdiskeleva ajattelu ja tasapainotarkennukset

Samankaltaiset tiedostot
LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

Pelien teoriaa: tasapainokäsitteet

Yhteistyötä sisältämätön peliteoria jatkuu

Johdanto peliteoriaan Kirja kpl. 2

Tasapaino epätäydellisen tiedon peleissä

SEKASTRATEGIAT PELITEORIASSA

Luento 5: Peliteoriaa

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Nollasummapelit ja bayesilaiset pelit

Yhteistyötä sisältämätön peliteoria

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Luento 8. June 3, 2014

Sekastrategiat ja intensiiviyhteensopivuus

PELITEORIAN PERUSTEITA

Dynaaminen hintakilpailu ja sanattomat sopimukset

Luento 5: Peliteoriaa

Signalointi: autonromujen markkinat

Yleinen tietämys ja Nashin tasapaino

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Sekastrategia ja Nash-tasapainon määrääminen

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Luento 5: Peliteoria

Luento 7. June 3, 2014

HUUTOKAUPPATEORIAA TTS-Kurssille/Kultti 2012

Luento 9. June 2, Luento 9

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Bayesilainen päätöksenteko / Bayesian decision theory

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Projektin keskeyttäminen, uudelleen käynnistäminen ja hylkääminen

Mikrotalousteoria 2, 2008, osa IV

Tutkimustiedonhallinnan peruskurssi

Peliteoria luento 1. May 25, Peliteoria luento 1

Projektin arvon aleneminen

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

Evolutiivisesti stabiilin strategian oppiminen

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Lyhyen aikavälin hintakilpailu 2/2

Ratkaisuehdotus 2. kurssikokeeseen

4 Matemaattinen induktio

Hintakilpailu lyhyellä aikavälillä

Mainonta ja laatu tuotteiden erilaistamisessa

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Prof. Marko Terviö Assist. Jan Jääskeläinen

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

Opettaminen ja oppiminen

1. Tilastollinen malli??

Ratkaisuehdotus 2. kurssikoe

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Peliteoria luento 3. May 27, Peliteoria luento 3

Prof. Marko Terviö Assist. Jan Jääskeläinen

Investointimahdollisuudet ja investointien ajoittaminen

Tutkimuksia pelien ja mekanismien suunnittelun teoriasta *

Epätäydellisen tiedon jatkuvat pelit

Päätöksentekomenetelmät

Evolutiivinen stabiilisuus populaation

INTERVALLIPÄÄTÖSPUUT JANNE GUSTAFSSON 45433E. Mat Optimointiopin seminaari Referaatti

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari

Äärellisten mallien teoria

Toistetun haukka-kyyhky -pelin numeerinen analysointi

Luento 3: Bayesiläiset pelit

Tarkastelemme ensin konkreettista esimerkkiä ja johdamme sitten yleisen säännön, joilla voidaan tietyissä tapauksissa todeta kielen ei-säännöllisyys.

Peliteoria ja kalatalous YE4

Päätöksentekomenetelmät

III- Divisioona playoff- ottelut Etelän loppusarjan ylempi jatkosarja ja Kymi-Saimaan loppusarja

JOHDATUSTA PELITEORIAAN

Ei-yhteydettömät kielet [Sipser luku 2.3]

3. Teoriaharjoitukset

Moraalinen uhkapeli: laajennuksia ja sovelluksia

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Rationaalisen valinnan teoria

Matematiikan tukikurssi, kurssikerta 2

Luku 2. Jatkuvien funktioiden ominaisuuksia.

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

Pelit matematiikan opetuksessa

T Privacy amplification

2. Uskottavuus ja informaatio

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

Vieruskaverisi on tämän päivän luennolla työtoverisi. Jos sinulla ei ole vieruskaveria, siirry jonkun viereen. Esittäytykää toisillenne.

Äärellisten mallien teoria

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Informaatio ja Strateginen käyttäytyminen

Laskuharjoitus 5. Mitkä ovat kuvan 1 kanavien kapasiteetit? Kuva 1: Kaksi kanavaa. p/(1 p) ) bittiä lähetystä kohti. Voidaan

CHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi

Strategiset valinnat Taloustieteen perusteet Matti Sarvimäki. A. Peliteorian alkeet. Johdanto. Johdanto 15/09/19

Yhtälönratkaisusta. Johanna Rämö, Helsingin yliopisto. 22. syyskuuta 2014

2. Teoriaharjoitukset

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

1. Osoita, että joukon X osajoukoille A ja B on voimassa toinen ns. de Morganin laki (A B) = A B.

Transkriptio:

Pohdiskeleva ajattelu ja tasapainotarkennukset Sanna Hanhikoski 24.3.2010

Sisältö Pohdiskeleva ajattelu Nashin tasapainotarkennukset Täydellinen tasapaino Täydellinen bayesiläinen tasapaino Vaiheittainen tasapaino Lokaalin parhaan vasteen kriteeri

Pohdiskeleva ajattelu (reflective reason) Pohdiskelevan ajattelun (tai päättelyn) hyväksikäyttö ennustamaan yksilön pelaamista Oletetaan että päädytään Nashin tasapainoratkaisuun Usein useita Nashin tasapainoratkaisuja joista kuitenkin vain osaa järkevät (reasonable) henkilöt pelaavat

Nashin tasapainotarkennukset (Nash equilibria refinement) Kriteerit jotka pätevät ainoastaan järkeville Nashin tasapainoille Pohdiskeleva ajattelu eli epävirallinen tieto siitä kuinka rationaaliset yksilöt pelaavat Useita erilaisia kriteerejä Perinteiset perustuvat osapelitäydellisyyteen

Osapelitäydellinen tasapaino (subgame-perfect equilibrium) Osapeli alkaa solmusta jossa siihenastisen pelin tapahtumat yleisesti tiedossa Osapelitäydellinen tasapaino on pelin osasta löytyvä Nashin tasapaino

Täydellinen tasapaino (Perfect equilibrium) Jos on mahdollista että pelaaja tekee virheen, kaikissa päätössolmuissa vieraillaan positiivisella todennäköisyydellä NE σ on täydellinen jos kaikilla δ > 0 on olemassa ε > 0 s.e. tasapaino säilyy δ päässä σ:ta kun jokin pelin tapahtuma heiluu ε verran L 1,5 Alice l 0, 0 R Bob r 2, 1

Täydellinen bayesiläinen tasapaino (Perfect bayesian equilibrium) 1. Jokaisessa informaatiojoukossa pelaajalla on uskomus siitä missä solmussa ollaan 2. Pelaaja maksimoi odotetun hyötynsä uskomuksensa mukaisesti 3. Niissä informaatiotiloissa, jotka ovat tasapainopolulla, uskomukset päivittyvät toisten pelaajien siihenastisista päätöksistä ja tasapainostrategioista 4. Niissä informaatiotiloissa, joiden saavuttamisen todennäköisyys on nolla, uskomukset päivittyvät toisten pelaajien siihenastisista päätöksistä ja tasapainostrategioista ELI: Nashin tasapaino on täydellinen bayesilainen jos johdonmukaiset uskomukset auttavat pelaajaa tuoton maksimoinnissa Lähde: Gibbons, R. A Primer in Game Theory. Prentice Hall, 1992.

Täydellinen bayesiläinen tasapaino (Perfect bayesian equilibrium) Osapelitäydellinen Nashin tasapaino (L, L, r) Vaatimukset 1-3 täyttyy, kaikki informaatiojoukot tasapainopolulla (joten 4 ei tarvita), joten täydellinen bayesiläinen tasapaino Jos p=0 ja tarkastellaan Nash tasapainoa (R,L,l), vaatimukset 1-3 toteutuvat koska pelaajilla uskomukset ja toimivat optimaalisesti niiden mukaan. Ei kuitenkaan osapelitäydellinen Bobin uskomus ja Alicen strategia ristiriidassa Bobin informaatiojoukko ei tasapainopolulla Vaatimus 4 pakottaa Bobin uskomusten perustuvan Alicen strategiaan 1,2,1 L Carol L Alice R R p 1-p Bob l r l r 2,0,0 3,3,3 0,1,2 0,1,1 Lähde: Gibbons, R. A Primer in Game Theory. Prentice Hall, 1992.

Vaiheittainen tasapaino (Sequential equilibrium) Vastaava kuin täydellinen bayesiläinen tasapaino, mutta joissakin sovelluksissa toimivampi Arvostus eli (strategia, uskomus) Ei käytä ei-tasapainopolulla sattumanvaraisia arvostuksia vaan aiheuttaa strategiassa häiriöitä Ja vaatii että informaatiojoukon arvostus eitasapainopolulla on raja-arvostus kun häiriö lähenee nollaa Eli yhden solmun informaatiojoukossa ei mahdollista vaihtaa strategiaa kesken kaiken Uskomukset oltava järkeviä Lähde :Kreps,D.M, Wilson, R. Sequential Equilibria. Econometrica 50(1982)4

Esimerkki-vaiheittainen tasapaino 1/2 Nashin tasapainot Ll ja Rr Arvostus (( ) ({ LM} )) ( ) = 1( ) 2( { LM} ) β, µ β 0, β,, µ, Termi 1: todennäköisyysjakauma Alicen strategioiden yli Termi 2: todennäköisyysjakauma Bobin strategioiden yli kun Alice valinnut L tai M Termi 3: Bobin uskomus kun saa pelata M dominoitu oletetaan että sen pelaamisen todennäköisyys on nolla Alice R 2,2 L M p Bob 1-p l r l r 3,1 1,0 0,0 0,1 Lähde: Oslon yliopiston kurssin Topics in microeconomics esimerkki

Esimerkki-vaiheittainen tasapaino 2/2 µ ({ LM} )( L) Uskomus Bayesin säännöstä µ ({ })( M ) Näillä uskomuksilla Bobin strategia on osa vaiheittaista tasapainoa jos valitsee l todennäköisyydellä 1 Vastaavasti Alicen strategia on osa vaiheittaista tasapainoa jos valitsee L todennäköisyydellä 1 Eräs vaiheittainen tasapaino ( ) = 1( ) 2( { LM} ) (( 1, 0, 0 ), ( 1, 0 )), ( 1, 0) =, (( 0,, ), ({ LM, })) ( ) β µ β β µ 3,1 L β1 ( 0/ )( L) ( 0/ )( L) + β ( 0/ )( M), = = 1 β L, M = 0 1 1 Alice p Bob 1-p l r l r R M 2,2 1,0 0,0 0,1

Lokaalin parhaan vasteen kriteeri (Local best response criterion) Gintisin esittelemä tasapainotarkennus Käyttää etuperin induktiota: pelaaja päättelee toisten pelaajien siirrot tulevaisuudessa perustuen siihen että on päästy tiettyyn solmuun ja että toiset ovat rationaalisia Nashin tasapaino σ on LBR tasapaino jos oletukset tukevat tasapainoon σ päätymistä Oletukset: jos useita vaihtoehtoja pelaaja valitsee suurimman tuoton pelaaja rajoittuu tarkastelemaan muiden käytöstä vain Nashin tasapainoon johtavalla polulla

Esimerkki LBR kriteeri Nash tasapainot (R,r) ja (L,σ B ), jossa σ B (r) ½ Alice Bobin informaatiojoukossa ainoa Nash tasapaino on (R,r) Alice olettaa Bobin valitsevan r johon paras vaste on R L 1,5 l R Bob r Bob olettaa Alicen valitsevan R johon paras vaste on r 0, 0 2, 1 (R,r) on ainoa LBR tasapaino

LBR vastaan täydellinen bayesiläinen 1/2 Nash tasapainot Rbr, Rσ A σ B (σ A (b) ½ja σ B (l) ½) ja Mbl Carol R 1,0,0 Kaikki osapelitäydellisiä ja täydellisiä bayesiläisiä tasapainoja Alice L M Rbr on täydellinen bayesiläinen b a b a Bob jos Bob uskoo että Alice valitsi a vähintään todennäköisyydellä ⅔ 0,1,0 0,0,0 l r l r ei vaiheittainen koska jos Alice saa pelata valitsee b 2,2,2 0,0,0 0,0,0 0,0,1

LBR vastaan täydellinen bayesiläinen 2/2 Rbr ei LBR Carole saa 1 jos valitsee R, valitsemalla M suurempi tuotto L Carol R M 1,0,0 Jos Alice saa pelata niin valitsee järkevänä b b Alice a b a Bob Jos Bob saa pelata (koska Carol valinnut M ja Alice b) paras vaste l Mbl on ainoa LBR tasapaino 0,1,0 0,0,0 l r 2,2,2 0,0,0 l r 0,0,0 0,0,1

Vaiheittainen vs. LBR Nash tasapainot M ja N Tasapaino M vaiheittainen N ei täydellinen bayesiläinen Ainut NE jossa Carol pelaa on N jolloin valitsee l Paras vaste Bobilta on a Alice olettaa että l ja a valittu jolloin kannattaa valita D Dal on LBR Alice A Bob a D d Carol l r l r 4,4,4 1,1,1 5,5,0 2,2,2 {(,, ( ) ) 1 l 1 l 0 l 3} (, ( 1 ), ) 1 a a a 1 M = A a pl+ p r p { 2 } N = D p a+ p d l p 3,3,0

Päättelystä Puutteellinen päättely (insufficient reason) Pelissä, jossa Bobin informaatiojoukon haarat symmetrisiä, ei voi päätellä kummassa haarassa ollaan Alicen päätöksen jälkeen Rehellinen vuorovaikutus (honest communication) Pelaajat sopivat siirroista etukäteen ja pitävät lupauksensa jos lupauksen rikkominen ei kannata

Lopuksi Nashin tasapainotarkennukset pyrkivät karsimaan tasapainoista pois järjettömät ratkaisut Perustuu pohdiskelevaan ajatteluun kuinka rationaaliset yksilöt pelaavat LBR kriteeri on Gintisin esittelemä uusi tasapainotarkennus Perustuu etuperin induktion käyttöön tasapainopolulla Pelin ainoa NE on sekä osapelitäydellinen että LBR

Kotitehtävä Etsi viereisen pelin Nash tasapainot Mitkä niistä ovat osapelitäydellisiä, täydellisiä bayesiläisiä ja LBR tasapainoja? Perustele lyhyesti vastauksesi Alice R 2,2 L M p Bob 1-p l r l r 4,1 0,0 3,0 0,1