Yhteistyötä sisältämätön peliteoria

Yhteistyötä sisältämätön peliteoria jarkko.murtoaro@hut.fi Optimointiopin seminaari Kevät 2003 / 1

Sisältö Johdanto Käsitteistö Työkalut Nashin tasapaino Täydellinen tasapaino Optimointiopin seminaari Kevät 2003 / 2

Johdanto John Nash 1951: Non-Cooperative games Tarjoaa matemaattiset työkalut ristiriitoja sisältävien tilanteiden analysointiin (vapaa talous, yhteiskunta, etc.) Sisältää useamman hengen pelejä, joissa kukin pelaaja: Yrittää maksimoida hyötynsä On sidoksissa muihin pelaajiin muutamalla säännöllä Voi kertoa yhteistyötä koskevat toivomukset vain käyttäytymisellä, mutta ei suoralla viestinnällä Optimointiopin seminaari Kevät 2003 / 3

Käsitteistö Pelaajat: indeksijoukko I = {1,,n} Strategiat: a i A i i I Hyötyfunktiot: u i : A 1 * * A 2 R, i I Staattinen peli: Päätökset samanaikaisia Dynaaminen peli: Päätökset tehdään ajassa edeten Laaja muoto: Peli esitetään päätöspuuna Normaalimuoto: Peli esitetään matriisina Puhdas strategia: Strategiaan ei liity epävarmuutta Sekastrategia: Strategiaan liittyy epävarmuutta (Heikosti) Dominoitu strategia: Jokin toinen strategia johtaa (vähintään yhtä hyvään) parempaan lopputulemaan riippumatta muiden pelaajien strategioista Reaktiojoukko: Pelaajan reaktio muiden strategioihin Optimointiopin seminaari Kevät 2003 / 4

Käsitteistö graafisesti r 1 r 2 O 2 S N O 1 A 2 Pareto-tehokas joukko A 1 Optimointiopin seminaari Kevät 2003 / 5

Pelien luokittelua; Pakin sisältö Täysi informaatio Vajaa informaatio Staattinen Nash Bayes Dynaaminen Täydellinen Täydellinen Bayes Optimointiopin seminaari Kevät 2003 / 6

Nashin tasapaino (1/3) Oletukset; pelikentän määritys: Pelaajat täysin rationaalisia Pelaajat ovat yhtä hyviä Tasapaino, Ratkaisu, Nash = Kuinka paljon hyötyä/tappiota voin olettaa saavani? Optimointiopin seminaari Kevät 2003 / 7

Nashin tasapaino (2/3) Nash: Tulokset kehittyvät toiseen kahdesta mahdollisesta tasapainotilasta Jos yksittäinen pelaaja muuttaisi strategiaansa tasapainotilasta, johtaisi se henkilökohtaiseen menetykseen Optimaalinen: suurin mahdollisuus saada palkinto Suboptimaalinen: suurin mahdollisuus välttää rangaistus Menettely Tehdäkseen optimaalisen päätöksen pelaajan on ennakoitava vastustajan käyttäytymistä Vastustaja tuskin pelaa dominoitua strategiaa Eliminoidaan siis dominoidut strategiat peräjälkeen Graafinen Optimointiopin seminaari Kevät 2003 / 8

Nashin tasapaino; Esimerkki (3/3) 2 pidätettyä Ei saa kommunikoida Lopputulema Pareto-tehoton Vanki 2 Vanki 1 Vasikoi Vaikene Vasikoi -2,-2 3,-3 Dominoitu strategia Vaikene -3,3 2,2 Optimointiopin seminaari Kevät 2003 / 9

Täydellinen tasapaino (1/5) Nashistä jatkojalostettu dynaamisten pelien ratkaisu Pelaaja tekee osan liikkeistään havaittuaan osan vastustajan liikkeistä Pelaajalla myös mahdollisuus vaikuttaa vastustajansa liikkeisiin (uhata, luvata, etc.) Perusidea: Valitaan Nash-ratkaisut, jotka eivät sisällä epäuskottavia uhkia Vaaditaan, että pelaajat käyttäytyisivät optimaalisesti myös kaikissa osapeleissä, jolloin voidaan jälleen eliminoida dominoidut strategiat osapelien kohdalla Optimointiopin seminaari Kevät 2003 / 10

Täydellinen tasapaino (2/5) Hyödyllinen kahden yleisesti käytetyn pelityypin analysoinnissa. Täyden informaation pelit: vuorossa oleva pelaaja on täysin tietoinen pelin aikaisemmista vaiheista Lähes täyden informaation pelit: pelaajat ovat yhtä aikaa vuorossa ja ovat täysin tietoisia pelin aikaisemmista vaiheista Optimointiopin seminaari Kevät 2003 / 11

Täydellinen tasapaino (3/5) Esim. Kpl 5: määrä-hinta pelit, kpl 6: lyhyen aikavälin hinnoittelupeli, etc. Ratkaistaan peli loppupäästä lähtien eliminoimalla peräjälkeen dominoidut strategiat (vrt. päätöspuu) Graafinen ratkaisu: Määrätään seuraajan reaktiokäyrä ja etsitään johtajan hyötyfunktion maksimi kyseisellä käyrällä Optimointiopin seminaari Kevät 2003 / 12

Täydellinen tasapaino (4/5) r 1 r 2 O 2 S N O 1 A 2 Pareto-tehokas joukko A 1 Optimointiopin seminaari Kevät 2003 / 13

Esimerkki: Väljähtyminen Dynaaminen, lähes täyden informaation peli Mallintaa ryhmäpsykologiaa Kukin pelaaja voi jäädä tai lähteä Jos enemmistö irrottautuu, irrottautuneet saa 1 Jos vähemmistö irrottautuu, irrottautuneet saa sakkoa -0,1 Ryhmään jääneitä ei palkita tai sakoteta 1 Ryhmä 0 Optimi: kaikki irrottautuu! Suboptimi: kaikki jää ryhmään! -0,1 Optimointiopin seminaari Kevät 2003 / 14

Kotitehtävä Anna jokin esimerkki väljähtymispelin suboptimaalisesta tasapainotilasta nykytaloudessa Esitä keinoja, joilla toimijat kuvailemassasi esimerkissä voitaisiin nostaa pois suboptimaalisesta tilasta Vihje: Mieti peliä, jossa pelaajat pelaavat minimoidakseen omia tappioita Optimointiopin seminaari Kevät 2003 / 15