Sekastrategia ja Nash-tasapainon määrääminen

Samankaltaiset tiedostot
Peliteoria luento 3. May 27, Peliteoria luento 3

Luento 8. June 3, 2014

Luento 7. June 3, 2014

SEKASTRATEGIAT PELITEORIASSA

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Johdanto peliteoriaan Kirja kpl. 2

Luento 9. June 2, Luento 9

Pelien teoriaa: tasapainokäsitteet

Luento 5: Peliteoriaa

Luento 5: Peliteoriaa

Yhteistyötä sisältämätön peliteoria jatkuu

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Luento 5: Peliteoria

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Hintakilpailu lyhyellä aikavälillä

PELITEORIAN PERUSTEITA

Nollasummapelit ja bayesilaiset pelit

Sekastrategiat ja intensiiviyhteensopivuus

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Peliteoria luento 1. May 25, Peliteoria luento 1

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

Y56 laskuharjoitukset 6

HUUTOKAUPPATEORIAA TTS-Kurssille/Kultti 2012

JOHDATUSTA PELITEORIAAN

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

Luento 3: Bayesiläiset pelit

Peliteoria luento 2. May 26, Peliteoria luento 2

Johdatus peliteoriaan

MIKROTEORIA, HARJOITUS 8

Yhteistyötä sisältämätön peliteoria

Pohdiskeleva ajattelu ja tasapainotarkennukset

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Peliteoria ja huutokauppamekanismit

1 Komparatiivinen statiikka ja implisiittifunktiolause

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Evolutiivinen stabiilisuus populaation

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17)

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Rationaalisen valinnan teoria

Signalointi: autonromujen markkinat

Tasapaino epätäydellisen tiedon peleissä

Miten osoitetaan joukot samoiksi?

Lyhyen aikavälin hintakilpailu 2/2

Epätäydellisen tiedon jatkuvat pelit

Mikrotalousteoria 2, 2008, osa IV

1. Kuntosalilla on 8000 asiakasta, joilla kaikilla on sama salikäyntien kysyntä: q(p)= P, missä

Voidaan laskea siis ensin keskimääräiset kiinteät kustannukset AFC: /10000=10

Nollasummapelit ja muut yleisemmät summapelit

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Luento 6. June 1, Luento 6

Dynaaminen hintakilpailu ja sanattomat sopimukset

Harjoitus 7: vastausvihjeet

Evolutiivisesti stabiilin strategian oppiminen

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Prof. Marko Terviö Assist. Jan Jääskeläinen

T H V 2. Kuva 1: Stirling kiertoprosessi. Ideaalisen Stirlingin koneen sykli koostuu neljästä osaprosessista (kts. kuva 1):

Luento 12: Duaalitehtävä. Tarkennuksia Lagrangen kertoimen tulkintaan. Hajautettu optimointi.

MIKROTEORIA, HARJOITUS 6 YRITYKSEN JA TOIMIALAN TARJONTA JA VOITTO TÄYDELLISESSÄ KILPAILUSSA, SEKÄ MONOPOLI

Prof. Marko Terviö Assist. Jan Jääskeläinen

Kysyntä (D): hyötyfunktiot, hinta, tulot X = X(P,m) Tarjonta (S): tuotantofunktiot, hinta, panoshinta y = y(p,w)

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Kvanttimekaniikan tulkinta

Luento 12: Duaalitehtävä. Tarkennuksia Lagrangen kertoimen tulkintaan. Hajautettu optimointi.

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Luento 2: Strategiset pelit

Estimointi. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Ratkaisuehdotukset LH 8 / vko 47

1 Eksergia ja termodynaamiset potentiaalit

Taloustieteen perusteet 31A Ratkaisut 3, viikko 4

Varian luku 12. Lähde: muistiinpanot on muokattu Varianin (2006, instructor s materials) muistiinpanoista

Luku 26 Tuotannontekijämarkkinat. Tuotannontekijämarkkinat ovat tärkeä osa taloutta. Esimerkiksi

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Yleinen tietämys ja Nashin tasapaino

Taloustieteen Nobel peliteorian kehittäjille

12 Oligopoli ja monopolistinen kilpailu

Moraalinen uhkapeli: perusmalli ja optimaalinen sopimus

Yhtälönratkaisusta. Johanna Rämö, Helsingin yliopisto. 22. syyskuuta 2014

HN = {hn h H, n N} on G:n aliryhmä.

Ellipsoidimenetelmä. Samuli Leppänen Kokonaislukuoptimointi. S ysteemianalyysin Laboratorio

Matematiikan tukikurssi

Laskuharjoitus 2. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Viime kerralta Epävarmuus ja riski Optimaalinen kulutus-säästämispäätös: Tulo- ja substituutiovaikutus analyyttinen tarkastelu Epävarmuus Epävarmuus

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

1. Arvioi kummalla seuraavista hyödykkeistä on hintajoustavampi kysyntä

Luku 26 Tuotannontekijämarkkinat. Tuotannontekijämarkkinat ovat tärkeä osa taloutta. Esimerkiksi

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Pääasiallisena lähteenä: Motwani, R., Raghavan, P.: Randomized algorithms. Cambridge: Cambridge University Press, 1997,

Diskreetin matematiikan perusteet Malliratkaisut 2 / vko 38

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Asymmetrinen informaatio

Transkriptio:

May 24, 2016

Sekastrategia Monissa peleissä ei ole Nash-tasapainoa puhtaissa strategioissa H T H 1, 1 1, 1 T 1, 1 1, 1 Ratkaisu ongelmaan löytyy siitä, että laajennetaan strategiat käsittämään todennäköisyysjakaumat yli pelin valintojen. Edellisessä pelissä pelaajien valintajoukot ovat S 1 = S 2 = {p : p [0, 1]} ja tulkinta on, että p on todennäköisyys valita H ja 1 p on todennäköisyys valita T. Jos pelaajan valintojen joukko on A = {a 1,a 2,...,a n } niin vastaava todennäköisyysjakaumien joukko on S = {p 1,p 2,...,p n : n i=1 p i = 1, p i 0} ja tulkinta on, että teko a i valitaan todennäköisyydellä p i. Näitä todennäköisyysjakaumia sanotaan sekastrategioiksi.

Sekastrategia Sekastrategioiden hyväksymisestä seuraa joitakin ongelmia. Yksi on se, miten pitäisi arvioida omasta valinnasta seuraava hyöty, jos vastapuoli käyttää sekastrategiaa. Tähän tarjoaa vastauksen von Neumann-Morgensternin odotetun hyödyn teoreema. Oletamme, että pelaajilla on odotetun hyödyn mukainen hyötyfunktio ja kaikki tulemiin liittyvät hyödyt ja maksut on ilmoitettu von Neumann-Morgenstern hyöty-yksiköissä. Jos tällainen talousyksikkö osallistuu arpajaiseen q = (q 1,q 2,...,q n ), jossa todennäköisyydellä q i voittaa palkinnon a i hänen hyötynsä saadaan lausekkeesta U(q) = n i=1 q(a i)u(a i ) = n i=1 q iu(a i ), missä u(a i ) kertoo palkinnosta a i saatavan välittömän hyödyn. u on niin sanottu Bernoulli-hyötyfunktio ja U von Neumann-Morgenstern hyötyfunktio.

Sekastrategia Denition Tarkastellaan normaalimuodon peliä Γ = { N,{A i } i N,{u i } i N }. Sen sekoitettu ekstensio on normaalimuodon peli, jossa kunkin pelaajan i valintajoukko on S i = { p : A i dp = 1 }. Denition Tarkastellaan normaalimuodon peliä Γ = { N,{A i } i N,{u i } i N } ja sen sekoitettua ekstensiota Γ me = { N,{S i } i N,{u i } i N }. Nash-tasapaino on strategiavektori s = (s 1,s 2,...,s n) siten, että kullekin pelaajalle i N u i ( s i,s i) ui ( si,s i) kaikille si S i.

Sekastrategia Jatkossa emme erottele normaalimuodon peliä ja sen sekoitettua ekstensiota, vaan kun ryhdytään määräämään tasapainoja tarkastellaan myös sekastrategioita. Emme myöskään huolellisesti erottele Bernoulli hyötyfunktioita von Neumann-Morgenstern hyötyfunktioista. Theorem Jokaisessa äärellisessä normaalimuodon pelissä on Nash-tasapaino (kenties sekastrategioissa). Nash-tasapainon määritelmästä huomaamme, että se voidaan määritellä myös optimivastausfunktioiden (best response functions) avulla.

Sekastrategia Denition Normaalimuodon pelissä Γ = { N,{S i } i N,{u i } i N } pelaajan i optimivastausfunktio on B i (s i ) = { s i S i : u i (s i,s i ) u i ( s i,s i )} kaikille s i S i. Normaalimuodon pelissä Γ = { } N,{S i } i N,{u i } i N strategiaproili s n S i=1 i on Nash-tasapaino joss si B i (s i ) kaikille i N. Nash-tasapaino on siis optimivastausfunktioiden kiintopiste. Nyt meillä on riittävästi koneistoa, jotta voimme ryhtyä määräämään tasapainoja useanlaisissa peleissä.

Tasapainon määrääminen Tarkastellaan ensin sekastrategiatasapainon määräämistä 2x2 pelissä L R T B Oletetaan, että P1 käyttää strategiaa (p, 1 p) ja P2 strategiaa (q, 1 q). Väistämättä P1 : n on oltava indierentti valintojen T ja B välillä. Jos hän valitsee T hän odottaa saavansa qu 1 (T,L) + (1 q)u 1 (T,R). Jos hän valitsee B hän odottaa saavansa qu 1 (B,L) + (1 q)u 1 (B,R). Tasapainossa näiden on oltava yhtä suuret qu 1 (T,L) + (1 q)u 1 (T,R) = qu 1 (B,L) + (1 q)u 1 (B,R). Tästä voidaan ratkaista q.

Tasapainon määrääminen Analogisesti saadaan ratkaistua p yhtälöstä pu 2 (T,L) + (1 p)u 2 (B,L) = pu 2 (T,R) + (1 p)u 2 (B,R). Laitetaan jotain lukuja hyötyfunktioihin:u 1 (T,L) = 3, u 1 (T,R) = u 1 (B,L) = 0 ja u 1 (B,R) = 1. Nyt q määräytyy yhtälöstä 3q = 1 q, mistä saadaan q = 1 4. Laitetaan jotain lukuja hyötyfunktioihin:u 2 (T,L) = 1, u 2 (T,R) = u 2 (B,L) = 0 ja u 2 (B,R) = 3. Nyt p määräytyy yhtälöstä p = 3(1 p), mistä saadaan p = 3 4. Sukupuolten välisessä taistelussa on siis myös sekastrategiatasapaino. Jos hyötyluvut ovat u 1 (T,L) = 2, u 1 (T,R) = 0, u 1 (B,L) = 3 ja u 1 (B,R) = 1 niin q määräytyy yhtälöstä 2p + 3(1 p) = (1 p), mikä ei voi päteä. Siis vangin ongelmassa ei ole sekastrategiatasapainoa.

Tasapainon määrääminen Cournot-kilpailussa kaksi yritystä valitsee markkinoille tuomansa määrät samanaikaisesti. Yritysten rajakustannukset ovat nolla. Markkinoiden käänteinen kysyntäkäyrä on p = 1 q, missä p on hinta ja q markkinoilla oleva tuotteen määrä. Yrityksen 1 tavoite on max q1 (1 q 1 q 2 )q 1. Ensimmäisen kertaluvun ehto on 1 2q 1 q 2 = 0, mistä ratkaistaan optimivastausfunktio q 1 = 1 q 2 2. Analogisesti saadaan yritykselle 2 optimivastausfunktio q 2 = 1 q 1 2. Näistä kahdesta yhtälöstä saadaan ratkaistua kaksi tuntematonta q 1 = q 2 = 1 3.

Tasapainon määrääminen Epästandardi rahanheittopeli H T H 2, 2 1, 1 T 3, 3 2, 2 P1:n strategia (p, 1 p) ja P2:n strategia (q, 1 q). P1 on indierentti H:n ja T :n välillä, jos 2q (1 q) = 3q + 2(1 q), mistä saadaan q = 3 8. P2 on indierentti H:n ja T :n välillä, jos 2p + 3(1 p) = p 2(1 p), mistä saadaan p = 5 8. P1:n odotettu hyöty on 1 8.

Tasapainon määrääminen Huutokauppa, jossa kaikki maksavat. Ostajia on n kappaletta, kaikki maksavat huutonsa verran ja voittaja saa V :n arvoisen palkinnon. Tarjoamalla b i ostaja i voittaa palkinnon todennäköisyydellä p i = b i n k=1 b k. Ostajan i tavoite on tai yhtäpitävästi max b i maxp i V b i b i b i n k=1 b V b i k

Tasapainon määrääminen Ensimmäisen kertaluvun ehto on n k=1 b k b i ( n k=1 b k) 2 V 1 = 0 Pyritään määräämään symmetrinen tasapaino, jossa b 1 = b 2 =... = b n = b, ja lykätään tämä tieto edelliseen ehtoon, jolloin saadaan mistä ratkaistaan (n 1)b n 2 b 2 V 1 = 0 b = n 1 n V 2 Ostajat käyttävät resursseja nb = n 1 n V verran.