Luento 5: Peliteoriaa



Samankaltaiset tiedostot
Luento 5: Peliteoriaa

Luento 5: Peliteoria

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

SEKASTRATEGIAT PELITEORIASSA

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Sekastrategia ja Nash-tasapainon määrääminen

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Nollasummapelit ja bayesilaiset pelit

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Pelien teoriaa: tasapainokäsitteet

Johdanto peliteoriaan Kirja kpl. 2

12 Oligopoli ja monopolistinen kilpailu

Hintakilpailu lyhyellä aikavälillä

Dynaaminen hintakilpailu ja sanattomat sopimukset

Yleinen tietämys ja Nashin tasapaino

Y56 laskuharjoitukset 6

Luento 8. June 3, 2014

Sekastrategiat ja intensiiviyhteensopivuus

PELITEORIAN PERUSTEITA

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Yhteistyötä sisältämätön peliteoria jatkuu

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Yhteistyötä sisältämätön peliteoria

Pohdiskeleva ajattelu ja tasapainotarkennukset

Johdatus peliteoriaan

Lyhyen aikavälin hintakilpailu 2/2

Luento 6: Monitavoitteinen optimointi

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Luento 6: Monitavoiteoptimointi

Luento 9. June 2, Luento 9

Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17)

JOHDATUSTA PELITEORIAAN

Peliteoria ja huutokauppamekanismit

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Luento 7. June 3, 2014

Täydellinen kilpailu: markkinoilla suuri määrä yrityksiä. ----> Yksi yritys ei vaikuta hyödykkeen markkinahintaan.

Peliteoria luento 3. May 27, Peliteoria luento 3

1. Kuntosalilla on 8000 asiakasta, joilla kaikilla on sama salikäyntien kysyntä: q(p)= P, missä

TALOUSTIETEEN LUENTOJEN TEHTÄVÄT

Harjoitus 7: vastausvihjeet

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Tasapaino epätäydellisen tiedon peleissä

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

suurtuotannon etujen takia yritys pystyy tuottamaan niin halvalla, että muut eivät pääse markkinoille

Paljonko maksat eurosta -peli

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Talousmatematiikan perusteet: Luento 11. Lineaarinen optimointitehtävä Graafinen ratkaisu Ratkaisu Excel Solverilla

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Luento 12: Duaalitehtävä. Tarkennuksia Lagrangen kertoimen tulkintaan. Hajautettu optimointi.

Peliteoria ja kalatalous YE4

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo Ratkaisut ja pisteytysohjeet

Prof. Marko Terviö Assist. Jan Jääskeläinen

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo 10 13

Tentissä on viisi tehtävää, jotka arvosteellaan asteikolla 0-6. Tehtävien alakohdat ovat keskenään samanarvoisia ellei toisin mainita.

w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1.

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Luento 12: Duaalitehtävä. Tarkennuksia Lagrangen kertoimen tulkintaan. Hajautettu optimointi.

Prof. Marko Terviö Assist. Jan Jääskeläinen

Talousmatematiikan perusteet: Luento 12. Lineaarinen optimointitehtävä Graafinen ratkaisu Ratkaisu Excel Solverilla

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Voidaan laskea siis ensin keskimääräiset kiinteät kustannukset AFC: /10000=10

Nollasummapelit ja muut yleisemmät summapelit

Luento 1: Optimointimallin muodostaminen; optimointitehtävien luokittelu

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

Prof. Marko Terviö Assist. Jan Jääskeläinen

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo Ratkaisut ja pisteytysohjeet

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

JYVÄSKYLÄN YLIOPISTO. 3. Luennon sisältö

Luku 29 Peliteoria. Käsittelemme aluksi peliteorian peruskäsitteitä ja sanastoa, sitten katsomme itse pelejä.

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

Luku 4. Derivoituvien funktioiden ominaisuuksia.

Mat Dynaaminen optimointi, mallivastaukset, kierros 5

Martingaalit ja informaatioprosessit

1 Ensimmäisen asteen polynomifunktio

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo 10-13

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

3. laskuharjoituskierros, vko 6, ratkaisut

Epätäydellisen tiedon jatkuvat pelit

Signalointi: autonromujen markkinat

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2018 Insinöörivalinnan matematiikan koe, , Ratkaisut (Sarja A)

Matematiikan tukikurssi

12. Hessen matriisi. Ääriarvoteoriaa

2 Pistejoukko koordinaatistossa

Luetteloivat ja heuristiset menetelmät. Mat , Sovelletun matematiikan tutkijaseminaari, kevät 2008, Janne Karimäki

Konvergenssilauseita

HUUTOKAUPPATEORIAA TTS-Kurssille/Kultti 2012

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

Johdatus lukuteoriaan Harjoitus 11 syksy 2008 Eemeli Blåsten. Ratkaisuehdotelma

Tehtävät 1/10. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Prof. Marko Terviö Assist. Jan Jääskeläinen

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

Strategiset valinnat Taloustieteen perusteet Matti Sarvimäki. A. Peliteorian alkeet. Johdanto. Johdanto 15/09/19

Aloitamme yksinkertaisella leluesimerkillä. Tarkastelemme yhtä osaketta S. Oletamme että tänään, hetkellä t = 0, osakkeen hinta on S 0 = 100=C.

Transkriptio:

Luento 5: Peliteoriaa Tässä kappaleessa tutustutaan lyhyesti peliteoriaan. Peliteorian ratkaisukäsite on Nashin tasapaino, jonka jo Augustin Cournot esitti duopolimallinsa ratkaisuna v. 1838. Cournot n duopolimalli Tarkastellaan Cournot n duopolimallia. Mallissa on kaksi yritystä, jotka tuottavat homogeenista tuotetta samoille markkinoille. Merkitään yrityksen yksi tuotantomäärää q 1 :llä ja yrityksen kaksi q 2 :lla. Olkoon kummankin yrityksen yksikkötuotantokustannus c. Tuotteen hinta määräytyy yleisin ehdoin seuraavasti: P (q 1, q 2 ) = a (q 1 + q 2 ), missä a on positiivinen vakio. Hintaan siis vaikuttavat molempien yritysten tuotantomäärät. Tarkastellaan pelitilannetta, jossa yritykset valitsevat tuotantomäärät samanaikaisesti. Merkitään yritysten saamaa hyötyä π:llä. Ensimmäisen yrityksen saama hyöty on π 1 (q 1, q 2 ) := q 1 P (q 1, q 2 ) q 1 c = q 1 (a (q 1 + q 2 ) c), (1) ja vastaavasti toiselle yritykselle π 2 (q 1, q 2 ) := q 2 (a (q 1 + q 2 ) c). (2) Yritykset maksimoivat omaa hyötyään, kun toisen yrityksen tuotantomäärä oletetaan ratkaistavaksi samanlaisesta tehtävästä. Lasketaan max π 1 (q 1, q 2 ), q 1 Q 1 missä Q 1 on yrityksen 1 käypien strategioiden joukko, esimerkiksi Q 1 = [0, a]. Oletataan, että c < a. Samalla tavalla yritykselle 2. Eo. tehtävän välttämätön ehto on: π 1 (q 1, q 2 ) q 1 = a 2q 1 q 2 c = 0 q 1 = 1 2 (a q 2 c). (3) 1

Vastaavasti toiselle yritykselle: π 2 (q 1, q 2 ) q 2 = 0 q 2 = 1 2 (a q 1 c). (4) Lasketut strategiat ovat todella maksimistrategiat, koska molempien hyötyfunktioiden toinen derivaatta on negatiivinen, 2 π i (q 1, q 2 ) q 2 i = 2 < 0. Yhtälöparin ratkaisu on q 1 = q 2 = a c 3. (5) Tämä strategia on siis molemmille yrityksille optimaalinen, kun toinen yritys pelaa omaa optimistrategiaansa. Sijoittamalla tulos kaavoihin (1) ja (2) saadaan molempien yritysten hyödyksi π i (q 1, q 2 ) = 1 9 (a c)2. (6) Tarkastellaan seuraavaksi tehtävän ratkaisemista graafisesti. Kaava (3) antaa parhaan vasteen (best response), eli reaktion, yritykselle 1 annetulla yrityksen 2 tuotantomäärällä; ks. kuva 1. Reaktiosuorien, q 1 = 1 2 (a q 2 c) ja q 2 = 1 2 (a q 1 c) leikkauspiste vastaa Nashin tasapainoratkaisua. Seuraavaksi tarkastelemme tilannetta, missä yritykset tekevät yhteistyötä. Kilpailulainsäädäntö pyrkii yleensä estämään tällaisen yhteistyön, eli ns. kartellien muodostumisen, kovin sakoin. Nyt yritykset valitsevat tuotantomäärät siten, että yhteinen hyöty π 1 (q 1, q 2 ) + π 2 (q 1, q 2 ) = π 12 (q 1, q 2 ) = q 1 (a (q 1 + q 2 ) c) + q 2 (a (q 1 + q 2 ) c) maksimoituu. Tämän tehtävän ratkaisu on: 2

Kuva 1: Reaktiosuorat ja Nashin tasapaino π 12 (q 1, q 2 ) q 1 = a 2(q 1 + q 2 ) c = 0 π 12 (q 1, q 2 ) q 2 = a 2(q 1 + q 2 ) c = 0 q 1 = q 2 = a c 4. (7) Tällä strategialla molempien yritysten tuotoksi saadaan (sijoitus kaavoihin (3) ja (4)) π 1 = π 2 = 1 8 (a c)2. Verrattaessa tätä tulosta ensimmäisen tilanteen tulokseen, kaava (6), huomataan, että tekemällä yhteistyötä voidaan saavuttaa suurempi hyöty kuin ilman yhteistyötä. Siksi kartelleja pyrkii syntymään. Kartellien muodostuminen ei ole kuitenkaan kuluttajan kannalta edullinen, koska tällöin tuotteen hinta nousee. 3

Nashin tasapaino Strategiapari (q N 1, q N 2 ) on Nashin tasapaino, jos π 1 (q N 1, q N 2 ) π(q 1, q N 2 ), q 1 Q 1, (8) π 2 (q N 1, q N 2 ) π(q N 1, q 2 ), q 2 Q 2. (9) Nashin tasapainostrategia on pelaajan paras strategia silloin, kun toinen pelaaja pelaa omaa tasapainostrategiaansa. Vaikka yhteistyötulos on parempi kuin Nashin tasapainotulos, pelaajalla on houkutus poiketa yhteistyöstä omaksi edukseen, koska yhteistyöratkaisu ei yleensä toteuta tasapainoehtoja. Sekastrategia Tarkastellaan seuraavaksi kahden pelaajan pelejä, joissa pelit esitetään tulostaulukkona. Tämä on mahdollista, kun pelaajien strategioita on äärellinen määrä. Taulukon alkio a ij on strategiaparin (i, j) tulos. Esimerkiksi peli voisi olla seuraavanlainen: Pelaaja1 Pelaaja2 L C R T 5,4 4,0 5,3 M 4,0 0,4 5,3 B 3,5 3,5 6,6 missä pelaajalla 1 on kolme strategiaa T, M, B ja pelaajalla 2 strategiat L, C, R. Nashin tasapaino voidaan määrittää tulostaulukosta tarkastelemalla strategioita pareittain. Jos pelaaja 2 pelaa strategiaa L, pelaajan 1 paras vaste on strategia T. Alleviivataan tämä tulos taulukkoon. Tehdään tämä operaatio molemmille pelaajille kaikilla strategiapareilla. Jos taulukosta löytyy alkio, jonka molemmat tulokset on alleviivattu, tämä strategiapari on Nashin tasapaino. Tässä pelissä Nashin tasapainoiksi saadaan (B,R) ja (T,L). 4

Nollasummapelissä pelaajien intressit ovat vastakkaiset, siis alkion a ij tulokset summautuvat nollaksi. Esimerkkinä kolikkojen sovittamispeli: Pelaaja1 p 1-p Pelaaja2 q 1-q Kr Kl Kr -1,1 1,-1 Kl 1,-1-1,1 Tälle pelille ei löydy Nashin tasapainoa puhtailla strategioilla, Kruuna ja Klaava. Tasapaino löytyy kuitenkin ns. sekastrategioilla. Oletetaan, että pelaaja 1 pelaa kruunaa todennäköisyydellä p ja klaavaa 1 p ja pelaaja 2 kruunaa todennököisyydellä q ja klaavaa 1 q. Pelaaajien hyötyjen odotusarvot ovat: E[π 1 ] = p [ q + (1 q)] + (1 p) [q (1 q)] = 4pq + 2p + 2q 1 E[π 2 ] = 4pq 2p 2q + 1. Voidaan todeta, että strategiat, missä molemmat pelaajat pelaavat kruunaa todennäköisyydellä 0.5 ja klaavaa todennäköisyydellä 0.5 on Nashin tasapaino, eli ko. strategiat toteuttavat epäyhtälöt (8) ja (9) hyötyjen odotusarvoille. Puhtaat strategiat ovat sekastrategioiden erikoistapaus, toiseen strategiaan liittyy todennäköisyys 1 ja toiseen 0. Vangin ongelma Kasper ja Jesper ovat tehneet kuutamokeikkoja Otaniemen ostarilla ja ovat jääneet siitä kiinni. Poliisilla ei ole riittävästi todisteita pidättää poikia, ellei ainakin toinen heistä tunnusta. Poliisi pistää pojat eri selleihin ja pyytää heitä tunnustamaan (C), tai sitten ei (N). Poliisi sanoo: Jos kumpikaan teistä ei tunnusta, olette molemmat tarkkailtavina putkassa yhden päivän, tulos kummallekin -1. Jos te molemmat tunnustatte, saatte olla putkassa 6 päivää. Jos sen sijaan toinen teistä tunnustaa, mutta toinen ei, ensin mainittu pääsee vapaaksi ja toinen saa olla putkassa 9 päivää. Peli, jota Kasper ja Jesper pelaavat poliisin välityksellä on seuraava: 5

Kasper Jesper N C N -1,-1-9,0 C 0,-9-6,-6 N : ei tunnusta C : tunnustaa Pelin rationaalinen ratkaisu on vääjäämättä (C,C), eli kumpikin on putkassa 6 päivää: Pojat jotk ei tulleet hyviks, nyt on jauhettuna jyviks. Tulos ( 1, 1) ei tule valituksi, koska se ei ole Nashin tasapaino, eli kummankaan pelaajan kannalta rationaalinen ratkaisu, kun peliä pelataan vain kerran. Jos peliä sen sijaan toistetaan, myös tämä tulos voi tulla kyseeseen, kun pelaajat pelaavat toistettua peliä esim. ns. Tit for Tat -strategialla: pelaa ensimmäisellä kierroksella N; pelaa seuraavissa peleissä aina, kuten vastaustaja pelasi edellisessä pelissä. Liite alkaa Nashin neuvotteluratkaisu Cournot n duopolimallissa tutustuimme ns. yhteisoptimiin, eli funktion π 1 + π 2 yhteisoptimiin. Sinänsä melkein mikä tahansa ns. tehokas, tai Pareto-optimaalinen piste voisi olla yhteistyöratkaisu. Piste on Pareto-optimaalinen, jos siirtyminen johonkin toiseen pisteeseen huonontaa aidosti ainakin toisen pelaajan hyötyä. Eli piste ei ole Pareto-optimaalinen, jos molempia hyötyjä voidaan parantaa, ja toista aidosti, siirtymällä johonkin toiseen pisteeseen. Luennolla 6 osoitetaan, että jokainen Pareto-piste saadaan maksimoimalla funktio απ 1 + (1 α)π 2, missä painokerroin α, 0 α 1. John Nash esitti v. 1950, että lukuisista hyvistä yhteistyöpisteistä voidaan valita yksi ratkaisu ns. neuvotteluratkaisuksi. Tutkitaan kahden pelaajan välisiä, käypiä hyötypareja (u 1, u 2 ). Oletetaan, että nämä pisteet kuuluvat kompaktiin ja konveksiin neuvottelujoukkoon S. 6

Olkoon (0,0) ristiriitatulos, tai neuvottelun referenssipiste. Nash oletti neuvotteluratkaisun toteuttavan Pareto-optimaalisuuden lisäksi kolme oikeudenmukaisuusaksioomaa, ja osoitti, että nämä määräävät yksikäsitteisesti kunkin neuvottelujoukon S neuvotteluratkaisun F (S) := (u N B 1, u N B 2 ). Ko. aksioomat ovat: (a) Riippumattomuus yksiköistä, joilla hyötyjä mitataan: olkoot λ 1 0 ja λ 2 0 vakioita. Merkitään λs := {(λ 1 u 1, λ 2 u 2 ) (u 1, u 2 ) S}. Tällöin F (λs) = (λ 1 u N B 1, λ 2 u N B 2 ). (b) F on symmetrinen: jos S on symmetrinen joukko suoran u 2 = u 1 suhteen u N B 2 = u N B 1. (c) F on riippumaton epäoleellisista vaihtoehdoista: jos S S ja F (S) S F (S ) = F (S). Nash osoitti lisäksi, että annetulla S neuvotteluratkaisu (u N B 1, u N B 2 ) saadaan ratkaisemalla optimointitehtävä max u 1u 2. (u 1,u 2 ) S Liite päättyy 7