Luento 5: Peliteoriaa Tässä kappaleessa tutustutaan lyhyesti peliteoriaan. Peliteorian ratkaisukäsite on Nashin tasapaino, jonka jo Augustin Cournot esitti duopolimallinsa ratkaisuna v. 1838. Cournot n duopolimalli Tarkastellaan Cournot n duopolimallia. Mallissa on kaksi yritystä, jotka tuottavat homogeenista tuotetta samoille markkinoille. Merkitään yrityksen yksi tuotantomäärää q 1 :llä ja yrityksen kaksi q 2 :lla. Olkoon kummankin yrityksen yksikkötuotantokustannus c. Tuotteen hinta määräytyy yleisin ehdoin seuraavasti: P (q 1, q 2 ) = a (q 1 + q 2 ), missä a on positiivinen vakio. Hintaan siis vaikuttavat molempien yritysten tuotantomäärät. Tarkastellaan pelitilannetta, jossa yritykset valitsevat tuotantomäärät samanaikaisesti. Merkitään yritysten saamaa hyötyä π:llä. Ensimmäisen yrityksen saama hyöty on π 1 (q 1, q 2 ) := q 1 P (q 1, q 2 ) q 1 c = q 1 (a (q 1 + q 2 ) c), (1) ja vastaavasti toiselle yritykselle π 2 (q 1, q 2 ) := q 2 (a (q 1 + q 2 ) c). (2) Yritykset maksimoivat omaa hyötyään, kun toisen yrityksen tuotantomäärä oletetaan ratkaistavaksi samanlaisesta tehtävästä. Lasketaan max π 1 (q 1, q 2 ), q 1 Q 1 missä Q 1 on yrityksen 1 käypien strategioiden joukko, esimerkiksi Q 1 = [0, a]. Oletataan, että c < a. Samalla tavalla yritykselle 2. Eo. tehtävän välttämätön ehto on: π 1 (q 1, q 2 ) q 1 = a 2q 1 q 2 c = 0 q 1 = 1 2 (a q 2 c). (3) 1
Vastaavasti toiselle yritykselle: π 2 (q 1, q 2 ) q 2 = 0 q 2 = 1 2 (a q 1 c). (4) Lasketut strategiat ovat todella maksimistrategiat, koska molempien hyötyfunktioiden toinen derivaatta on negatiivinen, 2 π i (q 1, q 2 ) q 2 i = 2 < 0. Yhtälöparin ratkaisu on q 1 = q 2 = a c 3. (5) Tämä strategia on siis molemmille yrityksille optimaalinen, kun toinen yritys pelaa omaa optimistrategiaansa. Sijoittamalla tulos kaavoihin (1) ja (2) saadaan molempien yritysten hyödyksi π i (q 1, q 2 ) = 1 9 (a c)2. (6) Tarkastellaan seuraavaksi tehtävän ratkaisemista graafisesti. Kaava (3) antaa parhaan vasteen (best response), eli reaktion, yritykselle 1 annetulla yrityksen 2 tuotantomäärällä; ks. kuva 1. Reaktiosuorien, q 1 = 1 2 (a q 2 c) ja q 2 = 1 2 (a q 1 c) leikkauspiste vastaa Nashin tasapainoratkaisua. Seuraavaksi tarkastelemme tilannetta, missä yritykset tekevät yhteistyötä. Kilpailulainsäädäntö pyrkii yleensä estämään tällaisen yhteistyön, eli ns. kartellien muodostumisen, kovin sakoin. Nyt yritykset valitsevat tuotantomäärät siten, että yhteinen hyöty π 1 (q 1, q 2 ) + π 2 (q 1, q 2 ) = π 12 (q 1, q 2 ) = q 1 (a (q 1 + q 2 ) c) + q 2 (a (q 1 + q 2 ) c) maksimoituu. Tämän tehtävän ratkaisu on: 2
Kuva 1: Reaktiosuorat ja Nashin tasapaino π 12 (q 1, q 2 ) q 1 = a 2(q 1 + q 2 ) c = 0 π 12 (q 1, q 2 ) q 2 = a 2(q 1 + q 2 ) c = 0 q 1 = q 2 = a c 4. (7) Tällä strategialla molempien yritysten tuotoksi saadaan (sijoitus kaavoihin (3) ja (4)) π 1 = π 2 = 1 8 (a c)2. Verrattaessa tätä tulosta ensimmäisen tilanteen tulokseen, kaava (6), huomataan, että tekemällä yhteistyötä voidaan saavuttaa suurempi hyöty kuin ilman yhteistyötä. Siksi kartelleja pyrkii syntymään. Kartellien muodostuminen ei ole kuitenkaan kuluttajan kannalta edullinen, koska tällöin tuotteen hinta nousee. 3
Nashin tasapaino Strategiapari (q N 1, q N 2 ) on Nashin tasapaino, jos π 1 (q N 1, q N 2 ) π(q 1, q N 2 ), q 1 Q 1, (8) π 2 (q N 1, q N 2 ) π(q N 1, q 2 ), q 2 Q 2. (9) Nashin tasapainostrategia on pelaajan paras strategia silloin, kun toinen pelaaja pelaa omaa tasapainostrategiaansa. Vaikka yhteistyötulos on parempi kuin Nashin tasapainotulos, pelaajalla on houkutus poiketa yhteistyöstä omaksi edukseen, koska yhteistyöratkaisu ei yleensä toteuta tasapainoehtoja. Sekastrategia Tarkastellaan seuraavaksi kahden pelaajan pelejä, joissa pelit esitetään tulostaulukkona. Tämä on mahdollista, kun pelaajien strategioita on äärellinen määrä. Taulukon alkio a ij on strategiaparin (i, j) tulos. Esimerkiksi peli voisi olla seuraavanlainen: Pelaaja1 Pelaaja2 L C R T 5,4 4,0 5,3 M 4,0 0,4 5,3 B 3,5 3,5 6,6 missä pelaajalla 1 on kolme strategiaa T, M, B ja pelaajalla 2 strategiat L, C, R. Nashin tasapaino voidaan määrittää tulostaulukosta tarkastelemalla strategioita pareittain. Jos pelaaja 2 pelaa strategiaa L, pelaajan 1 paras vaste on strategia T. Alleviivataan tämä tulos taulukkoon. Tehdään tämä operaatio molemmille pelaajille kaikilla strategiapareilla. Jos taulukosta löytyy alkio, jonka molemmat tulokset on alleviivattu, tämä strategiapari on Nashin tasapaino. Tässä pelissä Nashin tasapainoiksi saadaan (B,R) ja (T,L). 4
Nollasummapelissä pelaajien intressit ovat vastakkaiset, siis alkion a ij tulokset summautuvat nollaksi. Esimerkkinä kolikkojen sovittamispeli: Pelaaja1 p 1-p Pelaaja2 q 1-q Kr Kl Kr -1,1 1,-1 Kl 1,-1-1,1 Tälle pelille ei löydy Nashin tasapainoa puhtailla strategioilla, Kruuna ja Klaava. Tasapaino löytyy kuitenkin ns. sekastrategioilla. Oletetaan, että pelaaja 1 pelaa kruunaa todennäköisyydellä p ja klaavaa 1 p ja pelaaja 2 kruunaa todennököisyydellä q ja klaavaa 1 q. Pelaaajien hyötyjen odotusarvot ovat: E[π 1 ] = p [ q + (1 q)] + (1 p) [q (1 q)] = 4pq + 2p + 2q 1 E[π 2 ] = 4pq 2p 2q + 1. Voidaan todeta, että strategiat, missä molemmat pelaajat pelaavat kruunaa todennäköisyydellä 0.5 ja klaavaa todennäköisyydellä 0.5 on Nashin tasapaino, eli ko. strategiat toteuttavat epäyhtälöt (8) ja (9) hyötyjen odotusarvoille. Puhtaat strategiat ovat sekastrategioiden erikoistapaus, toiseen strategiaan liittyy todennäköisyys 1 ja toiseen 0. Vangin ongelma Kasper ja Jesper ovat tehneet kuutamokeikkoja Otaniemen ostarilla ja ovat jääneet siitä kiinni. Poliisilla ei ole riittävästi todisteita pidättää poikia, ellei ainakin toinen heistä tunnusta. Poliisi pistää pojat eri selleihin ja pyytää heitä tunnustamaan (C), tai sitten ei (N). Poliisi sanoo: Jos kumpikaan teistä ei tunnusta, olette molemmat tarkkailtavina putkassa yhden päivän, tulos kummallekin -1. Jos te molemmat tunnustatte, saatte olla putkassa 6 päivää. Jos sen sijaan toinen teistä tunnustaa, mutta toinen ei, ensin mainittu pääsee vapaaksi ja toinen saa olla putkassa 9 päivää. Peli, jota Kasper ja Jesper pelaavat poliisin välityksellä on seuraava: 5
Kasper Jesper N C N -1,-1-9,0 C 0,-9-6,-6 N : ei tunnusta C : tunnustaa Pelin rationaalinen ratkaisu on vääjäämättä (C,C), eli kumpikin on putkassa 6 päivää: Pojat jotk ei tulleet hyviks, nyt on jauhettuna jyviks. Tulos ( 1, 1) ei tule valituksi, koska se ei ole Nashin tasapaino, eli kummankaan pelaajan kannalta rationaalinen ratkaisu, kun peliä pelataan vain kerran. Jos peliä sen sijaan toistetaan, myös tämä tulos voi tulla kyseeseen, kun pelaajat pelaavat toistettua peliä esim. ns. Tit for Tat -strategialla: pelaa ensimmäisellä kierroksella N; pelaa seuraavissa peleissä aina, kuten vastaustaja pelasi edellisessä pelissä. Liite alkaa Nashin neuvotteluratkaisu Cournot n duopolimallissa tutustuimme ns. yhteisoptimiin, eli funktion π 1 + π 2 yhteisoptimiin. Sinänsä melkein mikä tahansa ns. tehokas, tai Pareto-optimaalinen piste voisi olla yhteistyöratkaisu. Piste on Pareto-optimaalinen, jos siirtyminen johonkin toiseen pisteeseen huonontaa aidosti ainakin toisen pelaajan hyötyä. Eli piste ei ole Pareto-optimaalinen, jos molempia hyötyjä voidaan parantaa, ja toista aidosti, siirtymällä johonkin toiseen pisteeseen. Luennolla 6 osoitetaan, että jokainen Pareto-piste saadaan maksimoimalla funktio απ 1 + (1 α)π 2, missä painokerroin α, 0 α 1. John Nash esitti v. 1950, että lukuisista hyvistä yhteistyöpisteistä voidaan valita yksi ratkaisu ns. neuvotteluratkaisuksi. Tutkitaan kahden pelaajan välisiä, käypiä hyötypareja (u 1, u 2 ). Oletetaan, että nämä pisteet kuuluvat kompaktiin ja konveksiin neuvottelujoukkoon S. 6
Olkoon (0,0) ristiriitatulos, tai neuvottelun referenssipiste. Nash oletti neuvotteluratkaisun toteuttavan Pareto-optimaalisuuden lisäksi kolme oikeudenmukaisuusaksioomaa, ja osoitti, että nämä määräävät yksikäsitteisesti kunkin neuvottelujoukon S neuvotteluratkaisun F (S) := (u N B 1, u N B 2 ). Ko. aksioomat ovat: (a) Riippumattomuus yksiköistä, joilla hyötyjä mitataan: olkoot λ 1 0 ja λ 2 0 vakioita. Merkitään λs := {(λ 1 u 1, λ 2 u 2 ) (u 1, u 2 ) S}. Tällöin F (λs) = (λ 1 u N B 1, λ 2 u N B 2 ). (b) F on symmetrinen: jos S on symmetrinen joukko suoran u 2 = u 1 suhteen u N B 2 = u N B 1. (c) F on riippumaton epäoleellisista vaihtoehdoista: jos S S ja F (S) S F (S ) = F (S). Nash osoitti lisäksi, että annetulla S neuvotteluratkaisu (u N B 1, u N B 2 ) saadaan ratkaisemalla optimointitehtävä max u 1u 2. (u 1,u 2 ) S Liite päättyy 7