Luento 5: Peliteoriaa

Luento 5: Peliteoriaa Tässä kappaleessa tutustutaan hieman peliteoriaan. Keskeisiä asioita ovat Nash-tasapaino ja sekastrategia. Cournot n duopolimalli vuodelta 1838 toimii oivallisena havainnollistuksena Nash-tasapainon ymmärtämiseen. Cournot n duopolimalli Tarkastellaan Cournot n duopolimallia. Mallissa on kaksi yritystä, jotka tuottavat homogeenista tuotetta samoille markkinoille. Merkitään yrityksen yksi tuotantomäärää q 1 :llä ja yrityksen kaksi q 2 :lla. Olkoon kummallakin yrityksellä yksikkötuotantokustannus sama, c. Tuotteen hinta määräytyy varsin yleisin ehdoin seuraavasti: P(q 1,q 2 ) = a (q 1 + q 2 ), missä a on positiivinen vakio. Hintaan siis vaikuttavat molempien yritysten tuotantomäärät. Tarkastellaan ensin tilannetta, jossa yritykset päättävät tuotantomäärät samanaikaisesti, tietämättä toisen valinnasta. Merkitään yritysten saamaa hyötyä π:llä. Ensimmäisen yrityksen saama hyöty on π 1 (q 1,q 2 ) = q 1 P(q 1,q 2 ) q 1 c = q 1 (a (q 1 + q 2 ) c) (1) ja vastaavasti yritykselle kaksi π 2 (q 1,q 2 ) = q 2 (a (q 1 + q 2 ) c) (2) Luonnollisesti yritykset yrittävät maksimoida omaa hyötyä, eli 1. yrityksen tuotantomäärä ratkaisee tehtävän max π 1 (q 1,q 2 ) q 1 Q 1 oletetulla q 2 ja Q on yrityksen 1 strategiajoukko, esimerkiksi q 1 [0,a]. Samalla tavalla yritykselle 2. Optimointitehtävän välttämättömästä ehdosta - optimi on derivaatan nollakohdassa - ensimmäiselle yritykselle π 1 (q 1,q 2 ) q 1 = a 2q 1 q 2 c = 0 q 1 = 1 2 (a q 2 c) (3) 1

ja vastaavasti toiselle yritykselle π 2 (q 1,q 2 ) q 2 = 0 q 2 = 1 2 (a q 1 c) (4) Lasketut strategiat ovat todella maksimit, koska molempien hyötyfunktioiden toinen derivaatta on 2 π i (q 1,q 2 ) = 2 < 0 qi 2 On siis saatu kaksi yhtälöä, (3) ja (4), joissa on 2 tuntematonta q 1 ja q 2. Yhtälöparin ratkaisu on q 1 = q 2 = a c (5) 3 Tämä strategia on siis molemmille yrityksille optimaalinen. Sijoittamalla tämä tulos kaavoihin (1) ja (2) saadaan molempien yritysten hyödyksi π i (q 1,q 2 ) = 1 9 (a c)2 (6) Tarkastellaan seuraavaksi tehtävän ratkaisemista graafisesti. Kaava (3) antaa parhaimman vasteen yritykselle 1 yrityksen 2 tuotantomäärään. Esimerkiksi, jos yritys 2 ei tuota ollenkaan, yrityksen 1 optimaalinen tuotantomäärä on q 1 = 1 (a c) 2 Laskemalla paras vaste kaikilla toisen yrityksen tuotantomäärillä, molemmille yrityksille, saadaan kuva 1 Suorien leikkauspisteessä molempien yritysten paras vaste toisen yrityksen tuotantomäärään on tämä leikkauspiste, eli ollaan tasapainossa. Määrittämällä suorien leikkauspisteiden koordinaatit saadaan q 1 = q 2 = a c 3 mikä on sama kuin kaava (5), kuten pitikin. Tarkastellaan seuraavaksi tilannetta, missä yritykset tekevät yhteistyötä, kysymys on siis kartellista. Nyt yritykset valitsevat tuotantomäärät siten, että yhteinen hyöty π 1 (q 1,q 2 )+π 2 (q 1,q 2 ) = π 12 (q 1,q 2 ) = q 1 (a (q 1 +q 2 ) c)+q 2 (a (q 1 +q 2 ) c) 2

Kuva 1: Parhaimmat vasteet ja Nash-tasapaino maksimoituu. Tämän tehtävän ratkaisu on osittaisderivaattojen nollakohta π 12 (q 1,q 2 ) q 1 = a 2(q 1 + q 2 ) c = 0 π 12 (q 1,q 2 ) q 2 = a 2(q 1 + q 2 ) c = 0 q 1 = q 2 = a c 4 (7) Tällä strategialla molempien yritysten tuotoksi saadaan (sijoitus kaavoihin (3) ja (4)) π 1 = π 2 = 1 (a c)2 8 Jos tätä tulosta verrataan ensimmäisen tilanteen tulokseen, kaava (6), huomataan, että tekemällä yhteistyötä voidaan saavuttaa suurempi hyöty kuin ilman yhteistyötä. Nash-tasapaino Edellisen kappaleen ensimmäisessä tilanteessa ratkaisu oli sellainen piste, joka on paras vaste toisen strategiaan. Tätä pistettä kutsutaan Nash-tasapainoksi 3

(toisinaan puhutaan Cournot-Nashin tasapainosta). Edellisen kappaleen toisessa tilanteessa (kartelli) molemmat yritykset saavat suuremman hyödyn kuin Nash-tasapainossa. Miksi tämä piste ei sitten ole Nash-tasapaino? Oletetaan nyt, että peliä pelataan monta kierrosta. Olkoot yritykset sopineet pelaavansa kartellistrategiaa, q 1 = q 2 = a c, jolloin molempien hyöty 4 on π 1 = π 2 = (a c)2. Yritys 2(1) kuitenkin huomaa, että se voi saavuttaa suuremman hyödyn pelaamalla parhaimman vasteen strategiaa sillä oletuksella, 8 että yritys 1(2) pelaa kartellistrategiaa. Seuraavalla kierroksella yritys 1 huomaa, että yritys 2 on vaihtanut strategiaa, jolloin sen ei enää kannata pelata kartellistrategiaa, vaan parhaimman vasteen. Sitä seuraavalla yritys 2 vastaavasti huomaa yrityksen 1 strategian vaihdon ja muuttaa omaa strategiaa. Seuraavat kierrokset menevät vastaavasti. Näin syntyy strategiapari-jono, joka lähtee kartellipisteestä poispäin ja ja päätyy Nash-tasapainopisteeseen. Kartellipiste on siis epästabiili, eikä näin ole tasapainopiste. Nash-tasapaino ei välttämättä ole siis tehtävän paras ratkaisu, mutta jos ollaan tasapainossa, ei siitä kannata yksinään poiketa. Kahdelle pelaajalle: Nash-tasapaino on sellainen strategiapari, mistä kummankaan ei kannata yksinään poiketa. Matemaattisessa muodossa Strategiapari (q 1,q 2) on Nash-tasapaino, jos pelaajalle 1 strategia q 1 ratkaisee tehtävän π 1 (q 1,q 2) π 1 (q 1,q 2), q 1 Q 1 (8) ja pelaajalle 2 strategia q 2 ratkaisee tehtävän π 2 (q 1,q 2) π 2 (q 1,q 2 ), q 2 Q 2 (9) missä Q i on pelaajan i strategiajoukko. Sekastrategia Tarkastellaan seuraavaksi kahden pelaajan pelejä, joissa pelit esitetään tulostaulukkona. Tämä on mahdollista, kun pelaajien strategioita on äärellinen määrä. Taulukon alkio a i,j on strategiaparin (i,j) tulos. Esimerkiksi peli voisi olla seuraavanlainen: 4

Pelaaja1 Pelaaja2 L C R T 5,4 4,0 5,3 M 4,0 0,4 5,3 B 3,5 3,5 6,6 missä pelaajalla 1 on kolme strategiaa T, M, B ja pelaajalla 2 strategiat L, C, R. Nashin-tasapaino voidaan määrittää tulostaulukosta tarkastelemalla strategioita pareittain. Jos pelaaja 2 pelaa strategiaa L, pelaajan 1 paras vaste on strategia T. Alleviivataan tämä tulos taulukkoon. Tehdään tämä operaatio molemmille pelaajille kaikilla strategiapareilla. Jos taulukosta löytyy alkio, jonka molemmat tulokset on alleviivattu, tämä strategiapari on Nash-tasapaino. Tässä pelissä Nash-tasapainoiksi saadaan (B,R) ja (T,L). Nollasummapelissä pelaajien intressit ovat vastakkaiset, siis a i,j on toiselle yhtä hyvä kuin mitä se on toiselle huono. Esimerkkinä kolikkojen sovittamispeli: Pelaaja2 q 1-q Pelaaja1 p 1-p Kr Kl Kr -1,1 1,-1 Kl 1,-1-1,1 Tälle pelille ei löydy Nash-tasapainoa puhtailla strategioilla, Kruuna ja Klaava. Tasapaino löytyy kuitenkin ns. sekastrategioilla. Oletetaan nyt, että pelaaja 1 pelaa kruunaa todennäköisyydellä p ja klaavaa 1 p ja pelaaja 2 kruunaa todennököisyydellä q ja klaavaa 1 q. Pelaaajien hyötyjen odotusarvot ovat E[π 1 ] = p [ q + (1 q)] + (1 p) [q (1 q)] = 4pq + 2p + 2q 1 E[π 2 ] = 4pq 2p 2q + 1 Voidaan todeta, että strategiat, missä molemmat pelaajat pelaavat kruunaa todennäköisyydellä 0.5 ja klaavaa todennäköisyydellä 0.5 on Nash-tasapaino, eli ko. olevat strategiat toteuttavat epäyhtälöt (8) ja (9). Sekastrategia kahdelle pelaajalle: Sekastrategia on pelaajalle i {1, 2} todennäköisyysjakauma p i = (p i1,...,p ik ), missä 0 p ik 1 kaikilla k = 1,...,K ja K p ik = 1 5 k=1

missä K on strategioiden lukumäärä. Puhtaat strategiat ovat sekastrategioiden erikoistapaus, yhteen strategiaan liittyy todennäköisyys 1 ja muihin nolla. Vangin pulma Kasper ja Jesper ovat tehneet kuutamokeikkoja Otaniemen ostarilla ja ovat jääneet siitä kiinni. Poliisilla ei ole riittävästi todisteita pidättää poikia, ellei ainakin toinen heistä tunnusta. Poliisi pistää pojat eri ja pyytää heitä tunnustamaan (C), tai sitten ei (N). Poliisi sanoo: Jos kumpikaan teistä ei tunnusta, olette molemmat tarkkailtavina putkassa yhden päivän. Jos te molemmat tunnustatte, saatte olla putkassa 6 päivää. Jos sen sijaan toinen teistä tunnustaa, mutta toinen ei, ensin mainittu pääsee vapaaksi ja toinen saa olla putkassa 9 päivää. Peli, jota Kasper ja Jesper pelaavat poliisin välityksellä on seuraava: Kasper Jesper N C N -1,1-9,0 C 0,-9-6,-6 N : ei tunnusta C : tunnustaa Pelin rationaalinen ratkaisu on vääjäämättä (C,C), eli kumpikin on putkassa 6 päivää: Pojat jotk ei tulleet hyviks, nyt on jauhettuna jyviks. Tulos ( 1, 1) ei tule valituksi, koska se ei ole Nashin tasapaino, eli kummankaan pelaajan kannalta rationaalinen ratkaisu, kun peliä pelataan vain kerran. Jos peliä sen sijaan toistetaan, myös tämä tulos voi tulla kyseeseen, mutta se vaatii pelaajilta sitoutumista yhteistyöhön. Nashin neuvotteluratkaisu Cournot n duopolimallissa tutustuimme yhteistyön mahdollisuuteen tässä kappaleessa aihetta käsitellään hieman ns. aksiomaattisesta näkökulmasta. Lähestymistapa on peräisin John Nashilta vuodelta 1950. Kyseinen paperi, johon myös Nashista tehdyssä elokuvassa Kaunis mieli viitataan on nimeltään 6

The Bargaining Problem. Määritellään referenssipiste, jonka suhteen pelin tulos lasketaan (voi olla origo, Nashin tasapainopiste tai muu sopiva piste) ja merkitään sitä ( u d 1,u d 2) :llä. Toisinaan tätä kutsutaan ristiriitapisteeksi. Olkoon mahdollisten tulosten (u 1,u 2 ) joukko S konveksi ja kompakti. Nash osoitti, että jos tutkitaan kaikkia tällaisia neuvottelujoukkoja S, ja oletetaan, että neuvotteluratkaisu (u S 1,u S 2) S toteuttaa ao. ehdot, niin tällaiset ehdot totetuttavia ratkaisuita on vain yksi, ja annetulla S, (u S 1,u S 2) maksimoi tulon (u 1 u d 1)(u 2 u d 2). riippumattomuus irrelevanteista vaihtoehdoista (independence of irrelevant alternatives) - jos S S ja (u S 1,u S 2) S (u S 1,u S 2 ) = (u S 1,u S 2) symmetrisyys - jos S on symmetrinen joukko suoran u 1 = u 2 suhteen u S 1 = u S 2 riippumattomuus affiineista muunnoksista - jos hyödyt u 1 ja u 2 kerrotaan mielivaltaisella positiivisella vakiolla, ja niihin lisätään mielivaltainen vakio, niin (u S 1,u 2 2) skaalautuu samalla tavalla. Lähteet Robert Gibbons: A Primer in Game Theory, Prentice Hall, 1992. John Nash: The Bargaining Problem, Econometrica, vol. 18, pp. 155-162, 1950. 7