Y56 Kevät 2010 1 Luku 29 Peliteoria Tässä luvussa tarkastellaan peliteorian perusteita. Tavoitteena on, että opit muodostamaan itsenäisesti kutakin peliä kuvaavat osat, ratkaisemaan erilaisten pelien tasapainon ja hyödyntämään peliteoriaa erilaisten strategisten päätösten selittämiseksi. 29.1 Johdanto Edellisessä luvussa tarkastelimme oligopolimarkkinoita. Duopolin simultaaninen Cournot-valinta on esimerkki päätöksentekijöiden välisestä strategisesta kanssakäymisestä. Cournot-valinta voidaan kuvata pelinä. Pelissä kummankin yrityksen optimivalinta riippuu siitä, mitä se olettaa toisen yrityksen tekevän. Pelaajat, siis yritykset, valitsivat tuotantomääränsä maksimoimalla omia voittojaan ottaen huomioon kilpailevan yrityksen valinnan. Peliteorialla voidaan yleisemmin mallintaa tällaisia päätöksentekijöiden välisiä strategisia kanssakäymisiä, eli tilanteita, joissa päätöksentekijä ottaa huomioon sen, että lopputulos riippuu omien valintojen lisäksi muiden valinnoista. Peliteoriaa käytetään mm. analysoimaan Oligopoleja ja kartelleja Ulkoisvaikutuksia esim. kalastuksessa ja kalastuspolitiikassa Julkishyödykkeiden tarjontaa Maanpuolustusstrategioita Bargaining (erilaiset neuvottelutilanteet) Käsittelemme aluksi peliteorian peruskäsitteitä ja sanastoa, sitten katsomme itse pelejä. 29.2 Käsitteet Peli: esittää formaalisesti päätöksentekijöiden kohtaamia tilanteita. Peli kostuu seuraavista elementeistä: pelaajat (players) pelin säännöt kuten esim. kuka valitsee missäkin tilanteessa mitä informaatiota pelaajilla on pelaajien strategiat tai päätössäännöt (strategies) eli kuvaus siitä, miten pelaaja toimii kaikissa mahdollisissa tilanteissa mukaan lukien sellaiset tilanteet, joihin ei pelin aikana lopulta päädytä kunkin pelaajan saama tuotto (hyöty, payoff) jokaisesta mahdollisesta valinnasta Peliteoriassa oletetaan, että pelaajat tuntevat ja ymmärtävät pelin rakenteen. Kaikilla pelaajilla ei kuitenkaan välttämättä ole samaa tietoa (ts. pelaajilla voi olla epäsymmetristä informaatiota). Staattiset pelit: kaikki pelaajat valitsevat vain kerran ja yhtä aikaa. Dynaamiset pelit: pelaajat tekevät valintoja peräkkäin ja/tai pelaavat staattista peliä useita kierroksia (toistettu peli).
Y56 Kevät 2010 2 Yhteistyöpelit (cooperative games): yhteistyöpeleissä pelaajat voivat tehdä sitovia sopimuksia (binding commitments, binding agreements). Kilpailulliset pelit (noncooperative games): sitovat sopimukset eivät ole mahdollisia Nollasummapelit: nollasummapeleissä jaettavissa oleva kokonaistuotto summautuu aina nollaan riippumatta pelaajien valitsemista strategioista. Pelaajat voivat siis hyötyä vain muiden kustannuksella. Nash-tasapaino: Nash-tasapainossa kaikki pelaajat valitsevat strategian, joka on paras mahdollinen, annettuna strategiat, joita muut pelaajat valitsevat. Ts. Nash-tasapainopiste on strategiapari, josta kummankaan pelaajan ei kannata yksinään poiketa. Nash-tasapainon/tasapainojen määrittelemiseksi oletetaan, että kukin pelaaja pelaa parhaan strategiansa mukaisesti. Pelissä voi olla useita Nash-tasapainoja. Dominoivien strategioiden tasapaino: strategioiden kombinaatio, joka koostuu kunkin pelaajan dominoivasta strategiasta Dominoiva strategia: strategia, joka on paras riippumatta siitä, mitä muut pelaajat tekevät. 29.3 Staattiset pelit 29.3.1Yhden kierroksen vangin dilemma Kun pelaajat toimivat yhtäaikaisesti tai tietämättä toistensa valinnoista, peli voidaan esittää normaalimuodossa (myös kutsuttu strategiseksi muodoksi) payoff-matriisin avulla. Payoff-matriisi eli hyötymatriisi kertoo pelaajat, pelaajien mahdolliset toiminnot sekä pelaajien hyödyt. Pelaajia ja valintoja voi olla useita, mutta keskitymme jatkossa tarkastelemaan kahden pelaajan pelejä (two-player game), jossa pelaajat valitsevat niin ikään kahden toiminnon välillä. Vangin dilemma on perusesimerkki peliteoreettisesta tilanteesta. Bonnie ja Clyde ovat tehneet rikoksen ja jääneet siitä kiinni. Heitä uhkaa vankeustuomio ja kumpaakin pidetään erillisessä tilassa ja kuulustellaan yksitellen. Kuulustelijat tarjoavat vasikoijalle hyvitystä (vain vuoden vankeustuomio) ja uhkaavat hiljaisena pysyvää kovalla tuomiolla (30 vuotta vankeutta). Jos molemmat pysyvät hiljaa, kumpikin saa viiden vuoden tuomion, eli (S,S) =(-5,-5). Jos molemmat vasikoivat, saa kumpikin kymmenen vuoden tuomion (C, C) =(-10,-10). Jos vain toinen vasikoi, pääsee hän vapaaksi ja vaiti pysynyt saa kymmenen vuoden tuomion (S,C) = (-30,-1). Esitetään kuvattu vangin dilemma matriisimuodossa eli ns. normaalimuodossa:
Y56 Kevät 2010 3 Vangin dilemma S Clyde C Bonnie S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) S = vaikenee (silence), C = vasikoi (cheat) Analysoidaan nyt vangin dilemma -peliä. Jos Bonnie pelaa S (vaikenee), Clyden paras valinta (best reply) on C (vasikoida), koska silloin hän saa vain vuoden vankeustuomion, kun taas valitsemalla S:n (vaikenee) hän saisi 5 vuotta. Jos Bonnie pelaa C (vasikoi), Clyden paras valinta on myös C (vasikoida), koska vasikoimalla hän saisi 10 vuotta vankeutta ja olemalla hiljaa (S) 30 vuotta. Tästä seuraa, että riippumatta siitä, mitä Bonnie valitsee (S tai C), Clyden kannattaa aina valita C, eli vasikoida. Peliteorian kielellä sanotaan, että vasikointi on dominoiva strategia (dominant strategy) Clydelle. Samalla tavalla, riippumatta siitä, mitä Clyde tekee, Bonnien paras strategia on vasikoida eli Bonniellekin C, eli vasikoida, on dominoiva strategia. Tämä on nähtävissä pelin symmetrisyyden takia. Mikä on sitten pelin tasapaino? Peliteoriassa puhutaan Nash-tasapainosta. Kahden päätöksentekijän pelissä, Nash-tasapainolla tarkoitetaan tilannetta, jossa molemmat päätöksentekijät valitsevat strategian, joka on paras mahdollinen annettuna strategia, jonka toinen pelaaja valitsee. Vangin dilemman ainut Nash tasapaino on siten (C,C). Tasapaino on tehoton koska (S,S) antaisi sekä Bonnielle ja Clydelle korkeamman tuoton (hyöty, payoff). Vangin dilemman tyyppisiä tilanteita esiintyy usein taloudessa. Seuraavaksi yksi esimerkki tästä:
Y56 Kevät 2010 4 29.3.2 Yhden kierroksen kartellipeli Luvussa 28 tarkasteltiin kartellin käyttäytymistä silloin, kun peliä pelattiin loputtomia kierroksia. Toisin sanoen, yritykset päättivät esim. vuosi vuoden jälkeen aina uudestaan siitä, pitäytyvätkö ne kartellisopimuksessa vai päättävätkö ne huijata ja poiketa sopimuksesta. Tutkitaan nyt tilannetta, jossa päätös kartellisopimuksessa pitäytymisessä tehdään vain kerran. Toisin sanoen kartellipeli pelataan vain kerran ja molemmat yritykset tietävät sen. Hyödynnetään luvussa 28 esitettyä laskuesimerkkiä pelin matriisia laadittaessa. Matriisin tuotot ovat tässä tapauksessa kunkin yrityksen saamat voitot eri tilanteissa. Vangin dilemmma: kartellipeli K Yritys2 C K Yritys1 C (48,48) (44,50) (50,44) (46.1,46.1) Jos yritys 2 pelaa K eli noudattaa kartellisopimusta, yrityksen 1 paras valinta on C huijata (cheat) ja olla noudattamatta kartellisopimusta, koska silloin se saa voittoa 50, kun taas noudattamalla kartellisopimusta se saisi vain voiton 48. Jos yritys 2 pelaa C (cheat), yrityksen 1 paras valinta on edelleen C, koska huijaamalla yritys saisi voiton 46.1, kun taas noudattamalla kartellisopimusta se saisi vain voiton 44. Tästä seuraa, että riippumatta siitä mitä yritys 2 valitsee, yrityksen 1 kannattaa aina valita C ja olla noudattamatta kartellisopimusta. Toisin sanoen kartellisopimuksesta poikkeaminen, C, on dominoiva strategia yritykselle 1. Samalla tavalla, riippumatta siitä, mitä yritys 1 tekee, yrityksen 2 paras strategia on C. Kartellipelin Nash-tasapaino on siten (C,C). Tasapaino on yritysten näkökulmasta tehoton, koska (K,K) antaisi molemmille korkeamman voiton. Tämä tasapaino pätee kuitenkin vain, jos peliä pelataan yhden kerran. Luvussa 28 näimme, että peli on luonteeltaan toisenlainen, jos kartellisopimuksesta päätetään useamman kerran peräkkäin.
Y56 Kevät 2010 5 13.4 REPEATED GAMES Chapter 13: Game Theory and Competitive Strategy In March 1983, American Airlines proposed that all airlines adopt a uniform fare schedule based on mileage. The rate per mile would depend on the length of the trip, with the lowest rate of 15 cents per mile for trips over 2500 miles and the highest rate, 53 cents per mile, for trips under 250 miles. Why did American propose this plan, and what made it so attractive to the other airlines? The aim was to reduce price competition and achieve a collusive pricing arrangement. Fixing prices illegal. Instead, the companies would implicitly fix prices by agreeing to use the same fare-setting formula. The plan failed, a victim of the prisoners dilemma. Pan Am, which was dissatisfied with its small share of the U.S. market, dropped its fares. American, United, and TWA, afraid of losing their own shares of the market, quickly dropped their fares to match Pan Am. The price-cutting continued, and fortunately for consumers, the plan was soon dead. Copyright 2009 Pearson Education, Inc. Publishing as Prentice Hall Microeconomics Pindyck/Rubinfeld, 8e. Lähde: Rubinfeld & Pindyck 2009, 492-494 21 of 42 Aktivoiva tehtävä 1: Tutki alla olevan mainontapelin matriisia (Rubinfeld & Pindyck 2009, 483) ja kerro a) Mikä tai mitkä ovat pelin mahdolliset tasapainot? b) Onko pelillä dominoivien strategioiden tasapainoa?
Y56 Kevät 2010 6 Muistinvirkistys: Dominoivien strategioiden tasapaino: Strategioiden kombinaatio, joka koostuu kunkin pelaajan dominoivasta strategiasta Dominant Strategies: I m doing the best I can, no matter what you do. You re doing the best you can, no matter what I do. vs. Nash Equilibrium: I m doing the best I can, given what you are doing. You re doing the best you can, given what I am doing. Lähde: Rubinfeld & Pyndyck (2009, 484) Tällä pelillä on dominoivien strategioiden tasapaino. Jos yritys B valitsee mainonnan (Advertise), yrityksen A:n kannattaa valita Advertise, koska 10 > 6. Jos yritys B valitse ei mainontaa (Don't advertise), yrityksen A kannattaa valita Advertise, koska 15 > 10. Yrityksellä A on siis dominoiva strategia eli Advertise. On helppo nähdä, että yrityksellä B on myös dominoiva strategia Jos A valitsee Advertise, yritys B valitsee Advertise, koska 5 > 0. Jos A valitsee Don't advertise, B valitsee Advertise, koska 8 > 2. Yrityksellä B on siis myös dominoiva strategia eli Advertise. Pelillä on siis yksi tasapaino (A,A), joka on dominoivien strategioiden tasapaino, koska kumpikin pelaaja pelaa omaa dominoivaa strategiaansa.
Y56 Kevät 2010 7 Aktivoiva tehtävä 2: Tutki nyt alla olevan mainontapelin matriisia (Rubinfeld & Pindyck 2009, 483), kun pelin tuotot eroavat edellisestä tilanteesta, ja kerro a) Mikä tai mitkä ovat pelin mahdolliset tasapainot? b) Onko pelillä dominoivien strategioiden tasapainoa? Tällä kertaa pelillä ei ole dominoivaa strategiaa, sillä yrityksen A valinta riippuu siitä, mitä yritys B valitsee. Muista, että dominoiva strategia määritellään pelaajan parhaana toimintona riippumatta siitä, mitä kilpaileva pelaaja tekee. Jos yritys B valitsee mainonnan (advertise), yrityksen A kannattaa valita advertise (10 > 6). Jos yritys B valitsee ei mainonnan (don't advertise), yrityksen A kannattaa valita don't advertise, koska nyt 20 >15. Yrityksellä B on kuitenkin edelleen dominoiva strategia riippumatta siitä, mitä yritys A valitsee. Jos A valitsee advertise, yritys B valitsee advertise, koska 5 > 0. Jos A valitsee don't advertise, B valitsee advertise, koska 8 > 2. Muistetaan, että pelaajilla on täydellinen tietämys pelin luonteesta. Yritys A voi siis tehdä saman päättelyn kuin teimme edellä ja päätellä, että B tulee valitsemaan advertise. Tietäen tämän A:n paras valinta on advertise, koska 10 > 6. Pelin Nash-tasapaino on (A,A), mutta pelillä ei ole dominoivien strategioiden tasapainoa.
Y56 Kevät 2010 8 29.3.3 Pelit, joissa ei ole dominoivien strategioiden tasapainoa Näimme, että vangin dilemmassa on dominoivien strategioiden tasapaino (C,C), kun peliä pelataan kerran. Kyseessä on siis paras valinta kummallekin pelaajalle riippumatta siitä, mitä toinen pelaaja valitsee. Kaikilla peleillä ei ole dominoivien strategioiden tasapainoa (katso edellä aktivoiva tehtävä 2). Tällaisissa peleissä voi kuitenkin olla ns. Nash-tasapaino (huom. kaikissa peleissä ei välttämättä ole ollenkaan tasapainoa). Muistetaan, että Nash-tasapainossa kaikki pelaajat valitsevat strategian, joka on paras mahdollinen, annettuna strategiat, joita muut pelaajat valitsevat. Ts. Nash-tasapainopiste on strategiapari, josta kummankaan pelaajan ei kannata yksinään poiketa. Nash-tasapainon/tasapainojen määrittelemiseksi siis oletetaan, että kukin pelaaja pelaa parhaan strategiansa mukaisesti. Tiedetään, että yhdessä pelissä Nash-tasapainoja voi olla useita. Aktivoiva tehtävä 3 Oletetaan, että muromarkkinoilla vallitsee duopoli. Molemmat yritykset harkitsevat uuden aamiaismuron lanseeraamista markkinoille. Markkinatutkimukset osoittavat, että markkinoilla on tilaa sekä yhdelle uudelle rapealle murolle että yhdelle uudelle makealle murolle. Oletetaan, että valinta tapahtuu samanaikaisesti ja että yrityksillä ei ole mahdollisuutta koordinoida lanseerattavan murotyypin valintaa. Oletetaan myös, että kummallakin yrityksellä on resursseja vain yhden uuden murotyypin tuottamiseen ja markkinointiin. Alla oleva matriisi havainnollistaa yritysten tuotot. Mikä on ns. normaalipelin Nash-tasapaino? Lähde: Rubinfeld & Pindyck 2009, 485 Jos yritys 2 valitsee Crispy (rapean), yrityksen 1 kannattaa valita Sweet (makea), koska10 > -5. Jos yritys 2 valitsee Sweet, yrityksen 1 kannattaa valita Crispy, koska 10 > -5. Jos yritys 1 valitsee Crispy (rapean), yrityksen 2 kannattaa valita Sweet (makea), koska 10 > -5. Jos yritys 1 valitsee Sweet, yrityksen 2 kannattaa valita Crispy, koska 10 > -5. Tästä seuraa, että pelillä on kaksi Nash-tasapainoa (S,C), eli matriisin vasen alakulma, ja (C,S), eli matriisin oikea yläkulma. Ilman lisäinformaatiota on mahdoton tietää, kumpi tasapaino toteutuu. ***
Y56 Kevät 2010 9 Toinen peli, jossa ei ole dominoivien strategioiden tasapainoa, on ns. kanapeli game of chicken. Tässä pelissä on myös useampia Nash-tasapainoja. Samaa pelimuotoa kutsutaan usein myös Haukka ja kyyhky -peliksi (Hawk-Dove game). Alkuperäinen kanapeli oli sellainen, jossa kaksi kuljettajaa ajaa toisiaan kohti törmäyskurssilla: toisen kuljettajista on väistettävä tai muuten molemmat voivat kuolla yhteentörmäyksessä. Jos kuitenkin yksi kuljettaja väistää ja toinen ei, väistäjää kutsutaan pelkuriksi "chicken". Haukka ja kyyhky -peli on loogisesti sama, vaikka tarina onkin erilainen. Tarina on seuraava: kaksi samaan lajiin kuuluvaa lintua kilpailevat reviiristä. Linnuilla on kaksi mahdollista strategiaa 1. Haukka-strategia: taistele reviiristä 2. Kyyhky-strategia: vältä taistelua ja jaa reviiri Reviiristä linnut saavat hyödyn V. Jos reviiri jaetaan, hyöty jaetaan puoliksi ja on ½V. Jos linnut päätyvät taistelemaan reviiristä, on mahdollista että linnut loukkaantuvat. Taistelemiseen liittyvä kustannus on siis C. Oletetaan, että molemmilla linnuilla on sama todennäköisyys voittaa taistelu. Jos molemmat taistelevat, molempien tuotto on W = ½V - C. Alla on kuvattu pelin matriisi yleisessä muodossa: Haukka ja kyyhky peli Hawk-Dove game D Lintu2 H Lintu1 D H (1/2V, 1/2V) (V,0) (0,V) (W,W) Olkoon parametrien arvot V = 6 ja C = 2, jolloin peli on tavallinen vangin dilemma peli (voit tarkistaa sen harjoituksena). Peli muuttuu kana-peliksi, kun V = 2 ja C = 2. Tällöin matriisi on
Y56 Kevät 2010 10 Haukka ja kyyhky peli : KANA Hawk-Dove game (Chicken) D Lintu 2 H Lintu 1 D H (1, 1) (0,2) (2,0) (-1,-1) Aktivoiva tehtävä 4 Tutki yllä oleva kana-peliä. Mikä on/ovat Nash-tasapainot? Jos lintu 1 valitsee D, linnun 2 paras valinta on H, koska 2 > 1. Jos lintu 1 valitsee H, linnun 2 paras strategia on D, koska 0 > -1. Jos lintu 2 valitsee D, linnun 1 paras valinta on H, koska 2 > 1. Jos lintu 2 valitsee H, linnun 1 paras strategia on D, koska 0 > -1. Nähdään, että kummallakaan linnulla ei ole dominoivaa strategiaa, siis yhtä strategiaa, jota kannattaisi noudattaa siitä huolimatta, mitä toinen pelaaja tekee. Pelillä on kuitenkin kaksi Nash-tasapainoa puhtaina strategioina (Nash equilibria in pure strategies): (H,D) ja (D,H). Tällä kurssilla tarkastellaan vain nk. puhtaita strategioita, mikä tarkoittaa, että pelaaja pelaa jompaakumpaa toimintoa D tai H todennäköisyydellä 1. On kuitenkin mahdollista, että pelaaja pelaa tiettyä toimintaa todennäköisyydellä 0 1. Tällöin puhutaan ns. sekastrategioista (mixed strategy) ja tasapainoja voi löytyä sekastrategioistakin. Emme tällä kurssilla tutki sekastrategioita, mutta seuraavaksi on esitetty esimerkkejä asiasta kiinnostuneille.
Y56 Kevät 2010 11 29.3.4 Sekastrategiat (ei tentittävää materiaalia, kiinnostuneille) Olkoon esimerkiksi V = 2 ja C = 4. Tällöin pelimatriisi on KANA Autoiljia 2 Väistä Ei väistä Autoilija 2 Väistä Ei väistä (1, 1) (0,2) (2,0) (-3,-3) Sekastrategiassa autoilijan 2 on oltava indifferentti toimintojen V ja E välillä. Olkoon todennäköisyys, jolla pelaaja valitsee E:n. Autoilijan 2 on siis oltava indifferentti toimintojen V ja E välillä, kun täyttää ehdon ( V ) 0 (1 ) 1 ( E) ( 3) (1 ) 2 0 (1 ) 1 ( 3) (1 ) 2 1 3 2 2 4 1 1 4 0.25. Tulkinta: sekastrategiassa pelaaja valitsee "Ei väistä" todennäköisyydellä 0.25 ja väistämisen todennäköisyydellä 0.75. Tilanne on sama toiselle pelaajalle pelin symmetrisyydestä johtuen. Aktivoiva tehtävä 5 Tarkastele normaalimuotoista peliä matching pennies. Pelin idea on seuraava: Pelaajien on valittava joko kruuna tai klaava siten, että kumpikin pelaaja tekee valintansa samanaikaisesti eikä heillä ole mahdollisuutta koordinoida valintojaan. Jos pelaajien valinnat ovat erilaisia, pelaaja A voittaa (1) ja pelaaja B häviää (-)1. Jos molemmat pelaajat valitsevat kruunan tai molemmat klaavan, pelaaja A häviää (-1) ja pelaaja B voittaa (1).
Y56 Kevät 2010 12 Lähde: Rubinfeld & Pindyck 2009, 488 Todetaan aluksi, että kyse on nollasummapelistä, koska jokaisen solun tuottojen summa on vakio (tässä tapauksessa 0), eli yhden pelaajan voitto on toisen pelaajan tappio. Tarkistetaan nyt, onko tällä pelillä Nash-tasapainoja puhtaina strategioina. Kruuna = heads Klaava = tails Jos pelaaja B valitsee kruunan, pelaaja A valitsee myös kruunan. Jos pelaaja B valitsee klaavan, pelaaja A valitsee myös klaavan. Jos pelaaja A valitsee kruunan, pelaaja B valitsee klaavan. Jos pelaaja A valitsee klaavan, pelaaja B valitsee kruunan. Kummankaan pelaajan valinta ei siis osu koskaan samaan soluun. Tästä nähdään, ettei pelissä ole Nash-tasapainoa puhtaana strategiana. Sellainen on kuitenkin olemassa sekastrategiana. Sekastrategiassa esimerkiksi pelaajalle A on oltava samantekevää valita joko kruuna tai klaava, eli ( heads) 1 (1 ) 1 ( tails) ( 1) (1 ) 1 1 (1 ) 1 ( 1) (1 ) 1 1 1 4 2 1 2 0.5. eli sekastrategiassaan pelaaja A valitsee kruunan todennäköisyydellä 0.5 tai klaavan todennäköisyydellä 0.5, jolloin pelaajan odotettu tuotto on 0 (voit tarkistaa sijoittamalla thetan sijaan 0.5:n tuoton kuvaavaan yhtälöön.) Ovatko sekastrategiat realistisia? Riippuu kuvatusta tilanteesta. Sellaisissa peleissä kuin matching pennies ja pokeri sekastrategiat voivat olla realistisia. Sen sijaan ne eivät ole kovin realistisia, jos ajetellaan vaikka yritysten valintatilanteita kuvaavia pelejä. On vaikea uskoa, että yritykset valitsisivat esimerkiksi tuotetut määrät tai hinnat sekastrategioiden perusteella, eli satunnaisesti. Koska kiinnostuksemme kohteet ovat tilanteita, joissa sekastrategiat eivät ole kovin realistisia, emme tutki niitä nyt enempää.
Y56 Kevät 2010 13 29.4 Dynaamiset pelit Edellä tarkastelimme staattisia pelejä, joissa valinta tehdään siis kerran ja vielä samanaikaisesti. Dynaamisilla peleillä tarkoitetaan tilanteita, joissa 1. pelaajat tekevät valintoja joko peräkkäin ja/tai 2. pelaajat pelaavat staattista peliä useita kierroksia (ns. toistettu peli, repeated game). Katsotaan ensin peliä, jossa on useita kierroksia: käytetään esimerkkinä kartellia, ja tämän jälkeen katsotaan dynaamisen pelin toista muotoa: tilannetta, jossa pelaajat tekevät valintansa peräkkäin. 29.4.1 Toistuvat pelit 29.4.1.1 Kartellipeli, jossa peliä pelataan tunnettu, äärellinen määrä kierroksia Luvussa 28 tutkittiin, olisiko yritysten muodostama kartelli stabiili, kun yritykset voivat pelata kartellipeliä loputtomia kertoja (siis äärettömän määrän kierroksia). Oletettiin, että jos yritys 1 huijaa toista yritystä, huijaamisen jälkeen toinen yritys ei enää suostu kartellitoimintaan, vaan pelaa tästä eteenpäin Cournot-peliä. Luvussa laskettiin, millä voitot nykyarvoistavalla koron tasolla kartelli olisi stabiili. Tutkitaan nyt tilannetta, jossa kartellipeliä pelataan toistuvasti, mutta kierroksia on äärellinen määrä. Oletetaan, että kierroksia on 10 ja pelaajat tietävät tämän. Edellä näimme staattisia pelejä tarkastellessamme, että yhden kierroksen tapauksessa Nashtasapaino ei ole kartellia ylläpitävä, vaan tasapaino oli matriisin solussa (C,C). Luvussa 28 taas näimme, että äärettömällä määrällä kierroksia kartellisopimus voi olla pysyvä, jos koron taso on laskemamme. Mitä jos nyt valitaan vaihtoehto näiden ääripäiden eli yhden ja äärettömän kierrosmäärän väliltä? Kysymys kuuluu: onko kartelli stabiili 10 kierroksen tapauksessa, eli onko yhteistyötä mahdollista ylläpitää? Hyödynnetään edelleen luvussa 28 esitetty laskuesimerkkiä, jonka lopputulokset on nähtävissä alla olevassa taulukossa. Cournot Kartelli "Huijaus" yritys 1 voitto 46,1 48 50 tuotanto 4,8 4 5 yritys 2 voitto 46,1 48 44 tuotanto 4,8 4 4
Y56 Kevät 2010 14 Tarkastellaan seuraavaa strategiaa, jonka yritys voisi valita itselleen: Valitse kartellin tuotantomäärä y = 4 niin kauan kuin toinenkin valitsee samoin. Jos toinen poikkeaa kartellisopimuksen mukaisesta tuotantomäärästä ja valitsee suuremman tuotantomäärän y = 5 jollakin kierroksella, pelaa jokaisella kierroksella siitä eteenpäin Cournot peliä, jolla y = 4.8. Voiko tilanne, että kumpikin yritys toteuttaa em. strategiaa olla tasapaino? Peli ratkaistaan nyt lopusta alkuun päin (backwards induction). Mietitään ensin, mitä kummankin yrityksen kannattaa tehdä (siis tuottaa) viimeisellä kierroksella 10. Viimeisellä kierroksella tämä toistettu peli näyttää tismalleen samalta kuin yhden periodin staattinen peli edellä. Yrityksillä on siis dominoiva strategia (C,C), jolloin valitaan tuotantomäärät (y,y ). Toiseksi viimeisellä periodilla pelaajat tietävät, että kierroksella 10 kannattaa joka tapauksessa pelata (C,C) eli valita tuotantomäärät (y,y ). Tästä seuraa, että 9 kierroksella kannattaa myös valita tuotantomääräksi y. Kun jatketaan samalla tavalla, todetaan, että jokaisella kierroksella kannattaa valita (C,C) eli (y,y ). Nash-tasapaino on siis kullakin kierroksella (C,C). Huomaa, että Nash-tasapaino tulee olemaan (C,C), vaikka peliä pelattaisiin satoja tai tuhansia kierroksia, kunhan vaan kierrosten määrä on äärellinen (loppu on siis tiedossa). Peliteoria siis ennustaa, että kartellisopimusta ei noudateta, ellei peliä pelata äärettömiä määriä kierroksia ja ellei korkokanta ole sopiva. Kun kierrosten määrä on ääretön, pelissä on useita Nashtasapainoja esim. korkokannasta riippuen. Yksi Nash tasapaino on pelata (C,C) ikuisesti, mutta myös (K,K) voi olla Nash-tasapaino, jos toinen yritys voi rangaista kilpailijaa, joka ei noudattanut kartellisopimusta. 29.4.1.2 Kartellipeli, kun kierrosten määrä on edelleen äärellinen, mutta tuntematon Todellisuudessa pelaajat eivät yleensä tiedä, kuinka monta kierrosta he tulevat pelaamaan. Kartellin solmineet osapuolet eivät siis ole tietoisia siitä, kuinka kauan he toistavat päätöksen kartellissa pysymisestä tai huijaamisesta. Jos kierrosten määrä on tuntematon, voi olla mahdollista pitää yllä yhteistyötä kartellipelissä. Tällöin tarvitaan kuitenkin uskottava uhkaus huijaamista seuraavasta sanktiosta. Tit-for-tat strategia toteuttaa tällaisen uskottavan uhkauksen:
Y56 Kevät 2010 15 Tit-for-tat -strategia Robert Axelrod 1 pyysi vuonna 1984 peliteorian tutkijoita ehdottamaan, mikä olisi paras strategia, kun vangin dilemman tyyppisiä pelejä pelataan äärettömiä kierroksia. Axelrod arvioi tietokonesimulaatioiden avulla, mikä strategia tuottaisi pelaajalle suurimman tuoton. Arvion voittaja oli ns. tit-for-tat -strategia (kirjaimellisesti potut pottuina -strategia) Käytetään seuraavaa pelimatriisia esimerkkinä: Lähde: Rubinfeld and Pindyck 2009, 490. Yo. pelin tit-for-tat strategia olisi seuraava: a) Aloita peli valitsemalla korkea hinta (Vangin dilemmassa vastaava kuin vaieta). b) Jos jollakin kierroksella toinen pelaaja valitsee matalan hinnan (vastaava kuin vasikoi), valitse sitten matala hinta ja jatka matalan hinnan valitsemista seuraavissakin peleissä siihen asti kunnes toinen pelaaja valitse jälleen korkean hinnan (vaieta). c) Sen jälkeen valitse korkea hinta siihen asti kunnes toinen pelaaja taas mahdollisesti poikkeaa tästä strategiasta. Rubinfeld & Pindyckin mukaan (2009, 491) tit-for-tat strategia voi olla toimiva, vaikka kierrosten määrä olisi äärellinen, kunhan vaan kierrosten määrä ei ole tiedossa. 1 Axelrod, R. (1984) The Evolution of Cooperation, New York: Basic Books.
Y56 Kevät 2010 16 29.4.2 Dynaamiset pelit, joissa valinta tehdään peräkkäin 29.4.2.1 Pelin ekstensiivinen muoto Tarkastelimme aktivoivassa tehtävässä 3 yritysten murolanseerausta. Katsotaan nyt modifioitu versiota tuotteen valintapelistä: Lähde: Rubinfeld ja Pindyck 2009, 495 Mikä on tämän pelin Nash-tasapaino? Jos yritys 1 valitsee crispy (rapea), yrityksen 2 kannattaa valita sweet. Jos yritys 1 valitsee sweet (makea), yrityksen 2 kannattaa valita crispy. Jos yritys 2 valitsee crispy, yrityksen 2 kannattaa valita sweet. Jos yritys 2 valitsee sweet, yrityksen 2 kannattaa valita crispy. On helppo nähdä, että pelissä on olemassa kaksi Nash-tasapainoa, mutta ei ole mahdollista sanoa, kumpi toteutuu eikä edes sitä, toteutuuko kumpikaan. Katsotaan nyt samaa peliä dynaamisessa muodossa eli oletetaan, että yritys 1 voi tuoda uuden tuotteen markkinoille nopeammin kuin yritys 2, eli yritys 1 on johtaja ja yritys 2 seuraaja. Tällainen peräkkäin pelattava peli voidaan nyt havainnollistaa normaalimuodon sijaan paremmin nk. ekstensiivisessä muodossa (engl. extensive form). Dynaamista peliä on usein luontevaa analysoida tämän ns. pelipuun avulla. Peliä, jossa on äärellinen määrä vaiheita, analysoidaan lopusta alkuun päin (backwards induction). Lähde: Rubinfeld & Pindyck 2009, 496
Y56 Kevät 2010 17 Pelin ekstensiivisestä muodosta nähdään, että yritys 1 valitsee tuotteensa ensimmäisenä. Sen jälkeen valinta siirtyy yritykselle 2. Peli ratkaistaan helpoiten lopusta alkuun. Nähdään, että yrityksen 2 valinta ylemmässä haarassa (node) on sweet, koska 20 > -5. Jos peli onkin alemmassa haarassa, niin valinta on puolestaan crispy, koska 10 > -5 Nyt tietäen yrityksen 2 valinnan, yritys 1 tekee käytännössä päätöksen ylemmän tai alemman haaran välillä, tietäen, että, mitkä ovat yrityksen 2 valinnat: 10,20 20,10 Koska valinta sweet on tuottoisampi, voidaan päätellä, että yritys 1 valitsee juuri sen. Eli dynaamisessa pelissä, jossa yritys 1 valitse ensimmäisenä, tasapaino on yksiselitteinen (sweet, crispy). 29.4.2.2 Uskottavan uhkauksen käsite Toistuvien pelien tapauksessa käsittelimme jo uskottavan uhkauksen käsitettä. Yleisesti ottaen on paljon peliteoreettisia tilanteita, jossa pelaajan kannattaa rajoittaa omaa käyttäytymistään saadaaksen edun itselleen. Dynaamisessa murolanseeraus-pelissä hitaampi seuraajayritys voi esimerkiksi ennakolta sitoutua sweet muron tuottamiseen. Nähdään, että jos yritys 1 voi olettaa yrityksen 2 todella tuottavan sweet muroja, niin yrityksen 1 on kannattavaa valita crispy. Tuotot ovat tässä tapauksessa päinvastaiset eli 10 yritykselle 1 ja 20 yritykselle 2 (huolimatta siitä, missä järjestyksessä murot lopulta tuodaan markkinoille). Tällaisen ratkaisun syntymisessä avainasemassa on yrityksen 2 sitoutumisen uskottavuus (= uhkauksen uskottavuus). Sitoutumiskeinoja voisivat olla esimerkiksi kalliin mainoskampanjan toteuttaminen, jossa mainostetaan tuleva sweet muroa tai suuren tuotantopanosmäärän (sokerin) ostaminen. Jotta sitoutuminen johtaisi yrityksen 2 etuun, eli jotta se olisi uskottava, sen pitäisi olla havaittava kilpailijalle ja toiminnan pitäisi olla uskottavan kallis. Jos yrityksen 2 uhkaus on uskottava, niin yrityksen 1 ei kannata lanseerata sweet muroa markkinoille, vaikka se pystyykin tekemään sen ensimmäisenä, koska vaihtoehto (sweet, sweet) tuottaa kummallekin yritykselle tappiota.
Y56 Kevät 2010 18 Aktivoiva tehtävä 6 Kahden yrityksen välinen dynaaminen peli on kuvattu alla. Oletetaan yritys 2 on nyt johtaja. Lähde: Rubinfeld ja Pindyck (2009, 498) Kuvittele, että yritys 1 uhkaa valita matalan hinnan, jos yritys 2 valitse matalan hinnan. Onko sen uhkaus uskottava? Perustele. Uhkaus ei ole uskottava, eli se on ns. empty threat. Matriisin perusteella yritys 2 tietää, että mikäli se valitsee matalan hinnan, yrityksen 1 kannattaa uhkauksesta huolimattaan valita korkea hinta. Rationaalinen taloudenpitäjä ajattelee omaa etuaan eikä siten ole uskottavaa, että yritys 1 valitsisi kiusatakseen matalan hinnan, jolloin se saisi 70 pienemmän voiton (80-10). Huomaa: Uhkauksien tekemisessä pelaajan maineella voi olla ratkaiseva rooli. Esimerkiksi pelaaja, jota pidetään vähän hulluna, voi saada pelissä etua esimerkiksi sillä, että sen voidaan uskoa toteuttavan sellainen uhkaus, joka ei ole pelaajalle itselleen (ainakaan lyhyellä aikavälillä) kannattava. Pelaaja voi pelata muutaman kierroksen peliä hulluna (siis epärationaalisesti), jos tällainen lyhyen aikavälin strategia antaa sille edun pitkällä aikavälillä. Kertaluontoisessa pelissä, kuten aktivoivassa tehtävässä edellä, hullun strategia ei kuitenkaan olisi toimiva. 29.4.2.3 Stackelberg-duopolipeli Luvussa 28 esitettiin Stackelberg-duopolipeli, jossa yritykset tekivät valinnan tuotetusta määrästä, mutta eivät samanaikaisesti kuten Cournot-pelissä, vaan peräkkäin. Kyseessä on siis dynaaminen peli, jossa pelaajat tekevät valintoja peräkkäin (mutta eivät välttämättä toistuvasti). Muistetaan, että Stackelberg-duopolipelin idea on se, että toisella yrityksistä on mahdollisuus tehdä määrävalintansa ensimmäisenä. Ensimmäisen askeleen ottaja on siten johtaja ja toinen yritys on seuraaja
Y56 Kevät 2010 19 Muistetaan lisäksi, että Stackelberg-duopolipeli ratkaistaan takaperin kolmessa vaiheessa: 1. Johtaja ratkaisee ensiksi seuraajan reaktiofunktion kuvaamaan kuinka seuraaja sopeutuu johtajan määrävalintaan 2. Johtaja maksimoi voittonsa ehdolla seuraajan reaktiofunktio 3. Seuraajan optimaalinen valinta ratkaistaan reaktiofunktiosta, johon on sijoitettu johtajan optimiratkaisu. Stackelberg määrävalintaa kuvaava dynaaminen peli on siten samanlainen kuin muro- tai hinnoittelupelit edellä sillä erotuksella, että yritykset tekevät valintansa tuotantomäärästä ja tuottona on yritysten voitot. Jos käytämme luvun 28 aktivoivan tehtävän 7 tuotantomääriä ja voittofunktioita, voimme määrittää seuraavan pelipuun: (76;76) 2 Cournot 1 Cournot Stackelb. 2 Stackelb. Cournot Stackelb. (96,25;70,94) (55,75;35,5) (86,125;40,56) Pelipuu havainnollistaa, että ensimmäisenä valinnan tekee yritys 1. Yritys voi päättää käyttää johtavaa asemaansa hyödyksi eli tuottaa suuremman ns. Stackelberg-määrän (13,5) tai tuottaa Cournon tasapainomäärän (9). Yritys 2 puolestaan reagoi yrityksen 1 tuotannontasoon ja voi tuottaa Stackelberg-seuraajan määrän (6,75) tai Cournot tasapainomäärän (9). Näiden tuotantomäärien synnyttämät voitot yrityksille on ilmaistu pelipuun loppua kuvaavissa silmuissa: ( 1, 2 ). Ratkaistaan peli takaperin, eli tarkastellaan ensin, mikä on seuraajan reaktio eli seuraajan valinta pelin päätöshetkellä. Jos peli on tällöin ylemmässä haarassa, seuraaja valitsee strategian Cournot, koska 76 > 70,94. Jos peli on alemmassa haarassa, seuraaja valitsee strategian Stackelberg, koska 40,56 > 35,5. Johtava yritys 1 tietää nyt seuraajan reaktion, joten sen valintatilanne on käytännössä supistunut seuraavaan muotoon:
Y56 Kevät 2010 20 Cournot (76;76) 1 Stackelb. (86,125;40,56) Nähdään, että 86,125 > 76 eli yrityksen 1 kannattaa valita Stackelberg-strategia. Pelin tasapaino on siis (Stackelberg, Stackelberg) eli (86,125; 40,56). On selvää, että seuraavan yrityksen uhkaus tuottaa Cournot-tasolla alemmassa haarassa ei olisi uskottava uhkaus kertaluontoisessa pelissä, joten yritys 1 valitsee vaihtoehdon Stackelberg. Tilanne voisi olla erilainen, jos yritys 2 pystyisi tekemään jotenkin sitovan uhkauksen siitä, että se tuottaa myös alemmassa haarassa Cournot-määrän (9), jos yritys 1 päätyy käyttämään hyväksi johtavaa asemaansa. Tällaisen uskottavan uhkauksen tilanteessa yrityksen 1 kannattaisi valita strategia Cournot, jolloin pelin tasapaino olisi (Cournot, Cournot) eli voitot olisivat (76; 76).