Luento 2: Strategiset pelit

Luento 2: Strategiset pelit Saara Hämäläinen Helsingin yliopisto TA5 Luento 2 2017 1 / 37

Game Theory by Ben Polak (Open Yale) "Introduction"(luento 1, kokonaan) "Formal ingredients of a game"(luento 2.2, katkelma) ja "Best response: formal definition"(luento 4.3, katkelma)

Strategiset pelit, Nash-tasapaino

Wikipedia.

Strategisen pelin määritelmä Strateginen peli G pi,pa i q ipi,pu i q ipi q koostuu seuraavista kolmesta elementistä 1. Pelaajat: Äärellinen joukko I. (Voidaan valita I t1,..., nu.) 2. Valintajoukot: Jokaiselle pelaajalle i P I joukko A i. Määritellään A ˆiPI A i. 3. Hyötyfunktiot: Jokaiselle pelaajalle i P I funktio u i. Määritellään u i : A Ñ R. Nimityksiä ja merkintöjä: Valintaprofiili a pa 1,...,a n q P A A 1 ˆ... ˆ A n sisältää yhdessä kaikkien pelaajien valinnat. a i P A i on pelaajan i valinta. a i pa 1,...,a i 1,a i`1,...,a n q sisältää kaikkien muiden pelaajien paitsi pelaajan i valinnat. Esitystapa: a pa i,a i q P A. TA5 Luento 2 2017 6 / 37

Strategiset pelit: huomioita 1 Strateginen peli on vuorovaikutusmalli, jossa kaikki valinnat tehdään kerralla ja lopullisesti. Pelaajat valitsevat joko yhtäaikaisesti tai riippumattomasti näkemättä toistensa valintoja. Pelataan kerran tai, jos pelataan monesti, eri pelien välillä ei saa olla strategista riippuvuutta (palkitseminen, rankaiseminen aiemmista valinnoista). Keskeinen ero pelitilanteen ja muitten päätöstilanteiden välillä on se, että toisten pelaajien valinnat vaikuuttavat toisten pelaajien hyötyyn: u i pa i,a i q. TA5 Luento 2 2017 7 / 37

Strategiset pelit: huomioita 2 Joskus on hyödyllista määritellä erillinen lopputulemafunktio g : A Ñ C ja pelaajien hyödyt suhteessa lopputulemiin u i : C Ñ R. Tällöin saadaan: u i paq ě u i pa 1 q ðñ u i pgpaqq ě u i pgpa 1 qq. Jos valinnat eivät täysin määrää lopputulemia (g : A ˆ Ω Ñ C, jossa ω P Ω on satunnainen), tarkastellaan odotettua hyötyä: U i paq ě U i pa 1 q ðñ ř ωpω u ipgpa,ωqqp ω ě ř ωpω u ipgpa 1,ωqqp ω. TA5 Luento 2 2017 8 / 37

Strategiset pelit: esimerkki 1 Sijaintipeli: "TV-asema L ja TV-asema K valitsevat kuinka liberaalia tai konservatiivistä sisältöä lähettää. Katsojien ideologista sijaintia kuvaa tiheysfunktio f pxq välillä r0, 1s. Katsojat seuraavat sitä TV-asemaa, jonka sisältö on lähinnä heidän omaa ideologista sijaintiaan. TV-asemat saavat mainostuloja suhteessa katsojien lukumäärään." I tl,ku (asemat). A i r0,1s (sisällöt). u i Fpāq jos a i ă a i ja u i 1 Fpāq jos a i ą a i (mainostulot) jossa ā pa L ` a K q{2. a L ā x a K TA5 Luento 2 2017 9 / 37

Strategiset pelit: esimerkki 2 Omistusoikeudet: "Henkilö 1:n ja henkilö 2:n ulottuvilla on hyödyke, jonka arvo on 50 (esim. henkilö 1:n laukku). Kumpikin voi yrittää ottaa sen haltuunsa tai antaa asian olla. Jos molemmat yrittävät saada hyödykkeen itselleen, heille aiheutuu kustannus 5; hyödyke mahdollisesti tuhoutuu. Oletetaan tässä vaiheessa, ettei ketään kiinnosta kenelle hyödyke alunperin kuului (olkoon paikka esim. Copacabana)." H2 I th1,h2u. A i to,ju (ota tai jätä). u i po,oq 5 i 1,2, u i pj,jq 0 i 1,2, u 1 pj,oq u 2 po,jq 0, u 1 po,jq u 2 pj,oq 50. H1 ota jätä ota 5 0 5 50 50 0 0 0 jätä TA5 Luento 2 2017 10 / 37

Strategiset pelit: esimerkki 3 Väsytystaistelu: "Iso jakeluyhtiö ja piraattiyhteisö käyvät väsytystaistelua. Jakeluyhtiö voi haastaa yhteisön jäseniä yksi kerrallaan oikeuteen tekijänoikeusrikkomuksista; tämä maksaa joka periodi sille c y. Piraattiyhteisö voi jatkaa sisällön pitämistä julkisena, vaikka siihen liittyy riskejä niin kauan kuin jakeluyhtiö on sen niskassa; aiheutuva kustannus on c p per periodi. Kumpikin osapuoli voi myös luovuttaa. Jos toinen osapuoli luovuttaa ensin, jakeluyhtiö saa v y ja piraattiyhteisö saa v p. Jos molemmat luopuvat yhtä aikaa, ne saavat puolet tästä". I ty,pu. A i N` (milloin luovuttaa ehdolla, että toinen jatkaa). u i pn i,n j q c i n i, jos n i ă n j, u i pn i,n j q c i n i ` v i {2, jos n i n j, ja u i pn i,n j q c i pn j ` 1q ` v i, jos n i ą n j. TA5 Luento 2 2017 11 / 37

Strategisen pelin ratkaiseminen Yritämme seuraavaksi ennustaa, mitä pelissä tulee käymään sen informaation perusteella, mitä pelistä alunperin tiedetään (pelaajat, valintajoukot, hyötyfunktiot). Eli mitä pelaajat tekevät pelissä? Haluamme siis erotella todennäisimmät valintaprofiilit a pa 1,...,a n q niistä, joita ei voida pitää kovin todennäköisinä. Tätä toimitusta kutsutaan pelin ratkaisemiseksi. Erilaisia ratkaisukäsitteitä on useita. Käymme niistä seuraavaksi joitain läpi. Tärkein ratkaisukäsite on Nash-tasapaino tai sen eri tarkennukset, joita käsitellään myöhemmillä luennoilla. Tänään puhumme ensiksi dominoitujen strategioiden elimoimimisesta ja rationalisoitavuudesta. TA5 Luento 2 2017 12 / 37

Strategisen pelin ratkaiseminen: dominoitujen strategioiden eliminointi Tapaus 1 (joskus): Pelin ratkaiseminen ei vaadi tietoa muiden valinnoista Dominoitujen strategioiden eliminoiminen: Joskus pelaajalla on selvästi parempia ja huonompia valintoja. Pelin ratkaisemisessa voidaan silloin päästä eteenpäin jättämällä "huonot"strategiat tarkastelun ulkopuolelle. Strategia a i aidosti dominoi strategiaa a 1 i, jos se on aidosti parempi valitsivatpa muut mitä hyvänsä: u i pa i,a i q ą u i pa 1 i,a i q kaikilla a i. Tapaus 2 (yleensä): Pelin ratkaiseminen vaatii tietoa muiden valinnoista Vaikka eliminoisimme kaikki dominoidut strategiat, peliin jää usein yhä monia valintaprofiileita, joista pitäisi koittaa erotella, mitkä ovat järkeviä ennusteita pelaajien toiminnalle ja mitkä eivät. Nyt jäljellä on siis enää valintoja a i ja ai 1, joista toiset ovat parempia, jos muut valitsevat a i, ja toiset ovat parempia, jos muut valitsevat a1 i : esim. u i pa i,a i q ą u i pa 1 i,a i q mutta u i pa i,a 1 iq ă u i pa 1 i,a 1 iq. TA5 Luento 2 2017 13 / 37

Strategisen pelin ratkaiseminen: pelaajien parhaat vastaukset ja rationalisoitavuus Ajatellaan siis tilannetta, jossa u i pa i,a i q ą u i pai 1,a iq mutta u i pa i,a 1 i q ă u ipai 1,a1 i q. Valitakseen järkevästi näitten välillä pelaajan i on muodostettava jonkinlainen näkemys siitä, mitä muut tulevat pelissä tekemään. Pelaajan uskomus a i tekee ymmärrettäväksi pelaajan i valinnan, jos a i on "pelaajan paras vastaus"muiden valintaan a i : BR i pa i q a i P A i u i pa i,a i q ě u i pa 1 i,a iq kaikilla a 1 i P A i(. Toisaalta järkevä pelaaja ymmärtää, että myös muut ovat järkeviä: Pelaajan i valinta a i on rationalisoitavissa, jos on sellaiset joukot Z i Ă A i ja Z i Ă A i a i P Z i ja kaikki valinnat Z i :ssa ovat parhaita vastauksia johonkin strategiaan Z i :ssa ja a i P Z i, ja kaikki valinnat Z i :ssa ovat parhaita vastauksia johonkin strategiaan Z i :ssa. TA5 Luento 2 2017 14 / 37

Strategisen pelin ratkaiseminen: Nash-tasapaino Nash-tasapaino on ratkaisukäsite, jossa pelaajien valinnat a i ovat parhaita vastauksia pelaajien odotuksiin muiden valinnoista a i pelaajien odotukset muiden valinnoista a i vastaavat näiden todellisia valintoja a i Nash-tasapaino a on siis niin sanottu paras vastaus -relaation kiintopiste a P BRpaq (vrt. x f pxq). Se on eräänlainen stabiili itsensä toteuttava ennuste. Kenenkään ei kannata yksipuolisesti poiketa Nash-strategiastaan, jos muutkin pysyvät omissaan. Nash-tasapaino on strategiaprofiili a P A, jolle pätee u i pa i,a i q ě u i pa 1 i,a iq kaikilla a 1 i P A i, kaikilla i P I. Huom. harjoitusten kirjoittajat: Nash-tasapaino a pa 1,...,a n q on valintaprofiili, joka kertoo, mikä kukin tekee. Se ei ole esim. vastaava tuottoprofiili upaq pu 1 paq,...,u n paqq... TA5 Luento 2 2017 15 / 37

Nash-tasapaino: tulkintoja Induktiivinen: Nash-tasapaino kuvaa säännönmukaista käyttäytymistä. Peliä pelaataan toistuvasti. Pelaajat oppivat ennustamaan muiden käyttäytymistä vähitellen havainnoimalla useita samantyyppisia valintatilanteita. Pelin analyysin tarkoitus on deskriptiivinen: kuvata, kuinka peliä todella pelataan, kunhan pelaajat tuntevat pelin hyvin. Deduktiivinen: Nash-tasapaino kuvaa järkiperäistä käyttäytymistä. Peli pelataan vain kerran. Pelaajat muodostavat odotuksensa muiden käyttäytymisestä erittelemällä huolellisesti, miten järkevä vastapelaaja toimisi. Pelin analyysin tarkoitus on normatiivinen: kuvata, kuinka peliä kannattaa pelata tai on mahdollista pelata järkevästi. Kummassakin tapauksessa peliteorian lähtötilanne on se, että pelaajat tuntevat pelin G pi,pa i q i,pu i q i q ja tietävät muiden tuntevan sen, tietävät muiden tietävän heidän tuntevan sen jne. TA5 Luento 2 2017 16 / 37

Hintakilpailu: Bertrand

Hintakilpailu: Bertrand-malli Yritys 1 ja yritys 2 1. myyvät homogeenisia hyödykkeitä 2. pelaavat kerran toisiaan vastaan 3. valitsevat hinnat p i riippumattomasti ja samanaikaisesti 4. tuottavat hyödykkeitä samalla tuotantoteknologialla: sama rajakustannus c i c 5. voivat vastata miten tahansa suureen kysyntään ilman kapasiteettirajoituksia TA5 Luento 2 2017 20 / 37

Bertrand-malli: tasapaino Kuluttajat havaitsevat myyjien hinnat p 1 ja p 2 ja ostavat siltä myyjältä, jonka hinta on matalampi. Jos hinnat ovat samat, kuluttajat valitsevat myyjän heittämällä lanttia, satunnaisesti. Kokonaiskysyntä Dpp min q riippuu markkinoitten matalimmasta hinnasta p min. Kysynnät ovat siis $ & D i pp i q, jos p i ă p j D i pp i,p j q D i pp i q{2, jos p i p j % 0, jos p i ą p j Vaikka myyjiä on vain kaksi, hintakilpailu riittää laskemaan hinnat rajakustannusten tasolle: Symmetrisellä Bertrand-pelillä on yksikäsitteinen tasapaino, jossa p 1 p 2 c ja Π 1 Π 2 0. TA5 Luento 2 2017 21 / 37

Bertrand-malli: todistus, osa I Todistus: Näytetään ensin, että p 1 p 2 c on Nash-tasapaino. Katsotaan siis, onko siitä kannattavia poikkeamia. Jos molemmat yritykset pelaavat oletettua tasapainostrategiaansa p i c, niiden voitto on Π D ipcq 2 pc cq 0. Mikä käy jos yritys valitsee matalamman hinnan p 1 i ă c? Tällöin yrityksen kysyntä on D i pp 1 i,p jq Dpp 1 iq, koska sen hinta on matalampi kuin toisen yrityksen hinta p j c, mutta se tekee tappiota myymällä alle rajakustannuksen: Π 1 j ă 0. Mitä käy jo yritys valitsee korkeamman hinnan p 1 i ą c? Nyt yrityksen kysyntä on D i pp 1 i,p jq 0, koska sen hinta on korkeampi kuin toisen yrityksen hinta p j c. Koska sillä ei ole kysyntää, yrityksen voitto on edelleen nolla: Π 1 j 0. Kumpikaan poikkeama ei siis ole kasvata yrityksen voittoa. pp 1,p 2 q pc,cq on siis Nash-tasapaino. TA5 Luento 2 2017 22 / 37

Bertrand-malli: todistus, osa II Todistus: Näytetään sitten, ettei muita Nash-tasapainoja ole. Käydään läpi eri mahdollisuuksia ja etsitään niistä kannattavia poikkeamia. 1. Tasapainokandidaatti: p i ă c jommallakummalla i 1,2. Ei käy: Myynti alle rajakustannuksen tuottaa tappiota. Yrityksellä on kannattava poikeama hintaan p i c, joka minimoi tappion. 2. Tasapainokandidaatti: p i p j ą c. Ei käy: Koska yritykset jakavat kysynnän, toisen yrityksen kannattaa poiketa hieman alaspäin, esim. hintaan p 1 i p j ε. Sen saama hinta laskee vain hieman, jos ε on pieni, mutta kysyntä kasvaa ainakin puolella. 3. Tasapainokandidaatti: p i ą p j. Ei käy: Koska kaikki kysyntä kohdistyy yritykseen j, sen voi poiketa reilusti ylöspäin, esim. hintaan p 1 i p j ε. Näin se on edelleen yrityksistä halvempi, mutta korkeampi hinta nostaa yleisesti ottaen sen myyntituloja. Koska muita Nash-tasapainoja ei ole, pp 1,p 2 q pc,cq on siis ainoa Nash-tasapaino. TA5 Luento 2 2017 23 / 37

Bertrand-malli: laajennuksia Erilaiset rajakustannukset: c 1 ă c 2 Iso kustannusero. Yritykset 1 monopolihinta p M 1 alle yrityksen 2 rajakustannuksen. Tasapainossa pp 1,p 2 q pp M 1,c 2q. Yritys 1 tuottaa voittoa Π 1 Dpp M 1 qppm 1 c 1q ą 0. Pieni kustannusero. Yritykset 1 monopolihinta p M 1 yli yrityksen 2 rajakustannuksen. Tasapainossa pp 1,p 2 q pc 2 ε,c 2 q. Yritys 1 tuottaa voittoa Π 1 Dpc 2 qpc 2 c 1 q ą 0. Kapasiteettirajoitukset: k 1 ă Dpcq Yritys 2 voi nostaa hintaa yli rajakustannuksen c menettämättä kysyntäänsä. Ne kuluttajat, jotka eivät saa kysyntäänsä tyydytyksi yrityksen 1 luona ovat siitä huolimatta valmiita ostamaan siltä. Huom. Malli, jossa yritykset valitsevat ensin haluamansa kapasiteetit k i ja sitten kilpailevat à la Bertrand, vastaa mallia, jossa yritykset kilpailevat à la Cournot (Kreps and Sheinkman, 1983). TA5 Luento 2 2017 24 / 37

Määräkilpailu: Cournot

Määräkilpailu: Cournot-malli Yritys 1 ja yritys 2 1. myyvät homogeenisia hyödykkeitä 2. pelaavat kerran toisiaan vastaan 3. valitsevat määrät q i riippumattomasti ja samanaikaisesti 4. tuottavat hyödykkeitä samalla tuotantoteknologialla: sama rajakustannus c i c 5. voivat vastata miten tahansa suureen kysyntään ilman kapasiteettirajoituksia TA5 Luento 2 2017 26 / 37

Cournot-malli: tasapaino Markkinahinta riippuu lineearisesti koko toimialan kokonaistuotannosta p 1 q 1 q 2, ja rajakustannus on c ă 1. Yritykset maksimoivat voittoaan: max Π i pq i,q j q q i pp cq q i `1 qi q j c q i Ensimmäisen kertaluvun ehdot ovat Tästä saadaan myyjän paras vastaus BΠ i pq i,q j q Bq i 1 2q i q j c 0 BR i pq j q 1 q j c 2 Tasapaino on näiden kiintopiste q 1 1 q 2 c 1 p 1 q 1 c 2 q c ðñ q 1 q 2 1 c 2 2 3 Tasapainossa pq 1,q 2 q pp1 cq{3,p1 cq{3q molemmat yritykset tuottavat voittoa: p 1 2p1 cq{3 ą c. TA5 Luento 2 2017 27 / 37

Makuerot: Hotelling

Erilaiset tuotteet: Hotelling-malli Tuotteet ja kuluttajat ovat erilaisia: toinen tykkää IPhonesta, toinen Androidista... Eroja kuvataan usein malleilla, joissa ne kiteytyvät tuotteen sijaintiin "ominaisuusavaruudessa". Jokaisella kuluttajalla ajatellaan olevan oma ihannepisteensä kyseisessä "ominaisuusavaruudessa". Mitä lähempänä tuote on kuluttajan ihannepistettä, sitä suurempi on kuluttajan maksuhalukkuus. Erot vaikuttavat yritysten väliseen hintakilpailuun, koska kuluttajat eivät enää pidä tuotteita toistensa täydellisinä substituutteina. Tämä yleensä lievittää kilpailua. Ainutlaatuisuus tuo monopolivoimaa. TA5 Luento 2 2017 29 / 37

Erilaiset tuotteet: Hotelling-malli Olkoon tuoteavaruus koko reaaliakseli. Tarkastellaan vain kahden "lähekkäisen"yrityksen kilpailua; unohdetaan muut. Yritys 1:n sijainti on a 1 ja yritys 2:n sijainti on a 2 tuoteavaruudessa. Oletetaan, että kuluttajien maut ovat tasaisesti jakautuneet a 1 :n ja a 2 :n välillä. Kuluttajan hyöty yrityksen i tuotteesta riippuu sen hinnasta p i, kuluttajan sijainnista x ja yrityksen sijainnista a i : upx,a i,p i q u p i px a i q 2. Klassinen esimerkki on tilanne, jossa aurinkorannalla on kaksi jäätelökioskia ja px a i q 2 on "kuljetuskustannus". TA5 Luento 2 2017 30 / 37

Hotelling-malli: kysynnät Joko kaikki ostavat yhdeltä yritykseltä tai yritystä 1 lähennä olevat kuluttajat ostavat siltä ja yritystä 2 lähinnä olevat kuluttajat ostavat siltä. Tällöin on olemassa kuluttaja x P pa 1,a 2 q, joka on indifferentti näiden yritysten tuotteiden välillä: u p 1 pa 1 xq 2 u p 2 pa 2 xq 2 pa 2 xq 2 pa 1 xq 2 p 1 p 2 a 2 2 2a 2 x a 2 1 ` 2a 1 x p 1 p 2 2pa 1 a 2 qx a 2 1 a 2 2 ` p 1 p 2 x a2 1 a2 2 2pa 1 a 2 q ` p1 p 2 2pa 1 a 2 q x a 1 ` a 2 2 x a 1 ` a2 a 1 2 ` p1 p 2 2pa 1 a 2 q ` p1 p 2 2pa 1 a 2 q Laskujen helpottamiseksi voidaan hyvin valita a 2 a 1 1 (normalisoidaan tuotteiden etäisyys ykköseksi), a 1 0 ja a 2 1 (laitetaan tuoteasteikon nollakohta yrityksen 1 hyödykkeen kohdalle), jolloin saadaan x 1 2 p1 p 2 2. TA5 Luento 2 2017 31 / 37

Hotelling-malli: hinnat Tarkastellaan yrityksen 1 ja yrityksen 2 välistä hinnoittelupeliä. Yritykset maksimoivat voittoaan Π i, jossa kysyntä riippuu molempien hinnoista: Yrityksen maksimointiongelmat: Ensimmäisen kertaluvun ehdot: q 1 x 1 2 p1 p 2 2 q 2 1 x 1 1 2 ` p1 p 2 2 ˆ 1 maxxp p 1 xc xpp 1 cq 1 2 p1 p 2 pp 2 1 cq ˆ maxp1 xqp p 2 xc p1 xqpp 2 cq 1 ` 1 2 2 p1 p 2 pp 2 2 cq 2p i ` 1 ` c ` p j 0, i 1,2 p i p j ` c ` 1, i 1,2 2 Tästä saadaan yritysten parhaat vastaukset BR i pp j q p j`c`1 2. TA5 Luento 2 2017 32 / 37

Hotelling-malli: tasapaino Tasapainossa on toteuduttava p 1 BR 1 pp 2 q p 2 ` c ` 1 2 p 2 BR 2 pp 1 q p 1 ` c ` 1 2 Tästä yhtälöparista voidaan ratkaista toisen yrityksen tasapainohinta p i p j ` c ` 1 2 Symmetrian perusteella tiedetään p p i`c`1 2 q ` c ` 1 ðñ p i c ` 1 2 p 1 c ` 1 p 2 c ` 1 Nash-tasapaino on siis pp 1,p 2 q p1 ` c,1 ` cq. Huomaa, että kuluttajien makuerot välillä a 2 a 1 1 tekevät yrityksille mahdolliseksi hinnoitella yli rajakustannuksen c. TA5 Luento 2 2017 33 / 37

Seuraavaa kertaa varten Game Theory by Ben Polak (Open Yale) "Nash Equilibrium"(luento 5, kokonaan) "Mixed strategies: definition"(luento 9.1, katkelma) ja "Mixed strategies: examples"(luento 9.2, katkelma) TA5 Luento 2 2017 36 / 37