PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA Matti Estola 29 marraskuuta 2013 Sisältö 1 Cournot'in duopolimalli 2 2 Pelin Nash -tasapainon tulkinta 3 3 Cournot'in mallin graanen ratkaisu 4 4 Bertrandin duopolimalli 5 5 Bertrandin mallin graanen ratkaisu 6 Teksti on suomennettu kirjasta: Gibbons, A Primer in Game Theory 1
1 Cournot'in duopolimalli Cournotin (1838) artikkeli on yksi peliteorian klassikkoja, joka paljon ennen Nashia ennakoi Nash -tasapainokäsitettä samankaltaisella käsitteellä Nykymuotoisen peliteorian katsotaan saaneen alkunsa 1930 -luvulla John Von Neumannin ja Oskar Morgernsternin tutkimuksista, joissa määriteltiin teorian peruskäsitteet (Von Neumann and Morgenstern: Theory of Games and Economic Behaviour, Third Edition (1953)) Palataan nyt Cournot'in malliin (johon olen lisännyt mittayksiköt) Olkoot q 1, q 2 (kpl/kk) kahden yrityksen tuotantonopeudet samaa homogeenista lopputuotetta Olkoon tarkasteltavan hyödykkeen markkinakysyntärelaatio muotoa p = p 0 zq, missä p (mk/kpl) on hyödykkeen yksikköhinta, q = q 1 + q 2 on toimialan yhteenlaskettu tuotantonopeus ja p 0 (mk/kpl) ja z ((mk kk)/kpl 2 ) ovat positiivisia dimensionaalisia vakioita Merkitään yritysten kuukausittaisia tuotantokustannuksia seuraavasti C i = cq i, i = 1, 2, missä yritysten rajakustannukset (=yksikkökustannukset) c (mk/kpl) ovat yhtä suuret, 0 < c < p 0 Yritysten oletetaan päättävän tuotantonopeuksistaan toisistaan tietämättä Muodostetaan tilanteesta normaalimuotoinen peli 1) Pelaajat ovat yritykset, jotka tuntevat sekä toisensa että toimialan menekkifunktion 2) Pelistrategiat ovat yritysten tuotantonopeudet, S i = {q i 0 q i < }, i = 1, 2, eli mikä tahansa positiivinen tuotantonopeus on yritysten valittavissa Koska p 0 vastaa tilannetta q 1 + q 1 p 0 /z, kumpikaan yritys ei kuitenkaan halua tuottaa suuremmalla tuotantonopeudella kuin p 0 /z ettei lopputuotteen hinta menisi negatiiviseksi 3) Pelin tulemat ovat yritysten kuukausittaiset voitot, Π 1 = pq 1 cq 1 = [p 0 z(q 1 + q 2 ) c]q 1, Π 2 = pq 2 cq 2 = [p 0 z(q 1 + q 2 ) c]q 2 Pelin Nash -tasapaino on strategiavektori (q 1N, q 2N ) jolle pätee Π 1 (q 1N, q 2N ) Π 1 (q 1, q 2N ), Π 2 (q 1N, q 2N ) Π 2 (q 1N, q 2 ) jokaisella mahdollisella strategialla q 1, q 2 Toisin sanoen yrityksellä 1 pätee max q 1 Π 1 = q 1 [p 0 z(q 1 + q 2 ) c] ja vastaava pätee yrityksellä 2 Ensimmäisen kertaluvun ehdot yritysten optimointiongelmista tuottavat = 0 q 1 = p 0 c zq 2 q 1 2z Π 2 = 0 q 2 = p 0 c zq 1 q 2 2z 2
Tämän yhtälöryhmän ratkaisu on q 1N = q 2N = p 0 c ja Nash -tasapainossa toimialan tuotantonopeus ja lopputuotteen hinta ovat q N = q 1N + q 2N = 2(p 0 c) ja p N = p 0 z 2(p 0 c) = p 0 + 2c 3 2 Pelin Nash -tasapainon tulkinta Kumpikin yritys haluaisi olla monopoliasemassa, jolloin niiden optimointiongelma olisi (tarkastellaan yritystä 1 olettamalla, että q 2 = 0) max q 1 Π 1 = q 1 [p 0 zq 1 ] cq 1 Tämän ratkaisu on = 0 q 1M = p 0 c q 1 2z ja p M = p 0 zq 1M = p 0 + c 2 Monopoliyrityksen maksimaalinen voitto olisi Π 1M = q 1M [p 0 zq 1M ] cq 1M = (p 0 c) 2 Nash -tasapainotilanteessa yrityksen 1 voitto on ( ) ( Π 1 (q 1N, q 2N ) = p 0 z 2(p ) 0 c) c = (p 0 c) 2 9z joten Π 1M > Π 1 (q 1N, q 2N ) Tarkastellaan vielä tilannetta, jossa yritysten yhteenlaskettu tuotantonopeus vastaa monopoliyrityksen optimaalista tuotantonopeutta, eli yritykset tuottavat yhdessä siten, että toimialan voitto maksimoituu Nyt q 1M/2 = q 2M/2 = (p 0 c)/ ja ( ) ( ( ) Π 1 (q 1M/2, q 2M/2 ) = p 0 z 2z ) c = (p 0 c) 2 8z Toimialan voiton maksimoiva yrityksen 1 tuotantonopeus on siis pienempi kuin yrityksen 1 tuotantonopeus Nash -tasapainotilanteessa ja Π 1M > Π 1 (q 1M/2, q 2M/2 ) > Π 1 (q 1N, q 2N ) Tämä voidaan selittää seuraavasti: q 1M/2 ei 3
ole yrityksen 1 paras vastastrategia yrityksen 2 strategialle q 2M/2, sillä asettamalla q 2 = q 2M/2 yrityksen 1 optimiehtoon, saadaan = 0 q 1 = p 0 c z q 1 2z ( p0 ) c = 3(p 0 c) 8z Yrityksen 1 kannattaa siis tuottaa suuremmalla tuotantonopeudella kuin toimialan voiton maksimoiva tuotantonopeus q 1M/2 olisi (3/8 > 2/8 = 1/4), jos yritys 2 tuottaa puolella tuotantonopeudella toimialan voiton maksimoivasta Syy tähän on se, että lopputuotteen hinta on tällöin riittävän korkea p M = (p 0 + c)/2 > p N jotta tuotantonopeuden lisääminen kannattaa Koska sama pätee molemmille yrityksille, molemmilla on halu lisätä tuotantonopeuttaan tilanteessa, jossa ne yhteenlaskettuna tuottavat toimialan voiton maksimoivalla tuotantonopeudella Tästä syystä Nash -tasapainossa, jossa yritykset eivät tiedä toistensa tuotantopäätöksistä, toimialan yhteenlaskettu tuotantonopeus on yksittäistä monopoliyritystä suurempi Tarkastellaan vielä yrityksen 1 voittoa seuraavissa tilanteissa ja osoitetaan, että Π 1 (q 1N, q 2M/2 ) > Π 1 (q 1M/2, q 2N ) Nyt q 1N + q 2M/2 = p 0 c + p 0 c = 7 12 ( ) z ja Π 1 (q 1N, q 2M/2 ) = Π 1 (q 1M/2, q 2N ) = ( ) ( p 0 z 7 ( ) ) c = 5 (p 0 c) 2, 12 z 36 z ( ) ( p 0 z 7 ( ) ) c = 5 (p 0 c) 2 12 z 48 z 3 Cournot'in mallin graanen ratkaisu Muodostetaan yrityksille optimaaliset reaktiofunktiot mitä tahansa toisen yrityksen strategiaa vastaan q 1N := R 1 (q 2 ) = p 0 c zq 2 2z q 2N := R 2 (q 1 ) = p 0 c zq 1 2z ; q 2 p 0 c, z ; q 1 p 0 c z Yhtälöryhmä kuvautuu kahdeksi laskevaksi suoraksi koordinaatistoon (q 1, q 2 ), ja sen ratkaisu (Nash -tasapaino) löytyy reaktiofunktioiden leikkauspisteestä 4
4 Bertrandin duopolimalli Bertrandin duopolimalli (Theorie Mathematique de la Richesse Sociale, 1883) on toinen peliteorian klassikko Bertrand oletti, että kaksi yritystä pitävät strategiamuuttujinaan lopputuotteittensa yksikköhintoja eivätkä tuotantonopeuksiaan (Cournot) Tämä tekee näistä malleista erilaisia, vaikka molempien pelien tasapainotilanteet vastaavat Nash -tasapainoa Yritysten lopputuotteet oletetaan epätäydellisiksi substituuteiksi, mistä syystä hyödykkeiden hintaero ei johda kalliimman hyödykkeen menekin täydelliseen romahtamiseen Oletetaan kuluttajien käyttäytyvän seuraavasti: q 1 (p 1, p 2 ) = a bp 1 + ep 2, q 2 (p 1, p 2 ) = a bp 2 + ep 1, missä q 1, q 2 (kpl/kk) ovat yritysten 1 ja 2 kuukausittaiset menekit (= kuluttajien kulutusnopeudet), p 1, p 2 (mk/kpl) ovat hyödykkeiden yksikköhinnat ja a, b, e ovat positiivisia dimensionaalisia vakioita joiden mittayksiköt ovat (kpl/kk), (kpl 2 /(mk kk)) ja (kpl 2 /(mk kk)) Koska e > 0, hyödykkeet ovat substituutteja Yritysten kustannusfunktiot ovat samat kuin Cournot'in mallissa: C i = cq i, i = 1, 2 Muodostetaan tilanteesta normaalimuotoinen peli: 1) Pelaajat ovat yritykset, 2) yritysten strategiat ovat hinnat {p i 0 p i < } ja 3) yritysten tulemat ovat niiden kuukausittaiset voitot Π 1 = q 1 (p 1, p 2 )[p 1 c] = [a bp 1 + ep 2 ][p 1 c], Π 2 = q 2 (p 1, p 2 )[p 2 c] = [a bp 2 + ep 1 ][p 2 c] Pelin Nash -tasapaino on strategiavektori (p 1 N, p 2 N ) joka toteuttaa ehdot max Π 1 (p 1, p 2 ) p 1 = [a bp 1 + ep 2 ][p 1 c], max Π 2 (p 1, p 2 ) p 2 = [a bp 2 + ep 1 ][p 2 c] Maksimoinnin ensimmäisen kertaluvun ehdoista saamme yhtälöryhmän = 0 p 1 = a + ep 2 + bc p 1 2b Π 2 = 0 p 2 = a + ep 1 + bc p 2 2b Tämän yhtälöryhmän ratkaisu on pelin Nash -tasapaino, p 1N = p 2N = a + bc 2b e 5
Harj Tarkista ratkaisun mittayksikkö! Yrityksen 1 voitto Nash -tasapainossa on ) Π 1 (p 1N, p 2N ) = = ( a b ( a + bc 2b e b(a + ce bc)2 (2b e) 2 Harj Tarkista ratkaisun mittayksikkö! + e ( )) ( ) a + bc a + bc 2b e 2b e c 5 Bertrandin mallin graanen ratkaisu Yritysten reaktiofunktiot p 1 := R 1 (p 2 ) = a + ep 2 + bc 2b ja p 2 := R 2 (p 1 ) = a + ep 1 + bc 2b ovat nousevia suoria koordinaatistossa (p 1, p 2 ) ja niiden leikkauspiste on pelin Nash -tasapaino 6