PRO GRADU -TUTKIELMA Tomi Salminen Nashin neuvotteluratkaisu ja Rubinsteinin vuorottelevien tarjousten neuvottelumalli HELSINGIN YLIOPISTO Soveltava matematiikka Stokastiikan linja 7.3.2013 Ohjaaja: Esa Nummelin
2
Sisältö 1 Johdanto 5 2 Hyötyteoriaa 7 2.1 Preferenssirelaatiot......................... 7 2.2 Hyötyfunktio............................ 9 3 Nashin neuvotteluratkaisu 15 3.1 Neuvotteluongelma......................... 15 3.2 Nashin neuvotteluratkaisu..................... 17 3.3 Nashin neuvotteluratkaisun ominaisuuksia............ 25 3.4 Esimerkkejä............................. 28 3.5 Epäsymmetrinen Nashin neuvotteluratkaisu........... 30 3.6 Monen pelaajan neuvotteluongelma................ 36 4 Rubinsteinin vuorottelevien tarjousten neuvottelumalli 43 4.1 Täydellisen informaation laajan muodon pelit.......... 43 4.2 Vuorottelevien tarjousten neuvottelupeli............. 46 4.3 Neuvottelupelin alipelitäydellinen tasapaino........... 47 4.4 Neuvottelupelin alipelitäydellisen tasapainon ominaisuuksia... 54 4.5 Yhteys Nashin neuvotteluratkaisuun............... 55 5 Lähdeteoksista 58 Lähdeluettelo 59 3
4
1 Johdanto Tässä tutkielmassa tarkastellaan tilannetta, jossa kahdella tai useammalla pelaajalla on mahdollisuus tehdä kaikkia hyödyttävää yhteistyötä useammalla kuin yhdellä tavalla. Heillä on joukko päätösvaihtoehtoja, joista heidän on keskenään valittava yksi. Merkitään tätä kaikkien pelaajille mahdollisten päätösvaihtoehtojen joukkoa merkinnällä X. Joukko X sisältää kaikki ne päätösvaihtoehdot, joihin pelaajat voivat päätyä riippumatta siitä ovatko ne heille suotuisia vai eivät. Esimerkki 1.1. Kaksi pelaajaa, pelaaja I ja pelaaja II, neuvottelevat mielivaltaisen rahasumman π > 0 jakamisesta. 1 Merkitään, että x 1 on pelaajan I saama rahasumma ja x 2 on pelaajan II saama rahasumma päätösvaihtoehdossa x. Vaaditaan luonnollisesti, että x 1, x 2 [0, π] ja x 1 + x 2 π. Voidaan siis muotoilla mahdollisten päätösvaihtoehtojen joukko (1.1) X = {(x 1, x 2 ) R 2 : x 1, x 2 [0, π] ja x 1 + x 2 π}. Jos pelaajat eivät pääse sopimukseen rahasumman jakamisesta, niin kumpikaan ei saa mitään. Tällöin päädytään jakoon x 1 = x 2 = 0. Esimerkin mukaiseen neuvottelutilanteeseen voidaan päätyä esimerkiksi, jos pelaaja I omistaa vaikkapa auton, josta on hänelle yhtä paljon hyötyä kuin rahasumman a käyttämisestä muihin hyödykkeisiin. Hänelle auton arvo on siis a. Pelaaja II sen sijaan pitää autoilusta enemmän ja hän saisi auton omistamisesta yhtä paljon hyötyä kuin rahasumman b = a + π käyttämisestä muihin hyödykkeisiin. Pelaajalle II auton arvo on siis b. Nyt pelaajat voivat tehdä molempia hyödyttävää yhteistyötä siten, että pelaaja I myy auton pelaajalle II hinnalla c (a, b). Pelaajien on vain päätettävä hinta c eli se miten rahasumma b a = π jaetaan. Jos sopimukseen ei päästä, niin kumpikaan ei saa mitään hyötyä ja pelaajalla I on edelleen auto ja pelaajalla II rahasumma b käytettävissään. Jos oletetaan pelaajien pyrkivän rationaalisesti maksimoimaan oman hyötynsä, niin minkälaiseen jakoon he päätyvät? Miten pelaajien suhtautuminen riskiin, että sopimusta ei synny, vaikuttaa lopputulokseen? Entä jos pelaajille syntyy kustannuksia neuvottelemisesta? Tässä tutkielmassa pyrin vastaamaan näihin kysymyksiin rakentamalla matemaattisia malleja neuvottelutilanteista. 1 Merkintä π ei viittaa tässä tutkielmassa ympyrän kehän ja halkaisijan suhteeseen, vaan se on otettu mielivaltaiseksi positiiviseksi rahapalkintoa kuvaavaksi reaaliluvuksi. 5
Kaksi matemaattisessa taloustieteessä yleisintä menetelmää tällaisten tilanteiden mallintamiseen ovat Nashin neuvotteluratkaisu ja Rubinsteinin vuorottelevien tarjousten neuvottelumalli. John Nash esitteli vuonna 1950 artikkelissaan The Bargaining Problem Nashin neuvotteluratkaisuna sittemmin tunnetun ratkaisun tällaiseen neuvotteluongelmaan (Nash, 1950). Nashin ratkaisu perustuu aksioomiin, jotka uskottavan neuvotteluratkaisun tulisi toteuttaa. Osoittautuu, että kaikilla neuvotteluongelmilla on olemassa yksikäsitteinen ratkaisu, Nashin neuvotteluratkaisu, joka toteuttaa nämä aksioomat. Rubinsteinin vuorottelevien tarjousten neuvottelumallissa sen sijaan mallinnetaan neuvottelutilannetta pelinä, jossa pelaajat tekevät vuorotellen tarjouksia toisilleen. Neuvotteluratkaisu saadaan tämän pelin alipelitäydellisenä tasapainona. Ariel Rubinstein esitteli tämän neuvottelumallin artikkelissaan Perfect Equilibrium in Bargaining Model (Rubinstein, 1982). Tämän tutkielman lukeminen ja ymmärtäminen vaatii esitietoina lähinnä tottumusta matemaattisen tekstin lukemiseen. Luvun 4 todistusten seuraamista tosin varmasti helpottaa peliteorian perusteiden tuntemus, sillä tarvittavat peliteorian käsitteet käydään luvun 4 alussa läpi vain hyvin lyhyesti. 6
2 Hyötyteoriaa Voidaksemme tutkia neuvottelutilanteita täsmällisesti, tarvitsemme täsmällisen teorian pelaajien valinnasta erilaisten hyödykkeiden tai yleisemmin erilaisten tapahtumien välillä. Tässä luvussa käsitellään tätä hyötyteoriaa. 2.1 Preferenssirelaatiot Tehdään heti ensimmäiseksi perustavanlaatuinen oletus, että jos pelaajalle esitetään jotkin kaksi vaihtoehtoa, niin hänen mielestään joko toinen vaihtoehdoista on hänelle miellyttävämpi tai molemmat vaihtoehdot ovat yhtä miellyttäviä. Tällä tavalla oletetaan, että pelaaja pystyy asettamaan kaikki mahdolliset vaihtoehdot miellyttävyysjärjestykseen siten, että jotkin vaihtoehdot voivat olla hänelle yhtämiellyttäviä eli indifferenttejä. Mitä nämä vaihtoehdot sitten ovat? Ne voivat periaatteessa olla mitä vain: hyödykkeitä, rahasummia, poliittisia päätöksiä tai jotakin toimintaa, esimerkiksi työtä. Käytännössä pelaaja voi vertailla mitä kummallisempia asioita. Hänen mielestään voi olla vaikkapa miellyttävämpää, että hänen tontillaan kasvaa mäntyjä kuin koivuja. Sanotaan yleisemmin, että nämä vaihtoehdot ovat tapahtumia, ja määritellään, että kaikkien tapahtumien joukko on joukko E. Kaikkien päätösvaihtoehtojen joukko kussakin neuvottelu tilanteessa sisältyy kaikkien tapahtumien joukkoon eli X E kaikilla X. Eri tapahtumien vertailuun käytämme preferenssirelaatioita (engl. preference relations) ja, jotka seuraavaksi määritellään. Määritelmä 2.1. Olkoot a, b, c E mielivaltaisia tapahtumia. Merkitään a b, jos a on pelaajalle miellyttävämpi kuin b. Merkitään a b, jos ei päde a b eikä b a. Relaatioille ja pätee seuraavat aksioomat. 1. Täsmälleen yksi seuraavista pätee: a b, b a tai a b. 2. a a. 3. Jos a b, niin b a. 4. Jos a b ja b c, niin a c. 5. Jos a b ja b c, niin a c. 6. Jos a b ja b c, niin a c. 7. Jos a b ja b c, niin a c. 7
Ensimmäinen aksiooma tarkoittaa, että pelaaja pystyy sanomaan mistä tahansa kahdesta tapahtumasta, että jompikumpi niistä on miellyttävämpi, tai että ne ovat hänelle yhtämiellyttäviä. Aksioomat 2,3 ja 4 yhdessä sanovat, että on ekvivalenssirelaatio. Aksioomat 1 ja 5 sanovat, että on järjestysrelaatio. Pelaaja, jonka preferenssit toteuttavat nämä aksioomat, osaa järjestää kaikkien tapahtumien joukon E alkiot miellyttävyysjärjestykseen, mutta preferenssirelaatio ei kerro mitään siitä kuinka paljon parempi jokin tapahtuma on johonkin toiseen tapahtumaan verrattuna. Ajatellaanpa tilannetta, jossa a b c ja pelaaja voi valita joko tapahtuman b tai arvonnan, jossa tapahtuma a toteutuu todennäköisyydellä 1/2 ja tapahtuma c toteutuu todennäköisyydellä 1/2. Tehdessään tällaista valintaa pelaajan täytyy arvioida onko tapahtuma a riittävän paljon miellyttävämpi kuin tapahtuma b, ja onko tapahtuma c riittävän vähän huonompi kuin tapahtuma b, jotta arvonta kannattaa valita. Määritelmä 2.2. Olkoot a, b E mielivltaisia tapahtumia ja olkoon p [0, 1]. Tällöin (2.1) pa + (1 p)b on arvonta, jossa a toteutuu todennäköisyydellä p ja b toteutuu todennäköisyydellä 1 p. Huomautus. Arvonta on tietysti myös tapahtuma eli pa + (1 p)b E. Näin ollen arvonnan tulos voi myös olla arvonta. Määritelmä 2.3. Olkoot a, b, c E mielivaltaisia tapahtumia. Arvonnoille pätee seuraavat aksioomat. 1. pa+(1-p)b=(1-p)b+pa 2. pa+(1-p)(qb+(1-q)c)=pa+(1-p)qb+(1-p)(1-q)c 3. pa+(1-p)a=a Laajennetaan nyt preferenssirelaatioiden määritelmää lisäämällä arvontojen järjestämiseen liittyviä aksioomia. Määritelmä 2.4. Olkoot a, b, c E mielivaltaisia tapahtumia ja p [0, 1]. Preferenssirelaatioille pätee määritelmän 2.1 lisäksi seuraavat aksioomat. L1 Jos a c, niin pa + (1 p)b pc + (1 p)b. L2 Jos a c, niin pa + (1 p)b pc + (1 p)b. L3 Jos a b c, niin on olemassa sellainen q [0, 1], että qa + (1 q)c b. Lause 2.1. Jos tapahtumille a, b, c E pätee a b c ja pa + (1 p)c b, niin 0 < p < 1 ja p on yksikäsitteinen. 8
Todistus. Jos olisi p = 0, niin olisi pa + (1 p)c = c b. Jos olisi p = 1, niin olisi pa+(1 p)c = a b. Kumpikin johtaa ristiriitaan oletuksen pa+(1 p)c b kanssa, joten täytyy olla 0 < p < 1. Osoitetaan, että p on yksikäsitteinen. Tehdään vastaoletus, että on olemassa luvut p, q (0, 1) siten, että p > q ja pa + (1 p)c b qa + (1 q)c. Koska nyt 0 < p q < 1 q ja a c, niin voidaan kirjoittaa (2.2) c = p q ( 1 q c + 1 p q ) c = p q 1 q 1 q c + 1 p 1 q c p q 1 q a + 1 p 1 q c. Nyt aksiooman L2 nojalla (2.3) pa + (1 p)c = qa + pa qa + (1 p)c ( p q = qa + (1 q) 1 q a + 1 p ) 1 q c qa + (1 q)c, mikä on ristiriita oletuksen pa + (1 p)c b qa + (1 q)c kanssa. 2.2 Hyötyfunktio Olemme nyt valmiit määrittelemään pelaajille hyötyfunktiot (engl. utility functions). Hyötyfunktion idea on, että jokaiseen tapahtumaan liitetään jokin reaaliluku, joka kuvaa tämän tapahtuman miellyttävyyttä pelaajalle. Hyötyfunktio on siis funktio tapahtumien joukosta reaaliluvuille, U : E R. Mitä mieluisampi jokin tapahtuma pelaajalle on, sitä suuremman arvon hyötyfunktio saa: (2.4) U(a) > U(b), jos ja vain jos a b. On myös luonnollista olettaa, että pelaajan odottama hyöty arvonnasta pa + (1 p)b on yhtäsuuri kuin arvonnan realisaatioista saatavien hyötyjen odotusarvo pu(a) + (1 p)u(b). Tätä hyötyfunktion ominaisuutta sanotaan odotetun hyödyn ominaisuudeksi (engl. expected utility property). Jos pelaajalla on sellaiset relaatioiden ja esittämät preferenssit, että kaikki yllä esitetyt aksioomat toteutuvat, niin hänelle voidaan muodostaa odotetun hyödyn ominaisuuden toteuttava hyötyfunktio, kuten seuraavassa lauseessa todetaan. Lause 2.2. On olemassa funktio U : E R siten, että kaikilla a, b E ja p [0, 1] pätee (2.5) U(a) > U(b), jos ja vain jos a b ja (2.6) U(pa + (1 p)b) = pu(a) + (1 p)u(b). 9
Todistus. Jos a b kaikilla a, b E, niin funktio U(a) = 0 kaikilla a E toteuttaa triviaalisti molemmat ehdot. Oletetaan sitten, että on olemassa tapahtumat e 0, e 1 E siten, että e 1 e 0. Tällöin preferenssirelaatioiden aksiooman 1 nojalla mielivaltaiselle tapahtumalle a E pätee jokin seuraavista: (i) a e 1 (ii) a e 1 (iii) e 1 a e 0 (iv) a e 0 (v) e 0 a Konstruoidaan hyötyfunktio U tapauksien (i),..., (v) mukaisesti paloittain ja osoitetaan, että se toteuttaa molemmat lauseen ehdot. Valitaan U(e 0 ) = 0 ja U(e 1 ) = 1. (i) Kun a e 1 e 0, lauseen 2.1 nojalla on olemassa yksikäsitteinen p (0, 1) siten, että pa + (1 p)e 0 e 1. Voidaan valita (2.7) U(a) = 1 p. (ii) Kun a e 1, niin valitaan (2.8) U(a) = 1. (iii) Kun e 1 a e 0, niin on olemassa yksikäsitteinen q (0, 1) siten, että qe 1 + (1 q)e 0 a. Valitaan (2.9) U(a) = q. (iv) Kun a e 0, niin valitaan (2.10) U(a) = 0. (v) Kun e 1 e 0 a, niin on olemassa yksikäsitteinen r (0, 1) siten, että ra + (1 r)e 1 e 0. Valitaan (2.11) U(a) = 1 1 r. Funktio U(a) on nyt hyvin määritelty kaikille tapahtumille a E. Osoitetaan, että näin määritelty U toteuttaa molemmat lauseen ehdot. Olkoon a, b E mielivaltaisia tapahtumia. Nyt tapahtumille a ja b pätee jokin vaihtoehdoista (i),..., (v). Jos tapahtumalle a pätee eri vaihtoehto kuin tapahtumalle b, niin ehto 2.5 on selvästi voimassa. Samoin, jos molemmille tapahtumille pätee vaihtoehto (ii) tai, jos molemmille tapahtumille pätee 10
vaihtoehto (iv). Ehdon 1 voimassaolo on vielä näytettävä tapauksissa, joissa tapahtumille a ja b molemmille pätee joko (i) tai (iii) tai (v). Näytetään tapaus, jossa molemmille tapahtumille pätee vaihtoehto (i). Muut tapaukset voidaan näyttää samankaltaisella päättelyllä. Nyt joillakin p 1, p 2 [0, 1] pätee U(a) = 1/p 1, U(b) = 1/p 2. Jos U(a) = U(b), niin p 1 = p 2 ja (2.12) p 1 a + (1 p 1 )e 0 e 1 p 2 b + (1 p 2 )e 0 = p 1 b + (1 p 1 )e 0. Koska nyt ei päde p 1 a + (1 p 1 )e 0 p 1 b + (1 p 1 )e 0 eikä p 1 b + (1 p 1 )e 0 p 1 a + (1 p 1 )e 0, niin aksioomasta L2 seuraa, että ei päde a b eikä b a. Täytyy siis olla a b. Jos 1/p 1 = U(a) > U(b) = 1/p 2, niin p 2 > p 1 ja (2.13) p 1 a + (1 p 1 )e 0 e 1 p 2 b + (1 p 2 )e 0. Nyt 0 < p 2 p 1 < 1 p 1 ja b e 0, joten (2.14) Koska aksiooman L2 nojalla (2.15) e 0 = p ( 2 p 1 e 0 + 1 p ) 2 p 1 e 0 1 p 1 1 p 1 = p 2 p 1 1 p 1 e 0 + 1 p 2 1 p 1 e 0 p 2 p 1 1 p 1 b + 1 p 2 1 p 1 e 0. p 2 b + (1 p 2 )e 0 = p 1 b + p 2 b p 1 b + (1 p 2 )e 0 ( p2 p 1 = p 1 b + (1 p 1 ) b + 1 p ) 2 e 0 p 1 b + (1 p 1 )e 0, 1 p 1 1 p 1 niin saadaan (2.16) p 1 a + (1 p 1 )e 0 p 2 b + (1 p 2 )e 0 p 1 b + (1 p 1 )e 0. Ei siis päde p 1 b + (1 p 1 )e 0 p 1 a + (1 p 1 )e 0 eikä p 1 a + (1 p 1 )e 0 p 1 b + (1 p 1 )e 0, joten aksioomien L2 ja L1 nojalla ei voi olla b a eikä a b. Täytyy siis olla a b. Symmetrisesti nähdään, että jos U(a) < U(b), niin b a. Täten a b täsmälleen silloin, kun U(a) > U(b). On vielä näytettävä, että ehto 2.6 on voimassa kaikissa tapauksissa, joissa tapahtumille a ja b pätee jokin vaihtoehdoista (i),..., (v). Triviaalisti ehto 2.6 on voimassa, jos molemmille tapahtumille pätee (ii) tai, jos molemmille tapahtumille pätee (iv). Jäljelle jää 13 tapausta. Näytetään tapaus, jossa sekä tapahtumalle a, että tapahtumalle b pätee (i). Loput 12 tapausta voidaan näyttää samantapaisella päättelyllä. 11
Olkoon siis a e 1 ja b e 1 ja p [0, 1]. Nyt joillakin p 1, p 2 [0, 1] pätee U(a) = 1/p 1, U(b) = 1/p 2 ja p 1 a + (1 p 1 )e 0 e 1 p 2 b + (1 p 2 )e 0. Lisäksi nähdään, että (2.17) ja 0 < p p + (1 p) p < 1 1 p 2 (2.18) 1 p p (1 p) 1 p p + (1 p) p = 2 1 p 2 p + (1 p) p. 1 p 2 Käyttämällä määritelmän 2.3 kohtaa 3 ja aksioomaa L1 saadaan (2.19) p p (1 p) 1 p e 1 p + (1 p) p (p 1 1 a + (1 p 1 )e 0 ) + 2 p 2 p + (1 p) p (p 1 2 b + (1 p 2 )e 0 ) p 2 (2.20) = 1 p 1 p 1 + (1 p) 1 p 2 (pa + (1 p)b) + p(1 p 1) p + (1 p) p 1 p 2 + jossa viimeisen termin kerroin on yhtäsuuri kuin p (1 p) 1 p 2 (1 p 2 ) p + (1 p) p 1 p 2 e 0, (2.21) p p + (1 p) p 1 p 2 p p 1 p 1 + (1 p) 1 p 2 + (1 p) p1 p 2 p + (1 p) p 1 p 2 1 p p 1 p 1 + (1 p) 1 p 2. Lausekkeen 2.21 ensimmäisen ja kolmannen termin summa on 1 ja toisen ja neljännen termin summa on (2.22) 1 p 1 p 1 + (1 p) 1, p 2 joten saadaan (2.23) e 1 1 p 1 p 1 + (1 p) 1 (pa + (1 p)b) + 1 p 2 Nyt funktion U määritelmän mukaan 1 p 1 p 1 + (1 p) 1 p 2 e 0. (2.24) U(pa + (1 p)b) = p 1 p 1 + (1 p) 1 p 2 = pu(a) + (1 p)u(b). Lauseen 2.2 toteuttavaa funktiota U sanotaan von Neumann-Morgenstern- Hyötyfunktioksi tai lyhyemmin hyötyfunktioksi. Osoitetaan seuraavaksi, että lauseen 2.2 toteuttava hyötyfunktio on positiiviseen affiinimuunnokseen saakka yksikäsitteinen. 12
Lause 2.3. Olkoon U : E R lauseen 2.2 todistuksessa konstruoitu hyötyfunktio ja V : E R hyötyfuntio, joka toteuttaa lauseen 2.2 ehdot. Tällöin on olemassa sellaiset α > 0 ja β R, että kaikilla a E pätee (2.25) V (a) = αu(a) + β. Todistus. Jos a b kaikilla a, b E, niin ehdon 2.5 nojalla funktion V täytyy olla jokin vakio eli on jokin c R siten, että V (a) = c kaikilla a E. Tällöin voidaan valita α = 0 ja β = c, jolloin V (a) = αu(a) + β kaikilla a E. Oletetaan sitten, että on olemassa tapahtumat e 0, e 1 E siten, että e 1 e 0. Tällöin ehdon 2.5 nojalla V (e 1 ) > V (e 0 ), joten voidaan valita (2.26) α = V (e 1 ) V (e 0 ) > 0 ja (2.27) β = V (e 0 ). Olkoon a E mielivaltainen tapahtuma. Nyt tapahtumalle a pätee jälleen jokin lauseen 2.2 todistuksen tapauksista (i),..., (v). Osoitetaan, että jokaisessa näistä V (a) = αu(a) + β. (i) a e 1. Jos nyt U(a) = 1 p, niin pa + (1 p)e 0 e 1, joten saadaan (2.28) V (e 1 ) = V (pa + (1 p)e 0 ) = pv (a) + (1 p)v (e 0 ) V (a) = 1 p V (e 1) 1 p p V (e 0) = 1 p 1 p (α + β) p β = α 1 p + β = αu(a) + β. (ii) a e 1. Nyt U(a) = 1, joten (2.29) V (a) = V (e 1 ) = V (e 1 ) V (e 0 ) + V (e 0 ) = α + β = αu(a) + β. (iii) e 1 a e 0. Jos nyt U(a) = q, niin qe 1 + (1 q)e 0 a, joten saadaan (2.30) V (a) = V (qe 1 + (1 q)e 0 ) = qv (e 1 ) + (1 q)v (e 0 ) = q(α + β) + (1 q)β = αq + β = αu(a) + β. (iv) a e 0. Nyt U(a) = 0, joten (2.31) V (a) = V (e 0 ) = β = αu(a) + β. 13
(v) e 0 a. Jos nyt U(a) = 1 1 r, niin ra + (1 r)e 1 e 0, joten saadaan (2.32) V (e 0 ) = V (ra + (1 r)e 1 ) = rv (a) + (1 r)v (e 1 ) V (a) = 1 r V (e 0) 1 r V (e 1 ) r = 1 r β 1 r (α + β) r = 1 ( r β + 1 1 ) (α + β) r ( = α 1 1 ) + β = αu(a) + β. r 14
3 Nashin neuvotteluratkaisu Tässä luvussa muotoillaan neuvotteluongelma täsmällisenä matemaattisena oliona pelaajien hyötyfunktioiden avulla. Sitten esitetään Nashin aksioomat, jotka uskottavan neuvotteluratkaisun tulisi toteuttaa. Jos neuvotteluratkaisu toteuttaa nämä aksioomat, niin käy ilmi, että se on yksikäsitteisesti olemassa ja se saadaan yksinkertaisen maksimointitehtävän ratkaisuna. Ensin käsitellään kahden pelaajan välistä neuvottelua, mutta tärkeimmät tulokset yleistetään lopulta monen pelaajan neuvotteluongelmiin. Pelaajien suhtautuminen riskiin osoittautuu ratkaisevaksi tekijäksi neuvotteluratkaisun määräytymisessä. 3.1 Neuvotteluongelma Neuvottelu on tilanne, jossa pelaajat voivat yhdessä valita, jonkin kahdesta tai useammasta päätösvaihtoehdosta. Nämä vaihtoehdot voivat olla mitä tahansa asioita, joita pelaajat voivat toteuttaa. He voivat esimerkiksi antaa toisilleen hyödykkeitä, rahasummia tai vaikkapa työpanoksia. Voidaan ajatella, että kaikki päätösvaihtoehdot ovat tapahtumia eli kaikkien mahdollisten tapahtumien joukon E alkioita. Määritelmä 3.1. Merkitään, että X E on päätösvaihtoehtojen joukko. Päätösvaihtoehtojen joukko X sisältää kaikki ne tapahtumat, joista pelaajat neuvottelevat. Jos pelaajilla on sellaiset relaatioiden ja esittämät preferenssit, että kaikki tämän kappaleen alussa esitetyt aksioomat toteutuvat, niin heille voidaan määritellä hyötyfunktiot joukossa E. Nämä hyötyfunktiot liittävät erityisesti myös kaikkiin päätösvaihtoehtojen joukon X alkioihin jotkin reaaliluvut, jotka kuvaavat eri päätösvaihtoehdoista saatavia hyötyjä. Erityisen mielenkiintoista on vertailla pelaajan hyötyfunktion arvoja, kun hänen omaisuutensa rahallinen arvo muuttuu. Tätä varten voidaan määritellä pelaajalle hyötyfunktio omaisuuden suhteen U : (0, ) R. Tässä kaikki pelaajan mahdolliset omaisuuden arvot välillä (0, ) ajatellaan eri tapahtumiksi, joihin hyötyfunktio liittää jonkin reaaliluvun. Sovelluksissa pelaajien hyötyfunktiot oletetaan usein konkaaveiksi omaisuuden suhteen. Tällä pyritään mallintamaan pelaajan pyrkimystä karttaa riskiä. Pelaajaa, jonka hyötyfunktio rahan suhteen on lineaarinen, sanotaan riskineutraaliksi (engl. risk neutral) pelaajaksi. Pelaajaa, jonka hyötyfunktio rahan suhteen on aidosti konkaavi, sanotaan riskinkaihtajaksi (engl. risk averse). Omai- 15
suuden suhteen logaritminen hyötyfunktio on mielenkiintoinen esimerkki konkaavista hyötyfunktiosta. Logaritmisella hyötyfunktiolla pelaajan omaisuuden kertominen jollakin vakiolla tuottaa saman muutoksen pelaajan hyödyssä riippumatta pelaajan alkuperäisestä omaisuudesta. Kokoamalla kahden pelaajan hyötyfunktiot U 1 ja U 2 yhteen saadaan funktio U : X R 2, U(x) = (U 1 (x), U 2 (x)). Neuvottelu voidaan siten ajatella olevan tilanne, jossa pelaajat pyrkivät yhdessä neuvotellen valitsemaan jonkin hyötyparin u = (u 1, u 2 ) joukosta S = {u R 2 : On olemassa x X siten, että u 1 = U 1 (x) ja u 2 = U 2 (x)} = U(X). Esimerkki 3.1. Tarkastellaan esimerkin 1.1 neuvottelutilannetta. (a) Jos U i (x i ) = x i kummallakin i {1, 2}, niin S = X. Tässä tapauksessa molemmat pelaajat ovat riskineutraaleja. (b) Jos U 1 (x 1 ) = x 1 ja U 2 (x 2 ) = log(1 + x 2 ), niin S = { u R 2 : On olemassa x X siten, että u 1 = x 1 ja u 2 = log(1 + x 2 ) } = { u R 2 : u 1 [0, π] ja u 2 [0, log(1 + π u 1 )] }. Tässä pelaaja I on riskineutraali ja pelaaja II on riskin kaihtaja. (c) Jos U 1 (x 1 ) = log(1 + x 1 ) ja U 2 (x 2 ) = log(1 + x 2 ), niin S = { u R 2 : On olemassa x X siten, että u 1 = log(1 + x 1 ) ja u 2 = log(1 + x 2 ) } = { u R 2 : u 1 [0, log(1 + π)] ja u 2 [0, log(1 + π U 1 1 (u 1 )] } = { u R 2 : u 1 [0, log(1 + π)] ja u 2 [0, log(2 + π e u 1 ] }. Tässä molemmat pelaajat ovat riskinkaihtajia. Esitetään seuraavaksi kahden pelaajan neuvotteluongelman määritelmä. Määritelmä 3.2. Neuvotteluongelma (engl. bargaining problem) on pari (S, d), jolle pätee seuraavaa: 1. S R 2 on kompakti ja konveksi. 1 Sanotaan, että S on mahdollisten hyötyparien joukko (engl. feasibility set). 2. d S on kieltäytymispiste (engl. disagreement point tai threat point). 3. u 1 d 1 ja u 2 d 2 kaikilla u S. 4. On olemassa sellainen u S, että u 1 > d 1 ja u 2 > d 2. Kaikkien neuvotteluongelmien joukko olkoon Σ. 1 Joukko S on konveksi, jos kaikilla u 1, u 2 S ja p [0, 1], pätee pu 1 + (1 p)u 2 S. 16
Ensimmäisessä oletuksessa määritellään niiden hyötyparien joukko, joka on saavutettavissa jonkin sopimuksen tuloksena. Joukon S konveksisuus kertoo, että satunnainen valinta kahden mahdollisen sopimuksen välillä on myös itse mahdollinen sopimus. Kompaktius takaa sen, että mikä tahansa hyötyparien jatkuva funktio saavuttaa maksimiarvonsa jossakin tämän joukon pisteessä. Toisen oletuksen kieltäytymispiste on hyötypari, johon pelaajat joutuvat tyytymään, jos sopimusta ei synny. Kumpi tahansa pelaaja voi valita halutessaan kieltäytymispisteen välittämättä toisen pelaajan toiminnasta. Kolmas oletus on henkilökohtaisen rationaalisuuden oletus. Kummankaan pelaajan ei kannata hyväksyä sopimusta, joka antaa hänelle pienemmän hyödyn kuin kieltäytymispiste. Näin ollen jommallekummalle pelaajalle kieltäytymispistettä huonommat hyötyparit voidaan jättää pois mahdollisten sopimusten joukosta. Mahdollisten hyötyparien joukko rajoitetaan siis niihin hyötypareihin, jotka ovat kummallekin pelaajalle vähintään yhtä mieluisia kuin kieltäytymispiste. Neljäs oletus kertoo, että on olemassa sopimus, joka on molemmille pelaajille kieltäytymispistettä mieluisampi. Tämä kertoo, että on olemassa molempia pelaajia hyödyttäviä sopimuksia. Huomautus. Neuvotteluongelman määritelmän kannalta ei ole merkitystä sillä, mitä konkreettista tulosta, rahaa, hyödykettä, materiaalista tai immateriaalista hyötyä pelaajat saavat. Vain sopimalla saavutettavilla hyötypareilla on merkitystä. Sopimukset määritellään hyötypareina u = (u 1, u 2 ) S ja pelaajat neuvottelevat mikä niistä valitaan. 3.2 Nashin neuvotteluratkaisu Määritelmä 3.3. Neuvotteluratkaisu (engl. bargaining solution) on funktio f : Σ S, joka liittää jokaiseen neuvotteluongelmaan (S, d) yksikäsitteisen sopimuksen (engl. agreement) u S. Mihin neuvotteluratkaisuun f : Σ S rationaaliset pelaajat päätyvät? Pelaaja I pyrkii maksimoimaan oman hyötynsä u 1 ja pelaaja II pyrkii maksimoimaan oman hyötynsä u 2. Kummankin on kuitenkin otettava huomioon myös toinen pelaaja, sillä ilman hänen suostumustaan sopimusta ei syntyisi ja pelaajat joutuisivat tyytymään kieltäytymispisteeseen. Esitetään seuraavaksi neljä aksioomaa, jotka uskottavan neuvotteluratkaisun f(s, d) tulisi toteuttaa. Nämä aksioomat perustuvat John Nashin aksioomiin. (Nash, 1950) N1 (Pareto-tehokkuus) Jos u S, u 1 f 1 (S, d) ja u 2 f 2 (S, d), niin u = f(s, d). N2 (Riippumattomuus epäolennaisista vaihtoehdoista) Olkoon (T, d) jokin neuvotteluongelma, jolle pätee T S ja f(s, d) T. Tällöin f(s, d) = f(t, d). 17
N3 (Riippumattomuus positiivisista affiinimuunnoksista) Olkoon (3.1) (3.2) T = {(α 1 u 1 + β 1, α 2 u 2 + β 2 ) : (u 1, u 2 ) S}, c = (α 1 d 1 + β 1, α 2 d 2 + β 2 ), missä α 1, α 2 (0, ) ja β 1, β 2 R. Tällöin (3.3) f(t, c) = (α 1 f 1 (S, d) + β 1, α 2 f 2 (S, d) + β 2 ). N4 (Symmetrisyys) Jos d 1 = d 2 ja implikaatio (3.4) (u 1, u 2 ) S (u 2, u 1 ) S pätee, niin f 1 (S, d) = f 2 (S, d). Ensimmäinen aksiooman mukaan pelaajat eivät tyydy hyötypariin, jos löytyy toinen mahdollinen hyötypari, joka on toiselle pelaajalle aidosti miellyttävämpi ja toiselle vähintään yhtä miellyttävä. Pareto-tehokkaassa sopimuksessa ei kummankaan pelaajan hyötyä voi kasvattaa ilman, että toisen pelaajan saama hyöty vähenee. Toinen aksiooma kertoo, että jos f(s, d) on pelaajien mielestä paras sopimus joukossa S, niin se on heidän mielestään paras myös osajoukossa T S. Tätä aksioomaa on kuitenkin myös kritisoitu ja esimerkiksi Ehud Kalain ja Meir Smorodinskyn esittämässä neuvotteluratkaisussa tämä aksiooma on korvattu aksioomalla, jota he kutsuvat monotonisuusaksioomaksi. (Kalai, Smorodinsky, 1975) Aksiooma N3 johtuu siitä, että hyötyfunktiot eivät ole yksikäsitteisesti määrättyjä. Jos hyötyfunktioiden skaalausta muutetaan, niin myös neuvotteluratkaisu muuttuu vastaavasti. Neljännen aksiooman mukaan, jos molempien pelaajien neuvottelutilanne on samanlainen, niin myös neuvotteluratkaisu antaa molemmille saman hyödyn. Symmetrisyyden voi ajatella kuvaavan sitä, että pelaajat ovat yhtä taitavia neuvottelijoita. Määritellään seuraavaksi Nashin neuvotteluratkaisu ja osoitetaan, että se on ainoa neuvotteluratkaisu, joka toteuttaa edellä mainitut aksioomat. Määritelmä 3.4. Nashin neuvotteluratkaisu (NNR) (engl. Nash bargaining solution, NBS) on funktio f N : Σ S, (3.5) f N (S, d) = arg max (u 1 d 1 )(u 2 d 2 ). (u 1,u 2 ) S Osoitetaan, että NNR on hyvin määritelty. Lause 3.1. Olkoon (S, d) neuvotteluongelma. Tällöin on olemassa yksikäsitteinen û = (û 1, û 2 ) S, joka maksimoi funktion (3.6) g(u) = (u 1 d 1 )(u 2 d 2 ) joukossa S. 18
Todistus. Osoitetaan ensin, että lause pätee kaikille neuvotteluongelmille, joissa d = 0. Koska S on kompakti ja g : S R on jatkuva, niin g saa joukossa S suurimman arvonsa M. Osoitetaan, että maksimipiste on yksikäsitteinen. Tehdään vastaoletus, että maksimi saavutetaan kahdessa eri pisteessä (û 1, û 2 ) ja (u 1, u 2). Määritelmän 3.2 kohdan 4 perusteella û 1 û 2 = u 1u 2 = M > 0. Jos olisi û 1 = u 1, niin täytyisi olla myös û 2 = u 2, mutta vastaoletuksen mukaan (û 1, û 2 ) (u 1, u 2). Oletetaan sitten, että û 1 < u 1. Tällöin täytyy olla û 2 > u 2. Koska S on konveksi, niin (3.7) ( 1 2 (û 1 + u 1), 1 ) 2 (û 2 + u 2) S ja ( 1 g 2 (û 1 + u 1), 1 ) 2 (û 2 + u 2) = 1 2 (û 1 + u 1) 1 2 (û 2 + u 2) = 1 4 (û 1û 2 + û 1 u 2 + u 1û 2 + u 1u 2) = M 2 + 1 4 (û 1u 2 + u 1û 2 ) = M 2 + 1 4 (û 1u 2 + u 1(u 2 + û 2 u 2) = M 2 + 1 4 (û 1u 2 + u 1u 2 + u 1(û 2 u 2)) > M 2 + 1 4 (û 1u 2 + u 1u 2 + û 1 (û 2 u 2)) (3.8) = M, mikä on ristiriita. Siten maksimipiste on yksikäsitteinen. Samalla tavalla ristiriitaan päädytään, jos û 1 > u 1. Tarkastellaan sitten mielivaltaista neuvotteluongelmaa (S, d). Olkoon (S, 0) neuvotteluongelma, jossa S = {u d : u S}. Tällöin siis S = {u+d : u S }. Nyt on olemassa yksikäsitteinen hyötypari (û 1, û 2 ) S, joka maksimoi tulon u 1 u 2 joukossa S, kuten yllä osoitettiin. Tällöin (û 1 + d 1, û 2 + d 2 ) S on yksikäsitteinen tulon (u 1 d 1 )(u 2 d 2 ) joukossa S maksimoiva hyötypari. Nashin neuvotteluratkaisu on siis hyvin määritelty. Se liittää jokaiseen neuvotteluongelmaan (S, d) yksikäsitteisen sopimuksen. NNR on ainut aksioomat N1,...,N4 toteuttava neuvotteluratkaisu. Tämän todistamista varten tarvitaan seuraava lemma. Lemma 3.2. Olkoon (S, d) neuvotteluongelma, f N (S, d) = û ja (3.9) h(u) = (û 2 d 2 )u 1 + (û 1 d 1 )u 2. Tällöin h(u) h(û) kaikilla u S. 19
Todistus. Tehdään vastaoletus, että h(u) > h(û) jollakin u S. Asetetaan p (0, 1), u 1 = û 1 + p(u 1 û 1 ) ja u 2 = û 2 + p(u 2 û 2 ). Konveksisuuden vuoksi u = (u 1, u 2) S. Nyt 0 < h(u) h(û) (3.10) = (û 2 d 2 )u 1 + (û 1 d 1 )u 2 (û 2 d 2 )û 1 (û 1 d 1 )û 2 = (û 2 d 2 )(u 1 û 1 ) + (û 1 d 1 )(u 2 û 2 ) = h(u û), ja saadaan (3.11) g(u ) = (u 1 d 1 )(u 2 d 2 ) = (û 1 + p(u 1 û 1 ) d 1 )(û 2 + p(u 2 û 2 ) d 2 ) = (û 1 d 1 )(û 2 d 2 ) + (û 1 d 1 )p(u 2 û 2 ) + p(u 1 û 1 )(û 2 d 2 ) + p 2 (u 1 û 1 )(u 2 û 2 ) = (û 1 d 1 )(û 2 d 2 ) + p((û 2 d 2 )(u 1 û 1 ) + (û 1 d 1 )(u 2 û 2 )) + p 2 (u 1 û 1 )(u 2 û 2 ) = g(û) + ph(u û) + p 2 (u 1 û 1 )(u 2 û 2 ). Kun p on riittävän pieni, niin kahden viimeisen termin summa on aidosti positiivinen ja silloin g(u ) > g(û). Tämä on ristiriita sen kanssa, että funktion g maksimi joukossa S saavutetaan pisteessä û. Huomautus. Lemman mukaan kaikilla u S pätee (3.12) (û 2 d 2 )u 1 + (û 1 d 1 )u 2 (û 2 d 2 )û 1 + (û 1 d 1 )û 2 u 2 û 2 û2 d 2 û 1 d 1 (û 1 u 1 ) u 2 û 2 û2 d 2 û 1 d 1 (u 1 û 1 ). Geometrisesti tulos voidaan tulkita seuraavasti (Kuvio 3.1). Asetetaan pisteen û kautta kulkeva suora a, jonka kulmakerroin on pisteiden d ja û määräämän suoran kulmakertoimen vastaluku. Tällöin mikään joukon S piste ei ole suoran a yläpuolella. Suora a on siis joukon S tangentti pisteessä û, (jos tangentti pisteessä û on olemassa). Lause 3.3. Nashin neuvotteluratkaisu on ainoa neuvotteluratkaisu, joka toteuttaa aksioomat N1,..., N4. Todistus. Osoitetaan ensin, että NNR toteuttaa aksioomat N1,...,N4. N1 (Pareto-tehokkuus) Olkoon u S sellainen sopimus, että u 1 f N 1 (S, d) = û 1 ja u 2 f N 2 (S, d) = û 2. Koska nyt (3.13) (u 1 d 1 )(u 2 d 2 ) (û 1 d 1 )(û 2 d 2 ) = g(û) 20
Kuvio 3.1 ja û on funktion g(u) yksikäsitteinen maksimipiste joukossa S, niin u = û = f N (S, d). N2 (Riippumattomuus epäolennaisista vaihtoehdoista) Oletetaan, että T S ja f N (S, d) T. Koska f N (S, d) on funktion g(u) maksimoiva piste joukossa S, niin se on myös funktion g(u) maksimoiva piste joukossa T S. Siispä f N (S, d) = f N (T, d). N3 (Riippumattomuus positiivisista affiinimuunnoksista) Olkoon (3.14) (3.15) T = {(α 1 u 1 + β 1, α 2 u 2 + β 2 ) : (u 1, u 2 ) S}, c = (α 1 d 1 + β 1, α 2 d 2 + β 2 ), missä α 1, α 2 (0, ) ja β 1, β 2 R. Koska (3.16) arg max u S = arg max u S = arg max u S =û, (α 1 u 1 + β 1 (α 1 d 1 + β 1 ))(α 2 u 2 + β 2 (α 2 d 2 + β 2 )) α 1 α 2 (u 1 d 1 )(u 2 d 2 ) α 1 α 2 g(u) 21
niin (3.17) arg max (t 1 (α 1 d 1 + β 1 ))(t 2 (α 2 d 2 + β 2 )) t T =(α 1 û 1 + β 1, α 2 û 2 + β 2 ). N4 (Symmetrisyys) Jos d 1 = d 2 ja implikaatio (3.18) (u 1, u 2 ) S (u 2, u 1 ) S pätee, niin (3.19) (f1 N (S, d), f2 N (S, d)) = arg max g(u 1, u 2 ) = arg max (u 1 d 1 )(u 2 d 2 ) = arg max (u 1 d 2 )(u 2 d 1 ) = arg max g(u 2, u 1 ) = (f2 N (S, d), f1 N (S, d)). On vielä osoitettava aksioomat toteuttavan neuvotteluratkaisun yksikäsitteisyys. Olkoon f : Σ S mielivaltainen aksioomat N1,...,N4 toteuttava neuvotteluratkaisu. Näytetään, että f = f N. Olkoon (S, d) mielivaltainen neuvotteluongelma. Määritellään joukko (3.20) U. = {u R 2 : h(u) h(û), u 1 d 1, ja u 2 d 2 }, jossa funktio h määritellään kuten lemmassa 3.2 ja û = f N (S, d). Joukko U on siis suorien (3.21) (3.22) (3.23) u 2 û 2 = û2 d 2 û 1 d 1 (u 1 û 1 ), u 1 = d 1 ja u 2 = d 2 rajoittama kompakti ja konveksi joukko (Kuvio 3.2). Lemman 3.2 ja sitä seuraavan huomautuksen mukaan S U. Olkoon joukko T R 2 joukon U positiivinen affiinimuunnos (3.24) T = {( 1 u 1 d 1 1, u 2 d 2 û 1 d 1 û 1 d 1 û 2 d 2 û 2 d 2 Nyt kaikilla t T pätee rajoitteen 3.21 nojalla ) : (u 1, u 2 ) U }. (3.25) t 1 + t 2 = u 1 û 1 d 1 d 1 û 1 d 1 + u 2 û 2 d 2 d 2 û 2 d 2 u 1 d û 2 û2 d 2 (u 1 û 1 ) 1 û + 1 d 1 d 2 û 1 d 1 û 1 d 1 û 2 d 2 û 2 d 2 = u 1 d 1 û 1 d 1 + û2 d 2 û 2 d 2 u 1 û 1 û 1 d 1 = 2 22
Kuvio 3.2. Joukot U ja S. ja koska u 1 d 1 ja u 2 d 2, niin t 1, t 2 0. Nähdään, että (3.26) T = {t R 2 : t 1 + t 2 2, t 1 0 ja t 2 0}. Määritelmän mukaisesti (T, (0, 0)) on nyt neuvotteluongelma. Koska T on symmetrinen, niin aksiooman N4 perusteella Nashin aksioomat toteuttava ratkaisu sijaitsee suoralla t 1 = t 2. Aksiooman N1 nojalla tämän ratkaisun täytyy olla Pareto-tehokkaassa pisteessä (1, 1). Siispä f(t, (0, 0)) = (1, 1). Koska yhtälön 3.24 perusteella joukko U saadaan joukosta T positiivisella affiinimuunnoksella (3.27) niin aksiooman N3 nojalla (3.28) U = {((û 1 d 1 )t 1 + d 1, (û 2 d 2 )t 2 + d 2 ) : (t 1, t 2 ) T }, f(u, d) = ((û 1 d 1 ) 1 + d 1, (û 2 d 2 ) 1 + d 2 ) = (û 1, û 2 ) = û. Koska S U ja f(u, d) = û S, niin aksiooman N2 nojalla f(s, d) = û = f N (S, d). On siis osoitettu, että jos neuvotteluratkaisu toteuttaa aksioomat, niin se on NNR. 23
Esitetään seuraavaksi alkuperäisen määritelmän kanssa yhtäpitävä muotoilu Nashin neuvotteluratkaisulle. Merkintöjen yksinkertaistamiseksi se on muotoiltu koskemaan neuvotteluongelmia, joissa kieltäytymispiste on d = (0, 0), mutta kaikki neuvotteluongelmat voidaan muotoilla tällaisiksi sopivalla hyötyfunktioiden positiivisella affiinimuunnoksella. Lause 3.4. Neuvotteluongelma (S, (0, 0)) liittyvä neuvotteluratkaisu f(s, (0, 0)) = u on NNR, jos ja vain jos seuraava implikaatio on voimassa kaikilla p [0, 1], x S ja i {1, 2}: (3.29) px i > u i pu j > x j, missä j i. Todistus. Oletetaan ensin, että u on NNR eli u 1 u 2 x 1 x 2, kaikilla x S. Koska kieltäytymispiste on (0, 0), niin u 1 > 0 ja u 2 > 0. Olkoon nyt i, x ja p sellaiset, että px i > u i. Huomaa, että tällöin x i > 0. Koska nyt (3.30) px i u j > u i u j x i x j, niin pu j > x j. Oletetaan sitten, että kaikilla p [0, 1], x S ja i {1, 2} pätee implikaatio (3.31) px i > u i pu j > x j, missä i j. Jos nyt x 1 = 0 tai x 2 = 0, niin triviaalisti u 1 u 2 x 1 x 2. Samoin jos x i u i molemmilla i {1, 2}, niin u 1 u 2 x 1 x 2. Oletetaan siis, että x 1 > 0, x 2 > 0 ja x i > u i jommallakummalla i. Tällöin kaikilla p [0, 1] pätee (3.32) p > u i x i p > x j u j ja u i x i < 1. Jos nyt olisi olemassa sellainen oletukset täyttävä x S, että (3.33) u i x i < x j u j, niin löytyisi sellainen p [0, 1], että (3.34) u i x i < p x j u j, mikä on ristiriita kaavan 3.32 kanssa. Täytyy siis olla (3.35) u i x i x j u j, ja siten u i u j x i x j. 24
3.3 Nashin neuvotteluratkaisun ominaisuuksia Esimerkki 3.2. (Riskineutraalit pelaajat.) Pelaajat I ja II neuvottelevat rahasumman π > 0 jakamisesta. Oletetaan, että pelaajien hyötyfunktiot rahan suhteen ovat U 1 (x) = U 2 (x) = x kaikilla x [0, π]. Jos sopimusta ei saada aikaan, pelaajat saavat kieltäytymispisteen d mukaiset rahasummat d 1 (0, π) ja d 2 (0, π), missä d 1 + d 2 < π. Mahdollisten sopimusten joukoksi saadaan siten (3.36) S = {u R 2 : u 1 [d 1, π d 2 ] ja u 2 [d 2, π u 1 ]}. Nyt NNR löytyy väliltä [d 1, π d 2 ] tulon (3.37) (u 1 d 1 )(π u 1 d 2 ). = g(u 1 ) maksimikohdasta. Tulon derivoimissääntöä käyttämällä saadaan (3.38) g (u 1 ) = π u 1 d 2 (u 1 d 1 ) = π 2u 1 + d 1 d 2, joten derivaatan nollakohdalle pätee (3.39) g (û 1 ) = π 2û 1 + d 1 d 2 = 0. Saadaan û 1 = d 1 + 1 2 (π d 1 d 2 ). Koska g (u 1 ) = 2 < 0, niin û 1 on lokaali maksimipiste. Kun u 1 = d 1 tai u 2 = π u 1 = d 2, niin tulo g(u 1 ) = 0 < g(û 1 ), joten û 1 on globaali maksimi. Koska Pareto-tehokkuusaksiooman nojalla û 2 = π û 1, niin NNR on hyötypari (3.40) û 1 = d 1 + 1 2 (π d 1 d 2 ), û 2 = d 2 + 1 2 (π d 1 d 2 ). Riskineutraalit pelaajat siis jakavat rahasumman niin, että kummallekin annetaan ensin se rahasumma, minkä hän saisi kieltäytymispisteessä ja loput rahat jaetaan puoliksi pelaajien kesken. Huomaa, että pelaajan i osuus on kasvava muuttujan d i ja vähenevä muuttuja d j, j i, suhteen. Pelaaja on siis sitä vahvemmassa neuvotteluasemassa, mitä suurempi on hänen kieltäytymispisteensä ja mitä pienempi on vastapelaajan kieltäytymispiste. Tämä ominaisuus pätee yleisesti kaikille neuvotteluongelmille, kuten seuraavasta tarkastelusta voidaan havaita. Etu paremmasta kieltäytymispisteestä. Kuvioon 3.3 on piirretty eräs mahdollisten hyötyparien joukko S ja sen Pareto-rintama S 0 (joukon S osajoukko, joka toteuttaa aksiooman N1). Jokaisesta Pareto-rintaman pisteestä, jossa on olemassa tangentti on piirretty suora, jonka kulmakerroin on tangentin kulmakertoimen vastaluku. Jos tangenttia ei ole, on pisteen kautta piirretty kaksi suoraa, joiden kulmakertoimet ovat vasemman ja oikean tangentin kulmakertoimien vastaluvut. 25
Kuvio 3.3. Kieltäytymispisteen vaikutus Nashin neuvotteluratkaisuun. Kuten lemman 3.2 jälkeisessä huomautuksessa todettiin, û on se piste, jossa pisteiden d ja û välisen suoran kulmakerroin on joukon S tangentin kulmakertoimen vastaluku pisteessä û. Jos siis kieltäytymispiste d on jollakin kuvaan piirretyistä suorista, niin NNR löytyy pisteestä q, jossa tämä suora leikkaa Pareto-rintaman S 0. Jos taas kieltäytymispiste on kahden saman joukon S 0 pisteen kautta kulkevan suoran välissä, kuten piste c, niin NNR löytyy pisteestä p, jossa nämä suorat leikkaavat. Nähdään, että mitä suurempi on d 1 ja mitä pienempi on d 2, sitä suurempi on û 1 ja sitä pienempi on û 2. Ajatellaanpa johdantoluvun autonmyyntiesimerkkiä. Jos autoja on paljon myytävänä, voi ostaja mennä neuvottelujen kariutuessa ostamaan auton joltakin toiselta myyjältä. Tällaisessa tapauksessa ostajan kieltäytymispiste ei olekaan 0 ja hän pääsee parempaan neuvotteluratkaisuun. On mielenkiintoista huomata, että jos pelaaja voi vaikuttaa kieltäytymispisteeseen, niin hän haluaa tehdä sen mahdollisimman miellyttäväksi itselleen ja mahdollisimman epämiellyttäväksi vastapelaajalleen. Pelaaja i saattaa esimerkiksi uhata tehdä jotakin pelaajan j i kannalta epämiellyttävää, mikäli kieltäytymispisteeseen joudutaan. Uhkauksen täytyy kuitenkin olla uskottava, eli sen täytyy tuottaa toteuttajalleen, pelaajalle i, vähintään saman hyödyn 26
kuin uhkauksen toteuttamatta jättäminen. Mikäli näin ei ole, niin pelaajan j on rationaalista olettaa, että pelaaja i ei toteuta uhkaustaan ja toimia neuvottelussa sen mukaisesti. Tällöin uhkauksella ei ole todellista vaikutusta kieltäytymispisteen sijaintiin ja sitä kautta neuvottelutulokseen. Esimerkki 3.3. Riskinkaihtamisen vaikutus. Tarkastellaan taas tilannetta, jossa pelaajat I ja II neuvottelevat rahasumman π > 0 jakamisesta. Olkoon nyt U 1 (x) = x a, a (0, 1), U 2 (x) = x ja d 1 = d 2 = 0. Mahdollisten hyötyparien joukko on siten (3.41) S = { u R 2 : u 1 [0, π a ] ja u 2 [ 0, π u 1/a 1 ]}. Siispä NNR löytyy funktion (3.42) g(u 1 ) = u 1 ( π u 1/a 1 ) = u1 π u 1+1/a 1. maksimikohdasta. Kun u 1 = 0 tai u 1 = π a, niin g(u 1 ) = 0. Muulloin g(u 1 ) > 0, joten tulon g(u 1 ) globaali maksimi löytyy väliltä (0, π a ). Derivoimalla saadaan (3.43) g (u 1 ) = π joten derivaatan nollakohta on ( ) a π (3.44) û 1 = = 1 + 1/a ( 1 + 1 ) u 1/a 1, a ( ) aπ a. 1 + a Tämä on ainoa ääriarvokohta välillä (0, π a ), joten sen on oltava määritelmän 3.4 mukainen maksimikohta. Nashin neuvotteluratkaisussa pelaaja I saa siten rahasumman (3.45) ˆx 1 = aπ 1 + a ja pelaaja II rahasumman (3.46) ˆx 2 = π aπ 1 + a = π 1 + a. Nähdään, että muuttuja a kasvaessa ˆx 1 kasvaa ja ˆx 2 vähenee. Kun a 0, niin ˆx 1 0 ja ˆx 2 π. Muuttujan a voidaan ajatella kuvaavan pelaajan I riskinkaihtamisen astetta. Mitä pienempi a on, sitä enemmän riskinkaihtaja hän on. Voidaan siis päätellä, että mitä enemmän riskinkaihtaja pelaaja I on sitä pienemmän osuuden rahoista hän saa Nashin neuvotteluratkaisussa ja sitä suuremman osuuden pelaaja II saa. Tässä piilee kuitenkin myös Nashin neuvotteluratkaisun soveltamiseen liittyvä ongelma. Pelaajat eivät nimittäin välttämättä tunne toistensa hyötyfunktioita. Hyötyfunktioiden tunteminen on välttämätöntä joukon S löytämiseksi. Jos hyötyfunktioita ei tunneta, niin ei tunneta joukkoa S ja Nashin neuvotteluratkaisua on mahdotonta löytää. 27
3.4 Esimerkkejä Esimerkki 3.4. Pelaajien I ja II neuvottelukohteena on jokin esine, jota ei voi jakaa osiin siten, että siitä olisi hyötyä molemmille pelaajille. He neuvottelevat siitä kumpi tämän esineen saa. Oletetaan, että pelaaja, joka saa esineen saa hyödyn 1, ja pelaaja, joka jää ilman esinettä saa hyödyn 0. Jos sopimukseen ei päästä joudutaan kieltäytymispisteeseen, jolloin kumpikin saa hyödyn 0. Jos nyt mahdollisten hyötyparien joukkoon kuuluisivat vain pisteet (0, 0), (0, 1) ja (1, 0), niin hyötyparien joukko ei olisi konveksi, joten kyseessä ei olisi määritelmän mukainen neuvotteluongelma. Mahdollisten hyötyparien joukko voidaan kuitenkin laajentaa konveksiksi, jos myös kaikki arvonnat näiden hyötyparien välillä sallitaan mahdollisiksi sopimuksiksi. Tällöin päädytään neuvotteluongelmaan (S, (0, 0)), jossa S = {p 1 (0, 0) + p 2 (0, 1) + p 3 (1, 0) : p 1, p 2, p 3 [0, 1] ja p 1 + p 2 + p 3 = 1}. Tämä neuvotteluongelma on symmetrinen, joten aksiooman N4 nojalla NNR on suoralla u 2 = u 1. Aksiooman N1 nojalla NNR löytyy tämän suoran ainoasta Pareto-tehokkaasta pisteestä ( 1, 1). Tähän hyötypariin päästään, kun p 2 2 1 = 0 ja p 2 = p 3 = 1. Pelaajat siis heittävät lanttia siitä kumpi saa esineen. 2 Arvontojen salliminen mahdollisiksi sopimuksiksi edellyttää tietysti sitä, että arvonnan hävinneen osapuolen on tyydyttävä arvonnalla saatuun ratkaisuun eikä hän voi enää kieltäytyä sopimuksesta arvonnan jälkeen. Jos tätä ei voida ennen arvontaa luotettavasti varmistaa, niin arvontoja ei ole järkevää sisällyttää mahdollisten sopimusten joukkoon. Mikäli arvontoja ei voida sallia mahdollisiksi sopimuksiksi, niin esimerkin tapauksessa neuvotteluongelma ei ole määritelmän mukainen ja tilanteeseen ei voida soveltaa Nashin neuvotteluratkaisua. Esimerkki 3.5. Kaksi pelaajaa neuvottelevat rahasumman $100 jakamisesta. Kuten aikaisemminkin, jos sopimusta ei synny, niin kumpikaan ei saa mitään. Olkoon pelaajan I hyötyfunktio omaisuuden w suhteen U 1 (w) = w ja pelaajan II U 2 (w) = log w. Oletetaan, että pelaajan II omaisuus on yhteensä w 2. Nyt pelaajan II saama hyödyn kasvu hänen saadessa rahasumman x on (3.47) U 2 (w 2 + x) U 2 (w 2 ) = log(w 2 + x) log w 2 = log w 2 + x w 2, joten mahdollisten hyötyparien joukoksi saadaan (3.48) S = { [ (u 1, u 2 ) R 2 : u 1 [0, 100] ja u 2 Siispä NNR löytyy funktion 0, log w 2 + 100 u 1 w 2 ]}. (3.49) g(u 1 ) = u 1 log w 2 + 100 u 1 w 2 28
maksimikohdasta. Derivoimalla saadaan (3.50) g (u 1 ) = log w 2 + 100 u 1 w 2 joten derivaatan nollakohdalle pätee u 1 w 2 + 100 u 1, (3.51) log w 2 + 100 u 1 w 2 = u 1 w 2 + 100 u 1. Tämän yhtälön toteuttava û 1 on ainoa ääriarvo, joten sen on oltava määritelmän 3.4 mukainen maksimikohta. Pelaaja I saa siis Nashin neuvotteluratkaisussa tämän yhtälön toteuttavan rahasumman û 1 ja pelaaja II vastaavasti summan 100 û 1. Jos esimerkiksi w 2 on $100, niin pelaaja I saa $54.5 ja pelaaja II saa $45.5. Huomautus. Esimerkin tulos on riippumaton pelaajan I omaisuudesta. Tämä johtuu siitä, että hänen hyötyfunktionsa on lineaarinen. Huomautus. Tämän esimerkin tapaan voidaan mallintaa tilannetta, jossa pelaajan I hyötyfunktio on myös aidosti konkaavi rahan suhteen, mutta hänellä on niin suuri omaisuus verrattuna jaettavaan rahasummaan, että tätä hyötyfunktiota voidaan riittävän tarkasti approksimoida lineaariseksi. Seuraavassa esimerkissä lasketaan Nashin neuvotteluratkaisu, kun molempien pelaajien hyötyfunktiot ovat logaritmisia. Esimerkki 3.6. (Varallisuuden vaikutus.) Oletetaan, että tilanne on muuten samanlainen kuin edellisessä esimerkissä, mutta pelaajan I omaisuus on w 1 ja hyötyfunktio omaisuuden w suhteen on U 1 (w) = log w. Nyt pelaajan I saama hyödyn kasvu hänen saadessa rahasumman x on (3.52) u 1 = U 1 (w 1 + x) U 1 (w 1 ) = log w 1 + x w 1. Tästä saadaan ratkaistua x = w 1 e u 1 w 1. Pelaajan II saama hyödyn kasvu rahasummasta 100 x on (3.53) log w 2 + 100 x w 2 = log w 2 + 100 (w 1 e u1 w 1 ) w 2, joten mahdollisten hyötyparien joukoksi saadaan (3.54) { [ S = (u 1, u 2 ) R 2 : u 1 0, log w ] 1 + 100 w 1 ja u 2 [ 0, log w 2 + 100 w 1 (e u 1 1) w 2 ]}. Nyt (3.55) g(u 1 ) = u 1 log w 2 + 100 w 1 (e u 1 1) w 2 29
ja derivaatta (3.56) g (u 1 ) = log w 2 + 100 w 1 (e u 1 1) w 2 u 1 w 1 e u 1 w 2 + 100 w 1 (e u 1 1), joten Nashin neuvotteluratkaisussa pelaaja I saa hyödynlisäyksen û 1, joka toteuttaa yhtälön (3.57) log w 2 + 100 w 1 (eû1 1) w 2 = û 1 w 1 eû1 w 2 + 100 w 1 (eû1 1). Rahasumma, jonka pelaaja I saa on siten w 1 (eû1 1). Tällöin pelaaja II saa rahasumman 100 w 1 (eû1 1). Jos esimerkiksi w 1 on $100 ja w 2 on $200, niin pelaaja I saa $48.1 ja pelaaja II saa $51.9. Pelaajien hyötyfunktiot ovat samanlaiset, mutta mitä varakkampi pelaaja on sitä vähemmän konkaaviksi hänen logaritminen hyötyfunktionsa tulee, sillä (3.58) d 2 dw 2 U 1(w) = d2 dw 2 log w = 1 w 2 0, kun x. Logaritminen hyötyfunktio alkaa muistuttamaan yhä enemmän lineaarista funktiota, kun omaisuus w kasvaa. Varakkaampi pelaaja on siten tässä tilanteessa vähemmän riskinkaihtaja ja siksi paremmassa neuvotteluasemassa. 3.5 Epäsymmetrinen Nashin neuvotteluratkaisu Mahdollisten sopimusten joukko S ja kieltäytymispiste d määräävät tavallisen Nashin neuvotteluratkaisun tuloksen, mutta tosielämän neuvottelua mallinnettaessa pelaajien väliseen neuvottelutulokseen voi vaikuttaa myös muut seikat. Esimerkiksi pelaajan I paremmat neuvottelutaidot tai pelaajan II tarve saada sopimus aikaan nopeasti voi tosielämässä parantaa pelaajan I neuvottelutulosta, vaikka mahdollisten sopimusten joukko S ja kieltäytymispiste d pysyvätkin samana. Epäsymmetrisessä Nashin neuvotteluratkaisussa otetaan huomioon tällainen pelaajien välinen epäsymmetrisyys. Tämä epäsymmetrisyys mallinnetaan liittämällä pelaajalle I neuvotteluvoima τ (0, 1) ja pelaajalle II neuvotteluvoima 1 τ (0, 1). Rubinsteinin neuvottelumallia käsittelevässä luvussa 3 tarkastellaan lähemmin pelaajien kärsimättömyyden vaikutusta neuvotteluvoimiin diskonttauskertoimien avulla. Määritelmä 3.5. Neuvotteluvoimiin τ ja 1 τ liittyvä epäsymmetrinen Nashin neuvotteluratkaisu (engl. asymmetric (tai generalized) Nash bargaining solution) on funktio f τ : Σ S, (3.59) f τ (S, d) = arg max (u 1 d 1 ) τ (u 2 d 2 ) 1 τ. (u 1,u 2 ) S 30
Osoitetaan, että epäsymmetrinen Nashin neuvotteluratkaisu on hyvin määritelty. Lause 3.5. Olkoon (S, d) neuvotteluongelma ja τ (0, 1). Tällöin on olemassa yksikäsitteinen u = (u 1, u 2) S, joka maksimoi funktion (3.60) g τ (u) = (u 1 d 1 ) τ (u 2 d 2 ) 1 τ joukossa S. Todistus. Osoitetaan ensin, että lause pätee kaikille neuvotteluongelmille, joissa d = 0. Koska S on kompakti ja g τ : S R on jatkuva, niin g τ saa joukossa S suurimman arvonsa M. Osoitetaan, että maksimipiste on yksikäsitteinen. Tehdään vastaoletus, että maksimi saavutetaan kahdessa eri pisteessä (u 1, u 2) S ja (u 1, u 2) S. Tarkastellaan funktiota f : (0, ) (0, ) (3.61) f(x) = ( M x τ ) 1/(1 τ) = M 1/(1 τ) x (τ/(1 τ)). Koska (u 1) τ (u 2) 1 τ = M = (u 1) τ (u 2) 1 τ, niin (3.62) u 2 = ( ) 1/(1 τ) ( ) 1/(1 τ) M M ja u (u 1) τ 2 =, (u 1) τ joten pisteet u ja u sijaitsevat funktion f kuvaajalla. Kaikille funktion f kuvaajan yläpuolella oleville pisteille (u 1, u 2 ) pätee (3.63) ( ) 1/(1 τ) 1 τ u τ 1u 1 τ 2 > u τ M 1 = M. u τ 1 Koska kaikilla x (0, ) funktion f(x) derivaatta on (3.64) f (x) = τ 1 τ M 1/(1 τ) x ( (τ/(1 τ) 1) ja toinen derivaatta on ( f (x) = τ ) ( (3.65) 1 τ 1 τ 1 τ niin f on aidosti konveksi, joten piste (3.66) ) M 1/(1 τ) x ( τ/(1 τ) 2) > 0, ( 1 1 2 (u + u ) = 2 (u 1 + u 1), 1 ) 2 (u 2 + u 2) sijaitsee funktion f kuvaajan yläpuolella (Kuvio 3.4). Tällöin (3.67) ( ) 1 τ ( 1 1 τ 2 (u 1 + u 1) 2 (u 2 + u 2)) > M 31
Kuvio 3.4 ja koska S on konveksi, niin 1 2 (u + u ) S, joten päädytään ristiriitaan. Tarkastellaan sitten mielivaltaista neuvotteluongelmaa (S, d). Olkoon (S, 0) neuvotteluongelma, jossa S = {u d : u S}. Tällöin siis S = {u+d : u S }. Nyt on olemassa yksikäsitteinen hyötypari (u 1, u 2) S, joka maksimoi funktion u τ 1u 1 τ 2 joukossa S. Tällöin (u 1+d 1, u 2+d 2 ) S on yksikäsitteinen funktion (u 1 d 1 ) τ (u 2 d 2 ) 1 τ joukossa S maksimoiva hyötypari. Lause 3.6. Jokainen epäsymmetrinen Nashin neuvotteluratkaisu toteuttaa aksioomat N1,...,N3. Olkoon f τ (S, d) neuvotteluvoimiin τ ja 1 τ liittyvä epäsymmetrinen Nashin neuvotteluratkaisu. N1 (Pareto-tehokkuus) Olkoon u S sellainen sopimus, että u 1 f τ 1 (S, d) = u 1 ja u 2 f τ 2 (S, d) = u 2. Koska nyt (3.68) (u 1 d 1 ) τ (u 2 d 2 ) 1 τ (u 1 d 1 ) τ (u 2 d 2 ) 1 τ = g τ (u ) ja u on funktion g τ (u) yksikäsitteinen maksimipiste joukossa S, niin u = u = f τ (S, d). 32
N2 (Riippumattomuus epäolennaisista vaihtoehdoista) Oletetaan, että T S ja f τ (S, d) T. Koska f τ (S, d) on funktion g τ (u) maksimoiva piste joukossa S, niin se on myös funktion g τ (u) maksimoiva piste joukossa T S. Siispä f τ (S, d) = f τ (T, d). N3 (Riippumattomuus positiivisista affiinimuunnoksista) Olkoon (3.69) (3.70) T = {(α 1 u 1 + β 1, α 2 u 2 + β 2 ) : (u 1, u 2 ) S}, c = (α 1 d 1 + β 1, α 2 d 2 + β 2 ), missä α 1, α 2 (0, ) ja β 1, β 2 R. Koska (3.71) arg max u S = arg max u S = arg max u S =u, (α 1 u 1 + β 1 (α 1 d 1 + β 1 )) τ (α 2 u 2 + β 2 (α 2 d 2 + β 2 )) 1 τ α τ 1α 1 τ 2 (u 1 d 1 ) τ (u 2 d 2 ) 1 τ α τ 1α 1 τ 2 g τ (u) niin (3.72) arg max (t 1 (α 1 d 1 + β 1 )) τ (t 2 (α 2 d 2 + β 2 )) 1 τ t T =(α 1 u 1 + β 1, α 2 u 2 + β 2 ). Jos τ 1, niin epäsymmetrinen Nashin neuvotteluratkaisu ei toteuta symmetrisyysaksioomaa N4. Jos taas τ = 1, niin epäsymmetrinen Nashin neuvotte- 2 2 luratkaisu toteuttaa aksiooman N4 ja on sama kuin Nashin neuvotteluratkaisu. Lause 3.7. Olkoon τ (0, 1) ja olkoon f aksioomat N2 ja N3 toteuttava neuvotteluratkaisu, jolla (3.73) f(a, (0, 0)) = (τ, 1 τ), missä A = {u R 2 + : u 1 + u 2 1}. Tällöin f = f τ. Todistus. On riittävää osoittaa, että f(s, d) = f τ (S, d) kaikilla neuvotteluongelmilla (S, d), joilla d 1 = d 2 = 0. Aloitetaan osoittamalla, että f τ (A, (0, 0)) = f(a, (0, 0)). Maksimoidaan tulo u τ 1u 1 τ 2 ehdolla u 1 +u 2 = 1. Sijoittamalla ehto muodossa u 2 = 1 u 1 maksimoitavaan tuloon saadaan (3.74) u τ 1(1 u 1 ) 1 τ. 33
Kun u 1 (0, 1), niin derivaatan nollakohdalle pätee (3.75) τu τ 1 1 (1 u 1 ) 1 τ u τ 1(1 τ)(1 u 1 ) τ = τ uτ 1 1 u 1 u 1 (1 u 1 ) u τ 1 (1 τ) τ (1 u 1 ) τ ( ) u1 τ ( = τ 1 u ) 1 (1 τ) = 0 1 u 1 u 1 τ 1 u 1 u 1 (1 τ) = 0 τ(1 u 1 ) = (1 τ)u 1 u 1 = τ. Koska tämä on ainoa ääriarvokohta välillä (0, 1), niin sen täytyy olla lauseen 3.5 mukainen yksikäsitteinen maksimikohta. Siispä (3.76) f τ (A, (0, 0)) = (τ, 1 τ) = f(a, (0, 0)). Olkoon sitten (S, d) mielivaltainen neuvotteluongelma, jossa d = (0, 0). Lauseen 3.5 nojalla neuvotteluongelmalla (S, (0, 0)) on olemassa yksikäsitteinen c S, jolla (3.77) c τ 1c 1 τ 2 > u τ 1u 1 τ 2 kaikilla u S, u c. Olkoon k = c τ 1c 1 τ 2. Nyt joukko (3.78) H = {u R 2 + : u τ 1u 1 τ 2 k} on selvästi konveksi ja joukot S ja H leikkaavat vain pisteessä c. Olkoon b 1 R ja b 2 R sellaiset, että suora (3.79) P = {x R 2 : b 1 x 1 + b 2 x 2 = k} on joukon H tangentti pisteessä c. Suoran P kulmakertoimen b 1 /b 2 on oltava negatiivinen, joten b 1 on samanmerkkinen kuin b 2. Nähdään helposti, että b 1 > 0 ja b 2 > 0, sillä jos b 1 < 0 ja b 2 < 0, niin olisi (3.80) 0 > b 1 c 1 + b 2 c 2 = k = c τ 1c 1 τ 2 > 0. Nyt suoran P alapuolelle jäävän joukon (3.81) T = {x R 2 + : b 1 x 1 + b 2 x 2 k} ja joukon H leikkaus on siis {c}. Täytyy siis olla (3.82) f τ (T, (0, 0)) = c. Toisaalta T on positiivinen affiinimuunnos joukosta A, ja koska f ja f τ toteuttavat aksiooman N3, niin yhtälöstä 3.76 seuraa (3.83) c = f τ (T, (0, 0)) = f(t, (0, 0)). Koska S T ja f(t, (0, 0)) = c S, niin aksiooman N2 nojalla f(s, (0, 0)) = c = f τ (S, (0, 0)). 34