SEKASTRATEGIAT PELITEORIASSA Matti Estola 8. joulukuuta 2013 Sisältö 1 Johdanto 2 2 Ratkaistaan sukupuolten välinen taistelu sekastrategioiden avulla 5 Teksti on suomennettu kirjasta: Gibbons: A Primer in Game Theory 1
1 Johdanto Tarkastellaan esimerkkinä sellaista peliä, jossa 2 pelaajaa päättävät asettavatko he yhden markan pöytään numero- vai leijonapuoli ylöspäin ( matching pennies eli mp). Molemmat tekevät päätöksensä toisen päätöksestä tietämättä. Jos rahat osoittautuvat olevan sama puoli ylöspäin, pelaaja 2 saa molemmat rahat. Jos rahat ovat eripäin, pelaaja 1 saa molemmat rahat. Pelimatriisi on seuraava. pelaaja 2 numero leijona pelaaja 1 numero 1, +1 +1, 1 leijona +1, 1 1, +1 Pelissä ei ole puhtailla strategioilla pelattuna Nash -tasapainoa. Jos pelattu strategiavektori on (numero, leijona) tai (leijona, numero), pelaaja 2 haluaa muuttaa strategiaansa ja jos strategiavektori on (numero, numero) tai (leijona, leijona), pelaaja 1 haluaa muuttaa strategiaansa. Pelaajat pyrkivät arvaamaan toisen pelaajan strategian ja valitsevat omansa sillä perusteella. Yllä kuvatun pelin kanssa samantyyppisiä pelejä ovat erilaiset pokeri- ja muut korttipelit, kaksinkamppailut, sukupuolten välinen taistelu jne. Pokerissa bluffaaminen silloin tällöin liittyy siihen, että vaikeutetaan vastapelaaja(ie)n kykyä arvata omat kortit. Jos pelaaja ei koskaan bluffaa, muut tietävät hänellä olevan hyvät kortit hänen nokittaessaan; toisaalta usein bluffaavan pelaajan korttien arvaaminen on myös helpompaa kuin satunnaisesti bluffaavan. Yleisesti ottaen mp :n tyyppisissä peleissä pelaajan kannattaa salata oma strategiavalintansa muilta pelaajilta mahdollisimman hyvin, kun taas sukupuolten välisessä taistelussa pelaajan kannattaa ilmaista strategiansa vastapelaajalle mahdollisimman hyvin. Esim. Mp:ssä pelaajan 1 sekastrategia on todennäköisyysjakauma (p, 1 p), 0 p 1, missä p on todennäköisyys, että 1 pelaa strategiaa numero ja 1 p on leijonan pelaamisen todennäköisyys. Sekastrategia p = 1 (1 p = 0) on tällöin puhdas strategia numero ja vastaavasti sekastrategia p = 0 (1 p = 1) vastaa puhdasta strategiaa leijona. Esim. Aiemmin tarkastelimme pelaajan valintaa pelissä, jossa hänellä oli strategiat vasen, keski, oikea. Yksi mahdollinen sekastrategia olisi tällöin todennäköisyysjakauma (q, p, 1 q p), 0 q 1, 0 p 1 ja 0 p+q 1, missä q on strategian vasen, p strategian keski ja 1 q p strategian oikea todennäköisyys. Yleisesti ottaen, tietyn pelaajan n:stä puhtaasta strategiasta voidaan muodostaa sekastrategia seuraavasti: p i on strategian i pelaamistodennäköi- 2
syys ja n i=1 p i = 1. Sekastrategioiden käytön yksi etu on se, että kaikki puhtaat strategiat saadaan yhden sekastrategian erikoistapauksina. Tarkastelu on tällöin yleisempää ja merkinnällisesti yksinkertaisempaa. Tarkastellaan sekastrategioiden käytön sallimisen vaikutusta pelin ratkaisemiseen muutaman esimerkin avulla. Esim. Tarkastellaan yllä esitettyä peliä mp pelaajan 1 näkökulmasta ja oletetaan hänen pelaavan sekastrategiaa (p, 1 p) aiemman esimerkin mukaisesti. Merkitään odotusarvo-operaattoria E:llä ja esitetään pelaajan 1 tuleman odotusarvot olettamalla, että pelaaja 2 pelaa jompaa kumpaa strategiaansa N tai L, E(jos 2 pelaa strategiaa N) = 1 p + 1 (1 p) = 1 2p, E(jos 2 pelaa strategiaa L) = 1 p 1 (1 p) = 2p 1. Asettamalla yllä olevat odotusarvot yhtäsuuriksi, saamme 1 2p = 2p 1 p = 1 2. Jos siis pelaaja 1 pelaa sekastrategiaansa todennäköisyyksillä (p, 1 p) = (1/2, 1/2), hänelle on odotusarvomielessä yhdentekevää, kumpaa strategiaa pelaaja 2 pelaa. Tällä tavalla pelaaja 1 voi suojata itsensä pelaajan 2 strategioita vastaan; sama pätee pelaajalla 2. Kummankin pelaajan kannattaa siten pelata sekastrategiaa (p, 1 p) = (1/2, 1/2), sillä kaikki muut strategiat paljastuessaan antavat vastapelaajalle mahdollisuuden hyödyntää sitä informaatiota. Saimme siis sekastrategioiden avulla ratkaistua pelin sellaiseen muotoon, josta kumpikaan pelaaja ei ole halukas poikkeamaan (pelin Nash -tasapaino). Esim. Oletetaan seuraava peli. pelaaja 2 L R pelaaja 1 T 3, 0, M 0, 3, B 1, 1, Pelaajan 2 tulemia ei ole huomioitu pelimatriisissa, koska tarkastelemme vain pelaajan 1 pelaamista. Jos sekastrategioita ei sallita, pelaajalla 1 strategia B on aidosti dominoitu yhdessä strategioiden T ja M taholta, mutta kumpikaan niistä yksin ei aidosti dominoi B:tä. Tällaisessa tilanteessa sekastrategia K, jossa pelaaja 1 pelaa strategiaa T todennäköisyydellä 1/2 ja strategiaa M todennäköisyydellä 1/2 dominoi aidosti strategiaa B odotusarvomielessä. O- soitetaan tämä seuraavasti. 3
Ajatellaan että pelaaja 1 olettaa 2:n pelaavan strategiaa L todennäköisyydellä p, 0 p 1 ja strategiaa R todennäköisyydellä (1 p). Lasketaan strategian B tuleman odotusarvo pelaajalle 1, E(B) = 1 p + 1 (1 p) = 1. Jos pelaaja 1 olettaa 2:n pelaavan strategiaa L todennäköisyydellä p, 0 p 1, sekastrategian K tuleman odotusarvo pelaajalle 1 saadaan vastaavasti E(K) = 1 2 E(T ) + 1 2 E(M) = 1 [3 p + 0 (1 p)] 2 + 1 2 [0 p + 3 (1 p)] = 3 2 p + 3 2 (1 p) = 3 2. Havaitsemme siis, että riippumatta siitä millä todennäköisyydellä pelaaja 2 pelaa omia strategioitaan, pelaajalla 1 sekastrategia K dominoi aidosti puhdasta strategiaa B odotusarvomielessä. Sekastrategioiden käytön salliminen saattaa siten auttaa pelin ratkaisemista siten, että pelistä löydetään aidosti dominoituja strategioita. Esim. Tämä esimerkki osoittaa, että jokin puhdas strategia voi olla pelaajan paras vastastrategia toisen pelaajan sekastrategialle siitä huolimatta, että ko. puhdas strategia ei ole pelaajan paras vastastrategia mitään toisen pelaajan puhdasta strategiaa vastaan. Oletetaan seuraava peli pelaaja 2 L R pelaaja 1 T 3, 0, M 0, 3, B 2, 2, ja tarkastellaan sitä pelaajan 1 näkökulmasta. Jos 2 valitsee L:n, 1:n kannattaa valita T ; jos 2 valitsee R:n, 1:n kannattaa valita M. B ei siis ole 1:n paras vastastrategia mitään 2:n puhdasta strategiaa vastaan. Oletetaan nyt 2:n pelaavan strategiaa L todennäköisyydellä q ja strategiaa R todennäköisyydellä 1 q. Pelaajan 1 tulemien odotusarvot eri strategioilla ovat tällöin E(T ) = 3 q + 0 (1 q) = 3q, E(M) = 0 q + 3 (1 q) = 3(1 q), E(B) = 2 q + 2 (1 q) = 2. Tarkistetaan vielä, millä q:n arvoilla B on pelaajan 1 paras vastastrategia yllä kuvatulle 2:n sekastrategialle. E(B) > E(T ) 2 > 3q q < 2 3 E(B) > E(M) 2 > 3(1 q) q > 1 3. 4
Puhdas strategia B on siten 1:n paras vastastrategia 2:n yllä kuvattua sekastrategiaa vastaan, jos 1/3 < q < 2/3. Yllä johdettu tulos voidaan tulkita seuraavasti: B on 1:n paras vastastrategia 2:n sekastrategiaa vastaan, jos pelaaja 1 uskoo 2:n pelaavan strategiaa L todennäköisyyksillä 1/3 < q < 2/3. Tämä esimerkki osoittaa sen, että pelaajien sekastrategiat voidaan tulkita vastapelaajien uskomuksiksi heidän puhtaiden strategioidensa pelaamistodennäköisyyksistä. Tämän tulkinnan sekastrategioille antoi Harsanyi vuonna 1973 ja se osoittaa, miten pelaajien uskomukset muiden pelaajien strategioiden pelaamistodennäköisyyksistä vaikuttavat heidän valintoihinsa. 2 Ratkaistaan sukupuolten välinen taistelu sekastrategioiden avulla Olkoon q todennäköisyys, jolla nainen pelaa strategiaa ooppera ja 1 q todennäköisyys, jolla nainen pelaa strategiaa jalkapallo. Miehen pelaamistodennäköisyydet ovat vastaavasti: ooppera r ja jalkapallo 1 r. Miehen tulemien odotusarvot ovat tällöin E( o ) = 1 q + 0 (1 q) = q, E( j ) = 0 q + 2 (1 q) = 2(1 q). Miehellä puhdas strategia o vastaa tilannetta r=1 ja se on paras vastastrategia naisen sekastrategialle, jos E( o ) > E( j ), eli q > 2(1 q) 3q > 2 q > 2 3. Jos q < 2/3, puhdas strategia j (joka vastaa tilannetta r = 0) on miehen paras vastastrategia naisen sekastrategialle. Jos q = 2/3, mikä tahansa r:n arvo 0 r 1 on miehen paras vastastrategia naisen sekastrategialle, sillä tällöin yllä olevan yhtälöryhmän mukaan miehellä pätee E( o ) = E( j ) r:stä riippumatta. Odotusarvomielessä on tällöin sama, millä todennäköisyyksillä mies strategioitaan pelaa, sillä molempien odotusarvot ovat samat, joten jokaisella niistä muodostetulla sekastrategialla on sama odotusarvo. Vastaava päättely voidaan suorittaa naisen kohdalla. Naisen puhtaiden strategioiden tulemien odotusarvot ovat E( o ) = 2 r + 0 (1 r) = 2r, E( j ) = 0 r + 1 (1 r) = 1 r. 5
Naisen paras vastastrategia miehen sekastrategialle on o (joka vastaa tilannetta q = 1), jos 2r > (1 r) 3r > 1 r > 1 3. Vastaavasti j (joka vastaa tilannetta q = 0) on naisen paras vastastrategia miehen sekastrategialle, kun r < 1/3. Jos r = 1/3, tällöin naisella pätee E( o ) = E( j ), eli on sama millä todennäköisyyksillä 0 q 1 nainen strategioitaan pelaa. Todennäköisyyksillä (q, r) = (2/3, 1/3) muodostettu sekastrategiapari on siten yksi pelin Nash -tasapaino, joka voidaan esittää pelaajien reaktiofunktioiden leikkauspisteenä. Pelaajien reaktiofunktiot koordinaatistossa (q, r) leikkaavat toisensa kolmessa pisteessä (q, r) = (0, 0), (q, r) = (1, 1) ja (q, r) = (2/3, 1/3), jotka kaikki ovat pelin Nash -tasapainoja. Nash - tasapainot (0, 0) ja (1, 1) on muodostettu puhtaista strategioista ja (2/3, 1/3) sekastrategioista. Jos mies uskoo naisen pelaavan strategiaa o todennäköisyydellä q < 2/3, miehen paras strategia on j (r = 0). Jos mies uskoo että q > 2/3, miehen paras strategia on o (r = 1). Jos nainen uskoo miehen pelaavan strategiaa o todennäköisyydellä r < 1/3, naisen paras strategia on j (q = 0). Jos nainen uskoo että r > 1/3, naisen paras strategia on o (q = 1). Siis uskomuksia (q < 2/3, r < 1/3) vastaa Nash -tasapaino ( j, j ), uskomuksia (q > 2/3, r > 1/3) vastaa Nash -tasapaino ( o, o ) ja uskomusten (q = 2/3, r = 1/3) tilanteessa, mikä tahansa strategia on yhtä hyvä. 6