SEKASTRATEGIAT PELITEORIASSA



Samankaltaiset tiedostot
PELITEORIAN PERUSTEITA

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Luento 5: Peliteoriaa

Johdanto peliteoriaan Kirja kpl. 2

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Luento 5: Peliteoriaa

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Sekastrategia ja Nash-tasapainon määrääminen

Mikrotalousteoria 2, 2008, osa IV

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Sekastrategiat ja intensiiviyhteensopivuus

Pohdiskeleva ajattelu ja tasapainotarkennukset

Luento 8. June 3, 2014

Pelien teoriaa: tasapainokäsitteet

Nollasummapelit ja bayesilaiset pelit

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Peliteoria luento 3. May 27, Peliteoria luento 3

JOHDATUSTA PELITEORIAAN

Peliteoria luento 2. May 26, Peliteoria luento 2

Epätäydellisen tiedon jatkuvat pelit

Yhteistyötä sisältämätön peliteoria jatkuu

Luento 7. June 3, 2014

Peliteoria luento 1. May 25, Peliteoria luento 1

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Tasapaino epätäydellisen tiedon peleissä

Luento 9. June 2, Luento 9

Yhteistyötä sisältämätön peliteoria

Johdatus peliteoriaan

Y56 laskuharjoitukset 6

Yleinen tietämys ja Nashin tasapaino

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Peliteoria ja huutokauppamekanismit

Evolutiivinen stabiilisuus populaation

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Signalointi: autonromujen markkinat

Tuloperiaate. Oletetaan, että eräs valintaprosessi voidaan jakaa peräkkäisiin vaiheisiin, joita on k kappaletta

Nollasummapelit ja muut yleisemmät summapelit

3. laskuharjoituskierros, vko 6, ratkaisut

Peliohje (6)

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Prof. Marko Terviö Assist. Jan Jääskeläinen

Taloustieteen Nobel peliteorian kehittäjille

Rahapelaamisen riskirajoilla. Mirka Smolej, Salla Karjalainen, Tapio Jaakkola

12 Oligopoli ja monopolistinen kilpailu

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

Kahden lausekkeen merkittyä yhtäsuuruutta sanotaan yhtälöksi.

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Johdatus go-peliin. 25. joulukuuta 2011

Strategiset valinnat. Taloustieteen perusteet Matti Sarvimäki

Paljonko maksat eurosta -peli

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Strategiset valinnat Taloustieteen perusteet Matti Sarvimäki. A. Peliteorian alkeet. Johdanto. Johdanto 15/09/19

Tenniksen pistelaskusäännöt, lukio/ammatilliset oppilaitokset

Blackjack on korttipeli, jossa pelaajan tavoitteena on voittaa pelinhoitaja.

Kahden suoran leikkauspiste ja välinen kulma (suoraparvia)

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Pelaisitko seuraavaa peliä?

HUUTOKAUPPATEORIAA TTS-Kurssille/Kultti 2012

(a) Kyllä. Jokainen lähtöjoukon alkio kuvautuu täsmälleen yhteen maalijoukon alkioon.

Matematiikan tukikurssi

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

Dynaaminen hintakilpailu ja sanattomat sopimukset

Peliteoria ja kalatalous YE4

Tilastollisia peruskäsitteitä ja Monte Carlo

Ongelmallisesti pelaavan nuoren auttaminen

Matematiikan tukikurssi, kurssikerta 2

Lyhyen aikavälin hintakilpailu 2/2

Demo 1: Simplex-menetelmä

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo Ratkaisut ja pisteytysohjeet

Markkinoiden suunnittelu ja Gale-Shapley-algoritmi

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly


Pelitehtäviä. Helpot tehtävät. Tuomas Korppi

Ratkaiseva päätöskierros

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo 10 13

1. Kuinka monella tavalla joukon kaikki alkiot voidaan järjestää jonoksi? Tähän antaa vastauksen: tuloperiaate ja permutaatio

Prof. Marko Terviö Assist. Jan Jääskeläinen

TALOUSTIETEEN LUENTOJEN TEHTÄVÄT

C2-D2 Final Four-turnaukset

Hex-pelin matematiikkaa

V ar(m n ) = V ar(x i ).

Luento 5: Peliteoria

Luku 29 Peliteoria. Käsittelemme aluksi peliteorian peruskäsitteitä ja sanastoa, sitten katsomme itse pelejä.

1 Komparatiivinen statiikka ja implisiittifunktiolause

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

x+3 = n(y 3) y +n = 3(x n). Kun ylemmästä yhtälöstä ratkaistaan x = n(y 3) 3 ja sijoitetaan alempaan, saadaan

KANSANTALOUSTIETEEN PÄÄSYKOE : Mallivastaukset

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Matemaatiikan tukikurssi

PANA RY LIIGASA A NNÖ T

( 3) ( 5) ( 7) ( 2) ( 6) ( 4) Pyramidi 3 Analyyttinen geometria tehtävien ratkaisut sivu 105 Päivitetty

KILPAILUKUTSU 22. MARJOLA BEACH VOLLEY TURNAUKSEEN LAPPEENRANTAAN ESI istumalentopallo Lappeenranta

Transkriptio:

SEKASTRATEGIAT PELITEORIASSA Matti Estola 8. joulukuuta 2013 Sisältö 1 Johdanto 2 2 Ratkaistaan sukupuolten välinen taistelu sekastrategioiden avulla 5 Teksti on suomennettu kirjasta: Gibbons: A Primer in Game Theory 1

1 Johdanto Tarkastellaan esimerkkinä sellaista peliä, jossa 2 pelaajaa päättävät asettavatko he yhden markan pöytään numero- vai leijonapuoli ylöspäin ( matching pennies eli mp). Molemmat tekevät päätöksensä toisen päätöksestä tietämättä. Jos rahat osoittautuvat olevan sama puoli ylöspäin, pelaaja 2 saa molemmat rahat. Jos rahat ovat eripäin, pelaaja 1 saa molemmat rahat. Pelimatriisi on seuraava. pelaaja 2 numero leijona pelaaja 1 numero 1, +1 +1, 1 leijona +1, 1 1, +1 Pelissä ei ole puhtailla strategioilla pelattuna Nash -tasapainoa. Jos pelattu strategiavektori on (numero, leijona) tai (leijona, numero), pelaaja 2 haluaa muuttaa strategiaansa ja jos strategiavektori on (numero, numero) tai (leijona, leijona), pelaaja 1 haluaa muuttaa strategiaansa. Pelaajat pyrkivät arvaamaan toisen pelaajan strategian ja valitsevat omansa sillä perusteella. Yllä kuvatun pelin kanssa samantyyppisiä pelejä ovat erilaiset pokeri- ja muut korttipelit, kaksinkamppailut, sukupuolten välinen taistelu jne. Pokerissa bluffaaminen silloin tällöin liittyy siihen, että vaikeutetaan vastapelaaja(ie)n kykyä arvata omat kortit. Jos pelaaja ei koskaan bluffaa, muut tietävät hänellä olevan hyvät kortit hänen nokittaessaan; toisaalta usein bluffaavan pelaajan korttien arvaaminen on myös helpompaa kuin satunnaisesti bluffaavan. Yleisesti ottaen mp :n tyyppisissä peleissä pelaajan kannattaa salata oma strategiavalintansa muilta pelaajilta mahdollisimman hyvin, kun taas sukupuolten välisessä taistelussa pelaajan kannattaa ilmaista strategiansa vastapelaajalle mahdollisimman hyvin. Esim. Mp:ssä pelaajan 1 sekastrategia on todennäköisyysjakauma (p, 1 p), 0 p 1, missä p on todennäköisyys, että 1 pelaa strategiaa numero ja 1 p on leijonan pelaamisen todennäköisyys. Sekastrategia p = 1 (1 p = 0) on tällöin puhdas strategia numero ja vastaavasti sekastrategia p = 0 (1 p = 1) vastaa puhdasta strategiaa leijona. Esim. Aiemmin tarkastelimme pelaajan valintaa pelissä, jossa hänellä oli strategiat vasen, keski, oikea. Yksi mahdollinen sekastrategia olisi tällöin todennäköisyysjakauma (q, p, 1 q p), 0 q 1, 0 p 1 ja 0 p+q 1, missä q on strategian vasen, p strategian keski ja 1 q p strategian oikea todennäköisyys. Yleisesti ottaen, tietyn pelaajan n:stä puhtaasta strategiasta voidaan muodostaa sekastrategia seuraavasti: p i on strategian i pelaamistodennäköi- 2

syys ja n i=1 p i = 1. Sekastrategioiden käytön yksi etu on se, että kaikki puhtaat strategiat saadaan yhden sekastrategian erikoistapauksina. Tarkastelu on tällöin yleisempää ja merkinnällisesti yksinkertaisempaa. Tarkastellaan sekastrategioiden käytön sallimisen vaikutusta pelin ratkaisemiseen muutaman esimerkin avulla. Esim. Tarkastellaan yllä esitettyä peliä mp pelaajan 1 näkökulmasta ja oletetaan hänen pelaavan sekastrategiaa (p, 1 p) aiemman esimerkin mukaisesti. Merkitään odotusarvo-operaattoria E:llä ja esitetään pelaajan 1 tuleman odotusarvot olettamalla, että pelaaja 2 pelaa jompaa kumpaa strategiaansa N tai L, E(jos 2 pelaa strategiaa N) = 1 p + 1 (1 p) = 1 2p, E(jos 2 pelaa strategiaa L) = 1 p 1 (1 p) = 2p 1. Asettamalla yllä olevat odotusarvot yhtäsuuriksi, saamme 1 2p = 2p 1 p = 1 2. Jos siis pelaaja 1 pelaa sekastrategiaansa todennäköisyyksillä (p, 1 p) = (1/2, 1/2), hänelle on odotusarvomielessä yhdentekevää, kumpaa strategiaa pelaaja 2 pelaa. Tällä tavalla pelaaja 1 voi suojata itsensä pelaajan 2 strategioita vastaan; sama pätee pelaajalla 2. Kummankin pelaajan kannattaa siten pelata sekastrategiaa (p, 1 p) = (1/2, 1/2), sillä kaikki muut strategiat paljastuessaan antavat vastapelaajalle mahdollisuuden hyödyntää sitä informaatiota. Saimme siis sekastrategioiden avulla ratkaistua pelin sellaiseen muotoon, josta kumpikaan pelaaja ei ole halukas poikkeamaan (pelin Nash -tasapaino). Esim. Oletetaan seuraava peli. pelaaja 2 L R pelaaja 1 T 3, 0, M 0, 3, B 1, 1, Pelaajan 2 tulemia ei ole huomioitu pelimatriisissa, koska tarkastelemme vain pelaajan 1 pelaamista. Jos sekastrategioita ei sallita, pelaajalla 1 strategia B on aidosti dominoitu yhdessä strategioiden T ja M taholta, mutta kumpikaan niistä yksin ei aidosti dominoi B:tä. Tällaisessa tilanteessa sekastrategia K, jossa pelaaja 1 pelaa strategiaa T todennäköisyydellä 1/2 ja strategiaa M todennäköisyydellä 1/2 dominoi aidosti strategiaa B odotusarvomielessä. O- soitetaan tämä seuraavasti. 3

Ajatellaan että pelaaja 1 olettaa 2:n pelaavan strategiaa L todennäköisyydellä p, 0 p 1 ja strategiaa R todennäköisyydellä (1 p). Lasketaan strategian B tuleman odotusarvo pelaajalle 1, E(B) = 1 p + 1 (1 p) = 1. Jos pelaaja 1 olettaa 2:n pelaavan strategiaa L todennäköisyydellä p, 0 p 1, sekastrategian K tuleman odotusarvo pelaajalle 1 saadaan vastaavasti E(K) = 1 2 E(T ) + 1 2 E(M) = 1 [3 p + 0 (1 p)] 2 + 1 2 [0 p + 3 (1 p)] = 3 2 p + 3 2 (1 p) = 3 2. Havaitsemme siis, että riippumatta siitä millä todennäköisyydellä pelaaja 2 pelaa omia strategioitaan, pelaajalla 1 sekastrategia K dominoi aidosti puhdasta strategiaa B odotusarvomielessä. Sekastrategioiden käytön salliminen saattaa siten auttaa pelin ratkaisemista siten, että pelistä löydetään aidosti dominoituja strategioita. Esim. Tämä esimerkki osoittaa, että jokin puhdas strategia voi olla pelaajan paras vastastrategia toisen pelaajan sekastrategialle siitä huolimatta, että ko. puhdas strategia ei ole pelaajan paras vastastrategia mitään toisen pelaajan puhdasta strategiaa vastaan. Oletetaan seuraava peli pelaaja 2 L R pelaaja 1 T 3, 0, M 0, 3, B 2, 2, ja tarkastellaan sitä pelaajan 1 näkökulmasta. Jos 2 valitsee L:n, 1:n kannattaa valita T ; jos 2 valitsee R:n, 1:n kannattaa valita M. B ei siis ole 1:n paras vastastrategia mitään 2:n puhdasta strategiaa vastaan. Oletetaan nyt 2:n pelaavan strategiaa L todennäköisyydellä q ja strategiaa R todennäköisyydellä 1 q. Pelaajan 1 tulemien odotusarvot eri strategioilla ovat tällöin E(T ) = 3 q + 0 (1 q) = 3q, E(M) = 0 q + 3 (1 q) = 3(1 q), E(B) = 2 q + 2 (1 q) = 2. Tarkistetaan vielä, millä q:n arvoilla B on pelaajan 1 paras vastastrategia yllä kuvatulle 2:n sekastrategialle. E(B) > E(T ) 2 > 3q q < 2 3 E(B) > E(M) 2 > 3(1 q) q > 1 3. 4

Puhdas strategia B on siten 1:n paras vastastrategia 2:n yllä kuvattua sekastrategiaa vastaan, jos 1/3 < q < 2/3. Yllä johdettu tulos voidaan tulkita seuraavasti: B on 1:n paras vastastrategia 2:n sekastrategiaa vastaan, jos pelaaja 1 uskoo 2:n pelaavan strategiaa L todennäköisyyksillä 1/3 < q < 2/3. Tämä esimerkki osoittaa sen, että pelaajien sekastrategiat voidaan tulkita vastapelaajien uskomuksiksi heidän puhtaiden strategioidensa pelaamistodennäköisyyksistä. Tämän tulkinnan sekastrategioille antoi Harsanyi vuonna 1973 ja se osoittaa, miten pelaajien uskomukset muiden pelaajien strategioiden pelaamistodennäköisyyksistä vaikuttavat heidän valintoihinsa. 2 Ratkaistaan sukupuolten välinen taistelu sekastrategioiden avulla Olkoon q todennäköisyys, jolla nainen pelaa strategiaa ooppera ja 1 q todennäköisyys, jolla nainen pelaa strategiaa jalkapallo. Miehen pelaamistodennäköisyydet ovat vastaavasti: ooppera r ja jalkapallo 1 r. Miehen tulemien odotusarvot ovat tällöin E( o ) = 1 q + 0 (1 q) = q, E( j ) = 0 q + 2 (1 q) = 2(1 q). Miehellä puhdas strategia o vastaa tilannetta r=1 ja se on paras vastastrategia naisen sekastrategialle, jos E( o ) > E( j ), eli q > 2(1 q) 3q > 2 q > 2 3. Jos q < 2/3, puhdas strategia j (joka vastaa tilannetta r = 0) on miehen paras vastastrategia naisen sekastrategialle. Jos q = 2/3, mikä tahansa r:n arvo 0 r 1 on miehen paras vastastrategia naisen sekastrategialle, sillä tällöin yllä olevan yhtälöryhmän mukaan miehellä pätee E( o ) = E( j ) r:stä riippumatta. Odotusarvomielessä on tällöin sama, millä todennäköisyyksillä mies strategioitaan pelaa, sillä molempien odotusarvot ovat samat, joten jokaisella niistä muodostetulla sekastrategialla on sama odotusarvo. Vastaava päättely voidaan suorittaa naisen kohdalla. Naisen puhtaiden strategioiden tulemien odotusarvot ovat E( o ) = 2 r + 0 (1 r) = 2r, E( j ) = 0 r + 1 (1 r) = 1 r. 5

Naisen paras vastastrategia miehen sekastrategialle on o (joka vastaa tilannetta q = 1), jos 2r > (1 r) 3r > 1 r > 1 3. Vastaavasti j (joka vastaa tilannetta q = 0) on naisen paras vastastrategia miehen sekastrategialle, kun r < 1/3. Jos r = 1/3, tällöin naisella pätee E( o ) = E( j ), eli on sama millä todennäköisyyksillä 0 q 1 nainen strategioitaan pelaa. Todennäköisyyksillä (q, r) = (2/3, 1/3) muodostettu sekastrategiapari on siten yksi pelin Nash -tasapaino, joka voidaan esittää pelaajien reaktiofunktioiden leikkauspisteenä. Pelaajien reaktiofunktiot koordinaatistossa (q, r) leikkaavat toisensa kolmessa pisteessä (q, r) = (0, 0), (q, r) = (1, 1) ja (q, r) = (2/3, 1/3), jotka kaikki ovat pelin Nash -tasapainoja. Nash - tasapainot (0, 0) ja (1, 1) on muodostettu puhtaista strategioista ja (2/3, 1/3) sekastrategioista. Jos mies uskoo naisen pelaavan strategiaa o todennäköisyydellä q < 2/3, miehen paras strategia on j (r = 0). Jos mies uskoo että q > 2/3, miehen paras strategia on o (r = 1). Jos nainen uskoo miehen pelaavan strategiaa o todennäköisyydellä r < 1/3, naisen paras strategia on j (q = 0). Jos nainen uskoo että r > 1/3, naisen paras strategia on o (q = 1). Siis uskomuksia (q < 2/3, r < 1/3) vastaa Nash -tasapaino ( j, j ), uskomuksia (q > 2/3, r > 1/3) vastaa Nash -tasapaino ( o, o ) ja uskomusten (q = 2/3, r = 1/3) tilanteessa, mikä tahansa strategia on yhtä hyvä. 6