PELITEORIAN PERUSTEITA



Samankaltaiset tiedostot
SEKASTRATEGIAT PELITEORIASSA

Luento 5: Peliteoriaa

Pelien teoriaa: tasapainokäsitteet

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Peliteoria luento 3. May 27, Peliteoria luento 3

Johdanto peliteoriaan Kirja kpl. 2

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Luento 5: Peliteoriaa

Peliteoria luento 2. May 26, Peliteoria luento 2

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Mikrotalousteoria 2, 2008, osa IV

Nollasummapelit ja bayesilaiset pelit

Yhteistyötä sisältämätön peliteoria

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Sekastrategia ja Nash-tasapainon määrääminen

Yhteistyötä sisältämätön peliteoria jatkuu

Pohdiskeleva ajattelu ja tasapainotarkennukset

Luento 8. June 3, 2014

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

JOHDATUSTA PELITEORIAAN

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Y56 laskuharjoitukset 6

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Luento 9. June 2, Luento 9

Sekastrategiat ja intensiiviyhteensopivuus

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

Tasapaino epätäydellisen tiedon peleissä

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

1 Kannat ja kannanvaihto

Luento 5: Peliteoria

Paljonko maksat eurosta -peli

Peliteoria luento 1. May 25, Peliteoria luento 1

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Epätäydellisen tiedon jatkuvat pelit

Johdatus peliteoriaan

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Miten osoitetaan joukot samoiksi?

Johdatus lukuteoriaan Harjoitus 2 syksy 2008 Eemeli Blåsten. Ratkaisuehdotelma

Yleinen tietämys ja Nashin tasapaino

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

12 Oligopoli ja monopolistinen kilpailu

Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17)

Matematiikan tukikurssi, kurssikerta 2

Demo 1: Simplex-menetelmä

7 Vapaus. 7.1 Vapauden määritelmä

Peliteoria ja huutokauppamekanismit

Luento 7. June 3, 2014

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin Yliopisto Harjoitus 1, ratkaisuehdotukset

Lineaarialgebra ja matriisilaskenta I, HY Kurssikoe Ratkaisuehdotus. 1. (35 pistettä)

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Kaikki kurssin laskuharjoitukset pidetään Exactumin salissa C123. Malliratkaisut tulevat nettiin kurssisivulle.

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

2.1. Tehtävänä on osoittaa induktiolla, että kaikille n N pätee n = 1 n(n + 1). (1)

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

= 5! 2 2!3! = = 10. Edelleen tästä joukosta voidaan valita kolme särmää yhteensä = 10! 3 3!7! = = 120

Numeeriset menetelmät

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

x+3 = n(y 3) y +n = 3(x n). Kun ylemmästä yhtälöstä ratkaistaan x = n(y 3) 3 ja sijoitetaan alempaan, saadaan

Koodausteoria, Kesä 2014

MS-A0004/A0006 Matriisilaskenta

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

Nollasummapelit ja muut yleisemmät summapelit

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2

1. Esitä rekursiivinen määritelmä lukujonolle

Matematiikan tukikurssi

Evolutiivisesti stabiilin strategian oppiminen

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Matematiikan tukikurssi

verkkojen G ja H välinen isomorfismi. Nyt kuvaus f on bijektio, joka säilyttää kyseisissä verkoissa esiintyvät särmät, joten pari

Lineaariset yhtälöryhmät ja matriisit

Tenttiin valmentavia harjoituksia

A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.

Todistusmenetelmiä Miksi pitää todistaa?

5 Lineaariset yhtälöryhmät

Äärellisten mallien teoria

Johdatus diskreettiin matematiikkaan Harjoitus 2, Osoita että A on hyvin määritelty. Tee tämä osoittamalla

Aloitamme yksinkertaisella leluesimerkillä. Tarkastelemme yhtä osaketta S. Oletamme että tänään, hetkellä t = 0, osakkeen hinta on S 0 = 100=C.

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Tarkastelemme ensin konkreettista esimerkkiä ja johdamme sitten yleisen säännön, joilla voidaan tietyissä tapauksissa todeta kielen ei-säännöllisyys.

Vektoreiden virittämä aliavaruus

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Käänteismatriisi 1 / 14

Vapaus. Määritelmä. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee:

Induktiota käyttäen voidaan todistaa luonnollisia lukuja koskevia väitteitä, jotka ovat muotoa. väite P(n) on totta kaikille n = 0,1,2,...

3 Suorat ja tasot. 3.1 Suora. Tässä luvussa käsitellään avaruuksien R 2 ja R 3 suoria ja tasoja vektoreiden näkökulmasta.

Matematiikan tukikurssi

TURNAUSOHJEET. Turnauksen tavoite. Ennen aloitusta. Taistelukierroksen Pelaaminen.

Pelaisitko seuraavaa peliä?

Sekalaiset tehtävät, 11. syyskuuta 2005, sivu 1 / 13. Tehtäviä

Harjoitus 6 ( )

Valitsemalla sopivat alkiot joudutaan tämän määritelmän kanssa vaikeuksiin, jotka voidaan välttää rakentamalla joukko oppi aksiomaattisesti.

keskenään isomorfiset? (Perustele!) Ratkaisu. Ovat. Tämän näkee indeksoimalla kärjet kuvan osoittamalla tavalla: a 1 b 3 a 5

Opettaminen ja oppiminen

MIKROTEORIA, HARJOITUS 8

Transkriptio:

PELITEORIAN PERUSTEITA Matti Estola 29. marraskuuta 2013 Sisältö 1 Johdanto 2 2 Peliteoreettisen analyysin vaiheet 2 3 Staattiset pelit täydellisen informaation vallitessa 3 4 Pelin ratkaiseminen 4 4.1 Aidosti dominoitujen strategioiden iteratiivinen eliminointi (adsie)................................. 4 4.2 Pelien ratkaiseminen Nash -tasapainon avulla......... 6 5 Nash -tasapainon mielekkyys 7 6 Nash -tasapainon ja adsie:n välinen yhteys 7 Teksti on suomennettu kirjasta: Gibbons, A Primer in Game Theory. 1

1 Johdanto Peliteoria on kehitetty sellaisten tilanteiden analysointiin, jossa kaksi tai useampia aktiivisia päätöksentekijöitä tekevät valiontoja siten, että eri pelaajien valinnat vaikuttavat toisten pelaajien hyvinvointiin (pelin lopputulokseen, tulemaan). Esim. Ammattiliiton ja työantajien palkkaneuvottelu, hallituspuolueiden neuvottelu hallitusohjelmasta, kartelliyritysten neuvottelu tuotantokiintiöistä jne. Peliteorian avulla voidaan myös analysoida tilanteita, joissa pelaajat eivät aidosti neuvottele asioista vaan tekevät toisistaan tietämättä valintoja, jotka vaikuttavat muiden pelaajien hyvinvointiin. Esim. Kaikki kilpailutilanteet, joukkue- ja yksilöpelit kuten shakki ja muut lautapelit, urheilukilpailut jne. Yhteistä pelitilanteille on, että pelaajilla on useita (vähintään kaksi) vaihtoehtoisia strategioita (valintoja), joilla he voivat vaikuttaa pelin lopputulokseen. Shakin pelaajalla siirrot, kartelliyrityksillä hyväksyä tai hylätä ehdotettu tuotantokiintiö jne. 2 Peliteoreettisen analyysin vaiheet Määritellään 1) pelaajat, 2) pelaajien kaikki mahdolliset strategiat sekä 3) peliolosuhteet. Peliolosuhteilla tarkoitetaan sitä, onko kyseessä staattinen vai dynaaminen peli sekä minkälaista informaatiota pelaajilla on toisten pelaajien valinnoista ja pelin tulemista omissa valintatilanteissaan (siirtovuoroissaan). Informaation laatu jaetaan yleensä kahteen kategoriaan: täydellinen ja epätäydellinen informaatio. Pelien luokittelu: Staattiset pelit; pelataan vain kerran Täyd. inform. pelit Normaalimuotoiset pelit Epätäyd. inform. pelit Bayesilaiset pelit Dynaamiset pelit; pelitilanne toistuu useita kertoja (mahdollisesti äärettömän monta) Jatkuva-aikaiset pelit Diskreettiaikaiset pelit Täyd. inf. Epätäyd. inf. Täyd. inf. Epätäyd. inf. Pelin informaation sanotaan olevan täydellistä (complete information), kun pelaajilla on tieto muiden pelaajien mahdollisista strategioista ja pelin tulemista (lopputuloksista) kaikissa mahdollisissa tilanteissa. 2

Dynaamisten pelien yhteydessä täydellisen informaation osalta voidaan edellisten lisäksi asettaa vielä seuraava vaatimus: siirtoa tekevällä pelaajalla on tieto muiden pelaajien aiemmista siirroista. Erona edelliseen pelin informaatiota nimitetään tällöin termillä (perfect information). 3 Staattiset pelit täydellisen informaation vallitessa Oletukset: 1) Jokainen pelaaja tietää muiden pelaajien kaikki mahdolliset strategiat sekä pelin lopputulokset tulemat kaikissa mahdollisissa tilanteissa; ainoastaan sitä ei tiedetä, minkä valinnan kukin pelaaja tekee peliä pelattaessa kussakin tilanteessa. 2) Pelaajat tekevät valintansa toistensa valinnoista tietämättä ja he perustavat valintansa oletuksiinsa muiden pelaajien valinnoista. Tarkastellaan esimerkkinä vangin ongelmaa (dilemma): Kaksi tietystä rikoksesta epäiltyä on pidätettynä. Poliisilla ei ole varmoja todisteita kummankaan syyllisyydestä ellei jompi kumpi tunnusta. Epäiltyjä pidetään eri selleissä siten, etteivät he voi keskustella keskenään, ja heille selitetään tilanne. Jos kumpikaan ei tunnusta, molemmat saavat yhden kuukauden tuomion (esimerkiksi luvattomasta liikkumisesta yksityisalueella). Jos molemmat tunnustavat, molemmat saavat puolen vuoden tuomion. Jos toinen tunnustaa heidän yhteisen syyllisyytensä ja toinen ei, tunnustaja välttyy tuomiolta ja toinen saa yhdeksän kuukauden tuomion: puoli vuotta rikoksesta ja kolme kuukautta poliisin työn vaikeuttamisesta. Vangin ongelma voidaan kuvata seuraavana kaksoismatriisina (kaksi numeroa jokaisessa matriisin osoitteessa) K T pelaaja 1 K 1, 1 9, 0 T 0, 9 6, 6 missä strategiat on nimetty kirjaimilla, K kiellä ja T tunnusta, ja pelin tulemat on esitetty pelimatriisissa. Pelaaja 1 pelaa riveillä ja hänen tulemansa eri tilanteissa ovat matriisin lohkojen ensimmäiset numerot, ja lohkojen toiset numerot ovat pelaajan 2 tulemat (pelaa sarakkeilla). Mitä suurempi numero on, sitä korkeampaa hyödyn tasoa se kuvaa (tässä tapauksessa tuomion pituutta kuukausina). Pelaajat pelaavat toistensa ratkaisuista tietämättä ja molemmilla on kaksi strategiaa. 3

Määritelmä: Normaalimuotoinen peli koostuu n:n pelaajan (n 2) strategiajoukoista S 1,..., S n ja pelaajien tulemajoukoista u 1,..., u n, missä S i = { s i1,..., s ik } on pelaajan i kaikkien mahdollisten strategioiden joukko (k kpl) ja u i = { u i1,..., u ip } on pelaajan i kaikkien mahdollisten tulemien joukko (p kpl, missä p riippuu muiden pelaajien strategioiden lukumääristä). Normaalimuotoisessa pelissä oletetaan lisäksi, että 1) kaikki pelaajat tietävät muut pelaajat ja heidän mahdolliset strategiansa, 2) kaikki pelaajat tietävät kaikkien pelaajien mahdolliset pelin tulemat, 3) jokainen pelaaja tekee valintansa toisten valinnoista tietämättä ja 4) pelin lopputulos määräytyy pelaajien valintojen perusteella yksikäsitteisesti. Normaalimuotoinen peli voidaan kuvata seuraavana mahdollisten strategioiden ja tulemien joukkona missä G viittaa peliin (game). G = { S 1, S 2,..., S n ; u 1, u 2,..., u n }, (1) 4 Pelin ratkaiseminen 4.1 Aidosti dominoitujen strategioiden iteratiivinen eliminointi (adsie) Tarkastellaan edellä esitettyä vangin ongelmaa. Oletetaan vangin 1 pelaavan K:ta. Vertaamalla ylärivin tulemia vangin 2 kannattaa pelata strategiaa T. Jos 1 pelaa T :tä, vertaamalla kahta alarivin tulemaa havaitaan, että 2:n kannattaa pelata T :tä. Vangin 2 kannattaa siis aina pelata T :tä. Koska peli on symmetrinen, sama pätee myös vangille 1. Strategia T dominoi siten aidosti strategiaa K molemmilla pelaajilla. Määritelmä: Olkoon peli normaalimuotoinen ja muotoa (1). Kahdesta pelaajan i strategiasta s ij, s ik S i, s ij dominoi aidosti s ik :ta, jos u i (s ij ) > u i (s ik ) kaikilla muiden pelaajien mahdollisilla strategioilla S 1,..., S i 1, S i+1,..., S n. Määritelmä: Rationaalinen pelaaja ei koskaan pelaa sellaista strategiaa, jota jokin toinen strategia aidosti dominoi. Vangin ongelmassa rationaalinen pelaaja pelaa siis strategiaa T, sillä se dominoi aidosti K:ta. Jos pelaajat ovat rationaalisia ja lisäksi tietävät toistensa olevan rationaalisia, tällä perusteella voimme ennustaa pelin ratkaisuksi strategiavektoria (T, T ), missä vektorin ensimmäinen alkio on pelaajan 1 strategia. Pelin tulema on tällöin vektori (u 1, u 2 ) = ( 6, 6). 4

Tarkastellaan seuraavaksi, voidaanko pelaajien rationaalisuusoletuksen perusteella ratkaista muitakin pelitilanteita kuin yllä kuvattu. Olkoon meillä peli vasen keski oikea pelaaja 1 ylös 1, 0 1, 2 0, 1 alas 0, 3 0, 1 2, 0 Pelaajalla 1 on kaksi strategiaa ja pelaajalla 2 kolme. Pelaajalla 1 kumpikaan strategia ei aidosti dominoi toista; sen sijaan 2:lla keski dominoi aidosti strategiaa oikea. Jos 2 on rationaalinen, hän ei koskaan pelaa strategiaa oikea. Jos 1 tietää 2:n olevan rationaalinen, 1 voi eliminoida 2:lta strategian oikea. Tällöin pelimatriisi supistuu muotoon vasen keski pelaaja 1 ylös 1, 0 1, 2 alas 0, 3 0, 1 Nyt pelaajalla 1 strategia ylös dominoi aidosti strategiaa alas. Jos pelaaja 2 tietää pelaajan 1 olevan rationaalinen (ja tietää lisäksi pelaajan 1 tietävän itsensä olevan rationaalinen), 2 voi eliminoida 1:ltä strategian alas. Tällöin pelimatriisi tulee muotoon vasen keski pelaaja 1 ylös 1, 0 1, 2 Nyt pelaajalla 2 keski dominoi aidosti strategiaa vasen, joten 1 voi tietämällä, että 2 on rationaalinen, 2:n tietävän 1:n olevan rationaalinen ja 1:n tietävän 2:n tietävän 1:n olevan rationaalinen eliminoida 2:lta strategian vasen. Pelin ratkaisuksi saadaan siten strategiavektori (ylös, keski) ja pelin tulemaksi tulee vektori (1, 2). Adsie perustuu pelaajien rationaalisuusoletukseen sekä täydelliseen informaatioon. Näissä oletuksissa on 2 heikkoutta: 1) jokainen iteraatioaskel vaatii lisäoletuksen muiden pelaajien informaatiosta. Jos tätä informaatiooletusten kasaantumista halutaan välttää, voidaan olettaa olevan yleisesti tunnettua, että pelin pelaajat ovat rationaalisia. 2) Toinen heikkous Adsie:ssa on, että sen tuottama ratkaisu on usein karkeata luokkaa. 5

Esim. Olkoon meillä seuraava peli L C R pelaaja 1 T 0, 4 4, 0 5, 3 M 4, 0 0, 4 5, 3 B 3, 5 3, 5 6, 6 Tässä pelissä ei ole aidosti dominoituja strategioita jotka voitaisiin eliminoida, joten Adsie:lla ei saada peliä ratkaistua. Seuraavaksi esittelemme pelin Nash -tasapaino käsitteen, jonka avulla y.o. peli saadaan ratkaistua. Nash -tasapaino pelin ratkaisuperiaatteena on yleisempi kuin adsie. Näin siksi, että jos pelin ratkaisu etsitään Nash -tasapainon avulla on se myös aina adsie -periaatteen mukainen ratkaisu. Sen sijaan päinvastainen väite ei päde. 4.2 Pelien ratkaiseminen Nash -tasapainon avulla Määritelmä: Srategiavektori (s 1,..., s n ) on n:n pelaajan normaalimuotoisen pelin G = { S 1,..., S n ; u 1,..., u n } Nash -tasapaino, jos jokaisella pelaajalla i, i = 1,..., n, s i on hänen paras vastastrategiansa peliteorian määrittämille muiden pelaajien kyseisen tilanteen strategioille, (s 1,..., s i 1, s i+1,..., s n ). Toisin sanoen u i (s 1,..., s i,..., s n ) u i (s 1,..., s i,..., s n ) missä s i on pelaajan i mikä tahansa muu strategia kuin s i. Tällöin s i voidaan myös ilmaista seuraavan optimointiongelman ratkaisuna max u i (s 1,..., s i 1, s i, s i+1,..., s n ); s i S i kyseessä on siis pelaajan i tuleman maksimointi oletuksella, että muut pelaajat pelaavat peliteorian tarjoaman ratkaisun mukaista strategiaa. Koska yllä oleva ehto pätee jokaiselle pelaajalle i = 1,..., n, jokainen pelaaja pelaa Nash -tasapainotilanteessa parasta vastastrategiaansa muiden pelaajien peliteorian mukaista strategiaa vastaan. Nash -tasapainotilanteessa kukaan pelaajista ei ole halukas muuttamaan strategiaansa, mistä nimitys tasapaino seuraa. 6

5 Nash -tasapainon mielekkyys Oletetaan, että peliteoria tarjoaa normaalimuotoisen pelin ratkaisuksi strategiavektoria (s 1,..., s n ). Jos tämä ei ole Nash -tasapaino, on olemassa pelaaja i, 1 i n siten, että s i ei ole hänen paras vastastrategiansa tilanteessa (s 1,..., s i 1, s i+1,..., s n ). Ts. löytyy strategia s i siten, että u i (s 1,..., s i 1, s i, s i+1,..., s n ) > u i (s 1,..., s i 1, s i, s i+1,..., s n ). Jos siis peliteoria tarjoaa jotakin strategiavektoria pelin ratkaisuksi siten, että ratkaisu ei ole Nash -tasapaino, ainakin yhdellä pelaajalla (yllä pelaaja i) on halu poiketa peliteorian esittämästä ratkaisusta. Tällaisessa tilanteessa pelin pelaaminen käytännössä osoittaa teorian ehdottaman ratkaisun virheelliseksi. Nash -tasapainon voidaan ajatella toteutuvan joko pelaajien riittävän pitkän pelitilanteen mietiskelyn kautta, tai pelitilanteen toistuessa käytännössä riittävän monta kertaa siten, että pelaajat pyrkivät pelitilanteissa parantamaan aiempaa tulemaansa. Käytännössä pelitilanteita ratkaistaan usein simuloimalla pelitilannetta numeerisesti siten, että rakennetaan pelaajille jokin parannusalgoritmi ja pelataan peliä useita kertoja tarkastellen konvergoituuko peli johonkin tiettyyn ratkaisuun. Ratkaistaan muutamia pelitilanteita Nash -tasapainon avulla. Kömpelöin ratkaisutapa on käydä läpi jokainen mahdollinen strategiayhdistelmä jokaisella pelaajalla ja tutkia, ovatko ne Nash -tasapainoja. Kahden pelaajan tilanteessa tämä tehdään seuraavasti: määritellään toisen pelaajan paras vastastrategia jokaiselle tarkasteltavan pelaajan strategialle. Kun löydetään strategiapari, jossa molemmat ovat pelaajien parhaat vastastrategiat toisilleen, kyseessä on Nash -tasapaino. Ratkaistaan edellä esitelty peli Nash -tasapainon avulla (luennolla). L C R pelaaja 1 T 0, 4 4, 0 5, 3 M 4, 0 0, 4 5, 3 B 3, 5 3, 5 6, 6 Harj. Ratkaise Vangin ongelma sekä edellä esitelty peli Nash -tasapainon avulla. 6 Nash -tasapainon ja adsie:n välinen yhteys Toistaiseksi käsitellyissä peleissä on ollut vain yksi Nash -tasapaino. Edellä käsitellyissä peleissä Nash -tasapainot (T, T ) ja (ylös,keski) ovat ainoat 7

strategiaparit jotka jäävät jäljelle, kun aidosti dominoidut strategiat eliminoidaan iteratiivisesti. Tämä tulos voidaan yleistää: Jos n:n pelaajan normaalimuotoisessa pelissä adsie tuottaa ratkaisuksi vain yhden strategiavektorin, on se myös Nash -tasapaino. Edellä havaitsimme, että pelillä saattaa olla Nash -tasapaino, jota adsie:lla ei löydetä. Adsie jättää jäljelle pelin Nash -tasapainot ja mahdollisesti myös muita strategiavektoreita. Nash -tasapaino on siten vahvempi pelin ratkaisuperiaate kuin adsie. Nash -tasapainon avulla voidaan ratkaista jokainen peli joka voidaan ratkaista adsie:llakin siten, että ratkaisut ovat samat. Tämän lisäksi Nash:illa saadaan ratkaistua myös sellaisia pelejä, joita adsie:lla ei voida ratkaista. John Nash osoitti (Equilibrium Points in n -Person Games, 1950), että jokaisessa äärellisessä pelissä (pelaajien lukumäärä ja strategiajoukot äärellisiä) on vähintään yksi Nash -tasapaino. Nash -tasapaino voi tosin vaatia sekastrategioiden (mixed strategies) käyttöä, eli että pelaaja pelaa puhtaita strategioitaan jonkin todennäköisyysjakauman mukaisesti. Esim. Vanki pelaa strategioitaan seuraavasti: T todennäköisyydellä p ja K todennäköisyydellä 1 p, missä 0 p 1. Käytännössä voidaan ajatella, että hänellä on esimerkiksi kymmenen kortin pakka, joissa 3:ssa lukee T ja seitsemässä K, ja hän nostaa kortin sekoitetusta pakasta ja pelaa sen mukaisesti. Erisuuri korttipakka ja toinen korttien suhdeluku tuottaa toisen todennäköisyysjakauman. Esim. Sukupuolten välinen taistelu. Mies ja nainen yrittävät sopia illanvietosta. Heidän on valittava oopperan ja jalkapallo-ottelun välillä. Molemmat haluavat mielummin viettää illan toistensa seurassa kuin yksinään, mutta nainen preferoi oopperaa ja mies jalkapalloa. Oletetaan pelimatriisi seuraavaksi mies ooppera jalkapallo nainen ooppera 2, 1 0, 0 jalkapallo 0, 0 1, 2 Pelin tulemat ovat joko mielihyvätasoja tai rahamääräisiä suureita. Jälkimmäisessä tapauksessa voidaan ajatella, että tulemat ilmaisevat minkä arvoisina pelaajat pitävät kutakin tilannetta. Jos siis nainen menee yksin oopperaan tai jalkapallo-otteluun, hän pitää tilannetta nollan arvoisena, samoin mies. Jos peliteoria tarjoaa pelin ratkaisuksi yksikäsitteistä strategiavektoria, on se aina Nash -tasapaino. Tässä pelissä on kuitenkin kaksi Nash -tasapainoa; (ooppera, ooppera) ja (jalkapallo, jalkapallo). Tällaisessa tilanteessa peliteoria ei kykene ennustamaan pelin ratkaisua. Myöhemmin osoitamme lisäksi, että sekastrategioiden käyttö tuo peliin myös kolmannen Nash -tasapainon. Tällöin tarkastelemme myös pelin ratkaisemista tilanteessa, jossa pelaajilla on 8

informaatiota toistensa pelaaman sekastrategian todennäköisyysjakaumasta. 9