June 3, 2014
Peli, jossa on kaksi Nash-tasapainoa. Yksi tasapaino on (1; 2) ja toinen (2; 1); P1:n valinta on ilmoitettu ensin. Ensimmäinen tasapaino ei vaikuta hyvältä; se perustuu epäuskottavaan uhkaukseen.
P1:n strategiajoukko on S 1 = {(A,E),(A,F ),(B,E),(B,F )} ja P2:n strategiajoukko S 2 = {C,D}. Tasapainoja ovat ((A,F );D), ((B,F );C) ja ((B,E);C).
Pelipuusta saattaa olla vaikea löytää tasapainoja. Hyödyllinen apuväline normaalimuodon peli, joka on rakennettu ekstensiivisen muodon pelin strategioista (ja hyödyistä). C D AE 1, 2 3, 1 AF 0, 0 3, 1 BE 2, 0 2, 0 BF 2, 0 2, 0 Niin sanottu redusoitu normaalimuodon peli on C D AE 1, 2 3, 1 AF 0, 0 3, 1 B 2, 0 2, 0
Esimerkkien perusteella on käynyt selväksi, että Nash-tasapainon määritelmä sallii joskus epäuskottavan tuntuiset tasapainot. Tästä syystä kavennamme uskottavien tasapainojen määrää vaatimalla niiltä lisäominaisuuksia. Vaadimme, että jokaisessa osapelissä tasapainon täytyy määrätä pelaajille optimaalinen käyttäytyminen. Tällaista tasapainoa sanotaan osapelitäydelliseksi. Joskus vaatimuksella on voimaa joskus ei, mutta silloin kun sen avulla voidaan sulkea pois muita tasapainoja näin myös menetellään.
Denition Olkoon h historia joka ei ole terminaalinen ekstensiivisen muodon pelissäγ = N,H,P,(u i ). Se indusoi ekstensiivisen muodon pelin Γ(h) = N,H(h),P(h),(u i (h)), missä h H(h) jos ja vain jos (h,h ) H, P(h)(h ) = P((h,h )) ja u i (h)(h ) = u i ((h,h )). Γ(h):ta sanotaan historian h indusoimaksi osapeliksi. Sanallisesti osapeli on se osa alkuperäistä peliä, jota pelaajat pelaavat tietyn historian jälkeen. Kaikki edellä tapahtunut on siis tietyssä mielessä unohdettu.
Tarkastellaan pelaajan i strategiaa s i ja historiaa h. Strategia s i indusoi strategian osapeliin Γ(h) ja tätä merkitään s i h. Denition Ekstensiivisen muodon pelissä Γ = N,H,P,(u i ) strategiaproili s on osapelitäydellinen Nash-tasapaino, jos jokaiselle pelaajalle i N ja jokaiselle ei-terminaaliselle historialle, jolle P(h) = i, pätee u i ( s i h,s i h ) ui ( si,s i h ) kaikille strategioille si osapelissä Γ(h). Osapelitäydellinen Nash-tasapaino on siis sellainen, että kunkin pelaaja alkuperäisestä strategiaansa seuraamalla pelaa kussakin osapelissä Nash-tasapainoa.
Äärellisissä peleissä osapelitäydellinen Nash-tasapaino voidan löytää takaperoisella induktiolla. Induktio tapahtuu osapelien pituuden suhteen, missä pelin pituus on sen pisin historia. Ensin etsitään ykkösen pituiset osapelit ja niiden Nash-tasapainot, sitten kakkosen pituiset pelit ja niiden Nash-tasapainot ehdolla, että ykkösen pituisten pelien tasapainot on kiinnitetty, jne. Jos jollain pelaajalla on useampi kuin yksi optimaalinen valinta jossain osapelissä tarkastellaan näistä kutakin erikseen; näin löydetään useita osapelitäydellisiä tasapainoja. Luento 6:n toisessa pelissä on kaksi osapelitäydellistä tasapainoa puhtaissa strategioissa (d, m, u, m; d, d) ja (u,m,d,m;m,d).
Theorem Takaperoisella induktiolla löydetään kaikki äärellisten ekstensiivisen muodon pelien osapelitäydelliset tasapainot puhtaissa strategioissa. Corollary Äärellisissä ekstensiivisen muodon peleissä on olemassa osapelitäydellinen tasapaino.
Emme ole käsitelleet sekastrategioita laisinkaan. Nämä hoituvat periaatteessa seuraavalla tuloksella. Theorem (Kuhn 1953) Jokaista sekastrategiaa äärellisessä ekstensiivisen muodon pelissä vastaa niin sanottu käyttäytymisstrategia, jossa pelaajat sekoittavat kussakin päätössolmussaan ja vastaavasti jokaista käyttäytymisstrategiaa vastaa sekastrategia.
Tarkastellaan tilannetta, jossa monopolilla on neljä uusinta mallia olevaa älypuhelinta myynnissä. Potentiaalisia ostajia on neljä ja periodeja, jolloin puhelimia voidaan myydä on kaksi. Kaksi ostajista arvostaa puhelimia niin, että ensimmmäisen periodin käytöstä he ovat valmiit maksamaan 1200 ja toisen periodin käytöstä 500. Toiset kaksi ostajaa arvosta puhelimia analogisesti 500 ja 200. Edellisten kokonaisarvostus on siis 1700 ja jälkimmäisten 700, jos he saavat puhelimet heti ensimmäisellä periodilla. Monopoli valitsee hinnan p 1 ensimmäiselle periodille ja hinnan p 2 toiselle periodille.
Tätä tilannetta ei ole hyödyllistä mallittaa ekstensiivisen muodon pelinä, vaikka sekin olisi mahdollista. Valitsemalla hinnan 700 monopoli myy kaikki puhelimet ensimmäisellä periodilla ja ansaitsee 2800. Jos vähintään yksi korkean arvostuksen ostaja ostaa puhelimen ensimmäisellä periodilla toisen periodin hinta on väistämättä 200. Näin korkean arvostuksen ostajat tietävät, että he voivat kokea hyödyn 500 200 = 300 odottamalla toiseen periodiin. Siispä monopoli pyytää ensimmäisellä periodilla hinnan 1400. Tällöin monopoli ansaitsee 2800 + 400 = 3200. Monopoli voi ansaita vieläkin enemmän, jos se julistaa hintatakuun 'Jos sama tuote löytyy halvemmalla maksan erotuksen'.
Tässä on esitetty vain monopolin päätökset ja ostajien yhteishyöty.