Luento 7. June 3, 2014



Samankaltaiset tiedostot
Sekastrategia ja Nash-tasapainon määrääminen

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Luento 6. June 1, Luento 6

Luento 5: Peliteoriaa

Peliteoria luento 1. May 25, Peliteoria luento 1

SEKASTRATEGIAT PELITEORIASSA

Luento 8. June 3, 2014

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Epätäydellisen tiedon jatkuvat pelit

Pelien teoriaa: tasapainokäsitteet

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Sekastrategiat ja intensiiviyhteensopivuus

Johdanto peliteoriaan Kirja kpl. 2

Luento 9. June 2, Luento 9

Yhteistyötä sisältämätön peliteoria jatkuu

Peliteoria luento 2. May 26, Peliteoria luento 2

Evolutiivinen stabiilisuus populaation

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Yhteistyötä sisältämätön peliteoria

Yleinen tietämys ja Nashin tasapaino

Peliteoria luento 3. May 27, Peliteoria luento 3

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Luento 5: Peliteoriaa

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Äärellisten mallien teoria

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Pohdiskeleva ajattelu ja tasapainotarkennukset

Y56 laskuharjoitukset 6

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

HUUTOKAUPPATEORIAA TTS-Kurssille/Kultti 2012

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto

Tasapaino epätäydellisen tiedon peleissä

Johdatus peliteoriaan

Prof. Marko Terviö Assist. Jan Jääskeläinen

JOHDATUSTA PELITEORIAAN

Hintakilpailu lyhyellä aikavälillä

Nollasummapelit ja bayesilaiset pelit

PELITEORIAN PERUSTEITA

Algoritmit 1. Luento 13 Ti Timo Männikkö

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopiston 31C00100 Syksy 2015 Assist. Salla Simola kauppakorkeakoulu

Paljonko maksat eurosta -peli

Task list Submit code Submissions Messages Scoreboard View queue Edit contest

YSILUOKKA. Tasa-arvo yhteiskunnassa ja työelämässä

Peliteoria ja huutokauppamekanismit

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Pelit matematiikan opetuksessa

TALOUSTIETEEN LUENTOJEN TEHTÄVÄT

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

Mikrotalousteoria 2, 2008, osa IV

Dynaaminen hintakilpailu ja sanattomat sopimukset

Geneettiset algoritmit

Mohrin-Mascheronin lause kolmiulotteisessa harppi-viivaingeometriassa

Banana Split -peli. Toinen kierros Hyvin todennäköisesti ryhmien yhteenlaskettu rahasumma on suurempi kuin 30 senttiä. Ryhmien

Sopimusteoria: Salanie luku 3.2

Evolutiivisesti stabiilin strategian oppiminen

MINI- JA MIDITENNISKIERTUE

Äärellisten mallien teoria

Luento 3: Bayesiläiset pelit

Helsingin seitsemäsluokkalaisten matematiikkakilpailu Ratkaisuita

797 E. matematiikka. Martti Heinonen Markus Luoma Leena Mannila Kati Rautakorpi-Salmio Timo Tapiainen Tommi Tikka Timo Urpiola

Luku 29 Peliteoria. Käsittelemme aluksi peliteorian peruskäsitteitä ja sanastoa, sitten katsomme itse pelejä.

Signalointi: autonromujen markkinat

Matematiikan olympiavalmennus

PIKAPELI PIKA-MONOPOLY

Probabilistiset mallit (osa 1) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 1 Jorma Merikoski Tampereen yliopisto

1.1 Funktion määritelmä

Ongelma 1: Mistä joihinkin tehtäviin liittyvä epädeterminismi syntyy?

Ensimmäinen induktioperiaate

SM-turnaukset /5

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Luento 4: Ekstensiiviset pelit, horisontaalinen yhteistyö & vertikaaliset rajoitteet

LUKU II HOMOLOGIA-ALGEBRAA. 1. Joukko-oppia

Johdatus go-peliin. 25. joulukuuta 2011

Ensimmäinen induktioperiaate

2019/2020 MIEHET 1-DIVISIOONA

Ongelma 1: Mistä joihinkin tehtäviin liittyvä epädeterminismi syntyy?

Markkinainstituutio ja markkinoiden toiminta. TTT/Kultti

Muumion kirous. Pelisuunnitteludokumentti. Veikkauksen pelisuunnittelukilpailua (Peliskaba2015) varten

Mobiilileikkipaikka!

Viittomakielen tulkkien palkka- ja muut työsuhteen ehdot

Nollasummapelit ja muut yleisemmät summapelit

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo.

x+3 = n(y 3) y +n = 3(x n). Kun ylemmästä yhtälöstä ratkaistaan x = n(y 3) 3 ja sijoitetaan alempaan, saadaan

4. www-harjoitusten mallivastaukset 2017

Panoskysyntä. Luku 26. Marita Laukkanen. November 15, Marita Laukkanen Panoskysyntä November 15, / 18

Helsingin, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo 10 13

Kuvio 1 Tasapaino (Equilibrium) on suljettujen ja avointen tietorakenteiden dynaaminen suhde

Mediakyselyn tulokset

CHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi

2-6 PELAAJAA. PELIN TAVOITE Tavoitteena on jäädä pelin viimeiseksi pelaajaksi, kun kaikki muut ovat menneet konkurssiin.

Taustaa GrIFK kyky- ja taitokoulutoiminnalle!

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

ALHAMBRA. Muuri Seralji Puutarha Holvikäytävä Paviljonki Asuinrakennus Torni Rakennuksen nimi Hinta

Taloustieteen Nobel peliteorian kehittäjille

Onko kuvaukset injektioita? Ovatko ne surjektioita? Bijektioita?

Transkriptio:

June 3, 2014

Peli, jossa on kaksi Nash-tasapainoa. Yksi tasapaino on (1; 2) ja toinen (2; 1); P1:n valinta on ilmoitettu ensin. Ensimmäinen tasapaino ei vaikuta hyvältä; se perustuu epäuskottavaan uhkaukseen.

P1:n strategiajoukko on S 1 = {(A,E),(A,F ),(B,E),(B,F )} ja P2:n strategiajoukko S 2 = {C,D}. Tasapainoja ovat ((A,F );D), ((B,F );C) ja ((B,E);C).

Pelipuusta saattaa olla vaikea löytää tasapainoja. Hyödyllinen apuväline normaalimuodon peli, joka on rakennettu ekstensiivisen muodon pelin strategioista (ja hyödyistä). C D AE 1, 2 3, 1 AF 0, 0 3, 1 BE 2, 0 2, 0 BF 2, 0 2, 0 Niin sanottu redusoitu normaalimuodon peli on C D AE 1, 2 3, 1 AF 0, 0 3, 1 B 2, 0 2, 0

Esimerkkien perusteella on käynyt selväksi, että Nash-tasapainon määritelmä sallii joskus epäuskottavan tuntuiset tasapainot. Tästä syystä kavennamme uskottavien tasapainojen määrää vaatimalla niiltä lisäominaisuuksia. Vaadimme, että jokaisessa osapelissä tasapainon täytyy määrätä pelaajille optimaalinen käyttäytyminen. Tällaista tasapainoa sanotaan osapelitäydelliseksi. Joskus vaatimuksella on voimaa joskus ei, mutta silloin kun sen avulla voidaan sulkea pois muita tasapainoja näin myös menetellään.

Denition Olkoon h historia joka ei ole terminaalinen ekstensiivisen muodon pelissäγ = N,H,P,(u i ). Se indusoi ekstensiivisen muodon pelin Γ(h) = N,H(h),P(h),(u i (h)), missä h H(h) jos ja vain jos (h,h ) H, P(h)(h ) = P((h,h )) ja u i (h)(h ) = u i ((h,h )). Γ(h):ta sanotaan historian h indusoimaksi osapeliksi. Sanallisesti osapeli on se osa alkuperäistä peliä, jota pelaajat pelaavat tietyn historian jälkeen. Kaikki edellä tapahtunut on siis tietyssä mielessä unohdettu.

Tarkastellaan pelaajan i strategiaa s i ja historiaa h. Strategia s i indusoi strategian osapeliin Γ(h) ja tätä merkitään s i h. Denition Ekstensiivisen muodon pelissä Γ = N,H,P,(u i ) strategiaproili s on osapelitäydellinen Nash-tasapaino, jos jokaiselle pelaajalle i N ja jokaiselle ei-terminaaliselle historialle, jolle P(h) = i, pätee u i ( s i h,s i h ) ui ( si,s i h ) kaikille strategioille si osapelissä Γ(h). Osapelitäydellinen Nash-tasapaino on siis sellainen, että kunkin pelaaja alkuperäisestä strategiaansa seuraamalla pelaa kussakin osapelissä Nash-tasapainoa.

Äärellisissä peleissä osapelitäydellinen Nash-tasapaino voidan löytää takaperoisella induktiolla. Induktio tapahtuu osapelien pituuden suhteen, missä pelin pituus on sen pisin historia. Ensin etsitään ykkösen pituiset osapelit ja niiden Nash-tasapainot, sitten kakkosen pituiset pelit ja niiden Nash-tasapainot ehdolla, että ykkösen pituisten pelien tasapainot on kiinnitetty, jne. Jos jollain pelaajalla on useampi kuin yksi optimaalinen valinta jossain osapelissä tarkastellaan näistä kutakin erikseen; näin löydetään useita osapelitäydellisiä tasapainoja. Luento 6:n toisessa pelissä on kaksi osapelitäydellistä tasapainoa puhtaissa strategioissa (d, m, u, m; d, d) ja (u,m,d,m;m,d).

Theorem Takaperoisella induktiolla löydetään kaikki äärellisten ekstensiivisen muodon pelien osapelitäydelliset tasapainot puhtaissa strategioissa. Corollary Äärellisissä ekstensiivisen muodon peleissä on olemassa osapelitäydellinen tasapaino.

Emme ole käsitelleet sekastrategioita laisinkaan. Nämä hoituvat periaatteessa seuraavalla tuloksella. Theorem (Kuhn 1953) Jokaista sekastrategiaa äärellisessä ekstensiivisen muodon pelissä vastaa niin sanottu käyttäytymisstrategia, jossa pelaajat sekoittavat kussakin päätössolmussaan ja vastaavasti jokaista käyttäytymisstrategiaa vastaa sekastrategia.

Tarkastellaan tilannetta, jossa monopolilla on neljä uusinta mallia olevaa älypuhelinta myynnissä. Potentiaalisia ostajia on neljä ja periodeja, jolloin puhelimia voidaan myydä on kaksi. Kaksi ostajista arvostaa puhelimia niin, että ensimmmäisen periodin käytöstä he ovat valmiit maksamaan 1200 ja toisen periodin käytöstä 500. Toiset kaksi ostajaa arvosta puhelimia analogisesti 500 ja 200. Edellisten kokonaisarvostus on siis 1700 ja jälkimmäisten 700, jos he saavat puhelimet heti ensimmäisellä periodilla. Monopoli valitsee hinnan p 1 ensimmäiselle periodille ja hinnan p 2 toiselle periodille.

Tätä tilannetta ei ole hyödyllistä mallittaa ekstensiivisen muodon pelinä, vaikka sekin olisi mahdollista. Valitsemalla hinnan 700 monopoli myy kaikki puhelimet ensimmäisellä periodilla ja ansaitsee 2800. Jos vähintään yksi korkean arvostuksen ostaja ostaa puhelimen ensimmäisellä periodilla toisen periodin hinta on väistämättä 200. Näin korkean arvostuksen ostajat tietävät, että he voivat kokea hyödyn 500 200 = 300 odottamalla toiseen periodiin. Siispä monopoli pyytää ensimmäisellä periodilla hinnan 1400. Tällöin monopoli ansaitsee 2800 + 400 = 3200. Monopoli voi ansaita vieläkin enemmän, jos se julistaa hintatakuun 'Jos sama tuote löytyy halvemmalla maksan erotuksen'.

Tässä on esitetty vain monopolin päätökset ja ostajien yhteishyöty.