Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari



Samankaltaiset tiedostot
Epätäydellisen tiedon jatkuvat pelit

SEKASTRATEGIAT PELITEORIASSA

Johdanto peliteoriaan Kirja kpl. 2

Luento 5: Peliteoriaa

Luento 7. June 3, 2014

Nollasummapelit ja bayesilaiset pelit

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Sekastrategiat ja intensiiviyhteensopivuus

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Luento 5: Peliteoriaa

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Sekastrategia ja Nash-tasapainon määrääminen

Peliteoria luento 1. May 25, Peliteoria luento 1

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Yleinen tietämys ja Nashin tasapaino

Luento 8. June 3, 2014

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Tasapaino epätäydellisen tiedon peleissä

Peliteoria ja huutokauppamekanismit

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Luento 6. June 1, Luento 6

Evolutiivinen stabiilisuus populaation

Yhteistyötä sisältämätön peliteoria

Yhteistyötä sisältämätön peliteoria jatkuu

PELITEORIAN PERUSTEITA

Johdatus peliteoriaan

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Pohdiskeleva ajattelu ja tasapainotarkennukset

Taloustieteen Nobel peliteorian kehittäjille

Luento 9. June 2, Luento 9

Nollasummapelit ja muut yleisemmät summapelit

Pelien teoriaa: tasapainokäsitteet

Hintakilpailu lyhyellä aikavälillä

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Peliteoria luento 2. May 26, Peliteoria luento 2

Tilastoja Tekoälykilpailun tulokset Palkintojen jako ja keskustelua. Lopputilaisuus. T Tekoälyn perusteet. Heikki Kallasjoki 28.4.

Peliteoria luento 3. May 27, Peliteoria luento 3

12 Oligopoli ja monopolistinen kilpailu

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

Luento 5: Peliteoria

Muumion kirous. Pelisuunnitteludokumentti. Veikkauksen pelisuunnittelukilpailua (Peliskaba2015) varten

JOHDATUSTA PELITEORIAAN

TALOUSTIETEEN LUENTOJEN TEHTÄVÄT

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Nashin tasapainon löytämisen laskennallinen vaativuus

Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17)

Determinoiruvuuden aksiooma

Paljonko maksat eurosta -peli

Tutkimustiedonhallinnan peruskurssi

Board Game Lab. 7 Pelimekaniikat ja -systeemit. Materiaalit CC-BY 4.0 Mikko Lampi

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Opettaminen ja oppiminen

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Pelit matematiikan opetuksessa

Geneettiset algoritmit

1 Logiikkaa. 1.1 Logiikan symbolit


JOHDATUS TEKOÄLYYN TEEMU ROOS

Strategiset valinnat Taloustieteen perusteet Matti Sarvimäki. A. Peliteorian alkeet. Johdanto. Johdanto 15/09/19

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

KUMPI OHJAA, STRATEGIA VAI BUDJETTI?

Strategiset valinnat. Taloustieteen perusteet Matti Sarvimäki

Lyhyen aikavälin hintakilpailu 2/2

Yksikönmuunnospelit Oppilaalle kopioitavat ohjeet:

Oppiminen ja oivaltaminen

Strategiset suunnittelupelit: SimCity ja Civilization

TIE Samuel Lahtinen. Lyhyt UML-opas. UML -pikaesittely

Experiment on psychophysiological responses in an economic game (valmiin työn esittely) Juulia Happonen

SÄÄNNÖT. Language: English / Suomi

Peliteoria ja kalatalous YE4

Sisällysluettelo. 1. Johdanto

Pelivaihtoehtoja. Enemmän vaihtelua peliin saa käyttämällä erikoislaattoja. Jännittävimmillään Alfapet on, kun miinusruudut ovat mukana pelissä!

Evolutiivisesti stabiilin strategian oppiminen

1. 33 Kokouksen laillisuus ja päätösvaltaisuus Pöytäkirjan tarkastajien valitseminen Työjärjestyksen hyväksyminen..

OHJEITA VALMENTAJILLE/ JOUKKUEENJOHTAJILLE TEHTÄVÄT ENNEN FBA TAPAHTUMAA - PELAAJIEN LISÄYS - JOUKKUETAPAHTUMIEN LISÄYS (VALMENTAJA)

Muodolliset kieliopit

Politiikka ja pedagogiikka: tehtäviä ja toimintahäiriöitä

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

JOHDATUS TEKOÄLYYN TEEMU ROOS

Luento 3: Bayesiläiset pelit

JOHDATUS TEKOÄLYYN TEEMU ROOS

PALLOVERKKO SÄHKÖINEN OTTELUPÖYTÄKIRJA

Sopimusteoria: Salanie luku 3.2

Pelaajat siirtävät nappuloitaan vastakkaisiin suuntiin pelilaudalla. Peli alkaa näin. Tuplauskuutio asetetaan yhtä kauas kummastakin pelaajasta.

PALLOVERKKO SÄHKÖINEN OTTELUPÖYTÄKIRJA

Kahoot - kyselytyökalu

Peliteoreettisten mallien soveltaminen toimintapeleihin

ESIPUHE... 3 SISÄLLYSLUETTELO JOHDANTO... 6

Matinteko (1 / 10) Matinteko (2 / 10) Helpointa matin tekeminen on kahdella raskaalla upseerilla (esim. kuningattarella ja tornilla).

Pääasiallisena lähteenä: Motwani, R., Raghavan, P.: Randomized algorithms. Cambridge: Cambridge University Press, 1997,

Kenguru Student (lukion 2. ja 3. vuosi) sivu 1 / 6

Asunnottomuuden ehkäisy, vapautuvat vangit ja AE-periaate teemaryhmän tapaaminen

JUUAN KUNTA KUNTASTRATEGIA

20 Kollektorivirta kun V 1 = 15V Transistorin virtavahvistus Transistorin ominaiskayrasto Toimintasuora ja -piste 10

Laskelmointia mielen evoluutiosta

Kärkipallo sijoitetaan alapisteelle, ja muut pallot sen taakse kiinni toisiinsa.

Transkriptio:

Epätäydellisen tiedon jatkuvat pelit Mika Viljanen Peliteorian seminaari

Erityispiirteitä

Erityispiirteitä Epätäydellinen tieto aiemmista toiminnoista

Erityispiirteitä Epätäydellinen tieto aiemmista toiminnoista ei välttämättä tietoa toisten pelaajien toiminnoista

Erityispiirteitä Epätäydellinen tieto aiemmista toiminnoista ei välttämättä tietoa toisten pelaajien toiminnoista ei välttämättä tietoa siitä, onko joku toinen pelaaja ylipäätään vielä toiminut

Erityispiirteitä Epätäydellinen tieto aiemmista toiminnoista ei välttämättä tietoa toisten pelaajien toiminnoista ei välttämättä tietoa siitä, onko joku toinen pelaaja ylipäätään vielä toiminut omat aiemmat toiminnot ovat saattaneet unohtua

Formaali määritelmä N,H,P, f c, i i N, i i N

Formaali määritelmä N on pelaajien joukko N,H,P, f c, i i N, i i N

Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko

Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko P on pelaajafunktio ( P h = c sattuma)

Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko P on pelaajafunktio ( P h = c sattuma) f c on sattuman toimintojen todennäköisyysfunktio

Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko P on pelaajafunktio ( P h = c sattuma) f c on sattuman toimintojen todennäköisyysfunktio i i N on pelaajan i informaatio-ositus

Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko P on pelaajafunktio ( P h = c sattuma) f c on sattuman toimintojen todennäköisyysfunktio i i N on pelaajan i informaatio-ositus i i N on pelaajan i suosituimmuusrelaatio

Informaatio-ositus ja informaatio-osio 2 L R o ' ' ' ' o 2 o 3 o 4 o 5

Informaatio-ositus ja informaatio-osio 2 L R o ' ' ' ' o 2 o 3 o 4 o 5 { }

Informaatio-ositus ja informaatio-osio 2 L R o ' ' ' ' o 2 o 3 o 4 o 5 {, L,, R}

Informaatio-ositus ja informaatio-osio 2 L R o ' ' ' ' o 2 o 3 o 4 o 5 = {{ }, {, L,, R} }

Täydellinen ja epätäydellinen muisti

Täydellinen ja epätäydellinen muisti Täydellinen muisti

Täydellinen ja epätäydellinen muisti Täydellinen muisti pelaaja muistaa kaiken, minkä on aiemmin tiennyt

Täydellinen ja epätäydellinen muisti Täydellinen muisti pelaaja muistaa kaiken, minkä on aiemmin tiennyt pelaaja ei silti välttämättä tiedä pelin tarkkaa historiaa; hän muistaa vain kaikki kohtaamansa informaatio-osiot ja niissä tekemänsä toiminnot

Täydellinen ja epätäydellinen muisti Täydellinen muisti pelaaja muistaa kaiken, minkä on aiemmin tiennyt pelaaja ei silti välttämättä tiedä pelin tarkkaa historiaa; hän muistaa vain kaikki kohtaamansa informaatio-osiot ja niissä tekemänsä toiminnot formaalisti: jos pelaajan i muistia merkitään niin pätee X i h = X i h', kun h ja h' ovat pelaajan i samassa informaatio-osiossa X i h

Täydellinen ja epätäydellinen muisti Täydellinen muisti pelaaja muistaa kaiken, minkä on aiemmin tiennyt pelaaja ei silti välttämättä tiedä pelin tarkkaa historiaa; hän muistaa vain kaikki kohtaamansa informaatio-osiot ja niissä tekemänsä toiminnot formaalisti: jos pelaajan i muistia merkitään niin pätee X i h = X i h', kun h ja h' ovat pelaajan i samassa informaatio-osiossa X i h peliä, jossa kaikilla pelaajilla on täydellinen muisti, sanotaan täydellisen muistin peliksi

Täydellinen ja epätäydellinen muisti Epätäydellinen muisti, esimerkkejä

Täydellinen ja epätäydellinen muisti Epätäydellinen muisti, esimerkkejä pelaaja ei muista, onko jo toiminut

Täydellinen ja epätäydellinen muisti Epätäydellinen muisti, esimerkkejä pelaaja ei muista, onko jo toiminut pelaaja ei muista valitsemaansa toimintoa

Täydellinen ja epätäydellinen muisti Epätäydellinen muisti, esimerkkejä pelaaja ei muista, onko jo toiminut pelaaja ei muista valitsemaansa toimintoa pelaaja unohtaa toisen pelaajan vaikutuksen c α β β α

Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin

Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin

Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin voidaan rinnastaa, jos epätäydellisen tiedon pelissä missään informaatio-osiossa ei ole kuin yksi historia (tällöin epätietoisuutta ei enää käytännössä ole)

Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin voidaan rinnastaa, jos epätäydellisen tiedon pelissä missään informaatio-osiossa ei ole kuin yksi historia (tällöin epätietoisuutta ei enää käytännössä ole) vaikka pelaaja ei näkisi toisen pelaajan toimintoa, hän voi mahdollisesti päätellä sen

Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin voidaan rinnastaa, jos epätäydellisen tiedon pelissä missään informaatio-osiossa ei ole kuin yksi historia (tällöin epätietoisuutta ei enää käytännössä ole) vaikka pelaaja ei näkisi toisen pelaajan toimintoa, hän voi mahdollisesti päätellä sen Suhde samanaikaisten toimintojen peleihin

Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin voidaan rinnastaa, jos epätäydellisen tiedon pelissä missään informaatio-osiossa ei ole kuin yksi historia (tällöin epätietoisuutta ei enää käytännössä ole) vaikka pelaaja ei näkisi toisen pelaajan toimintoa, hän voi mahdollisesti päätellä sen Suhde samanaikaisten toimintojen peleihin jos ensimmäistä pelaajaa lukuun ottamatta muut eivät näe toisten pelaajien toimintoja ennen vuoron loppua, vastaa tilanne samanaikaisuutta

Jatkuvien pelien ekvivalenssi Neljä periaatetta, jotka säilyttävät pelin supistetun strategisen muodon ja ovat siten Osbornen ja Rubinsteinin mukaan ekvivalentteja paisuttamis-supistamisperiaate tarpeettoman siirron lisäämisen periaate siirtojen sulauttamisen periaate siirtojen keskinäisen vaihdon periaate

Paisuttamis-supistamisperiaate 2 2 A B ' ' ' ' o o 2 o 3 o 4 o 5 o 6 o o 2 o 3 o 4 o 5 o 6

Tarpeettoman siirron lisäämisen periaate 2 2 A B ' ' ' ' o o 2 o 3 o 4 o 5 o 6 o o 2 o o 2 o 3 o 4 o 5 o 6

Siirtojen sulauttamisen periaate 2 A B 2 A B ' ' ' ' o o 2 o o 2 o 3 o 4 o 5 o 6 o 3 o 4 o 5 o 6

Siirtojen keskinäisen vaihdon periaate 2 A B ' ' ' ' A B ' 2 ' o o 2 o 3 o 4 o 5 o 6 o o 2 o 3 o 4 o 5 o 6

Strategiat jatkuvissa peleissä

Strategiat jatkuvissa peleissä Puhdas strategia

Strategiat jatkuvissa peleissä Puhdas strategia funktio, joka määrittelee tietyn toiminnon jokaisen informaatio-osion mahdollisesta toimintojoukosta A I i, I i i

Strategiat jatkuvissa peleissä Puhdas strategia funktio, joka määrittelee tietyn toiminnon jokaisen informaatio-osion mahdollisesta toimintojoukosta A I i, I i i Sekastrategia

Strategiat jatkuvissa peleissä Puhdas strategia funktio, joka määrittelee tietyn toiminnon jokaisen informaatio-osion mahdollisesta toimintojoukosta A I i, I i i Sekastrategia todennäköisyysjakauma kaikille pelaajan puhtaille strategioille

Strategiat jatkuvissa peleissä Käyttäytymisstrategia

Strategiat jatkuvissa peleissä Käyttäytymisstrategia joukko i I i I itsenäisiä todennäköisyyksiä, i i missä i I i on todennäköisyysjakauma joukolle A I i

Strategiat jatkuvissa peleissä Käyttäytymisstrategia joukko i I i I itsenäisiä todennäköisyyksiä, i i missä i I i on todennäköisyysjakauma joukolle A I i kaikille historioille h I i i ja toiminnoille a A h merkitään notaatiolla i ha todennäköisyyttä i I i a jonka i I i määrittelee toiminnolle a

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot satunnaisen puhtaan strategian käyttö vs. satunnaisen toiminnon valitseminen jokaisella toimintokierroksella erikseen

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot satunnaisen puhtaan strategian käyttö vs. satunnaisen toiminnon valitseminen jokaisella toimintokierroksella erikseen esimerkki: mahdolliset sekastrategiat ovat L, L, R ja R ja käyttäytymisstrategiat {L, R} ja {, } L R 2 A B 2, 0, 0, 2, 2 0, 0

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot sekä sekastrategioille että käyttäytymisstrategioille voidaan määritellä profiilin = i i N seuraus O joka kertoo lopullisten historioiden todennäköisyydet kun pelaaja i seuraa profiilia i

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot sekä sekastrategioille että käyttäytymisstrategioille voidaan määritellä profiilin = i i N seuraus O joka kertoo lopullisten historioiden todennäköisyydet kun pelaaja i seuraa profiilia kaksi strategiaa ovat seurauksen suhteen ekvivalentit, jos niiden seuraus on sama kaikkien muiden pelaajien puhtaiden strategioiden joukolla i

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot sekä sekastrategioille että käyttäytymisstrategioille voidaan määritellä profiilin = i i N seuraus O joka kertoo lopullisten historioiden todennäköisyydet kun pelaaja i seuraa profiilia kaksi strategiaa ovat seurauksen suhteen ekvivalentit, jos niiden seuraus on sama kaikkien muiden pelaajien puhtaiden strategioiden joukolla täydellisen muistin peleissä kaikille sekastrategioille löytyy seurauksen suhteen ekvivalentti käyttäytymisstrategia i

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot epätäydellisen muistin peleissä seurauksen suhteen ekvivalentteja strategioita ei aina ole

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot epätäydellisen muistin peleissä seurauksen suhteen ekvivalentteja strategioita ei aina ole esimerkki: pelin lopullisten historioiden joukon {aa, ab, b} todennäköisyydet a b käyttäytymisstrategiassa, jossa toiminnon a valitsemisen a b todennäköisyys on p: p 2, p p, p 0 0

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot epätäydellisen muistin peleissä seurauksen suhteen ekvivalentteja strategioita ei aina ole esimerkki: pelin lopullisten historioiden joukon {aa, ab, b} todennäköisyydet a b käyttäytymisstrategiassa, jossa toiminnon a valitsemisen a b todennäköisyys on p: p 2, p p, p 0 sekastrategialla lopullinen historia ab on saavuttamaton 0

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot esimerkki 2: sekastrategioiden L ja R ollessa yhtä todennäköiset on pelin neljän lopullisen historian todennäköisyysjakauma 2, 0, 0, 2 L R L R L R

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot esimerkki 2: sekastrategioiden L ja R ollessa yhtä todennäköiset on pelin neljän lopullisen historian todennäköisyysjakauma 2, 0, 0, 2 L R L R L R käyttäytymisstrategialla, jossa toiminnon L todennäköisyys on p, on lopullisten historioiden todennäköisyysjakauma p 2, p p, p p, p 2

Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot esimerkki 2: sekastrategioiden L ja R ollessa yhtä todennäköiset on pelin neljän lopullisen historian todennäköisyysjakauma 2, 0, 0, 2 L R L R L R käyttäytymisstrategialla, jossa toiminnon L todennäköisyys on p, on lopullisten historioiden todennäköisyysjakauma p 2, p p, p p, p 2 käyttäytymisstrategialla ei saa sekastrategian seurausta millään arvolla p

Nashin tasapaino jatkuvissa peleissä

Nashin tasapaino jatkuvissa peleissä sekastrategioille Nashin tasapaino on profiili jolle pätee kaikilla pelaajilla i N O * i, * i i O * i, i jokaiselle pelaajan i sekastrategiaprofiilille i

Nashin tasapaino jatkuvissa peleissä sekastrategioille Nashin tasapaino on profiili jolle pätee kaikilla pelaajilla i N O * i, * i i O * i, i jokaiselle pelaajan i sekastrategiaprofiilille käyttäytymisstrategioille määritelmä on vastaava ja tasapainot ekvivalentteja i

Nashin tasapaino jatkuvissa peleissä sekastrategioille Nashin tasapaino on profiili jolle pätee kaikilla pelaajilla i N O * i, * i i O * i, i jokaiselle pelaajan i sekastrategiaprofiilille käyttäytymisstrategioille määritelmä on vastaava ja tasapainot ekvivalentteja...mutta vain täydellisen muistin peleissä i

Nashin tasapaino jatkuvissa peleissä epätäydellisen muistin peleissä Nashin tasapaino tuottaa erilaisia tuloksia satunnaisille strategioille eikä siis ole hyvä mittari

Nashin tasapaino jatkuvissa peleissä epätäydellisen muistin peleissä Nashin tasapaino tuottaa erilaisia tuloksia satunnaisille strategioille eikä siis ole hyvä mittari esimerkki: molemmat sekastrategiat tuottavat pelaajalle hyödyn 0 ja ovat siis samanarvoisia a a b b 0 0

Nashin tasapaino jatkuvissa peleissä epätäydellisen muistin peleissä Nashin tasapaino tuottaa erilaisia tuloksia satunnaisille strategioille eikä siis ole hyvä mittari esimerkki: molemmat sekastrategiat tuottavat pelaajalle hyödyn 0 ja ovat siis samanarvoisia käyttäytymisstrategia, jossa valitaan toiminto a todennäköisyydellä 2 tuottaa hyödyn odotusarvon 4 0 a a b b 0

Nashin tasapaino jatkuvissa peleissä epätäydellisen muistin peleissä Nashin tasapaino tuottaa erilaisia tuloksia satunnaisille strategioille eikä siis ole hyvä mittari esimerkki: molemmat sekastrategiat tuottavat pelaajalle hyödyn 0 ja ovat siis samanarvoisia käyttäytymisstrategia, jossa valitaan toiminto a todennäköisyydellä 2 tuottaa hyödyn odotusarvon tarvitaan siis alipelin täydellistä tasapainoa, mutta sen toteutus on ei-triviaalia 4 0 a a b b 0

...ja siitä jatketaan ensi viikolla

Lähde: Osborne & Rubinstein: A Course in Game Theory (994)