Epätäydellisen tiedon jatkuvat pelit Mika Viljanen Peliteorian seminaari
Erityispiirteitä
Erityispiirteitä Epätäydellinen tieto aiemmista toiminnoista
Erityispiirteitä Epätäydellinen tieto aiemmista toiminnoista ei välttämättä tietoa toisten pelaajien toiminnoista
Erityispiirteitä Epätäydellinen tieto aiemmista toiminnoista ei välttämättä tietoa toisten pelaajien toiminnoista ei välttämättä tietoa siitä, onko joku toinen pelaaja ylipäätään vielä toiminut
Erityispiirteitä Epätäydellinen tieto aiemmista toiminnoista ei välttämättä tietoa toisten pelaajien toiminnoista ei välttämättä tietoa siitä, onko joku toinen pelaaja ylipäätään vielä toiminut omat aiemmat toiminnot ovat saattaneet unohtua
Formaali määritelmä N,H,P, f c, i i N, i i N
Formaali määritelmä N on pelaajien joukko N,H,P, f c, i i N, i i N
Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko
Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko P on pelaajafunktio ( P h = c sattuma)
Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko P on pelaajafunktio ( P h = c sattuma) f c on sattuman toimintojen todennäköisyysfunktio
Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko P on pelaajafunktio ( P h = c sattuma) f c on sattuman toimintojen todennäköisyysfunktio i i N on pelaajan i informaatio-ositus
Formaali määritelmä N on pelaajien joukko H N,H,P, f c, i i N, i i N on historioiden joukko P on pelaajafunktio ( P h = c sattuma) f c on sattuman toimintojen todennäköisyysfunktio i i N on pelaajan i informaatio-ositus i i N on pelaajan i suosituimmuusrelaatio
Informaatio-ositus ja informaatio-osio 2 L R o ' ' ' ' o 2 o 3 o 4 o 5
Informaatio-ositus ja informaatio-osio 2 L R o ' ' ' ' o 2 o 3 o 4 o 5 { }
Informaatio-ositus ja informaatio-osio 2 L R o ' ' ' ' o 2 o 3 o 4 o 5 {, L,, R}
Informaatio-ositus ja informaatio-osio 2 L R o ' ' ' ' o 2 o 3 o 4 o 5 = {{ }, {, L,, R} }
Täydellinen ja epätäydellinen muisti
Täydellinen ja epätäydellinen muisti Täydellinen muisti
Täydellinen ja epätäydellinen muisti Täydellinen muisti pelaaja muistaa kaiken, minkä on aiemmin tiennyt
Täydellinen ja epätäydellinen muisti Täydellinen muisti pelaaja muistaa kaiken, minkä on aiemmin tiennyt pelaaja ei silti välttämättä tiedä pelin tarkkaa historiaa; hän muistaa vain kaikki kohtaamansa informaatio-osiot ja niissä tekemänsä toiminnot
Täydellinen ja epätäydellinen muisti Täydellinen muisti pelaaja muistaa kaiken, minkä on aiemmin tiennyt pelaaja ei silti välttämättä tiedä pelin tarkkaa historiaa; hän muistaa vain kaikki kohtaamansa informaatio-osiot ja niissä tekemänsä toiminnot formaalisti: jos pelaajan i muistia merkitään niin pätee X i h = X i h', kun h ja h' ovat pelaajan i samassa informaatio-osiossa X i h
Täydellinen ja epätäydellinen muisti Täydellinen muisti pelaaja muistaa kaiken, minkä on aiemmin tiennyt pelaaja ei silti välttämättä tiedä pelin tarkkaa historiaa; hän muistaa vain kaikki kohtaamansa informaatio-osiot ja niissä tekemänsä toiminnot formaalisti: jos pelaajan i muistia merkitään niin pätee X i h = X i h', kun h ja h' ovat pelaajan i samassa informaatio-osiossa X i h peliä, jossa kaikilla pelaajilla on täydellinen muisti, sanotaan täydellisen muistin peliksi
Täydellinen ja epätäydellinen muisti Epätäydellinen muisti, esimerkkejä
Täydellinen ja epätäydellinen muisti Epätäydellinen muisti, esimerkkejä pelaaja ei muista, onko jo toiminut
Täydellinen ja epätäydellinen muisti Epätäydellinen muisti, esimerkkejä pelaaja ei muista, onko jo toiminut pelaaja ei muista valitsemaansa toimintoa
Täydellinen ja epätäydellinen muisti Epätäydellinen muisti, esimerkkejä pelaaja ei muista, onko jo toiminut pelaaja ei muista valitsemaansa toimintoa pelaaja unohtaa toisen pelaajan vaikutuksen c α β β α
Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin
Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin
Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin voidaan rinnastaa, jos epätäydellisen tiedon pelissä missään informaatio-osiossa ei ole kuin yksi historia (tällöin epätietoisuutta ei enää käytännössä ole)
Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin voidaan rinnastaa, jos epätäydellisen tiedon pelissä missään informaatio-osiossa ei ole kuin yksi historia (tällöin epätietoisuutta ei enää käytännössä ole) vaikka pelaaja ei näkisi toisen pelaajan toimintoa, hän voi mahdollisesti päätellä sen
Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin voidaan rinnastaa, jos epätäydellisen tiedon pelissä missään informaatio-osiossa ei ole kuin yksi historia (tällöin epätietoisuutta ei enää käytännössä ole) vaikka pelaaja ei näkisi toisen pelaajan toimintoa, hän voi mahdollisesti päätellä sen Suhde samanaikaisten toimintojen peleihin
Epätäydellisen tiedon jatkuvien pelien suhde muihin peleihin Suhde täydellisen tiedon peleihin voidaan rinnastaa, jos epätäydellisen tiedon pelissä missään informaatio-osiossa ei ole kuin yksi historia (tällöin epätietoisuutta ei enää käytännössä ole) vaikka pelaaja ei näkisi toisen pelaajan toimintoa, hän voi mahdollisesti päätellä sen Suhde samanaikaisten toimintojen peleihin jos ensimmäistä pelaajaa lukuun ottamatta muut eivät näe toisten pelaajien toimintoja ennen vuoron loppua, vastaa tilanne samanaikaisuutta
Jatkuvien pelien ekvivalenssi Neljä periaatetta, jotka säilyttävät pelin supistetun strategisen muodon ja ovat siten Osbornen ja Rubinsteinin mukaan ekvivalentteja paisuttamis-supistamisperiaate tarpeettoman siirron lisäämisen periaate siirtojen sulauttamisen periaate siirtojen keskinäisen vaihdon periaate
Paisuttamis-supistamisperiaate 2 2 A B ' ' ' ' o o 2 o 3 o 4 o 5 o 6 o o 2 o 3 o 4 o 5 o 6
Tarpeettoman siirron lisäämisen periaate 2 2 A B ' ' ' ' o o 2 o 3 o 4 o 5 o 6 o o 2 o o 2 o 3 o 4 o 5 o 6
Siirtojen sulauttamisen periaate 2 A B 2 A B ' ' ' ' o o 2 o o 2 o 3 o 4 o 5 o 6 o 3 o 4 o 5 o 6
Siirtojen keskinäisen vaihdon periaate 2 A B ' ' ' ' A B ' 2 ' o o 2 o 3 o 4 o 5 o 6 o o 2 o 3 o 4 o 5 o 6
Strategiat jatkuvissa peleissä
Strategiat jatkuvissa peleissä Puhdas strategia
Strategiat jatkuvissa peleissä Puhdas strategia funktio, joka määrittelee tietyn toiminnon jokaisen informaatio-osion mahdollisesta toimintojoukosta A I i, I i i
Strategiat jatkuvissa peleissä Puhdas strategia funktio, joka määrittelee tietyn toiminnon jokaisen informaatio-osion mahdollisesta toimintojoukosta A I i, I i i Sekastrategia
Strategiat jatkuvissa peleissä Puhdas strategia funktio, joka määrittelee tietyn toiminnon jokaisen informaatio-osion mahdollisesta toimintojoukosta A I i, I i i Sekastrategia todennäköisyysjakauma kaikille pelaajan puhtaille strategioille
Strategiat jatkuvissa peleissä Käyttäytymisstrategia
Strategiat jatkuvissa peleissä Käyttäytymisstrategia joukko i I i I itsenäisiä todennäköisyyksiä, i i missä i I i on todennäköisyysjakauma joukolle A I i
Strategiat jatkuvissa peleissä Käyttäytymisstrategia joukko i I i I itsenäisiä todennäköisyyksiä, i i missä i I i on todennäköisyysjakauma joukolle A I i kaikille historioille h I i i ja toiminnoille a A h merkitään notaatiolla i ha todennäköisyyttä i I i a jonka i I i määrittelee toiminnolle a
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot satunnaisen puhtaan strategian käyttö vs. satunnaisen toiminnon valitseminen jokaisella toimintokierroksella erikseen
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot satunnaisen puhtaan strategian käyttö vs. satunnaisen toiminnon valitseminen jokaisella toimintokierroksella erikseen esimerkki: mahdolliset sekastrategiat ovat L, L, R ja R ja käyttäytymisstrategiat {L, R} ja {, } L R 2 A B 2, 0, 0, 2, 2 0, 0
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot sekä sekastrategioille että käyttäytymisstrategioille voidaan määritellä profiilin = i i N seuraus O joka kertoo lopullisten historioiden todennäköisyydet kun pelaaja i seuraa profiilia i
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot sekä sekastrategioille että käyttäytymisstrategioille voidaan määritellä profiilin = i i N seuraus O joka kertoo lopullisten historioiden todennäköisyydet kun pelaaja i seuraa profiilia kaksi strategiaa ovat seurauksen suhteen ekvivalentit, jos niiden seuraus on sama kaikkien muiden pelaajien puhtaiden strategioiden joukolla i
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot sekä sekastrategioille että käyttäytymisstrategioille voidaan määritellä profiilin = i i N seuraus O joka kertoo lopullisten historioiden todennäköisyydet kun pelaaja i seuraa profiilia kaksi strategiaa ovat seurauksen suhteen ekvivalentit, jos niiden seuraus on sama kaikkien muiden pelaajien puhtaiden strategioiden joukolla täydellisen muistin peleissä kaikille sekastrategioille löytyy seurauksen suhteen ekvivalentti käyttäytymisstrategia i
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot epätäydellisen muistin peleissä seurauksen suhteen ekvivalentteja strategioita ei aina ole
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot epätäydellisen muistin peleissä seurauksen suhteen ekvivalentteja strategioita ei aina ole esimerkki: pelin lopullisten historioiden joukon {aa, ab, b} todennäköisyydet a b käyttäytymisstrategiassa, jossa toiminnon a valitsemisen a b todennäköisyys on p: p 2, p p, p 0 0
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot epätäydellisen muistin peleissä seurauksen suhteen ekvivalentteja strategioita ei aina ole esimerkki: pelin lopullisten historioiden joukon {aa, ab, b} todennäköisyydet a b käyttäytymisstrategiassa, jossa toiminnon a valitsemisen a b todennäköisyys on p: p 2, p p, p 0 sekastrategialla lopullinen historia ab on saavuttamaton 0
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot esimerkki 2: sekastrategioiden L ja R ollessa yhtä todennäköiset on pelin neljän lopullisen historian todennäköisyysjakauma 2, 0, 0, 2 L R L R L R
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot esimerkki 2: sekastrategioiden L ja R ollessa yhtä todennäköiset on pelin neljän lopullisen historian todennäköisyysjakauma 2, 0, 0, 2 L R L R L R käyttäytymisstrategialla, jossa toiminnon L todennäköisyys on p, on lopullisten historioiden todennäköisyysjakauma p 2, p p, p p, p 2
Strategiat jatkuvissa peleissä Satunnaisstrategioiden erot esimerkki 2: sekastrategioiden L ja R ollessa yhtä todennäköiset on pelin neljän lopullisen historian todennäköisyysjakauma 2, 0, 0, 2 L R L R L R käyttäytymisstrategialla, jossa toiminnon L todennäköisyys on p, on lopullisten historioiden todennäköisyysjakauma p 2, p p, p p, p 2 käyttäytymisstrategialla ei saa sekastrategian seurausta millään arvolla p
Nashin tasapaino jatkuvissa peleissä
Nashin tasapaino jatkuvissa peleissä sekastrategioille Nashin tasapaino on profiili jolle pätee kaikilla pelaajilla i N O * i, * i i O * i, i jokaiselle pelaajan i sekastrategiaprofiilille i
Nashin tasapaino jatkuvissa peleissä sekastrategioille Nashin tasapaino on profiili jolle pätee kaikilla pelaajilla i N O * i, * i i O * i, i jokaiselle pelaajan i sekastrategiaprofiilille käyttäytymisstrategioille määritelmä on vastaava ja tasapainot ekvivalentteja i
Nashin tasapaino jatkuvissa peleissä sekastrategioille Nashin tasapaino on profiili jolle pätee kaikilla pelaajilla i N O * i, * i i O * i, i jokaiselle pelaajan i sekastrategiaprofiilille käyttäytymisstrategioille määritelmä on vastaava ja tasapainot ekvivalentteja...mutta vain täydellisen muistin peleissä i
Nashin tasapaino jatkuvissa peleissä epätäydellisen muistin peleissä Nashin tasapaino tuottaa erilaisia tuloksia satunnaisille strategioille eikä siis ole hyvä mittari
Nashin tasapaino jatkuvissa peleissä epätäydellisen muistin peleissä Nashin tasapaino tuottaa erilaisia tuloksia satunnaisille strategioille eikä siis ole hyvä mittari esimerkki: molemmat sekastrategiat tuottavat pelaajalle hyödyn 0 ja ovat siis samanarvoisia a a b b 0 0
Nashin tasapaino jatkuvissa peleissä epätäydellisen muistin peleissä Nashin tasapaino tuottaa erilaisia tuloksia satunnaisille strategioille eikä siis ole hyvä mittari esimerkki: molemmat sekastrategiat tuottavat pelaajalle hyödyn 0 ja ovat siis samanarvoisia käyttäytymisstrategia, jossa valitaan toiminto a todennäköisyydellä 2 tuottaa hyödyn odotusarvon 4 0 a a b b 0
Nashin tasapaino jatkuvissa peleissä epätäydellisen muistin peleissä Nashin tasapaino tuottaa erilaisia tuloksia satunnaisille strategioille eikä siis ole hyvä mittari esimerkki: molemmat sekastrategiat tuottavat pelaajalle hyödyn 0 ja ovat siis samanarvoisia käyttäytymisstrategia, jossa valitaan toiminto a todennäköisyydellä 2 tuottaa hyödyn odotusarvon tarvitaan siis alipelin täydellistä tasapainoa, mutta sen toteutus on ei-triviaalia 4 0 a a b b 0
...ja siitä jatketaan ensi viikolla
Lähde: Osborne & Rubinstein: A Course in Game Theory (994)