Evolutiivinen stabiilisuus populaation

Samankaltaiset tiedostot
Evolutiivisesti stabiilin strategian oppiminen

SEKASTRATEGIAT PELITEORIASSA

Luento 7. June 3, 2014

Sekastrategiat ja intensiiviyhteensopivuus

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Yhteistyötä sisältämätön peliteoria

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Johdanto peliteoriaan Kirja kpl. 2

Sekastrategia ja Nash-tasapainon määrääminen

Yhteistyötä sisältämätön peliteoria jatkuu

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Luento 5: Peliteoriaa

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Nollasummapelit ja bayesilaiset pelit

Luento 8. June 3, 2014

ESS oppiminen ja sen simulointi

Lyhyen aikavälin hintakilpailu 2/2

Hintakilpailu lyhyellä aikavälillä

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Laskelmointia mielen evoluutiosta

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

Y56 laskuharjoitukset 6

Signalointi: autonromujen markkinat

Projektin arvon aleneminen

Epäsymmetriset pelit - omistajuus

Luento 9. June 2, Luento 9

Harha mallin arvioinnissa

Lisää satunnaisuutta ja mahdollisuus keskeyttää projekti

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

Pohdiskeleva ajattelu ja tasapainotarkennukset

Projektin keskeyttäminen, uudelleen käynnistäminen ja hylkääminen

Pelit matematiikan opetuksessa

Arkkitehtuurien tutkimus Outi Räihä. OHJ-3200 Ohjelmistoarkkitehtuurit. Darwin-projekti. Johdanto

Projektin arvon määritys

Tasapaino epätäydellisen tiedon peleissä

Peliteoria luento 3. May 27, Peliteoria luento 3

Johdatus peliteoriaan

Pelien teoriaa: tasapainokäsitteet

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Yleinen tietämys ja Nashin tasapaino

Laskuharjoitus 5. Mitkä ovat kuvan 1 kanavien kapasiteetit? Kuva 1: Kaksi kanavaa. p/(1 p) ) bittiä lähetystä kohti. Voidaan

TIES592 Monitavoiteoptimointi ja teollisten prosessien hallinta. Yliassistentti Jussi Hakanen syksy 2010

Epätäydellisen tiedon jatkuvat pelit

Investointimahdollisuudet ja niiden ajoitus

Dynaaminen hintakilpailu ja sanattomat sopimukset

Luento 5: Peliteoriaa

Referenssipiste- ja referenssisuuntamenetelmät

Mat Dynaaminen optimointi, mallivastaukset, kierros 1

v AB q(t) = q(t) v AB p(t) v B V B ṗ(t) = q(t) v AB Φ(t, τ) = e A(t τ). e A = I + A + A2 2! + A3 = exp(a D (t τ)) (I + A N (t τ)), A N = =

Geneettiset algoritmit

Lohkoasetelmat. Kuusinen/Heliövaara 1

Tutkimustiedonhallinnan peruskurssi

III Perinnöllisyystieteen perusteita

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

6. Differentiaaliyhtälösysteemien laadullista teoriaa.

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

17. Differentiaaliyhtälösysteemien laadullista teoriaa.

Data Envelopment Analysis (DEA) - menetelmät + CCR-DEA-menetelmä

Esimerkki: Tietoliikennekytkin

Harjoitus 4: Differentiaaliyhtälöt (Matlab) MS-C2107 Sovelletun matematiikan tietokonetyöt 1

Dynaamisten systeemien teoriaa. Systeemianalyysilaboratorio II

Ito-prosessit. Määritelmä Geometrinen Brownin liike Keskiarvoon palautuvat prosessit Iton lemma. S ysteemianalyysin. Laboratorio

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Matemaattinen Analyysi

Peliteoria luento 1. May 25, Peliteoria luento 1

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Diskreettiaikainen dynaaminen optimointi

JOHDATUSTA PELITEORIAAN

12. Hessen matriisi. Ääriarvoteoriaa


Inversio-ongelmien laskennallinen peruskurssi Luento 2

Evoluutio. BI Elämä ja evoluutio Leena Kangas-Järviluoma

Harjoitus Tarkastellaan luentojen Esimerkin mukaista työttömyysmallinnusta. Merkitään. p(t) = hintaindeksi, π(t) = odotettu inflaatio,

Preference Programming viitekehys: epätäydellisen preferenssi-informaation elisitointi ja mallintaminen, dominanssi

Lohkoasetelmat. Heliövaara 1

MS-A0207 Differentiaali- ja integraalilaskenta 2 (Chem) Yhteenveto, osa I

Numeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33

Peliteoria luento 2. May 26, Peliteoria luento 2

Prospektiteoria. Systeemianalyysin. Antti Toppila. Esitelmä 4 3. helmikuuta laboratorio Aalto-yliopiston TKK

LUKU 7. Perusmuodot Ensimmäinen perusmuoto. Funktiot E, F ja G ovat tilkun ϕ ensimmäisen perusmuodon kertoimet ja neliömuoto

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Moraalinen uhkapeli: laajennuksia ja sovelluksia

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Harjoitus 7: NCSS - Tilastollinen analyysi

Opettaminen ja oppiminen

S Laskennallinen systeemibiologia

7.4 Sormenjälkitekniikka

PELITEORIAN PERUSTEITA

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

2. Teoriaharjoitukset

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

TAITO TARTTUU TREENAAMALLA!

AC Kajaani valmennuslinja 2017

Markov-kustannusmallit ja kulkuajat

MS-C1340 Lineaarialgebra ja

Peliteoria ja huutokauppamekanismit

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

Säätötekniikkaa. Säätöongelma: Hae (mahdollisesti ulostulon avulla) ohjaus, joka saa systeemin toimimaan halutulla tavalla

Transkriptio:

Antti Toppila sivu 1/20 Optimointiopin seminaari Syksy 2008 Evolutiivinen stabiilisuus populaation määrittämisessä Antti Toppila 24.9.2008

Antti Toppila sivu 2/20 Optimointiopin seminaari Syksy 2008 Sisältö Pareittainen peli Evoluutio mutaation kautta Evolutiiviset tasapainot Yksilö vastaan Matti Meikäläinen Kotitehtävä

Antti Toppila sivu 3/20 Optimointiopin seminaari Syksy 2008 Pareittainen peli Ajatusmalli Äärettömän populaation P jäsenet kohtaavat symmetrisessä pelissä Kohtaaminen muuttaa elinkelpoisuutta W riippuen kohtaajien fenotyypeistä (strategioista) Jälkeläiset samaa fenotyyppiä kun vanhempansa Seuraavan sukupolven osuus omaa fenotyyppiä p noudattaa kvalitatiivisesti differentiaaliyhtälöä dp dt = p W W W (1) missä W on keskimääräinen elinkelpoisuus

Antti Toppila sivu 4/20 Optimointiopin seminaari Syksy 2008 Pareittainen peli Kuvaaminen matriisipelinä Järjestetään lopputulemat palkkiomatriisiksi A = matriisipeli puhtailla strategioilla Haukka-Kyyhky palkkiotaulukko Fenotyypit haukka H ja kyyhky D H D H 1 2 D 0 1

Antti Toppila sivu 5/20 Optimointiopin seminaari Syksy 2008 Pareittainen peli Dynamiikan analysointi Tutkitaan fenotyypin pärjäämistä alkupopulaatiossa P 0 Elinkelpoisuus keskimääräistä huonompi = Suhteellinen osuus pienenee Elinkelpoisuus keskimääräistä parempi = Suhteellinen osuus kasvaa Peli määrää dynamiikan fenotyyppien suhteellisille osuuksille Pelissä muuttumattomat alkupopulaatiot dp dt = 0 kaikilla p

Antti Toppila sivu 6/20 Optimointiopin seminaari Syksy 2008 Evoluutio mutaation kautta Lähtökohta Puhdas strategia Ennaltamäärätystä toimenpidejoukosta valittavan toimenpiteen suorittaminen joka ei ole määritelty muiden pelin strategioiden suhteen Puhdas startegia vastaa jonkin pelissä oleellisen ja perinnöllisen toimenpiteen valitsemista

Antti Toppila sivu 7/20 Optimointiopin seminaari Syksy 2008 Evoluutio mutaation kautta Mutaatio sekastrategioilla Sekastrategia Puhtaiden strategioiden i pelaaminen vakiotodennäköisyyksillä 0 p i 1, i p i = 1 Uskottava mutaatio, sillä kaksi olemassa olevaa ominaisuutta yhdistyy Voitaisiin mallintaa uutena sarakkeena pelimatriissa Matriisiin odotusarvoiset palkkiot Yleensä oletetaan että kaikki sekastrategiat voivat esiintyä mutaatioissa

Antti Toppila sivu 8/20 Optimointiopin seminaari Syksy 2008 Evoluutio mutaation kautta Muutokset populaatiossa Yksilö taistelee aina satunnaista populaation jäsentä vastaan Startegia muita parempi Strategia yleistyy Strategia kamppailee useammin itseään vastaan Strategiaa I käyttävän yksilön näkökulmasta odotusarvoinen pärjääminen W (I ) = P J E(I, J) J missä P J on strategian J osuus populaatiosta ja E(I, J) pelin lopputulema pelaajalle joka pelaa I :tä kun vastustaja pelaa J:tä.

Antti Toppila sivu 9/20 Optimointiopin seminaari Syksy 2008 Evoluutio mutaation kautta Mutantti puhtaassa populaatiosssa Mutantti J käyttää sekastrategiaa tai puhdasta strategiaa Populaatio vastaa sekastrategialla tai puhtaalla strategialla I Mutantti joutuu taistelemaan myös itseään vastaan Populaatio voittaa jos E(I, I ) > E(J, I ) tai E(I, I ) = E(J, I ) ja E(I, J) > E(J, J) Evolutiivisesti stabiilit strategia (ESS) on strategia joka estää mutanttien lisääntymisen kun (lähes) kaikki populaation jäsenet käyttävät kyseistä strategiaa. Olisi järkevää aina mainita millaisia mutantteja vastaan Voiko konstruoida puhtaiden strategioiden positiivisena lineaarikombinationa sarakkeen joka parempi kun ESS ehdokas?

Antti Toppila sivu 10/20 Optimointiopin seminaari Syksy 2008 Evoluutio mutaation kautta Mutantti polymorfisessa populaatiosssa Mutantti J käyttää sekastrategiaa tai puhdasta strategiaa Populaatio vastaa useilla strategioilla joiden frekvenssi riippuu poulaation jakaumasta Mutantti joutuu taistelemaan muuttuvaa sekastrategiaa vastaan Evolutiivisesti stabiili tila on populaatiojakauma joka palautuu valinnan kautta pienen poikkeaman jälkeen Poikkeama on pieni määrä puhdasta strategiaa/puhtaiden strategioiden sekoitusta.

Antti Toppila sivu 11/20 Optimointiopin seminaari Syksy 2008 Evolutiivisesti stabiilien strategioiden olemassaolo Kahden strategian pareittainen peli Kahdella strategialla aina ESS a > c H ESS d > b D ESS a > c, d > b D ja H ESS Muulloin sekastrategia PH+(1 P)D b d missä P = on ESS (b d) + (c a) Myös jakaumaa noudattava puhdas populaatio on evolutiivisesti stabiili tila H D H a b D c d

Antti Toppila sivu 12/20 Optimointiopin seminaari Syksy 2008 Evolutiivisesti stabiilien strategioiden olemassaolo Usean strategian pareittainen peli ESS ei välttämättä ole olemassa eikä ESS:ää vastaava polymorfinen populaatio välttämättä stabiili ESS ei olemassa (ε < 0 ja pieni) ε > 0: I = 1 3 K + 1 3 P + 1 3 S on ESS ESS vastaava populaatiojakauma 1 3 K, 1 3 P, 1 3 S epästabiili (syklinen käytös) Kivi-Paperi-Sakset peli K P S K ε 1 1 P 1 ε 1 S 1 1 ε

Antti Toppila sivu 13/20 Optimointiopin seminaari Syksy 2008 Monimutkaisempia strategioita Haukka-Kyyhky-Kostaja peli 1/3 Kostaja R haukka haukkaa (H) ja kyyhky kyyhkyä (D) vastaan Kostajan strategia riippuu muiden valitsemasta strategiasta Voidaan mallintaa matriisipelinä (a) Pelissä (b) oletettu että Kostaja joskus haukka myös kyyhkyä vastaan H D R H 1 2 1 D 0 1 1 R 1 1 1 (a) H D R H 1 2 1 D 0 1 0.9 R 1 1.1 1 (b)

Antti Toppila sivu 14/20 Optimointiopin seminaari Syksy 2008 Monimutkaisempia stretegiota Haukka-Kyyhky-Kostaja peli 2/3 Bishop & Cannings (1978) Jos I on seka-ess jossa positiivisilla todennäköisyyksillä strategiat J 1, J 2,..., J n niin E(J 1, I ) = E(J 2, I ) =... E(J n, I ) Ehdot tarkistettava kaikille puhtaiden strategioiden permutaatioille jos halutaan löytää kaikki potentiaaliset ESS:t Sovelletaan ehtoja peliin (b) Kaksi ESS:ää: I = 1 2 H+ 1 2 D ja R Satulapiste S = 1 200 90 11H+ 319D+ 319 R

Antti Toppila sivu 15/20 Optimointiopin seminaari Syksy 2008 Monimutkaisempia stretegiota Haukka-Kyyhky-Kostaja peli 3/3 E(I, R) < E(R, R) kun I {H, D} eli R on ESS E(H, I ) = 1 2 + 1 2 2 = 1 2 ja E(D, I ) = 1 2 0 + 1 2 = 1 2 eli E(I, I ) = 1 2 I on ESS jos E(I, I ) > E(R, I ) = 1 2 + 1.1 1 Miten nähdään että S satula? E(H, H) < E(H, S) ja E(D, D) < E(D, S) mutta E(R, R) > E(R, S) ja E(I, I ) > E(I, S) 2 = 1 20 H I R S D

Antti Toppila sivu 16/20 Optimointiopin seminaari Syksy 2008 Yksilö vastaan Matti Meikäläinen Periaatteet Pelataan yhteisön ominaisuutta vastaan Kukat kaikkien ymäröivien kukkien kanssa W (I, J) straegiaa I käyttävän pärjääminen J populaatiossa P q,j,i on populaatio P = qj + (1 q)i I on ESS jos kaikille J I joko W (J, I ) < W (I, I ) { W (J, I ) =W (I, I ) tai W (J, P q,j,i <W (I, P q,j,i ) pienille q Polymorfismi ei välttämättä jakautunut strategioden suhteessa

Antti Toppila sivu 17/20 Optimointiopin seminaari Syksy 2008 Yksilö vastaan Matti Meikäläinen Sukupuolijakaumapeli 1/2 Naiset synnyttävät N kpl miehiä ja naisia suhteessa s : (1 s) Mitataan kelpoisuutta lapsenlapsien määränä populaatiossa jonka strategia s : [ W (s, s ) = W (s, s ) = N 2 1 s + s 1 ] s s Jos kaikissa suhteissa 0 s 1 voidaan synnyttää on s paras jos [ W (s, s ] ) = 0. s s=s Saadaan s = 0.5.

Antti Toppila sivu 18/20 Optimointiopin seminaari Syksy 2008 Yksilö vastaan Matti Meikäläinen Sukupuolijakaumapeli 2/2 Strategia s = 0.5 stabiili jos W (s, s ) < W (s, s ) kaikilla s s, s = qs + (1 q)s eli 1 s + s 1 s s < 1 s + s 1 s s kaikilla s s. Epäyhtälö on tosi strategia s stabiili Voisiko tämän tarkistaa toisen derivaatan perusteella? [ 2 W (s, s ] ) s 2 s=s.

Antti Toppila sivu 19/20 Optimointiopin seminaari Syksy 2008 Kotitehtävä Tehtävänanto Haukka-Kyyhky- Kostaja peli Haukka-Kyyhky peliin lisätään mutaatio M joka luulee 100τ % kyyhkyistä ja mutanteista haukoiksi. Mutantti on haukka oikeita tai uskottuja haukkoja vastaan, muulloin kyyhky. Haukkamutantti jota luullaan kyyhkyksi aiheuttaa paniikin jolloin paetaan kuten kyyhky. Kaksi mutanttikyyhkyä osaavat jakaa resurssin vain 100α % tehokkuudella. (a) Muotoile uusi peli! ( 1 2 p) (b) Etsi pelin seka-ess p = p 1 H + p 2 D + p 3 M kun p:ssä esiintyy kaikkia strategioita ja τ, α ]0, 1[. (1 p) (c) Milloin p:tä vastaava polymorfismi on stabiili? ( 1 2 p)

Antti Toppila sivu 20/20 Optimointiopin seminaari Syksy 2008 Kotitehtävä Vinkit Mathematica rulez Tehtävän ratkaisussa kannattaa ehdottomasti käyttää Mathematicaa tai muuta symbolista ratkaisinta. Mathematican Reduce ja Exists komennot voivat osoittautua kullanarvoisiksi kurssin aikana. Käyttöohjeet helpistä