ESS oppiminen ja sen simulointi

Samankaltaiset tiedostot
Evolutiivisesti stabiilin strategian oppiminen

Tilastollisia peruskäsitteitä ja Monte Carlo

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

Nollasummapelit ja bayesilaiset pelit

Evolutiivinen stabiilisuus populaation

Hintakilpailu lyhyellä aikavälillä

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

1. Osoita, että joukon X osajoukoille A ja B on voimassa toinen ns. de Morganin laki (A B) = A B.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

SEKASTRATEGIAT PELITEORIASSA

Tutkimustiedonhallinnan peruskurssi

Opettaminen ja oppiminen

Teema 8: Parametrien estimointi ja luottamusvälit

pitkittäisaineistoissa

Tasapaino epätäydellisen tiedon peleissä

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Induktiota käyttäen voidaan todistaa luonnollisia lukuja koskevia väitteitä, jotka ovat muotoa. väite P(n) on totta kaikille n = 0,1,2,...

Harha mallin arvioinnissa

Laskelmointia mielen evoluutiosta

Sekastrategiat ja intensiiviyhteensopivuus

Johdatus todennäköisyyslaskentaan Todennäköisyyslaskenta ja puudiagrammit. TKK (c) Ilkka Mellin (2005) 1

Liite 2: Verkot ja todennäköisyyslaskenta. Todennäköisyyslaskenta ja puudiagrammit

Todennäköisyyslaskenta ja puudiagrammit. Todennäköisyyslaskenta ja puudiagrammit. Todennäköisyyslaskenta ja puudiagrammit: Esitiedot

Peliteoria luento 3. May 27, Peliteoria luento 3

Valintahetket ja pysäytetyt martingaalit

2 arvo muuttujan arvolla

Johdatus matemaattiseen päättelyyn

Yhteistyötä sisältämätön peliteoria jatkuu

Vastaoletuksen muodostaminen

Yhtäpitävyys. Aikaisemmin osoitettiin, että n on parillinen (oletus) n 2 on parillinen (väite).

Luottamusvälit. Normaalijakauma johnkin kohtaan

Pohdiskeleva ajattelu ja tasapainotarkennukset

4.3. Matemaattinen induktio

Esitetään tehtävälle kaksi hieman erilaista ratkaisua. Ratkaisutapa 1. Lähdetään sieventämään epäyhtälön vasenta puolta:

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi

pitkittäisaineistoissa

Prospektiteoria. Systeemianalyysin. Antti Toppila. Esitelmä 4 3. helmikuuta laboratorio Aalto-yliopiston TKK

(a) Kyllä. Jokainen lähtöjoukon alkio kuvautuu täsmälleen yhteen maalijoukon alkioon.

Pelaisitko seuraavaa peliä?

Luento 5: Peliteoria

Johdanto peliteoriaan Kirja kpl. 2

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Luento 8. June 3, 2014

Martingaalit ja informaatioprosessit

Sovellettu todennäköisyyslaskenta B

Tee konseptiin pisteytysruudukko! Muista kirjata nimesi ja ryhmäsi. Lue ohjeet huolellisesti!

Ilkka Mellin Todennäköisyyslaskenta Osa 1: Todennäköisyys ja sen laskusäännöt Verkot ja todennäköisyyslaskenta

Laskuharjoitus 5. Mitkä ovat kuvan 1 kanavien kapasiteetit? Kuva 1: Kaksi kanavaa. p/(1 p) ) bittiä lähetystä kohti. Voidaan

Evoluutioekologia

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Tasapainotilaan vaikuttavia tekijöitä

Harjoitus 7: NCSS - Tilastollinen analyysi

Martingaalit ja informaatioprosessit

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Rahoitustarkastuksen standardi 4.3i Operatiivisen riskin vakavaraisuusvaatimus LIITE 2

Paljonko maksat eurosta -peli

Ekvivalenssirelaatio. Määritelmä 2 Joukon A binäärinen relaatio R on ekvivalenssirelaatio, mikäli. Jos R on ekvivalenssirelaatio ja a A, niin joukkoa

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

LASKENNALLISEN TIETEEN OHJELMATYÖ: Diffuusion Monte Carlo -simulointi yksiulotteisessa systeemissä

Informaatio ja Strateginen käyttäytyminen

Matematiikassa väitelauseet ovat usein muotoa: jos P on totta, niin Q on totta.

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Pikalajittelu: valitaan ns. pivot-alkio esim. pivot = oikeanpuoleisin

Parametrin estimointi ja bootstrap-otanta

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Haitallinen valikoituminen

Bob Baileyn luento eläintenkoulutuksesta Heurekassa

Bifurkaatiot dierentiaaliyhtälöissä. Systeemianalyysin. Antti Toppila laboratorio. Teknillinen korkeakoulu

Diskreetin matematiikan perusteet Laskuharjoitus 1 / vko 8

Johdat us eläinplankt onin maail maan

Yhteistyötä sisältämätön peliteoria

Rekursioyhtälön ratkaisu ja anisogamia

Johdatus todennäköisyyslaskentaan Verkot ja todennäköisyyslaskenta. TKK (c) Ilkka Mellin (2004) 1

Harjoitus 6. KJR-C2001 Kiinteän aineen mekaniikan perusteet, IV/2016

Tehtäväsarja I Seuraavissa tehtävissä harjoitellaan erilaisia todistustekniikoita. Luentokalvoista 11, sekä voi olla apua.

f(n) = Ω(g(n)) jos ja vain jos g(n) = O(f(n))

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

Markov-kustannusmallit ja kulkuajat

Varian luku 12. Lähde: muistiinpanot on muokattu Varianin (2006, instructor s materials) muistiinpanoista

Johdatus matemaattiseen päättelyyn

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

S Laskennallinen systeemibiologia

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

12 Oligopoli ja monopolistinen kilpailu

Trafficars - Ruuhkaara

Insinöörimatematiikka A

Jalkapallovedonlyöntistrategioiden. evaluointi. Aleksi Avela Ohjaaja: Juho Roponen Valvoja: Ahti Salo

Peliteoria luento 2. May 26, Peliteoria luento 2

Aalto-yliopiston perustieteiden korkeakoulu Matematiikan ja systeemianalyysin laitos. MS-A0203 Differentiaali- ja integraalilaskenta 2, kevät 2016

V ar(m n ) = V ar(x i ).

Poisson-prosessien ominaisuuksia ja esimerkkilaskuja

Tekemällä oppiminen tuumasta toimeen yhteisöllisin työkaluin

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Transkriptio:

ESS oppiminen ja sen simulointi 8.10.2008

Suhteellinen palkkiosumma, RPS = = = = + + = = n i t i t i t i t i i n i i i i P m r P m r t f r r f 1 1 1 1 1 1 1 1 ) ( ) ( ) ( (1) τ τ τ τ τ τ Harleyn (1981) ehdottama sääntö ES-oppimiselle Todistus kokeellisesti, kritisoitu

RPS-Esimerkki S konsentraatiot B käyttäytyminen P palkkiot r - residuaalit / bias / oletus palkkiosta Peliä pelataan kierroksittain, jolloin valitaan käytös todennäköisyydellä: Pr( B Pr( B ) = S ) = S /( S1 /( S 1 2 1 2 1 + S2) + S ) 2

RPS-Esimerkki Esimerkin malli voisi kuvastaa kahta neurosolua Solut aktivoituvat riippuen suhteellisesta konsentraatiosta jotain ainetta (S) Konsentraatiota vähenee suhteessa kertoimeen m, S Sm Konsentraatiota lisääntyy määrällä (1-m)r Ilman palkkiota konsentraatiot ajautuvat määräksi r (kotitehtävänä osoittaa tämä)

Haluttuja ominaisuuksia - RPS I. Populaatio ajautuu ESS-tilaan, sillä rajoituksella, että mikään käyttäytyminen ei katoa kokonaan (johtuen r:stä) II. Kierroksen n peliin vaikuttaa kierroksen k<n peli enemmän kuin tätä aikasemman kierroksen h<k<n peli. (Unohtava vaikutus) III. Käyttäytyminen alussa riippuu täysin r:stä IV. Käyttäytymisen muutokset riippuvat suhteellisista määristä r:stä ja palkkioista

Haluttuja ominaisuuksia - RPS Jos r suuri: alk. käyttäytyminen muuttuu hitaasti Jos palkkiot ovat suuret suhteessa r:iin: käyttäytyminen painottuu nopeasti tiettyyn käytökseen r:t vastaavat oletusta palkkiosta Jos todellinen palkkio on pienempi, käyttäytymistä tulee muuttaa (eli jatkaa alkuperäistä satunnaista käytöstä) Jos todellinen palkkio on suurempi, käyttäytyminen tulee kohdistaa siihen mikä aiheuttaa palkkion (eli alkuperäinen satunnainen käytös tulee painottua enemmän suotuisaan käytökseen)

Oppimisen simulointi Harley esittää neljä eri simulointia (tässä siis kurssikirjan tulkinta)

(1/4). Kaksikätinen rosvo Kaksi mahdollista käytöstä B 1 ja B 2, Molemmilla vakio tod. saada palkkio. Näitä todennäköisyyksiä ei alussa tiedetä mutta ne voidaan estimoida yritysten kautta. Kun peliä on pelattu monta kierrosta todennäköisyydet voidaan estimoida. Tällöin ESS on että valitaan aina käytös jolla on suurempi todennäköisyys antaa palkkio. Hyvin lähellä RPS-oppimista

(1/4). Kaksikätinen rosvo

(2/4). Haukka-kyyhky peli 30 yksilöä pelaa haukka-kyyhky peliä Keskiarvo lähellä ESS:aa (80% kyyhkyjä) Yksilöt ajelehtivat huomattavasti

(2/4). Haukka-kyyhky peli

(3/4). Ruuan etsiminen (population foraging) Milinskyn 1979 toteuttama koe 6 kalaa akvaariossa syötettiin vesikirpuilla akvaarion molemmista päistä, niin että toisesta päästä syötettiin kaksin verroin toiseen päähän verrattuna ESS on kun kala ei hyödy siirtymällä toiseen päähän. Tässä tapauksessa ESS on kun 2 kalaa on vähemmän ruokittavassa päädyssä ja 4 enemmän ruokittavassa Kokeessa (kuva) todettiin, että ESS saavutetaan kun tarkastellaan kalojen keskimääräistä sijaintia. Kuitenkin yksittäiset kalat uivat akvaariota päästä päähän.

(3/4). Ruuan etsiminen (population foraging)

(3/4). Ruuan etsiminen (population foraging) Harley simuloi Milinskyn kokeita RPS oletuksella päätyen seuraaviin tuloksiin Harleyn simulaatio kun oletus palkkiosta (r) keskisuuri

(3/4). Ruuan etsiminen (population foraging) Harleyn simulaatio kun oletus palkkiosta (r) pieni

(3/4). Ruuan etsiminen (population foraging) Harleyn simulaatio kun oletus palkkiosta (r) suuri

(4/4). Concurrent variable-interval game Kaksi mahdollista käytöstä (vasen ja oikea), Molemmilla vakio tod. saada palkkio. (vrt. kaksikätinen rosvo) Kun valitaan vasen käsi se antaa palkkion vakio todennäköisyydellä, mutta samalla myös oikea käsi antaa palkkion sen vakio tod. Oikean käden antama palkkio ei kuitenkaan ole saatavissa ennen kuin valitaan oikea käsi. Kun jollain puolella on palkkio, ei sille puolelle anneta lisää palkkioita ennen kuin palkkio on käytetty. Vastaavasti kun valitaan oikea käsi, myös vasen antaa palkkion jota ei kuitenkaan nähdä ennen kuin valitaan vasen käsi

(4/4). Concurrent variable-interval game Jos täydennys todennäköisyydet p 1 ja p 2 ovat pieniä, voidaan kirjan mukaan osoittaa että ESS on valita 1 vaihtoehto tod. p 1 (p 1 +p 2 ) Kirjassa todetaan, että todellisuudessa eläimet saavuttavat tämän ESS:an (Heyman, 1979) ja että simulointi RPS:lla ajautuu myös samaiseen ESS:aan.

Ote kirjasta: An animal which performs the correct action correct in fitness-maximising terms when simultaneously experiencing hunger, thirst and sexual motivation, will, by definition, leave most offspring.

Henkilöitä John Maynard Smith Harley B Calvin Richard Dawkins

Sanastoa Daphnia - Vesikirppu Foraging - Ruoan etsiminen Concurrent - Samanaikainen Moth - Yöperhonen/Perhonen Warbler - Kerttu Replenishment - Täydennys Lähteet Maynard Smith (1982). Evolution and the Theory of Games. Cambridge University Press. Tracy & Seaman (1995). Properties of Evolutionarily Stable Learning Rules. J. theor. Biol. 177, 193-198

Kotitehtävä a) Kalvolla 3 on esitetty kirjan kuvaus RPS mekanismista. Osoita, että ilman palkkiota konsentraatiot lähenevät residuaaleja. b) Harley:tä ja Manyard Smith:iä on kritisoitu ES-oppimiseen liittyen. Selitä ja perustele omin sanoin jokin kritiikki.