Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

Samankaltaiset tiedostot
Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina

Implementation of Selected Metaheuristics to the Travelling Salesman Problem (valmiin työn esittely)

Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko

Evolutiivinen stabiilisuus populaation

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Vedonlyöntistrategioiden simulointi ja evaluointi

Experiment on psychophysiological responses in an economic game (valmiin työn esittely) Juulia Happonen

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Monte Carlo -menetelmä optioiden hinnoittelussa (valmiin työn esittely)

Laskelmointia mielen evoluutiosta

Menetelmä Markowitzin mallin parametrien estimointiin (valmiin työn esittely)

Evolutiivisesti stabiilin strategian oppiminen

Geneettiset algoritmit

Kirjallisuuskatsaus sisäpistemenetelmiin ja niiden soveltamiseen eri optimointiluokille (valmiin työn esittely)

Kaksintaistelun approksimatiivinen mallintaminen (valmiin työn esittely)

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Kopulafunktiot. Joonas Ollila 12. lokakuuta 2011

Lisäinformaation arvo monikriteerisessä projektiportfoliovalinnassa (valmiin työn esittely)

Opettaminen ja oppiminen

Tutkimustiedonhallinnan peruskurssi

SEKASTRATEGIAT PELITEORIASSA

Tuotantoprosessin optimaalinen aikataulutus (valmiin työn esittely)

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Puhelintukiasema-antennin säteilykuvion mittaus multikopterilla (Valmiin työn esittely)

Vestan kaudet 2008/

Lajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely)

Trimmitysongelman LP-relaksaation ratkaiseminen sarakkeita generoivalla algoritmilla ja brute-force-menetelmällä

Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto

Kenguru 2011 Cadet (8. ja 9. luokka)


Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Luento 5: Peliteoriaa

Ylikerroinstrategiat ja Poissonmallit vedonlyönnissä (aihe-esittely) Jussi Kolehmainen

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Search space traversal using metaheuristics

Strategiset valinnat. Taloustieteen perusteet Matti Sarvimäki

Strategiset valinnat Taloustieteen perusteet Matti Sarvimäki. A. Peliteorian alkeet. Johdanto. Johdanto 15/09/19

Optimaaliset riskinalentamisportfoliot vikapuuanalyysissä (valmiin työn esittely)

Sekastrategiat ja intensiiviyhteensopivuus

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Informaation leviäminen väkijoukossa matemaattinen mallinnus

Markov-ketjuja suurilla tila-avaruuksilla

Vesivoimaketjun optimointi mehiläisalgoritmilla (Valmiin työn esittely)

Seurantalaskimen simulointi- ja suorituskykymallien vertailu (valmiin työn esittely) Joona Karjalainen

Epälineaarinen hinnoittelu: Diskreetin ja jatkuvan mallin vertailu

Sisällysluettelo. 1. Johdanto

Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Cubature Integration Methods in Non-Linear Kalman Filtering and Smoothing (valmiin työn esittely)

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Yhteistyötä sisältämätön peliteoria jatkuu

Polkuriippuvuus trade-off-painotuksessa (valmiin työn esittely)

Kertomustaulut. Johdanto. Pakkauksen sisältö

Optimization of Duties in Railway Traffic (valmiin työn esittely)

Minimilatenssiongelman ratkaisualgoritmeja (valmiin työn esittely)

Paljonko maksat eurosta -peli

Pelien teoriaa: tasapainokäsitteet

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Inferring Trichoderma reesei gene regulatory network

Avainsanat: peli, matematiikka, polynomi, yhteen- ja vähennyslasku, kertolasku

Yleistä tietoa kokeesta

SUBSTANTIIVIT 1/6. juttu. joukkue. vaali. kaupunki. syy. alku. kokous. asukas. tapaus. kysymys. lapsi. kauppa. pankki. miljoona. keskiviikko.

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ohjeistus pöytäkirjan käyttöön. Suomen Lentopalloliitto ry

Uppgårds Fotisgolf. Tällä radalla pitää potkaista pallo alustalta reikään joka sijaitsee juuri ratalipun kohdalla.

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Kuva 1. Mittauspiste HH1. Asuinkiinteistö, raja-arvo 55 db päiväaikaan (klo 7-22) ja 50 db yöaikaan (klo 22-7).

Gaussiset prosessit derivaattahavainnoilla regressio-ongelmassa (valmiin työn esittely)

PELITEORIAN PERUSTEITA

Sekastrategia ja Nash-tasapainon määrääminen

Suomalaisen jääkiekon strategia

SUOMEN DARTSLIITTO. SM-LIIGA Kierroksen tulokset ### ### ### ### ### ### ### ### ### ###

Tilastollinen aineisto Luottamusväli

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Työvuorosuunnittelun optimointi (valmiin työn esittely)

Luodin massajakauman optimointi

Asiakaspalautteen monikanavainen keräys ja analyysi (valmiin työn esittely)

Portfoliolähestymistapa CO2 - kiilapelin analysoinnissa (valmiin työn esittely) Tuomas Lahtinen

Jalkapallovedonlyöntistrategioiden. evaluointi. Aleksi Avela Ohjaaja: Juho Roponen Valvoja: Ahti Salo

Probabilistiset mallit (osa 1) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 1 Jorma Merikoski Tampereen yliopisto

Likimääräisratkaisut ja regularisaatio

Lineaaristen monitavoiteoptimointitehtävien ratkaiseminen Bensonin algoritmilla

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Kustannustehokkaat riskienhallintatoimenpiteet kuljetusverkostossa (Valmiin työn esittely)

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

Sovellettu todennäköisyyslaskenta B

Luento 7. June 3, 2014

Markov-ketjut pitkällä aikavälillä

1 PÖYDÄT JA PALLOT 1. Kilpailuissa tulee käyttää Suomen Biljardiliiton hyväksymiä pöytiä ja palloja.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luento 5: Peliteoriaa

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Transkriptio:

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist 21.01.2013 Ohjaaja: Kimmo Berg Valvoja: Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki oikeudet pidätetään.

Vangin dilemma -peli

Yleinen vangin dilemma T>R>P>S

Toistettu peli Erilaisia strategioita: Petä koko ajan Tee yhteistyötä koko ajan Tee yhteistyötä vain jos vastapelaaja teki aiemmin Jatkuva pettäminen on on evolutiivisesti stabiili strategia. Sitä ei voi siis voittaa, jos joku pelaa sitä alun perin.

Häiriöinen tapaus Kuten edellä: valitaan C tai D Pelaaja saavuttaa pistemäärän tämän perusteella, mutta lisäksi mukana on normaalijakautunut virhetermi Esimerkiksi: Pelaaja 1: C Pelaaja 2: C Normaalisti saisivat 3 ja 3 pistettä, mutta lisäksi tulee virhetermi. Virhetermit esim. +1,2 ja -0,3. Pelaajat havaitsevat vain pistemäärät 4,2 ja 2,7.

Oma tutkimuskohde Populaatiossa p määrä strategiaa A ja 1-p määrä strategiaa B. Tavoite-strategia: Pelaa vaihtoehtoa C vain jos edellisessä kierroksella havaittiin ennalta valittua rajaa k suurempi pistemäärä. Esim: Havaittiin edellisellä pistemäärä 3,2 ja raja oli 2,0 Pelataan C:tä. Voiko tällainen strategia pärjätä jatkuvasti pettävälle strategialle, ja millä populaatio-osuudella p.

Markov-prosessi Tavoitestrategia vastaan toinen tavoitestrategia Prosessi koostuu tiloista T, R, P ja S. Tilansiirtotodennäköisyydet voidaan laskea kun tunnetaan virhetermin varianssi, arvot T, R, P ja S sekä tavoitteen rajat k1 ja k2 molemmille. Halutaan laskea, kuinka suurella todenäköisyydellä ollaan eri tiloissa äärettömän ajan kuluttua. Lasketaan siis tilansiirtomatriisin raja-arvo eli tässä tapauksessa stationaarinen jakauma. Saadaan helposti selville todennäköisyydet ja siten keskimääräinen pistemäärä toista strategiaa vastaan Pettävä strategia on tavoitestrategia, jonka tavoiteraja on äärettömän korkea.

Strategian menestys Pistemäärä = T*P(T)+R*P(R)+P*P(S)+S*P(S) Strategia voittaa toisen, jos se saa enemmän pisteitä. Kuvataan vaihtelevalla häiriön varianssilla ja tavoiterajalla, miten tavoitestrategia menestyy pettävää strategiaa vastaan kun T=5 R=3 P=1 S=0

Punainen: tavoitestrategia voittaa jollain populaatiosuhteella Keltainen: pettävä strategia voittaa aina

Vihreä alue: Pieni populaatiotiheys vaadittu Punainen alue: Suuri populaatiotiheys vaadittu

Parametrien vaikutus Parametrien valitseminen on mielivaltaista, jos ei ole kyseessä reaalimaailman sovellus. Tutkitaan miten tilanne muuttuu parametrien mukana (T, R, P ja S) Voidaan asettaa nollapiste valitsemalla S=0. Voidaan asettaa skaalaus valitsemalla P=1. Tutkittavaksi jää riippuvuus T:stä ja R:stä.

Miten suurilla häiriöillä tavoitestrategia voi päihittää vielä pettävän strategian?

Evoluutio Tavoitestrategia voittaa pettävän strategian, mutta mitä sitten tapahtuu? Esim. tavoitestrategia rajalla 2,20 ja syntyy uusi strategia joka pelaa arvolla 2,21. Jos aina uusi mutantti voittaa edellisen tavoitteen raja kasvaa ja strategia muuttuukin pettäväksi strategiaksi. Toisaalta voi käydä niin, että kehitys pysähtyy johonkin arvoon. Mitä tapahtuu, jos tätä arvoa vastaan tuleekin pettävä strategia?

Tässä strategia ajautuu ulos punaiselta alueelta punaiselle viivalle ja lopulta pettävä strategia valloittaa populaation.

Evoluutio Yleensä onneksi parempi tilanne. Lähtökohtana alkutilanne, joka on pärjännyt pettävälle strategialle. Tutkitaan, ajautuuko tavoitestrategia hyvän alueen sisäpuolelle vai ei. Kuinka suurilla häiriöillä ajaudutaan hyvälle alueelle?

Nähdään, että jos R ja T ovat lähes samat, ajaudutaan ulos alueelta.

Mitä iloa tästä kaikesta on? Ei mitään? Strategia oli hyvin yksinkertainen. Ei tarvinnut edes tietoa omista valinnoistaan. Silti yhteistyön ylläpito usein mahdollista. Jatkotutkimuksena voisi olla esimerkiksi strategia, joka käyttää eri tavoiterajaa riippuen siitä, mitä itse on valinnut siirrokseen.