Luento 6. June 1, 2015. Luento 6



Samankaltaiset tiedostot
Luento 7. June 3, 2014

Peliteoria luento 1. May 25, Peliteoria luento 1

Johdatus diskreettiin matematiikkaan Harjoitus 7,

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Luento 8. June 3, 2014

Peliteoria luento 2. May 26, Peliteoria luento 2

Johdanto peliteoriaan Kirja kpl. 2

Sekastrategia ja Nash-tasapainon määrääminen

Induktio kaavan pituuden suhteen

Epätäydellisen tiedon jatkuvat pelit

Luonnollisten lukujen laskutoimitusten määrittely Peanon aksioomien pohjalta

monissa laskimissa luvun x käänteisluku saadaan näyttöön painamalla x - näppäintä.

Ratkaisuehdotukset Kesäyliopisto Kuvassa on esitetty erään ravintolan lounasbuffetin kysyntäfunktio.

Matematiikan tukikurssi

Diskreetit rakenteet

Peliteoria luento 3. May 27, Peliteoria luento 3

Matematiikan tukikurssi 3.4.

Luento 5: Peliteoriaa

Kolmogorov-kompleksiteetti

SEKASTRATEGIAT PELITEORIASSA

2.7 Neliöjuuriyhtälö ja -epäyhtälö

Yhteistyötä sisältämätön peliteoria jatkuu

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Esimerkki 8. Ratkaise lineaarinen yhtälöryhmä. 3x + 5y = 22 3x + 4y = 4 4x 8y = r 1 + r r 3 4r 1. LM1, Kesä /68

Lisää segmenttipuusta

Luento 9. June 2, Luento 9

Oletetaan, että funktio f on määritelty jollakin välillä ]x 0 δ, x 0 + δ[. Sen derivaatta pisteessä x 0 on

Eksponenttifunktion Laplace muunnos Lasketaan hetkellä nolla alkavan eksponenttifunktion Laplace muunnos eli sijoitetaan muunnoskaavaan

Isännän Ääni- Seuraseminaari. Kokkola SJK - juniorit

Racket ohjelmointia II. Tiina Partanen 2015

MAA10 HARJOITUSTEHTÄVIÄ

2.2 Täydellinen yhtälö. Ratkaisukaava

Yleinen tietämys ja Nashin tasapaino

Perusopetuksen aamu- ja iltapäivätoiminnan laadun arviointi 2016 Västankvarns skola/ Tukiyhdistys Almus ry.

Kuntosaliharjoittelun kesto tunteina Kokonaishyöty Rajahyöty

Päätöksentekomenetelmät

5.2 Eulerin kehät ja -polut

Esitelmä saattohoidosta

Onnistunut liikkumissuunnitelma - ohjeet liikkumissuunnitelman tekemiseen

TW- EAV510: WDS- TOIMINTO KAHDEN TW- EAV510 LAITTEEN VÄLILLÄ

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

S5. IKKU-vaikuttavuustutkimuksen mittausten laadunvarmistus

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Tasapaino epätäydellisen tiedon peleissä

Johdatus L A TEXiin. 6. Omat komennot ja lauseympäristöt Markus Harju. Matemaattiset tieteet

Matematiikan tukikurssi

Sähköstaattisen potentiaalin laskeminen

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

Mitta ja integraaliteoria. Sirkka-Liisa Eriksson ja Pasi Vahimaa Tampereeen teknillinen yliopisto PL Tampere

Empatiaosamäärä. Nimi: ********************************************************************************

Rohkeus uudistua ja kasvaa. Uskallus uudistua, rohkeus rikkoja rajoja SMTS Helmiseminaari

MS-A Matriisilaskenta Laskuharjoitus 3

VALTAKUNNALLINEN VALINTAPERUSTESUOSITUS 2015

TILASTOLLINEN LAADUNVALVONTA

PHYS-C0220 Termodynamiikka ja statistinen fysiikka Kevät 2016

(x 0 ) = lim. Derivoimissääntöjä. Oletetaan, että funktiot f ja g ovat derivoituvia ja c R on vakio. 1. Dc = 0 (vakiofunktion derivaatta) 2.

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Ravintovartti, teemana lautasmalli

Derivaatan esittämisestä muutosnopeutena

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Toimialan ja yritysten uudistuminen

FSD2463 European Social Survey 2008: Suomen aineisto

VIITASAAREN KAUPUNGIN LUOTTAMUSHENKILÖIDEN PALKKIOSÄÄNTÖ (voimaantulo )

Luku 8. Ehrenfeucht-Fraïssé pelit. Osittaisisomorfismit

Yhteistyötä sisältämätön peliteoria

Johdatus yliopistomatematiikkaan, 2. viikko (2 op)

LUPAOSAKASLUETTELO (ns. yhteislupa) Liite hirvieläinten pyyntilupahakemukseen Sivu 1

Kari Ollikaisen Parhaita ajatuksia johtamisesta, laadusta ja muusta elämästä

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Ylä-Savon SOTE kuntayhtymän ASIAKASRAATI

KURSSIVALINNAT & YLIOPPILASKIRJOITUKSET

Joonas Korpisalo, Fysiikka harjoittelu, kausi Joonas tuli meille Ilvekseen keskellä kautta Juha Järvenpään Loukkaannuttua.

MIELENTERVEYSTYÖN OMAISSEMINAARI

1.7 Gradientti ja suunnatut derivaatat

Funktion raja-arvo 1/6 Sisältö ESITIEDOT: reaalifunktiot

Dynaamisen järjestelmän siirtofunktio

Tekijät: Hellevi Kupila, Katja Leinonen, Tuomo Talala, Hanna Tuhkanen, Pekka Vaaraniemi

Algoritmit 2. Luento 8 Ke Timo Männikkö

TimeEdit henkilökunnan ohje

Puheenjohtajana taloyhtiössä rooli ja vastuut

PELITEORIAN PERUSTEITA

HALLINTOTIETEIDEN MAISTERIN TUTKINTO Valintakoe Pisteet yhteensä (tarkastaja merkitsee)

Learning cafen yhteenveto. Helsinki

Numeeriset menetelmät

Nollasummapelit ja bayesilaiset pelit

Epäyhtälön molemmille puolille voidaan lisätä sama luku: kaikilla reaaliluvuilla a, b ja c on voimassa a < b a + c < b + c ja a b a + c b + c.

IV-kuntotutkimushanke_tutkijat

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Koululentistä ikäluokittain

Evolutiivisesti stabiilin strategian oppiminen

A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.

Osaamisen tunnistaminen/tunnustaminen

Kokemusasiantuntijan tarina. Kasvamista kokemusasiantuntijaksi

Jäämistösuunnittelu. Antti Kolehmainen Timo Räbinä

YHTEISKUNTATIETEIDEN JA FILOSOFIAN HAKUKOHTEEN VALINTAKOE TO klo (filosofia, sosiologia, valtio-oppi, yhteiskuntapolitiikka)

Kolme pientä opinto-ohjaajaa ja suuren suuri lukio

T&K- HANKKEISIIN ja OPINNÄYTETÖIHIN SOVELTUVIA ANALYYSIMENETELMIÄ

Aluksi Kahden muuttujan lineaarinen epäyhtälö

Peliteoria ja kalatalous YE4

Y56 laskuharjoitukset 6

Transkriptio:

June 1, 2015

Normaalimuodon pelissä on luontevaa ajatella, että pelaajat tekevät valintansa samanaikaisesti. Ekstensiivisen muodon peleissä pelin jonottaisella rakenteella on keskeinen merkitys. Aluksi käsittelemme pelejä, joissa pelaajien informaatio on täydellistä eli he tietävät mitä pelissä on tapahtunut siinä vaiheessa kun on heidän vuoronsa tehdä valinta. Pelien kuvaamiseen käytämme yleensä pelipuita.

Definition Ekstensiivisen muodon peli N,H,P,(u i ) koostuu pelaajien joukosta N, historioiden joukosta H, pelaajafunktiosta P ja pelaajien hyötyfunktioista. Historiat ovat jonoja pelaajien valintoja. Pelaajafunktio liittää jokaiseen ei-terminaaliseen historiaan pelaajan, jonka vuoro on tehdä valinta. Terminaaliset historiat ovat sellaisia, että peli päättyy ja niihin liittyy kullekin pelaajalle hyötyluku.

Pelin historiat toteuttavat seuraavat ominaisuudet i) Ø H, ii) jos ( a k ) K k=1 H niin ( a k) L H kaikille L < K, iii) jos jonolle k=1 ( a k ) k=1 pätee ( a k) K k=1 H kaikille K niin ( a k) k=1 H. Tulkinta on, että jokainen historia koostuu pelaajien teoista. Terminaalihistoria ( a k) K on sellainen, että ei ole olemassa k=1 a K+1 siten, että ( a k) K+1 H jollekin luvulle K, tai se on k=1 äärettömän pitkä. Pelaajafunktio liittää jokaiseen terminaalihistoriaan tyhjän joukon. Jos pelissä on vain äärellisen pitkiä historioita ja terminaalihistorioiden joukko on äärellinen peliä sanotaan äärelliseksi. Muutoin peli on ääretön.

Pelit, joissa ei ole äärettömän pitkiä historioita voidaan ratkaista algoritmisesti. Takaperoinen induktio on menetelmä, jolla voidaan löytää ainakin jotkut Nash-tasapainot ja lisäksi se löytää aina vähintään yhden tasapainon. Menetelmässä aloitetaan pelin lopusta ja määrätään optimaaliset valinnat. Sitten siirrytään askel lähemmäksi alkua ja tehdään sama. Teknisesti sanotaan, että aloitetaan lyhyimmistä osapeleistä ja siirrytään toiseksi lyhyimpiin jne. Tällä tavoin määrätään kullekin pelaajalle jokaisessa hänen päätössolmussaan optimaalinen päätös. Seuraavat esimerkit kuvaavat menetelmää.

Peli jossa takaperoinen induktio toimii hyvin.

Peli jossa takaperoinen induktio ei toimi niin hyvin kuin edellä.

Vielä yksi peli, jossa takaperoinen induktio ei toimi hyvin.

Peli, jossa takaperoinen induktio toimii liian hyvin.

Toisessa esimerkissä induktio ei tuota yksikäsitteistä vastausta, koska joissa päätössolmuissa pelaajat ovat indifferenttejä tekojen välillä. Kolmannessa esimerkissä ongelma on äärettömät historiat; ei ole lyhintä osapeliä josta induktion voisi aloittaa. Yleisesti ottaen takaperoinen induktio ei ole riittävän vahva menetelmä tasapainon määräämiseksi. Tästä syystä joudumme taas tyytymään Nash-tasapainoon ratkaisukäsitteenä. Joudumme tietysti ensin määrittelemään, mitä tarkoitetaan strategialla. Se ei ole triviaali käsite; sanallisesti strategia on täydellinen suunnitelma, mitä pelaaja tekee kussakin päästössolmussaan. Jopa niissä solmuissa, joita ei voida strategian mukaan saavuttaa.

Definition Pelaajan i strategia ekstensiivisen muodon pelissä N,H,P,(u i ) on funktio s i, joka liittää jokaiseen historiaan h, jolle P(h) = i alkion joukosta A i (h). Tämä määritelmä ei ole vielä täydellisen yksikäsitteinen. Strategian täydellinen määrittely vaatii enemmän koneistoa kuin meillä on käytössä tällä kurssilla. Yksityiskohtainen määrittely löytyy esimerkiksi teoksesta Klaus Ritzberger: Foundations of Non-Cooperative Game Theory.

Strategian määräämiseksi pitää olla selvillä, missä järjestyksessä pelaajien päätössolmuja käsitellään. Olkoon ensimmäisessä pelissä järjestys vasemmalta oikealle ja ylhäältä alas. Yksi strategia P1:lle olisi tällöin (d,u,u,m). P1:n puhtaiden strategioiden joukossa on 16 alkiota ja P2:n puhtaiden strategioiden joukossa 6 alkiota. Takaperoisella induktiolla saatu strategiaprofiili on (u,m,u,m;m,d), missä P1:n strategiat on annettu ensin.

Strategiat indusoivat terminaalhistorian, johon liittyyvät hyödyt kullekin pelaajalle. Ekstensiivisen muodon pelin Nash-tasapaino voidaan näin määritellä ihan kuten normaalimuodon peleille. Definition Ekstensiivisen muodon pelissä N,H,P,(u i ) strategiaprofiili s j N s j on Nash-tasapaino, ) jos jokaiselle pelaajalle i pätee u i (s i,s i ) u i (s i,s i kaikille s i S i. Monesti on hyvä ajatella, että terminaalihistoriat liittyvät reaalisiin tulemiin ja pelaajien hyödyt ovat seurausta näistä tulemista.

I Mallitetaan lopuksi historiallinen tapahtuma ekstensiivisen muodon pelinä. Kun Cortez rantautui Meksikoon hänellä oli vastassaan omia sotajoukkoja lukuisammat atsteekit. Varmistaakseen miestensä taistelutahdon ja tehdäkseen tämän selväksi atsteekeille hän poltti laivat, joilla retkikunta oli saapunut. Näin mitään pakotietä ei ollut. Atsteekit vetäytyivät kukkuloille sen sijaan, että olisivat taistelleet. Tässä on ohitettu muutamia historiallisesti tärkeitä seikkoja ja yksinkertaistettu kovasti. Oletetaan, että miehistön päätöksiä ei tarvitse mallittaa, vaan koska laivat on poltettu miehistö taistelee ankarasti.

I Kenties tämä peli kuvaa tilannetta.