Johdanto peliteoriaan Kirja kpl. 2



Samankaltaiset tiedostot
SEKASTRATEGIAT PELITEORIASSA

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Pelien teoriaa: tasapainokäsitteet

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Sekastrategia ja Nash-tasapainon määrääminen

Pohdiskeleva ajattelu ja tasapainotarkennukset

Luento 5: Peliteoriaa

Luento 8. June 3, 2014

Yhteistyötä sisältämätön peliteoria jatkuu

Nollasummapelit ja bayesilaiset pelit

Tasapaino epätäydellisen tiedon peleissä

PELITEORIAN PERUSTEITA

Epätäydellisen tiedon jatkuvat pelit

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Peliteoria luento 3. May 27, Peliteoria luento 3

Yhteistyötä sisältämätön peliteoria

Luento 5: Peliteoriaa

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Lyhyen aikavälin hintakilpailu 2/2

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17)

Sekastrategiat ja intensiiviyhteensopivuus

Y56 laskuharjoitukset 6

12 Oligopoli ja monopolistinen kilpailu

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Hintakilpailu lyhyellä aikavälillä

JOHDATUSTA PELITEORIAAN

Luento 7. June 3, 2014

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Peliteoria luento 1. May 25, Peliteoria luento 1

Johdatus peliteoriaan

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Luento 5: Peliteoria

Nollasummapelit ja muut yleisemmät summapelit

Peliteoria ja huutokauppamekanismit

Taloustieteen Nobel peliteorian kehittäjille

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Dynaaminen hintakilpailu ja sanattomat sopimukset

Luento 9. June 2, Luento 9

Signalointi: autonromujen markkinat

Luku 29 Peliteoria. Käsittelemme aluksi peliteorian peruskäsitteitä ja sanastoa, sitten katsomme itse pelejä.

Luento 6. June 1, Luento 6

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Evolutiivinen stabiilisuus populaation

Experiment on psychophysiological responses in an economic game (valmiin työn esittely) Juulia Happonen

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Miten osoitetaan joukot samoiksi?

Opettaminen ja oppiminen

Laskuharjoitus 2. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Peliteoria luento 2. May 26, Peliteoria luento 2

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

Pääasiallisena lähteenä: Motwani, R., Raghavan, P.: Randomized algorithms. Cambridge: Cambridge University Press, 1997,

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Yleinen tietämys ja Nashin tasapaino

Toistetun haukka-kyyhky -pelin numeerinen analysointi

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Informaatio ja Strateginen käyttäytyminen

Determinoiruvuuden aksiooma

Fuusio vai konkurssi? Hintakilpailun satoa

Datatähti 2019 loppu

Mikrotalousteoria 2, 2008, osa IV

Hex-pelin matematiikkaa

Peliteoria ja kalatalous YE4

isomeerejä yhteensä yhdeksän kappaletta.

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari

Strategiset valinnat. Taloustieteen perusteet Matti Sarvimäki

Paljonko maksat eurosta -peli

Evolutiivisesti stabiilin strategian oppiminen

verkkojen G ja H välinen isomorfismi. Nyt kuvaus f on bijektio, joka säilyttää kyseisissä verkoissa esiintyvät särmät, joten pari

Prof. Marko Terviö Assist. Jan Jääskeläinen

Äärellisten mallien teoria

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

Signalointi: kustannukseton signalointi (halpa puhe)

Kenguru 2012 Junior sivu 1 / 8 (lukion 1. vuosi)

Haitallinen valikoituminen: Kahden tyypin malli

58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia

Äärellisten mallien teoria

Talousmatematiikan perusteet: Luento 11. Lineaarinen optimointitehtävä Graafinen ratkaisu Ratkaisu Excel Solverilla

Johdatus verkkoteoriaan 4. luento

TALOUSTIETEEN LUENTOJEN TEHTÄVÄT

Johdatus graafiteoriaan

Algoritmit 2. Luento 10 To Timo Männikkö

Markkinoiden suunnittelu ja Gale-Shapley-algoritmi

2017 = = = = = = 26 1

Luento 3: Bayesiläiset pelit

Prospektiteoria. Systeemianalyysin. Antti Toppila. Esitelmä 4 3. helmikuuta laboratorio Aalto-yliopiston TKK

Uusien keksintöjen hyödyntäminen

Talousmatematiikan perusteet: Luento 12. Lineaarinen optimointitehtävä Graafinen ratkaisu Ratkaisu Excel Solverilla

Lineaarialgebra ja matriisilaskenta I

Kokonaislukuoptiomointi Leikkaustasomenetelmät

ESSEE-TEHTÄVÄT 1. KYSYMYS

Matemaatiikan tukikurssi

Johdatus logiikkaan I Harjoitus 4 Vihjeet

Transkriptio:

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 1 Johdanto peliteoriaan Kirja kpl. 2 Ilkka Leppänen 20.1.2010

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 2 Aiheet Laajennettu muoto Normaalimuoto Sekastrategiat Nashin tasapaino Sovellusesimerkki:duopoli

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 3 Game theory is a bag of analytical tools designed to help us understand the phenomena that we observe when decision-makers interact. The basic assumptions that underlie the theory are that decision-makers pursue well-defined exogenous objectives (they are rational) and take into account their knowledge or expectations of other decision-makers behavior (they reason strategically). Osborne, M. & Rubinstein, A. 1994. AQ Course in Game Theory, MIT Press.

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 4 Laajennettu muoto Esitys: pelipuu Pelien muodot Normaalimuoto (strateginen muoto) Esitys: bi-matriisi Usein peli järkevä kuvata numeroituna listana tapahtumia, esim: 1. Pelaaja 1 valitsee 1 [U,D] 2. Pelaaja 2 ei havaitse pelaajan 1 valintaa, ja valitsee 2 [L,R] 3. Tuotot ovat π 1 ( 1, 2 ) ja π 2 ( 1, 2 )

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 5 Laajennettu muoto Laajennetun muodon pelissä on kolme elementtiä: Pelaajien joukko {1,2,...,N} Pelipuu joka koostuu solmuista ja päätössolmuista t T Tuottojen joukko eli hyötyfunktiot π (t) Pelipuulla on puuominaisuus: kukin polku p t aloitussolmusta päätössolmuun t on yksikäsitteinen Äärellisyys: sekä pelaajien määrä että päätössolmujen määrä oletetaan äärelliseksi Satunnainen tapahtuma voidaan esittää luonto-pelaajan valintana

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 6 Laajennettu muoto Informaatiojoukko on joukko solmuja joissa pelaaja tietää olevansa; kaikissa solmuissa on samat valintamahdollisuudet Jos informaatiojoukko on yksikköjoukko, pelaajalla on täydellinen informaatio siitä mitä tapahtui edellä Jos infomaatiojoukossa on kaksi tai useampi solmua, pelaaja ei tiedä yksikäsitteisesti mitä on tapahtunut

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 7 Laajennettu muoto Strategia s määrittää pelaajalle valinnan jokaisessa :n informaatiojoukossa Pelin strategiaprofiili s=(s 1,...,s n ), eli kaikkien pelaajien strategiat, määrittää kunkin pelaajan tuoton π (s) Täydellisen informaation peleissä π (s)=π (t) Epätäydellisen informaation peleissä π (s)= t T p(s,t)π (t), jossa p(s,t) on niiden todennäköisyyksien tulo jotka liittyvät polkuun p t joissa luonto liikkuu; jos luonto ei liiku polulla p t, on p(s,t)=1

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 8 Laajennettu muoto Alicen strategiat ovat {LL,LR,RL,RR}, Bobin {, d,d,dd}; luonto valitsee B tai S Jos valinnat ovat esim. A =LL, B =, ovat tuotot π A (LL, )=p(b)π A (LL, B)+p(S)π A (LL, S)= 0.6 4+0.4 6=4.8 π B (LL, )=p(b)π B (LL, B)+p(S)π B (LL, S)= 0.6 4+0.4 4=4.0

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 9 Normaalimuoto Normaalimuodon peleissä on kolme elementtiä: Pelaajien joukko {1,2,...,N} Strategioiden joukko S pelaajalle : strategiaprofiili s=(s 1,s 2,...,s N ), jossa s S on pelaajan strategia Tuottojen joukko eli hyötyfunktiot π (s)

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 10 Sekastrategiat Pelaaja arpoo eri puhtaiden strategioiden s 1,...,s k väliltä σ=p 1 s 1 + +p k s k, jossa p j [0,1] ja p j =1 Normaalimuodon pelissä sekastrategiaprofiili σ=(σ 1,...,σ N ) kertoo kunkin pelaajan valitseman sekastrategian Tuotot voidaan määrittää sekastrategiaprofiilin avulla: π (σ)= s 1 S 1 s N S N p s1 p s2 p sn π (s 1,...,s N )

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 11 Nashin tasapaino (Notaatio: tarkoittaa puheena olevaa pelaajaa ja jotakin toista pelaajaa) Strategiaprofiili σ =(σ 1,...,σ N ) on Nashin tasapaino jos kaikille ja σ ΔS pätee π (σ ) π (σ,σ ), jossa ΔS pelaajan sekastrategioiden joukko Nashin tasapainossa kunkin valitsema strategia on paras vaste muiden valitsemille strategioille

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 12 Miten löytää Nashin tasapaino? Puhtailla strategioilla: eliminoi dominoidut strategiat Helppo tapa löytää matriisista: Käsittele ensin rivipelaajaa Alleviivaa kukin rivipelaajan tuotto joka on paras vaste sarakepelaajan valinnalle Käsittele sitten sarakepelaaja samaan tapaan Puhdasstrategia-Nash on sellainen ruutu jossa molemmat alkiot alleviivattu

Miten löytää Nashin tasapaino? Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 13

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 14 Peliteorian perusteoreema John F. Nash 1950: Equilibrium Points in n-person Games, Proc Nat Acad Sci 36 Jos kullakin pelaajalla N-pelaajan pelissä on äärellinen määrä puhtaita strategioita, niin silloin pelissä on (ei välttämättä yksikäsitteinen) Nashin tasapaino sekastrategioilla Sekastrategia-käsite siis takaa Nashin tasapainon olemassaolon! Nashin tasapaino on olemassa ainakin sekastrategioilla; on mahdollista että se on olemassa myös puhtailla strategioilla, muttei aina

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 15 Sekastrategioiden ratkaiseminen Sarakepelaajalla strategia σ=αl+(1 α)r Tällöin rivipelaajan molempien valintojen U ja D tuottojen on oltava yhtäsuuret σ:aa vasten Saadaan ehto α 1 +(1 α)b 1 =αc 1 +(1 α)d 1 josta ratkaistaan α: α= d 1 b 1 d 1 b 1 + 1 c 1

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 16 Sekastrategioiden ratkaiseminen Rivipelaajalla strategia τ=βu+(1 β)d Saadaan ehto β 2 +(1 β)c 2 =βb 2 +(1 β)d 2 josta voidaan taas ratkaista β

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 17 Sovellusesimerkki: duopoli Epätäydellinen kahden yrityksen kilpailu Pelaajat: yritys A ja yritys B Strategiat: tuotantomäärävalinnat q A,q B [3,4,...,15] Tuotot: π =q (30 q A q B ) 6q Jos valinnat ovat vaiheittaisia ja A valitsee ennen B:tä s.e. B havaitsee A:n valinnan, on kyseessä von Stackelbergin duopoli Jos valinnat samanaikaisia, on kyseessä Cournotin duopoli Strategiat voivat olla myös hintoja, jolloin tuottofunktiot muuttuvat

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 18 Cournot Duopoli Molemmat valitsevat samanaikaisesti, eli optimoivat vasten arveluitaan toisen optimaalisesta valinnasta Von Stackelberg A valitsee ensin eli reagoi vasten arveluaan B:n optimaalisesta valinnasta B valitsee A:n jälkeen eli optimoi A:n valintaa vasten reaktiofunktiollaan

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 19 Kotitehtävä 1.1 (2 pistettä) a) Etsi puhdasstrategia-nashin tasapaino(t) oheiselle pelille b) Oleta että peli on vaiheittainen, ja sarakepelaaja päättää vasta nähtyään mitä rivipelaaja päätti. Esitä tämä peli laajennetussa puumuodossa

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 20 Kotitehtävä 1.2 (2 pistettä) Katso pelimatriisia kalvolla 15 Oleta numeroarvot 1 =2, 2 =1, b 1 =0,b 2 =2, c 1 =1,c 2 =2, ja d 1 =3,d 2 =0. Onko tällä pelillä puhdasstrategia-nashin tasapainoja? Etsi sen sekastrategia-nashin tasapainot.

Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 21 Kotitehtävä 1.3 (2 pistettä) Etsi sekastrategia-nashin tasapainot kotitehtävän 1.1 pelille TAI Etsi netistä/kirjallisuudesta tietoa sukupuolten taistelu -pelistä (battle of the sexes) ja kirjoita siitä puolen sivun miniessee. Pohdi miksi peliteoriassa usein puhutaan juuri tästä pelistä, ja mikä tekee siitä sopivan tiettyihin vuorovaikutustilanteisiin.