Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 1 Johdanto peliteoriaan Kirja kpl. 2 Ilkka Leppänen 20.1.2010
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 2 Aiheet Laajennettu muoto Normaalimuoto Sekastrategiat Nashin tasapaino Sovellusesimerkki:duopoli
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 3 Game theory is a bag of analytical tools designed to help us understand the phenomena that we observe when decision-makers interact. The basic assumptions that underlie the theory are that decision-makers pursue well-defined exogenous objectives (they are rational) and take into account their knowledge or expectations of other decision-makers behavior (they reason strategically). Osborne, M. & Rubinstein, A. 1994. AQ Course in Game Theory, MIT Press.
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 4 Laajennettu muoto Esitys: pelipuu Pelien muodot Normaalimuoto (strateginen muoto) Esitys: bi-matriisi Usein peli järkevä kuvata numeroituna listana tapahtumia, esim: 1. Pelaaja 1 valitsee 1 [U,D] 2. Pelaaja 2 ei havaitse pelaajan 1 valintaa, ja valitsee 2 [L,R] 3. Tuotot ovat π 1 ( 1, 2 ) ja π 2 ( 1, 2 )
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 5 Laajennettu muoto Laajennetun muodon pelissä on kolme elementtiä: Pelaajien joukko {1,2,...,N} Pelipuu joka koostuu solmuista ja päätössolmuista t T Tuottojen joukko eli hyötyfunktiot π (t) Pelipuulla on puuominaisuus: kukin polku p t aloitussolmusta päätössolmuun t on yksikäsitteinen Äärellisyys: sekä pelaajien määrä että päätössolmujen määrä oletetaan äärelliseksi Satunnainen tapahtuma voidaan esittää luonto-pelaajan valintana
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 6 Laajennettu muoto Informaatiojoukko on joukko solmuja joissa pelaaja tietää olevansa; kaikissa solmuissa on samat valintamahdollisuudet Jos informaatiojoukko on yksikköjoukko, pelaajalla on täydellinen informaatio siitä mitä tapahtui edellä Jos infomaatiojoukossa on kaksi tai useampi solmua, pelaaja ei tiedä yksikäsitteisesti mitä on tapahtunut
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 7 Laajennettu muoto Strategia s määrittää pelaajalle valinnan jokaisessa :n informaatiojoukossa Pelin strategiaprofiili s=(s 1,...,s n ), eli kaikkien pelaajien strategiat, määrittää kunkin pelaajan tuoton π (s) Täydellisen informaation peleissä π (s)=π (t) Epätäydellisen informaation peleissä π (s)= t T p(s,t)π (t), jossa p(s,t) on niiden todennäköisyyksien tulo jotka liittyvät polkuun p t joissa luonto liikkuu; jos luonto ei liiku polulla p t, on p(s,t)=1
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 8 Laajennettu muoto Alicen strategiat ovat {LL,LR,RL,RR}, Bobin {, d,d,dd}; luonto valitsee B tai S Jos valinnat ovat esim. A =LL, B =, ovat tuotot π A (LL, )=p(b)π A (LL, B)+p(S)π A (LL, S)= 0.6 4+0.4 6=4.8 π B (LL, )=p(b)π B (LL, B)+p(S)π B (LL, S)= 0.6 4+0.4 4=4.0
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 9 Normaalimuoto Normaalimuodon peleissä on kolme elementtiä: Pelaajien joukko {1,2,...,N} Strategioiden joukko S pelaajalle : strategiaprofiili s=(s 1,s 2,...,s N ), jossa s S on pelaajan strategia Tuottojen joukko eli hyötyfunktiot π (s)
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 10 Sekastrategiat Pelaaja arpoo eri puhtaiden strategioiden s 1,...,s k väliltä σ=p 1 s 1 + +p k s k, jossa p j [0,1] ja p j =1 Normaalimuodon pelissä sekastrategiaprofiili σ=(σ 1,...,σ N ) kertoo kunkin pelaajan valitseman sekastrategian Tuotot voidaan määrittää sekastrategiaprofiilin avulla: π (σ)= s 1 S 1 s N S N p s1 p s2 p sn π (s 1,...,s N )
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 11 Nashin tasapaino (Notaatio: tarkoittaa puheena olevaa pelaajaa ja jotakin toista pelaajaa) Strategiaprofiili σ =(σ 1,...,σ N ) on Nashin tasapaino jos kaikille ja σ ΔS pätee π (σ ) π (σ,σ ), jossa ΔS pelaajan sekastrategioiden joukko Nashin tasapainossa kunkin valitsema strategia on paras vaste muiden valitsemille strategioille
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 12 Miten löytää Nashin tasapaino? Puhtailla strategioilla: eliminoi dominoidut strategiat Helppo tapa löytää matriisista: Käsittele ensin rivipelaajaa Alleviivaa kukin rivipelaajan tuotto joka on paras vaste sarakepelaajan valinnalle Käsittele sitten sarakepelaaja samaan tapaan Puhdasstrategia-Nash on sellainen ruutu jossa molemmat alkiot alleviivattu
Miten löytää Nashin tasapaino? Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 13
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 14 Peliteorian perusteoreema John F. Nash 1950: Equilibrium Points in n-person Games, Proc Nat Acad Sci 36 Jos kullakin pelaajalla N-pelaajan pelissä on äärellinen määrä puhtaita strategioita, niin silloin pelissä on (ei välttämättä yksikäsitteinen) Nashin tasapaino sekastrategioilla Sekastrategia-käsite siis takaa Nashin tasapainon olemassaolon! Nashin tasapaino on olemassa ainakin sekastrategioilla; on mahdollista että se on olemassa myös puhtailla strategioilla, muttei aina
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 15 Sekastrategioiden ratkaiseminen Sarakepelaajalla strategia σ=αl+(1 α)r Tällöin rivipelaajan molempien valintojen U ja D tuottojen on oltava yhtäsuuret σ:aa vasten Saadaan ehto α 1 +(1 α)b 1 =αc 1 +(1 α)d 1 josta ratkaistaan α: α= d 1 b 1 d 1 b 1 + 1 c 1
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 16 Sekastrategioiden ratkaiseminen Rivipelaajalla strategia τ=βu+(1 β)d Saadaan ehto β 2 +(1 β)c 2 =βb 2 +(1 β)d 2 josta voidaan taas ratkaista β
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 17 Sovellusesimerkki: duopoli Epätäydellinen kahden yrityksen kilpailu Pelaajat: yritys A ja yritys B Strategiat: tuotantomäärävalinnat q A,q B [3,4,...,15] Tuotot: π =q (30 q A q B ) 6q Jos valinnat ovat vaiheittaisia ja A valitsee ennen B:tä s.e. B havaitsee A:n valinnan, on kyseessä von Stackelbergin duopoli Jos valinnat samanaikaisia, on kyseessä Cournotin duopoli Strategiat voivat olla myös hintoja, jolloin tuottofunktiot muuttuvat
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 18 Cournot Duopoli Molemmat valitsevat samanaikaisesti, eli optimoivat vasten arveluitaan toisen optimaalisesta valinnasta Von Stackelberg A valitsee ensin eli reagoi vasten arveluaan B:n optimaalisesta valinnasta B valitsee A:n jälkeen eli optimoi A:n valintaa vasten reaktiofunktiollaan
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 19 Kotitehtävä 1.1 (2 pistettä) a) Etsi puhdasstrategia-nashin tasapaino(t) oheiselle pelille b) Oleta että peli on vaiheittainen, ja sarakepelaaja päättää vasta nähtyään mitä rivipelaaja päätti. Esitä tämä peli laajennetussa puumuodossa
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 20 Kotitehtävä 1.2 (2 pistettä) Katso pelimatriisia kalvolla 15 Oleta numeroarvot 1 =2, 2 =1, b 1 =0,b 2 =2, c 1 =1,c 2 =2, ja d 1 =3,d 2 =0. Onko tällä pelillä puhdasstrategia-nashin tasapainoja? Etsi sen sekastrategia-nashin tasapainot.
Aalto-yliopiston TKK Mat-2.4142 K2010 Esitelmä 1 Ilkka Leppänen 21 Kotitehtävä 1.3 (2 pistettä) Etsi sekastrategia-nashin tasapainot kotitehtävän 1.1 pelille TAI Etsi netistä/kirjallisuudesta tietoa sukupuolten taistelu -pelistä (battle of the sexes) ja kirjoita siitä puolen sivun miniessee. Pohdi miksi peliteoriassa usein puhutaan juuri tästä pelistä, ja mikä tekee siitä sopivan tiettyihin vuorovaikutustilanteisiin.