Luento 5: Peliteoriaa



Samankaltaiset tiedostot
Luento 5: Peliteoriaa

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Luento 5: Peliteoria

SEKASTRATEGIAT PELITEORIASSA

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Yleinen tietämys ja Nashin tasapaino

Johdanto peliteoriaan Kirja kpl. 2

12 Oligopoli ja monopolistinen kilpailu

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Pohdiskeleva ajattelu ja tasapainotarkennukset

Sekastrategia ja Nash-tasapainon määrääminen

Luento 7. June 3, 2014

PELITEORIAN PERUSTEITA

Nollasummapelit ja bayesilaiset pelit

Pelien teoriaa: tasapainokäsitteet

Peliteoria ja huutokauppamekanismit

Sekastrategiat ja intensiiviyhteensopivuus

Yhteistyötä sisältämätön peliteoria

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Y56 laskuharjoitukset 6

Hintakilpailu lyhyellä aikavälillä

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Solmu 3/2001 Solmu 3/2001. Kevään 2001 ylioppilaskirjoitusten pitkän matematiikan kokeessa oli seuraava tehtävä:

Täydellinen kilpailu: markkinoilla suuri määrä yrityksiä. ----> Yksi yritys ei vaikuta hyödykkeen markkinahintaan.

Peliteoria luento 1. May 25, Peliteoria luento 1

Yhteistyötä sisältämätön peliteoria jatkuu

Luento 8. June 3, 2014

r > y x z x = z y + y x z y + y x = r y x + y x = r

TALOUSTIETEEN LUENTOJEN TEHTÄVÄT

JOHDATUSTA PELITEORIAAN

XXIII Keski-Suomen lukiolaisten matematiikkakilpailu , tehtävien ratkaisut

Johdatus peliteoriaan

Lyhyen aikavälin hintakilpailu 2/2

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Luento 9. June 2, Luento 9

1 Ensimmäisen asteen polynomifunktio

Matemaattisen analyysin tukikurssi

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Dynaaminen hintakilpailu ja sanattomat sopimukset

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Matematiikan johdantokurssi, syksy 2017 Harjoitus 8, ratkaisuista

Epätäydellisen tiedon jatkuvat pelit

Luento 6: Monitavoiteoptimointi

Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa.

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Tyyppi metalli puu lasi työ I II III

PRELIMINÄÄRIKOE. Pitkä Matematiikka

Sopimusteoria: Salanie luku 3.2

3. Kongruenssit. 3.1 Jakojäännös ja kongruenssi

Harjoitus 7: vastausvihjeet

Luento 6: Monitavoitteinen optimointi

Matematiikan tukikurssi, kurssikerta 3

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

} {{ } kertaa jotain

Paljonko maksat eurosta -peli

Matematiikan tukikurssi

Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17)

f(x, y) = x 2 y 2 f(0, t) = t 2 < 0 < t 2 = f(t, 0) kaikilla t 0.

2 Yhtälöitä ja epäyhtälöitä

1 Komparatiivinen statiikka ja implisiittifunktiolause

KA , tentti (mikrotaloustieteen osuus), luennoitsija Mai Allo

3.1 Väliarvolause. Funktion kasvaminen ja väheneminen

Vanhoja koetehtäviä. Analyyttinen geometria 2016

Talousmatematiikan perusteet: Luento 12. Lineaarinen optimointitehtävä Graafinen ratkaisu Ratkaisu Excel Solverilla

Probabilistiset mallit (osa 1) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 1 Jorma Merikoski Tampereen yliopisto

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Matematiikan tukikurssi

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Lineaarinen optimointitehtävä

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo Ratkaisut ja pisteytysohjeet

Harjoitus 1 ( )

y=-3x+2 y=2x-3 y=3x+2 x = = 6

Matematiikan tukikurssi

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Talousmatematiikan perusteet: Luento 14. Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Kaikkiin tehtäviin ratkaisujen välivaiheet näkyviin! Lue tehtävänannot huolellisesti. Tee pisteytysruudukko B-osion konseptin yläreunaan!

1. Kuntosalilla on 8000 asiakasta, joilla kaikilla on sama salikäyntien kysyntä: q(p)= P, missä

Pyramidi 4 Analyyttinen geometria tehtävien ratkaisut sivu 352 Päivitetty Pyramidi 4 Luku Ensimmäinen julkaistu versio

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo 10-13

Diofantoksen yhtälön ratkaisut

1. Olkoot f ja g reaalifunktioita. Mitä voidaan sanoa yhdistetystä funktiosta g f, jos a) f tai g on rajoitettu? b) f tai g on jaksollinen?

Mat Dynaaminen optimointi, mallivastaukset, kierros 5

1 2 x2 + 1 dx. (2p) x + 2dx. Kummankin integraalin laskeminen oikein (vastaukset 12 ja 20 ) antaa erikseen (2p) (integraalifunktiot

Prof. Marko Terviö Assist. Jan Jääskeläinen

Kertaus. x x x. K1. a) b) x 5 x 6 = x 5 6 = x 1 = 1 x, x 0. K2. a) a a a a, a > 0

Prof. Marko Terviö Assist. Jan Jääskeläinen

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

1. Etsi seuraavien funktioiden kriittiset pisteet ja tutki niiden laatu: (a.) f(x,y) = 20x 2 +10xy +5y 2 (b.) f(x,y) = 4x 2 2y 2 xy +x+2y +100

Matematiikan peruskurssi 2

Tehtävät 1/10. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Matematiikan tukikurssi

Ratkaisuehdotus 2. kurssikokeeseen

Voidaan laskea siis ensin keskimääräiset kiinteät kustannukset AFC: /10000=10

Transkriptio:

Luento 5: Peliteoriaa Tässä kappaleessa tutustutaan hieman peliteoriaan. Keskeisiä asioita ovat Nash-tasapaino ja sekastrategia. Cournot n duopolimalli vuodelta 1838 toimii oivallisena havainnollistuksena Nash-tasapainon ymmärtämiseen. Cournot n duopolimalli Tarkastellaan Cournot n duopolimallia. Mallissa on kaksi yritystä, jotka tuottavat homogeenista tuotetta samoille markkinoille. Merkitään yrityksen yksi tuotantomäärää q 1 :llä ja yrityksen kaksi q 2 :lla. Olkoon kummallakin yrityksellä yksikkötuotantokustannus sama, c. Tuotteen hinta määräytyy varsin yleisin ehdoin seuraavasti: P(q 1,q 2 ) = a (q 1 + q 2 ), missä a on positiivinen vakio. Hintaan siis vaikuttavat molempien yritysten tuotantomäärät. Tarkastellaan ensin tilannetta, jossa yritykset päättävät tuotantomäärät samanaikaisesti, tietämättä toisen valinnasta. Merkitään yritysten saamaa hyötyä π:llä. Ensimmäisen yrityksen saama hyöty on π 1 (q 1,q 2 ) = q 1 P(q 1,q 2 ) q 1 c = q 1 (a (q 1 + q 2 ) c) (1) ja vastaavasti yritykselle kaksi π 2 (q 1,q 2 ) = q 2 (a (q 1 + q 2 ) c) (2) Luonnollisesti yritykset yrittävät maksimoida omaa hyötyä, eli 1. yrityksen tuotantomäärä ratkaisee tehtävän max π 1 (q 1,q 2 ) q 1 Q 1 oletetulla q 2 ja Q on yrityksen 1 strategiajoukko, esimerkiksi q 1 [0,a]. Samalla tavalla yritykselle 2. Optimointitehtävän välttämättömästä ehdosta - optimi on derivaatan nollakohdassa - ensimmäiselle yritykselle π 1 (q 1,q 2 ) q 1 = a 2q 1 q 2 c = 0 q 1 = 1 2 (a q 2 c) (3) 1

ja vastaavasti toiselle yritykselle π 2 (q 1,q 2 ) q 2 = 0 q 2 = 1 2 (a q 1 c) (4) Lasketut strategiat ovat todella maksimit, koska molempien hyötyfunktioiden toinen derivaatta on 2 π i (q 1,q 2 ) = 2 < 0 qi 2 On siis saatu kaksi yhtälöä, (3) ja (4), joissa on 2 tuntematonta q 1 ja q 2. Yhtälöparin ratkaisu on q 1 = q 2 = a c (5) 3 Tämä strategia on siis molemmille yrityksille optimaalinen. Sijoittamalla tämä tulos kaavoihin (1) ja (2) saadaan molempien yritysten hyödyksi π i (q 1,q 2 ) = 1 9 (a c)2 (6) Tarkastellaan seuraavaksi tehtävän ratkaisemista graafisesti. Kaava (3) antaa parhaimman vasteen yritykselle 1 yrityksen 2 tuotantomäärään. Esimerkiksi, jos yritys 2 ei tuota ollenkaan, yrityksen 1 optimaalinen tuotantomäärä on q 1 = 1 (a c) 2 Laskemalla paras vaste kaikilla toisen yrityksen tuotantomäärillä, molemmille yrityksille, saadaan kuva 1 Suorien leikkauspisteessä molempien yritysten paras vaste toisen yrityksen tuotantomäärään on tämä leikkauspiste, eli ollaan tasapainossa. Määrittämällä suorien leikkauspisteiden koordinaatit saadaan q 1 = q 2 = a c 3 mikä on sama kuin kaava (5), kuten pitikin. Tarkastellaan seuraavaksi tilannetta, missä yritykset tekevät yhteistyötä, kysymys on siis kartellista. Nyt yritykset valitsevat tuotantomäärät siten, että yhteinen hyöty π 1 (q 1,q 2 )+π 2 (q 1,q 2 ) = π 12 (q 1,q 2 ) = q 1 (a (q 1 +q 2 ) c)+q 2 (a (q 1 +q 2 ) c) 2

Kuva 1: Parhaimmat vasteet ja Nash-tasapaino maksimoituu. Tämän tehtävän ratkaisu on osittaisderivaattojen nollakohta π 12 (q 1,q 2 ) q 1 = a 2(q 1 + q 2 ) c = 0 π 12 (q 1,q 2 ) q 2 = a 2(q 1 + q 2 ) c = 0 q 1 = q 2 = a c 4 (7) Tällä strategialla molempien yritysten tuotoksi saadaan (sijoitus kaavoihin (3) ja (4)) π 1 = π 2 = 1 (a c)2 8 Jos tätä tulosta verrataan ensimmäisen tilanteen tulokseen, kaava (6), huomataan, että tekemällä yhteistyötä voidaan saavuttaa suurempi hyöty kuin ilman yhteistyötä. Nash-tasapaino Edellisen kappaleen ensimmäisessä tilanteessa ratkaisu oli sellainen piste, joka on paras vaste toisen strategiaan. Tätä pistettä kutsutaan Nash-tasapainoksi 3

(toisinaan puhutaan Cournot-Nashin tasapainosta). Edellisen kappaleen toisessa tilanteessa (kartelli) molemmat yritykset saavat suuremman hyödyn kuin Nash-tasapainossa. Miksi tämä piste ei sitten ole Nash-tasapaino? Oletetaan nyt, että peliä pelataan monta kierrosta. Olkoot yritykset sopineet pelaavansa kartellistrategiaa, q 1 = q 2 = a c, jolloin molempien hyöty 4 on π 1 = π 2 = (a c)2. Yritys 2(1) kuitenkin huomaa, että se voi saavuttaa suuremman hyödyn pelaamalla parhaimman vasteen strategiaa sillä oletuksella, 8 että yritys 1(2) pelaa kartellistrategiaa. Seuraavalla kierroksella yritys 1 huomaa, että yritys 2 on vaihtanut strategiaa, jolloin sen ei enää kannata pelata kartellistrategiaa, vaan parhaimman vasteen. Sitä seuraavalla yritys 2 vastaavasti huomaa yrityksen 1 strategian vaihdon ja muuttaa omaa strategiaa. Seuraavat kierrokset menevät vastaavasti. Näin syntyy strategiapari-jono, joka lähtee kartellipisteestä poispäin ja ja päätyy Nash-tasapainopisteeseen. Kartellipiste on siis epästabiili, eikä näin ole tasapainopiste. Nash-tasapaino ei välttämättä ole siis tehtävän paras ratkaisu, mutta jos ollaan tasapainossa, ei siitä kannata yksinään poiketa. Kahdelle pelaajalle: Nash-tasapaino on sellainen strategiapari, mistä kummankaan ei kannata yksinään poiketa. Matemaattisessa muodossa Strategiapari (q 1,q 2) on Nash-tasapaino, jos pelaajalle 1 strategia q 1 ratkaisee tehtävän π 1 (q 1,q 2) π 1 (q 1,q 2), q 1 Q 1 (8) ja pelaajalle 2 strategia q 2 ratkaisee tehtävän π 2 (q 1,q 2) π 2 (q 1,q 2 ), q 2 Q 2 (9) missä Q i on pelaajan i strategiajoukko. Sekastrategia Tarkastellaan seuraavaksi kahden pelaajan pelejä, joissa pelit esitetään tulostaulukkona. Tämä on mahdollista, kun pelaajien strategioita on äärellinen määrä. Taulukon alkio a i,j on strategiaparin (i,j) tulos. Esimerkiksi peli voisi olla seuraavanlainen: 4

Pelaaja1 Pelaaja2 L C R T 5,4 4,0 5,3 M 4,0 0,4 5,3 B 3,5 3,5 6,6 missä pelaajalla 1 on kolme strategiaa T, M, B ja pelaajalla 2 strategiat L, C, R. Nashin-tasapaino voidaan määrittää tulostaulukosta tarkastelemalla strategioita pareittain. Jos pelaaja 2 pelaa strategiaa L, pelaajan 1 paras vaste on strategia T. Alleviivataan tämä tulos taulukkoon. Tehdään tämä operaatio molemmille pelaajille kaikilla strategiapareilla. Jos taulukosta löytyy alkio, jonka molemmat tulokset on alleviivattu, tämä strategiapari on Nash-tasapaino. Tässä pelissä Nash-tasapainoiksi saadaan (B,R) ja (T,L). Nollasummapelissä pelaajien intressit ovat vastakkaiset, siis a i,j on toiselle yhtä hyvä kuin mitä se on toiselle huono. Esimerkkinä kolikkojen sovittamispeli: Pelaaja2 q 1-q Pelaaja1 p 1-p Kr Kl Kr -1,1 1,-1 Kl 1,-1-1,1 Tälle pelille ei löydy Nash-tasapainoa puhtailla strategioilla, Kruuna ja Klaava. Tasapaino löytyy kuitenkin ns. sekastrategioilla. Oletetaan nyt, että pelaaja 1 pelaa kruunaa todennäköisyydellä p ja klaavaa 1 p ja pelaaja 2 kruunaa todennököisyydellä q ja klaavaa 1 q. Pelaaajien hyötyjen odotusarvot ovat E[π 1 ] = p [ q + (1 q)] + (1 p) [q (1 q)] = 4pq + 2p + 2q 1 E[π 2 ] = 4pq 2p 2q + 1 Voidaan todeta, että strategiat, missä molemmat pelaajat pelaavat kruunaa todennäköisyydellä 0.5 ja klaavaa todennäköisyydellä 0.5 on Nash-tasapaino, eli ko. olevat strategiat toteuttavat epäyhtälöt (8) ja (9). Sekastrategia kahdelle pelaajalle: Sekastrategia on pelaajalle i {1, 2} todennäköisyysjakauma p i = (p i1,...,p ik ), missä 0 p ik 1 kaikilla k = 1,...,K ja K p ik = 1 5 k=1

missä K on strategioiden lukumäärä. Puhtaat strategiat ovat sekastrategioiden erikoistapaus, yhteen strategiaan liittyy todennäköisyys 1 ja muihin nolla. Vangin pulma Kasper ja Jesper ovat tehneet kuutamokeikkoja Otaniemen ostarilla ja ovat jääneet siitä kiinni. Poliisilla ei ole riittävästi todisteita pidättää poikia, ellei ainakin toinen heistä tunnusta. Poliisi pistää pojat eri ja pyytää heitä tunnustamaan (C), tai sitten ei (N). Poliisi sanoo: Jos kumpikaan teistä ei tunnusta, olette molemmat tarkkailtavina putkassa yhden päivän. Jos te molemmat tunnustatte, saatte olla putkassa 6 päivää. Jos sen sijaan toinen teistä tunnustaa, mutta toinen ei, ensin mainittu pääsee vapaaksi ja toinen saa olla putkassa 9 päivää. Peli, jota Kasper ja Jesper pelaavat poliisin välityksellä on seuraava: Kasper Jesper N C N -1,1-9,0 C 0,-9-6,-6 N : ei tunnusta C : tunnustaa Pelin rationaalinen ratkaisu on vääjäämättä (C,C), eli kumpikin on putkassa 6 päivää: Pojat jotk ei tulleet hyviks, nyt on jauhettuna jyviks. Tulos ( 1, 1) ei tule valituksi, koska se ei ole Nashin tasapaino, eli kummankaan pelaajan kannalta rationaalinen ratkaisu, kun peliä pelataan vain kerran. Jos peliä sen sijaan toistetaan, myös tämä tulos voi tulla kyseeseen, mutta se vaatii pelaajilta sitoutumista yhteistyöhön. Nashin neuvotteluratkaisu Cournot n duopolimallissa tutustuimme yhteistyön mahdollisuuteen tässä kappaleessa aihetta käsitellään hieman ns. aksiomaattisesta näkökulmasta. Lähestymistapa on peräisin John Nashilta vuodelta 1950. Kyseinen paperi, johon myös Nashista tehdyssä elokuvassa Kaunis mieli viitataan on nimeltään 6

The Bargaining Problem. Määritellään referenssipiste, jonka suhteen pelin tulos lasketaan (voi olla origo, Nashin tasapainopiste tai muu sopiva piste) ja merkitään sitä ( u d 1,u d 2) :llä. Toisinaan tätä kutsutaan ristiriitapisteeksi. Olkoon mahdollisten tulosten (u 1,u 2 ) joukko S konveksi ja kompakti. Nash osoitti, että jos tutkitaan kaikkia tällaisia neuvottelujoukkoja S, ja oletetaan, että neuvotteluratkaisu (u S 1,u S 2) S toteuttaa ao. ehdot, niin tällaiset ehdot totetuttavia ratkaisuita on vain yksi, ja annetulla S, (u S 1,u S 2) maksimoi tulon (u 1 u d 1)(u 2 u d 2). riippumattomuus irrelevanteista vaihtoehdoista (independence of irrelevant alternatives) - jos S S ja (u S 1,u S 2) S (u S 1,u S 2 ) = (u S 1,u S 2) symmetrisyys - jos S on symmetrinen joukko suoran u 1 = u 2 suhteen u S 1 = u S 2 riippumattomuus affiineista muunnoksista - jos hyödyt u 1 ja u 2 kerrotaan mielivaltaisella positiivisella vakiolla, ja niihin lisätään mielivaltainen vakio, niin (u S 1,u 2 2) skaalautuu samalla tavalla. Lähteet Robert Gibbons: A Primer in Game Theory, Prentice Hall, 1992. John Nash: The Bargaining Problem, Econometrica, vol. 18, pp. 155-162, 1950. 7