MS-C2105 Optimoinnin perusteet Malliratkaisut 5 Ehtamo Demo 1: Arvaa lähimmäksi Jokainen opiskelija arvaa reaaliluvun välillä [0, 100]. Opiskelijat, joka arvaa lähimmäksi yhtä kolmasosaa (1/3) kaikkien valittujen lukujen keskiarvosta, jakavat voiton. Minkä luvun sinä arvaat? Koko ryhmälle jaetaan paperilaput, joihin kukin opiskelija kirjoittaa jonkin luvun väliltä [0,100]. Laput kerätään pois ja assistentti laskee vastausten keskiarvon. Lähimmäksi päässyt voittaa palkinnon. Onneksi olkoon voittajalle! :) Mikä olisi järkevin tapa vastata? Jos jokainen osallistuja vastaisi täysin satunnaisesti jonkin luvun, vastausten keskiarvon odotusarvo olisi 50/3 = 16,66. Fiksu opiskelijahan ei luonnollisesti vastaa täysin satunnaisesti, vaan juuri tuon 16,66. Toisaalta, jos kaikki ajattelevat samalla tavalla, keskiarvon kolmasosaksi saadaan 16,66/3 = 5,55. Edelleen, jos kaikki vastaavat näin, keskiarvon kolmasosaksi saadaan 5,55/3 = 1,85. Peliteorian yksi tärkeimmistä oletuksista on pelaajien rationaalisuus, eli se, että kaikki pelaajat valitsevat aina omalta kannaltaan parhaan vaihtoehdon. Edellistä päättelyketjua seuraamalla rationaalinen pelaaja päätyisi lopulta valitsemaan luvun 0. Tämän pelin tapauksessa näin harvemmin käy, sillä todelliset pelaajat eivät ole täysin rationaalisia. Demo 2: Matriisipeli Ratkaise seuraavien normaalimuotoisten matriisipelien Nashin tasapainot. Matriisissa on esitettynä pelaajien saamat hyödyt (pelaajan A hyöty, pelaajan B hyöty) pelaajien strategioille. Esimerkiksi a-kohdassa jos pelaaja A pelaa strategiaa U ja pelaaja B strategiaa R, A saa hyödyn 1 ja B saa hyödyn 2. a) b) U 3, 2 1, 1 D 0, 1 5, 6 Nashin tasapaino on strategiapari, josta kummankaan pelaajan ei kannata poiketa kun toinen pelaaja pelaa tasapainostrategian mukaisesti. Nashin tasapainot eivät aina välttämättä ole pelin parhaita tuloksia. Mahdollisen paremman tuloksen saamiseksi pelaajien olisi tehtävä yhteistyötä. Tämä johtaisi uuteen, yleensä dynaamiseen peliin. Matriisipelin Nashin tasapaino voidaan ratkaista selvittämällä vuorotellen kummankin pelaajan reaktiot jokaiseen toisen pelaajan strategiaan, ja etsimällä tämän jälkeen ruudut, jotka kuuluvat molempien pelaajien reaktiofunktioihin. 1
a) Kiinnitetään aluksi pelaajan B strategia L. Nyt pelaajan A kannattaa valita strategia U, jolla hän saa hyödyn 4, koska toisella strategialla D hän saisi hyödyn 2. Merkitään valinta alleviivaamalla pelaajan A hyöty toteutuneen strategian ruudusta (4). Nyt kiinnitetään pelaajan B strategia R, jolloin pelaajan A kannattaa pelata myös U. Alleviivataan pelaajan A hyöty toteutuneen strategian ruudustua (1). Nyt toistetaan sama pelaajalle B. Kiinnitetään pelaajan A strategia U, jolloin B:n kannattaa valita L. Kiinnitetään pelaajan A strategia D, jolloin B:n kannattaa valita R. Alleviivataan vastaavat hyödyt (4 ja 0). Strategiaparin (U, L) molemmat hyödyt ovat alleviivatut, eli pelaajien reaktiot leikkaavat tässä pisteessä. Tämä piste on pelin Nashin tasapaino. b) Kiinnitetään aluksi pelaajan B strategiat, ja selvitetään pelaajan A reaktiot. Vastaavasti kiinnitetään pelaajan A strategiat ja selvitetään pelaajan B reaktiot, jolloin edellisen tehtävän tavoin saadaan taulukko: U 3, 2 1, 1 D 0, 1 5, 6 Huomaa. Nashin tasapainoja voi olla useita. Lisäksi kannattaa muistaa, että toinen Nash-tasapaino, tai mikä tahansa muukin strategiapari, saattaa olla molempien pelaajien kannalta parempi lopputulos pelille. Demo 3: Cournot n duopolimalli Kaksi yritystä myy tuotetta, jonka hinta määrätyy markkinoilla tarjonnan mukaan noudattaen funktiota p(q 1, q 2 ) = a b(q 1 + q 2 ), missä p(q 1, q 2 ) on tuotteen hinta, q i yrityksessä i tuotettu määrä ja a ja b positiivisia vakioita. Kumpikin yritys tuottaa voittoa π = (p(q 1, q 2 ) c) q i, missä c on yhden tuotteen yksikkökustannus. Laske markkinan Nashin tasapaino, kun yritykset asettavat hintansa yhtäaikaa. Vertaa tasapainoa tilanteeseen, jossa markkinoilla olisi vain yksi monopolistinen yritys. 2
Nashin tasapaino löytyy pelaajien reaktiofunktioiden leikkauspisteestä. Selvitetään pelaajan i reaktio, kun toista pelaajaa merkitään j:llä. Tunnetulla q i :llä Yritys i maksimoi tuottoaan, eli sen optimointitehtävä on max q i π(q i, q j ) = (p(q 1, q 2 ) c) q i = (a b(q i + q j ) c)q i. Tehtävän optimi löytyy derivaatan nollakohdasta: π q i = (a b(q i + q j ) c) bq i = 0 q i = a bq j c Tämä on pelaajan i reaktiofunktio. Vastaavasti pelaajalle j saadaan reaktiofunktio q j = a bq i c Ratkaistaan reaktiofunktioiden leikkauspiste, eli piste, jossa molemmat pelaajat pelaavat tasapainostrategiaa: q 1 q 2 = a bq 2 c = a bq 1 c Sijoittamalla alempi ylempään ja ratkaisemalla q 1 saadaan q 1 q 2 = a c 3b = a c 3b Tämä on pelin Nashin tasapaino. Tasapainossa hinta on ja kokonaiskysyntä p = a b(q 1 + q 2 ) = a + 2c, 3 q 1 = 2(a c). 3b Sen sijaan, jos markkinoilla olisi vain yksi yritys, ja hinta määräytyisi vastaavalla tavalla: p = a bq, missä q on yrityksen tuottantomäärä, yrityksen optimointitehtävä olisi max π(q) = (p(q) c)q = (a bq c) q. q Tehtävän optimi löytyy derivaatan nollakohdasta: Tällä tuotantomäärällä hinta on dπ dq = (a bq c) bq = 0 q i = a c p = a bq = (a + c)/2. Verrattuna kahden yrityksen markkinaan, hinta on korkeampi ja tuotantomäärä matalampi. Tämän perusteella voidaan esimerkiksi perustella, miksi kilpailu on kuluttajien kannalta parempi kuin monopoli. 3
Tehtävä 1: Stackelbergin duopolimalli Tutkitaan edellisen tehtävän kaltaista kahden yrityksen duopolimarkkinaa pienellä muutoksella. Toinen yritys valitsee tuotantomääränsä ensin, jonka jälkeen toinen yritys reagoi ensimmäisen yrityksen tuotantomäärään optimaalisesti. Laske tämän kaksivaiheisen pelin Nashin tasapaino. Vinkki. Voit käyttää edellisessä tehtävässä laskettuja reaktiofunktioita apunasi. Peli on kaksivaiheinen. Aluksi ensimmäinen pelaaja asettaa tuotantomääränsä q 1, jonka jälkeen toinen pelaaja reagoi tähän ja asettaa oman tuotantomääränsä q 2. Tutkitaan peliä takaperininduktion avulla ja tarkastellaan aluksi pelin jälkimmäistä vaihetta. Nyt pelaaja 1 on jo asettanut tuotantomäärän q 1 ja edellisessä tehtävässä lasketun reaktiofunktion nojalla voimme päätellä, että toinen pelaaja valitsee tuotantomäärän q 2 (q 1 ) = a bq 1 c. Nyt ensimmäisessä vaiheessa pelaaja 1 tietää miten pelaaja 2 tulee reagoimaan hänen asettamaansa tuotantomäärään. Pelaaja 1:n optimointitehtävä on siis max q 1 π(q 1, q 2 (q 1 )) = (p(q 1, q 2 (q 1 )) c) q 1 = (a b(q 1 + q 2 (q 1 )) c) q 1. Sijoitetaan q 2 (q 1 ) reaktiofunktiosta, jolloin saadaan ( π(q 1, q 2 (q 1 )) = a b ( q 1 + a bq 1 c ) ) c q 1 Optimi on derivaatan nollakohdassa: = 1 2 (a bq 1 c)q 1 dπ dq 1 = 1 2 ((a bq 1 c) bq 1 ) = 0 q i = a c Nyt pelaajan 2 reaktio on q 2 (q 1 ) = a c 4b. Selvästi ensimmäinen pelaaja tuottaa suuremman määrän ja koska hinnat ovat samat kaikille markkinan yrityksille, pelaaja saa myös suuremmat voitot. Tilanteen voi tulkita esimerkiksi siten, että pelaajalla 2 on pelaajaa 1 selvästi heikompi markkinaosuus eikä se voi yksin vaikuttaa tuotettaviin määriin. Verrattuna edellisen tehtävän monopoli- ja duopoliratkaisuihin, ensimmäinen pelaaja tuottaa nyt monopolimäärän, ja toinen pelaaja vähemmän kuin kumpikaan yritys duopolissa. Ensimmäisen pelaajan tuotot ovat kuitenkin monopolia heikommat sillä pelaajan 2 tuotanto laskee markkinan hintoja. 4
Tehtävä 2: Tuhatjalkaispeli Pelaa vieruskaverisi kanssa peliä, jossa pelaajat A ja B vuorotellen päättävät lopetetaanko peli vai jatketaanko sitä. Jos peli jatkuu, vuoro siirtyy seuraavalle pelaajalle. Riippuen siitä, kuinka kauan peliä pelataan, pelaajat saavat eri määrän pisteitä. Pisteet on esitetty kuvassa. Esimerkki pelin kulusta: Pelaaja A aloittaa, ja hän valitsee pelin jatkumisen. Pelaaja B valitsee samoin, mutta kolmannessa vaiheessa A päättää pelin. Tällöin A saa 6 pistettä ja B 1 pisteen. Pelatkaa muutama kierros sopivilla panoksilla. Miettikää miten peliä kannattaa pelata A:na ja miten B:nä. Pelin kokonaispotti kasvaa mitä pidemmälle peli etenee. Jatkamiseen kuitenkin sisältyy riski, että toinen pelaaja lopettaa pelin ennen kuin oma vuoro tulee uudestaan. Tarkastellaan peliä taaksepäininduktiolla. Oletetaan, että peli on viimeisessä vaiheessa, ja pelaajan B on päätettävä jaetaanko 10 pisteen kokonaispotti (5,5) vai (3,7). Rationaalinen pelaaja valitsee jälkimmäisen, sillä tällöin hän saa suuremman hyödyn. Edellisessä vaiheessa rationaalinen A taas tietää, että seuraavassa vaiheessa B tulee valitsemaan vaihtoehdon (3,7). A:n kannattaa nyt keskeyttää peli, jolloin hän saa yhteensä 7 pistettä. Jatketaan päättelyä taaksepäin, ja huomataan että jokaisessa vaiheessa pelaajan kannataa keskeyttää peli, sillä hän tietää, että seuraavassa vaiheessa toinen pelaaja keskeyttää pelin. Pelaajat voisivat myös tehdä yhteistyötä, jolloin he sopisivat yhdessä strategiansa. He voisivat esimerkiksi sopia, että molemmat jatkavat peliä niin pitkään kuin mahdollista, jolloin molemmat saisivat hyödyn 5. Tehtävä 3: Matriisipeli Ratkaise seuraavien normaalimuotoisten matriisipelien Nashin tasapainot. a) b) A \ B L C R U 0, 1 3, 2 4, 5 D 1, 3 0, 1 2, 2 U 1, 1 1, 1 D 1, 1 1, 1 5
Selvitetään kummankin pelaajan reaktiot kiinnittämällä vuorotellen toisen pelaajan kukin strategia ja valitsemalla pelaajan kannalta paras vaihtoehto. a) b) A \ B L C R U 0, 1 3, 2 4, 5 D 1, 3 0, 1 2, 2 Reaktiot leikkaavat strategiapareilla (D,L) ja (U,R), joten nämä ovat pelin kaksi Nashin tasapainoa. U 1, 1 1, 1 D 1, 1 1, 1 Koska reaktiot eivät leikkaa missään ruudussa, pelillä ei ole Nashin tasapainoa puhtailla strategioilla. Pelillä on kuitenkin sekastrategiatasapaino, missä kumpikin pelaaja pelaa strategioitaan todennäköisyyksillä 1 2 ja 1 2. Kiva tietää. Tätä peliä kutsutaan myös kolikonheittopeliksi. Pelaajat valitsevat joko kruunan (strategian U tai L) tai klaavan (strategian D tai R). Jos molemmat valitsevat saman strategian pelaaja B voittaa, jos strategiat eriävät A voittaa. 6