Luento 8. June 3, 2014

Samankaltaiset tiedostot
Yhteistyötä sisältämätön peliteoria jatkuu

Nollasummapelit ja bayesilaiset pelit

Peliteoria luento 3. May 27, Peliteoria luento 3

Sekastrategia ja Nash-tasapainon määrääminen

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Pelien teoriaa: tasapainokäsitteet

SEKASTRATEGIAT PELITEORIASSA

Johdanto peliteoriaan Kirja kpl. 2

Sekastrategiat ja intensiiviyhteensopivuus

Luento 3: Bayesiläiset pelit

Signalointi: autonromujen markkinat

Luento 7. June 3, 2014

Peliteoria luento 1. May 25, Peliteoria luento 1

Peliteoria luento 2. May 26, Peliteoria luento 2

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Pohdiskeleva ajattelu ja tasapainotarkennukset

PELITEORIAN PERUSTEITA

HUUTOKAUPPATEORIAA TTS-Kurssille/Kultti 2012

Luento 5: Peliteoriaa

Tasapaino epätäydellisen tiedon peleissä

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

Informaatio ja Strateginen käyttäytyminen

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Luento 9. June 2, Luento 9

Epätäydellisen tiedon jatkuvat pelit

Luento 5: Peliteoriaa

Y56 laskuharjoitukset 6

Luento 6. June 1, Luento 6

Demo 7 ( ) Antti-Juhani Kaijanaho. 9. joulukuuta 2005

Yleinen tietämys ja Nashin tasapaino

Lyhyen aikavälin hintakilpailu 2/2

Yhteistyötä sisältämätön peliteoria

1. Kuntosalilla on 8000 asiakasta, joilla kaikilla on sama salikäyntien kysyntä: q(p)= P, missä

TALOUSTIETEEN LUENTOJEN TEHTÄVÄT

Dynaaminen hintakilpailu ja sanattomat sopimukset

Evolutiivisesti stabiilin strategian oppiminen

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

LAAJENNETUN MUODON RATIONALISOITUVUUS. S ysteemianalyysin. Arno Solin Laboratorio. Aalto-yliopiston Teknillinen korkeakoulu

Totta vai tarua matematiikan paradokseja

12 Oligopoli ja monopolistinen kilpailu

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Evolutiivinen stabiilisuus populaation

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

Martingaalit ja informaatioprosessit

x+3 = n(y 3) y +n = 3(x n). Kun ylemmästä yhtälöstä ratkaistaan x = n(y 3) 3 ja sijoitetaan alempaan, saadaan

Esimerkki: Tietoliikennekytkin

Moraalinen uhkapeli: laajennuksia ja sovelluksia

b) Arvonnan, jossa 50 % mahdollisuus saada 15 euroa ja 50 % mahdollisuus saada 5 euroa.

Prof. Marko Terviö Assist. Jan Jääskeläinen

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

Prof. Marko Terviö Assist. Jan Jääskeläinen

Paljonko maksat eurosta -peli

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

Hintakilpailu lyhyellä aikavälillä

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

JOHDATUSTA PELITEORIAAN

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

2. Uskottavuus ja informaatio

Haitallinen valikoituminen: Kahden tyypin malli

Pelaisitko seuraavaa peliä?

Seuraavana tavoitteena on osoittaa, että binääristen neliömuotojen ekvivalenssiluokat

Induktiota käyttäen voidaan todistaa luonnollisia lukuja koskevia väitteitä, jotka ovat muotoa. väite P(n) on totta kaikille n = 0,1,2,...

Ydin-Haskell Tiivismoniste

1. Tilastollinen malli??

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Laskuharjoitus 1. Markkinoitten mallintaminen ja Internet-markkinat Saara Hämäläinen, Helsingin yliopisto, syksy 2016

V ar(m n ) = V ar(x i ).

Taloustieteen Nobel peliteorian kehittäjille

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Strategiset valinnat. Taloustieteen perusteet Matti Sarvimäki

Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17)

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

Strategiset valinnat Taloustieteen perusteet Matti Sarvimäki. A. Peliteorian alkeet. Johdanto. Johdanto 15/09/19

Harjoitus 1. Tehtävä 1. Malliratkaisut. f(t) = e (t α) cos(ω 0 t + β) L[f(t)] = f(t)e st dt = e st t+α cos(ω 0 t + β)dt.

MS-C1350 Osittaisdifferentiaaliyhtälöt Harjoitukset 5, syksy Mallivastaukset

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Matriisilaskenta, LH4, 2004, ratkaisut 1. Hae seuraavien R 4 :n aliavaruuksien dimensiot, jotka sisältävät vain

1 p p P (X 0 = 0) P (X 0 = 1) =

Maatalous-metsätieteellinen tiedekunta Ympäristöekonomia Kansantaloustiede ja matematiikka

Peliteoria ja kalatalous YE4

Lineaarinen toisen kertaluvun yhtälö

Matemaattisen analyysin tukikurssi

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Sovellettu todennäköisyyslaskenta B

(0 desimaalia, 2 merkitsevää numeroa).

9. Tila-avaruusmallit

4.0.2 Kuinka hyvä ennuste on?

6. Yhteenvetoa kurssista

Transkriptio:

June 3, 2014

Luokka pelejä, joissa pelaajilla on epätäydellistä informaatiota toistensa preferensseistä ja joissa valinnat tehdään samanaikaisesti. Tämä tarkoittaa, että pelaajat eivät tiedä toistensa hyötyjä. Täydellistä tietämättömyyttä ei ole olemassakaan ja tapana onkin olettaa, että pelaajilla on uskomukset toistensa hyödyistä. Uskomukset ovat tietenkin todennäköisyysjakaumia. Keskeinen rajoittava oletus on, että nämä uskomukset ovat yhteistä tietoa (common knowledge). Esimerkiksi tarjoushuutokaupat ovat tällaisia tilanteita.

Example Markkinoille tulon estäminen. Markkinoilla on yksi yritys ja toinen pohtii asettumista samoille markkinoille. Samanaikaisesti jo markkinoilla oleva yritys pohtii laajentaako toimintaansa vai ei. Se kannattaako tulla markkinoille riippuu siitä laajentaako siellä jo oleva yritys toimintaansa vai ei. Laajentamisen kannattavuus taas riippuu siitä ovatko kustannukset alhaiset vai korkeat. Tämä on markkinoilla olijan henkilökohtaista informaatiota. Markkinoille tulijalla on uskomukset kustannuksista. Todennäköisyydellä p kustannukset ovat alhaiset c l ja todennäköisyydellä 1 p ne ovat korkeat c h.

Example (Asiain)tila c l Tila c h

Yksi tapa mallittaa tällaiset pelit on ajatella, että ensin LUONTO valitsee, mitä tyyppiä markkinoilla oleva yritys on. Todennäköisyydellä p se on tyyppiä c l ja todennäköisyydellä 1 p tyyppiä c h. Pelaajat tuntevat nämä todennäköisyydet; todennäköisyyttä sanotaan monesti priori-todennäköisyydeksi. Sen jälkeen pelaajat saavat signaalin todellisesta asiaintilasta. Tyypillisesti yksi pelaaja saa täysin paljastavan signaalin; esimerkissä markkinoilla olija. Näin hän tietää tyyppinsä. Toinen pelaaja saa signaalin joka on epätäydellinen; esimerkissä markkinoille tulija. Tätä signaaliteknologiaa ei esimerkissä malliteta eikä siihen yksinkertaisissa tilanteissa ole tarvetta.

Oletetaan, että tila on todennäköisyydellä 2 3 c l. Pelimatriiseista nähdään, että markkinoille tulo kannattaa ainoastaan, jos laajentumista ei tapahdu. Kun kustannukset ovat alhaiset dominoiva strategia on laajentua. Kun kustannukset ovat korkeat dominoiva strategia on olla laajentumatta. Jos yritys päättää tulla markkinoille se saa voittoa 2 3 ( 1) + 1 3 1 = 1 3. Pysymällä pois voittoa tulee nollan verran, joten pelin Nash-tasapaino on (pysypois; laajenna, älälaajenna). P2:n eli markkinoilla olijan strategia on funktio tilajoukolta tekojen joukolle s 2 : {c l,c h } {laajenna,älälaajenna}.

Bayesiläisissä peleissä perusoivallus on pitää kunkin pelaajan kutakin tyyppiä omana pelaajanaan. Tällöin tilanne on formaalisti samanlainen kuin normaalimuodon peleissä: pelaajien tyypeistä vain on jotain epävarmuutta. Tämän seurauksena koko normaalimuodon pelien analyysivälineistö on käytettävissä. Denition Bayesiläinen peli Γ = (N,(S i ) i N,Ω,(p i ) i N,(τ i ) i N,(u i ) i N ) koostuu pelaajien joukosta N, strategioiden joukosta S i kullekin pelaajalle i, tilojen joukosta Ω,signaalifunktioista τ i : Ω T i kullekin pelaajalle i ja hyötyfunktioista u i : i N S i Ω R. Joukko T i on pelaajan i mahdollisten signaalien joukko. Jos pelaaja i saa signaalin t i T i, sanotaan että hän on tyyppiä t i.

On selvää, miten esimerkin peli voidaan esittää bayesiläisenä pelinä kunhan selvitetään signaalifunktiot ja todennäköisyyksien määräytyminen. Seuraavassa yksi lukuisista vaihtoehdoista. Olkoon priori p = ( 2 3, 1 3 ) ja Ω = {c l,c h }. Markkinoille tulijalle eli P1:lle τ 1 (c l ) = 79 = τ 1 (c h ). Markkinoilla olijalle eli P2:lle τ 2 (c l ) = 21 ja τ 2 (c h ) = 121. Lisäksi on huomattava, että P2:n strategiajoukko koostuu funktioista joukolta {21, 121} joukolle {laajenna, älälaajenna}.

Yksinkertaisten bayesiläisten pelien ratkaisemiseksi ei yleensä tarvita koko koneistoa. Tärkeää on ymmärtää, että pelaajien strategiat ovat ehdollisia heidän tyypeilleen; siis funktioita. Bayesiläistä peliä vastaa normaalimuodon peli, jossa jokaisen pelaajan jokainen tyyppi on pelaaja; pelaajalla (i,t i ) on hyötyfunktio u i. Bayesiläisen pelin Nash-tasapaino määritellään sitten vastaavan normaalimuodon pelin tasapainona. Bayesiläisissä peleissä voi tapahtua epäintuitiivisia asioita, kuten seuraavassa esimerkissä.

Example On kaksi mahdollista tilaa ω 1 ja ω 2 joita pelaajat pitävät yhtä todennäköisinä. ω 1 l m r t 1, 2ε 1, 0 1, 3ε b 2, 2 0, 0 0, 3 ω 2 l m r t 1, 2ε 1, 3ε 1, 0 b 2, 2 0, 3 0, 0 Olkoon ε < 1. P2:lla on yksikäsitteinen optimivastaus l. P1:n 2 valintaa t vastaan se tuottaa 2ε, kun m tai r tuottaa 1 3ε. Valintaa 2 b vastaan se tuottaa 2, kun taas m tai r tuottaa 1 3. P1:n 2 yksikäsitteinen optimivastaus l vastaan on b kummassakin tilassa (joita tiloja pelaajat eivät siis tiedä). Yksikäsitteinen Nash-tasapaino on siis (b; l).

Example jatkuu Oletetaan sitten, että informaatio lisääntyy ja P2 saa tietää todellisen tilan. Nyt hänellä on tilassa ω 1 dominoiva strategia r ja tilassa ω 2 dominoiva strategia m. Koska kumpikin tila on yhtä todennäköinen P1:n kannalta katsoen P2 pelaa r ja m sekastrategialla ( 1 2, 1 2). P1:n optimivastaus on t. Kun kumpikaan pelaaja ei tiennyt tilaa he saivat tasapainossa 2. Kun P2 saa tietää tilan pelin yksikäsitteisessä tasapainossa (t; r, m), missä toinen koordinaatti on P2:n valinta kun tila on ω 1 ja kolmas koordinaatti on P2:n valinta kun tila on ω 2, pelaajien hyödyt ovat 1 ja 3ε.

Peli Osbornen kirjasta sivulta 284. Kaksi pelaajaa ja kolme tilaa Ω = {α,β,γ}. Signaalifunktion sijasta pelaajien informaatiota kuvataan tila-avaruuden osituksella. P1: {{α},{β,γ}} P2: {{α,β},{γ}} Kun P1 tietää, että tila on joukossa {β,γ} hänen uskomuksensa, että tila on β on 3 4. Kun P2 tietää, että tila on joukossa {α,β} hänen uskomuksensa, että tila on β on 1 4.

α L R L 2, 2 0, 0 R 3, 0 1, 1 β L R L 2, 2 0, 0 R 0, 0 1, 1 γ L R L 2, 2 0, 0 R 0, 0 1, 1

Tämän pelin yksikäsitteinen tasapaino on (R, R). Jos P1 tietää, että tila on α hänen dominoiva valintansa on R. Jos P2 tietää, että tila on joukossa {α,β}l tuottaa hänelle parhaimmillaan 3 4 0 + 1 2, kun taas R tuottaa hänelle 4 vähintään 3 4 1 + 1 4 0. Tällöin P2 siis valitsee R. Jos P1 tietää, että tila on joukossa {β,γ}l tuottaa hänelle parhaimmillaan 3 4 0 + 1 2, kun taas R tuottaa hänelle 4 vähintään 3 4 1 + 1 4 0. Tällöin P1 valitsee siis R. Jos P2 tietää, että tila on γ L tuottaa hänelle nollan, kun taas R tuottaa hänelle 1.