Paljastetut preferenssit ja peliteoria. Ks. esim. Grüne-Yanoff & Lehtinen (tulossa) tai Hausman 2000, 2005, Guala 2006

Samankaltaiset tiedostot
Peliteoria luento 3. May 27, Peliteoria luento 3

Rationaalisen valinnan teoria

Peliteoria Strategiapelit ja Nashin tasapaino. Sebastian Siikavirta

Sekastrategia ja Nash-tasapainon määrääminen

Opettaminen ja oppiminen

Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Peliteoria luento 2. May 26, Peliteoria luento 2

SEKASTRATEGIAT PELITEORIASSA

Paljonko maksat eurosta -peli

Luento 8. June 3, 2014

Johdanto peliteoriaan Kirja kpl. 2

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

PELITEORIAN TALOUSTIETEELLISIÄ SOVELLUKSIA

Yhteistyötä sisältämätön peliteoria jatkuu

Strategiapelit ja Nashin tasapaino. Esitta ja : Sebastian Siikavirta

Peliteoria luento 1. May 25, Peliteoria luento 1

Luento 10 Kustannushyötyanalyysi

b) Arvonnan, jossa 50 % mahdollisuus saada 15 euroa ja 50 % mahdollisuus saada 5 euroa.

Strateginen kanssakäyminen. Taloustieteen perusteet Matti Sarvimäki

Luento 5: Peliteoria

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

ESS oppiminen ja sen simulointi

Strateginen kanssakäyminen Taloustieteen perusteet Matti Sarvimäki

Nollasummapelit ja bayesilaiset pelit

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Varian luku 12. Lähde: muistiinpanot on muokattu Varianin (2006, instructor s materials) muistiinpanoista

PELITEORIAN PERUSTEITA

12 Oligopoli ja monopolistinen kilpailu

I I K UL U UT U T T A T JANTE T O E R O I R A

Signalointi: autonromujen markkinat

Capacity Utilization

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Luento 9. June 2, Luento 9

Rationalisoituvuus ja yleinen tieto rationaalisuudesta

Yhteistyötä sisältämätön peliteoria

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Y56 laskuharjoitukset 6

Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17)

Kokeellinen peliteoria ja rahalliset palkkiot

Grand Challenges. Smart Start-Ups? Ny Start Up erto örnberg

Akateemiset fraasit Tekstiosa

Sosiaaliset hyvinvointifunktiot (Social welfare functions SWF)

Surveytutkimusksen Suunnittelu ja Teoreettisten Konstruktioiden Validointi. Seppo Pynnönen Vaasan yliopisto Menetelmätieteiden laitos

TUTKIMUSOTTEITA TIEDONINTRESSIN NÄKÖKULMA

ATLAS-kartan esittely - Peli palveluiden yhteiskehittämisen menetelmistä Päivi Pöyry-Lassila, Aalto-yliopisto

Luento 5: Peliteoriaa

Strategiset valinnat Taloustieteen perusteet Matti Sarvimäki. A. Peliteorian alkeet. Johdanto. Johdanto 15/09/19

Results on the new polydrug use questions in the Finnish TDI data

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Strategiset valinnat. Taloustieteen perusteet Matti Sarvimäki

TALOUSTIETEEN LUENTOJEN TEHTÄVÄT

Lisää pysähtymisaiheisia ongelmia

Matemaatiikan tukikurssi

Luento 5: Peliteoriaa

Matematiikan tukikurssi

Viime kerralta Epävarmuus ja riski Optimaalinen kulutus-säästämispäätös: Tulo- ja substituutiovaikutus analyyttinen tarkastelu Epävarmuus Epävarmuus

Evolutiivinen stabiilisuus populaation

Evolutiivisesti stabiilin strategian oppiminen

Efficiency change over time

Tasapaino epätäydellisen tiedon peleissä

Pelien teoriaa: tasapainokäsitteet

Päätöksentekomenetelmät

Päätöksentekomenetelmät

Etiikan mahdollisuudesta tieteenä. Henrik Rydenfelt Helsingin yliopisto

Valuation of Asian Quanto- Basket Options

You can check above like this: Start->Control Panel->Programs->find if Microsoft Lync or Microsoft Lync Attendeed is listed

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Approbatur 3, demo 1, ratkaisut A sanoo: Vähintään yksi meistä on retku. Tehtävänä on päätellä, mitä tyyppiä A ja B ovat.

Yleinen tietämys ja Nashin tasapaino

Johdatus politologiaan. Turun yliopisto, sl 2012 Maija Setälä Luento VII: Politiikan tutkimuksen lähestymistapoja: Rationaalisen valinnan teoria

Dynaaminen hintakilpailu ja sanattomat sopimukset

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Tero Sirkka. Peliteoriaa

Prof. Marko Terviö Assist. Jan Jääskeläinen

TIETOINEN HAVAINTO, TIETOINEN HAVAINNOINTI JA TULKINTA SEKÄ HAVAINNOLLISTAMINEN

Muutos mahdollisuutena Tuusula Anssi Tuulenmäki

Elastisuus: Siirtymä

VAIKUTTAVA INSIGHT JA INSIGHT-ORGANISAATIO. Poiminnat Esomarin konferenssista, Berliini Anu Bergius, kehityspäällikkö

Taloustieteen Nobel peliteorian kehittäjille

Epätäydellisen tiedon jatkuvat pelit

Pohdiskeleva ajattelu ja tasapainotarkennukset

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari

ACUMEN O2: Verkostot

1. Liikkuvat määreet

HARJOITUS- PAKETTI A

TAITO TARTTUU TREENAAMALLA!

1.3Lohkorakenne muodostetaan käyttämällä a) puolipistettä b) aaltosulkeita c) BEGIN ja END lausekkeita d) sisennystä

Informaatio ja Strateginen käyttäytyminen

monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.

Experiment on psychophysiological responses in an economic game (valmiin työn esittely) Juulia Happonen

Kandidaatintyön esittely: Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu

Kuntarakenteen uudistus

PHYS-C0220 Termodynamiikka ja statistinen fysiikka Kevät 2016

x+3 = n(y 3) y +n = 3(x n). Kun ylemmästä yhtälöstä ratkaistaan x = n(y 3) 3 ja sijoitetaan alempaan, saadaan

Hintakilpailu lyhyellä aikavälillä

4. Funktion arvioimisesta eli approksimoimisesta

KOEKYSYMYKSIÄ IKI 7 -OPPIKIRJAN SISÄLTÖIHIN

Dynaamiset regressiomallit

Transkriptio:

Paljastetut preferenssit ja peliteoria Ks. esim. Grüne-Yanoff & Lehtinen (tulossa) tai Hausman 2000, 2005, Guala 2006

Peruskysymys Voidaanko peliteorian palkkiot ymmärtää paljastettuina preferensseinä (von Neumann-Morgenstern hyötyinä)? Onko peliteoria episteemisesti tukevalla pohjalla?

Taustaa paljastettujen preferenssien teorialle (RPT) Samuelson 1938: RPT onnistui poistamaan viimeisemmätkin jäänteet hyötyanalyysistä. : teoria viittaa vain havaittaviin asioihin (hinnat, budjettirajoitteet, hyödykkeet).

Miten paljastettuja preferenssejä pitäisi tulkita? Kaksi teoriaa: (RPT) Samuelson/Arrow/Houthakker ja Savage/Von Neumann-Morgenstern (valinta varmuudessa ja riskin/epävarmuuden vallitessa) Useita tulkintoja (Wong 1976): 1) Viittauksesta mentalistiseen preferenssin käsitteeseen päästään eroon (Samuelson 1938) 2) RPT tarjoaa tavan testata väitteitä yksilöiden preferensseistä, tai tavan saada nämä preferenssit selville (Samuelson 1948) 3) RPT tarjoaa tavan johtaa kysyntäteorian kaikki johtopäätökset (Samuelson 1950). 4) Valinnat määrittelevät preferenssejä.

Weak Axiom of Revealed Preference (WARP) Yksilön valintajoukko C i (S) on vaihtoehto (vaihtoehdot) jonka yksilö i valitsi joukosta S. Jos henkilö valitsee x:n kun y on myös saatavana, ja jos hän sitten valitsee y:n toisessa tilanteessa, jossa x on myös saatavana, hänen pitää valita myös x. x, y S & x C i (S) { x, y S y C i (S ) x C i (S )}

valintakonsistenssi WARP on valintakonsistenssiehto: jos yhdessä tilanteessa valitaan yhdellä tavalla, siitä seuraa jotakin jossakin toisessa tilanteessa. Vrt. transitiivisuus

Vastaesimerkkejä WARP:n mielekkyydelle Amartya Sen: preferenssien menuriippuvuus: Jaska and Maija tapaavat yliopiston kirjastossa. 1) Jaska kysyy haluaako Maija lähteä hänen kanssaan kahville läheiseen kahvilaan. Maija suostuu. 2) Jaska kysyy haluaako Maija lähteä hänen kanssaan kahville läheiseen kahvilaan, tai jos häntä huvittaa, polttamaan Jaskan kotona vähän heroiinia. Maija ei suostu (kumpaankaan).

Valintajoukon episteeminen arvo X=Maija juo kahvia kahvilassa Y=Maija menee kotiin Z=Maija polttaa Jaskan kanssa heroiinia X C({X, Y}) Y C({X,Y,Z}) WARP rikkoutuu Vasta-argumentti: Valinnoissa ei ole epäjohdonmukaisuutta jos ne kuvataan uudelleen oikealla tavalla: Kahvin juominen kahvilassa merkitsee erilaista valintaa näissä kahdessa tilanteessa. Vastaus: Jos näin saa aina tehdä, konsistenssiehdot täyttyvät aina triviaalisti (vacuously). Teoria ei sanoisi enää mitään kiinnostavaa todellisuudesta, eikä sillä voi perustella palkkioiden turvallista episteemistä statusta.

Standardiargumentit RPT:tä vastaan (Wong & Sen) Teorian täytyy olettaa, etteivät preferenssit muutu. Mutta tämä oletus rikkoo tilannerajoitteen, jonka mukaan vain havaittavia käsitteitä saa käyttää. RPT ei saavuta tavoitettaan

Paljastetut preferenssit peliteoriassa: Binmoren (1994, 1998, 2005, 2007) väitteet Senin, Gauthierin, Tuomelan ym. analyysit vangin dilemmasta eivät kelpaa, koska nämä muuttavat vangin dilemman joksikin muuksi peliksi olettamalla, että pelaajat välittävät toisesta pelaajasta tai kokonaishyödystä ym. Palkkiot (hyödyt) peleissä tulisi tulkita paljastettuina preferensseinä.

Analysointi ja mallinnus Mallinnus tarkoittaa palkkioiden ja strategioiden määrittelyä (ja ehkä ratkaisukäsitteen valintaa). Pelin analysointi: peli ratkaistaan tasapainolla jotta nähtäisiin minkälaisen ennusteen peliteoria antaa. Kun peli on mallinnettu/konstruoitu, palkkioihin ei saa enää puuttua analysointivaiheessa; ne ovat mitä ovat.

Kaksi tapaa ymmärtää paljastetut preferenssit RP1 Valinnat määrittelevät palkkiot koska preferenssit ja valinnat ovat käsitteellisessä yhteydessä toisiinsa. RP2 On olemassa kokeellinen proseduuri (referenssiarpajaistekniikka), jota voitaisiin käyttää pelaajien palkkioiden selville saamiseksi.

Binmore Modern utility theory makes tautology of the fact that action B will be chosen rather than A when the former yields a higher payoff by defining the payoff of B to be larger than the payoff of A if B is chosen when A is available (Binmore 1994: p. 169). Moderni hyötyteoria pitää tautologiana sitä, että teko B valitaan A:n sijaan silloin kun B antaa suuremman palkkion määrittelemällä B:n palkkion suuremmaksi kuin A:n palkkion jos B valitaan kun A on saatavana. (vrt. representaatioteoreemat ja kategoriavirhe)

Binmoren PD Eeva Haukka Kyyhky Aatami Haukka 2,2 4,1 Kyyhky 1,4 3,3

Binmoren argumentti Haukkastrategialle In the one-shot Prisoner s Dilemma, Eve s utility [payoff] for the outcome (Dove, Hawk) is made larger than her utility for the outcome (Dove, Dove) because we are given that she would choose Hawk if she knew that Adam were sure to choose Dove Once this is understood, it becomes obvious that all the endless disputation over the standard game-theoretic analysis of the Prisoner s Dilemma is based on the simplest of misunderstandings. Eevan hyöty tulemalle (Kyyhky, Haukka) toistamattomassa vangin dilemmassa on tehty suuremmaksi kuin tulemalle (Kyyhky, Kyyhky) koska otamme annettuna, että hän valitsisi Haukka-strategian jos hän tietäisi että Aatami valitsee varmasti Kyyhky-strategian.

Kaksi tapaa argumentoida Haukkastrategian puolesta 1) Pelaajat valitsevat Haukka-strategian koska heidän palkkionsa on määritelty suuremmiksi tälle strategialle riippumatta siitä mitä toinen pelaaja valitsee. (perustuu ratkaisukäsitteeseen) 2) Koska valinnat määrittelevät preferenssit RPT:n mukaan, palkkiot Haukka-strategialle ovat suuremmat kuin Kyyhky-strategialle riippumatta siitä mitä toinen pelaaja valitsee, koska pelaajat valitsevat Haukka-strategian jos he ovat vangin dilemma- pelissä. (perustuu paljastettuihin preferensseihin)

Argumentti vaihtoehtoa 2) vastaan Pelaajien valinnat itse pelissä eivät voi määritellä heidän palkkioitaan tuossa samaisessa pelissä. Pelaajat valitsevat strategioita, joiden muotoilu edellyttää että preferenssit on jo määritelty Pelin analysointi olisi turhaa jos pelaajien valinnat pelissä määrittelisivät preferenssit.

Binmore? Käsitteellinen linkki palkkiot pitää määritellä pelaajien valinnoilla itse pelissä. Mutta jos peliteoreettinen malli on oikea kuvaus tilanteesta, pelaajat voivat valita vain tasapainostrategiansa mukaisia valintoja. Koko peliä ei voi määritellä noilla valinnoilla peliä ei voida määritellä valinnoilla pelissä.

Kaksi tapaa väittää että Kyyhkystrategia on mahdoton 1) Pelaajat valitsevat Haukka-strategian koska heidän palkkionsa on määritelty niin, että he valitsevat sen jos ovat vangin dilemmassa. Jos he siis valitsevat Kyyhky-strategian, he eivät ole vangin dilemmassa. 2) Pelaajien palkkiot on määritelty korkeammaksi Haukka-strategialle, koska he valitsevat sen jos ovat vangin dilemmassa. Pelaajien Kyyhkyvalinta siis määrittelee heidän palkkionsa siten, että he eivät ole vangin dilemmassa.

Elicitation Preferenssien selville saaminen koeproseduurilla (elicitation) on aina vaikeaa: framing, irrationaalisuus, preference reversals, tilariippuvat preferenssit ym. Peleissä on lisäkomplikaatio: Kaikki valinnat riippuvat siitä mitä odottaa toisen pelaajan tekevän. Miten siis preferenssit ja uskomukset erotetaan toisistaan havainnoissa kun puhumme peleistä?

Preferenssit ja uskomukset Jos uskomukset määritetään pelin sisällä, ne pitää johtaa ratkaisukäsitteen avulla. Ratkaisukäsitteen käyttö taas vaatii pelin analysointia. Elisitaatio vaatisi siis pelin analysoimista. Jos uskomukset määritetään eksogeenisesti, voisimme yhtä hyvin käyttää odotetun hyödyn teoriaa pelaajien valintojen määrittämiseksi. Pelin analysointi olisi turhaa. Ei ole ihme että preferenssit yleensä yksinkertaisesti postuloidaan, eikä niitä oteta selville.

Senin hedelmien valinta X: Valitse hedelmä korista ja syö se cocktailkutsuilla Y: Älä ota hedelmää korista tilanne 1: korissa on vain yksi hedelmä jäljellä henkilö ei ota sitä (kohteliaisuussyistä): Y tilanne 2: korissa on kaksi tai useampia hedelmiä henkilö ottaa hedelmän: X. Henkilön valinnat rikkovat WARPia: Ensin hedelmää ei otettu tilanteessa 1, sitten se valittiin tilanteessa 2.

Binmoren kritiikki Sen kertoo meille, etteivät ihmiset koskaan ota viimeistä hedelmää korista ja ovat siis epäjohdonmukaisia, kun he paljastavat preferenssinsä ensin olemalla ottamatta sitä jos korissa on vain yksi hedelmä, mutta muuttavat sitten preferenssinsä kun korissa on useita hedelmiä Kun hedelmänvalintaongelma asetetaan laajempaan yhteyteen [sellaiseen jossa valinta-avaruus sisältää hedelmän valitsemisen seuraukset sellaisessa yhteisössä jossa tällainen teko saa aikaan moraalista pahennusta], se mikä näytti RPT:n konsistenssiehtojen rikkomiselta, ei enää näytäkään siltä. Henkilö pitää hedelmistä riittävästi ottaakseen yhden silloin kun etiketti sen sallii, muttei muuten. Senin esimerkin opetus ei ole se, että RPT:n konsistenssivaatimukset ovat liian vahvoja ollakseen hyödyllisiä, vaan että jos ne näyttävät rikkoutuvan, on ensin katsottava onko valintaongelma oikealla tavalla mallinnettu.

Binmoren argumentin ongelma Senin pointti ei ole se, että WARP on liian vahva, vaan se, ettei se tee sitä teoreettista työtä jonka sen piti tehdä, eli tehdä viittaus mentaalisiin tiloihin turhaksi. Tarvitsemme psykologista tietoa henkilön asenteesta etikettiin määritelläksemme henkilön preferenssit oikein. Pelkät henkilön valinnat eivät anna tätä informaatiota. Emme voi määrittä onko henkilö epäjohdonmukainen tietämättä mitä hän yrittää tehdä, eli siis tietämättä jotakin teon itsensä ulkopuolista.

Mitä RPT argumenttien epäonnistumisesta seuraa? Ehkä Binmoren idea on vain sanoa, ettei peliteoriaa saisi käyttää löperöön tarinan kerrontaan. Binmoren pointti voisi olla se, että jos peliteorialla on jotain hyödyllistä annettavaa, sen täytyy olla mielenkiintoinen strategian valinnan analyysi. Tähän ei kuitenkaan tarvita paljastettuja preferenssejä.

Elisitaatio Binmore olettaa että preferenssit on jo saatu selville ja jäljellä on vain hyötynumeroiden allokointi, vaikka tällainen lähestymistapa onkin lähes tuntematon peliteoriassa.

RPT ja RP analyysi Jotkin RPT:n kannattajat (Dowding) korostavat RP analyysin merkitystä: Ideana on käyttää konsistenssivaatimuksia ihmisten toiminnan tulkitsemiseen. Jos tutkijalla on mitään resursseja ihmisten toiminnan ymmärtämiseen, nämä rationaalisuusvaatimukset ovat sellaisia.