Paljastetut preferenssit ja peliteoria. Ks. esim. Grüne-Yanoff & Lehtinen (tulossa) tai Hausman 2000, 2005, Guala 2006

Paljastetut preferenssit ja peliteoria Ks. esim. Grüne-Yanoff & Lehtinen (tulossa) tai Hausman 2000, 2005, Guala 2006

Peruskysymys Voidaanko peliteorian palkkiot ymmärtää paljastettuina preferensseinä (von Neumann-Morgenstern hyötyinä)? Onko peliteoria episteemisesti tukevalla pohjalla?

Taustaa paljastettujen preferenssien teorialle (RPT) Samuelson 1938: RPT onnistui poistamaan viimeisemmätkin jäänteet hyötyanalyysistä. : teoria viittaa vain havaittaviin asioihin (hinnat, budjettirajoitteet, hyödykkeet).

Miten paljastettuja preferenssejä pitäisi tulkita? Kaksi teoriaa: (RPT) Samuelson/Arrow/Houthakker ja Savage/Von Neumann-Morgenstern (valinta varmuudessa ja riskin/epävarmuuden vallitessa) Useita tulkintoja (Wong 1976): 1) Viittauksesta mentalistiseen preferenssin käsitteeseen päästään eroon (Samuelson 1938) 2) RPT tarjoaa tavan testata väitteitä yksilöiden preferensseistä, tai tavan saada nämä preferenssit selville (Samuelson 1948) 3) RPT tarjoaa tavan johtaa kysyntäteorian kaikki johtopäätökset (Samuelson 1950). 4) Valinnat määrittelevät preferenssejä.

Weak Axiom of Revealed Preference (WARP) Yksilön valintajoukko C i (S) on vaihtoehto (vaihtoehdot) jonka yksilö i valitsi joukosta S. Jos henkilö valitsee x:n kun y on myös saatavana, ja jos hän sitten valitsee y:n toisessa tilanteessa, jossa x on myös saatavana, hänen pitää valita myös x. x, y S & x C i (S) { x, y S y C i (S ) x C i (S )}

valintakonsistenssi WARP on valintakonsistenssiehto: jos yhdessä tilanteessa valitaan yhdellä tavalla, siitä seuraa jotakin jossakin toisessa tilanteessa. Vrt. transitiivisuus

Vastaesimerkkejä WARP:n mielekkyydelle Amartya Sen: preferenssien menuriippuvuus: Jaska and Maija tapaavat yliopiston kirjastossa. 1) Jaska kysyy haluaako Maija lähteä hänen kanssaan kahville läheiseen kahvilaan. Maija suostuu. 2) Jaska kysyy haluaako Maija lähteä hänen kanssaan kahville läheiseen kahvilaan, tai jos häntä huvittaa, polttamaan Jaskan kotona vähän heroiinia. Maija ei suostu (kumpaankaan).

Valintajoukon episteeminen arvo X=Maija juo kahvia kahvilassa Y=Maija menee kotiin Z=Maija polttaa Jaskan kanssa heroiinia X C({X, Y}) Y C({X,Y,Z}) WARP rikkoutuu Vasta-argumentti: Valinnoissa ei ole epäjohdonmukaisuutta jos ne kuvataan uudelleen oikealla tavalla: Kahvin juominen kahvilassa merkitsee erilaista valintaa näissä kahdessa tilanteessa. Vastaus: Jos näin saa aina tehdä, konsistenssiehdot täyttyvät aina triviaalisti (vacuously). Teoria ei sanoisi enää mitään kiinnostavaa todellisuudesta, eikä sillä voi perustella palkkioiden turvallista episteemistä statusta.

Standardiargumentit RPT:tä vastaan (Wong & Sen) Teorian täytyy olettaa, etteivät preferenssit muutu. Mutta tämä oletus rikkoo tilannerajoitteen, jonka mukaan vain havaittavia käsitteitä saa käyttää. RPT ei saavuta tavoitettaan

Paljastetut preferenssit peliteoriassa: Binmoren (1994, 1998, 2005, 2007) väitteet Senin, Gauthierin, Tuomelan ym. analyysit vangin dilemmasta eivät kelpaa, koska nämä muuttavat vangin dilemman joksikin muuksi peliksi olettamalla, että pelaajat välittävät toisesta pelaajasta tai kokonaishyödystä ym. Palkkiot (hyödyt) peleissä tulisi tulkita paljastettuina preferensseinä.

Analysointi ja mallinnus Mallinnus tarkoittaa palkkioiden ja strategioiden määrittelyä (ja ehkä ratkaisukäsitteen valintaa). Pelin analysointi: peli ratkaistaan tasapainolla jotta nähtäisiin minkälaisen ennusteen peliteoria antaa. Kun peli on mallinnettu/konstruoitu, palkkioihin ei saa enää puuttua analysointivaiheessa; ne ovat mitä ovat.

Kaksi tapaa ymmärtää paljastetut preferenssit RP1 Valinnat määrittelevät palkkiot koska preferenssit ja valinnat ovat käsitteellisessä yhteydessä toisiinsa. RP2 On olemassa kokeellinen proseduuri (referenssiarpajaistekniikka), jota voitaisiin käyttää pelaajien palkkioiden selville saamiseksi.

Binmore Modern utility theory makes tautology of the fact that action B will be chosen rather than A when the former yields a higher payoff by defining the payoff of B to be larger than the payoff of A if B is chosen when A is available (Binmore 1994: p. 169). Moderni hyötyteoria pitää tautologiana sitä, että teko B valitaan A:n sijaan silloin kun B antaa suuremman palkkion määrittelemällä B:n palkkion suuremmaksi kuin A:n palkkion jos B valitaan kun A on saatavana. (vrt. representaatioteoreemat ja kategoriavirhe)

Binmoren PD Eeva Haukka Kyyhky Aatami Haukka 2,2 4,1 Kyyhky 1,4 3,3

Binmoren argumentti Haukkastrategialle In the one-shot Prisoner s Dilemma, Eve s utility [payoff] for the outcome (Dove, Hawk) is made larger than her utility for the outcome (Dove, Dove) because we are given that she would choose Hawk if she knew that Adam were sure to choose Dove Once this is understood, it becomes obvious that all the endless disputation over the standard game-theoretic analysis of the Prisoner s Dilemma is based on the simplest of misunderstandings. Eevan hyöty tulemalle (Kyyhky, Haukka) toistamattomassa vangin dilemmassa on tehty suuremmaksi kuin tulemalle (Kyyhky, Kyyhky) koska otamme annettuna, että hän valitsisi Haukka-strategian jos hän tietäisi että Aatami valitsee varmasti Kyyhky-strategian.

Kaksi tapaa argumentoida Haukkastrategian puolesta 1) Pelaajat valitsevat Haukka-strategian koska heidän palkkionsa on määritelty suuremmiksi tälle strategialle riippumatta siitä mitä toinen pelaaja valitsee. (perustuu ratkaisukäsitteeseen) 2) Koska valinnat määrittelevät preferenssit RPT:n mukaan, palkkiot Haukka-strategialle ovat suuremmat kuin Kyyhky-strategialle riippumatta siitä mitä toinen pelaaja valitsee, koska pelaajat valitsevat Haukka-strategian jos he ovat vangin dilemma- pelissä. (perustuu paljastettuihin preferensseihin)

Argumentti vaihtoehtoa 2) vastaan Pelaajien valinnat itse pelissä eivät voi määritellä heidän palkkioitaan tuossa samaisessa pelissä. Pelaajat valitsevat strategioita, joiden muotoilu edellyttää että preferenssit on jo määritelty Pelin analysointi olisi turhaa jos pelaajien valinnat pelissä määrittelisivät preferenssit.

Binmore? Käsitteellinen linkki palkkiot pitää määritellä pelaajien valinnoilla itse pelissä. Mutta jos peliteoreettinen malli on oikea kuvaus tilanteesta, pelaajat voivat valita vain tasapainostrategiansa mukaisia valintoja. Koko peliä ei voi määritellä noilla valinnoilla peliä ei voida määritellä valinnoilla pelissä.

Kaksi tapaa väittää että Kyyhkystrategia on mahdoton 1) Pelaajat valitsevat Haukka-strategian koska heidän palkkionsa on määritelty niin, että he valitsevat sen jos ovat vangin dilemmassa. Jos he siis valitsevat Kyyhky-strategian, he eivät ole vangin dilemmassa. 2) Pelaajien palkkiot on määritelty korkeammaksi Haukka-strategialle, koska he valitsevat sen jos ovat vangin dilemmassa. Pelaajien Kyyhkyvalinta siis määrittelee heidän palkkionsa siten, että he eivät ole vangin dilemmassa.

Elicitation Preferenssien selville saaminen koeproseduurilla (elicitation) on aina vaikeaa: framing, irrationaalisuus, preference reversals, tilariippuvat preferenssit ym. Peleissä on lisäkomplikaatio: Kaikki valinnat riippuvat siitä mitä odottaa toisen pelaajan tekevän. Miten siis preferenssit ja uskomukset erotetaan toisistaan havainnoissa kun puhumme peleistä?

Preferenssit ja uskomukset Jos uskomukset määritetään pelin sisällä, ne pitää johtaa ratkaisukäsitteen avulla. Ratkaisukäsitteen käyttö taas vaatii pelin analysointia. Elisitaatio vaatisi siis pelin analysoimista. Jos uskomukset määritetään eksogeenisesti, voisimme yhtä hyvin käyttää odotetun hyödyn teoriaa pelaajien valintojen määrittämiseksi. Pelin analysointi olisi turhaa. Ei ole ihme että preferenssit yleensä yksinkertaisesti postuloidaan, eikä niitä oteta selville.

Senin hedelmien valinta X: Valitse hedelmä korista ja syö se cocktailkutsuilla Y: Älä ota hedelmää korista tilanne 1: korissa on vain yksi hedelmä jäljellä henkilö ei ota sitä (kohteliaisuussyistä): Y tilanne 2: korissa on kaksi tai useampia hedelmiä henkilö ottaa hedelmän: X. Henkilön valinnat rikkovat WARPia: Ensin hedelmää ei otettu tilanteessa 1, sitten se valittiin tilanteessa 2.

Binmoren kritiikki Sen kertoo meille, etteivät ihmiset koskaan ota viimeistä hedelmää korista ja ovat siis epäjohdonmukaisia, kun he paljastavat preferenssinsä ensin olemalla ottamatta sitä jos korissa on vain yksi hedelmä, mutta muuttavat sitten preferenssinsä kun korissa on useita hedelmiä Kun hedelmänvalintaongelma asetetaan laajempaan yhteyteen [sellaiseen jossa valinta-avaruus sisältää hedelmän valitsemisen seuraukset sellaisessa yhteisössä jossa tällainen teko saa aikaan moraalista pahennusta], se mikä näytti RPT:n konsistenssiehtojen rikkomiselta, ei enää näytäkään siltä. Henkilö pitää hedelmistä riittävästi ottaakseen yhden silloin kun etiketti sen sallii, muttei muuten. Senin esimerkin opetus ei ole se, että RPT:n konsistenssivaatimukset ovat liian vahvoja ollakseen hyödyllisiä, vaan että jos ne näyttävät rikkoutuvan, on ensin katsottava onko valintaongelma oikealla tavalla mallinnettu.

Binmoren argumentin ongelma Senin pointti ei ole se, että WARP on liian vahva, vaan se, ettei se tee sitä teoreettista työtä jonka sen piti tehdä, eli tehdä viittaus mentaalisiin tiloihin turhaksi. Tarvitsemme psykologista tietoa henkilön asenteesta etikettiin määritelläksemme henkilön preferenssit oikein. Pelkät henkilön valinnat eivät anna tätä informaatiota. Emme voi määrittä onko henkilö epäjohdonmukainen tietämättä mitä hän yrittää tehdä, eli siis tietämättä jotakin teon itsensä ulkopuolista.

Mitä RPT argumenttien epäonnistumisesta seuraa? Ehkä Binmoren idea on vain sanoa, ettei peliteoriaa saisi käyttää löperöön tarinan kerrontaan. Binmoren pointti voisi olla se, että jos peliteorialla on jotain hyödyllistä annettavaa, sen täytyy olla mielenkiintoinen strategian valinnan analyysi. Tähän ei kuitenkaan tarvita paljastettuja preferenssejä.

Elisitaatio Binmore olettaa että preferenssit on jo saatu selville ja jäljellä on vain hyötynumeroiden allokointi, vaikka tällainen lähestymistapa onkin lähes tuntematon peliteoriassa.

RPT ja RP analyysi Jotkin RPT:n kannattajat (Dowding) korostavat RP analyysin merkitystä: Ideana on käyttää konsistenssivaatimuksia ihmisten toiminnan tulkitsemiseen. Jos tutkijalla on mitään resursseja ihmisten toiminnan ymmärtämiseen, nämä rationaalisuusvaatimukset ovat sellaisia.