Moraalinen uhkapeli: perusmalli ja optimaalinen sopimus

Samankaltaiset tiedostot
Moraalinen uhkapeli: laajennuksia ja sovelluksia

Haitallinen valikoituminen: Kahden tyypin malli

Signalointi: autonromujen markkinat

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

Haitallinen valikoituminen

Harjoitus 7: vastausvihjeet

Luento 12: Duaalitehtävä. Tarkennuksia Lagrangen kertoimen tulkintaan. Hajautettu optimointi.

min x x2 2 x 1 + x 2 1 = 0 (1) 2x1 1, h = f = 4x 2 2x1 + v = 0 4x 2 + v = 0 min x x3 2 x1 = ± v/3 = ±a x 2 = ± v/3 = ±a, a > 0 0 6x 2

Nollasummapelit ja bayesilaiset pelit

Matematiikan tukikurssi

Diskreettiaikainen dynaaminen optimointi

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Luento 12: Duaalitehtävä. Tarkennuksia Lagrangen kertoimen tulkintaan. Hajautettu optimointi.

Luento 9. June 2, Luento 9

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

Yhteistyötä sisältämätön peliteoria jatkuu

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Moraalinen uhkapeli: laajennuksia

b 1. b m ) + ( 2b Ax) + (b b)

1. TILASTOLLINEN HAHMONTUNNISTUS

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Sekastrategia ja Nash-tasapainon määrääminen

2 Osittaisderivaattojen sovelluksia

Sopimusteoria: Salanie luku 3.2

k S P[ X µ kσ] 1 k 2.

Luento 5: Peliteoria

Funktion raja-arvo ja jatkuvuus Reaali- ja kompleksifunktiot

b) Arvonnan, jossa 50 % mahdollisuus saada 15 euroa ja 50 % mahdollisuus saada 5 euroa.

Arvo (engl. value) = varmaan attribuutin tulemaan liittyvä arvo. Päätöksentekijä on riskipakoinen, jos hyötyfunktio on konkaavi. a(x) = U (x) U (x)

IV. TASAINEN SUPPENEMINEN. f(x) = lim. jokaista ε > 0 ja x A kohti n ε,x N s.e. n n

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

1. Etsi seuraavien funktioiden kriittiset pisteet ja tutki niiden laatu: (a.) f(x,y) = 20x 2 +10xy +5y 2 (b.) f(x,y) = 4x 2 2y 2 xy +x+2y +100

Viime kerralta Epävarmuus ja riski Optimaalinen kulutus-säästämispäätös: Tulo- ja substituutiovaikutus analyyttinen tarkastelu Epävarmuus Epävarmuus

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

Matematiikan tukikurssi

Konvergenssilauseita

Tenttiin valmentavia harjoituksia

Lineaarinen optimointi. Harjoitus 6-7, Olkoon A R m n, x, c R ja b R m. Osoita, että LP-tehtävän. c T x = min!

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Projektin arvon aleneminen

Inversio-ongelmien laskennallinen peruskurssi Luento 2

Lineaarinen optimointitehtävä

Mat Dynaaminen optimointi, mallivastaukset, kierros 5

Derivaatat lasketaan komponenteittain, esimerkiksi E 1 E 2

,ܾ jaü on annettu niin voidaan hakea funktion

Toispuoleiset raja-arvot

3. Teoriaharjoitukset

Matematiikan tukikurssi

2. Teoriaharjoitukset

saadaan kvanttorien järjestystä vaihtamalla ehto Tarkoittaako tämä ehto mitään järkevää ja jos, niin mitä?

Luento 6: Monitavoiteoptimointi

Matematiikan tukikurssi

Hintadiskriminaatio 2/2

Pelien teoriaa: tasapainokäsitteet

Duaalisuus kokonaislukuoptimoinnissa. Mat , Sovelletun matematiikan tutkijaseminaari, kevät 2008, Janne Karimäki

Seurauksia. Seuraus. Seuraus. Jos asteen n polynomilla P on n erisuurta nollakohtaa x 1, x 2,..., x n, niin P on muotoa

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1.

Varian luku 12. Lähde: muistiinpanot on muokattu Varianin (2006, instructor s materials) muistiinpanoista

Matematiikan tukikurssi, kurssikerta 2

4 Matemaattinen induktio

Sopimusteoria: Salanie luku 3.2

Matematiikassa väitelauseet ovat usein muotoa: jos P on totta, niin Q on totta.

Tehtävänanto oli ratkaista seuraavat määrätyt integraalit: b) 0 e x + 1

T Luonnollisten kielten tilastollinen käsittely

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Investointimahdollisuudet ja niiden ajoitus

KKT: log p i v 1 + v 2 x i = 0, i = 1,...,n.

Luento 8. June 3, 2014

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset

Differentiaali- ja integraalilaskenta 1 Ratkaisut 2. viikolle /

Aalto-yliopiston perustieteiden korkeakoulu Matematiikan ja systeemianalyysin laitos. MS-A0203 Differentiaali- ja integraalilaskenta 2, kevät 2016

1 Rajoittamaton optimointi

Numeeriset menetelmät TIEA381. Luento 7. Kirsi Valjus. Jyväskylän yliopisto. Luento 7 () Numeeriset menetelmät / 43

Avaruuden R n aliavaruus

3.7 Todennäköisyysjakaumia

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

Matematiikan tukikurssi, kurssikerta 3

Generoivat funktiot, Poisson- ja eksponenttijakaumat

U missä U A := {U R n : U avoin ja U A}; intuitiivisesti suurin avoin joukko, joka sisältyy A:han. Määritellään A:n sulkeuma A := F F A

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

Mikäli funktio on koko ajan kasvava/vähenevä jollain välillä, on se tällä välillä monotoninen.

MS-C1350 Osittaisdifferentiaaliyhtälöt Harjoitukset 5, syksy Mallivastaukset

Matematiikan tukikurssi

Pystysuuntainen hallinta 2/2

Johdantoa INTEGRAALILASKENTA, MAA9

Mat Sovellettu todennäköisyyslasku A

MS-A0004/A0006 Matriisilaskenta

Lyhyen aikavälin hintakilpailu 2/2

Matemaattisen analyysin tukikurssi

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari

saadaan kvanttorien järjestystä vaihtamalla ehto Tarkoittaako tämä ehto mitään järkevää ja jos, niin mitä?

Matematiikan tukikurssi

Matematiikan tukikurssi

Jokaisen parittoman kokonaisluvun toinen potenssi on pariton.

1 Kertaus. Lineaarinen optimointitehtävä on muotoa:

Investointimahdollisuudet ja investoinnin ajoittaminen

4.0.2 Kuinka hyvä ennuste on?

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Transkriptio:

Moraalinen uhkapeli: perusmalli a optimaalinen sopimus Mat-2.4142 Optimointiopin seminaari Mauno Taaamaa 18.02.2008

Esityksen rakenne Johdanto moraalisen uhkapelin käsite) Yksinkertaistettu tapaus a sen ratkaisu Yleinen malli a optimaalisen ratkaisun/sopimuksen ohto Optimaalisen ratkaisun/sopimuksen tulkinta Yhteenveto a kysymykset Kotitehtävä

Johdanto: Moraalinen uhkapeli Moraalisen uhkapelin edellytykset Agentti tekee päätöksen toiminta ), oka vaikuttaa hänen a Päämiehen saamaan hyötyyn Päämies pystyy vain tarkkailemaan tulosta, epätäydellistä signaalia toiminnasta Toiminta, onka Agentti suorittaa, ei ole Pareto-optimaalinen

Johdanto: Moraalinen uhkapeli Päämies ei voi pakottaa Agenttia toimimaan Paretooptimaalisesti, sillä hän ei tiedä mitä Agentti tekee Normaalisti Agentti on riskiä karttava a Päämies riskineutraali Päämies pyrkii vaikuttamaan Agentin saamaan hyötyyn lopputuloksen kautta: kannustimet a riskinkanto näiden välillä kompromissi) Mikäli Agentti riskineutraali, mitään kompromissia ei tarvita, vaan Agentti haluaa kantaa kaiken riskin

Yksinkertaistettu tapaus Kaksi toimintaa a), kaksi tulosta x) Agentti valitsee työskentelyn a=1) a työskentelemättä olemisen a = 0) välillä Kun a = 1, niin onnistumisen todennäköisyys on P, vastaavasti a = 0 niin todennäköisyys on p < P Päämies pystyy seuraamaan vain onnistuuko vai epäonnistuuko agentti Toiminnan hinta Agentille on normalisoitu siten, että agentin saama hyöty riippuen palkkiosta w) on uw) a, missä u on konkaavi Päämiehen saama hyöty onnistumisesta on x S a epäonnistumisesta on x F < x S

Yksinkertaistettu tapaus Päämies pyrkii saamaan Agentin valitsemaan a = 1, oten hän antaa palkkion w S onnistumisesta a w F epäonnistumisesta Täten Agentin saama hyöty Puw S ) + 1 P)uw F ) 1 puw S ) + 1 p)uw F ) P p)uw S ) uw F )) 1 Koska w S w F niin palkkoen erotus nousee kun P p olloin on vaikeampaa päätellä Agentin valintaa). Tällöin sanotaan, että kannustimen ollakseen toimiva on oltava korkea-asteisempi IC)

Yksinkertaistettu tapaus Myös yksilöllinen osallistumisraoite rationaalisuusehto) on pitää ottaa huomioon ulkopuolisen valinnan antama hyöty = U): Puw S ) + 1 P)uw F ) 1 U IR) Nyt IR-epäyhtälö)ehto redusoituu yhtälöksi, sillä muuten Päämies voi vähentää uw S ):sta a uw F ):sta pienen muutoksen, ε, oka ei muuta IC-ehtoa, mutta lisää Päämiehen hyötyä: Px S w S ) + 1 P)x F w F )

Yksinkertaistettu tapaus Lisäksi IC-ehto myös muodostuu yhtälöksi Sillä os se olisi tiukka epäyhtälö siitä voisi vähentää w S :stä termin 1 P)ε/u w S ) a lisätä w F :ään termin Pε/u w F ) Tällöin vielä IC-ehto olisi voimassa pienelle ε Nyt uw S ) vähenisi 1 P)ε verran a uw F ) kasvaisi Pε verran siten, että IR ehto pysyisi voimassa Kuitenkin Päämiehen kulut Pw S + 1 P) w F vähentyisi P1 P) ε1/u w S ) 1/uw F )) verran, oka on positiivinen sillä w S >w F a u on konkaavi

Yksinkertaistettu tapaus Nyt IC- a IR- ehdoista syntyy seuraavat ehdot: uw F ) = U p/p p) uw S ) = U 1 p)/p p) Josta ratkeaa Päämiehen odotettu hyöty: W 1 =Px S w S ) + 1 P)x F w F ) Mikäli Päämies katsoo, että Agentin kannustintoimet ovat liian kalliita, hän taroaa palkkioita w S = w F = w siten, että uw) = U a Päämies saa odotetun hyödyn: W 0 =px S + 1 p)x F w

Yksinkertaistettu tapaus Nyt W 1 W 0 on: W 1 W 0 = P p)x S x F )+w P w S 1 P)w F Koska palkkiot eivät riipu x S, x F :stä, oten os onnistuminen on Päämiehelle selvästi kiinnostavampi kuin epäonnistuminen x S x F on iso), niin hän valitsee kannustinpalkkion Tällöin on x S w S > x F w F optimitilassa, olloin voitto on aettu Agentin a Päämiehen kesken

Yleinen malli - pohustus Agentti voi valita n vaihtoehdoista toiminnan: a 1,a 2,,a n Vastaavasti tulee m kpl tuloksia: x 1,,x m Tulos on siis a priori signaali Agentin toiminnasta voitto/yliäämä Päämies- Agentti suhteesta Toiminnan vaihtoehdon a tuloksen välistä suhdetta kutsutaan toimintarakenteeksi : a i x tn:llä p i >0

Yleinen malli - lähtökohta Perusaatuksena on, että sopimusten tulee perustua palkkioihin, otka riippuvat tuloksesta: Päämies huomaa tuloksen x, hän maksaa palkkion w a pitää x w itsellään Agentin hyöty on separoituva palkkion a toiminnan suhteen, lisäksi toiminta on renormalisoitu siten, että marginaalikulut ovat vakiot Agentin hyöty on täten uw) a, missä u on kasvava a konkaavi Päämies on riskineutraali, olloin hänen hyötynsä on x w

Yleinen malli Agentin ohelma Agentti valitsee toimintansa Päämiehen taroaman palkkion w perusteella seuraavan ongelman pohalta max p i uw ) a i ) Kun Agentti valitsee a i, niin on n 1) kpl kannustinehtoa a rationaalisuusehto p i uw ) a i p k uw ) a k, IC k ) oka on voimassa k = 1,..,n a k n. p i uw ) a i U IR)

Yleinen malli Päämiehen ohelma Päämies voi valita sopimuksen w 1,,w n, oka maksimoi hänen odotettua hyötyään max p i x w ) Kun a i on optimaalinen ratkaisu, niin IR- a IC raoitteesiin liittyvät kertoimet λ 0 a µ 0 λ k p i uw ) a p k uw ) + a k ) 0 IC k ) µ p i uw ) a U ) 0 IR)

Yleinen malli Optimiratkaisu Ratkaisu tapahtuu Lagrangian yhtälön kautta Lw, λ, µ) = p i x w ) + λ p i uw ) a p k uw ) + a k ) + µ p i uw ) a U) Siitä saadaan ratkaistua 1 u' w ) = µ + n k = 1, k i λ 1 k p p k i ) Tämä redusoituu ykkösparhaaksi 1/ u w ) = µ 0, oka on samalla tehoikkain riskiako µ 0 toteuttaa aktiivisen IR:n) Termillä p k /p i on tärkeä rooli analyysissa, se voidaan ymmärtää tilastollisessa mielessä sitä kutsutaankin todennäköisyyssuhteeksi likelihood ratio) a pätee: p k /p i 1 kaikilla k, kun a i on estimaattori suhteelle annetulla x *)

Yleinen malli Optimiratkaisu Optimiratkaisu a i kiinnitetty Koska kaikki kertoimet λ k ovat ei-negatiivisia a funktio 1/u on kasvava, niin palkkio w liittyen tulokseen on suurempi kun on isompi määrä todennäköisyyssuhteita p k /p i <1 Päädytään ohtopäätökseen, että Päämies antaa parempaa palkkaa, kun hän tulkitsee tuloksesta, että Agentin suorittama toiminta olisi optimaalista

Yleinen malli Optimiratkaisun tulkinta Tutkitaan kuinka palkkio w riippuu tuloksesta Tiedetään, että kun Agentin toiminta on näkyvä a Päämies riskineutraali, niin optimaalinen palkka on vakio Jos Päämies on riskiä karttava a hänellä on konkaavi von Neumann-Morgenstern hyötyfunktio v, niin silloin marginaalihyötyen suhde on v x w ))/u w ) Tämä on itsenäinen tuloksesta, a optimiratkaisu w, on kasvava funktio :stä Vastaavanlainen tulos olisi hyvä saada myös tilanteessa, ossa Agentin toiminta ei ole havaittavissa Luonnollista olisi, että palkkion tulisi olla isompi, mitä enemmän hyödyn yliäämää on aettavissa

Yleinen malli Optimiratkaisun tulkinta Yleisesti pätee vain seuraavaa: 1. w ei voi olla tasaisesti vähenevä :ssä 2. Kuten ei myöskään x w ) 3. On olemassa,l) w > w l a x w x l w l

Yleinen malli Optimiratkaisun tulkinta Jos tuloksia on kahta vaihtoehtoa: onnistuminen a epäonnistuminen, niin optimaalinen palkkio-ohelma w: w 1 = w w 2 = w + sx 2 -x 1 ) Agentti saa siis peruspalkkion w, a bonuksen yliäämän perusteella mikäli hyväksyy sopimuksen 3. ehdon perusteella bonuskerroin: 0 < s 1

Yleinen malli Optimiratkaisun tulkinta Mikäli tuloksia enemmän kuin kaksi vaihtoehtoa, ei tarkempaa analyysia voi tehdä tekemättä lisäoletuksia toimintarakenteesta eli todennäköisyyksistä p i ) Tuloksella on siis kaksoisrooli: 1) kertoo aettavan hyödyn yliäämän 2) signaloi Päämiehelle minkälaisen toiminnan Agentti on mahdollisesti) tehnyt Ratkaisun rakenne täten määräytyy signaalin ominaisuuksista, kuten edellä nähtiin todennäköisyyssuhteesta

Yleinen malli Optimiratkaisun tulkinta Optimiratkaisu oli siis 1/ u w ) = µ + λ k 1 p k / p i ) *) Oletetaan, että korkeampi toiminta lisää todennäköisyyttä saada hyvä tulos vähintään yhtä palon kuin se lisää todennäköisyyttä saada huonompi tulos: kaikilla k < i, l <, pi pk p p il kl Tätä kutsutaan monotoniseksi todennäköisyyssuhde-ehdoksi MLRC: monotone likelihood ratio condition)

Yleinen malli Optimiratkaisun tulkinta MLRC kertoo siis että todennäköisyyssuhde kasvaa tuloksen kasvaessa Lisäksi siitä seuraa ensimmäisen asteen stokastinen dominanssi todistus kiran haroitus 5.6) Koska *):n kertoimet λ k ovat ei-negatiivisia, niin MLRC sanoo, että termit λ k 1 p k / p i ) ovat kasvavia, mikäli k < i a väheneviä muulloin Mielekäs ratkaisu saadaan kun ehdoksi tulee, että kertoimet λ k ovat nollia kun k > i, olloin ainoat aktiiviset kannustinraoitteet ovat ne, otka estävät Agenttia valitsemasta toimintaa, oka on vähemmän kallista kuin optimaalinen ratkaisu

Yleinen malli Optimiratkaisun tulkinta Mikäli tuloksia on vain kahdenlaisia, riittää MLRC takaa, että palkkio nousee tuloksen perusteella Yleisessä tapauksessa käytetään Jakaumafunktion konveksisuusehtoa CDFC - convexity of the distribution function condition) Kumulatiivinen akaumafunktio tuloksesta pitää olla konveksi a:ssa {a 1,, a n } Tarkemmin, kun i < < k a λ kuuluu [0,1] siten, että a = λa i + 1 λ)a k, niin CDFC P l λp il + 1 λ)p kl kaikilla l = 1,,m Yksi tulkinta CDFC:lle on, että se kuvaa toiminnasta tulevien tuloen vähenemistä, mutta Salinié kritisoi tulkintaa

Yleinen malli Optimiratkaisun tulkinta Olkoon a i optimaalinen toiminta Tällöin on l < i, olloin λ l on positiivinen Jos kaikki λ k = 0, k < i, niin optimaalinen palkkio sama, os mahdolliset toiminnat olisivat raoitettu A = {a i,,a n } Mutta tällöin optimaalinen palkkio olisi vakio, sillä a i on pienimmän kustannuksen toiminta oukossa A Nyt vakio palkkio voi implementoida toiminnan a 1, eikä a i oka on siis globaali optimi) ei päästä eteenpäin

Yleinen malli Optimiratkaisun tulkinta Tarkastellaan tilannetta, ossa Agentti on raoitettu toimintaan A = {a 1,,a i } a optimipalkkio w Tällöin a i on kallein toiminta a MLRC kertoo, että w kasvaa :ssä Tavoitteena todistaa, että w pysyy optimaalisena os Agentin annetaan valita toiminta raoittamattomasta oukosta A = {a 1,,a n }

Yleinen malli Optimiratkaisun tulkinta Vastatodistus: oletetaan, että on olemassa k > i siten, että Agentti haluaa valita a k :n: p k uw ) a k > p i uw ) a i Nyt l on indeksi toiminnalle, oka on vähemmän kallis kuin a i a onka kerroin λ k 0, p l uw ) a l = p i uw ) a i On olemassa λ kuuluu [0,1] siten, että a i = λa k + 1 λ)a l CDFC P i λp k + 1 λ)p l kaikilla = 1,,m

Yleinen malli Optimiratkaisun tulkinta Sioitetaan a käytetään CDFC:ää + = + + + + = = = = + = + + = = m l l m k k m l m l m k m k i m m m i i i a w u p a w u p a w u w u w u P a w u w u w u P a w u w u w u P a w u p 1 1 1 1 1 1 1 1 1 1 1 1 ) ) 1 ) ) )) ) ) 1 ) )) ) ) )) ) ) λ λ λ λ

Yleinen malli Optimiratkaisun tulkinta Tulos on ristiriidassa a k :n a a l :n määritelmien kanssa Täten palkkio w on kasvava a optimaalinen ratkaisu yleiseen ongelmaan Pitää huomioida myös, että välttämättä aina intuitiiviset tulokset eivät päde, esim. Päämiehen odotettu tuotto ei nousekaan Agentin tullessa tuottoisammaksi stokastisen dominanssin mielessä, eli todennäköisyydet kasvavat) valitsi Agentti mitä tahansa kotitehtävä)

Yhteenveto Moraalinen uhkapeli erittäin yleinen elävässä elämässä Ratkaisu ongelmaan on sitoa Agentin palkkio tulokseen, käyttäen hyväksi kannustimia a tarvittaessa riskinakoa Johdettu optimaalinen sopimusehto a siitä saatu palkkio-ohelma 1/ u w ) = µ + λ k 1 p k / p i ) w kasvava tai kahden tuloksen tapauksessa w 1 = w w 2 = w + sx 2 -x 1 ) Kysymyksiä?

Kotitehtävä Kiran haroitus 5.3.1) Yksinkertaistettu tapaus kaksi toimintaa, kaksi tulosta) Lähde liikkeelle Päämiehen odotetusta hyödystä W 1 >W 0. Kiroita W 1 a osoita, että W p P1 P) 1 = 2 ) P p u' w 1 ) u' ) 1 < S w F 0