Lisää mekanismin suunnittelusta

Samankaltaiset tiedostot
Kommunikaatio Visa Linkiö. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Nollasummapelit ja bayesilaiset pelit

Signalointi: autonromujen markkinat

Luento 5: Peliteoriaa

Peliteoria luento 2. May 26, Peliteoria luento 2

Paljonko maksat eurosta -peli

Päämies-agentti-malli ja mekanismisuunnittelu

1 Raja-arvo. 1.1 Raja-arvon määritelmä. Raja-arvo 1

Yhteistyötä sisältämätön peliteoria jatkuu

Mat. tukikurssi 27.3.

Johdanto peliteoriaan Kirja kpl. 2

MS-C2105 Optimoinnin perusteet Malliratkaisut 5

Yhteistyötä sisältämätön peliteoria

Toistetut pelit Elmeri Lähevirta. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

12 Oligopoli ja monopolistinen kilpailu

Opettaminen ja oppiminen

Haitallinen valikoituminen: Kahden tyypin malli

Harjoitus 3 ( )

Haitallinen valikoituminen: yleinen malli ja sen ratkaisu

11 Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Ch 17)

3 Raja-arvo ja jatkuvuus

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Prof. Marko Terviö Assist. Jan Jääskeläinen

Suoran yhtälöt. Suoran ratkaistu ja yleinen muoto: Suoran yhtälö ratkaistussa, eli eksplisiittisessä muodossa, on

Pyramidi 4 Analyyttinen geometria tehtävien ratkaisut sivu 352 Päivitetty Pyramidi 4 Luku Ensimmäinen julkaistu versio

6.1 Lineaarinen optimointi

Ratkaisuehdotukset LH 3 / alkuvko 45

Hintakilpailu lyhyellä aikavälillä

TALOUSTIETEEN LUENTOJEN TEHTÄVÄT

Sekastrategiat ja intensiiviyhteensopivuus

x+3 = n(y 3) y +n = 3(x n). Kun ylemmästä yhtälöstä ratkaistaan x = n(y 3) 3 ja sijoitetaan alempaan, saadaan

(a) Järjestellään yhtälöitä siten, että vasemmalle puolelle jää vain y i ja oikealle puolelle muut

Luku 21 Kustannuskäyrät

Y56 laskuharjoitukset 6

Graafit ja verkot. Joukko solmuja ja joukko järjestämättömiä solmupareja. eli haaroja. Joukko solmuja ja joukko järjestettyjä solmupareja eli kaaria

Funktio. Funktio on kahden luvun riippuvuuden ilmaiseva sääntö, joka annetaan usein laskulausekkeena.

Harjoitus 3 ( )

Geneettiset algoritmit

Pohdiskeleva ajattelu ja tasapainotarkennukset

Kuva 1: Tehtävä 1a. = 2π. 3 x3 1 )

Kokonaislukuoptimointi hissiryhmän ohjauksessa

Harjoitus 1 ( )

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopisto BIZ 31C00100 Assist. Jan Jääskeläinen Syksy 2017

Data Envelopment Analysis (DEA) - menetelmät + CCR-DEA-menetelmä

Talousmatematiikan perusteet

Epätäydellisen tiedon jatkuvat pelit. Mika Viljanen Peliteorian seminaari

Esimerkkejä polynomisista ja ei-polynomisista ongelmista

Algoritmit 1. Luento 13 Ti Timo Männikkö

PRELIMINÄÄRIKOE. Pitkä Matematiikka

Helsingin, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe klo 10 13

Probabilistiset mallit (osa 1) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 1 Jorma Merikoski Tampereen yliopisto

Algoritmit 2. Luento 13 Ti Timo Männikkö

v 8 v 9 v 5 C v 3 v 4

Luento 9. June 2, Luento 9

Demo 1: Simplex-menetelmä

Informaatio ja Strateginen käyttäytyminen

Algoritmit 1. Luento 9 Ti Timo Männikkö

Peliteoria luento 1. May 25, Peliteoria luento 1

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

Sijoitusmenetelmä Yhtälöpari

Valitaan alkio x 1 A B ja merkitään A 1 = A { x 1 }. Perinnöllisyyden nojalla A 1 I.

SEKASTRATEGIAT PELITEORIASSA

ehdolla y = f(x1, X2)

Uolevin reitti. Kuvaus. Syöte (stdin) Tuloste (stdout) Esimerkki 1. Esimerkki 2

Tietotekniikan valintakoe

Matematiikan pohjatietokurssi

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

Matemaattinen Analyysi

y 1 x l 1 1 Kuva 1: Momentti

Harjoitus 1 ( )

normaali- ja leikkaus jännitysten laskemiseen pisteessä Määritetään ne tasot, joista suurimmat normaali- ja leikkausjännitykset löytyvät

Mikrotaloustiede Prof. Marko Terviö Aalto-yliopiston 31C00100 Syksy 2015 Assist. Salla Simola kauppakorkeakoulu

Lyhyen aikavälin hintakilpailu 2/2

1. Olkoot vektorit a, b ja c seuraavasti määritelty: a) Määritä vektori. sekä laske sen pituus.

Matematiikan johdantokurssi, syksy 2017 Harjoitus 8, ratkaisuista

Tekijä Pitkä matematiikka On osoitettava, että jana DE sivun AB kanssa yhdensuuntainen ja sen pituus on 4 5

4.3. Matemaattinen induktio

Kustannustehokkaat riskienhallintatoimenpiteet kuljetusverkostossa (Valmiin työn esittely)

Luento 8. June 3, 2014

Lukuteorian kertausta

Kurssikoe on maanantaina Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

T : Max-flow / min-cut -ongelmat

Tee konseptiin pisteytysruudukko! Muista kirjata nimesi ja ryhmäsi. Lue ohjeet huolellisesti!

isomeerejä yhteensä yhdeksän kappaletta.

Kirjoita oma versio funktioista strcpy ja strcat, jotka saavat parametrinaan kaksi merkkiosoitinta.

2 Osittaisderivaattojen sovelluksia

DI matematiikan opettajaksi: Täydennyskurssi, kevät 2010 Luentorunkoa ja harjoituksia viikolle 11: ti klo 13:00-15:30

Tee konseptiin pisteytysruudukko! Muista kirjata nimesi ja ryhmäsi. Lue ohjeet huolellisesti

Dynaaminen hintakilpailu ja sanattomat sopimukset

SUBSTANTIIVIT 1/6. juttu. joukkue. vaali. kaupunki. syy. alku. kokous. asukas. tapaus. kysymys. lapsi. kauppa. pankki. miljoona. keskiviikko.

Johdatus lukuteoriaan Harjoitus 2 syksy 2008 Eemeli Blåsten. Ratkaisuehdotelma

Markkinoiden suunnittelu ja Gale-Shapley-algoritmi

Tarkennamme geneeristä painamiskorotusalgoritmia

PARITUS KAKSIJAKOISESSA

, tuottoprosentti r = X 1 X 0

Tekijä Pitkä Matematiikka 11 ratkaisut luku 2

matematiikka Martti Heinonen Markus Luoma Leena Mannila Kati Rautakorpi-Salmio Timo Tapiainen Tommi Tikka Timo Urpiola

ja siten kyseisen symmetriaryhmä on toinen dihedraaliryhmä (D 2 )

Transkriptio:

Lisää mekanismin suunnittelusta MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäl 16.11.2016 Joonas Laihanen The document can be stored and made available to the public on the open internet pages of Aalto Universit. All other rights are reserved.

Sisältö Mekanismin suunnittelun käsitteitä (kertaus?). Esimerkkejä mekanismeista sekä niiden ominaisuuksista ja sovelluksista: VCG-mekanismi -siirtoverkkoesimerkki -vahvuudet ja heikkoudet Mekanismien olemassaolosta tietillä ominaisuuksilla Tehtävien aikataulutusongelma - Hvits ja rankaisu -mekanismit Kaistenleveden allokointi tietoverkoissa - suhteutettu allokointimekanismi Monilähetksen kulujen jako -Shaple vs. VCG Kaksipuolinen paritus -stabiili paritus -jaksotettu hväksmisalgoritmi mekanismina Kotitehtävät

Suora intensiivihteensopiva/todenmukainen kvasilineaarinen tehokas mekanismi, joka on määritett parina Jossa:???

Kertaus: Mitä on mekanismin suunnittelu? Sosiaalisen valinnan teoria tutkii agenttien preferenssien järjestämistä suurimman kokonaishödn mukaisesti Sosiaalisen valinnan teoria on kuitenkin eistrateginen: preferenssit oletetaan annetuiksi, vaikka agentit voivat saada hötä valehtelemalla preferensseistään Mekanismin suunnittelu hdistää peliteorian ja. sosiaalisen valinnan teorian. Suunnittelija etsii optimaalista tulosta agenttien aitojen preferenssien mukaan Normaalin peliteorian ongelma: Kuinka agentit kättätvät jossain pelissä? Mekanismin suunnittelun ( käänteisen peliteorian ) ongelma: Kuinka saada agentit kättätmään tietllä halutunkaltaisilla tavoilla, esim. äänestämisessä, että agentit ilmoittavat todelliset preferenssinsä?

Kertaus: Mitä on mekanismin suunnittelu? Sosiaalisen valinnan teoria tutkii agenttien preferenssien järjestämistä suurimman kokonaishödn mukaisesti Sosiaalisen valinnan teoria on kuitenkin eistrateginen: preferenssit oletetaan annetuiksi, vaikka agentit voivat saada hötä valehtelemalla preferensseistään Mekanismin suunnittelu hdistää peliteorian ja. sosiaalisen valinnan teorian. Suunnittelija etsii optimaalista tulosta agenttien aitojen preferenssien mukaan Normaalin peliteorian ongelma: Kuinka agentit kättätvät jossain pelissä? Mekanismin suunnittelun ( käänteisen peliteorian ) ongelma: Kuinka saada agentit kättätmään tietllä halutunkaltaisilla tavoilla, esim. äänestämisessä, että agentit ilmoittavat todelliset preferenssinsä?

Kertaus: Paljastusperiaate: Jos on olemassa mekanismi, joka toimeenpanee sosiaalisen valintafunktion C dominoiville strategioille, silloin on olemassa suora mekanismi, joka toimeenpanee C:n dominoiville strategioille ja on todenmukainen. = on olemassa mekanismi, jossa agenttien kannattaa paljastaa valehtelematta omat tppinsä. Miten New mechanism -laatikko kätännössä toteutetaan?

Kertaus: Groven mekanismi Valintasääntö= Näin mekanismi valitsee agenttien antamien preferenssien mukaan maksusääntö=agentit saavat tämän Todenkertominen kannattavaa eli agenttien kannattaa kertoa todelliset arvostuksensa v vaihtoehdoille Esimerkki tehokkaasta ja todenmukaisesta mekanismista dominoiduille strategioille Mutta kuinka valitaan h maksusäännössä?

VCG-mekanismi Valitaan edellisessä, että Saadaan mekanismi:

Esimerkki VCG-mekanismin toiminnasta: Silta-saari-peli (nimi itse keksitt katson kirjasta luku 10.4.2) Olen agentti BD ja minun siltani on 2km pitkä ja minulle koituu kustannus -2, jos tätä siltaa kätetään Miten päästään saaresta A saareen F mahdollisimman alhaisin kustannuksin ja mitä agenteille tulee tällöin maksaa, kun kätetään VCG-mekanismia?

Esimerkki VCG-mekanismin toiminnasta Lhin reitti on selvästikin: ABEF = reitti ABEF

Esimerkki VCG-mekanismin toiminnasta Tarkastellaan agentti AC:tä. Jos hän ilmoittaa olevansa mukana, on lhin reitti pituudeltaan 5 ja kustannus muille kuin hänelle on -5 ja jos hän ilmoittaa, että hän ei ole mukana, niin lhin reitti on 5. p(ac)=(-5)-(-5)=0 Eli AC:lle ei makseta mitään Möskin BD, CE, CF ja DF saavat maksun 0.

Esimerkki VCG-mekanismin toiminnasta Tarkastellaan agentti AB:tä. Jos hän ilmoittaa olevansa mukana, on lhin reitti Pituudeltaan 5 ja kustannus muille kuin hänelle on 2 ja jos hän ilmoittaa, että hän ei ole mukana, niin lhin reitti on 6. p(ab)=(-6)-(-2)=-4 Eli AB:lle maksetaan 4. Vastaavasti: p(be)=(-6)-(-4)=-2 p(ef)=(-7)-(-4)=-3 Erillaiset Markkinavoimat HUOM. Vaikka siltamaksut ovat samoja BE ja EF:lle maksetaan eri hinnat.

VCG-mekanismi: hviä puolia Vain pivotaaliset eli agentit, joiden mukana olo vaikuttaa reitin valintaan, joutuvat maksamaan pelaamisesta. Yleisesti ottaen: Mekanismi suunnittelun ksi voimakkaimmista positiivisista tuloksista: leinen tapa rakentaa dominoiduille strategioille todenmukainen peli, joka maksimoi sosiaalisen hteishödn (kvasilineaarisissa tapauksissa) Mikään muu oleellisesti erilainen mekanismi ei pst samaan

VCG-mekanismi: heikkoudet 1) Agenttien paljastettava kokonaisuudessaan ksitinen tieto -ongelmallista esim. jos ksitisellä tiedolla arvoa jatkossa toistettujen pelien muodossa 2) Mahdollisuus pelaajien välisiin liittoumiin 3) VCG ei ole niukka: maksaa turhan suuria hvitksiä peliin osallistumisesta 4) Tarjoajien poistaminen saattaa nostaa voittoja 5) Ei pst palauttamaan kaikkia voittoja agenteille 6) Laskennalliset ongelmat: arg ma laskeminen NP-kova ongelma usein

Valitettavasti kaikkia hviä ominaisuuksia mekanismille ei voi olla htä aikaa

Tehtävien aikataulutusongelma N agenttia ja T tehtävää Agentin i tppi on vektori t(i,j), joka kertoo kuinka kauan tehtävään j menee agentilla i Yritetään minimoida kokonaissuoritusaikaa eli milloin viimeinen tehtävä saadaan tehtä Huom. agentit tekevät siis tehtäviä htä aikaa ja ksi agentti voi tehdä monta ja toinen ei htään Agentit ilmoittavat arvionsa tönopeuksistaan eli vektorin t (huom. voivat valehdella) Ja toteutunut tömäärä ei välttämättä sama kuin arvio, vaan aina suurempi tai htä suuri Mekanismi näkee todelliset tötunnit tehtävän suorituksen jälkeen Agentit haluavat painaa duunia mahdollisimman paljon

Ratkaistaan tämä Groven mekanismilla? Ei onnistu. Groven mekanismi olisi siitä hvä, että pelaajat paljastaisivat todelliset tppinsä eli töaika-arviot rehellisesti, mutta Grove maksimoi agenttien omien hötjen summaa, eikä minimoi kokonaissuoritusaikaa. Kätetään ns. 'hvits ja rankaisu' -mekanismeja, jotka voidaan käsittää Groven mekanismin leistksenä tapauksiin, joissa maksimoidaan jotain leisempää kuin sosiaalisen hödn summaa agenteille

Tämä mekanismi minimoi siis kokonaissuoritusajan Lisäksi:

Kaistanleveden allokointi tietoverkoissa N kättäjää kättää verkkoresurssia, jolla kapasiteetti C [ LIITUTAULU ] Tarkastellaan ns. suhteutettua allokointimekanismia, jossa agentit ilmoittavat hden arvon w(i), joka kuvaa maksutarjousta, jonka i tekee tietoverkon operaattorille [ LIITUTAULU ]

Kaistanleveden allokointi tietoverkoissa Huom. suhteutettu ei ole suora mekanismi Hvä puoli: hötfunktio voi olla mielivaltainen Huono puoli: strateginen kompleksisuus agentit voivat vaikuttaa allokointiensa lisäksi mös maksuihinsa tarkastellaan ksinkertaistettua mallia, jossa μ ajatellaan vakiona saadaan oheinen tulos 'kilpailukkiselle tasapainolle':

Kaistanleveden allokointi tietoverkoissa Jos tarkastellaan normaalia tapausta, jossa μ riippuu tarjouksista w Kuinka suuri osa sosiaalisesta optimista kilpailutasapainosta saavutetaan Nashin tasapainossa? saadaan oheinen tulos normaalille Nashin tasapainolle: Strateginen kätös aiheuttaa siis pahimmassa tapauksessa -25% tehottomuutta (=anarkian hinta 4/3)

Multicast cost sharing Mallinnetaan median streamausta digitaalisessa verkossa: -useita kättäjiä, jotka arvostavat lähetksen vastaanottamista eri määrin -ktketvät toisiinsa linkeillä, joiden kätössä jokin linkkikohtainen maksu Ketkä valitaan lähetksen vastaanottajaksi? Kuinka paljon heidän tulisi maksaa?

Multicast cost sharing Ohessa vastaus, jonka VCG-mekanismi antaa. VGC-mekanismi: todenmukainen ja tehokas Shaplen arvomekanismi: todenmukainen ja budjettitasapainoinen Osa kotitehtävää: Tutustu Shaplen mekanismiin (Figure 10.6) ja ratkaise edellä esitett peli sillä.

Kaksipuolinen paritus Edellisissä esimerkeissä on tarkasteltu kvasilineaarisia asetelmia on oletettu, että raha liikkuu agenttien ja mekanismin välillä rahan liikkuminen ei aina mahdollista (esim. moraaliset st, kuten munuassiirrot ja oppilasvalinnat) Nt, kaksipuolisessa parituksessa paritetaan joukon A alkiot joukon S alkioihin. Keskittään tässä esimerkki tapaukseen A=Advisors=Ohjaajat, S=Students=Opiskelijat

Kaksipuolinen paritus a a c b b c a b c

Kaksipuolinen paritus Käsitteitä:

Kaksipuolinen paritus Käsitteitä: + =

Kaksipuolinen paritus Stabiili paritus on aina olemassa (ei tosin ksikäsitteisesti). Eräs stabiili paritus voidaan lötää ns. jaksotetulla hväksmisalgoritmilla (opiskelija-versio)

Kaksipuolinen paritus a a c b b c a b c

Kaksipuolinen paritus a a c b b c a b c

Kaksipuolinen paritus a a c b b c a b c

Kaksipuolinen paritus a a c b b c a b c

Kaksipuolinen paritus a a c b b c a b c

Kaksipuolinen paritus a a c b b c a b c

Kaksipuolinen paritus Stabiili paritus on opiskelija-optimaalinen, jos opiskelijat pitävät kaikkia muitakin stabiileja parituksia htä hvinä lödetään opiskelija-versiolla Vastaavasti ohjaaja-optimaalinen stabiili paritus lödetään jaksotetulla hväksmisalgoritmilla (ohjaaja-versio) eli sama kuin opiskelija-versio, mutta opiskelija ohjaaja

Kaksipuolinen paritus Ikäviä piirteitä parittamisessa: Achievable= saavutettavissa oleva= on olemassa stabiili paritus, jossa löt tämä ohjaaja-opiskelijapari

Kaksipuolinen paritus Lisäksi kaksipuolista paritusta vaivaa seuraavakin: Löt kuitenkin seuraava positiivinen tulos mekanismi suunnitteluun liitten. Joudutaan tosin vaatimaan, että ohjaajat kättätvät rehellisesti (=ei-strategisesti):

KOTITEHTÄVÄT 1. Generoi satunnainen kokonaisluku väliltä 1-2 osoitteessa https://www.random.org/ (tai vaikka arpakuutiolla). Tee niin monta tehtävää tehtävistä a), b), c) kuin luku nättää. Eli jos saat vaikka luvun 1 voit valita, että teet vaikka vain b)-kohdan ja saat tältä osin tädet pisteet (jos suurin piirtein oikein ratkaistu). Huom. teen tilastollisen analsin saamilleni luvuille. Jos havaitsen liian vakavaa vilunkia eli että vain hden kohdan tehneitä on liikaa (= p-arvo pienempi kuin 0.01), kaikki saavat nolla pistettä tästä tehtävästä. Huom. jos olet jänishousu voit tehdä kaikki 3 tehtävää a), b), c) ja et osallistu tällöin o. peliin ja saat varmasti tädet pisteet.

KOTITEHTÄVÄT 1. a) Muodosta silta-saari-peli, jossa vähintään 7 solmua ja 9 kaarta. Oheisessa kuvassa on nt 6 solmua ja 8 kaarta eli voit muokata tätä pienin lisäksin tai mieluummin keksi kokonaan uudenlainen graafi. Ratkaise VCG-mekanismin avulla, mitä pelaajille joudutaan maksamaan. Lisäksi graafissa 3 kaarella tulee olla sama kustannus, mutta eri maksut kseisten kaarien/siltojen omistajille, kun maksut määritetään VCG-mekanismin mukaisesti.

KOTITEHTÄVÄT 1. b) Kaistenlevettä allokoidessa saatiin oheinen tulos: Anna esimerkki pelistä (voit päättää arvostusfunktiot v jne. itse), jossa Nashin tasapaino on 1 % - 25 % vähemmän tehokas kuin kilpailukkinen tasapaino.

KOTITEHTÄVÄT 1. c) Ratkaise Shaplen arvomekanismin tulokset tuottavan algoritmin (Figure 10.6) avulla oheisen graafin kuvaamana tilanne. Tämä on ratkaistu kirjassa mös VCG-mekanismiin perustuen. Vertaa lopputuloksia. Pitäisikö lopputulosten erota toisistaan? Kumpi on leisesti tällaiseen ongelmaan parempi?

KOTITEHTÄVÄT 2. Tee joko a)- tai b)-kohta tästä tehtävästä. Tai saa tehdä molemmatkin, mutta ei lisäpisteitä tarjolla.

KOTITEHTÄVÄT 2. a) Kaksipuolinen paritus: Muodosta peli, jossa vähintään 4 opiskelijaa ja 4 ohjaajaa. Esitä preferenssit. Pelillä tulee olla vähintään kaksi stabiilia paritusta. Esitä nämä kaksi paritusta. (Vinkki: kätä student- ja advisor-versioita ja valitse preferenssit niin, että eri versiot ajautuvat eri ratkaisuihin).

KOTITEHTÄVÄT 2. b) Mallinna kköstehtävän peliä, jossa arvotaan luku väliltä 1-2, mutta luonnollisesti tehtävän tarkastaja ei voi tietää, onko luku oikeasti arvottu ksilötasolla, mutta jos esim. kaikki päätvät huijaamaan ja tekemään vain hden tehtävän, tulee p-arvoksi hvin pieni luku, ja voi tarkastaja tehdä tästä päätelmänsä ja antaa kaikille nollan. Mallinnuksessa kannattaa varmaan tehdä oletuksia, kuten että halutaan tehdä mahdollisimman vähän tehtäviä ( hötfunktiot tämän mukaan), mutta voi mös olettaa, että hötfunktiot ovat heterogeenisiä tai että joukossa on esim. ksittäisiä epärationaalisia pelaajia jne. - vapaat kädet. Mallin voi rittää saada muistuttamaan sitä, mitä uskoo todellisuuden olevan. Mikäs tulee pelin Nashin tasapainoksi? Voisiko mekanismin suunnittelua soveltaa, jotta huijaaminen vähenisi? Jos kllä, niin miten ja jos ei, niin miksei?