Lisää mekanismin suunnittelusta MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäl 16.11.2016 Joonas Laihanen The document can be stored and made available to the public on the open internet pages of Aalto Universit. All other rights are reserved.
Sisältö Mekanismin suunnittelun käsitteitä (kertaus?). Esimerkkejä mekanismeista sekä niiden ominaisuuksista ja sovelluksista: VCG-mekanismi -siirtoverkkoesimerkki -vahvuudet ja heikkoudet Mekanismien olemassaolosta tietillä ominaisuuksilla Tehtävien aikataulutusongelma - Hvits ja rankaisu -mekanismit Kaistenleveden allokointi tietoverkoissa - suhteutettu allokointimekanismi Monilähetksen kulujen jako -Shaple vs. VCG Kaksipuolinen paritus -stabiili paritus -jaksotettu hväksmisalgoritmi mekanismina Kotitehtävät
Suora intensiivihteensopiva/todenmukainen kvasilineaarinen tehokas mekanismi, joka on määritett parina Jossa:???
Kertaus: Mitä on mekanismin suunnittelu? Sosiaalisen valinnan teoria tutkii agenttien preferenssien järjestämistä suurimman kokonaishödn mukaisesti Sosiaalisen valinnan teoria on kuitenkin eistrateginen: preferenssit oletetaan annetuiksi, vaikka agentit voivat saada hötä valehtelemalla preferensseistään Mekanismin suunnittelu hdistää peliteorian ja. sosiaalisen valinnan teorian. Suunnittelija etsii optimaalista tulosta agenttien aitojen preferenssien mukaan Normaalin peliteorian ongelma: Kuinka agentit kättätvät jossain pelissä? Mekanismin suunnittelun ( käänteisen peliteorian ) ongelma: Kuinka saada agentit kättätmään tietllä halutunkaltaisilla tavoilla, esim. äänestämisessä, että agentit ilmoittavat todelliset preferenssinsä?
Kertaus: Mitä on mekanismin suunnittelu? Sosiaalisen valinnan teoria tutkii agenttien preferenssien järjestämistä suurimman kokonaishödn mukaisesti Sosiaalisen valinnan teoria on kuitenkin eistrateginen: preferenssit oletetaan annetuiksi, vaikka agentit voivat saada hötä valehtelemalla preferensseistään Mekanismin suunnittelu hdistää peliteorian ja. sosiaalisen valinnan teorian. Suunnittelija etsii optimaalista tulosta agenttien aitojen preferenssien mukaan Normaalin peliteorian ongelma: Kuinka agentit kättätvät jossain pelissä? Mekanismin suunnittelun ( käänteisen peliteorian ) ongelma: Kuinka saada agentit kättätmään tietllä halutunkaltaisilla tavoilla, esim. äänestämisessä, että agentit ilmoittavat todelliset preferenssinsä?
Kertaus: Paljastusperiaate: Jos on olemassa mekanismi, joka toimeenpanee sosiaalisen valintafunktion C dominoiville strategioille, silloin on olemassa suora mekanismi, joka toimeenpanee C:n dominoiville strategioille ja on todenmukainen. = on olemassa mekanismi, jossa agenttien kannattaa paljastaa valehtelematta omat tppinsä. Miten New mechanism -laatikko kätännössä toteutetaan?
Kertaus: Groven mekanismi Valintasääntö= Näin mekanismi valitsee agenttien antamien preferenssien mukaan maksusääntö=agentit saavat tämän Todenkertominen kannattavaa eli agenttien kannattaa kertoa todelliset arvostuksensa v vaihtoehdoille Esimerkki tehokkaasta ja todenmukaisesta mekanismista dominoiduille strategioille Mutta kuinka valitaan h maksusäännössä?
VCG-mekanismi Valitaan edellisessä, että Saadaan mekanismi:
Esimerkki VCG-mekanismin toiminnasta: Silta-saari-peli (nimi itse keksitt katson kirjasta luku 10.4.2) Olen agentti BD ja minun siltani on 2km pitkä ja minulle koituu kustannus -2, jos tätä siltaa kätetään Miten päästään saaresta A saareen F mahdollisimman alhaisin kustannuksin ja mitä agenteille tulee tällöin maksaa, kun kätetään VCG-mekanismia?
Esimerkki VCG-mekanismin toiminnasta Lhin reitti on selvästikin: ABEF = reitti ABEF
Esimerkki VCG-mekanismin toiminnasta Tarkastellaan agentti AC:tä. Jos hän ilmoittaa olevansa mukana, on lhin reitti pituudeltaan 5 ja kustannus muille kuin hänelle on -5 ja jos hän ilmoittaa, että hän ei ole mukana, niin lhin reitti on 5. p(ac)=(-5)-(-5)=0 Eli AC:lle ei makseta mitään Möskin BD, CE, CF ja DF saavat maksun 0.
Esimerkki VCG-mekanismin toiminnasta Tarkastellaan agentti AB:tä. Jos hän ilmoittaa olevansa mukana, on lhin reitti Pituudeltaan 5 ja kustannus muille kuin hänelle on 2 ja jos hän ilmoittaa, että hän ei ole mukana, niin lhin reitti on 6. p(ab)=(-6)-(-2)=-4 Eli AB:lle maksetaan 4. Vastaavasti: p(be)=(-6)-(-4)=-2 p(ef)=(-7)-(-4)=-3 Erillaiset Markkinavoimat HUOM. Vaikka siltamaksut ovat samoja BE ja EF:lle maksetaan eri hinnat.
VCG-mekanismi: hviä puolia Vain pivotaaliset eli agentit, joiden mukana olo vaikuttaa reitin valintaan, joutuvat maksamaan pelaamisesta. Yleisesti ottaen: Mekanismi suunnittelun ksi voimakkaimmista positiivisista tuloksista: leinen tapa rakentaa dominoiduille strategioille todenmukainen peli, joka maksimoi sosiaalisen hteishödn (kvasilineaarisissa tapauksissa) Mikään muu oleellisesti erilainen mekanismi ei pst samaan
VCG-mekanismi: heikkoudet 1) Agenttien paljastettava kokonaisuudessaan ksitinen tieto -ongelmallista esim. jos ksitisellä tiedolla arvoa jatkossa toistettujen pelien muodossa 2) Mahdollisuus pelaajien välisiin liittoumiin 3) VCG ei ole niukka: maksaa turhan suuria hvitksiä peliin osallistumisesta 4) Tarjoajien poistaminen saattaa nostaa voittoja 5) Ei pst palauttamaan kaikkia voittoja agenteille 6) Laskennalliset ongelmat: arg ma laskeminen NP-kova ongelma usein
Valitettavasti kaikkia hviä ominaisuuksia mekanismille ei voi olla htä aikaa
Tehtävien aikataulutusongelma N agenttia ja T tehtävää Agentin i tppi on vektori t(i,j), joka kertoo kuinka kauan tehtävään j menee agentilla i Yritetään minimoida kokonaissuoritusaikaa eli milloin viimeinen tehtävä saadaan tehtä Huom. agentit tekevät siis tehtäviä htä aikaa ja ksi agentti voi tehdä monta ja toinen ei htään Agentit ilmoittavat arvionsa tönopeuksistaan eli vektorin t (huom. voivat valehdella) Ja toteutunut tömäärä ei välttämättä sama kuin arvio, vaan aina suurempi tai htä suuri Mekanismi näkee todelliset tötunnit tehtävän suorituksen jälkeen Agentit haluavat painaa duunia mahdollisimman paljon
Ratkaistaan tämä Groven mekanismilla? Ei onnistu. Groven mekanismi olisi siitä hvä, että pelaajat paljastaisivat todelliset tppinsä eli töaika-arviot rehellisesti, mutta Grove maksimoi agenttien omien hötjen summaa, eikä minimoi kokonaissuoritusaikaa. Kätetään ns. 'hvits ja rankaisu' -mekanismeja, jotka voidaan käsittää Groven mekanismin leistksenä tapauksiin, joissa maksimoidaan jotain leisempää kuin sosiaalisen hödn summaa agenteille
Tämä mekanismi minimoi siis kokonaissuoritusajan Lisäksi:
Kaistanleveden allokointi tietoverkoissa N kättäjää kättää verkkoresurssia, jolla kapasiteetti C [ LIITUTAULU ] Tarkastellaan ns. suhteutettua allokointimekanismia, jossa agentit ilmoittavat hden arvon w(i), joka kuvaa maksutarjousta, jonka i tekee tietoverkon operaattorille [ LIITUTAULU ]
Kaistanleveden allokointi tietoverkoissa Huom. suhteutettu ei ole suora mekanismi Hvä puoli: hötfunktio voi olla mielivaltainen Huono puoli: strateginen kompleksisuus agentit voivat vaikuttaa allokointiensa lisäksi mös maksuihinsa tarkastellaan ksinkertaistettua mallia, jossa μ ajatellaan vakiona saadaan oheinen tulos 'kilpailukkiselle tasapainolle':
Kaistanleveden allokointi tietoverkoissa Jos tarkastellaan normaalia tapausta, jossa μ riippuu tarjouksista w Kuinka suuri osa sosiaalisesta optimista kilpailutasapainosta saavutetaan Nashin tasapainossa? saadaan oheinen tulos normaalille Nashin tasapainolle: Strateginen kätös aiheuttaa siis pahimmassa tapauksessa -25% tehottomuutta (=anarkian hinta 4/3)
Multicast cost sharing Mallinnetaan median streamausta digitaalisessa verkossa: -useita kättäjiä, jotka arvostavat lähetksen vastaanottamista eri määrin -ktketvät toisiinsa linkeillä, joiden kätössä jokin linkkikohtainen maksu Ketkä valitaan lähetksen vastaanottajaksi? Kuinka paljon heidän tulisi maksaa?
Multicast cost sharing Ohessa vastaus, jonka VCG-mekanismi antaa. VGC-mekanismi: todenmukainen ja tehokas Shaplen arvomekanismi: todenmukainen ja budjettitasapainoinen Osa kotitehtävää: Tutustu Shaplen mekanismiin (Figure 10.6) ja ratkaise edellä esitett peli sillä.
Kaksipuolinen paritus Edellisissä esimerkeissä on tarkasteltu kvasilineaarisia asetelmia on oletettu, että raha liikkuu agenttien ja mekanismin välillä rahan liikkuminen ei aina mahdollista (esim. moraaliset st, kuten munuassiirrot ja oppilasvalinnat) Nt, kaksipuolisessa parituksessa paritetaan joukon A alkiot joukon S alkioihin. Keskittään tässä esimerkki tapaukseen A=Advisors=Ohjaajat, S=Students=Opiskelijat
Kaksipuolinen paritus a a c b b c a b c
Kaksipuolinen paritus Käsitteitä:
Kaksipuolinen paritus Käsitteitä: + =
Kaksipuolinen paritus Stabiili paritus on aina olemassa (ei tosin ksikäsitteisesti). Eräs stabiili paritus voidaan lötää ns. jaksotetulla hväksmisalgoritmilla (opiskelija-versio)
Kaksipuolinen paritus a a c b b c a b c
Kaksipuolinen paritus a a c b b c a b c
Kaksipuolinen paritus a a c b b c a b c
Kaksipuolinen paritus a a c b b c a b c
Kaksipuolinen paritus a a c b b c a b c
Kaksipuolinen paritus a a c b b c a b c
Kaksipuolinen paritus Stabiili paritus on opiskelija-optimaalinen, jos opiskelijat pitävät kaikkia muitakin stabiileja parituksia htä hvinä lödetään opiskelija-versiolla Vastaavasti ohjaaja-optimaalinen stabiili paritus lödetään jaksotetulla hväksmisalgoritmilla (ohjaaja-versio) eli sama kuin opiskelija-versio, mutta opiskelija ohjaaja
Kaksipuolinen paritus Ikäviä piirteitä parittamisessa: Achievable= saavutettavissa oleva= on olemassa stabiili paritus, jossa löt tämä ohjaaja-opiskelijapari
Kaksipuolinen paritus Lisäksi kaksipuolista paritusta vaivaa seuraavakin: Löt kuitenkin seuraava positiivinen tulos mekanismi suunnitteluun liitten. Joudutaan tosin vaatimaan, että ohjaajat kättätvät rehellisesti (=ei-strategisesti):
KOTITEHTÄVÄT 1. Generoi satunnainen kokonaisluku väliltä 1-2 osoitteessa https://www.random.org/ (tai vaikka arpakuutiolla). Tee niin monta tehtävää tehtävistä a), b), c) kuin luku nättää. Eli jos saat vaikka luvun 1 voit valita, että teet vaikka vain b)-kohdan ja saat tältä osin tädet pisteet (jos suurin piirtein oikein ratkaistu). Huom. teen tilastollisen analsin saamilleni luvuille. Jos havaitsen liian vakavaa vilunkia eli että vain hden kohdan tehneitä on liikaa (= p-arvo pienempi kuin 0.01), kaikki saavat nolla pistettä tästä tehtävästä. Huom. jos olet jänishousu voit tehdä kaikki 3 tehtävää a), b), c) ja et osallistu tällöin o. peliin ja saat varmasti tädet pisteet.
KOTITEHTÄVÄT 1. a) Muodosta silta-saari-peli, jossa vähintään 7 solmua ja 9 kaarta. Oheisessa kuvassa on nt 6 solmua ja 8 kaarta eli voit muokata tätä pienin lisäksin tai mieluummin keksi kokonaan uudenlainen graafi. Ratkaise VCG-mekanismin avulla, mitä pelaajille joudutaan maksamaan. Lisäksi graafissa 3 kaarella tulee olla sama kustannus, mutta eri maksut kseisten kaarien/siltojen omistajille, kun maksut määritetään VCG-mekanismin mukaisesti.
KOTITEHTÄVÄT 1. b) Kaistenlevettä allokoidessa saatiin oheinen tulos: Anna esimerkki pelistä (voit päättää arvostusfunktiot v jne. itse), jossa Nashin tasapaino on 1 % - 25 % vähemmän tehokas kuin kilpailukkinen tasapaino.
KOTITEHTÄVÄT 1. c) Ratkaise Shaplen arvomekanismin tulokset tuottavan algoritmin (Figure 10.6) avulla oheisen graafin kuvaamana tilanne. Tämä on ratkaistu kirjassa mös VCG-mekanismiin perustuen. Vertaa lopputuloksia. Pitäisikö lopputulosten erota toisistaan? Kumpi on leisesti tällaiseen ongelmaan parempi?
KOTITEHTÄVÄT 2. Tee joko a)- tai b)-kohta tästä tehtävästä. Tai saa tehdä molemmatkin, mutta ei lisäpisteitä tarjolla.
KOTITEHTÄVÄT 2. a) Kaksipuolinen paritus: Muodosta peli, jossa vähintään 4 opiskelijaa ja 4 ohjaajaa. Esitä preferenssit. Pelillä tulee olla vähintään kaksi stabiilia paritusta. Esitä nämä kaksi paritusta. (Vinkki: kätä student- ja advisor-versioita ja valitse preferenssit niin, että eri versiot ajautuvat eri ratkaisuihin).
KOTITEHTÄVÄT 2. b) Mallinna kköstehtävän peliä, jossa arvotaan luku väliltä 1-2, mutta luonnollisesti tehtävän tarkastaja ei voi tietää, onko luku oikeasti arvottu ksilötasolla, mutta jos esim. kaikki päätvät huijaamaan ja tekemään vain hden tehtävän, tulee p-arvoksi hvin pieni luku, ja voi tarkastaja tehdä tästä päätelmänsä ja antaa kaikille nollan. Mallinnuksessa kannattaa varmaan tehdä oletuksia, kuten että halutaan tehdä mahdollisimman vähän tehtäviä ( hötfunktiot tämän mukaan), mutta voi mös olettaa, että hötfunktiot ovat heterogeenisiä tai että joukossa on esim. ksittäisiä epärationaalisia pelaajia jne. - vapaat kädet. Mallin voi rittää saada muistuttamaan sitä, mitä uskoo todellisuuden olevan. Mikäs tulee pelin Nashin tasapainoksi? Voisiko mekanismin suunnittelua soveltaa, jotta huijaaminen vähenisi? Jos kllä, niin miten ja jos ei, niin miksei?