Luento 5: Pysäytyspelit

Luento 5: Pysäytyspelit Saara Hämäläinen Helsingin yliopisto TA5 Luento 5 2017 1 / 24

Game Theory by Ben Polak (Open Yale) "Backward induction"(luento 15, kokonaan) Kirjallisuutta Weitzman, Martin (1979): Optimal search for the best alternative. Econometrica: Journal of the Econometric Society, 641-654. Wolinsky, Asher (1986): True monopolistic competition as a result of imperfect information. Quarterly Journal of Economics 101 (3), 493 512.

Pysäytyspelit

Pysäytyspeli Tärkeä osa oppimisteoriaa ja etsintäteoriaa. Pysäytyspelin taustalla on seuraava yksittäisen pelaajan i päätösongelma: Jono satunnaismuuttujia px t q X 1,X 2,... Jono tuottofunktioita y i,t y i,t px 1,x 2,...,x t q Pelaajan i valinnat A i,t ts,cu (pysähdy, älä pysähdy) a i,t s: Lopeta etsintä, pelaajan tuotto y i,t y i,t px 1,x 2,...,x t q. a i,t c: Jatka etsintää, katso seuraava X t`1 :n arvo x t`1. Asunnon myynti: vaatii listautumista välityspalveluun, kulut per päivä c; joka päivä uusi tarjous x t. Tuottofunktiot y i,t x t ct. TA5 Luento 5 2017 4 / 24

Pysäytyspelit: parhaimman vaihtoehdon optimaalinen etsiminen, Weitzman

Projekti 1 vai projekti 2? Lääkeyhtiön tutkimusosasto etsii uutta tapaa valmistaa tietty lääke. Yhtiöllä on tiedossa kaksi lupaavaa valmistusmenetelmää: i 1 ja i 2. Kummankin kokeiluun liittyy oma kestonsa t i, kustannus c i ja tuottojakauma F i P X i : projekti 1 2 c i 15 20 t i 1 2 x i 100 55 240 0 p i 0,5 0,5 0,2 0,8 Kysymys: Missä järjestyksessä projektit kannattaa toteuttaa, jos kannattaa? Milloin kannattaa kokoeilla vain yhtä, milloin taas kahta? TA5 Luento 5 2017 6 / 24

Projekti 1: odotettu hyöty yksinään U 1 p0q 15 ` 1 p0,5 100 ` 0,5 55q 55,5 1.1 Projekti 2: odotettu hyöty yksinään U 2 p0q 20 ` 1 p0,2 240 ` 0,8 0q 19,7 1.12 Ainakin jompikumpi kannattaa toteuttaa: U i p0q ą 0 i 1,2. Jos projektista 2 tulee 0, projekti 1 kannattaa toteuttaa. Jos projektista 2 tulee 240, projektia 1 ei kannattaa toteuttaa. Jos projektista 1 tulee 55, projekti 2 kannattaa toteuttaa. U 2 p55q 20 ` 1 p0,2 240 ` 0,8 55q 56 ą 55 1.12 Jos projektista 1 tulee 100, projektia 2 ei kannattaa toteuttaa. U 2 p100q 20 ` 1 p0,2 240 ` 0,8 100q 85,8 ă 100 1.12 TA5 Luento 5 2017 7 / 24

Kummasta siis kannattaa aloittaa? Projekti 1: odotettu hyöty (ottaen huomioon tulevaisuus) V 1 p0q 15 ` 1 0,5 100 ` 0,5 U 2 p55q 1.1 loomoon 55,9 56 Projekti 2: odotettu hyöty (ottaen huomioon tulevaisuus) V 2 p0q 20 ` 1 1.1 2 0,2 240 ` 0,8 lomon U 1 p0q 56,3 55,5 Eli kannattaa aloittaa projektista 2, vaikka yksinänsä projektien arvot olivat: U 1 p0q 15 ` 1 p0,5 100 ` 0,5 55q 55,5 1.1 U 2 p0q 20 ` 1 p0,2 240 ` 0,8 0q 19,7 1.12 Pitää siis ottaa huomioon myös B-suunnitelman arvo (engl. fall back option). TA5 Luento 5 2017 8 / 24

Yleinen tilanne: Pandoran ongelma, osa 1 Joukko laatikoita B t1,...,nu, joista osa suljettuja K Ă B ja osa aukinaisia A Ă B; B K Y A. Laatikon sisällä on palkinto, jonka arvo on x i F i. Avaamisen kustannus c i, aukeamisen kestoaika t i. Jokaisella laatikolla i oma pc i,β i,f i q; β i riippuu t i :stä suunnilleen samoin kuin edellä β i e rt i. Merkitään parasta tähänastista tuottoa y max ipa x i. Optimaalinen etsintätapa voitaisiin laskea rekursiivisesti Vpy,Kq maxty,wpy,kqu, jossa " ż ý Wpy,Kq max c i ` β i Vpy,K tiuqdf i px i q ` ipk 8 ż 8 y j* Vpx i,k tiuqdf i px i q. TA5 Luento 5 2017 9 / 24

Yleinen tilanne: Pandoran ongelma, osa 2 On myös helpompi tapa. Ajatellaan että laatikoita on vain kaksi: suljettu ja aukaistu. Oletetaan, että avatussa laatikossa oli palkinto, arvoltaan z i. Jos z i on hyvin pieni, toinenkin laatikko kannattaa avata Jos z i on hyvin suuri, toista laatikkoa ei kannata avata Pohditaan, millä arvoilla z i etsinnän jatkaminen ja lopettaminen tuottavat aivan saman. z i vs. c i ` β i ż zi 8 z i f i px i qdx i ` ż 8 z i x i f i px i qdx i j. TA5 Luento 5 2017 10 / 24

Optimaalinen strategia etsimiseen Laatikoiden indeksointi Liitetään jokaiseen laatikkoon pc i,β i,f i q numero z i c i β i ż 8 z i px i z i qf i px i qdx i p1 β i qz i. Järjestys: avataan seuraavaksi laatikko i, jolla max ipk z i. Pysäytys: lopetetaan etsiminen, kun max ipa x i ě max ipk z i. TA5 Luento 5 2017 11 / 24

Esimerkki Olkoon käsillä joukko mahdollisia projekteja. Projekteja voidaan kokeilla välittömästi β i 1. Kuhunkin liittyy onnistumistodennäköisyys p i. Jos projekti onnistuu, se tuottaa R i. Muuten sen tuotto on nolla. c i p i pr i z i q ðñ z i p ir i c i p i TA5 Luento 5 2017 12 / 24

Pysäytyspelit: epätäydellinen informaatio ja monopolistinen hinnoittelu, Wolinsky

Erilaisten tuotteiden malli Ykkösmassa kuluttajia N tuotetta ja yritystä, jokaisella yrityksellä oma erilainen tuotteensa, jolle yritys valitsee hinnan p i ě 0. v i kuluttajan hyöty tuotteesta, kuluttajan maku riippumaton muiden kuluttajien mauista, jakauma v i G. Ongelma: kuluttaja haluaisi ostaa sen tuotteen i, jolla v i p i on suurin. Kuluttajat eivät kuitenkaan aluksi tunne tuotteiden hintoja p i tai niiden tuottamia höytyjä v i. Yhden tuotteen etsintäkustannus s. Miten yritysten kannattaa hinnoitella ja miten kuluttajien kannattaa etsiä? Kuluttajat etsivät tuotteita yksi kerrallaan, ilman takaisinpanoa ja vapaasti taaksepäin palaten. TA5 Luento 5 2017 14 / 24

Kuluttajan optimaalinen etsintästrategia Kuluttajien arvostukset tulevat satunnaisesti väliltä θ,θ. Määritellään niille kynnysarvo w P θ,θ : ż θ s pv w qgpvqdv. w Vasen puoli on odotettavissa oleva kustannus seuraavasta etsinnästä. Oikea puoli on odotettavissa oleva lisähyöty seuraavasta etsinnästä, jos kuluttaja on juuri löytänyt tuotteen, josta olisi valmis maksamaan w. Kuluttaja on tällöin indifferentti sen suhteen jatkaako vai lopettaa etsintä. Jos kuluttaja löytää itselleen huonomman tuotteen v i ă w, odotettavissa oleva lisähyöty on suurempi kuin kustannus, joten hänen kannattaa jatkaa etsintää. Jos kuluttaja löytää itselleen paremman tuotteen v i ą w, odotettavissa oleva lisähyöty on pienempi kuin kustannus, joten hänen kannattaa lopettaa etsiminen. TA5 Luento 5 2017 15 / 24

Yrityksen optimaalinen hintastrategia, osa 1 Ajatellaan alustavasti, että markkinahinta on p. Kuluttajat ostallistuvat markkinoille, jos w ą p. Pohditaan, miten yrityksen kannattaa asettaa sen oma hinta p. Jos kuluttaja havaitsee hinnan p p mutta odottaa edelleen muiden yritysten käyttävän hintaa p, kuluttaja lopettaa etsinnän, jos v i ą wppq, missä wppq p w p Matalampi hinta p ă p saa siis kuluttajat ostamaan herkemmin, wppq ă w, ja korkeampi hinta harvemmin. TA5 Luento 5 2017 16 / 24

Yrityksen optimaalinen hintastrategia, osa 2 Oletetaan, että kuluttajat ehtivät halutessaan etsiä läpi jokaisen markkinoiden tuotteen i. Etsinnän järjestys on satunnainen Tuotteen i kysyntä on suunnilleen Dpp,p,nq 1 n n p1 Gpwppqqq ÿ Gpw q i 1 i 1 p1 Gpwppqqq 1 Gpw q n np1 Gpw qq Unohdamme pois yksinkertaisuuden vuoksi yhden termin... TA5 Luento 5 2017 17 / 24

Yrityksen optimaalinen hintastrategia, osa 3 Yritys maksimoi voittoa Π Dpp,p,nqp maxp1 Gpwppqqq 1 Gpw q n p np1 Gpw qq p Ensimmäisen kertaluvun ehto ( Bwppq Bp 1) p1 Gpwppqqq 1 Gpw q n np1 Gpw qq gpwppqq 1 Gpw q n np1 Gpw qq p 0. Tämä sievenee heti tunnettuun muotoon p 1 Gpwppqq. gpwppqq Mikä on kuin monopolihinta ongelmassa max p1 Gpwppqqqp. p Muiden yritysten läsnäolo ei siis vaikuta hintaan, kun höydykkeet ovat erilaisia ja kuluttajat eivät aluksi tunne hyödykkeitä eivätkä hintoja. TA5 Luento 5 2017 18 / 24

Etsintä, ei-informoidut kuluttajat ja monopolihinnoittelu: Diamond

Diamondin paradoksi: malli Suuri määrä yrityksiä n. Myyvät kaikki homogeenista tuotetta. Kilpailevat hinnoilla p i. Yksittäisen kuluttajan maksuhalukkuus v 1 Kuluttajat eivät näe hintoja suoraan. Kuluttaja voi tarkastaa ne yksi kerrallaan. Positiivinen etsintäkustannus s ą 0. TA5 Luento 5 2017 20 / 24

Diamondin paradoksi: hinta Symmetrinen lähtötilanne. Olkoon aluksi markkinahinta p Jos p ă v, yrityksen kannattaa nostaa hintaa, kunnes se on etsintäkustannuksen verran tästä yli: p ` s Kuluttajan valinta: osta heti (hyöty: v pp sq) vs jatka etsintää ja osta seuraava (hyöty: s ` v p ). Koska kaikkilla yrityksillä on sama kannustin aina, jos p ă v, tasapainossa markkinahinta on monopolihinta p v. Huom. Hinta on tässä siis monopolihinta, vaikka yrityksiä on suuri määrä ja ne kilpailevat nimenomaan hinnoilla. "Etsintäkustannuksilla voi olla suuri vaikutus hintoihin." TA5 Luento 5 2017 21 / 24

Diamondin paradoksi: "hold-up-ongelma Mutta nyt kuluttajien ei kannatakaan etsiä ollenkaan: etsi (hyöty: s ` pv vq ă 0) vs älä etsi (hyöty: 0). Löydettyään tietyn yrityksen hinnan, kuluttajasta tulee tälle yritykselle käytännön sanelemana "uskollinen kuluttaja", eli yritys saa monopoliaseman suhteessa kuluttajaan, koska uuden yrityksen etsiminen olisi kallista, hankalaa, aikaa vievää. "Hold-up-ongelma: mennyt etsintäkustannus on upotettu kustannus mutta tuleva etsintäkustannus ei. Ostaminen tietyltä yritykseltä vaatii kuluttajaa tekemään yritykseen "investoinnin", tulemaan paikalle ja etsimään tuotteen. Kuluttaja ei etukäteen tiedä, kuinka suuren osuuden investoinnin tuotosta hän saa eli tässä esimerkissä hintaa. Kun investointi on tehty, yrityksella on kannustin neuvotella alas kuluttajan osuus tuotosta eli nostaa hintaa. Koska järkevä kuluttaja ymmärtää tämän, investointi kannattaa jättää tekemättä; kuluttaja jää näin ollen kotiin. TA5 Luento 5 2017 22 / 24

Seuraavaa kertaa varten Game Theory by Ben Polak (Open Yale) "Imperfect information"(luento 18, kokonaan) TA5 Luento 5 2017 23 / 24