Diskreettiaikainen dynaaminen optimointi

Samankaltaiset tiedostot
Jatkuvan ajan dynaaminen optimointi

Projektin arvon aleneminen

Johdannaisanalyysi. Contingent Claims Analysis Juha Leino S ysteemianalyysin. Laboratorio

MS-A0104 Differentiaali- ja integraalilaskenta 1 (ELEC2) MS-A0106 Differentiaali- ja integraalilaskenta 1 (ENG2)

Investointimahdollisuudet ja niiden ajoitus

Investointimahdollisuudet ja investoinnin ajoittaminen

Esteet, hyppyprosessit ja dynaaminen ohjelmointi

811120P Diskreetit rakenteet

Dynaaminen optimointi

min x x2 2 x 1 + x 2 1 = 0 (1) 2x1 1, h = f = 4x 2 2x1 + v = 0 4x 2 + v = 0 min x x3 2 x1 = ± v/3 = ±a x 2 = ± v/3 = ±a, a > 0 0 6x 2

Mat Dynaaminen optimointi, mallivastaukset, kierros 11

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

OPTIMAALINEN INVESTOINTIPÄÄTÖS

Mat Dynaaminen optimointi, mallivastaukset, kierros 5

MS-A0107 Differentiaali- ja integraalilaskenta 1 (CHEM)

Malliratkaisut Demo 1

IV. TASAINEN SUPPENEMINEN. f(x) = lim. jokaista ε > 0 ja x A kohti n ε,x N s.e. n n

Jos siis ohjausrajoitusta ei olisi, olisi ratkaisu triviaalisti x(s) = y(s). Hamiltonin funktio on. p(0) = p(s) = 0.

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Piiri K 1 K 2 K 3 K 4 R R

1. TILASTOLLINEN HAHMONTUNNISTUS

Analyysi III. Jari Taskinen. 28. syyskuuta Luku 1

Malliratkaisut Demot

Dynaaminen ohjelmointi ja vaikutuskaaviot

[xk r k ] T Q[x k r k ] + u T k Ru k. }.

Lisää satunnaisuutta ja mahdollisuus keskeyttää projekti

Ito-prosessit. Määritelmä Geometrinen Brownin liike Keskiarvoon palautuvat prosessit Iton lemma. S ysteemianalyysin. Laboratorio

MS-A0207 Differentiaali- ja integraalilaskenta 2 (Chem) Tentti ja välikokeiden uusinta

Projektin arvon määritys

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Martingaalit ja informaatioprosessit

Matematiikan tukikurssi

Sovellettu todennäköisyyslaskenta B

Mat Dynaaminen optimointi, mallivastaukset, kierros Johdetaan ensiksi välttämättömät ehdot diskreettiaikaiselle optimisäätötehtävälle.

y = 3x2 y 2 + sin(2x). x = ex y + e y2 y = ex y + 2xye y2

Luento 1: Optimointimallin muodostaminen; optimointitehtävien luokittelu

Markov-ketjut pitkällä aikavälillä

1 Di erentiaaliyhtälöt

Prof. Marko Terviö Assist. Jan Jääskeläinen

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

, c) x = 0 tai x = 2. = x 3. 9 = 2 3, = eli kun x = 5 tai x = 1. Näistä

1 Reaaliset lukujonot

Haitallinen valikoituminen: Kahden tyypin malli

Markov-ketjuja suurilla tila-avaruuksilla

Kuinka määritellään 2 3?

Generoivat funktiot, Poisson- ja eksponenttijakaumat

Numeeriset menetelmät

Funktioiden approksimointi ja interpolointi

MATEMATIIKAN KOE, PITKÄ OPPIMÄÄRÄ HYVÄN VASTAUKSEN PIIRTEITÄ

Differentiaaliyhtälöt I, kevät 2017 Harjoitus 3

1 Rajoitettu optimointi I

Juuri 2 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

x 7 3 4x x 7 4x 3 ( 7 4)x 3 : ( 7 4), 7 4 1,35 < ln x + 1 = ln ln u 2 3u 4 = 0 (u 4)(u + 1) = 0 ei ratkaisua

Algoritmit 1. Luento 13 Ti Timo Männikkö

Talousmatematiikan perusteet: Luento 17. Integraalin sovelluksia kassavirta-analyysissa Integraalin sovelluksia todennäköisyyslaskennassa

Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot! Laskin (yo-kirjoituksissa hyväksytty) on sallittu apuväline tässä kokeessa!

Yhteistyötä sisältämätön peliteoria jatkuu

Mat Sovellettu todennäköisyyslasku A

= X s + IE[X t X s ] = 0, s ja sitä, että ehdollinen odotusarvo on tavallinen odotusarvo silloin, kun satunnaismuuttuja

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

V ar(m n ) = V ar(x i ).

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

1 2 x2 + 1 dx. (2p) x + 2dx. Kummankin integraalin laskeminen oikein (vastaukset 12 ja 20 ) antaa erikseen (2p) (integraalifunktiot

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Differentiaali- ja integraalilaskenta 1 Ratkaisut 5. viikolle /

Osittaisdifferentiaaliyhtälöt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Matematiikan tukikurssi

STOKASTISET PROSESSIT Peruskäsitteitä

Matematiikan tukikurssi

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Numeeriset menetelmät

SGN-2500 Johdatus hahmontunnistukseen 2007 Luennot 4 ja 5

Luento 9: Yhtälörajoitukset optimoinnissa

Markov-ketjut pitkällä aikavälillä

Mat Dynaaminen optimointi, mallivastaukset, kierros Vaimennetun heilurin tilanyhtälöt on esitetty luennolla: θ = g sin θ r θ

1 Rajoittamaton optimointi

Satunnaismuuttujien muunnokset ja niiden jakaumat

. Kun p = 1, jono suppenee raja-arvoon 1. Jos p = 2, jono hajaantuu. Jono suppenee siis lineaarisesti. Vastaavasti jonolle r k+1 = r k, suhde on r k+1

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Säätötekniikkaa. Säätöongelma: Hae (mahdollisesti ulostulon avulla) ohjaus, joka saa systeemin toimimaan halutulla tavalla

6. Toisen ja korkeamman kertaluvun lineaariset

TIEA382 Lineaarinen ja diskreetti optimointi

KKT: log p i v 1 + v 2 x i = 0, i = 1,...,n.

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Harjoitus 7 -- Ratkaisut

Harjoitus 4: Matlab - Optimization Toolbox

Matematiikan tukikurssi

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Yhtälöryhmät 1/6 Sisältö ESITIEDOT: yhtälöt

w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1.

4.0.2 Kuinka hyvä ennuste on?

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut

Luento 12: Duaalitehtävä. Tarkennuksia Lagrangen kertoimen tulkintaan. Hajautettu optimointi.

Algoritmit 2. Luento 13 Ti Timo Männikkö

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Matemaattinen lisäys A. Derivaatta matematiikassa ja taloustieteessä

Mat Investointiteoria Laskuharjoitus 3/2008, Ratkaisut

Transkriptio:

Diskreettiaikainen dynaaminen optimointi Usean kauden tapaus 2 kauden yleistys Ääretön loppuaika Optimaalinen pysäytys Optimointiopin seminaari - Syksy 2000 /

Ongelma t 0 x 0 t- t T x t- + x t + x T u t- p t- (x t-, u t- ) F t- (x t x t-, u t- ) u t p t (x t, u t ) F t (x t+ x t, u t ) O T (x T ) Optimointiopin seminaari - Syksy 2000 /2

Notaatio Diskreetit ajan hetket t: t 0, t,..., T-, T Tila x t (Markov) Ohjaus u t Hetkellinen tuotto p t (x t, u t ) Tilan siirto todennäköisyys F t (x t+ x t, u t ) Diskonttauskerroin /(+?) Loppuaika T ja lopputuotto (jakauma) O T (x T ) Optimointiopin seminaari - Syksy 2000 /3

Ratkaisu Ongelmana valita u t t=0,,2,... T- siten että kokonaistuoton odotusarvo maksimoituu max u E[ T t= 0 π t ( xt, u (+ ) t t ) + Ω( xt ) T (+ ) ] Jaetaan ongelma kahteen osaan: max( π t ( xt, ut ) + E[ Ft + ( xt+ )]) ut + Tuoton odotusarvo tilasta x t+ valittaessa ohjaukset optimaalisesti Optimointiopin seminaari - Syksy 2000 /4

Ratkaistaan u t Saadaan F t (x t ) Ft ( xt ) = max( π t ( xt, ut ) + E[ Ft + ( xt+ )]) ut + Belmannin yhtälö, antaa rekursiivisen kaavan F:lle Ohjaukset u t+, u t+2,... oletetaan optimaalisiksi Alkuarvo (loppuarvo) F:lle saadaan loppuajan tuotosta F T ( xt ) = max( π T ( xt, ut ) + u T + E[ Ω Tästä saadaan F T-2 ratkaisemalla u T-2, ja niin edelleen T ( x T )]) Optimointiopin seminaari - Syksy 2000 /5

Eli aloitetaan lopusta ja lasketaan ajassa taaksepäin Saadaan F t (x t ) F t+ (x t+ ):stä u t (x t ) Jatketaan kunnes on saatu u 0 = optimaalinen päätös alussa F 0 = optimaalisen tuoton odotusarvo (ratkaisu) Jos ei satunnaisuutta voidaan laskea u 0? x? u? x 2?... Optimointiopin seminaari - Syksy 2000 /6

Ääretön loppuaika F t saadaan F t+ :stä Tarvittaisiin F:lle alkuarvo O T (x T ) Ongelmalla rekursiivinen rakenne ja F ei riipu ajan hetkestä F t (x t )? F(x t ) Oltava: F,?, p eivät riipu ajasta Nyt millä tahansa t F( xt ) = max( π( xt, ut ) + E[ F( xt+ )]) ut + Optimointiopin seminaari - Syksy 2000 /7

Edelleen koska t:n arvolla ei väliä merkitään x t =x x t+ =x u t =u F( x) = max( π( x, u) + E[ F( x' ) x, u]) u + Bellmannin yhtälö äärettömälle tehtävälle Ongelmana löytää funktio F, joka toteuttaa annetun yhtälön Optimointiopin seminaari - Syksy 2000 /8

Ratkaistaan F iteroimalla Otetaan alkuarvaus F () (x), sijoitetaan se edellisen yhtälöön ja ratkaistaan u () (x) Sijoitetaan u () (x) ja saadaan F (2) (x) Jatketaan kunnes F (), F (2),... suppenee Suppenemisen takaa tekijä /(+?) < Saadaan F(x) ja u(x) u 0 (x 0 ) Optimointiopin seminaari - Syksy 2000 /9

Optimaalinen pysäytys Loppuaika T ei ole kiinnitetty u=[jatka, lopeta] aiempien esitelmien aiheissa [sijoita, odota] Jos lopetetaan saadaan lopputuotto ja jos jatketaan tuottovirta odottamisesta ja päädytään uuteen samanlaiseen päätöstilanteeseen Bellmannin yhtälö saa muodon p(x) : tuottovirta odottamisesta O(x) : tuotto lopettamisesta F ( x) = max( Ω( x), π( x) + E[ F ( x' ) x]) + Optimointiopin seminaari - Syksy 2000 /0

Optimaalinen pysäytys Optimaalinen päätös jatkaa tai pysäyttää voi olla mielivaltainen funktio tilasta x Joissain tehtävissä on rakenne jolla muodostuu raja-arvo x * siten että jatka, kun x<x *, lopeta, kun x>x * Ehtona x:n positiivinen sarjakorrelaatio ja d { π( x) + E[ Ω( x' ) x] Ω( x)} < dx + Jos O(x) riippuu ajasta myös x * riippuu ajasta O t (x), x * (t) 0 Optimointiopin seminaari - Syksy 2000 /

Kotitehtävä Tuotantokapasiteetti alussa x 0 =5 Kapasiteettia voidaan lisätä, ohjaus u t, t=0, x t+ =x t +u t Tuottovirta p(x t, u t )= x t -u t 2 Lopputuotto O 2 (x 2 )=0x 2 Diskonttokorko?=0% Laske optimaaliset ohjaukset u 0, u ja saatava tuotto F 0 Optimointiopin seminaari - Syksy 2000 /2