[xk r k ] T Q[x k r k ] + u T k Ru k. }.

Samankaltaiset tiedostot
Mat Dynaaminen optimointi, mallivastaukset, kierros 3

Mat Dynaaminen optimointi, mallivastaukset, kierros Johdetaan ensiksi välttämättömät ehdot diskreettiaikaiselle optimisäätötehtävälle.

Mat Dynaaminen optimointi, mallivastaukset, kierros 5

Jos siis ohjausrajoitusta ei olisi, olisi ratkaisu triviaalisti x(s) = y(s). Hamiltonin funktio on. p(0) = p(s) = 0.

k = 1,...,r. L(x 1 (t), x

Mat Dynaaminen optimointi, mallivastaukset, kierros 11

Mat Dynaaminen optimointi, mallivastaukset, kierros Johdetaan välttämättömät ehdot funktionaalin. g(y(t), ẏ(t),...

Ensimmäisen ja toisen kertaluvun differentiaaliyhtälöistä

Insinöörimatematiikka D

1 Rajoittamaton optimointi

v AB q(t) = q(t) v AB p(t) v B V B ṗ(t) = q(t) v AB Φ(t, τ) = e A(t τ). e A = I + A + A2 2! + A3 = exp(a D (t τ)) (I + A N (t τ)), A N = =

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

Mat Dynaaminen optimointi, mallivastaukset, kierros 1

Luento 9: Yhtälörajoitukset optimoinnissa

13. Ratkaisu. Kirjoitetaan tehtävän DY hieman eri muodossa: = 1 + y x + ( y ) 2 (y )

(s 2 + 9)(s 2 + 2s + 5) ] + s + 1. s 2 + 2s + 5. Tästä saadaan tehtävälle ratkaisu käänteismuuntamalla takaisin aikatasoon:

Matemaattinen Analyysi

4. Ensimmäisen ja toisen kertaluvun differentiaaliyhtälöistä

min x x2 2 x 1 + x 2 1 = 0 (1) 2x1 1, h = f = 4x 2 2x1 + v = 0 4x 2 + v = 0 min x x3 2 x1 = ± v/3 = ±a x 2 = ± v/3 = ±a, a > 0 0 6x 2

MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI) Luento 4: Ketjusäännöt ja lineaarinen approksimointi

Häiriöteoriaa ja herkkyysanalyysiä. malleissa on usein pieniä/suuria parametreja. miten yksinkertaistetaan mallia kun parametri menee rajalle

2. kl:n DY:t. Lause. Yleisesti yhtälöllä ẍ = f(ẋ, x, t) on (sopivin oletuksin) aina olemassa 1-käs. ratkaisu. (ẋ dx/dt, ẍ d 2 x/dt 2.

Dierentiaaliyhtälöistä

2. Viikko. CDH: luvut (s ). Matematiikka on fysiikan kieli ja differentiaaliyhtälöt sen yleisin murre.

1 Di erentiaaliyhtälöt

6 Variaatiolaskennan perusteet

Tampere University of Technology

DI matematiikan opettajaksi: Täydennyskurssi, kevät 2010 Luentorunkoa ja harjoituksia viikolle 13: ti klo 13:00-15:30 ja to 1.4.

Insinöörimatematiikka D

1 Perusteita lineaarisista differentiaaliyhtälöistä

Luento 11: Rajoitusehdot. Ulkopistemenetelmät

2 Osittaisderivaattojen sovelluksia

Matematiikan tukikurssi

Normaaliryhmä. Toisen kertaluvun normaaliryhmä on yleistä muotoa

Luento 8: Epälineaarinen optimointi

y (0) = 0 y h (x) = C 1 e 2x +C 2 e x e10x e 3 e8x dx + e x 1 3 e9x dx = e 2x 1 3 e8x 1 8 = 1 24 e10x 1 27 e10x = e 10x e10x

MS-C1350 Osittaisdifferentiaaliyhtälöt Harjoitukset 5, syksy Mallivastaukset

5 Differentiaaliyhtälöryhmät

Matemaattinen Analyysi

Mat Dynaaminen optimointi, mallivastaukset, kierros Vaimennetun heilurin tilanyhtälöt on esitetty luennolla: θ = g sin θ r θ

BM20A0900, Matematiikka KoTiB3

12. Hessen matriisi. Ääriarvoteoriaa

Talousmatematiikan perusteet: Luento 13. Rajoittamaton optimointi Hessen matriisi Ominaisarvot ja vektorit Ääriarvon laadun tarkastelu

Matematiikan peruskurssi (MATY020) Harjoitus 10 to

Luento 2: Liikkeen kuvausta

x 7 3 4x x 7 4x 3 ( 7 4)x 3 : ( 7 4), 7 4 1,35 < ln x + 1 = ln ln u 2 3u 4 = 0 (u 4)(u + 1) = 0 ei ratkaisua

läheisyydessä. Piirrä funktio f ja nämä approksimaatiot samaan kuvaan. Näyttääkö järkeenkäyvältä?

MS-A0207 Differentiaali- ja integraalilaskenta 2 (Chem) Yhteenveto, osa I

Dynaamisten systeemien teoriaa. Systeemianalyysilaboratorio II

3 = Lisäksi z(4, 9) = = 21, joten kysytty lineaarinen approksimaatio on. L(x,y) =

8 Potenssisarjoista. 8.1 Määritelmä. Olkoot a 0, a 1, a 2,... reaalisia vakioita ja c R. Määritelmä 8.1. Muotoa

Luento 8: Epälineaarinen optimointi

Insinöörimatematiikka D

Numeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33

Talousmatematiikan perusteet: Luento 14. Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu

Matematiikan tukikurssi

Matematiikan taito 9, RATKAISUT. , jolloin. . Vast. ]0,2] arvot.

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

6. Toisen ja korkeamman kertaluvun lineaariset

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

KKT: log p i v 1 + v 2 x i = 0, i = 1,...,n.

, on säännöllinen 2-ulotteinen pinta. Määrää T x0 pisteessä x 0 = (0, 1, 1).

y + 4y = 0 (1) λ = 0

Harjoitus Etsi seuraavien autonomisten yhtälöiden kriittiset pisteet ja tutki niiden stabiliteettia:

Diskreettiaikainen dynaaminen optimointi

Derivaatan sovellukset (ääriarvotehtävät ym.)

w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1.

2 Yhtälöitä ja epäyhtälöitä

3 TOISEN KERTALUVUN LINEAARISET DY:T

6. Differentiaaliyhtälösysteemien laadullista teoriaa.

Differentiaali- ja integraalilaskenta 1 Ratkaisut 5. viikolle /

4 Yleinen potenssifunktio ja polynomifunktio

Johdatus reaalifunktioihin P, 5op

LUKU 7. Perusmuodot Ensimmäinen perusmuoto. Funktiot E, F ja G ovat tilkun ϕ ensimmäisen perusmuodon kertoimet ja neliömuoto

Matematiikan tukikurssi, kurssikerta 3

Matematiikan tukikurssi

Juuri 7 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty c) sin 50 = sin ( ) = sin 130 = 0,77

SARJAT JA DIFFERENTIAALIYHTÄLÖT

IV. TASAINEN SUPPENEMINEN. f(x) = lim. jokaista ε > 0 ja x A kohti n ε,x N s.e. n n

Matemaattinen Analyysi

Luento 3: Liikkeen kuvausta, differentiaaliyhtälöt

Insinöörimatematiikka D, laskuharjoituksien esimerkkiratkaisut

Antti Rasila. Kevät Matematiikan ja systeemianalyysin laitos Aalto-yliopisto. Antti Rasila (Aalto-yliopisto) MS-A0204 Kevät / 16

H5 Malliratkaisut - Tehtävä 1

Matematiikan tukikurssi

lnx x 1 = = lim x = = lim lim 10 = x x0

Malliratkaisut Demot

Matematiikan tukikurssi

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Kertaus. x x x. K1. a) b) x 5 x 6 = x 5 6 = x 1 = 1 x, x 0. K2. a) a a a a, a > 0

a) Mikä on integraalifunktio ja miten derivaatta liittyy siihen? Anna esimerkki = 16 3 =

Y (z) = z-muunnos on lineaarinen kuten Laplace-muunnoskin

Viikon aiheet. Funktion lineaarinen approksimointi

f(x) f(y) x y f f(x) f(y) (x) = lim

Matematiikan tukikurssi

MATEMATIIKAN PERUSKURSSI I Harjoitustehtäviä syksy Millä reaaliluvun x arvoilla. 3 4 x 2,

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 4: Ketjusäännöt ja lineaarinen approksimointi

Osa IX. Z muunnos. Johdanto Diskreetit funktiot

Transkriptio:

Mat-2.48 Dynaaminen optimointi Mitri Kitti/Ilkka Leppänen Mallivastaukset, kierros 3. Johdetaan lineaarisen aikainvariantin seurantatehtävän yleinen ratkaisu neliöllisellä kustannuksella. Systeemi: x k+ = Ax k + Bu k. Kustannusfunktio: J = 2 xt N Hx N + 2 N k= { [xk r k ] T Q[x k r k ] + u T k Ru k. }. Tässä siis r k :t ovat referenssejä, joita tulisi noudatella. Lisäksi ohjaukset aiheuttavat positiivisen kustannuksen. Jotta tehtävä olisi mielekäs, ovat H, Q ja R symmetrisiä pos.def neliömatriiseja. Optimaalisen kustannuksen ajan hetkellä k tilasta x k loppuun saakka antaa dynaamisen ohjelmoinnin cost-to-go -funktio J k (x k). Johdetaan J :n lauseke. Lopussa: J N (x N) = 2 xt N Hx N 2 xt N P Nx N, eli määritellään P N H N. Vastaavasti askeleella N : JN (x { N ) = min [xn r N ] T Q[x N r N ] + u T u N 2 N Ru N } + [Ax N + Bu N ] T P N [Ax N + Bu N ]. }{{} =2 JN (x N) Derivoimalla u N :n suhteen ja asettamalla nollaksi saadaan lauseke optimaaliselle ohjaukselle u N = [R + BT P N B] B T P N Ax N F N x N. Koska R ja P N = H olivat pos.def. matriiseja, niin ovat myöskin B T P N B sekä R + B T P N B. Näin ollen käänteismatriisi on aina olemassa, ja lauseke on hyvin määritelty. Tässä F N on optimaalisen feedback-ohjauksen vahvistusmatriisi. Sijoittamalla optimiohjaus JN :n lausekkeeseen ja järjestelemällä termejä saadaan missä J N (x N ) = 2 xt N P N x N + q T N x N + S N, P N Q + F T N RF N + [A + BF N ] T P N [A + BF N ] q T N r T N Q S N 2 rt N Qr N. Tekemällä täysin vastaava pyöritys askeleella N 2 saadaan: u N 2 = [R + B T P N B] [B T P N Ax N 2 + B T q N ] F N 2 x N 2 + G N 2.

Ohjaukseen ilmestyy nyt ylimääräinen termi G k, jota siis ei ollut lineaarisen regulaattoritehtävän tapauksessa (r k =, k). Lisäksi on oltava G N =. Sijoittamalla ohjaus ja järjestelemällä termejä saadaan J N 2 : missä J N 2(x N 2 ) = 2 xt N 2P N 2 x N 2 + q T N 2x N 2 + S N 2, P N 2 Q + F T N 2 RF N 2 + [A + BF N 2 ] T P N [A + BF N 2 ] q T N 2 S N 2 r T N 2Q + G T N 2RF N 2 +[G T N 2B T P N + q T N ][A + BF N 2 ] 2 rt N 2 Qr N 2 + 2 GT N 2 [R + BT P N B]G N 2 +q T N BG N 2 + S N. Nyt voitaisiin induktiolla todistaa, että optimaalinen ohjaus hetkellä k on muotoa missä F k u (x k ) = F k x k + G k, = [R + B T P k+ B] B T P k+ A P k = Q + F T k RF k + [A + BF k ] T P k+ [A + BF k ] G k = [R + B T P k+ B] B T q k+ qk T = rk T Q + GT k RF k + [G T k BT P k+ + qk+ T ][A + BF k] loppuehdoilla P N = H, G N = ja qn T = rt N Q. Jos nyt r k =, k niin palaudutaan luennollakin esitettyyn lineaariseen regulaattoritehtävän ratkaisuun (missä vahvistusmatriisi F k = K k ). 2. Systeemille ẋ (t) = x 2 (t) ẋ 2 (t) = x (t) + x 2 (t) + u(t) etsittävä optimiohjaus u (t) s.e. kustannusfunktionaali J = 2 T minimoituu. Ohjauksille on voimassa rajoitusehto [ q x 2 (t) + q 2x 2 2 (t) + u2 (t) ] dt, q, q 2 > u(t), t [, T]. Hamilton-Jacobi-Bellman -yhtälö = Jt T (x(t), t) + min{g(x(t), u(t), t) + Jx (x(t), t)[a(x(t), u(t), t)]} () u(t) voidaan vastaavasti kirjoittaa muodossa = J t (x(t), t) + min u(t) H (x(t), u(t), J x, t)

missä H (x(t), u(t), J x T, t) g(x(t), u(t), t) + Jx (x(t), t)[a(x(t), u(t), t)] on Hamiltonin funktio. Annetulle tehtävälle Hamiltonin funktio on muotoa H (x, u, J x, t) = 2 q x 2 + 2 q 2x 2 2 + 2 u2 + J x x 2 + J x 2 [ x + x 2 + u]. Tämän minimit u:n suhteen löytyvät joko H :n nollakohdista tai rajoitusvälin u päätepisteistä: u H u = u + J x 2 = = u = Jx 2. Toinen osittaisderivaatta on positiivinen, joten kyseessä on minimi. Sidotun ääriarvon löytämiseksi riittää tarkastella H :n niitä termejä, joissa esiintyy u: i) Kun J x 2 <, niin H = 2 u2 + J x 2 u +... minimoituu, kun u =. ii) Kun J x 2 >, niin H = 2 u2 + J x 2 u +... minimoituu, kun u =. iii) Kun J x 2 [, ], niin u = J x 2 on käypä ohjaus ja siten minimoi Hamiltonin funktion. Näistä voidaan kirjoittaa Hamiltonin funktion minimoiva optimiohjaus:, jos J u x 2 > (t) = Jx 2, jos Jx 2. +, jos Jx 2 < Sijoittamalla tämä yhtälöön () saadaan osittaisdifferentiaaliyhtälö cost-to-go -funktiolle J (x(t), t), jota voitaisiin yrittää ratkaista. 3. Alussa säästöjä S, pääoman muutoksen yhtälö ẋ(t) = αx(t) r(t) missä α > on korko ja r(t) on ohjausmuuttujana toimiva kulutusnopeus. Luonnollinen rajoitusehto on nyt r(t), t [, T]. Kuluttamisesta koetaan hyöty U(r(t)) = r(t), joka diskontataan nykyarvoksi diskonttaustekijällä β > α/2, jolloin kokonaishyödyn nykyarvo on J = T e βt U(r(t)) dt. Tavoite on maksimoida J kun lopussa kaikki pääoma on käytetty.

a) Muodostetaan HJB-yhtälö. Tehtävän Hamiltonin funktio on H (x(t), r(t), t) = e βt r(t) + J T x (x(t), t) [ αx(t) r(t) ]. Kirjoittamalla osittaisderivaatta r:n suhteen ja asettamalla nollaksi saadaan yhtälö josta saadaan maksimi H r = e βt 2 r (t) J x (x(t), t) =, r (t) = e 2βt 4 [ J x (x(t), t)] 2, sillä toinen osittaisderivaatta on negatiivinen. Nyt voidaan kirjoittaa HJB-yhtälö: = Jt (x(t), t) + e 2βt 2Jx (x(t), t) + αj x e (x(t), t)x(t) 4J x 2βt (x(t), t) eli vastaavasti J t (x(t), t) + e 2βt 4Jx(x(t), t) + αj x (x(t), t)x(t) =. b) Yritetään ratkaisua muodossa J (x(t), t) = A x(t)f(t), missä A > ja f(t) on jokin derivoituva funktio: J t (x(t), t) = A x(t)f (t), Jx Af(t) (x(t), t) = 2 x(t). Sijoittamalla HJB-yhtälöön saadaan yhtälö [ Af (t) + e 2βt 2Af(t) + 2 αaf(t)] x(t) =. Tämä toteutuu kaikilla t [, T] vain jos f(t) toteuttaa tavallisen differentiaaliyhtälön Af (t) + e 2βt 2Af(t) + αaf(t) =. 2 Kertomalla puolittain e αt :lla ja järjestelmällä termejä yhtälö voidaan kirjoittaa muotoon Integroimalla puolittain saadaan αe αt f 2 + 2e αt ff }{{} =. A 2e(α 2β)t d dt (eαt f 2 ) e αt f 2 = A 2 () e(α 2β)t + C. Jos nyt oikea puoli on positiivinen, löydetään ratkaisut f(t) = ± A 2 () e 2βt + Ce αt.

Näistä vain positiivinen merkki on mahdollinen, koska muuten olisi J. On saatu kandidaatti cost-to-go -funktiolle J (x(t), t) = A x(t) A 2 () e 2βt + Ce αt. Integroimisvakio C tulee valita niin, että HJB-yhtälön reunaehto J (x(t), T)) = toteutuu. Näin ollen saadaan ehto vakiolle C: C = A 2 (α 2β) e(α 2β)T. Sijoittamalla cost-to-go -funktion lausekkeeseen saadaan J (x(t), t)) = x(t) e 2βt e α(t t) 2βT. Juurilausekkeessa oleva eksponenttilauseke on aina ei-negatiivinen kun t [, T] (harjoitustehtävä). Funktio on siis hyvin määritelty ja se toteuttaa HJB-yhtälön reunaehdon. Sijoittamalla J :n lauseke aiemmin laskettuun optimiohjauksen lausekkeeseen saadaan optimaalinen feedback-ohjaus r (t) = e (2β α)(t T)x(t). Sijoittamalla tilayhtälöön saadaan optimitrajektorille differentiaaliyhtälö ẋ(t) = ( α e (2β α)(t T) ) x(t). Separoimalla yhtälö ja integroimalla puolittain päästään muotoon eli x(t) S dx x = t log x S = αt () t ( α e (2β α)(t T) ) dt dt e (2β α)(t T). Integraalitaulukoista löytyy kaava dt a + be = ( kt log(a + be kt ) ), kt ak jota käyttämällä ja sieventämällä päästään lopputulokseen x(t) = Se 2(α β)t e(2β α)(t T) e (2β α)t.

Kuva : Tehtävän 3 optimaaliset kulutustrajektorit eri diskonttauskertoimen β arvoilla kun T =, S = ja α =.95. Todetaan, että x(t) = eli myös loppuehto toteutuu. Tämä on luonnollista, koska mikäli lopussa olisi käyttämätöntä pääomaa, ei kokonaishyöty voi olla paras mahdollinen. Kuvassa on esitetty trajektorit eri β:n arvoilla, kun T =, S = ja α =.95. 4. a) Muunnoksesta V (x, t) = e rt J(x, t) saadaan J(x, t) = e rt V (x, t) ja edelleen J t (x, t) = e rt V t (x, t) re rt V (x, t) ja J x (x, t) = e rt V x (x, t). Sijoittamalla nämä tavalliseen HJB-yhtälöön saadaan: e rt [rv t V ] = min u [e rt g + e rt V x f]. Jakamalla tämä yhtälö puolittain termillä e rt muodostuu HJB-yhtälö nykyarvolle: rv t V = min u [g + V x f]. b) Koska tehtävän aikahorisontti on ääretön on luontevaa hakea sellaista V :tä joka riippuu vain tilasta. Nyt käytetään yritettä V (x, t) = Ax 2. HJB-yhtälön oikealla puolella on minimoitavana x 2 +u 2 +2Ax(x+u). Tämän minimi löytyy derivaatan nollakohdasta, eli u = Ax. Sijoittamalla tämä takaisin HJB-yhtälöön saadaan x 2 + A 2 x 2 + 2Ax 2 ( A)x 2 = rax 2. Asettamalla vasemman ja oikean puolen x 2 :n kertoimet yhtäsuuriksi saadaan toisen asteen yhtälö + (2 + r) A 2 =. Ratkaisu on A = + r/2 ± ( + r/2) 2 +. Näistä juurista positiivinen tuottaa pienemmän arvon V :lle, joten ratkaisu vastaa kyseistä juurta.