6 Variaatiolaskennan perusteet Sivut ss. 22 26 pääosin lähteen [Kirk, Ch. 4, ss. 107 127] pohjalta Variaatiolaskenta keskittyy lokaaliin analyysiin eli funktion lokaalin minimin vastineisiin funktionaaleilla. Määritelmä. Jos ε > 0 s.e. f( ) f(t) t [ ε, + ε], niin f:llä on lokaali minimi :ssa Välttämätön ehto. Jos f:llä on lokaali minimi :ssa, f C 2 (, ), niin f ( ) = 0. Riittävät ehdot. Jos f C 2 (, ), f ( ) = 0 ja f ( ) > 0, niin f:llä on lokaali minimi :ssa. 6.1 Funktionaalin variaatio Olkoon X mielivaltainen normeerattu funktioavaruus, ts. X on vektoriavaruus, jonka elementit ovat funktioita x X. x:n normi, x, toteuttaa ehdot 1. x 0 ja x = 0 jos ja vain jos x(t) = 0, t [, t f ]. 2. αx = α x kaikille reaaliluvuille α. 3. x + y x + y. Esimerkki. Jos x C[, t f ] eli välillä t t f jatkuvien funktioiden joukko, niin normi voisi olla x = max t t f x(t). Kahden funktion läheisyyttä voidaan mitata normilla x y. Kun x = y, niin x y = 0 Määritelmä. Funktionaali J on kuvaus X R, joka kuvaa (mahdollisesti vektoriarvoisen) funktion x X reaalilukujen joukkoon. Määritelmä. Funktionaalin J inkrementti (lisäys) on missä x, δx C 1 [, t f ]. J(x, δx) J(x + δx) J(x) J, Määritelmä. Funktionaali J on lineaarinen, jos ja vain jos se on Homogeeninen: J(αx) = αj(x), α R, x X Additiivinen: J(x + y) = J(x) + J(y), x,y X Määritelmä. Jos funktionaalin inkrementti J voidaan lausua δx:n suhteen lineaarisen funktionaalin δj(x, δx) avulla seuraavasti J(x, δx) = δj(x, δx) + g(x, δx) δx, missä lim δx 0 {g(x, δx)} = 0, niin J:n sanotaan olevan differentioituva ja δj:tä kutsutaan J:n variaatioksi funktiolla x. 22
Huomaa analogia funktioiden kanssa: f(t) df f differentiaali = variaatio differenssi = inkrementti df f t t Toisin sanoen variaatio δj on lineaarinen approksimaatio kahden toisistaan poikkeavan funktion x ja x + δx tuottavien funktionaalin arvojen erolle. Jos δx pieni, variaation pitäisi olla hyvä approksimaatio inkrementille. Määritelmä. Funktionaalilla J : X R on lokaali ääriarvo funktiolla x, jos ε > 0 s.e. x X, joille x x < ε, J:n inkrementillä on sama etumerkki. 1. Jos J = J(x) J(x ) 0, niin J(x ) on lokaali minimi 2. Jos J = J(x) J(x ) 0, niin J(x ) on lokaali maksimi Funktiota x kutsutaan ekstremaaliksi ja J(x ) on ekstreemi. Lause. Olkoon J(x) differentioituva funktionaali J : X R (x X on yleisesti vektoriarvoinen funktio). Oletetaan, että x:llä ei ole rajoituksia X:ssä. Jos x on ekstremaali, niin J:n variaatio x :llä on nolla, δj(x, δx) = 0 kaikille sallituille x+δx, x X. Todistus. (Kirk s. 121) Vastaoletuksella, olkoon x ekstremaali ja δj 0. Inkrementti J = δj(x, δx) + g(x, δx) δx, missä g(x, δx) 0, kun δx 0 ja δj on lineaarinen. Toisin sanoen on olemassa pieni alue, δx < ε, missä δj:n etumerkki määrää J:n etumerkin. Oletetaan, että δj(x, αδx) < 0, α > 0. Tarkastelemalla +αδx ja αδx vertailufunktioita nähdään, että (homogeenisuudesta johtuen) { δj(x, αδx) = αδj(x, δx) < 0 δj(x, αδx) = αδj(x, δx) > 0 eli δj:n etumerkki saadaan vaihtumaan ristiriita (δj:n etumerkin piti säilyä, jos kyseessä on ekstremaali). Näin ollen, jos x on ekstremaali, pitää olla voimassa δj(x, δx) = 0, kaikille δx. 6.2 Variaatiolaskennan perustehtävä Olkoon g skalaarifunktio, jolla on jatkuvat 1. ja 2. derivaatat kunkin argumentin suhteen. 23
Tehtävä: määrää välillä t t f jatkuvasti differentioituvien funktioiden joukosta se, jolle pätee x( ) = x 0 ja x(t f ) = x f, ja jolla funktionaali J(x) = t f g(x, ẋ, t)dt on lokaali ekstreemi. Ratkaisu. Tarkastellaan J:n inkrementtiä ratkaisukäyrällä x. Mikä on ehto variaation häviämiselle? J(x, δx) = J(x + δx) J(x) = g(x(t) + δx(t), ẋ(t) + δẋ(t), t)dt Kehitetään g Taylorin sarjaksi x(t):n ja ẋ(t):n ympäristössä. g(x(t) + δx(t), ẋ(t) + δẋ(t), t) = g + ẋ δẋ(t) + o(δx(t), δẋ(t)) 0, kun δx, δẋ 0 gdt [ x ] δx(t) + Kootaan J:n lausekkeesta ne termit, jotka ovat lineaarisia δx(t):n ja δẋ(t):n suhteen { } δj(x, δx) = δx(t) + δẋ(t) dt. x ẋ Osittaisintegroidaan jälkimmäinen termi ẋ u δẋ(t)dt = v = 0, koska δx( ) = δx(t f ) = 0 (sallittujen ohjausten pitää kulkea annettujen päätepisteiden ja t f kautta) {}}{ t f δx(t) ẋ v u d δx(t)dt. dt ẋ v u Kootaan yhteen ja sovelletaan välttämätöntä ehtoa ekstremaalille { δj(x, δx) = 0 = x (x (t), ẋ (t), t) } d dt ẋ (x (t), ẋ (t), t) δx(t)dt. Välitulos. Olkoon h(t) jatkuva funktio välillä [, t f ]. Jos t f h(t)δx(t)dt = 0, δx(t) C[, t f ] ja joilla δx( ) = δx(t f ) = 0, niin h(t) = 0, t [, t f ] (Kirk s. 126). Sovelletaan perustehtävään, jolloin nähdään, että välttämätön ehto ekstreemille on { } = 0, eli x (x (t), ẋ (t), t) d dt ẋ (x (t), ẋ (t), t) = 0, t [, t f ] reunaehdoilla x( ) = x t0 ja x(t f ) = x tf 24
Euler-Lagrangen yhtälö on tyypillisesti epälineaarinen, aikavariantti, hankalasti ratkaistavissa oleva toisen asteen differentiaaliyhtälö. Euler-Lagrangen yhtälö muodostaa kahden pisteen reuna-arvotehtävän x(t):lle (vrt. H-J-B:n yhtälö on osittaisdifferentiaaliyhtälö). Euler-Lagrangen yhtälö on välttämätön ehto ekstremaalille, ei riittävä. Ekstermaalin laatu tarkistettava eri keinoin. 6.3 Esimerkki Varasto-tuotanto (Kamien-Schwartz s. 22 24): Tilauskoko B toimitettava viimeistään hetkellä T. Varastointikustannukset aikayksikössä tuotetta kohden C 2. Tuotantokustannus on tuotantonopeuden neliö kerrottuna C 1 :llä. x(t) = varaston koko hetkellä t x(0) = 0, alussa ei varastoa ẋ(t) 0, vain tuotantoa ẋ(t) = tuotantonopeus x(t) = B, lopussa tilauskoko varastossa Kustannus: J = T 0 g [{}}{] C1 ẋ 2 (t) + C 2 x(t) dt tuotantokustannus varastointikustannus Euler-Lagrange: g = g(x(t), ẋ(t)) = C 1 ẋ 2 (t) + C 2 x(t) g x d dt g ẋ = 0, g x = C 2, gẋ = 2C 1 ẋ, d dt g ẋ = 2C 1 ẍ C 2 2C 1 ẍ = 0 ẍ = C 2 2C 1. Integroidaan kahdesti, saadaan kandidaatti ekstremaalille. x (t) = C 2 t 2 + K 1 t + K 2, missä K 1 ja K 2 ovat integrointivakioita, joiden valinnan määrää reunaehdot x(0) = 0 K 2 = 0 ja Optimivaraston koko 0 t T: x(t) = B C 2 T 2 + K 1 T = B K 1 = B T C 2 T. x (t) = C 2 t(t T) + Bt T Tarkistetaan rajoitus ẋ (t) 0, edellä ẍ(t) > 0 ẋ(t) kasvava 25
Halutaan yleisiä lainalaisuuksia, ei numeroita: Eulerin yhtälö 2C 1 ẍ(t) = C 2. Koska C 1 ẋ 2 (t) on kokonaistuotantokustannus hetkellä t, niin 2C 1 ẋ on hetkittäinen marginaalinen tuotantokustannus. Näin ollen 2C 1 ẍ on hetkittäisen marginaalisen tuotantokustannuksen kasvunopeus. Toisin sanoen optimia voidaan kuvata näin: optimipolitiikassa on tasapainotettava joka hetki yksikkövarastokustannus C 2 ja hetkittäisen marginaalisen tuotantokustannuksen kasvunopeus 2C 1 ẍ. Sama tulos toisin: integroidaan Euler-Lagrange pienen ajan t yli 2C 1 ẋ(t + t) Yhden yksikön marginaalinen tuotantokustannus hetkellä t + t t+ t 2C t 1 ẍ(t)dt = t+ t C t 2 dt 2C 1 [ẋ(t + t) ẋ(t)] = C 2 t = 2C 1 ẋ(t) Yhden yksikön marginaalinen tuotantokustannus hetkellä t + C 2 t Varastokustannus ajan t yli On sama, tuotetaanko yksikkö nyt ja varastoidaan se vai tuotetaanko myöhemmin. Toisin sanoen optimiradalla tuotannon viivyttäminen ei vähennä kustannuksia! 26