Klassisia variaatio-ongelmia. Joni Kunelius. Matematiikan pro gradu

Samankaltaiset tiedostot
Kuva 1: Funktion f tasa-arvokäyriä. Ratkaisu. Suurin kasvunopeus on gradientin suuntaan. 6x 0,2

Oletetaan ensin, että tangenttitaso on olemassa. Nyt pinnalla S on koordinaattiesitys ψ, jolle pätee että kaikilla x V U

, on säännöllinen 2-ulotteinen pinta. Määrää T x0 pisteessä x 0 = (0, 1, 1).

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

JOHDATUS VARIAATIOLASKENTAAN

Differentiaali- ja integraalilaskenta 1 Ratkaisut 5. viikolle /

Matematiikan taito 9, RATKAISUT. , jolloin. . Vast. ]0,2] arvot.

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A)

Matematiikan tukikurssi

Derivaatan sovellukset (ääriarvotehtävät ym.)

BM20A0900, Matematiikka KoTiB3

Maksimit ja minimit 1/5 Sisältö ESITIEDOT: reaalifunktiot, derivaatta

RATKAISUT a + b 2c = a + b 2 ab = ( a ) 2 2 ab + ( b ) 2 = ( a b ) 2 > 0, koska a b oletuksen perusteella. Väite on todistettu.

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

13. Ratkaisu. Kirjoitetaan tehtävän DY hieman eri muodossa: = 1 + y x + ( y ) 2 (y )

MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI) Luento 1: Parametrisoidut käyrät ja kaarenpituus

Ympyrä 1/6 Sisältö ESITIEDOT: käyrä, kulma, piste, suora

MS-A0207 Differentiaali- ja integraalilaskenta 2 (Chem) Tentti ja välikokeiden uusinta

Matematiikan peruskurssi (MATY020) Harjoitus 10 to

Oletetaan sitten, että γ(i) = η(j). Koska γ ja η ovat Jordan-polku, ne ovat jatkuvia injektiivisiä kuvauksia kompaktilta joukolta, ja määrittävät

Johdatus reaalifunktioihin P, 5op

y = 3x2 y 2 + sin(2x). x = ex y + e y2 y = ex y + 2xye y2

Polkuintegraali yleistyy helposti paloitain C 1 -poluille. Määritelmä Olkoot γ : [a, b] R m paloittain C 1 -polku välin [a, b] jaon

Differentiaali- ja integraalilaskenta 2 (CHEM) MS-A0207 Hakula/Vuojamo Kurssitentti, 12.2, 2018, arvosteluperusteet

MS-A0207 Differentiaali- ja integraalilaskenta 2 (Chem) Yhteenveto, osa I

Aalto-yliopiston perustieteiden korkeakoulu Matematiikan ja systeemianalyysin laitos

Vektoriarvoiset funktiot Vektoriarvoisen funktion jatkuvuus ja derivoituvuus

2 Pistejoukko koordinaatistossa

MS-A010{3,4} (ELEC*) Differentiaali- ja integraalilaskenta 1 Luento 10: Ensimmäisen kertaluvun differentiaaliyhtälö

Johdatus tekoälyn taustalla olevaan matematiikkaan

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

Tekijä Pitkä matematiikka Suoran pisteitä ovat esimerkiksi ( 5, 2), ( 2,1), (1, 0), (4, 1) ja ( 11, 4).

MS-A0207 Differentiaali- ja integraalilaskenta 2 Luento 5: Gradientti ja suunnattu derivaatta. Vektoriarvoiset funktiot. Taylor-approksimaatio.

Juuri 7 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty c) sin 50 = sin ( ) = sin 130 = 0,77

Antti Rasila. Kevät Matematiikan ja systeemianalyysin laitos Aalto-yliopisto. Antti Rasila (Aalto-yliopisto) MS-A0204 Kevät / 16

Tekijä Pitkä matematiikka

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

u = 2 u (9.1) x + 2 u

MS-A010{3,4,5} (ELEC*, ENG*) Differentiaali- ja integraalilaskenta 1 Luento 10: Ensimmäisen kertaluvun differentiaaliyhtälö

Laudatur 4 MAA4 ratkaisut kertausharjoituksiin

Matematiikan peruskurssi 2

Aalto-yliopiston perustieteiden korkeakoulu Matematiikan ja systeemianalyysin laitos

a) on lokaali käänteisfunktio, b) ei ole. Piirrä näiden pisteiden ympäristöön asetetun neliöruudukon kuva. VASTAUS:

x + 1 πx + 2y = 6 2y = 6 x 1 2 πx y = x 1 4 πx Ikkunan pinta-ala on suorakulmion ja puoliympyrän pinta-alojen summa, eli

MS-A0003/A0005 Matriisilaskenta Laskuharjoitus 2 / vko 45

MS-A0305 Differentiaali- ja integraalilaskenta 3 Luento 3: Vektorikentät

4.3.7 Epäoleellinen integraali

Differentiaali- ja integraalilaskenta 3 Mallit laskuharjoitukseen 3 /

12. Hessen matriisi. Ääriarvoteoriaa

MS-A010{3,4,5} (ELEC*, ENG*) Differentiaali- ja integraalilaskenta 1 Luento 11: Lineaarinen differentiaaliyhtälö

MS-C1350 Osittaisdifferentiaaliyhtälöt Harjoitukset 5, syksy Mallivastaukset

Yhtälön oikealla puolella on säteen neliö, joten r. = 5 eli r = ± 5. Koska säde on positiivinen, niin r = 5.

F dr = F NdS. VEKTORIANALYYSI Luento Stokesin lause

6 Variaatiolaskennan perusteet

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 9: Muuttujanvaihto taso- ja avaruusintegraaleissa

3.3 Funktion raja-arvo

r > y x z x = z y + y x z y + y x = r y x + y x = r

2. Viikko. CDH: luvut (s ). Matematiikka on fysiikan kieli ja differentiaaliyhtälöt sen yleisin murre.

LUKU 3. Ulkoinen derivaatta. dx i 1. dx i 2. ω i1,i 2,...,i k

MATEMATIIKAN JA TILASTOTIETEEN LAITOS Analyysi I Harjoitus alkavalle viikolle Ratkaisuehdotuksia (7 sivua) (S.M)

a) Mikä on integraalifunktio ja miten derivaatta liittyy siihen? Anna esimerkki = 16 3 =

d Todista: dx xn = nx n 1 kaikilla x R, n N Derivaatta Derivaatta ja differentiaali

y=-3x+2 y=2x-3 y=3x+2 x = = 6

JYVÄSKYLÄN YLIOPISTO. Integraalilaskenta 2 Harjoitus Olkoon A := {(x, y) R 2 0 x π, sin x y 2 sin x}. Laske käyräintegraali

Mapu 1. Laskuharjoitus 3, Tehtävä 1

Differentiaali- ja integraalilaskenta 3 Harjoitus 4/ Syksy 2017

Matematiikan tukikurssi

Ensimmäisen ja toisen kertaluvun differentiaaliyhtälöistä

Oletetaan, että funktio f on määritelty jollakin välillä ]x 0 δ, x 0 + δ[. Sen derivaatta pisteessä x 0 on

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

Luento 8: Epälineaarinen optimointi

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 10: Napa-, sylinteri- ja pallokoordinaatistot. Pintaintegraali.

6. Toisen ja korkeamman kertaluvun lineaariset

Sekalaiset tehtävät, 11. syyskuuta 2005, sivu 1 / 13. Tehtäviä

läheisyydessä. Piirrä funktio f ja nämä approksimaatiot samaan kuvaan. Näyttääkö järkeenkäyvältä?

Ratkaisuehdotus 2. kurssikokeeseen

MS-A010{3,4} (ELEC*) Differentiaali- ja integraalilaskenta 1 Luento 4: Derivaatta

MS-A0305 Differentiaali- ja integraalilaskenta 3 Luento 8: Divergenssi ja roottori. Gaussin divergenssilause.

2 Osittaisderivaattojen sovelluksia

Matematiikan tukikurssi

1 Peruskäsitteet. Dierentiaaliyhtälöt

IV. TASAINEN SUPPENEMINEN. f(x) = lim. jokaista ε > 0 ja x A kohti n ε,x N s.e. n n

Differentiaali- ja integraalilaskenta 1 Ratkaisut 2. viikolle /

f(x 1, x 2 ) = x x 1 k 1 k 2 k 1, k 2 x 2 1, 0 1 f(1, 1)h 1 = h = h 2 1, 1 12 f(1, 1)h 1 h 2

MS-A0102 Differentiaali- ja integraalilaskenta 1

LUKU 10. Yhdensuuntaissiirto

Numeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33

MS-A0305 Differentiaali- ja integraalilaskenta 3 Luento 10: Stokesin lause

PRELIMINÄÄRIKOE PITKÄ MATEMATIIKKA

MS-A0305 Differentiaali- ja integraalilaskenta 3 Luento 9: Greenin lause

Ratkaisuja, Tehtävät

Ratkaisuehdotus 2. kurssikoe

KOMPLEKSIANALYYSI I KURSSI SYKSY 2012

Kvanttifysiikan perusteet 2017

l 1 2l + 1, c) 100 l=0 AB 3AC ja AB AC sekä vektoreiden AB ja

LUKU 4. Pinnat. (u 1, u 2 ) ja E ϕ 2 (u 1, u 2 ) := ϕ u 2

Ratkaisut vuosien tehtäviin

Differentiaali- ja integraalilaskenta 3 Ratkaisut viikko 3

Transkriptio:

Klassisia variaatio-ongelmia Joni Kunelius Matematiikan pro gradu Jyväskylän yliopisto Matematiikan ja tilastotieteen laitos Kevät 17

Tiivistelmä: Joni Kunelius, Klassisia variaatio-ongelmia (engl. Classical problems of calculus of variations), matematiikan pro gradu -tutkielma, 37 s., Jyväskylän yliopisto, Matematiikan ja tilastotieteen laitos, kevät 17. Tämä tutkielma käsittelee variaatiolaskentaa. Variaatiolaskenta on saanut alkunsa matemaattisesta analyysistä 17-luvun vaihteessa Johann Bernoullin esittämän Brachistochrone-ongelman vaikutuksesta. Tätä matematiikan alaa voidaan pitää yleistyksenä analyysin ongelmaan funktioiden ääriarvopisteiden löytämisestä. Reaaliarvoisten funktioiden sijaan variaatiolaskenta käsittelee funktionaaleja. Funktionaalit ovat kuvauksia funktioavaruudesta reaaliluvuille. Funktionaaleilla mallinnetaan ongelmaa, johon variaatiolaskennalla etsitään ratkaisu. Variaatiolaskenta keskittyykin funktion, jolla funktionaali saa suurimman tai pienimmän arvonsa, etsimiseen. Yksinkertaisin esimerkki on kahden pisteen, P 1 ja P, välisen lyhimmän etäisyyden ratkaiseminen. Tällöin käsiteltävä funktionaali on pisteitä yhdistävän jatkuvasti differentioituvan käyrän P : [, 1] R n pituus 1 P (t) dt ja funktionaalia minimoidaan reunaehtot P () = P 1 ja P (1) = P toteuttavien käyrien luokas- sa. Minimointiongelmiin voidaan liittää myös muunkinlaisia reunaehtoja, esimerkiksi käyrän rajaamaa pinta-alaa voidaan minimoida annetun pituisten käyrien joukossa. Tällaisiin ongelmiin etsitään ratkaisu reunaehtojen toteutuessa käyttäen variaatiolaskennan työkaluja. Niistä yksi tärkeimmistä on Eulerin yhtälö, joka antaa analyysin derivaatan nollakohtaa vastaavan ehdon funktioille, joilla funktionaalin ääriarvo saavutetaan. Nykyisin variaatiolaskentaa sovelletaan monien eri tieteenalojen, kuten kemian, tietotekniikan, biologian ja taloustieteiden ongelmiin. Sen sijaan alkuperäiset variaatiolaskennan kysymykset ovat yleensä peräisin fysiikasta tai geometrian ongelmista. Näistä esimerkiksi Brachistochrone-ongelmassa tutkitaan kappaleen liukumiseen kuluvaa aikaa ja pyritään löytämään sen minimi. Toinen esimerkki klassisista ongelmista on isoperimetrinen ongelma, jossa etsitään pinta-alan maksimia, kun alueen rajaavan käyrän pituus on kiinnitetty. i

Sisältö Luku 1. Johdanto 1 Luku. Variaatiolaskennan historia 3 Luku 3. Variaatiolaskennan määritelmiä ja tuloksia 5 Luku 4. Klassisia variaatio-ongelmia 19 4.1. Lyhin aika (Brachistochrone) 19 4.. Isoperimetrinen ongelma 4 4.3. Lyhin pisteiden välinen etäisyys pallon pinnalla 8 Lähteet 37 i

LUKU 1 Johdanto Tämän tutkielman tavoitteena on toimia johdatuksena variaatiolaskentaan. Tutkielmassa perehdytään variaatiolaskennan historiaan ja kehitykseen sekä tärkeimpiin määritelmiin ja tuloksiin. Lisäksi esitellään muutamia klassisia variaatiolaskennan ongelmia, tutustutaan niiden taustoihin ja todistuksiin. Toisessa luvussa tutustutaan variaatiolaskennan historiaan ja kehitykseen. Variaatiolaskennan voidaan sanoa syntyneen vuonna 1696 Johann Bernoullin esittämän Brachistochrone-ongelman seurauksena. Kyseiseen ongelmaan annetut ratkaisut johtivat Eulerin yhtälön syntyyn ja näin ollen loivat pohjan modernille variaatiolaskennalle. Vuosien saatossa monet tunnetut matemaatikot kuten Legendre, Jacobi, Weierstrass, Cauchy ja Lebesgue ovat antaneet osansa variaatiolaskennan kehitykselle. Tämän seurauksena variaatiolaskennasta on kehittynyt hyödyllinen työkalu, jota käytetään laajalti erilaisten ongelmien ratkaisuun esimerkiksi fysiikan, tietotekniikan ja taloustieteen aloilla. Kolmannessa luvussa tutustutaan variaatiolaskennan keskeisimpiin määritelmiin ja tuloksiin. Variaatiolaskennassa käsitellään funktioiden sijaan funktionaaleja, jotka ovat kuvauksia funktioavaruudesta reaaliluvuille. Funktionaalien ääriarvot etsitään hyvin samankaltaisilla tavoilla kuin reaaliarvoisten funktioiden ääriarvot. Reaaliarvoisten funktioiden ääriarvokandidaatit löydetään pisteistä, joissa funktion derivaatta on nolla. Olettaen, että funktio on kahdesti derivoituva ja toinen derivaatta poikkeaa nollasta, voidaan selvittää onko kyseessä minimi vai maksimi. Funktionaaleilla ensimmäistä derivaattaa vastaa ensimmäinen variaatio. Etsimällä sen nollakohdat käyttäen Eulerin yhtälöä, voidaan löytää funktiot, jotka ovat ääriarvokandidaatteja tutkittavalle funktionaalille. Sen jälkeen tutkimalla funktionaalin toista variaatiota Eulerin yhtälöllä löydetyillä funktioilla, voidaan pyrkiä selvittämään ääriarvon tyyppi. Tämä tapahtuu esimerkiksi tutkimalla toteutuuko Legendren, Weierstrassin tai Jacobin ehto löydetyillä funktioilla. Viimeisessä luvussa tutustutaan muutamaan klassiseen esimerkkiin variaatiolaskennan ongelmista. Käsiteltävät ongelmat ovat Bernoullin esittämä Brachistochroneongelma, isoperimetrinen ongelma, joka tunnetaan myös kuningatar Didon ongelmana, ja lyhin etäisyys pallopinnalla. Näistä Brachistochrone-ongelma keskittyy liukuvan kappaleen liukumisajan minimoimiseen, kun taas isoperimetrisessä ongelmassa etsitään suurinta pinta-alaa, kun alueen rajaavan käyrän pituus on kiinnitetty. Käsiteltäviin ongelmiin esitetään ratkaisu käyttäen aikaisemmin osoitettuja variaatiolaskennan tuloksia. Tämän lisäksi kuhunkin ongelmaan esitetään vaihtoehtoinen, yksinkertaisempi ratkaisu hyödyntäen lähinnä analyysin työkaluja. 1

LUKU Variaatiolaskennan historia 16-luvun loppupuolta voidaan pitää yhtenä matematiikan historian käännekohdista. Tuona aikana Newton (164 1716) ja Leibniz (1646-1716) kehittivät differentiaali- ja integraalilaskennan, jota vielä silloin kutsuttiin infinitesimaalilaskennaksi. Heidän kehittämänsä matematiikan teorian avulla pystyttiin esimerkiksi laskemaan tasokuvioiden pinta-aloja, kappaleiden tilavuuksia ja liikeratoja. Vaikka vasta Newton ja Leibniz loivat pohjan infinitesimaalilaskennalle, jo ennen heidän aikaansa oli esitetty kyseiselle matematiikan alalle tyypillisiä päättelyitä. Yksi ensimmäisistä oli Stevin (1548-16), joka perusteli kolmion painopisteen sijaintia kolmion sisälle piirrettyjen pienten suunnikkaiden avulla. Myös Kepler (1571-163) käytti menestyksekkäästi infinitesimaalisia pinta-alan- ja tilavuudenmääritysmenetelmiä. Hän laski esimerkiksi ympyrän ja ellipsin alat täyttämällä ne pienillä kolmioilla, joiden kantojen pituus lähestyi nollaa. Tällä menetelmällä hän johti muun muassa kuuluisan tuloksensa planeettojen liikkeestä. Samalla tavalla Cavalieri (1598-1647) päätyi ajatukseen muodostaa vastaavuus kahden kuvion tai kappaleen infinitesimaalisten osien välillä. Tämä tulos tunnetaan Cavalierin periaatteena ja sitä käytetään usein kappaleiden tilavuuksien laskemiseen. Pian infinitesimaalilaskennan synnyn jälkeen sai alkunsa uusi matematiikan haara. Se sai alkunsa Johann Bernoullin (1667-1748) vuonna 1696 esittämästä Brachistochroneongelmasta. Variaatiolaskennan perustajina voidaan pitää Johann ja Jacob Bernoullia (1654-175) sekä Leonhard Euleria (177-1783). Heistä Euler nimesi tämän matematiikan haaran variaatiolaskennaksi myöhemmin teoksessaan Elementa Calculi Variationum. Brachistochrone-ongelman ratkaiseminen johti Eulerin yhtälön syntyyn ja antoi näin alkusysäyksen variaatiolaskennan ongelmien ratkaisemiselle. Variaatiolaskennan teorian voidaan sanoa syntyneen vasta 1744, jolloin Euler julkaisi kuuluisan teoksensa Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimetrici lattissimo sensu accepti. Tämä teos sisälsi muun muassa Eulerin yhtälön, erilaisia lyhimmän etäisyyden ongelmia ja yleistettyjä versioita Brachistochrone-ongelmasta. Monet matemaatikot ovat sittemmin jatkaneet Eulerin ja Bernoullien aloittamaa työtä. Heistä esimerkiksi Legendre (175-1833) keksi keinon, jolla Eulerin yhtälön tuottamat ratkaisut pystyttiin erottamaan minimeiksi ja maksimeiksi. Aikalaiset Newton ja Leibniz antoivat osansa, mutta heidän suurin lahjansa variaatiolaskennalle olivat sen hyödyntämät analyysin työkalut. Seuraavan vuosisadan tärkein variaatiolaskennan edistäjistä oli Weierstrass (1815-1897). Hänen suurin saavutuksensa oli variaatiolaskennan perustusten laskeminen tukevalle pohjalle. Tämän lisäksi Weierstrass 3

4. VARIAATIOLASKENNAN HISTORIA muun muassa osoitti välttämättömän ehdon ääriarvojen olemassaololle ja auttoi kehittämään ehdon, jolla pystytään löytämään halutun integraalin minimoiva käyrä. Myöhemmin esimerkiksi Hilbert, Lebesgue ja Clarke ovat jatkaneet Weierstrassin työtä. Nykyisin variaatiolaskentaa hyödynnetään laajasti ja sillä on useita sovelluksia. Sitä pystytään käyttämään erilaisten ongelmien, jotka käsittelevät muun muassa virtausdynamiikkaa, erilaisten systeemien tasapainotiloja, minimipintoja, elektromagnetismia, ratkaisemiseen. Tästä syystä variaatiolaskennalla on nykyään tärkeä merkitys esimerkiksi fysiikan, tietotekniikan ja taloustieteen aloilla.

LUKU 3 Variaatiolaskennan määritelmiä ja tuloksia Määritelmä 3.1. Funktio f : R m R n on k kertaa jatkuvasti differentioituva eli f C k, jos funktion kaikki osittaisderivaatat kertalukuun k saakka ovat jatkuvia. Määritelmä 3. (Funktionaali). Olkoon y : [, x ] X R n C 1 -funktio ja F : R X R n R luokan C funktio. Tällöin funktiota sanotaan funktionaaliksi. I(y) = F (x, y, y ) dx Variaatiolaskennan ongelmia mallinnetaan funktionaaleilla. Tutustutaan seuraavaksi muutamiin esimerkkeihin variaatiolaskennan ongelmista ja niiden ratkaisutapoihin. Esimerkki 3.3 (Kahden pisteen välinen lyhin etäisyys). Olkoon P 1 = (, y 1 ) R ja P = (x, y ) R. Mikä on pisteiden välinen lyhin etäisyys? Ratkaisu löydetään minimoimalla funktionaali luokassa y C 1, I(y) = 1 y (t) dt y() = (, y 1 ) ja y(1) = (x, y ). Esimerkki 3.4 (Ketjukäyrä). Olkoon P 1 = (, y 1 ) R ja P = (x, y ) R. Miten asettuu painovoiman vaikutuksesta päistään pisteistä P 1 ja P kiinni oleva köysi, jonka pituus on L, missä L ( x ) + (y 1 y )? Ratkaisu saadaan etsimällä funktiota y : [, x ] R, joka minimoi köyden potentiaalienergian Reunaehtoina I(y) = y y (x) dx. y (x) dx = L, y( ) = y 1 ja y(x ) = y. 5

6 3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA Esimerkki 3.5 (Minimipinta). Tämä esimerkki mukailee lähteessä [1] esitettyä. Olkoon C R 3 itseään leikkaamaton käyrä. Millä pinnalla S on pienin pinta-ala niistä pinnoista, joiden reunakäyrä on C? Jos käyrä C on tasokuvion kuten esimerkiksi ympyrän reunakäyrä, niin ratkaisu on kyseinen tasokuvio. Yleisessä tilanteessa ratkaisu ei kuitenkaan ole näin yksinkertainen. Oletetaan, että käyrän C projektio (x, y)-tasolle tuottaa itseään leikkaamatto- Kuva 1. Suljettu käyrä C ja sen projektio. man suljetun käyrän Γ = Ω, joka rajaa avoimen joukon Ω R. Nyt käyrä C voidaan esittää muodossa z = g(x, y), missä (x, y) Γ = Ω. Oletetaan myös, että pinta S voidaan esittää funktion z = u(x, y) C 1, missä (x, y) Ω, graafina. Tällöin pinnan pinta-ala saadaan funktionaalista I(u) = Ω 1 + ( u x ) + ( ) u dx dy. y Minimipinnan löytämiseksi etsitään funktiota z = u(x, y), joka minimoi funktionaalin I. Lisäksi funktion on toteutettava ehto u(x, y) = g(x, y) kaikille (x, y) Ω. Tällaisia pinta-alaan liittyviä ongelmia kutsutaan Plateaun ongelmiksi. Variaatiolaskennan ongelmissa tutkittaville funktioille y asetetaan usein ehtoja, kuten esimerkiksi y( ) = y 1 ja y(x ) = y, missä y 1 ja y ovat annettuja vakioita. Ongelmiin voidaan myös liittää muita ehtoja. Tästä toimii esimerkkinä seuraava. Etsi funktio y, joka minimoi funktionaalin ja toteuttaa reunaehdot I(y) = F (x, y, y ) dx y( ) = y 1, y(x ) = y ja J(y) = G(x, y, y ) dx = k, missä J(y) on toinen funktionaali ja k R vakio. Tällaisia ongelmia, joissa esiintyy ehtoja toisten funktionaalien arvoille, kutsutaan isoperimetrisiksi. Esitetään seuraavaksi tulos näiden ongelmien käsittelemistä varten.

Lause 3.6. Olkoon 3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA 7 I(y) = F (x, y, y ) dx. Minimoidaan funktionaalia seuraavat ehdot toteuttavien käyrien luokassa y( ) = y 1, y(x ) = y ja J(y) = G(x, y, y ) dx = k, missä J(y) on toinen funktionaali ja k R vakio. Oletetaan lisäksi, että funktio y minimoi funktionaalin I. Jos tällöin funktio y ei minimoi funktionaalia J, niin on olemassa vakio λ R siten, että funktio y minimoi funktionaalin (F + λg) dx. Todistus. Lausetta ei todisteta. Todistukseen voi tutustua lähteen [4] sivuilla 43-46. Analyysissä reaaliarvoisten funktioiden ääriarvot löydetään derivaatan avulla. Ääriarvokandidaatit saadaan etsimällä pisteet, joissa funktion gradientti f on nolla. Olettaen, että funktio on kahdesti derivoituva, nämä ääriarvokandidaatit voidaan yrittää luokitella minimeiksi, maksimeiksi tai satulapisteiksi hyödyntäen funktion toisen kertaluvun osittaisderivaattoja. Joissain tapauksissa luokitteluun tarvitaan myös korkeamman kertaluvun derivaattoja. Funktionaalin ääriarvojen löytämiseksi on hyödyllistä kehittää vastineet näille ehdoille. Tarkastellaan seuraavaksi yleistä funktionaalia I(y) = x F (x, y, y ) dx reunaehdoilla y( ) = y 1 ja y(x ) = y. Pyritään kehittämään sille reaaliarvoisen funktion gradientin vastine. Olkoon funktio v : [, x ] R n, v C, v( ) = ja v(x ) =. Tällöin y( ) + λv( ) = y 1 ja y(x ) + λv(x ) = y, missä λ. Käytetään hyväksi funktionaalin I(y + λv) suuntaisderivaattoja funktionaalin I(y) gradientin määrittämisessä seuraavasti [ d d x I(y + λv) = dλ dλ = ] F (x, y + λv, y + λv ) dx d dλ F (x, y + λv, y + λv ) dx. Koska F C, niin edellä tehty integroinnin ja derivoinnin järjestyksen vaihto on Leibnizin integraalisäännön perusteella sallittua. Nyt voidaan käyttää ketjusääntöä ja sijoittaa λ =, jolloin d dλ I(y + λv) λ= = = [ v F (x, y + λv, y + λv ) y + v F (x, y + λv, ] y + λv ) dx y λ= [ v ] y F (x, y, y ) + v y F (x, y, y ) dx.

8 3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA Integroidaan v -termi osittain v y F (x, y, y ) = / x v y F (x, y, y ) x } 1 {{} = v d ( ) dx y F (x, y, y ) dx. Tällöin saadaan d x [ dλ I(y) = v y F (x, y, y ) d ( )] dx y F (x, y, y ) dx. Koska funktio v on mielivaltainen, niin yhtäsuuruuden on pädettävä kaikille v. Siten I (y) = y F (x, y, y ) d dx ( y F (x, y, y ) Kutsutaan tätä funktionaalin ensimmäiseksi variaatioksi. Määritelmä 3.7 (Ensimmäinen variaatio). Olkoon y : [, x ] R n luokan C funktio, joka toteuttaa ehdot y( ) = y 1 R n ja y(x ) = y R n. Tällöin funktionaalin I(y) ensimmäinen variaatio on missä F (x, y, y ) C. I (y) = y F (x, y, y ) d dx ). ( ) y F (x, y, y ), Näin määriteltynä ensimmäinen variaatio vastaa reaaliarvoisten funktioiden gradienttia. Osoitetaan seuraavaksi lemma, jota tarvitaan tulokseen funktionaalin ääriarvojen löytämiseksi. Lemma 3.8. Olkoon funktio f : [, x ] R jatkuva. Jos f(x)h(x) dx = kaikille jatkuville funktioille h : [, x ] R, joille h( ) = h(x ) =, niin f on identtisesti nolla välillä [, x ]. Todistus. Oletetaan, että funktio f ei ole identtisesti nolla. Tällöin on piste x [, x ] siten, että f(x ). Oletetaan lisäksi, että f(x ) >. Koska funktio f on jatkuva, niin on olemassa pisteen x ympäristö [a, b] [, x ] siten, että f(x) > c > kaikilla x [a, b]. Olkoon funktio h : [, x ] R, { (x a)(x b), jos x [a, b] h(x) =, jos x [a, b]. Funktio h on jatkuva ja aidosti positiivinen välillä ]a, b[. Tällöin f(x)h(x) dx = > c a >, f(x)h(x) dx + b a h(x) dx b a f(x)h(x) dx + b f(x)h(x) dx

3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA 9 mikä on ristiriita oletuksen kanssa. Ei siis voi olla pistettä x [, x ] siten, että f(x ) >. Tapaus f(x ) < osoitetaan vastaavasti. Siten funktio f on identtisesti nolla välillä [, x ]. Osoitetaan seuraavaksi tulos, jonka mukaan funktionaalin ääriarvokandidaatit löydetään funktionaalin gradientin nollakohdista. Lause 3.9 (Eulerin yhtälö). Olkoon funktio y : [, x ] R n, y C, y( ) = y 1 ja y(x ) = y. Jos funktionaali I = F (x, y, y ) dx saa suurimman tai pienimmän arvonsa funktiolla y, niin funktio y toteuttaa ehdon F y d ( ) F = dx y kaikilla x x. Todistus. Oletetaan, että funktio y on kahdesti differentioituva välillä [, x ], toteuttaa ehdot y( ) = y 1, y(x ) = y ja minimoi funktionaalin I. Määritellään funktiolle y joukko vertailufunktioita Y (x) välillä [, x ] seuraavasti Y (x) = y(x) + ɛη(x), missä funktio η C 1, η( ) = η(x ) = ja ɛ. Tällöin funktio y(x) kuuluu joukkoon {Y (x)} mielivaltaiselle η(x), kun ɛ =. Korvaamalla funktionaalissa I esiintyvät y ja y vastaavilla Y ja Y, saadaan I(ɛ) = F (x, Y, Y ) dx. Näillä valinnoilla ɛ ja λ sekä η ja v vastaavat toisiaan, jolloin ensimmäisen variaation johtamisen perusteella päästään tulokseen [ F I () = y d ( )] F η dx. dx y Koska funktio y minimoi funktionaalin I ja I(y) = I(ɛ), kun ɛ =, niin I () =. Tämä tarkoittaa, että [ F I () = y d ( )] F η dx =. dx y kaikilla funktioilla η, jotka toteuttavat reunaehdot η( ) = η(x ) =. Tällöin Lemman 3.8 nojalla integroitava on nolla eli F y d ( ) F =. dx y Todistetaan seuraavaksi vaihtoehtoinen muotoilu Eulerin yhtälöstä. Tätä tullaan hyödyntämään myöhemmin kappaleessa 4.1 Brachistochrone-ongelman yhteydessä.

1 3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA Lemma 3.1 (Eulerin yhtälö - vaihtoehtoinen muoto). Olkoon funktio y : [, x ] R n, y C, y( ) = y 1 ja y(x ) = y. Jos integraali I = F (x, y, y ) dx saa suurimman tai pienimmän arvonsa funktiolla y, niin funktio y(x) toteuttaa ehdon [ d F y F ] F dx y x = kaikilla x x. Todistus. Derivoidaan yhdistettyä funktiota F (x, y, y ) muuttujan x suhteen Derivoidaan y F y df dx = F x + F dy y dx + F dy y dx = F x muuttujan x suhteen ( d y F ) dx y + y F y = y d dx + y F y. ( ) F Vähentämällä yhtälö () yhtälöstä (1) saadaan df dx d ( y F ) = F ( ) F + dx y y x y d F y. dx y Tämä voidaan sieventää muotoon ( d F y F ) F [ F dx y x = y y d ( )] F. dx y y (1) + F y y. () Eulerin yhtälön toteutuessa yhtälön oikea puoli on nolla. Täten Eulerin yhtälölle saadaan vaihtoehtoinen muoto [ d F y F ] F dx y x =. Kuten gradientin nollakohta, ei Eulerin yhtälön toteutuminenkaan välttämättä takaa ääriarvoa tai sen olemassaoloa. Tämä huomataan seuraavasta esimerkistä. Esimerkki 3.11. Tämä esimerkki mukailee lähteessä [7] esitettyä. Olkoon funktionaali I(y) = 3π y (y ) dx. Vaaditaan, että funktio y toteuttaa ehdot y() = ja y( 3π ) = 1. Etsitään nyt funktionaalin I ääriarvot luokassa C. Eulerin yhtälöksi saadaan y + y =, joka on lineaarinen toisen kertaluvun vakiokertoiminen differentiaaliyhtälö. Tämä yhtälö voidaan ratkaista sen karakterisesta yhtälöstä r +1 =. Karakterisen yhtälön

3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA 11 juuret ovat imaginaarisia, r 1 = i, r = i. Juurten ollessa imaginaarisia yleinen ratkaisu tähän differentiaaliyhtälöön on y = c 1 e αx cos(βx) + c e αx sin(βx), missä r 1 = r = α + iβ. Nyt α =, β = 1 ja siten yhtälön yleinen ratkaisu on muotoa c 1 cos x + c sin x. Funktiolle y asetettujen ehtojen perusteella ratkaisuksi saadaan y(x) = sin x. Selvitetään seuraavaksi, onko kyseessä minimi, maksimi vai satulapiste. Tämä tehdään tarkastelemalla mitä tapahtuu funktion y ympäristössä. Olkoon z : [, 1] R jatkuvasti derivoituva funktio, jolle z() = ja z( 3π) = 1. Tällöin funktio h(x) = z(x) sin x on jatkuvasti derivoituva, h() = ja h( 3π) =. Siten jokainen funktio z voidaan esittää muodossa sin x + h(x) jollakin funktiolla h. Tarkastellaan seuraavaksi funktionaalia I(z) = I(sin x + h(x)), I(sin x + h(x)) = = 3π 3π + [sin x + h(x)] [cos x + h (x)] dx 3π sin x cos x dx + 3π = I(sin x) + h(x) [h (x)] dx 3π / h(x) cos x }{{} = 3π = I(sin x) + h(x) [h (x)] dx. }{{} = h(x) sin x h (x) cos x dx 3π + h(x) [h (x)] dx Nähdään, että tulos riippuu termin 3π h(x) [h (x)] dx merkistä. Tarkastellaan tätä termiä fuktioilla h 1 (x) = sin x ja h (x) = x( 3π x), joille h 1() = h () = h 1 ( 3π) = h ( 3π ) =. Nyt 3π 3π Olkoon ɛ >. Tällöin h 1 (x) [h 1(x)] dx = 9π 4 <, h (x) [h (x)] dx = 9 3 π3 (9π 4) 4, 58 >. 3π I(sin x + ɛh 1 ) = I(sin x) + ɛ 3π I(sin x + ɛh ) = I(sin x) + ɛ h 1 (x) [h 1(x)] dx < I(sin x), h (x) [h (x)] dx > I(sin x) kaikilla ɛ >. Siten funktio y = sin x ei ole minimi tai maksimi.

1 3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA Kuten esimerkistä 3.11 huomattiin, Eulerin yhtälö yksinään ei takaa ääriarvojen olemassaoloa. Osoitetaan funktionaaleille seuraavaksi ehtoja, jotka takaavat toteutuessaan Eulerin yhtälön tuottaman ääriarvokandidaatin olevan etsitty ääriarvo. Tarkastellaan seuraavaksi yleistä funktionaalia I(y) = x F (x, y, y ) dx reunaehdoilla y( ) = y 1 ja y(x ) = y. Pyritään seuraavaksi kehittämään sille reaaliarvoisen funktion toisen derivaatan vastine. Olkoon funktio v : [, x ] R n, v C, v( ) = ja v(x ) =. Funktionaalin I(y) toinen derivaatta saadaan sen ensimmäisestä derivaatasta seuraavasti missä λ. Koska d I(y + λv) = dλ niin Q(y, v) = x1 x Q(y, v) = d dλ I(y + λv) λ= = d dλ I (y + λv) λ=, x1 x [ v [F (x, y + λv, y + λv )] + v [F (x, y + λv, ] y + λv )] dx, y y [ d v [F (x, y + λv, y + λv )] + v [F (x, y + λv, ] y + λv )] dλ y y λ= dx. Koska F C, niin edellä tehdyt integroinnin ja derivoinnin järjestyksen vaihdot ovat Leibnizin integraalisäännön perusteella mahdollisia. Käytetään nyt ketjusääntöä kumpaankin termiin d dλ ( v [F (x, y + λv, y + λv )] y ) = v [F (x, y + λv, y + λv )] + vv [F (x, y + λv, y + λv )], y y y ( d v [F (x, y + λv, ) y + λv )] = dλ y vv [F (x, y + λv, y + λv )] + v [F (x, y + λv, y + λv )] y y y. Sijoittamalla λ = ja edellä lasketut derivaatat takaisin Q(y, v) yhtälöön, saadaan ] Q(y, v) = [v y F (x, y, y ) + vv y y F (x, y, y ) + v y F (x, y, y ) dx. Kutsutaan tätä funktionaalin toiseksi variaatioksi. Määritelmä 3.1 (Toinen variaatio). Olkoon y : [, x ] R n luokan C funktio, joka toteuttaa ehdot y( ) = y 1 ja y(x ) = y ja F (x, y, y ) C. Olkoon v C, jolle v( ) = ja v(x ) =. Tällöin funktionaalin I toinen variaatio Q(y, v) suuntaan v on ] Q(y, v) = [v y F (x, y, y ) + vv y y F (x, y, y ) + v y F (x, y, y ) dx.

3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA 13 Toinen variaatio on reaaliarvoisten funktioiden toisen kertaluvun derivaatan vastine funktionaaleille. Sen avulla ensimmäistä variaatiota tutkimalla löydetyt ääriarvokandidaatit voidaan tietyissä tapauksissa luokitella minimeiksi, maksimeiksi tai satulapisteiksi. Lause 3.13. Olkoon y : [, x ] R n luokan C funktio, joka toteuttaa ehdot y( ) = y 1 ja y(x ) = y ja F (x, y, y ) C. Olkoon funktio v : [, x ] R n, v C, v( ) = ja v(x ) =. Oletetaan lisäksi, että funktio y toteuttaa Eulerin ehdon. Tällöin funktio y on funktionaalin I(y) lokaali minimi, jos v y F (x, y, y ) + vv y y F (x, y, y ) + v y F (x, y, y ) > kaikille nollasta poikkeaville funktioille v. Todistus. Funktio y on funktionaalin I(y) lokaali minimi, jos Q(y, v) > kaikille nollasta poikkeaville funktioille v. Määritelmän 3.1 mukaan ] Q(y, v) = [v y F (x, y, y ) + vv y y F (x, y, y ) + v y F (x, y, y ) dx. Nyt jos v y F (x, y, y ) + vv y y F (x, y, y ) + v y F (x, y, y ) >, niin myös Q(y, v) >. Koska v oli mielivaltainen, vaaditaan, että ehto pätee kaikille nollasta poikkeaville funktioille v. Toisen variaation lauseketta on suhteellisen hankala käsitellä. Tästä syystä ilmaistaan lauseke toisin ] Q(y, v) = [v y F (x, y, y ) + vv y y F (x, y, y ) + v y F (x, y, y ) dx ] = [v y F (x, y, y ) + v y F (x, y, y ) dx+ / x v x yy F (x, y, y ) v d ( ) x dx yy F (x, y, y ) dx 1 ( = [v y F (x, y, y ) + v y F (x, y, y ) d ( ))] dx yy F (x, y, y ). Kiinnitetään funktio y ja valitaan funktioiksi R = F (x, y, y ) ja S = F (x, y, y ) y y d dx ( yy F (x, y, y ) ). Näillä valinnoilla toinen variaatio voidaan kirjoittaa muodossa J(v) = (Rv + Sv ) dx. Nyt ehdon Q(y, v) > sijaan voidaan tutkia, millä ehdoilla J(v) >.

14 3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA Lemma 3.14. Olkoot R ja S jatkuvia funktioita ja oletetaan, että J(v) = (Rv + Sv ) dx kaikilla C 1 -funktioilla v, joille v( ) = v(x ) =. Tällöin R(x) kaikilla x [, x ]. Todistus. Riittää näyttää, että jos R(x ) < jollekin x [, x ], niin J(v). Olkoon väli [a, b] [, x ] siten, että x [a, b] ja R(x) δ < kaikilla x [a, b]. Valitaan funktioksi v { sin π(x a) kaikilla x [a, b] v(x) = b a muulloin. Nyt (Rv + Sv ) dx = b + R π π(x a) sin dx (b a) b a a b a 4 π(x a) S sin b a dx < δπ + M(b a), (b a) missä M = max S(x). Riittävän pienelle (b a) epäyhtälön oikea puoli on negatiivinen ja siten myös J(v) <, mikä on ristiriita oletuksen kanssa. Siten R(x) x x kaikilla x [, x ]. Esitellään seuraavaksi välttämätön ehto, jonka funktionaalin minimoivan funktion y tulee toteuttaa. Kuten Eulerin yhtälö ei tämäkään ehto itsessään ole riittävä osoittamaan, että sen toteuttava funktio on etsitty minimi. Ehdon avulla voidaan kuitenkin rajata Eulerin yhtälöllä löydettyjä funktoita tarkastelun ulkopuolelle. Lause 3.15 (Legendren ehto). Olkoon y : [, x ] R n luokan C funktio, jolle y( ) = y 1 ja y(x ) = y, ja F (x, y, y ) C. Jos funktio y on funktionaalin I(y) lokaali minimi, niin F y kaikilla x [, x ]. Todistus. Ollakseen minimi funktion y on toteutettava ehto Q(y, v) kaikille nollasta poikkeaville funktioille v. Kiinnitetylle funktiolle y toinen variaatio voidaan kirjoittaa muodossa J(v) = (Rv + Sv ) dx, ( missä R = F (x, y, y ) ja S = F (x, y, y ) d F (x, y, y ) ). Jos Q(y, v), y y dx yy niin J(v) ja Lemmasta 3.14 seuraa, että R = F y

3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA 15 kaikilla x [, x ]. Siten epäyhtälö pätee aina, kun funktio y on funktionaalin I(y) minimoija. Pyritään seuraavaksi määrittämään lisää ehtoja, joiden toteutuessa Q(y, v) >. Aikaisemman perusteella toinen variaatio Q(y, v) pystytään kirjoittamaan kiinnitetylle funktiolle y muodossa Q(y, v) = J(v) = (Rv + Sv ) dx. Lemman 3.14 mukaan ehto R(x) on välttämätön, jotta J(v). Oletetaan nyt, että R(x) > kaikilla x [, x ] ja määritellään ehdot, joiden toteutuessa J(v) > kaikille v. Aloitetaan kirjoittamalla funktionaalille J(v) Eulerin yhtälö Sv d dx (Rv ) =. Tämä on toisen asteen differentiaaliyhtälö, johon reunaehdoilla v( ) = v(x ) = on ratkaisu v. Yhtälöllä voi myös olla muita ratkaisuja ja niiden tutkimista varten otetaan käyttöön seuraava määritelmä. Määritelmä 3.16 (Konjugaatti). Olkoon v : [, x ] R luokan C 1 funktio, jolle v( ) = v(x ) =, v ja olkoot R ja S jatkuvia funktioita. Olkoon J(v) muotoa J(v) = (Rv + Sv ) dx. Oletetaan lisäksi, että funktio v toteuttaa Eulerin yhtälön. Tällöin yhtälöä Sv d dx (Rv ) =. (3) sanotaan Jacobin yhtälöksi. Pistettä x sanotaan pisteen konjugaatiksi, jos yhtälöllä (3) on olemassa epätriviaali ratkaisu v, siten, että v(x ) = v( ). Lause 3.17. Olkoon v : [, x ] R n luokan C 1 funktio siten, että v( ) = v(x ) =, v, ja olkoot R ja S jatkuvia funktioita. Kun R(x) > kaikilla x [, x ] ja ei ole olemassa pisteen konjugaattia x ], x [, niin J(v) = (Rv + Sv ) dx >. Todistus. Lauseen todistamiseksi riittää osoittaa, että funktionaali voidaan kirjoittaa muodossa, jossa integroitava ei ole identtisesti nolla kuin tilanteessa v. Aloitetaan lisäämällä integraalin sisälle d dx (wv ), missä w(x) C 1. Tästä funktionaalin arvo ei muutu, sillä koska v( ) = v(x ) =, niin d dx (wv ) dx =.

16 3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA Valitaan seuraavaksi funktio w siten, että w = R(S + w ) kaikilla x [, x ]. Nyt funktion w valinnan perusteella integroitava voidaan täydentää neliöksi Rv + Sv + d dx (wv ) = Rv + wvv + (S + w )v = Rv + wvv + w v R ) = R (v + wvv R + w v R ( = R v + wv ). R Tästä seuraa, että integraali voidaan kirjoittaa muodossa ( J(v) = (Rv + Sv ) dx = R v + wv ) dx. R Koska R > ja (v + wv R ) >, kun v ja funktio w on olemassa, niin J(v) >. Osoitetaan seuraavaksi, että välillä ], x [ ei ole pisteen konjugaattia. Korvaamalla w = Rh uudelle funktiolle h h C1 saadaan w = R(S + w ) R h = R (S (Rh + d dx (R)h )h Rh ) h h ( = Sh Rh + d ) dx (R)h = Sh d dx (Rh ). Tämä on Jacobin yhtälö funktionaalille J(v). Funktio w on olemassa kaikilla x [, x ] vain, jos on olemassa nollasta poikkeava funktio h. Nyt halutaan, että funktio h on epätriviaali ratkaisu Jacobin yhtälöön ja pisteelle ei ole konjugaattipistettä välillä ], x [. Tällöin J(v) > aina, kun R > ja pisteellä ei ole konjugaattia x ], x [. Lause 3.18. Olkoon y : [, x ] R n luokan C funktio, joka toteuttaa ehdot y( ) = y 1 ja y(x ) = y ja F (x, y, y ) C. Olkoon v C ja oletetaan, että funktio y toteuttaa Eulerin yhtälön. Funktio y on funktionaalin I(y) lokaali minimi, jos kaikilla x [, x ] ja Jacobin yhtälöön, [ F y d ( F dx y y F y > )] v d dx on vain triviaali ratkaisu, v, kaikilla x [, x ]. ( ) F y v =,

3. VARIAATIOLASKENNAN MÄÄRITELMIÄ JA TULOKSIA 17 Todistus. Ollakseen minimi funktion y on toteutettava ehto Q(y, v) > kaikille nollasta poikkeaville funktioille v. Koska y on kiinnitetty, niin toinen variaatio voidaan kirjoittaa muodossa [ ( Q(y, v) = v F y + F v y d ( ))] F dx. dx y y Lauseesta 3.17 seuraa, että Q(y, v) >, jos F y > kaikilla x [, x ] ja ei ole olemassa pisteen konjugaattia x ], x [. Jacobin yhtälöön [ F y d ( )] F v d ( ) F dx y y dx y v = on reunaehdoilla v( ) = v(x ) = vain triviaali ratkaisu v. Siten funktio y minimoi funktionaalin I(y), jos F > kaikilla x [x y 1, x ] ja Jacobin yhtälöön on vain triviaali ratkaisu kaikilla x [, x ]. Jacobin yhtälö on hyödyllinen työkalu funktionaalien ääriarvoja etsittäessä. Se on kuitenkin usein hyvin hankala ratkaista. Esitellään seuraavaksi yhtälön käsittelyä helpottava tulos. Lemma 3.19. Olkoot y : [, x ] R luokan C kahdesta parametrista, α ja β, riippuva funktio, funktio v C ja R ja S jatkuvia funktioita. Tällöin Jacobin yhtälöön Sv d dx (Rv ) = on olemassa epätriviaali ratkaisu pisteelle x [, x ] aina, kun determinantti α y y β, α y 1 missä y 1 = y( ) ja y = y(x ) kaikilla x ], x ], on nolla. Tällaiset pisteet x ovat pisteen konjugaatteja. β y 1 Lemmaa 3.19 ei todisteta. Tuloksesta voi lukea lisää lähteestä [1] sivuilta 8-84.

LUKU 4 Klassisia variaatio-ongelmia 4.1. Lyhin aika (Brachistochrone) Vuonna 1696 Johann Bernoulli esitteli Brachistochrone-ongelman julkaisussaan Acta Eruditorum. Itse ratkaistavan ongelman hän muotoili seuraavasti: Olkoon pisteet A ja B. Millainen on käyrä, jota pitkin painovoiman vaikutuksesta liikkuva kappale liukuu nopeimmin pisteestä A pisteeseen B? Bernoulli ei kuitenkaan ollut ensimmäinen, joka tutki kyseistä ongelmaa. Vuonna 1638 Galileo käsitteli vastaavaa ongelmaa teoksessaan Discorsi e Dimostrazioni Matematiche Intorno a Due Nuove Scienze. Galileo osoitti, että verrattuna pisteitä yhdistävään janaan kappale liukuu pisteestä A pisteeseen B nopeammin janoja AC ja CB pitkin, jos piste C on ympyrän kaarella. Tämän huomion seurauksena hän väitti, että nopein reitti pisteiden A ja B välillä olisi ympyrän kaari. Hänen väitteensä oli kuitenkin virheellinen. Oikean ratkaisun Johann Bernoullin esittämään ongelmaan löysivät hänen veljensä, Jacob Bernoulli, Newton, Leibniz ja l Hopital. Vaikka kukin heistä esitti ongelmaan erilaisen ratkaisun, lopputulos oli kuitenkin sama. Ratkaisu Brachistochrone-ongelmaan ei ollut Galileon väittämä ympyrän kaari vaan toinen ympyrään läheisesti liittyvä käyrä, sykloidi. Sykloidi on käyrä, joka muodostuu ympyrän kehällä olevan pisteen piirtämänä, kun ympyrä vierii pitkin suoraa. Osoitetaan seuraavaksi, että ratkaisu Bernoullin esittämään ongelmaan on sykloidi. Kuva. Vierivän ympyrän muodostama sykloidi. 19

4. KLASSISIA VARIAATIO-ONGELMIA Todistus. Oletetaan y-akselin positiivisen suunnan olevan alaspäin. Olkoon A = (, y 1 ) ja B = (x, y ). Oletetaan, että < x ja valitaan piste A origoksi, jolloin = ja y 1 =. Olkoon y : [, x ] R, y() = ja y(x ) = y. Tällöin funktio y kuvaa kappaleen etäisyyttä y-akselista. Koska kappale liukuu käyrää pitkin kitkatta, kappaleen potentiaalienergia muuttuu suoraan liike-energiaksi. Kun oletetaan, että kappale lähtee liikkeelle levosta, niin kappaleen nopeus v missä tahansa käyrän pisteessä saadaan yhtälöstä 1 mv = mgy, missä m on kappaleen massa ja g putoamiskiihtyvyys. Siten nopeudeksi v saadaan Nopeus voidaan esittää muodossa v = gy. v = ds dt, missä s on kappaleen kulkema matka ja t siihen kulunut aika. Integroimalla tätä saadaan kappaleelta liukumiseen kuluva aika t = ds gy = 1 g 1 + y y dx. Ajan minimoivan käyrän on toteutettava Eulerin yhtälö. Käytetään siitä vaihtoehtoista muotoa, Lemmaa 3.1, jolloin Integroimalla tämä ehdoksi saadaan [ ] d 1 + y y dx y =. y 1 + y 1 + y 1 + y y y 1 + y = k 1. Tämä voidaan vielä sieventää muotoon y(1 + y ) = k, missä k 1 R on vakio ja k = ( 1 k 1 ). Kyseinen differentiaaliyhtälö voidaan kirjoittaa muodossa y = k y. y

4.1. LYHIN AIKA (BRACHISTOCHRONE) 1 Yhtälö on separoituva ja se voidaan ratkaista käyttäen sijoitusta y = k (1 cos θ) y = dy dx = k y y y k y dy = dx 1 cos θ k 1 + cos θ sin θ dθ = x + k 3 k (1 cos θ) dθ = x + k 3 k (θ sin θ) k 3 = x, missä k 3 R on integroimisvakio. Koska piste A valittiin origoksi, niin k 3 =. Edellisen perusteella funktio y voidaan esittää parametrimuodossa x = k (θ sin θ), y = k (1 cos θ). Tämä parametrimuoto kuvaa sykloideja, joissa vierivän ympyrän säde on k ja keskuskulmaa θ vastaavan kaaren pituus on ympyrän vierimä matka. Koska alkuehdon mukaan sykloidin on kuljettava pisteen B kautta, voidaan tämän perusteella määrittää vakio k. Osoitetaan lopuksi, että tämä ratkaisu on ehdokas etsityksi minimiksi. Minimoitava funktionaali oli muotoa 1 + y F dx = dx. y Tällöin F y = y ( ) y = y(1 + y ) 1. y(1 + y ) 3 Selvästi nähdään, että (1 + y ) 3 > ja y = k (1 cos φ) kaikilla φ. Siten F kaikilla x. Sykloidi siis toteuttaa Lauseen 3.15 ehdon ja on ehdokas etsityksi y minimiksi. Edellinen todistus osoittaa, että sykloidi täyttää minimille välttämättömät ehdot. Se ei kuitenkaan riitä osoittamaan, että kaikista käyristä juuri sykloidi minimoi kappaleen liukumisajan. Täydennetään tältä osin edellistä todistusta osoittamalla, että sykloidi tosiaan on etsitty minimi. Seuraava todistus mukailee lähdettä [3]. Todistus. Oletetaan y-akselin positiivisen suunnan olevan alaspäin. Sykloidin parametrimuoto on x = R(θ sin θ), y = R(1 cos θ), missä θ π ja R on sykloidin määräävän ympyrän säde. Sykloidia pitkin liukuvan kappaleen sijainti on ajan t funktio välillä [, T ] siten, että alkupiste

4. KLASSISIA VARIAATIO-ONGELMIA A = (, ) = (x(), y()) ja loppupiste B = (x(t ), y(t )). Tässä T on kappaleelta liukumiseen kuluva aika, joka pyritään minimoimaan. Oletetaan lisäksi, että sykloidin pisteille pätee x ja y. Koska kappaleen oletetaan lähtevän liikkeelle levosta ja liukuvan kitkatta, niin 1 mv = mgy. Tämän yhtälön nojalla kappaleen nopeudelle missä tahansa sykloidin pisteessä pätee v = gy. Otetaan nyt käyttöön uudet koordinaatit ρ ja τ, joilla x = ρτ ρ sin τ ( ja y = ρ 1 cos τ ), ρ ρ missä < ρ ja τ πρ. Tämä vastaa sykloidin parametrimuotoa, jossa R = ρ ja θ = τ. Käyttämällä ketjusääntöä ρ x ja y voidaan ilmaista termien τ ja ρ avulla x = x τ τ + x ( ρ ρ = ρ ρ cos τ ) ( τ + τ + τ cos τ ρ ρ ρ sin τ ) ρ, ρ y = y τ τ + y ρ ρ = (ρ sin τρ ) ( τ + ρ ρ cos τ ρ τ sin τ ) ρ. ρ Hyödyntäen edellistä kappaleen nopeus voidaan ilmaista termien τ ja ρ avulla gy = v = x + y ( = ρ 1 cos τ ) ( τ + (4ρ 1 cos τ ) 4ρτ sin τρ ( ρ ρ + τ 1 + cos τ )) ρ ρ ( = yτ + 4 ρ sin τ ρ ρ) τ cos τ ρ. Tätä yhtälöä käyttämällä Brachistochrone-ongelma on helppo ratkaista. Termi ρ on ei-negatiivinen, joten yτ gy. Koska y > paitsi pisteessä A ja mahdollisesti pisteessä B, niin τ g paitsi ehkä ajanhetkillä t = ja t = T. Integroimalla tätä epäyhtälöä välillä [, T ] saadaan τ(t ) = T τ dt T g dt = gt. Siten aika, joka kappaleelta kuluu pisteiden A ja B välisen matkan liukumiseen, on alhaalta rajoitettu. Liukumisajan minimi saadaan valitsemalla τ = g ja ρ =. Tällöin ρ on vakio ja kappaleen kulkema polku on sykloidin kaari. Edellinen todistus yhdessä aikaisemman kanssa osoittaa, että juuri sykloidi minimoi kappaleen liukumisajan. Siten sykloidi on Brachistochrone-ongelmaan etsitty ratkaisu. Tarkastellaan seuraavaksi, miten kahden annetun pisteen kautta kulkevan sykloidin yhtälö saadaan. Esimerkki 4.1 (Brachistochrone annetuilla pisteillä). Oletetaan y-akselin positiivisen suunnan olevan alaspäin. Olkoot piste A = (, ) ja piste B = (1, 1). Ratkaistaan Brachistochrone-ongelma näille pisteille eli etsitään pisteiden välille käyrä, jota pitkin

4.1. LYHIN AIKA (BRACHISTOCHRONE) 3 kitkaton kappale liukuu nopeiten pisteestä A pisteeseen B. Brachistochrone-ongelman todistuksen perusteella tiedetään, että tällaisen käyrän parametrimuoto on x = k (θ sin θ), y = k (1 cos θ). Huomataan seuraavaksi, että pisteiden A ja B kautta kulkevan suoran kulmakerroin x B x A y B y A = 1 1 = k (1 cos θ) k (θ sin θ) = (1 cos θ) (θ sin θ) on riippumaton vakiosta k. Nyt parametrin θ arvo pisteessä B voidaan ratkaista edellisestä yhtälöstä, jolloin θ, 41. Vakion k arvo pisteessä B voidaan ratkaista sijoittamalla yhtälöihin aikaisemmin ratkaistu parametrin θ arvo, jolloin saadaan k 1, 146. Tällä vakion k arvolla käyrä kulkee pisteiden A ja B kautta.

4 4. KLASSISIA VARIAATIO-ONGELMIA 4.. Isoperimetrinen ongelma Isoperimetrinen ongelma on todennäköisesti vanhin tunnettu variaatiolaskennan ongelma. Ongelma juontaa juurensa antiikin aikaan, jolloin se tunnettiin kuningatar Didon ongelmana. Tarinan mukaan Tyroksen kuninkaan Pygmalionin sisko Dido pakeni veljeään Pohjois-Afrikkaan nykyisen Libyan alueelle. Pakomatkansa päätteeksi Dido osti paikalliselta kuninkaalta maata, jolle myöhemmin perustettaisiin Karthagon kaupunki. Sopimuksen mukaan hän sai niin suuren maa-alueen kuin härän taljalla pystyi peittämään. Hän leikkasi kyseisen taljan ohuiksi suikaleiksi ja sitoi ne yhteen naruksi. Sitten hän asetteli narun maahan niin, että se rajasi suurimman mahdollisen alueen. Näin tehdessään Dido joutui ratkaisemaan seuraavan ongelman: Mikä kaikista suljetuista käyristä rajaa suurimman alueen, kun käyrän pituus on kiinnitetty? Tarinan mukaan hän asetteli narun puoliympyrän muotoon käyttäen rantaviivaa reunana. Täten voidaankin olettaa, että Dido löysi ongelmaansa oikean ratkaisun, sillä ympyrä, jonka piirin pituus on kyseisen narun pituus, rajaa suurimman alueen. Osoitetaan seuraavaksi, että suljetuista käyristä ympyrä rajaa suurimman alueen, kun käyrän pituus on kiinnitetty. Kuva 3. Kuningatar Didon ratkaisu. [13] Todistus. Olkoon C suljettu itseään leikkaamaton käyrä, jonka pituus on L >. Olkoon käyrän C parametriesitys f : [, 1] R, f(t) = (x(t), y(t)). Oletetaan lisäksi, että parametriesitys f on paloittain C. Tällöin Greenin teoreema antaa käyrän C rajaaman alueen pinta-alan I = 1 1 (xy x y) dt.

4.. ISOPERIMETRINEN ONGELMA 5 Koska käyrä C on suljettu, niin x() = x(1) ja y() = y(1). Käyrän C pituus saadaan integraalista 1 J = x + y dt. Nyt Lauseen 3.6 mukaan minimoitava funktionaali on 1 1 H = (xy x y) + λ x + y dt. Funktionaalin minimoivan funktion on toteutettava Eulerin yhtälöt H x d ( ) H = ja dt x H y d ( ) H =. dt y Derivoidaan H muuttujien x, x, y ja y suhteen ja sijoitetaan nämä Eulerin yhtälöihin 1 y d ( 1 ) dt y + λx = ja x + y 1 x d ( ) 1 dt x + λy =. x + y Integroimalla nämä muuttujan t suhteen saadaan y x + λx x + y = c 1 λy x + y = c, missä c 1 ja c ovat vakioita. Korotetaan (y c 1 ) ja (x c ) toiseen ja lasketaan yhteen, jolloin ( ) λy (x c ) + (y c 1 ) ( ) λx = + x + y x + y ja = λ (x + y ) (x + y ) = λ. Saatu yhtälö (x c ) + (y c 1 ) = λ vastaa ympyrän, jonka säde on λ = L π keskipiste (c, c 1 ), yhtälöä. ja Hyvin usein isoperimetristä ongelmaa lähestytään todistamalla isoperimetrinen epäyhtälö 4πA L. Epäyhtälö antaa suhteen suljetun käyrän pituuden ja sen rajaaman pinta-alan välille. Epäyhtälöstä huomataan, että yhtäsuuruus on voimassa ympyrän tapauksessa eli kun A = πr ja L = πr. Täten voidaan päätellä, että ympyrä tuottaa etsityn maksimin.

6 4. KLASSISIA VARIAATIO-ONGELMIA Isoperimetriseen epäyhtälöön ja sen todistuksiin voi tutustua tarkemmin lähteen [] sivuilla 55-564. Edellinen todistus perustuu variaatiolaskentaan ja käyttää hyväkseen sen työkaluja ongelman esittämisessä ja ratkaisemisessa. Kyseistä ongelmaa on myös mahdollista lähestyä eri tavoin. Esimerkiksi vuonna 1841 Steiner julkaisi viisi erilaista todistusta isoperimetriseen ongelmaan. Nämä todistukset olivat luonteeltaan puhtaasti geometrisia. Esitetään näistä yksi. Todistusta varten osoitetaan ensin lemma kolmioiden alalle. Lemma 4.. Olkoon BCD kolmio. Olkoon sivun BC pituus b ja sivun CD pituus c. Tällöin kolmion BCD ala on suurin, kun kulma BCD on suora. Todistus. Kolmion BCD pinta-ala voidaan laskea kaavalla A = 1 bc sin( BCD). Koska sin( BCD) 1, niin A 1 bc. Tällöin kolmion BCD ala on suurin, kun sin( BCD) = 1 eli kulma BCD on suora. Steinerin saranatodistus. Olkoon C suljettu, itseään leikkaamaton käyrä annetulla pituudella. Osoitetaan ensin, että käyrän C rajaama alue on konveksi, jos käyrä C on pinta-alan maksimoiva käyrä. Oletetaan, että käyrän C rajaama alue ei ole konveksi. Tällöin on pisteet P, Q C siten, että vähintään yksi piste janalta P Q ei ole käyrän C rajaaman alueen sisällä. Nyt voidaan määritellä uusi käyrä C peilaamalla pisteiden P ja Q välinen käyrän osa janan P Q suhteen. Näin saatu käyrä C on yhtä pitkä tai lyhyempi kuin käyrä C ja rajaa suuremman alueen. Tämä on ristiriita oletuksen kanssa. Siten pinta-alan maksimoivan käyrän rajaama alue on konveksi. Kuva 4. Peilaamalla P ja Q välinen käyrän osa janan P Q suhteen saadaan pinta-alaltaan suurempi käyrä C. Osoitetaan seuraavaksi, että käyrä C on ympyrä. Olkoot pisteet R ja S käyrältä C siten, että ne jakavat käyrän C kahteen yhtä pitkään osaan C ja C. Tällöin jana RS jakaa käyrän C rajaaman alueen kahteen pinta-alaltaan yhtä suureen alueeseen. Jos näin ei olisi, voitaisiin suurempi alue peilata janan RS suhteen, jolloin saataisiin uusi, yhtä pitkä käyrä, joka rajaa suuremman alueen.

4.. ISOPERIMETRINEN ONGELMA 7 Edellisen perusteella riittää osoittaa, että C tai C on puoliympyrä. Valitaan C. Oletetaan, että C ei ole puoliympyrä. Tällöin on piste A käyrältä C siten, että kulma RAS ei ole suora. Pisteitä R ja S voidaan liikuttaa pitkin niiden määräämää suoraa siten, että janojen RA ja AS pituudet eivät muutu kulman RAS toimiessa saranana. Näin tekemällä saadaan suorakulmainen kolmio RAS, jossa kulma RAS on suora. Lemman 4. mukaan suorakulmainen kolmio on alaltaan suurempi kuin aikaisempi. Toistamalla tätä prosessia kaikille pisteille A, joille kulma RAS ei ole suora saadaan koko ajan suuremman pinta-alan rajaava käyrä. Prosessia jatkamalla käyrä C suppenee kohti puoliympyrää. Täten suurimman pinta-alan rajaava käyrä on ympyrä. Kuva 5. Liikuttamalla pisteitä R ja S niiden määräämää suoraa pitkin voidaan kasvattaa käyrään C rajaamaa pinta-alaa. Steinerin todistuksessa käytetyt konstruktiot osoittavat, että jos käyrä C ei ole ympyrä, niin tietyillä prosesseilla löydetään aina toinen yhtä pitkä käyrä, joka rajaa suuremman alueen. Lisäksi päädytään tulokseen, että ympyrä rajaa suuremman alueen kuin mikään näistä käyristä. Lopputuloksesta huolimatta todistus jää hieman puutteelliseksi. Todistuksessa nimittäin oletetaan, että esitettyä prosessia toistamalla käyrä C suppenee kohti ympyrää eli toisin sanoen suurimman alueen rajaavan käyrä on olemassa. Tältä osin Steinerin todistuksen ovat täydentäneet esimerkiksi Edler ja Carathéodory. Heidän todistuksiinsa voi tutustua lähteen [] sivuilla 544-548.

8 4. KLASSISIA VARIAATIO-ONGELMIA 4.3. Lyhin pisteiden välinen etäisyys pallon pinnalla Tavallisessa euklidisessa tasossa kahden pisteen välinen lyhin polku löytyy suoralta viivalta, joka kulkee kummankin pisteen kautta. Kaarevilla pinnoilla sama ei välttämättä pidä paikkaansa, sillä niillä ei yleensä ole suoria viivoja. Siten esimerkiksi pallon pinnalla ei ole itsestään selvää mikä on lyhin polku pisteestä toiseen. Avaruudessa R n lyhin polku voidaan kuitenkin selvittää variaatiolaskennan avulla minimoimalla valittujen pisteiden välisen käyrän pituus Tietoa lyhimmästä polusta voidaan hyödyntää käytännön sovelluksiin monilla eri tavoilla. Näitä ovat muun muassa erilaisten rakenteiden suunnittelu, teollisuusrobottien liikeratojen suunnittelu ja kaksiulotteisten kuvien projisointi kolmiulotteiselle objektille. Koska maapallo on kutakuinkin pallon muotoinen voidaan lyhintä polkua käyttää lisäksi etäisyyksien mittaamiseen, lento- ja laivareittien suunnitteluun. Ennen kuin lyhin polku ratkaistaan, tutustutaan määritelmiin, jotka helpottavat pallopinnan pisteiden käsittelemistä. Määritelmä 4.3. Olkoon atan : R [-π, π] funktio arctan ( y x), jos x >, arctan ( y x) + π jos x < ja y, atan(y, x) = arctan ( y x) π jos x < ja y <, π, jos x = ja y >,, jos x = ja y <. - π Määritelmä 4.4 (Pallokoordinaatit). Olkoon piste P = (x, y, z) R 3. Lukukolmikkoa (r, θ, φ), missä r = x + y + z, r, ( ) z θ = arccos, θ < π, r r φ = atan(y, x), φ π, sanotaan pisteen P pallokoordinaateiksi. Koordinaateista r ilmaisee pisteen P etäisyyden origosta, kulma θ x-akselin positiivisen suunnan, origon ja pisteen P xy-tason projektion välisen kulman ja kulma φ z-akselin, origon ja pisteen P välisen kulman.

4.3. LYHIN PISTEIDEN VÄLINEN ETÄISYYS PALLON PINNALLA 9 Kuva 6. Pisteen esitys pallokoordinaatistossa. Osoitetaan seuraavaksi, että pallopinnalla pisteiden välisen lyhimmän etäisyyden määrää isoympyrä. Todistus. Oletetaan pallon keskipiste origoksi ja säteeksi r = R, R >. Olkoot piste P 1 = (R, θ 1, φ 1 ) ja P = (R, θ, φ ). Jotta etäisyyden minimoiva käyrä löydetään, on tutkittava pallopinnan kaaria ja niiden pituuksia. Pallopinnalla olevan kaaren pituudelle s pätee (ds) = (dr) + (rdφ) + (r sin φ dθ). Koska pallon säde r on vakio, niin dr = ja ds = R (dφ) + sin φ(dθ). Siten koko käyrän pituus s saadaan integraalista φ ( ) dθ s = R 1 + sin φ dφ. dφ φ 1 Merkintöjen yksinkertaistamiseksi merkitään jatkossa dθ = dφ θ ja F = R 1 + θ sin φ. Koska F on riippumaton muuttujasta θ, niin F =. Tällöin pisteiden P θ 1 ja P välisen etäisyyden minimoivan käyrän on toteutettava Eulerin yhtälö Täten F θ d dφ ( ) F =. θ = k jollekin vakiolla k R. Edellisestä yhtälöstä saadaan, että k = Rθ sin φ 1 + θ sin φ. Hyödynnetään tätä θ ratkaisemiseksi. Korotetaan yhtälö puolittain toiseen ja ratkaistaan θ suhteen θ = k = R θ sin 4 φ 1 + θ sin φ k sin φ sin φ k = k cosec φ 1 k cosec φ,

3 4. KLASSISIA VARIAATIO-ONGELMIA missä cosec φ = 1 on trigonometrinen funktio kosekantti. Integroidaan tämä käyttämällä sin φ hyväksi muutoskaavaa cosec φ = 1 + cot φ ja sijoittamalla q = A cot φ, missä A = 1 k, jolloin saadaan k θ(φ) = A dq 1 q = A sin 1 q + α, missä α R on integroimisvakio. Nyt nähdään, että θ ja φ välillä on yhteys sin(θ α) = q = A cot φ. Jotta tämän yhteyden merkitys minimoitavan etäisyyden osalta selkiytyy, kerrotaan yhtälö puolittain termillä R cos φ ja käytetään muutoskaavaa sin(θ α) = sin θ cos α cos θ sin α, jolloin saadaan (cos α)y (sin α)x = Az, missä x = R sin φ cos θ, y = R sin φ sin θ ja z = R cos φ. Tämä on origon, pisteen P 1 ja P kautta kulkevan tason yhtälö. Tällaisen tason ja pallopinnan leikkausjoukkoa sanotaan isoympyräksi. Siten isoympyrä määrää kahden pallopinnan pisteen välisen lyhimmän etäisyyden. Osoitetaan lopuksi, että isoympyrän lyhyempi kaari u on etsitty minimi. Valitaan todistuksen yksinkertaistamiseksi piste P 1 = (R, θ 1, ) pallon pohjoisnavaksi ja P = (R, θ, φ ). Pisteiden valinnan perusteella niiden kautta kulkeva isoympyrä voidaan parametrisoida seuraavasti u(x, y, z) = R ( cos θ 1 sin(t), sin θ 1 sin(t), cos(t) ), t [, π]. Lauseen 3.18 perusteella riittää näyttää, että s > ja Jacobin yhtälöllä θ [ s θ d ( )] s v d ( ) s dt θ θ dt θ v = on vain triviaali ratkaisu, v, kaikilla φ [, π]. Selvästi s >, sillä pisteen P θ 1 valinnasta seuraa, että φ > ja s θ = θ ( R ) φ + θ sin φ = Rθ sin φ φ + θ sin φ >. Osoitetaan seuraavaksi, että Jacobin yhtälöön on vain triviaali ratkaisu, v. Tätä varten hyödynnetään tietoa, että isoympyrän pisteet ovat samassa tasossa. Siten voidaan valita, että käyrä u on xy-tasossa, jolloin se voidaan kirjoittaa muodossa x + y = R. Koska x = R cos θ 1 sin φ, niin käyrä u voidaan ilmaista kulman φ funktiona seuraavasti y = R 1 cos θ 1 sin φ, missä φ [, π]. Nyt voidaan hyödyntää Lemmaa 3.19 konjugaattipisteiden löytämiseen tutkimalla yhtälöä θ 1 y y R =, θ 1 y 1 R y 1

4.3. LYHIN PISTEIDEN VÄLINEN ETÄISYYS PALLON PINNALLA 31 missä y 1 = y(φ 1 ) ja y = y(φ ) jollekin φ ], π]. Sijoittamalla yhtälöön saadaan y = R sin θ 1 cos θ 1 sin φ θ 1 1 cos θ 1 sin φ y R = 1 cos θ 1 sin φ R sin θ 1 cos θ 1 sin φ 1 cos θ 1 sin 1 cos φ θ 1 sin φ R sin θ 1 cos θ 1 sin φ 1 1 cos θ 1 sin 1 cos φ 1 θ 1 sin φ 1 = R sin θ 1 cos θ 1 sin φ 1 cos θ 1 sin φ 1 R sin θ 1 cos θ 1 sin φ 1 1 cos θ 1 sin φ 1 cos θ 1 sin φ 1 cos θ 1 sin φ 1 Huomataan, että determinantti on nolla, kun sin φ = sin φ 1. Tällöin φ on ratkaisu, kun φ = φ 1 + πk, k Z. Näistä ainoa ratkaisu, joka osuu välille ], π] on φ = π. Siten käyrällä u on konjugaattipiste vain silloin, kun pisteet (R, θ 1, φ 1 ) ja (R, θ, φ ) ovat vastakkaisilla puolilla ympyrää. Tällaisessa tilanteessa kaikkien näiden pisteiden välisten isoympyröiden kaarien pituudet ovat yhtä suuria ja siksi yksikäsitteistä etäisyyden minimoivaa käyrää ei ole. Siten todistuksen perusteella isoympyrän kaari määrää kahden pallopinnan pisteen välisen lyhimmän etäisyyden. Edellinen todistus hyödyntää variaatiolaskentaa kahden pallopinnan pisteen välisen lyhimmän etäisyyden määrittämiseen. Kyseinen ongelma voidaan esittää myös yksinkertaisemmin analyysin avulla. Tällöin todistus on suoraviivaisempi eikä variaatiolaskennan tuloksia, kuten Eulerin yhtälöä, tarvitse käyttää. Esitetään seuraavaksi analyyttinen todistus pallopinnan pisteiden väliselle etäisyydelle. Todistus. Tarkastellaan ensin pisteiden välistä etäisyyttä avaruudessa R n. Olkoot pisteet P = (,..., ) ja P 1 R n. Olkoon P jatkuva käyrä, joka kulkee pisteiden P ja P 1 kautta siten, että käyrän P parametriesitykselle pätee P () = P ja P (1) = P 1. Pisteiden välinen lyhin etäisyys löydetään minimoimalla Tällöin pätee epäyhtälö 1 1 P (t) dt P (t) dt. 1 P (t) dt = P 1, missä yhtäsuuruus on voimassa, kun P (t) = P 1. Siten jana P (t) = P 1 t, t 1, määrää lyhimmän etäisyyden pisteiden P ja P 1 välillä. Vastaavaa lähestymistapaa voidaan käyttää määritettäessä kahden pisteen, P ja P 1, välistä lyhintä etäisyyttä a-säteisen pallon pinnalla. Valitaan piste P pohjoisnavaksi eli P = (a, θ, ) ja olkoon piste P 1 = (a, θ 1, φ 1 ). Koska piste P valittiin pohjoisnavaksi, niin pisteiden välinen käyrä voidaan ilmaista kulman φ funktiona θ(φ), missä

3 4. KLASSISIA VARIAATIO-ONGELMIA < φ φ 1 π, θ() = ja θ(φ 1 ) = θ 1. Käyrän pituus voidaan laskea pallopinnan pituuselementin ds = a (dφ) + sin φ(dθ) avulla. Siten käyrän pituudeksi saadaan φ1 L(θ) = a 1 + sin φ(dθ) dφ. Yhtälöstä nähdään, että käyrän pituudelle pätee L(θ) a Yhtälössä yhtäsuuruus on voimassa vain jos d(θ(φ)) = eli θ(φ) = vakio. Tällöin etäisyyden minimoiva kaari vastaa pisteen P 1 kautta kulkevaa pituuspiirin lyhyempää kaarta. Koska pituuspiirit ovat myös isoympyröitä, niin isoympyrän lyhyempi kaari määrää lyhimmän etäisyyden kahden pallopinnan pisteen välillä. Jotta aikaisempaa tulosta voidaan hyödyntää käytäntöön, määritellään uusi koordinaatisto, joka vastaa maapallon pinnalla käytettyä koordinaattijärjestelmää. Määritelmä 4.5 (Maantieteelliset koordinaatit). Olkoon piste P = (x, y, z) R 3. Lukukolmikko (r, λ, δ), missä φ1 dφ. r = x + y + z, r, λ = atan(y, x), π λ π, ( ) z δ = arcsin, π r δ π, vastaa pisteen P maantieteellisiä koordinaatteja. Kuva 7. Pisteen esitys maantieteellisessä koordinaatistossa. Tämä pallokoordinaatisto poikkeaa Määritelmän 4.4 mukaisesta esimerkiksi kulman δ määritelmän ja koordinaattien rajoitteiden osalta. Tässä kulma δ vastaa Määritelmän 4.4 mukaisessa koordinaatistossa kulmaa π φ. Määritelmän 4.5 mukainen

4.3. LYHIN PISTEIDEN VÄLINEN ETÄISYYS PALLON PINNALLA 33 koordinaatisto kuitenkin soveltuu paremmin käytäntöön, sillä kulma λ vastaa maantieteellistä leveysastetta ja δ kulma pituusastetta. Todistuksien perusteella tiedetään, että pallopinnalla isoympyrä määrää kahden pisteen välisen lyhimmän etäisyyden. Todistukset eivät kuitenkaan anna tietoa siitä, kuinka suuri annettujen pisteiden välinen etäisyys on. Määritellään siis seuraavaksi kahden annetun pisteen välinen etäisyys pallopinnalla. Lause 4.6 (Pisteiden välinen etäisyys pallopinnalla). Olkoot A = (R, λ 1, δ 1 ), B = (R, λ, δ ). Pisteiden A ja B välinen etäisyys saadaan funktiosta d S : S S R, d S (A, B) = Rψ, missä R on pallopinnan säde, S = {(r, λ, φ) : r = R, π λ π, π δ π } R-säteinen pallopinta ja ψ = arccos (sin λ 1 sin λ + cos λ 1 cos λ cos(δ 1 δ )) on pisteiden A ja B määräämä keskuskulma. Pisteiden välisen etäisyyden lisäksi on hyödyllistä tuntea niitä yhdistävä isoympyrän kaari. Määritetään seuraavaksi isoympyrän kaari kahden mielivaltaisen pisteen välille. Esimerkki 4.7 (Isoympyrän kaari kahden pallopinnan pisteen välille). Olkoot pisteet A = (r, λ A, δ A ) ja B = (r, λ B, δ B ). Koska säde r ei vaikuta kaaren määräytymiseen voidaan olettaa, että r = 1 ja tarkastella vain kulmia λ ja δ. Muunnetaan pisteet A ja B karteesiseen koordinaatistoon, jolloin x = cos λ cos δ y = sin λ cos δ z = sin δ. Olkoon kulma ψ pisteiden A ja B välinen keskuskulma. Tällöin pisteiden A ja B välinen isoympyrän kaari voidaan esittää kulman α funktiona x = x A sin(ψ α) + x B sin α sin ψ y = y A sin(ψ α) + y B sin α sin ψ z = z A sin(ψ α) + z B sin α. sin ψ Nämä karteesiset koordinaatit voidaan muuttaa takaisin pallokoordinaateiksi seuraavasti λ = atan(y, x) δ = arcsin z.

34 4. KLASSISIA VARIAATIO-ONGELMIA Näin saatu funktio f : [, ψ] [-π, π] [- π, π ], f(α) = (atan(y, x), arcsin z), missä x = cos λ A cos δ A sin(ψ α) + cos λ B cos δ B sin α sin ψ y = sin λ A cos δ A sin(ψ α) + sin λ B cos δ B sin α sin ψ z = sin δ A sin(ψ α) + sin δ B sin α, sin ψ antaa isoympyrän kaaren pisteiden A ja B välille. Esimerkki 4.8. Oletetaan maapallon vastaavan pallopintaa säteellä r = 6378 km. Määritetään lyhin reitti Suomen ja Yhdysvaltojen pääkaupunkien, Helsingin ja Washingtonin, välille. Kaupunkien koordinaatit ovat 6 1 15 N 4 56 15 E ja 38 53 4 N 77 1 W. Nämä koordinaatit vastaavat pallokoordinaatiston pisteitä H = (r, λ H, δ H ) (6378;,435; 1,5) W = (r, λ W, δ W ) (6378; 1,345;,679). Lauseen 4.6 mukaan pisteiden väliseksi etäisyydeksi saadaan d S (H, W ) = rψ = 6378 km arccos (sin λ H sin λ W + cos λ H cos λ W cos(δ H δ W )) 6938 km Esimerkin 4.7 perusteella saadaan lyhin reitti pisteiden H ja W välille. Reitti kulkee esimerkiksi pisteiden R = f( 7 ψ) (,386; 1,119) ja G = f( 53 ψ) (,777; 1,47) 1 kautta. Piste R vastaa kartalla koordinaatteja 64 8 N 8 1 W ja sijaitsee merellä noin 15 kilometria länteen Islannin pääkaupungista Reykjavíkista. Piste G taas vastaa kartalla koordinaatteja 59 58 3 N 44 3 7 W ja sijaitsee Grönlannin eteläkärjessä noin seitsemän kilometriä kaakkoon Narsarmijitistä. ja

4.3. LYHIN PISTEIDEN VÄLINEN ETÄISYYS PALLON PINNALLA 35 Kuva 8. Lyhin reitti Helsingistä Washingtoniin.