Dierentiaalilaskennan käsitteistä Ossi Pasanen 13. marraskuuta 2008 1 Funktio Funktio on matemaattinen käsite, joka kuvaa kahden alkion välistä riippuvuutta. Erityisesti, kun fysiikassa jonkin suureen y arvo riippuu yksikäsitteisesti jonkun toisen suureen x arvosta, sanotaan, että ensimmäinen suure on jälkimmäisen suureen funktio. 1.1 Funktion määritelmä Määritelmä Funktio f on sääntö, joka liittää jokaiseen joukon A alkioon x yksikäsitteisen joukon B alkion y, merkitään y = f(x). Alkiota x kutsutaan lähtöjoukkoon A kuuluvaksi riippumattomaksi muuttujaksi eli argumentiksi ja alkio y on kuvajoukkoon B kuuluva riippuva muuttuja eli funktion arvo kyseisellä x:n arvolla. Lähtöjoukosta käytetään myös nimitystä määrittelyjoukko (merkitään M f ) ja kuvajoukkoa kutsutaan arvojoukoksi (merkitään A f ). Funktion ilmaisemaa sääntöä kutsutaan toisinaan kuvaukseksi ja sitä voidaan merkitä f : x y. Funktion toimintaa voidaan ajatella prosessina, jossa funktion määräämä resepti muuntaa sisääntuloalkion ulostuloalkioksi. 2 Funktion raja-arvo 2.1 Matemaattinen käsite Funktion raja-arvo on peruskäsite, johon dierentiaalilaskenta perustuu. Epäformaalisti raja-arvo voidaan määritellä seuraavasti [1].
2 Määritelmä (epäformaali) Olkoon funktio f(x) määritelty pisteen x = x 0 ympäristössä. Jos funktion arvo f(x) lähestyy mielivaltaisen lähelle lukua L, kunhan x valitaan riittävän läheltä pistettä x 0, on funktion raja-arvo pisteessä x = x 0 yhtä kuin L. Merkitään: lim f(x) = L. x x 0 Usein tämä epäformaali määritelmä on matematiikan soveltajalle täysin riittävä, sillä raja-arvo on pohjakäsite, johon seuraavan tason käsitteet perustuvat, mutta raja-arvoa ei sellaisenaan juuri tarvita sovelluksissa. Määritelmässä esiintyy kuitenkin kaksi salakavalaa ilmaisua: lähestyy mielivaltaisen lähelle ja valitaan riittävän läheltä, joiden matemaattinen merkitys on tarpeen täsmentää. Formaalisti raja-arvo määritellään seuraavasti [4, 1]. Määritelmä (formaali) Funktion f(x) raja-arvo pisteessä x 0 on L, merkitään lim x x0 f(x) = L, jos kaikille luvuille ɛ > 0 on olemassa jokin sellainen luku δ ɛ > 0 siten, että ehdon 0 < x x 0 < δ ɛ toteuttavilla x:n arvoilla pätee f(x) L < ɛ. Mielivaltaisen lähellä ja riittävän lähellä tarkoittavat näitä kahta lukua ɛ ja δ ɛ. Koska reaaliluvut täyttävät lukusuoran aukottomasti [1], on matemaattisesta näkökulmasta täysin mielekästä valita luku avoimelta väliltä ]0, [ vaikka miten läheltä nollaa. Tarkastellaan määritelmää seuraavaksi fysikaalisesta näkökulmasta. 2.2 Fysikaalinen näkökulma Olkoon tarkasteltavana kahden fysikaalisen suureen x ja y välistä riippuvuutta kuvaava funktio f eli y = f(x). Tällöin funktion f raja-arvolla pisteessä x 0 tarkoitetaan sitä suureen y arvoa, jota f(x) lähestyy mielivaltaisen lähelle, kun suureen x arvo valitaan riittävän läheltä arvoa x 0, kuitenkin niin, että erotus x x 0 on dimensiollisten lukuarvojen 0 ja δ ɛ välissä, 0 < x x 0 < δ ɛ. Määritelmä siis olettaa, että kahden mittauksen välinen erotus voisi olla miten pieni tahansa olematta kuitenkaan nolla. Tämä on fysikaalisesti mieletön ajatus. Yhtäältä absoluuttisen tarkat mittaukset ovat fysikaalisesti mahdottomia. Toisaalta tutkimus on paljastanut, että pienessä mittakaavassa luonto näyttäytyy mittauksissa epäjatkuvana eli suureiden arvot ovat kvantittuneet. Mitattavissa olevat suureiden arvot eivät siis täytä lukusuoraa samalla tavalla aukottomasti kuin reaaliluvut. [2]
3. Funktion derivaatta 3 Fysikaalisten ilmiöiden mallintamiseen käytetyt matemaattiset mallit sisältävät siten jatkuvuuden idealisaation, jolle ei ole fysikaalista vastinetta. Mallin hyvyys riippuukin siitä, voidaanko empiirisesti rajallisen kokoiset erotukset ɛ ja δ ɛ valita tarkasteltavassa systeemissä niin pieniksi, että tulos on mittaustarkkuuden rajoissa sama kuin matemaattista määritelmää käytettäessä [2]. 3 Funktion derivaatta Luonnonilmiöitä tutkittaessa tarkkaillaan, millaista tutkittavien suureiden muutos on. Tarkastellaan mitattavaa suuretta edustavan funktion f(x) arvoja kahdella argumentin arvolla x 0 ja x 1. Tällöin suureen f(x) absoluuttinen muutos f(x) tilanteessa, jossa x muuttuu arvosta x 0 arvoon x 1, määritellään näitä vastaavien funktion arvojen erotuksena f(x) = f(x 1 ) f(x 0 ). Absoluuttinen muutos liittyy aina valittuun tarkastelun alkupisteeseen x 0 ja argumentin absoluuttiseen muutokseen x = x 1 x 0 ja se voidaan kirjoittaa muodossa f(x) = f(x 0 + x) f(x 0 ). (1) Paremmin vertailukelpoinen funktion muutoksen mitta on absoluuttisen muutoksen sijaan funktion arvon suhteellinen muutos argumentin muutokseen nähden. Tätä suhteellisen muutoksen lauseketta kutsutaan myös erotusosamääräksi f(x) x = f(x 0 + x) f(x 0 ). (2) x Suhteellinen muutos kuvaa funktion arvon keskimääräistä muutosnopeutta argumentin muutoksen suhteen välillä x 0... x 1. 3.1 Derivaatta tietyssä pisteessä Funktion derivaatta pisteessä x = x 0 määritellään erotusosamäärän (2) rajaarvona, kun argumentin muutos x lähestyy nollaa. Määritelmä Funktion f(x) derivaatta kohdassa x = x 0 on df dx = lim x=x0 x 0 f x = lim f(x 0 + x) f(x 0 ) x 0 x (3) Graasesti funktion suhteellinen muutos vastaa funktion kuvaajalle pisteiden (x 0, f(x 0 )) ja (x 1, f(x 1 )) kautta piirretyn sekantin kulmakerrointa ja funk-
4 y y=f(x) f(x 0 ) sekantti f(x 1 ) x 0 tangentti x 1 x Kuva 1: Funktion f(x) keskimääräinen muutosnopeus argumentin x muutokseen nähden vastaa sekantin kulmakerrointa. Hetkellinen muutosnopeus eli derivaatta vastaa graasesti kuvaajalle piirretyn tangentin kulmakerrointa. tion derivaatta vastaa funktion kuvaajan tangentin kulmakerrointa pisteessä (x 0, f(x 0 )). Tätä on havainnollistettu kuvassa 1. 3.2 Derivaattafunktio Edellä annettu lauseke määrittelee derivaatan tietyssä tarkastelupisteessä. Derivaatan määritelmä siis liittää tiettyyn funktion määrittelyjoukon pisteeseen a M f lukuarvon df dx. Jos derivaatta on määritelty kaikissa määrittelyjoukon pisteissä, muodostuu näistä derivaatan arvoista funktio määrittely- x=a joukolta M f derivaatan lukuarvojen joukolle A derivaatta. Tätä funktiota kutsutaan derivaattafunktioksi ja merkitsemme sitä pilkulla alkuperäisen funktion nimen perässä f. Siispä derivaattafunktion arvo tietyssä yksittäisessä pisteessä x 0 vastaa funktion derivaatan arvoa kyseisessä pisteessä ja voidaan merkitä f (x 0 ) = df dx. Derivaattafunktiolle käytetään myös merkintää Df(x), jossa x=x0 derivointimerkki D on käsky suorittaa derivointi perään kirjoitetulle funktiolle. 1 1 D-merkistä käytetään myös nimitystä derivointioperaattori.
3.3 Fysikaalinen merkitys 5 3.3 Fysikaalinen merkitys Tyypillinen tutkittava ilmiö fysiikassa on suureen aikariippuvuuden määrittäminen. Tällöin tutkittavan suureen arvoa mitataan eri ajan hetkillä valittuun alkuhetkeen nähden. Tarkasteltaessa samanpituisia aikavälejä, saattaa suureen arvon muutos olla eri suuruinen eri mittauksissa. Tällöin suureen keskimääräinen muutosnopeus ajan suhteen on ollut erilainen eri mittausväleillä. Kun aikaväliä lyhennetään lähestytään hetkellisen muutosnopeuden eli suureen aikaderivaatan käsitettä. Mittaustekniikka asettaa käytännön rajoituksia, miten lyhyt kahden mittauksen aikaväli voi käytännössä olla. Empiiriseltä kannalta derivaatta voidaan siten tulkita kahden toisistaan riippuvan suureen absoluuttista muutosta kuvaavien ns. dierentiaalien osamääränä. Dierentiaali on fysiikassa tärkeä käsite ja sillä tarkoitetaan hyvin pientä mitattavissa olevaa suureen muutosta. Muutoksen pienuuden korostamiseksi käytetään tavallisen -merkinnän sijasta d -kirjainta suurenimen edessä. Kun esimerkiksi suureen s muutos s on hyvin pieni, voidaan merkitä ds = s. Jos esimerkiksi kappaleen paikasta tehdään kaksi peräkkäistä mittausta lyhyen aikavälin dt aikana ja havaitaan paikan muuttuneen näiden mittausten välillä määrällä ds, voidaan kappaleen hetkellistä nopeutta mittausten aikana approksimoida lausekkeella v ds dt. (4) Mitä pienemmäksi aikaväli saadaan, sitä paremmin oikealla oleva osamäärä vastaa kappaleen hetkellistä nopeutta. 2 3.4 Derivaattamerkinnöistä Derivaatan eri merkintätavat heijastelevat erilaisia näkökulmia käsitteeseen. Dierentiaalimerkinnän df voidaan nähdä heijastelevan derivaatan operationaalista puolta: derivaatan määrittämiseksi funktiolle on tehtävä jotain. dx Pilkkumerkintä f (x) puolestaan esittää derivaatan rakenteellisena käsitteenä. Derivaatta on ruumiillistunut objektiksi: Jos f on funktio, niin f on sen derivaatta. Derivaatan merkitsemisessä dierentiaaliosamääränä on etu, että se korostaa empiiristä puolta. Kullakin dierentiaalilla on emosuureensa dimensio. Tällöin dierentiaaliosamäärän dimensio on sama kuin kyseisten emosuureiden 2 Käytännössä tilanne ei tosin ole näin yksinkertainen, sillä aikaväliä pienennettäessä mittausten suhteellinen virhe kasvaa, mikä vääristää nopeudelle saatavaa laskettua arvoa.
6 osamäärän dimensio. Tämä on välittömästi nähtävissä derivaatan dierentiaalimuotoisesta merkinnästä. Pilkku- ja D-merkinnässä derivaatan dimensiot eivät ole suoraan näkyvissä. Toinen etu dierentiaalimerkinnästä on, että sen avulla kirjoitettu derivaatta antaa suoran mittausreseptin derivaatan numeerisen arvon laskemiseksi. 4 Osittaisderivaatta Usean muuttujan funktion arvo voi muuttua minkä tahansa muuttujan muuttuessa. Tällaisen funktion riippuvuutta yksittäisestä muuttujasta kuvataan osittaisderivaatoilla kyseisen muuttujan suhteen kaikkien muiden muuttujien pysyessä muuttumattomina. Kyseessä on yhden muuttujan funktion derivaatan käsitteen laajennus. Määritelmä Usean muuttujan funktion g(x 1, x 2,..., x n ) osittaisderivaatta muuttujan x i suhteen pisteessä (x 1, x 2,..., x n ) on g x i = lim (x1,x 2,...,x n) x 0 g(x 1, x 2,..., x i + x,..., x n ) g(x 1, x 2,..., x n ). x (5) Osittaisderivaatan käsitteessä on siis mukana sama raja-arvon avulla määritelty rajankäyntiprosessi kuin tavallisessa yhden muuttujan derivaatassakin. Pidetään vain huolta siitä, että useista muuttujista tutkitaan aina yhden muuttujan muutosta kerrallaan. Funktion g osittaisderivaattaa muuttujan x i suhteen merkitään usein lyhyesti i g. 4.1 Fysikaalinen merkitys Monissa fysikaalisissa ilmiöissä tutkittava suure riippuu useamman kuin yhden suureen arvosta. Sopivasti suunnitellussa koetilanteessa saattaa kuitenkin olla mahdollista rajoittaa tutkittavaa ilmiötä siten, että riippuvuutta määritettäessä muutellaan vain yhtä suuretta kerrallaan. Tällöin tilanne vastaa efektiivisesti edellä tarkasteltua yhdestä muuttujasta riippuvaa tapausta. Osittaisderivaatan symbolisessa esityksessä esiintyvien g ja x merkintöjen empiirinen tulkinta dierentiaaleina on hyvin samanlainen kuin edellä käsiteltyjen yhden muuttujan tapauksessa. Dierentiaali g kuvaa suureen g pientä muutosta silloin, kun muuttuja x muuttuu pienellä määrällä x muiden g:n arvoon
5. Nablaoperaattori 7 Kuva 2: Maaston korkeusproili h(x, y). Osittaisderivaatta eri koordinaattien suhteen kertoo maaston jyrkkyyden kyseisen koordinaatin suuntaisessa siirtymässä. vaikuttavien muuttujien pysyessä muuttumattomina. Maantieteellisgeometrisenä esimerkkinä tarkasteltavana voi olla esimerkiksi kaksiulotteisessa tasossa määritelty maaston korkeusproili h(x, y), joka kertoo maaston korkeuden pisteessä (x, y) merenpinnasta mitattuna (kuva 2). Osittaisderivaatan h(x,y) geometrinen merkitys on nyt maaston jyrkkyys liikuttaessa x-akselin suunnassa eli pinnalle piirretyn x-akselin suuntaisen x tangenttisuoran kulmakerroin. Osittaisderivaatta y-akselin suhteen on vastaava jyrkkyys y-akselin suuntaisessa siirtymässä. 5 Nablaoperaattori Monen muuttujan dierentiaalilaskennassa usein vastaantulevat derivaatat voidaan kirjoittaa yksinkertaisessa helposti käsiteltävässä symbolisessa muodossa ns. nablaoperaattorin (symboli ) avulla. Operaattori on vektorimuotoinen kokoelma edellä määritellyistä osittaisderivaattaoperaattoreista x i, missä indeksi i viittaa koordinaattiakselin järjestysnumeroon avaruudessa, jonka kanta on {ê 1, ê 2,..., ê n }. Nablaoperaattorin määritelmä on ( = ê 1 ) + ê 2 +... + +ê n, (6) x 1 x 2 x n missä ê i tarkoittaa koordinaattiakselin x i suuntaista yksikkövektoria. Kolmiulotteisessa karteesisessa koordinaatistossa nabla on ( = i x + j y + k ), (7) z
8 standardikantavektoreiden {i, j, k} avulla lausuttuna. Koska nabla on muodoltaan vektori, voidaan sillä operoida sekä skalaari- että vektorifunktioihin muodollisesti eri kertolaskutoimitusten avulla. 3-ulotteisessa avaruudessa nablan avulla määriteltävät peruslaskutoimitukset ovat [5] gradientti h, (8) divergenssi F, (9) roottori F, (10) missä h on skalaarifunktio ja F vektorifunktio kolmiulotteisessa avaruudessa. Tässä tutkielmassa keskitymme vain divergenssiin ja roottoriin 2- tai 3- ulotteisessa avaruudessa. Koska kyse on vektorimuotoisten funktioiden dierentiaalilaskennasta eli analyysistä, käytetään tästä aihepiiristä myös kompaktia nimitystä vektorianalyysi. 6 Divergenssin fysikaalinen tulkinta Vektorifunktion F(x, y, z) divergenssi eli lähteisyys F = F x x + F y y + F z z (11) on muodoltaan skalaarisuure. Kyseessä on muodollisesti kahden vektorin pistetulo eikä lausekkeen arvo riipu koordinaatiston valinnasta. Divergenssillä on sama tulkinta sekä kahdessa että kolmessa ulottuvuudessa. Olkoon v(x, y, z) nesteen virtausnopeus. Tällöin divergenssin v arvo pisteessä (x, y, z) tarkoittaa nettovuota tilavuusyksikköä kohti eli vuon tiheyttä tarkasteltavassa pisteessä [6]. Jos divergenssi on positiivinen, on tarkastelupisteessä lähde ja virtaus ulos on suurempi kuin sisään eli pisteestä pulppuaa nestettä ulos tai neste laajenee tarkastelupisteessä. Jos taas vuo on negatiivinen, on kyseessä nielu ja piste imee nestettä sisäänsä tai neste puristuu kokoon. Kun divergenssi on nolla, on kenttä tarkastelupisteessä lähteetön. Piste tulee tässä ymmärtää fysikaalisessa mielessä dierentiaalisena tilavuusalkiona. Toinen tyypillinen fysikaalinen esimerkki lähteisyydestä on Maxwellin I laki, joka voidaan esittää muodossa D(r) = ρ(r). (12) Laki kertoo varaustiheyden toimivan sähkövuon tiheyden lähteisyytenä [3].
7. Roottorin fysikaalinen tulkinta 9 7 Roottorin fysikaalinen tulkinta Vektorifunktion F(x, y, z) roottori eli pyörteisyys i j k F = x y z = i( y F z z F y ) j( x F z z F x )+k( x F y y F x ). (13) F x F y F z on muodoltaan vektorisuure. Lauseke on muodollisesti kahden vektorin vektoritulo. Tämäkään lauseke ei riipu käytetystä koordinaatistosta. Roottoria voidaan käsitellä myös kaksiulotteisena versiona rajoittamalla tarkasteltava vektorikenttä tasoon. Esimerkiksi xy-tasossa roottori on muotoa F = k( x F y y F x ) (14) Myös roottorin fysikaalinen tulkinta voidaan esittää nestevirtauksen avulla. Jos pyörteiseen nestevirtaukseen asetetaan pieni testipallo, se lähtee pyörimään. Pyörteisyysvektorin suunta määräytyy ns. oikean käden säännöllä 3 pallon pyörimisakselista ja kiertosuunnasta. Pyörteisyysvektorin pituus kuvaa pyörteisyyden voimakkuutta ja se on verrannollinen testipallon pyörimisnopeuteen. Pyörteisyysvektori vastaa siten fysikaalisesti kerrointa vaille testipallon kulmanopeusvektoria. Jos testipallo pyörii, esiintyy kyseisessä mittauspisteessä pyörteisyyttä ja pyörteisyysvektorin pituus on suurempi kuin nolla. Rajatapauksessa, jossa testipallo pysyy paikallaan eli F = 0, sanotaan kenttää pyörteettömäksi. Koska pyörteisyys on vektorisuure, ei sen sijaan ole oikein puhua positiivisesta tai negatiivisesta pyörteisyydestä muutoin kuin 2-ulotteisen tarkastelun tapauksessa. Kaksiulotteisessa tilanteessa testipallo voidaan korvata siipirattaalla [6]. Pyörteisyysakseli on kaiken aikaa kohtisuorassa tarkastelutasoa vastaan, joten pyörteisyysvektorin suunnalla on vain kaksi vastakkaista vaihtoehtoa. Toinen näistä vektorisuunnista voidaan valita positiiviseksi suunnaksi, joka kiinnittää samalla oikean käden säännön mukaisesti positiivisen kiertosuunnan tasossa. Tai jos tehdään ensin valinta positiivisesta kiertosuunnasta tasossa, määrää tämä valinta oikeakätisyyssännöllä pyörteisyysvektorin positiivisen suunnan. Kuvassa 3 on esitetty siipirattaan pyörimissuunnan ja pyörteisyysvektorin välinen yhteys oikean käden säännön mukaisesti. 3 Kun oikean käden sormet etusormesta pikkurilliin asetetaan kaarelle osoittamaan pallon kiertosuuntaa niin pyörimisakselin suuntaisesti pystyyn nostettu peukalo määrää pyörteisyysvektorin suunnan.
10 VIITTEET Kuva 3: Tasoon rajoittuneessa kaksiulotteisessa virtauskentässä pyörteisyyden detektorina voidaan käyttää siipiratasta. Pyörteisyysvektorin suunta määräytyy rattaan kiertosuunnasta oikean käden säännön mukaisesti. Toinen tyypillinen fysikaalinen esimerkki pyörteisyydestä on Maxwellin IV lain staattinen osa, joka voidaan esittää muodossa H(r) = J(r), (15) missä H on magneettikentän voimakkuus ja J on virrantiheys tarkastelupisteessä. Laki kertoo, että stationaarinen virtajakauma synnyttää ympärilleen pyörteisen magneettikentän. Magneettivuon tiheyden pyörteisyys tarkastelupisteessä on yhtä suuri kuin virrantiheys [3]. Virrantiheysvektori määrää siis pyörteisyysakselin. Viitteet [1] Adams, R. A. Calculus: a complete course, 5th ed. Addison Wesley, 2003. [2] Kurki-Suonio, K., and Kurki-Suonio, R. Fysiikan merkitykset ja rakenteet. Limes ry, 1998. [3] Kurki-Suonio, K., and Kurki-Suonio, R. Vuorovaikutuksista kenttiin - sähkömagnetismin perusteet. Limes ry, 1999.
VIITTEET 11 [4] Lahtinen, A., and Pehkonen, E. Matematiikkaa soveltajille: peruskurssi korkeakouluja varten, osa 1. Kirjayhtymä, 1992. [5] Lahtinen, A., and Pehkonen, E. Matematiikkaa soveltajille: peruskurssi korkeakouluja varten, osa 2. Kirjayhtymä, 1994. [6] Weir, M. D., et al. Thomas' Calculus. Pearson Addison-Wesley, 2008.