Opetusmonisteita Helsingin yliopiston kansantaloustieteen laitos Tapio Palokangas Luentoja kansantaloustieteen matemaattisista menetelmistä Syyslukukausi 2007
1 1 Determinantit 11 Mitä ovat determinantit? Determinantit ovat lukuja, joita käytetään mm matriisilaskenassa on matemaattisessa optimoinnissa Ne voidaan määritellä seuraavasti: Ensimmäisen asteen determinantti on a 11 = a 11, missä a 11 on luku Esimerkiksi 4 = 4 Huomautus: vaikka determinantteja merkitään pystytangoilla, niitä ei saa sekoittaa itseiarvoihin! Toisen asteen determinantti on a 11 a 12 a 21 a 22 = a 11a 22 a 12 a 21 Esimerkiksi 2 1 3 2 = 2 2 1 3 = 1 Kolmannen asteen determinantti voidaan kehittää minkä tahansa vaakatai pystyrivin avulla seuraavasti: 1 vaakarivi a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 = a 11 a 22 a 23 a 32 a 33 a 12 a 21 a 23 a 31 a 33 + a 13 a 21 a 22 a 31 a 32 2 vaakarivi a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 = a 21 a 12 a 13 a 32 a 33 + a 22 a 11 a 13 a 31 a 33 a 23 a 11 a 12 a 31 a 32 3 vaakarivi a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 = a 31 a 12 a 13 a 22 a 23 a 32 a 11 a 13 a 21 a 23 + a 33 a 11 a 12 a 21 a 22 1 pystyrivi a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 = a 11 a 22 a 23 a 32 a 33 a 21 a 12 a 13 a 32 a 33 + a 31 a 12 a 13 a 22 a 23 2 pystyrivi a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 = a 12 a 21 a 23 a 31 a 33 + a 22 a 11 a 13 a 31 a 33 a 32 a 11 a 13 a 21 a 23
2 3 pystyrivi a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 = a 13 a 21 a 22 a 31 a 32 a 23 a 11 a 12 a 31 a 32 + a 33 a 11 a 12 a 21 a 22 Kehitettäessä kunkin kertoimen a ij etumerkki on ( 1) i+j, missä i on vaaka- ja j pystyrivin järjestysnumero Esimerkiksi 3 1 2 1 1 2 2 4 1 = 3 1 2 4 1 1 1 2 2 1 + 2 1 1 2 4 = 3(1 8) 1(1 4) + 2(4 2) = 14 n:nnen asteen determinantti voidaan kehittää minkä tahansa vaaka- tai pystyrivin avulla seuraavasti: i:nnes vaakarivi a 11 a 12 a 1n a 21 a 22 a 2n = a n1 a n2 a nn a 11 a 12 a 1,j 1 a 1,j+1 a 1n n ( 1) i+j a ij a i 1,j a i 1,2 a i 1,j 1 a i 1,j+1 a 1 i,n j=1 a i+1,j a i+1,2 a i+1,j 1 a i+1,j+1 a 1+i,n a n1 a n2 a nn j:nnes pystyrivi a 11 a 12 a 1n a 21 a 22 a 2n = a n1 a n2 a nn a 11 a 12 a 1,j 1 a 1,j+1 a 1n n ( 1) i+j a ij a i 1,j a i 1,2 a i 1,j 1 a i 1,j+1 a 1 i,n i=1 a i+1,j a i+1,2 a i+1,j 1 a i+1,j+1 a 1+i,n a n1 a n2 a nn Kehittämällä edelleen alideterminantit päädytään lopulta tilanteeseen, jossa determinatti on aikioiden a ij funktio
3 12 Determinanttien ominaisuuksia Determinantista saadaan käänteisdeterminantti, jos sen pysty- ja vaakarivit vaihtavat paikkaansa Ominaisuus 1: Determinantin ja sen käänteisdeterminantin arvo ovat samat, a 11 a 12 a 1n a 11 a 21 a n1 a 21 a 22 a 2n = a 12 a 22 a n2 a n1 a n2 a nn a 1n a 2n a nn Todistus: Jos determinatti kehitetään aina 1 vaakarivin avulla ja sen käänteisdeterminatti aina 1 pystyrivin avulla, niin saadaan täsmälleen sama tulos Ominaisuus 2: Jos yhden vaakarivin tai yhden pystyrivin kaikki alkiot kerrotaan samalla vakiolla k, niin silloin koko determinantin arvo kerrotaan samalla vakiolla k, a 11 a 1j a 1n ka i1 ka ij ka in a n1 a nj a nn = k a 11 a 1j a 1n a i1 a ij a in a n1 a nj a nn, (11) a 11 ka 1j a 1n a i1 ka ij a in a n1 ka nj a nn = k a 11 a 1j a 1n a i1 a ij a in a n1 a nj a nn (12) Todistus: Jos yhtälön (11) molemmat puolet kehitetään pystyrivin i avulla, niin saadaan sama tulos Jos yhtälön (12) molemmat puolet kehitetään vaakarivin j avulla, niin saadaan sama tulos Ominaisuus 3: Determinatti muuttuu vastaluvukseen, jos kaksi sen pystyriviä tai kaksi sen vaakariviä vaihtavat paikkaansa: a 11 a 1j a 1n a 11 a 1j a 1n a i1 a ij a in a h1 a hj a hn =, (13) a h1 a hj a hn a i1 a ij a in a n1 a nj a nn a n1 a nj a nn
4 = a 11 a 1j a 1h a 1n a i1 a ij a ih a in a n1 a nj a nh a nn a 11 a 1h a 1j a 1n a i1 a ih a ij a in a n1 a nh a nj a nn (14) Todistus: Vaakariveille a 11 a 1j a 1n a i1 a ij a in n = ( 1) i+j a ij a h1 a hj a in j=1 a n1 a nj a nn n n = ( 1) i+j a ij ( 1) h 1+j a hj j=1 j=1 = n ( 1) h 1+j a hj j=1 n j=1 ( 1) i+j a ij a 11 a 1j a 1n a i 1,1 a i 1,j a i 1,n a i+1,1 a i+1,j a i+1,n a h1 a hj a hn a n1 a nj a nn a 11 a 1j a 1n a i 1,1 a i 1,j a i 1,n a i+1,1 a i+1,j a i+1,n a h 1,1 a h 1,j a h 1,n a h+1,1 a h+1,j a h+1,n a n1 a nj a nn a 11 a 1j a 1n a i 1,1 a i 1,j a i 1,n a i+1,1 a i+1,j a i+1,n a h 1,1 a h 1,j a h 1,n a h+1,1 a h+1,j a h+1,n a n1 a nj a nn
5 n = ( 1) h+j a hj j=1 = a 11 a 1j a 1n a h1 a hj a hn a i1 a ij a in a n1 a nj a nn Sama pystyriveille a 11 a 1j a 1n a i1 a ij a in a h 1,1 a h 1,j a h 1,n a h+1,1 a h+1,j a h+1,n a n1 a nj a nn Ominaisuus 4: Jos determinantilla on kaksi täysin samaa vaakariviä tai kaksi täysin samaa pystyriviä, niin sen arvo on nolla: a 11 a 1j a 1n a 11 a 1j a 1j a 1n a i1 a ij a in 0, a i1 a ij a ij a in 0 a i1 a ij a in a n1 a nj a nj a nn a n1 a nj a nn (15) Todistus: Sijoittamalla a ij = a hj (j = 1,, n) yhtälöön (13) saadaan vasemmanpuoleinen yhtälö (15) Sijoittamalla a ij = a ih (i = 1,, n) yhtälöön (14) saadaan oikeanpuoleinen yhtälö (15) Ominaisuus 5: Jos yhden vaakarivin tai yhden pystyrivin kaikki alkiot voidaan kirjoittaa summiksi, niin determinatti voidaan esittää kahden determinantin summana seuraavasti: = a 11 a 1j a 1n a i1 + ã i1 a ij + ã ij a in + ã in a n1 a nj a nn a 11 a 1j a 1n a i1 a ij a in a n1 a nj a nn + a 11 a 1j a 1n ã i1 ã ij ã in a n1 a nj a nn, (16)
= + a 11 a 1j + ã 1j a 1n a i1 a ij + ã ij a in a n1 a nj + ã nj a nn a 11 a 1j a 1n a i1 a ij a in a n1 a nj a nn a 11 ã 1j a 1n a i1 ã ij a in a n1 ã nj a nn 6 (17) Todistus: Jos yhtälön (16) molemmat puolet kehitetään pystyrivin i avulla, niin saadaan sama tulos Jos yhtälön (17) molemmat puolet kehitetään vaakarivin j avulla, niin saadaan sama tulos Ominaisuus 6: Jos yksi vaakarivi kerrotaan vakiolla ja lisätään toiseen vaakariviin tai jos yksi pystyrivi kerrotaan vakiolla k ja lisätään toiseen pystyriviin, niin determinatin arvo ei muutu: a 11 a 1j a 1n a 11 a 1j a 1n a i1 a ij a in a i1 a ij a in =, a h1 + ka i1 a hj + ka ij a hn + ka in a h1 a hj a hn a n1 a nj a nn a n1 a nj a nn (18) a 11 a 1j a 1h + ka 1j a 1n a i1 a ij a ih + ka ij a in a n1 a nj a nh + ka nj a nn a 11 a 1j a 1h a 1n = a i1 a ij a ih a in (19) a n1 a nj a nh a nn Todistus: Ominaisuuksien 2, 4 ja 5 perusteella vaakariveille a 11 a 1j a 1n a i1 a ij a in a h1 + ka i1 a hj + ka ij a hn + ka in a n1 a nj a nn
7 = = = Sama pystyriveille a 11 a 1j a 1n a i1 a ij a in a h1 a hj a hn a n1 a nj a nn a 11 a 1j a 1n a i1 a ij a in a h1 a hj a hn a n1 a nj a nn a 11 a 1j a 1n a i1 a ij a in a h1 a hj a hn a n1 a nj a nn + + k a 11 a 1j a 1n a i1 a ij a in ka i1 ka ij ka in a n1 a nj a nn a 11 a 1j a 1n a i1 a ij a in a i1 a ij a in a n1 a nj a nn }{{} 0
8 2 Komparatiivinen statiikka 21 Ongelma Miten systeemistä (kansantalous, kotitalous, yritys jne), jossa on olemassa useita samanaikaisia eli simultaanisia riippuvuuksia ja joka koko ajan on jatkuvassa liikkeessä, voidaan johtaa luotettavia ennusteita? Tämän ongelman selvittämisessä kansantaloustiede käyttää kahta tutkimusmetodia: komparatiivista statiikkaa, jossa systeemistä abstrahoidaan pois liike ja keskitytään tutkimaan systeemin rakennetta, sekä komparatiivista dynamiikkaa, jossa keskitytään tarkastelemaan pelkästään systeemin liikettä Nämä metodit on alunperin lainattu fysiikasta (lähinnä mekaniikasta), mutta ajan myötä ne ovat mukautuneet kansantaloustieteen omiin tarpeisiin Niitä sovelletaan pääpiirteissään seuraavalla tavalla 211 Komparatiivinen statiikka: 1 Oletetaan, että systeemi on alunperin tasapainossa (= lepotilassa), jolloin siinä ei ole mitään liikettä 2 Oletetaan, että tapahtuu jokin ulkoinen muutos ja katsotaan, mikä on uusi muutoksen jälkeinen tasapaino 3 Vertailemalla uutta tasapainoa alkuperäiseen tasapainoon saadaan laadullista tietoa systeemin rakenteellisista riippuvuuksista Esimerkkejä komparatiivisesta statiikasta: 1 kuula epätasaisella pinnalla 2 kysynnän ja tarjonnan laki 3 kuluttajan ja yrityksen tasapaino 4 Kahnin-Keynesin ekspansiokerroin Tulkinnan erityispiirteitä: (I) Komparatiivisen statiikan soveltaminen edellyttää, että systeemi oletetaan stabiiliksi eli vakaaksi niin, että se hakeutuu kohden jotain tasapainoa Muuten uutta tasapainoa ei voidaan olenkaan saavuttaa, joten uutta ja vanhaa tasapainoa ei voida lainkaan verrata Mallin stabiilisuuden selvittäminen kuuluu komparatiivisen dynamiikan alueeseen
9 (II) Komparatiivisen statiikan ideana on liikkeen poistaminen systeemistä tarkastelemalla sitä tasapainossa, jossa liikettä ei ole laisinkaan Tällöin joudutaan kuitenkin olettamaan, että systeemi on koko ajan likimääräisen lähellä tasapainoa, jotta sen rakenteelliset riippuvuudet olisivat likimäärin samat kuin tasapainossa Toisin sanoen: komparatiivinen statiikka kuvaa likimääräisesti systeemin todellisia rakenteellisia ominaisuuksia, mikäli ollaa lähellä tasapainoa Mitä kauempana systeemin todellinen tila on tasapainosta, sitä epätarkemmin komparatiivinen statiikka ennustaa systeemin käyttäytymistä (III) Koska komparatiivinen statiikka vertailee muutosta edeltävää tasapainoa muutoksen jälkeiseen tasapainoon, se kuvaa pysyvän muutoksen pysyvää vaikutusta Esimerkki: Makromalli ennustaa, että rahamäärän lisäys taloudessa nostaa hintatasoa Tarkkaan ottaen tämä täytyy tulkita siten, että rahamäärän pysyvä lisäys pyrkii pysyvästi nostamaan hintatasoa (IV) Koska systeemin täytyy olla aina suhteellisen lähellä tasapainoa (vrt kohta (II) yllä), tutkittava eksogeeninen muutos on oletettava pieneksi Jos muutos olisi suuri, niin systeemi olisi muutoksen jälkeen kaukana voimassa olevasta (= uudesta) tasapainosta ja komparatiivisen statiikka ennustaisi huonosti Esimerkki: Mallin ennustama hintatason riippuvuus rahamäärästä on sitä tarkempi ja luotettavampi (epätarkempi ja epäluotettavampi), mitä pienempi (suurempi) on rahamäärän suhteellinen muutos (V) Vaikka taloudelliset ja fysikaaliset mallit ovat tekniseltä rakenteeltaan usein varsin samankaltaisia, niiden tulkinnassa on silti suuria eroja, koska ne kuvaavat varsin erilaisia ilmiöitä Mekaniikassa pystytään yleensä arvioimaan milloin ja miten uuteen tasapainoon päästään Kansantaloustieteessä komparatiivisen statiikan tulokset ovat tendessimäisiä: se ei sano mitään siitä, millä hetkellä uusi tasapaino saavutetaan, vaan kertoo sen, että mallin ennustama muutos tapahtuu ennemmin tai myöhemmin Esimerkki: Rahamäärän lisäyksen aiheuttama hintatason nousu tapahtuu tietyn ajanjakson kuluessa ja vieläpä niin, että tämä monetäärisen viiveen pituus on satunnaismuuttuja Tämä tendenssimäisyys (ja siitä aiheutuva epävarmuus) on peräisin taloudellisten ilmiöiden luonteesta Muutokset tapahtuvat mikroyksikköjen (kuluttajat, yritykset, työmarkkinajärjestöt jne) valintojen ja tavoitteisten toimintojen kautta Suurten lukujen lain nojalla mikroyksiköt joukkona käyttäytyvät verrattain säännönmukaisesti, ja taloudelliset mallit kuvaavat näitä säännönmukaisuuksia Yksilöiden välisistä eroista ja suuresta määrästä johtuen välitysmekanismit ovat kuitenkin niin hienojakoisia ja monisyisiä, että havaitut säännönmukaisuudet jäävät tendessimäisiksi (VI) Jotta komparatiivista statiikkaa voitaisiin soveltaa, mallin tarkasteleman ajanjakson täytyy olla riittävän pitkä, jotta uusi tasapaino voidaan saavuttaa sen puitteissa
10 Esimerkki: Jos halutaan selvittää, mikä on rahamäärän pysyvän lisäyksen aiheuttama pysyvä hintatason muutos, niin ajanjakson on oltava niin pitkä, että koko monetäärinen viive satunnaisvaihteluineen sisältyy siihen; eli kysymys on tässä tapauksessa pitkän aikavälin mallista 212 Komparatiivinen dynamiikka: 1 Rakennetaan jokin mekanismi, joka liikuttaa systeemiä silloin, kun tämä on epätasapainossa (so tasapainon ulkopuolella) 2 Valitaan systeemille erilaisia alkuarvoja ja lasketaan näitä vastaavat kehitysurat 3 Vertailemalla eri alkutilanteita vastaavia systeemin kehitysuria saadaan laadullista tietoa systeemin liikkumisesta Jos systeemi on stabiili, se hakeutuu kohden jotain tasapainoa, jos se on epästabiili, se erkaantuu tasapainosta Sama systeemi voi toisilla alkuarvoilla olla stabiili ja toisilla epästabiili Mikäli systeemi on kaikilla ajateltavissa olevilla alkuarvoilla stabiili (epästabiili), sitä sanotaan globaalisti stabiiliksi (epästabiiliksi) Esimerkkejä komparatiivisesta dynamiikasta (luennolla): 1 kuula epätasaisella pinnalla 2 lukiseittiteoreema 3 osakekurssin määräytyminen 4 vaihtokurssin yliampuminen 22 Komparatiivinen statiikka matemaattisti Taloudellisissa (ja myös luonnontieteellisissä) malleissa systeemin tasapainoa kuvataan jonkin yhtälöryhmän avulla, esim f 1 (x 1, x 2,, x n, x n+1,,, x n+m ) = 0, f 2 (x 1, x 2,, x n, x n+1,,, x n+m ) = 0, f n (x 1, x 2,, x n, x n+1,,, x n+m ) = 0 (21) missä (x 1, x 2,, x n ) ovat endogeenisia muuttujia ja (x n+1,, x n+m ) eksogeenisia muuttujia (parametreja) Tämä yhtälöryhmä voidaan esittää myös seuraavasti: f i (x 1, x 2,, x n, x n+1,,, x n+m ) = 0, i = 1,, n (22) Joukkoa A, josta eksogeeniset muuttujat (x n+1,, x n+m ) voidaan valita, sanotaan systeemin määrittelyjoukoksi (domain) Tällöin merkitään (x n+1,, x n+m ) A
11 Jotta yhtälöryhmä (21) tai (22) ratkeaisi, siinä täytyy olla sama määrä n endogeenisia muuttujia kuin yhtälöitä Jos yhtälöitä on enemmän kuin muuttujia, systeemiä sanotaan ylideterminoituvaksi, ja jos yhtälöitä on vähemmän kuin muuttujia, niin sitä sanotaan alideterminoituvaksi Tasapainomalli ei saa olla yli- eikä alideterminoituva! Mikäli yhtälöryhmällä (21) tai (22) on olemassa yksikäsitteinen ratkaisu (unique solution) ja kaikki funktiot f i (i = 1,, n) ovat (osittais)derivoituvia kaikkien muuttujien x j (j = 1,, n + m) suhteem, niin silloin se määrittelee endogeeniset muuttujat (x 1, x 2,, x n ) eksogeenisten muuttujien (x n+1,,, x n+m ) derivoituvina funktioina seuraavasti: x 1 = X 1 (x n+1,,, x n+m ), x 2 = X 2 (x n+1,,, x n+m ), Tämä voidaan kirjoittaan myös seuraavasti: x n = X n (x n+1,,, x n+m ), (23) x i = X i (x n+1,,, x n+m ), i = 1,, n (24) Funktioita (23) tai (24) sanotaan systeemin (21) tai (22) ratkaisufunktioiksi Yhtälöryhmää (23) tai (24) sanotaan myös systeemin (21) tai (22) staattiseksi ratkaisuksi Mikäli yhtälöryhmällä (21) tai (22) on olemassa monta ratkaisua, sanotaan, että sillä on monikäsitteinen ratkaisu (multiple solution) Tällöin ollaan vaikea ongelman edessä Mallilla ei nimittäin voida ennustaa, jos ei tiedetä, mihin tasapainoon se hakeutuu Taloudellisissa malleissa tämän yleensä kierretään, joko osoittamalla että vain yksi tasapainoista on stabiili, tai rajoittamalla systeemin määrittelyjoukkoa A niin, että vain yksi tasapaino on mahdollinen 23 Implisiittifunktioteoreema Sen perusteella mitä tiedetään funktioiden f i ominaisuuksista systeemissä (22), voidaan päätellä jotakin myös ratkaisufunktioiden X i ominaisuuksista relaatiossa (24) Matemaattisesti tätä voidaan selvittää seuraavan teoreeman avulla Implisiittifunktioteoreema (implicit function theorem) Oletetaan, että jokaisella funktiolla f i (i = 1,, m) on olemassa kaikki osittaisderivaatat f i / x k = 0, kun k = 1,, n + m Jos eksogeenisten muuttujien x n+1,, x n+m muutokset ovat pieniä, niin silloin systeemin (22) tasapainon muutokselle pätee n+m k=1 f i (x 1,, x n+m ) x k dx k = 0; i = 1,, n, missä dx k kuvaa muuttujan x k tasapainoarvon muutosta
12 Todistus (heuristinen): Oletetaan, että alkutilanteessa systeemi on tasapainossa, jossa muuttujien (x 1,,, x n+m ) arvot ovat (x o 1,, x o n+m) Tällöin tietysti pätee f i (x o 1,, x o n+m) = 0, i = 1,, n (25) Oletetaan edelleen, että joku tai jotkin parametreista x n+1,, x n+m muuttuu hieman, jolloin koko systeemi liikahtaa alkupisteestä (x o 1,, x o n+m) uuteen tasapainopisteeseen (x 1,,, x n+m ), jossa (22) on voimassa Otetaan nyt funktiosta f i (x 1,,, x n+m ) pisteen (x o 1,, x o n+m) suhteen Taylorin kehitelmä: f i (x 1,,, x n+m ) = f i (x o 1,, x o n+m) n+m + + 1 2 k=1 n+m k=1 + 1 2 3 f i (x o 1,, x o n+m) x k (x k x o k) n+m h=1 n+m n+m k=1 2 f i (x o 1,, x o n+m) x k x h (x k x o k)(x h x o h) h=1 n+m s=1 3 f i (x o 1,, x o n+m) x k x h x s (x k x o k)(x h x o h)(x s x o s) (26) Sijoittamalla (22) and (25) yhtälöön (26) saadaan 0 = n+m k=1 + 1 2 + 1 6 f i (x o 1,, x o n+m) x k (x k x o k) n+m k=1 k=1 n+m h=1 n+m n+m n+m h=1 2 f i (x o 1,, x o n+m) x k x h (x k x o k)(x h x o h) s=1 3 f i (x o 1,, x o n+m) x k x h x s (x k x o k)(x h x o h)(x s x o s) (27) Oletetaan vielä että parametrien x n+1,, x n+m muutos on pieni, jolloin kaikkien muuttjien muutokset dx j = x j x o j (j = 1,, n + m) jäävät pieniksi Tällöin x j x o j, toisen ja useamman kertaluvun tulotermit (x k x o k)(x h x o h), (x k x o k)(x h x o h)(x s x o s), jne tulevat niin pieniksi, että ne voidaan pyöristää nolliksi Sijoittamalla tämä tulos, dx j = x j x o j (i = 1,, n + m) ja x j x o j (i = 1,, n + m) yhtälöön (27) saadaan n+m 0 (x k x o k) f n+m i (x o x 1,, x o f i n+m) = (x o k x 1,, x o n+m)dx k k k=1 n+m f i (x 1,, x n+m )dx k (28) x k k=1 k=1
13 24 Sovellus: yksi endogeeninen muuttuja Tarkastellaan yhtälöä f(x, a 1,, a m ) = 0, (a 1,, a m ) A, (29) jossa f(x, a 1,, a m ) on derivoituva funktio, x endogeeninen muuttuja, (a 1,, a m ) eksogeenisia muuttujia ja A on systeemin määrittelyjoukko Jos yhtälöllä (29) on olemassa ratkaisu, niin se on muotoa [vrt (23)] x = X(a 1,, a m ), (a 1,, a m ) A, (210) missä X(a 1,, a m ) on derivoituva funktio Mitkä ovat funktion X ominaisuudet? Seurauslause: Oletetaan, että f x 0 Ratkaisufunktion (210) derivaatat voidaan johtaa ottamalla ensiksi funktiosta (29) kokonaisdifferentiaali (totally differentiating (29)) f m x dx + f da k = 0, (211) a k k=1 dx ja sitten ratkaisemalla tästä suhdeluvut da k seuraavasti: X = dx = f / f, k = 1,, m a k da k a k x Todistus (heuristinen): Sijoitetaan ratkaisu (210) funktioon (29), jolloin saadaan f ( X(a 1,, a m ), a 1,, a m ) = 0 Jos tämän yhtälön vasen puoli f(x(a), a) on yhtä kuin nolla, niin silloin sen derivaattakin muuttujan a k suhteen on nolla: df = f X + f = 0 da k x a k a k Tästä saadaan funktion X derivaatta muuttujan a k suhteen seuraavasti: X = a k f a k f x (212) Sovelletaan nyt implisiittifunktioteoreemaa yhtälöön (210): dx = m k=1 X a k da k
14 Sijoittamalla tähän (212) kaikilla k:lla saadaan dx = m k=1 Kerrotaan molemmin puolin termillä f x : f a k da f k x f m x dx = f da k a k Hieman järjestelemällä nähdään että (211) pitää paikkansa, kun a A: k=1 m f x dx + f da k = 0 a k k=1 241 Esimerkki 1 Asetetaan Osoitettava, että yhtälö a 2 e x 2x + a = 0 määrittelee muuttujan x muuttujan a funktiona pisteen (x, a) = (0, 1) läheisyydessä Määrättävä tämän funktion derivaatta, kun a = 1 f(x, a) = a 2 e x 2x + a f a (x, a) = 2ae x + 1 f x (x, a) = a 2 e x 2 Havaitaan ensiksi, että f(0, 1) = ( 1) 2 1 = 0, joten f(x, a) määrittelee muuttujan x muuttujan a funktiona pisteen (x, a) = (0, 1) läheisyydessä Koska f x (0, 1) = ( 1) 2 2 = 1 0, ratkaisufunktion osittaisderivaatta voidaan laskea seurauslauseen avulla Näin ollen 242 Esimerkki 2 0 = f x (0, 1)dx + f a (0, 1)da = dx da dx = ( 1)/( 1) = 1 da Kuluttajan teoriassa indifferenssikäytä on hyötyfunktion tasokäyrä: U(x 1, x 2 ) = U 0, missä U 0 > 0 on vakiohyötytaso ja x 1 ja x 2 ovat hyödykkeiden 1 ja 2 kulutetut määrät Indifferenssikäyrän kulmakerroin (x 1, x 2 )-koordinaatistossa, MRS x1,x 2,
15 saadaan kokonaisdifferentiaalin avulla seuraavasti: U(x 1, x 2 ) U 0 = 0 U(x 1, x 2 ) dx 1 + U(x 1, x 2 ) dx 2 = 0 x 1 x 2 dx 2 = U(x / 1, x 2 ) U(x1, x 2 ) dx 1 x 1 x 2 dx 2 MRS x1,x 2 = dx 1 = U(x / 1, x 2 ) U(x1, x 2 ) x 1 x 2 Pisteessä (x o 1, x o 2) indifferenssikäyrän kulmakerroin määräytyy seuraavasti: Rajasubstituutioaste (marginal rate of substitution) MRS x1,x 2 pisteessä (x o 1, x o 2) kertoo, kuinka paljon enemmän hyödykkeen 2 kulutuksen x 2 täytyy nousta tasolta x o 2, jotta hyötytaso pysyisi vakiona silloin kun hyödykkeen 1 kulutus x 1 putoaa yhdellä yksiköllä tasolta x o 1 243 Esimerkki 3 Tuottajan teoriassa samatuotoskäyrä määritellään F (K, L) = Y 0, missä Y = F (K, L) on tuotantofunktio, Y tuotos, K pääoma, L työ ja Y 0 vakiotuotos Nyt samatuotoskäyrän kulmakerroin (K, L)-koordinaatistossa, MRT KL,
16 saadaan kokonaisdifferentiaalin avulla seuraavasti: F (K, L) Y 0 = 0 F K (K, L)dK + F L (K, L)dL = 0 dl dk = F K(K, L) F L (K, L) dl MRT KL = dk = F K(K, L) F L (K, L) Pisteessä (K o, L o ) samatuotoskäyrän kulmakerroin määräytyy seuraavasti: Rajamuunnosaste (marginal rate of transformation) MRT KL pisteessä (K o, L o ) kertoo, kuinka paljon enemmän työpanoksen L täytyy nousta tasolta L o, jotta tuotannon taso Y pysyisi vakiona silloin kun pääoman K määrä laskee yhdellä yksiköllä tasolta K o Cobb-Douglas funktion Y = F (K, L) = AK α L 1 α (α ja A vakioita) tapauksessa saadaan MRT KL = F K(K, L) F L (K, L) = αakα 1 L 1 α (1 α)ak α L α = α 1 α CES-funktion Y = F (K, L) = [δk 1 1/σ + (1 δ)l 1 1/σ] σ/(σ 1) tapauksessa saadaan δ ja σ vakioita, 0 < δ < 1, σ > 0, σ 1 MRT KL = F K(K, L) F L (K, L) = δ(y/k)1/σ (1 δ)(y/l) = δ 1/σ 1 δ L K ( ) 1/σ L K
17 244 Esimerkki 4 Olkoon Y kansantulo, C kulutus ja I inveastoinnit Kulutusfunktio on C = c(y ), 0 < c < 1, missä c on rajakulutusalttius Tasapainossa kaikki tulot joko kulutetaan tai investoidaan: Y = C + I = c(y ) + I (213) Millainen kerroinvaikutus on investoinneilla I? Yhtälö (213) määrittelee kansantulon Y investointien funktiona Sen kokonaisdifferentiaali on dy = c (Y )dy + di Tästä ratkaistaan Keynesin-Kahnin kerroin: dy di = 1 1 c (Y ) > 1 Tulotaso nousee enemmän kuin investoinnit (dy/di>1) ja määrällä 1/(1-rajakulutusalttius) 25 Sovellus: useita endogeenisia muuttujia Tarkastellaan yhtälöryhmää f i (x 1,, x n, a 1,, a m ) = 0, (a 1,, a m ) A, i = 1,, n, (214) jossa f i (x 1,, x n, a 1,, a m ) on derivoituvia funktioita (i = 1,, n), (x 1,, x n ) endogeenisia muuttujia, (a 1,, a m ) eksogeenisia muuttujia ja A on systeemin määrittelyjoukko Jos yhtälöllä (214) on olemassa ratkaisu, niin se voidaan ilmaista yhtälöryhmänä seuraavasti [vrt (23)] x h = X h (a 1,, a m ), (a 1,, a m ) A, h = 1,, n, (215) missä X h (a 1,, a m ) ovat derivoituvia funktioita Mitkä ovat funktioiden X h ominaisuudet? Seurauslause: Oletetaan, että funktioden f 1,, f n Jakobin determinantti endogeenisten muuttujien suhteen on nollasta eroava: f 1 f 1 f x D = 1 x 2 1 x n f 2 f 2 f x 1 x 2 2 x n 0 f n x 2 f n x 1 f n x n
18 Tällöin ratkaisufunktion (215) derivaatat voidaan johtaa ottamalla ensiksi funktioista (214) kokonaisdifferentiaalit n h=1 f i x h dx h + m k=1 f i a k da k = 0, i = 1,, n, (216) ja sitten ratkaisemalla suhdeluvut dx h da k käsittelemällä yhtälöitä (216) lineaarisena yhtälöryhmänä, jossa muutokset dx 1,, dx n ovat endogeenisia muuttujia, f muutokset da 1,, da m ovat eksogeenisia muuttujia, ja kertoimet i x h ja fi a k ovat vakioita Todistus (heuristinen): Soveltamalla implisiittifunktioteoreemaa yhtälöön (215) saadaan dx h = m k=1 Sijoitetaan ratkaisu (215) funktioon (214), jolloin saadaan X h a k da k (217) f i ( X1 (a 1,, a m ),, X n (a 1,, a m ), a 1,, a m ) = 0 Jos tämän yhtälön vasen puoli on yhtä kuin nolla, niin silloin sen derivaattakin muuttujan a k suhteen on nolla: 0 = n i=1 df i da k = n h=1 f i X h + f i x h a k a k Kerrotaan tämä termillä da k ja summataan yli k = 1,, m: 0 = m n k=1 h=1 f i x h X h a k da k + m k=1 f i a k da k = Sijoittamalla tähän (217) saadaan (216): n h=1 f i x h m k=1 X h a k da k + m k=1 f i a k da k 0 = n h=1 f i x h m X h da k + a k k=1 }{{} dx h m k=1 f i a k da k = n h=1 f i x h dx h + m k=1 f i a k da k Kirjoitetaan yhtälöryhmä (216) matriisimuotoon: f 1 f 1 f x 1 x 2 1 f 1 f 1 f x n dx 1 a f 2 f 2 f x 1 x 2 2 x n dx 2 1 a 2 1 a m f + 2 f 2 f a 1 a 2 2 a m f n x 2 dx f n n a 2 f n x 1 f n x n f n a 1 f n a m da 1 da 2 da m = 0
19 Tästä saadaan Cramerin säännön avulla, että f 1 f 1 f x 1 x 2 1 f 1 f 1 f x k 1 a k x k+1 1 x m f 2 f 2 f x 1 x 2 2 f 2 f 2 f x k 1 a k x k+1 2 x m m f n f n f x dx h = 1 x 2 n f n f n f x k 1 a k x k+1 n x m f 1 f 1 f k=1 x 1 x 2 1 x n f 2 f 2 f x 1 x 2 2 x n f n x 2 f n x 1 f n x 1 f n x n Tämä yhtälö voidaan kirjoittaa osittaisderivaattoina seuraavasti: f 1 f 1 f x 1 x 2 1 f 1 f 1 f x k 1 a k x k+1 1 x m f 2 f 2 f x 1 x 2 2 f 2 f 2 f x k 1 a k x k+1 2 x m x f n f n f h x = 1 x 2 n f n f n f x k 1 a k x k+1 n x m a k f 1 f 1 f x 1 x 2 1 x n f 2 f 2 f x 1 x 2 2 x n f n x 2 h = 1,, n, k = 1,, m f n x n da k, 251 Esimerkki Tarkastellaan Hicksin-Hansenin ISLM mallia: L(r, Y ) = M/P, L r < 0, L Y > 0, (218) I = f(r), f (r) < 0, (219) S = s(y ), 0 < s (Y ) < 1, (220) I = S, (221) missä r on korko, Y tulotaso, S säästäminen ja I investoinnit ovat endogeenisia, ja M rahamäärä ja P hintataso ovat eksogeenisia muuttujia Yhtälö (218) sanoo, että rahan reaalinen kysyntä L, joka on koron r laskeva ja tulotason Y nouseva funktio, on yhtä kuin rahan reaalinen tarjonta eli nimellinen rahamäärä M jaettuna hintatasolla Yhtälö (219) sanoo, että investoinnit ovat koron laskeva funktio Yhtälö (220) on säästämisfunktio Yhtälö (221) sanoo, että hyödykemarkkinat ovet tasapainossa silloin kun investoinnit I on yhtä kuin säästäminen S
20 Mitä tapahtuu korolle ja tulotasolle, jos keskuspankki lisää rahamäärää M? Kirjoitetaan systeemi (218)-(221) kahdeksi yhtälöksi L(r, Y ) M/P = 0, f(r) s(y ) = 0 Muodostetaan näistä yhtälöistä kokonaisdifferentiaalit: ( M ) L r (r, Y )dr + L Y (r, Y )dy d = 0, P f (r)dr s (Y )dy = 0 Kirjoitetaan nämä matriisimuotoon: ( ) ( Lr L Y dr f s dy ) ( 1 + 0 ) ( M ) d = 0 P Koska Jacobin determinantti on nollasta eroava, D = L r L Y f s = L r }{{}}{{} s f L }{{}}{{} Y + + seurauslauseen avulla on saatavissa ratkaisu: dr ( ) = 1 d D 1 L Y 0 s = M P M P 1 }{{} D + dy ( ) = 1 d D L r 1/P f 0 = s }{{} + 1 }{{} D + f }{{} > 0, < 0, > 0 Reaalisen rahamäärän M P lisäys nostaa tulotasoa Y ja laskee korkotasoa r
21 3 Usean muuttujan funktion optimoinnista 31 Rajoittamaton optimointi Tarkastelemme differtioituvaa useamman muuttujan funktiota y = f(x 1,, x n ), (x 1,, x n ) A, (31) missä A on muuttujien määrittelyjoukko Merkitään yksikertaisuuden vuoksi funktion (31) osittaisderivaattoja seuraavasti: f i = f x i, f ij = f x i x j, i = 1,, n; j = 1,, n Funktion (31) Hessin determinantti oletetaan nollasta eroavaksi: f 11 f 12 f 1n f 21 f 22 f 2n 0 (32) f n1 f n2 f nn Huomautus Funktion f(x 1,, x n ) toisen tai useamman asteen osittaisderivaatat voidaan muodostaa derivoimalla tämä funktio muuttujien x i suhteen missä järjestyksessä tahansa Näin ollen esim 2 f f ij = = 2 f = fji, f ijk = f ikj = f kij = f jik = f ikj = f kji x i x j x j x i Määritelmä (a) Funktiolla (31) on yksikäsitteinen globaali maksimi (unique global maximum) pisteessä (x 1,, x n) A, jos f(x 1,, x n) > f(x 1,, x n ) kaikilla A:han kuuluvilla pisteillä (x 1,, x n ) (x 1,, x n), ja yksikäsitteinen globaali minimi (unique global minimum) pisteessä (x 1,, x n) A, jos f(x 1,, x n) < f(x 1,, x n ) kaikilla A:han kuuluvilla pisteillä (x 1,, x n ) (x 1,, x n) (b) Funktiolla (31) on yksikäsitteinen lokaali maksimi (unique local maximum) pisteessä (x 1,, x n) A, jos f(x 1,, x n) > f(x 1,, x n ) kaikilla A:han kuuluvilla pisteillä, jotka ovat pisteen (x 1,, x n) lähiympäristössä, ja yksikäsitteinen lokaali minimi (unique local minimum) pisteessä (x 1,, x n) A, jos f(x 1,, x n) < f(x 1,, x n ) kaikilla A:han kuuluvilla pisteillä, jotka ovat pisteen (x 1,, x n) lähiympäristössä Pisteen (x 1,, x n ) A sanotaan oevan määrittelyjoukon A reunalla, jos sen ympärillä joka puolella ei ole joukon A pisteitä Tarkastellaan esimerkiksi lukuja 0 x 100 Tässä joukossa piste x on reunalla, jos x = 0 tai x = 100, mutta sisällä, jos 0 < x < 100 Määritelmä Jos maksimi/minimi on määrittelyjoukon A reunalla, niin sitä sanotaan reunamaksimiksi/reunaminimiksi (boundary maximum/minimum) Jos
22 maksimi (minimi) on määrittelyjoukon A sisällä, niin sitä sanotaan sisämaksimiksi/sisäminimiksi (interior maximum/minimum) Yksikäsitteinen globaali optimi (maksimi tai minimi) voidaan löytää seuraavan teoreeman avulla Sen todistus perustuu neliömuotoihin, mutta sivuutetaan tällä kurssilla Teoreema 1 (a) Funktiolla (31) on yksikäsitteinen lokaali sisämaksimi pisteessä (x 1,, x n) silloin ja vain silloin kun 1 f i = 0 kaikilla i = 1,, n (ensimmäisen asteen ehdot), 2 Hessin determinantin (32) pääminoreilla on vaihtuvat etumerkit seuraavasti (toisen asteen ehdot): f 11 < 0, f 11 f 12 f 21 f 22 > 0, f 11 f 12 f 13 f 21 f 22 f 23 < 0, (33) f 31 f 32 f 33 f 11 f 12 f 1n, f 21 f 22 f 2n > 0, kun n on parillinen (34) < 0, kun n on pariton f n1 f n2 f nn (b) Funktiolla (31) on yksikäsitteinen lokaali sisäminimi pisteessä (x 1,, x n) silloin ja vain silloin kun 1 f i = 0 kaikilla i = 1,, n (ensimmäisen asteen ehdot), 2 Hessin determinantin (32) pääminorit ovat positiivisia (toisen asteen ehdot): f 11 > 0, f f 11 f 12 f 1n 11 f 12 f 21 f 22 > 0,, f 21 f 22 f 2n > 0 (35) f n1 f n2 f nn Huom! Edellinen teoreema pätee vaikka muuttujat x 1,, x n pantaisiin eri järjestykseen Näin ollen jos toisen asteen ehdot saadaan täyttymään jollakin järjestyksellä, niin silloin lokaali optimi on yksikäsitteinen Edelläolevassa teoreemassa ehto (34) on yhtäpitävä sen kanssa että funktio (31) on aidosti konkaavi, ja ehto (35) yhtäpitävä sen kanssa että funktio (31) on aidosti konveksi 311 Esimerkki Tarkastellaan funktiota y = f(x 1, x 2, x 3 ) = 2x 2 1 + x 2 2 + 3x 2 3 4x 1 6x 2 6x 3, (x 1, x 2, x 3 ) R 3 (36)
23 Ensimmäisen asteen ehdot ovat f 1 = 4x 1 4 = 0, f 2 = 2x 2 6 = 0, f 3 = 6x 3 6 = 0 Näistä saadaan ratkaisut x 1 = 1, x 2 = 3 and x 3 = 1 Pääminorit 1 asteen ehdot toteuttavassa pisteessä (1, 3, 1) ovat f 11 = 4 > 0, f 11 f 12 f 12 f 22 = 4 0 0 2 = 8 > 0, f 11 f 12 f 13 f 12 f 22 f 23 f 13 f 23 f 33 = 4 0 0 0 2 0 = 48 > 0 0 0 6 Koska nämä kaikki ovat positiivisia, funktiolla (36) on yksikäsitteinen lokaali minimi pisteessä (1, 3, 1) 32 Optimointi yhden yhtälön rajoittamana Tarkastelemme nyt funktion (31) optimointia (maksimointia tai minimointia), kun rajoitteena on yhtälö g(x 1, x 2,, x n ) = 0 (37) jossa g on differentioituva funktio Merkitään yksikertaisuuden vuoksi funktion (37) osittaisderivaattoja seuraavasti: g i = g x i, g ij = g x i x j, i = 1,, n; j = 1,, n Rajoitteella (37) ei ole mitään merkitystä, jos ei ole olemassa edes yhtä endogeenista muuttujaa, josta funktio g(x 1, x 2,, x n ) on riippuvainen Jotta toisen asteen ehdot voitaisiin kirjoittaa mahdollisimman yksinkertaiseen muotoon, oletetaan g 1 0 Muissa suhteissa endogeenisten muuttujien järjestyksellä ei ole väliä Suoraviivaisin tapa on ratkaista rajoitteesta (37) jokin muuttujista (esim x 1 ) muiden muuttujien (esim x 2,, x n ) funktiona: x 1 = X(x 2,, x n ) (38) Jos ratkaisua (38) ei löydy eksplisiittisesti, niin sen voi etsiä implisiittisesti komparatiivisen statiikan avulla [ks moniste "Komparatiivinen statiikka", tämä luentosarja] Sijoittamalla (38) saadaan maksimoitava funktio (31) muotoon y = f ( X(x 2,, x n ), x 2,, x n ) (39) Funktio (39) voidaan nyt maksimoida ilman rajoitetta Tässä voidaan menetellä samalla tavalla kuin kappaleessa 31
24 Joissakin taloudellisissa sovelluksissa ratkaisun (38) muodostaminen ei ole tarkoituksenmukaista, koska se voi esimerkiksi tehdä mallin hankalammin tulkittavaksi Tällöin joudutaan edellä esitellyn sijoitusmenetelmän sijasta käyttämään Lagrangen menetelmää, jonka esittelyyn käytämme tämän kappaleen loppuosan Funktion (31) optimointi rajoitteena (37) voidaan kääntää optimoinniksi ilman rajoitetta muodostamalla Lagrangen funktio L(x 1,, x n, x n+1 ) = f(x 1,, x n ) + x n+1 g(x 1,, x n ), (310) missä x n+1 on Lagrangen kerroin Merkitään yksikertaisuuden vuoksi funktion (310) osittaisderivaattoja seuraavasti: L i = L x i, L ij = L x i x j, i = 1,, n + 1; j = 1,, n + 1 Lagrangen funktiota (310) maksimoidaan nyt muuttujien (x 1,, x n+1 ) avulla ilman rajoitetta Tässä voidaan menetellä pienin muutoksen samalla tavoin kuin kappaleessa 31 Rajoitettu Hessin determinantti on muotoa = L 11 L 12 L 1n L 1,n+1 L 21 L 22 L 2n L 2,n+1 L n1 L n2 L nn L n,n+1 L n+1,1 L n+1,2 L n+1,n L n+1,n+1 L 11 L 12 L 1n g 1 L 21 L 22 L 2n g 2 L n1 L n2 L nn g n g 1 g 2 g n 0 = 0 g 1 g 2 g n g 1 L 11 L 12 L 1n g 2 L 21 L 22 L 2n g n L n1 L n2 L nn (311) (312) Teoreema 2 (a) Funktiolla (31) on yksikäsitteinen lokaali sisämaksimi rajoitteena (37) pisteessä (x 1,, x n) silloin ja vain silloin kun 1 L i = 0 kaikilla i = 1,, n (ensimmäisen asteen ehdot), 2 Rajoitetun Hessin determinantin (312) pääminoreilla on vaihtuvat etumerkit seuraavasti (toisen asteen ehdot): 0 g 1 g 2 0 g 1 g 2 g 3 g 1 L 11 L 12 g 1 L 12 L 22 > 0, g 1 L 11 L 12 L 13 g 2 L 12 L 22 L 23 < 0, g 3 L 13 L 23 L 33 0 g 1 g 2 g n g 1 L 11 L 12 L 1n, g 2 L 12 L 22 L 2n > 0, kun n on parillinen < 0, kun n on pariton g 3 L n3 L n3 L nn
25 (b) Funktiolla (31) on yksikäsitteinen lokaali sisäminimi rajoitteena (37) pisteessä (x 1,, x n) silloin ja vain silloin kun 1 L i = 0 kaikilla i = 1,, n (ensimmäisen asteen ehdot), 2 Rajoitetun Hessin determinantin (312) pääminorit ovat negatiivisia (toisen asteen ehdot): 0 g 1 g 2 0 g 1 g 2 g 3 g 1 L 11 L 12 g 1 L 12 L 22 < 0, g 1 L 11 L 12 L 13 g 2 L 12 L 22 L 23 < 0, g 3 L 13 L 23 L 33 0 g 1 g 2 g n g 1 L 11 L 12 L 1n, g 2 L 12 L 22 L 2n < 0 g 3 L n3 L n3 L nn 321 Esimerkki 1 Etsi funktion y = xz ääriarvo rajoitteena x + z = 8 Ratkaistaan tämä ongelma ensiksi sijoitusmenettelyllä Ratkaistaan rajoite muotoon z = 8 x ja sijoitetaan tavoitefunktioon, jolloin saadaan Ensimmäisen ja toisen asteen ehdoista y(x) = x(8 x) dy d = 8 2x = 0, dx 2 y = 2 < 0 dx2 nähdään, että funktiolla on annetuissa rajoissa maksimi pisteessä x = 8 2 = 4 Funktion maksimiarvo on y(4) = 4 2 = 16 Seuraavaksi ratkaistaan sama Lagrangen menetelmällä Muodotetaan Lagrangen funktio L(x, z, λ) = xz + λ[8 x z], missä λ on Lagrangen kerroin Ensimmäisen asteen ehdot: L x = z λ = 0, L z = x λ = 0, L λ = 8 x z = 0 Näistä saadaan x = z = λ = 8 2 = 4 Muodostetaan rajoitettu Hessin determinantti: 2 L 2 L 2 L λ 2 λ x λ z 2 L 2 L 2 L 0 1 1 = x λ x 2 x z 1 0 1 2 L 2 L 2 L 1 1 0 z λ z x z 2 = ( 1) 1+2 ( 1) 1 1 1 0 + ( 1)1+3 ( 1) 1 0 1 1 = 1 + 1 = 2 > 0
26 Koska tämä on positiivinen, niin ääriarvo x = z = 4 on maksimi 322 Esimerkki 2 Optimoidaan funktiota rajoitteena y = f(x 1, x 2, x 3 ) = x 2 1 + x 2 2 + x 2 3 2x 1 2x 2 2x 3 2x 1 x 2 x 3, (x 1, x 2, x 3 ) R 3, (313) Tämän ongelman Lagrangen funktio on g(x 1, x 2, x 3 ) = x 1 + x 2 + x 3 9 = 0 (314) L(x 1, x 2, x 3, x 4 ) = x 2 1 + x 2 2 + x 2 3 2x 1 2x 2 2x 3 2x 1 x 2 x 3 + x 4 [x 1 + x 2 + x 3 9] (315) Ensimmäisen asteen ehdot ovat L 1 = 2x 1 2 2x 2 x 3 x 4 = 0, L 2 = 2x 2 2 2x 1 x 3 x 4 = 0, L 3 = 2x 3 2 2x 1 x 2 x 4 = 0, L 4 = x 1 + x 2 + x 3 9 = 0 Tästä saadaan ratkaisu x 1 = x 2 = x 3 = 3 Rajoitettu Hessin determinantti ensimmäisen asteen ehdot toteuttavassa pisteessä (3, 3, 3) on muotoa 0 g 1 g 2 g 3 g 1 L 11 L 12 L 13 g 2 L 12 L 22 L 23 g 3 L 13 L 23 L 33 = 192 < 0 = 0 1 1 1 1 2 2x 3 2x 2 1 2x 3 2 2x 1 1 2x 2 2x 1 2 = 0 1 1 1 1 2 6 6 1 6 2 6 1 6 6 2 Sen pääminori on 0 1 1 1 2 6 1 6 2 = 16 < 0 Koska molemmat determinantit ovat negatiivisia, funktiolla (313) on yhtälön (314) antamissa rajoissa minimi pisteessä (3, 3, 3) 323 Esimerkki 3 Kuluttaja valitsee kulutuksensa (c 1, c 2 ) maksimoidakseen hyötyä U(c 1, c 2 ), (c 1, c 2 ) R 2, (316)
27 missä c 1 on hyödykkeen 1 ja c 2 on hyödykkeen 2 kulutus, budjettirajoitteena p 1 c 1 + p 2 c 2 = I, (317) missä p 1 ja p 2 ovat hyödykkeiden 1 ja 2 hintoja ja I tulot Hyötyfunktiolla (316) on tavalliset ominaisuudet 2 U c 2 1 < 0, 2 U c 2 2 < 0, Tämän ongelman Lagrangen funktio on 2 U c 1 c 2 > 0 L(c 1, c 2, λ) = U(c 1, c 2 ) + λ[i p 1 c 1 p 2 c 2 ], (318) missä λ on Lagrangen kerroin Ensimmäisen asteen ehdot ovat L = U p 1 λ = 0, c 1 c 1 L = U p 2 λ = 0, c 2 c 2 Rajoitettu Hessin determinantti on muotoa 0 p 1 p 1 p 2 U 2 U 1 c 2 1 c 1 c 2 = p 2 2 U 2 U 1 p 2 U 2 U }{{} c 2 2 + 2p 1 p 2 }{{} 2 c 1 c c 1 c 2 c 2 }{{} + }{{ 2 } 2 + L λ = I p 1c 1 p 2 c 2 = 0 p 2 2 }{{} 2 U c 2 1 }{{} > 0 Täten hyötyfunktiolla (316) on budjetin (317) rajoissa maksimi Lagrangen funktion (318) maksimiarvoa sanotaan myös epäsuoraksi hyötyfunktioksi V (I, p 1, p 2 ), joka kertoo hyötytason tulojen I ja hintojen funktiona Sillä om sama arvo kuin kuluttajan hyödyllä optimissa: V (I, p 1, p 2 ) = L(c 1, c 2, λ) = U(c 1, c 2) + λ[i p 1 c 1 p 2 c 2] = U(c }{{} 1, c 2), =0, (317) missä c 1 ja c 2 ovat kuluttajan valitsemat optimiarvot kulutukselle c 1 ja c 2 Koska 1 asteen ehtojen nojalla L/ c 1 = L/ c 2 = 0, vaikutuksia c 1:n ja c 2:n kautta ei tarvitse ottaa huomioon Koska V/ I = λ, Lagrangen kerrointa λ voidaan pitää tulon rajahyötynä yksi euro tuloihin I lisää hyötytasoa λ:n verran Klassinen tulos: Epäsuoran hyötyfunktion derivaatta hyödykkeen i hinnan p i suhteen on sama kuin minus kuluttajan rajahyöty λ kertaa saman hyödykkeen i kulutus c i : 324 Esimerkki 4 V/ p i = λc i = λc i Olkoon tuotantokustannukset wl + rk ja tuotantofuntio Y = F (K, L), missä Y tuotos, L työ, K pääoma, w palkka ja r korko (lopputuoteen hinta on valittu ykköseksi) Tuottaja minimoi kustannuksiaan wl + rk valitsemalla panoksensa K ja L siten, että tuotanto Y pidetään annetulla tasolla: F (K, L) = Y
28 Tämän ongelman Lagrangen funktion on Q(K, L, w, r, Y ) = wl + rk + µ[y F (K, L)], (319) missä µ on Lagrangen kerroin Emsimmäisen asteen ehdot ovat Q K = r µf K(K, L) = 0, Q L = r µf L(K, L) = 0, (320) missä F K = L/ K ja FL = L/ L Lagrangen funktion (319) minimiarvoa sanotaan (kokonais) kustannusfunktioksi: C(w, r, Y ) = Q(K, L, w, r, Y ) = wl + rk + µ[y F (K, L )], (321) missä K ja L ovat pääoman ja työn optimiarvot Koska 1 asteen ehtojen nojalla Q/ L = Q/ K = 0, vaikutuksia K :n ja L :n kautta ei tarvitse ottaa huomioon Koska C/ Y = µ, Lagrangen kerrointa µ voidaan pitää rajakustannuksina yksi yksikkö tuotantoa Y lisää kustannuksia µ yksikköä Klassinen tulos: Kustannusfunktion derivaatta panoksen L (K) hinnan w (r) suhteen on tämän panoksen kysyntä L (K): C w = L = L, C r = K = K 33 Optimointi monen yhtälön rajoittamana Edellisessä kappaleessa esitelty teoria optimoinnista yhden yhtälön rajoittamana voidaan yleistää koskemaan optimointia, jossa rajoittavia yhtälöitä on mielivaltainen määrä m: g h (x 1, x 2,, x n ) = 0, h = 1,, m, (322) jossa g h on differentioituva funktio Merkitään yksikertaisuuden vuoksi funktioiden (322) osittaisderivaattoja seuraavasti: g h i = gh x i, g h ij = gh x i x j, i = 1,, n, j = 1,, n, h = 1,, m < n Oletetaan, että rajoitteiden (322) Jacobin determinantti m;n ensimmäisen endogeenisen muuttujan suhteen on nollasta eroava: g1 1 g2 1 g 1 n g1 2 g2 2 gn 2 0 (323) g1 n g2 n gn n Tämä takaa sen, että kaikilla rajoitteilla on optimoinnin kannalta jotain merkitystä Endogeenisten muuttujien järjestys voidaan vapaasti valita edellyttäen, että (323) pysyy voimassa
29 Suoraviivaisin tapa on ratkaista rajoitteesta (322) m muuttujaa (esim x 1,, x m ) muiden muuttujien (esim x m+1,, x n ) funktiona: x h = X h (x m+1,, x n ), h = 1,, m (324) Jos ratkaisua (324) ei löydy eksplisiittisesti, niin sen voi etsiä implisiittisesti komparatiivisen statiikan avulla [ks moniste "Komparatiivinen statiikka", tämä luentosarja] Sijoittamalla (324) saadaan (31) muotoon y = f ( X 1 (x m+1,, x n ),, X m (x m+1,, x n ), x m+1,, x n ) (325) Funktio (325) voidaan nyt maksimoida ilman rajoitetta Tässä voidaan menetellä samalla tavalla kuin kappaleessa 31 Vaihtoehtoisesti voidaan käyttää Lagrangen menetelmää seuraavasti Funktion (31) optimointi rajoitteina (322) voidaan kääntää optimoinniksi ilman rajoitetta muodostamalla Lagrangen funktio L(x 1,, x n+m ) = f(x 1,, x n ) + m x n+h g h (x 1,, x n ), (326) missä x n+1,, x n+m ovat Lagrangen kertoimia Merkitään yksikertaisuuden vuoksi funktion (326) osittaisderivaattoja seuraavasti: h=1 L i = L x i, L ij = L x i x j, i = 1,, n + m; j = 1,, n + m Lagrangen funktiota (326) maksimoidaan nyt muuttujien (x 1,, x n+m ) avulla ilman rajoitetta, samoin kuin kappaleessa 31 Rajoitettu Hessin determinantti on muotoa L 11 L 1,n+m L n+m,1 L n+m,n+m = = 0 0 g 1 1 g 1 n 0 0 g m 1 g m n g 1 1 g m 1 L 11 L 1n g 1 n g m n L n1 L nn L 11 L 1n g1 1 g1 m L n1 L nn gn 1 gn m g1 1 gn 1 0 0 g1 m gn m 0 0 (327) Teoreema 3 (a) Funktiolla (31) on yksikäsitteinen lokaali sisämaksimi rajoitteena (322) pisteessä (x 1,, x n) silloin ja vain silloin kun 1 L i = 0 kaikilla i = 1,, n (ensimmäisen asteen ehdot),
30 2 Rajoitetun Hessin determinantin (327) pääminorilla numero (2m + 1) on sama etumerkki kuin termillä ( 1) m+1, ja siitä eteenpäin etumerkit vaihtuvat niin että pääminorilla numero (2m + s) on sama etumerkki kuin termillä ( 1) m+s (b) Funktiolla (31) on yksikäsitteinen lokaali sisäminimi rajoitteena (322) pisteessä (x 1,, x n) silloin ja vain silloin kun 1 L i = 0 kaikilla i = 1,, n (ensimmäisen asteen ehdot), 2 Rajoitetun Hessin determinantin (327) pääminorit numerosta (2m+1) eteenpäin ovat samaa merkkiä kuin ( 1) m (toisen asteen ehdot) Huom! Kaikki rajoitetun Hessin determinantin (327) pääminorit, joiden jäjestysluku on pienempi kuin (2m + 1), ovat nollia 331 Esimerkki Tarkastellaan kotitaloutta, joka kuluttaa neljää hyödykettä ja maksimoi hyötyfunktiota U(c 1, c 2, c 3, c 4 ), (c 1, c 2, c 3, c 4 ) R 4, (328) missä c i on hyödykkeen i kulutus Funktio (328) oletetaan kahdesti derivoituvaksi Merkitään yksikertaisuuden vuoksi U i = U c i, U ij = U c i c j, i {1, 2, 3, 4}, j {1, 2, 3, 4} Kotitalouden budjettirajoite on p 1 c 1 + p 2 c 2 + p 3 c 3 + p 4 c 4 = I, (329) missä I on tulot ja p i hyödykkeen i hinta Tamperelaisen taloustieteilijän Ilari Tyrnin mukaan hyödykkeiden kuluttaminen ei vie ainoastaan rahaa, vaan myös aikaa Niinpa oletetaan, että kotitalouden aikavaranto Q on yksikköä ja hyödykkeen i kuluttamiseen tarvitaan q i aikayksikköä Tästä tulee kotitaloudelle aikarajoite q 1 c 1 + q 2 c 2 + q 3 c 3 + q 4 c 4 = Q (330) Kotitalous maksimoi hyötyään (328) siten, että sekä budjetti- (329) että aikarajoite (330) ovat yhtä aikaa voimassa Tästä Lagrangen funktio L(c 1, c 2, c 3, c 4, λ, µ) = U(c 1, c 2, c 3, c 4 ) + λ[i p 1 c 1 p 2 c 2 p 3 c 3 p 4 c 4 ] + µ[q q 1 c 1 q 2 c 2 q 3 c 3 q 4 c 4 ],
31 missä Lagrangen kerroin λ voidaan tulkita tulon I ja kerroin µ ajan Q rajahyödyksi Ensimmäisen asteen ehdot ovat L c i = U i λp i µq i = 0, i = 1,, 4, L λ = I p 1c 1 p 2 c 2 p 3 c 3 p 4 c 4 = 0, L µ = Q q 1c 1 q 2 c 2 q 3 c 3 q 4 c 4 = 0 Rajoitettu Hessin determinantti on muotoa 0 0 p 1 p 2 p 3 p 4 0 0 q 1 q 2 q 3 q 4 p 1 q 1 U 11 U 12 U 13 U 14 p 2 q 2 U 21 U 22 U 23 U 24 p 3 q 3 U 31 U 32 U 33 U 34 p 4 q 4 U 41 U 42 U 43 U 44 Toisen asteen ehdot hyödyn maksimoinnille ovat voimassa, jos pääminorilla numero (2 2 + 1) = 5 on sama etumerkki kuin termillä ( 1) 2+1 ja seuraavalla on vastaikkainen etumerkki: 0 0 p 1 p 2 p 3 0 0 q 1 q 2 q 3 p 1 q 1 U 11 U 12 U 13 p 2 q 2 U 21 U 22 U 23 p 3 q 3 U 31 U 32 U 33 < 0, 0 0 p 1 p 2 p 3 p 4 0 0 q 1 q 2 q 3 q 4 p 1 q 1 U 11 U 12 U 13 U 14 p 2 q 2 U 21 U 22 U 23 U 24 p 3 q 3 U 31 U 32 U 33 U 34 p 4 q 4 U 41 U 42 U 43 U 44 34 Optimointi epäyhtälöiden rajoittamana > 0 Tarkastelemme nyt funktion (31) maksimointia, kun rajoitteina ovat epäyhtälöt g h (x 1, x 2,, x n ) 0, h = 1,, m, (331) jossa g h on differentioituva funktio Merkitään yksikertaisuuden vuoksi funktioiden (322) osittaisderivaattoja seuraavasti: g h i = gh x i, g h ij = gh x i x j, i = 1,, n, j = 1,, n, h = 1,, m Tämä ongelma ratkaistaan Kuhnin-Tuckerin menetelmällä seuraavasti Muodostetaan Lagrangen funktio L(x 1,, x n+m ) = f(x 1,, x n ) + m x n+h g h (x 1,, x n ) (332) h=1
32 Merkitään yksikertaisuuden vuoksi funktion (332) osittaisderivaattoja seuraavasti: L i = L x i, L ij = L x i x j, i = 1,, n + m; j = 1,, n + m Ensimmäisen asteen ehdot ovat nyt muotoa L x i = 0, kun i=1,,n, L x i x i = 0 ja x i 0, kun i=n+1,,n+m (333) Muuttujia (x n+1,, x n+m ) koskevia ehtoja sanotaan Kuhnin-Tuckerin ehdoiksi Tämä yleistää näppärästi aikaisemmin opitun teorian: Jos rajoite ei ole sitova, g h (x 1,, x n ) > 0, niin silloin vastaava Lagrangen kerroin on nolla, x n+h = 0 Tällöin optimointi tehdään ikään kuin rajoitetta ei olisikaan (vrt kappale 31) Jos rajoite on sitova, g h (x 1,, x n ) = 0, niin silloin x n+h voi saada nollasta poikkeavia arvoja Tällöin optimointi tehdään kuten yhtälörajoitteen tapauksessa Huom 1 Rajoitteiden g h 0 epäyhtälön suunnan vaihtaminen kääntää Kuhnin- Tuckerin x i 0 epäyhtälöiden suunnan! Jos funktiota (31) maksimoidaan ja rajoitteet ovat (331):n sijasta muotoa g h (x 1, x 2,, x n ) 0, h = 1,, m, (334) niin silloin ensimmäisen asteen ehdot ovat (333):n sijasta muotoa L x i = 0, kun i=1,,n, L x i x i = 0 ja x i 0, kun i=n+1,,n+m (335) Todistus: Kerrotaan rajoitteet (334) ( 1):llä, jolloin saadaan g h (x 1, x 2,, x n ) 0, h = 1,, m (336) Maksimoidaan nyt funktiota (31) rajoitteina (336) Lagrangen funktioksi tulee L(x 1,, x n+m ) = f(x 1,, x n ) + m x n+h [ g h (x 1,, x n )], (337) h=1 jossa x n+1,, x n+m ovat Lagrangen kertoimia Tällöin ensimmäisen asteen ehdoiksi tulee L x i = 0, kun i=1,,n, L x i x i = 0 ja x i 0, kun i=n+1,,n+m (338) Määrittelemällä uudet muuttujat x n+h = x n+h ja sijoittamalla nämä (337):een ja (338):een saadaan Lagrangen funktio (332) ja ensimmmäisen asteen ehdot (335)
33 Huom 2 Maksimoinnin vaihtaminen minimoinniksi kääntää Kuhnin- Tuckerin x i 0 epäyhtälöiden suunnan! Jos funktion (31):n minimoidaan rajoitteena (331), niin silloin ensimmäisen asteen ehdot ovat (333):n sijasta L x i = 0, kun i=1,,n, L x i x i = 0 ja x i 0, kun i=1,,n+m (339) Todistus: Funktion (31):n minimimointi rajoitteena (331) on sama asia kuin funktion f(x 1,, x n ) maksimointi rajoitteena (331) Tätä vastaava maksimoitava Lagrangen funktio on L(x 1,, x n+m ) = f(x 1,, x n ) + m x n+h g h (x 1,, x n ), (340) jossa x n+1,, x n+m ovat Lagrangen kertoimia Tätä vastaavat ensimmäisen asteen ehdot ovat L x i = 0, kun i=1,,n, h=1 Funktion (340) maksimointia vastaa funktion L x i x i = 0 ja x i 0, kun i=n+1,,n+m (341) L(x 1,, x n+m ) = L(x 1,, x n+m ) m = f(x 1,, x n ) + ( x n+h )g h (x 1,, x n ) (342) minimointi Määrittelemällä uudet muuttujat x n+h = x n+h ja sijoittamalla nämä (341):een ja (342):een saadaan Lagrangen funktio (332) ja ensimmmäisen asteen ehdot (339) h=1 Huom 3 rajoitteilla Huomautuksista 1 ja 2 seuraa, että jos funktiota (31) minimoidaan g h (x 1, x 2,, x n ) 0, h = 1,, m, niin silloin ensimmäisen asteen ehdot ovat L x i = 0, kun i=1,,n, 341 Toisen asteen ehdot L x i x i = 0 ja x i 0, kun i=1,,n+m Optimoinnista epäyhtälörajoitteella on vaikea antaa mitään yleipäteviä toisen asteen ehtoja Monissa taloudellisissa malleissa toisen asteen ehtojen olemassaolo taataan seuraavasti: (a) Olkoon tarkoituksena on maksimoida funktiota (31) rajoitteina (331) Tällöin välttämättömät ehdot (333) ovat samalla riittävät ehdot, jos sekä tavoitefunktio (31) että rajoitefunktiot (331) ovat konkaaveja, so jos niiden Hessin determinanttien pääminorit toteuttavat ehdot (34)
34 (b) Olkoon tarkoituksena on minimoida funktiota (31) rajoitteina (331) Tällöin välttämättömät ehdot (333) ovat samalla riittävät ehdot, jos sekä tavoitefunktio (31) että rajoitefunktiot (331) ovat konvekseja, so jos niiden Hessin determinanttien pääminorit toteuttavat ehdot (35) 342 Esimerkki 1 Osoita, että on aivan sama, maksimoidaanko funktiota f(x 1,, x n ) yhtälörajoitteella g(x 1,, x n ) = 0 vai maksimoidaanko sitä epäyhtälörajoitteilla g(x 1,, x n ) 0 ja g(x 1,, x n ) 0, kun f x 1 0 ja g x 1 0 Lagrangen funktio yhtälörajoitteen tapauksessa: Emsimmäisen asteen ehdot: L = f(x 1,, x n ) + λg(x 1,, x n ) L = f + λ g = 0, x i x i x i i = 1,, n, (343) L λ = g(x 1,, x n ) = 0 (344) Lagrangen funktio epäyhtälörajoitteiden tapauksessa: L = f(x 1,, x n ) + λ 1 g(x 1,, x n ) + λ 2 [ g(x 1,, x n )] Emsimmäisen asteen ehdot: = f(x 1,, x n ) + (λ 1 λ 2 )g(x 1,, x n ) L = f + (λ 1 λ 2 ) g = 0, x i x i x i i = 1,, n, (345) L λ 1 = λ 1 g(x 1,, x n ) = 0, λ 1 λ 1 0, (346) L λ 2 = λ 2 g(x 1,, x n ) = 0, λ 2 λ 2 0 (347) Koska f x 1 0 ja g x 1 0, ehdon (345) nojalla jomman kumman muuttujista λ 1 ja λ 2 täytyy olla nollasta eroava Jos λ 1 > 0, niin silloin (346):n mukaan g(x 1,, x n ) = 0, ja jos λ 2 > 0, niin silloin (347):n mukaan g(x 1,, x n ) = 0 Määritellään muuttuja λ = λ 1 λ 2, jolloin ehdot (345) saadaan muotoon (343) Näin ollen g(x 1,, x n ) = 0, ja ehto (344) pitää aina paikkansa Koska molemissa tapauksissa ensimmäisen asteen ehdot ovat täysin samat, ne johtavat täysin samaan tulokseen 343 Esimerkki 2 Minimoitava f(x, y) = x 2 + y 2 rajoitteena x + y 1
35 Lagrangen funktio: L(x, y, λ) = x 2 + y 2 + λ[1 x y] Ensimmäisen asteen ehdot: L x = 2x λ = 0, L y = 2y λ = 0, L λ = [1 x y]λ = 0, λ 0 λ (348) Tarkastellaan erikseen kahta tapausta: rajoittamatonta optimia λ = 0 ja rajoitettua optimia λ > 0 Jos λ = 0, niin silloin (348):n perusteella x = y = 0 Tämä on kuitenkin ristiriidassa rajoitteen x + y 1 kanssa, joten λ = 0 ei ole mahdollista Koska λ > 0, ehdot (348) muuttuvat yhtälörajoitemuotoon: L x = 2x λ = 0, L y = 2y λ = 0, L = 1 x y = 0 (349) λ Tästä kolmen yhtälön yhtälöryhmästä ratkaistaan x = y = 1 2 ja λ = 1 Sijoittamalla takaisin tavoitefunktioon rajoitetuksi minimiksi ( 1 f 2 2), 1 ( 1 ) 2 ( 1 ) 2 1 = + = 2 2 4 + 1 4 = 1 2 (350) Yhtälöiden (349) perusteella L λλ L λx L λy L xλ L xx L xy L yλ L yx L yy = joten (350) on lokaali minimi 344 Esimerkki 3 Maksimoitava 0 1 1 1 2 0 1 0 2 = ( 1) 1+2 ( 1)( 2) + ( 1) 2+2 ( 1)2 = 4 < 0, rajoitteena x + y 50 Lagrangen funktio: f(x, y) = 64x 2x 2 + 4xy 4y 2 + 32y 14 (351) L(x, y, λ) = 64x 2x 2 + 4xy 4y 2 + 32y 14 + λ[50 x y] Ensimmäisen asteen ehdot: L L = 64 4x + 4y λ = 0, = 4x 8y + 32 λ = 0, x y L λ = [50 x y]λ = 0, λ 0 (352) λ
36 Tarkastellaan erikseen kahta tapausta: rajoittamatonta optimia λ = 0 ja rajoitettua optimia λ > 0 Jos λ = 0, niin silloin L x = 64 4x + 4y = 0, L y = 4x 8y + 32 = 0 (353) Näistä ratkaistaan x = 40 ja y = 24 Sijoittamalla takaisin (351):een saadaan rajoittamattomaksi optimiksi f(40, 24) = 1650 (354) Yhtälöiden (352):n perusteella L xx = 4 < 0, L xx L xy L xy L yy = 4 4 4 8 = 32 16 = 16 > 0, joten (354) on lokaali maksimi Jos λ > 0, niin silloin ehdot (352) muuttuvat yhtälörajoitemuotoon: L L = 64 4x + 4y λ = 0, = 4x 8y + 32 λ = 0, x y L = 50 x y = 0 (355) λ Tästä kolmen yhtälön yhtälöryhmästä ratkaistaan x = 316, y = 184 ja λ = 112 Sijoittamalla takaisin (351):een saadaan rajoitetuksi maksimiksi Yhtälöiden (355) perusteella L λλ L λx L λy L xλ L xx L xy L yλ L yx L yy = f(316, 184) = 15716 (356) 0 1 1 1 4 4 1 4 8 = ( 1) 1+2 ( 1)(8 + 4) + ( 1) 2+2 ( 1)( 4 4) = 12 + 8 = 20 > 0, joten (356) on lokaali maksimi Koska rajoittamaton maksimi (354) on suurempi kuin rajoitettu maksimi (356), niin (354) on ratkaisu 345 Esimerkki 4 Maksimoidaan funktiota (351) rajoitteena x + y 79 Lagrangen funktio: L(x, y, λ) = 64x 2x 2 + 4xy 4y 2 + 32y 14 + λ[79 x y]