Taloustieteen matemaattiset menetelmät 7 materiaali 5 Rajoittamaton optimointi Yhden muuttujan tapaus f R! R Muistutetaan mieleen maksimin määritelmä. Funktiolla f on maksimi pisteessä x jos kaikille y R; f (y) f (x ) Funktiolla on minimi pisteessä x jos kaikille y R; Lokaali optimi f (y) f (x ) f llä on lokaali maksimi pisteessä x jos on olemassa " > siten, että kaikille y B " (x ) (siis kun d (y; x ) < ") pätee f (y) f (x ) lokaali minimi määritellään samoin. Miten tiedämme, onko f llä minimi maksimi tai jotain muuta pisteessä x? Miten löytää lokaalit minimit ja maksimit? Oletetaan, että f on derivoituva. Tiedämme jo, että mikäli f llä on maksimi (tai minimi) pisteessä x ; tällöin Df (x ) = f (x ) = Oletetaan siis toisin päin, että f (x ) = Ajatus Jos f (x ) lla on maksimi x x < x ja vähenevä, kun x > x ssa, tällöin f on kasvava, kun Mikäli kasvavalla funktiolla on derivaatta, se on positiivinen. Mikäli vähenevällä funktiolla on derivaatta, se on negatiivinen. Toisin sanoen on x n funktiona vähenevä. pätee.maksimissa f (x ) Siis mikäli f (x ) lla on derivaatta, sille Df (x )
Toisin sanoen päädymme tarkastelemaan derivaatan derivaattaa. Merkitsemme f (x ) = lim h! f (x + h) f (x ) h ja kutsumme tätä funktion f toiseksi derivaataksi pisteessä x Kolmas derivaatta on toisen derivaatan derivaatta, neljäs jne määritellään samoin. Jos funktiolla on k s derivaatta pisteessä, sanomme että se on k kertaa di erentioituva pisteessä x Merkitään k s derivaatta f [k] (x ) lla. Miten tulkita toinen derivaatta?. Taylorin Teoreema Tarkastellaan funktiota f R! R; ja oletetaan, että funktio on k kertaa di erentioituva pisteessä x Tällöin f (x + h) = f (x )+f (x ) h+ f (x ) h ++ k! f [k] (x )+ (k + )! f [k+] (x) h k+ ; jollekin pisteelle x siten, että x < x < x + h Lokaalia analyysiä varten (siis analyysiä, jossa h on mielivaltaisen pieni) meidän tulee tarkastella ensimmäistä nollasta poikkeavaa termiä tässä sarjakehitelmässä. Muut termit ovat siihen verrattuna häviävän pieniä, kun h on pieni. Taylorin teoreeman avulla voimme luokitella kaikki pisteet, joissa f (x ) = tyhjentävästi. Jos ensimmäinen l; jolle f [l] (x ) 6= ; on pariton, funktiolla f ei ole ääriarvoa pisteessä x. Jos ensimmäinen l; jolle f [l] (x ) 6= ; on parillinen ja f [l] (x ) <, funktiolla f on lokaali maksimi pisteessä x 3. Jos ensimmäinen l; jolle f [l] (x ) 6= ; on parillinen ja f [l] (x ) >, funktiolla f on lokaali minimi pisteessä x
. Kvadraattiset funktiot Kvadraattiset reaalimuuttujan funktiot saavat muodon f (x) = ax + bx + c Taylorin sarjakehitelmä pisteen x ympäristössä antaa f (x + h) = f (x ) + (ax + b) h + ah Pisteessä x = b a ; funktion derivaatta on nolla. Funktiolla on minimi pisteessä x ; jos a > ja maksimi jos a < Siirrytään useamman muuttujan polynomifunktioihin, jotka ovat toista astetta. Vakiotermi, c R Ensimmäisen asteen (lineaarinen) termi b x; missä Toisen asteen termi Voidaanko ilmaista matriisin avulla? b = (b ; b ; ; b n ) ; x = (x ; x ; ; x n ) b x = b > x = n i=b i x i a x + a x x + + a n x x n +a x x + + a n x x n +a n x n x + + a nn x n x Ax = x > Ax = B (x ; x ; ; x n ) A @ x. x n C A Koska x i x j = x j x i ; kirjoitetaan A symmetrisessä muodossa. Miltä näyttää (x ; x ; x 3 ) @ 3 3 A @ x x x 3 A? 3
Kertomalla jälkimmäinen tulo auki saadaan (x ; x ; x 3 ) @ x + 3x + x 3 3x + x + x 3 A x + x + x 3 = x + 3x x + x x 3 + 3x x +x + x x 3 + x x 3 + x x 3 + x 3 = x + x + x 3 + 6x x + 4x x 3 + x x 3 Esimerkki Kvadraattinen funktio, kun x = (x ; x ) f (x) = 6 + 7x + 3x + x + 5x x + 4x = 5 c = 6; b = (7; 3) ; A = 5 4.3 Kvadraattisen funktion ääriarvot Missä pisteessä bx on kvadraattisella funktiolla missä @f (bx) @x i on matriisin A rivi i rf (bx) =? = b i + a ii bx i + j6=i (a ij + a ji ) bx j = b i + a i bx; a i Koska saadaan Saadaan siis rf (bx) = B @ @f(bx) @x. @f(bx) @x n rf (bx) = b + Abx C A ; rf (bx) =, bx = A b Luonnollisesti taas vaaditaan, että A on olemassa eli siis Alla on nollasta poikkeava determinantti. 4
.4 Esimerkkejä derivaatan nollakohdan etsimisestä Pienimmän neliösumman menetelmä Tarkastellaan tilastollista aineistoa, jossa meillä on N paria havaintoja (y ; x ) ; ; (y N ; x N ) Ajatellaan, että y riippuu x stä lineaarisen mallin mukaan. y i = x i + " i " i on riippumaton virhetermi, jonka oletamme jakautuneen identtisesti kaikille i on tuntematon parametri, joka pitää tilastoaineistosta päätellä. Etsitään siten, että havaintoaineistosta laskettu virhetermien neliösumma N i= (y i x i ) minimoituu. min f () = N i= (y i x i ) Lasketaan Df () ja tarkastellaan pistettä ; b jolle pätee Df b = Derivoimalla saadaan Df b = N i= x i y i xi b Siis Df b = jos b = N i= x iy i N i= x i Laajennetaan seuraavaksi mallia siten, että otetaan mukaan vakiotermi y i = + x i + " i Tällöin neliösumma n ja n funktiona saadaan f (; ) = N i= (y i x i ) Etsitään b; b siten, että @f b; b @ 5 @f = @ b; b =
Saadaan N i= N i= y i b b x i x i y i b b x i = ; = Siis ensimmäisestä saadaan Huomataan lisäksi b = N i= y i Sijoittamalla jälkimmäiseen b N i= x i = y x b N N i=x y i b x b i = b = N i= (x i x) (y i y) Cov (y; x) N i= (x i x) = V ar (x) Yleisemmin voidaan analysoida aineistoa (y ; x ; x ; ; x K ) ; (y N ; x N ; ; x KN ) mallilla y = x + K x K ". y n. = eli matriisimuodossa Neliösumma.. + x N K x KN y = X + " f () = " " = (y X) > (y X). " N = y y (X) > y y > X + > X > X = y y y > X + > X > X Käytetään edellä laskettua kaavaa kvadraattisen funktion gradientille rf b = X > y + X > X b Siis jos rf b = b = X > X X > y 6
.5 Onko ääriarvo minimi vai maksimi vai jotain muuta? Miten voidaan päätellä, onko kvadraattisella funktiolla minimi vai maksimi pisteessä bx Merkitään funktion f toista derivaattaa pisteessä bx symbolilla D f (bx) Kuvitellaan, että Taylorin kehitelmä pätee myös monen muuttujan funktioille. Tällöin voisi päteä f (bx + h) = f (bx) + rf (bx) h + h D f (bx) h Tarkastellaan gradienttia pisteen bx funktiona. Tällöin rf (bx) R n! R n ; ja gradientin derivaatta on siis nn matriisin kuvaama lineaarinen funktio. Määritellään siis D f (bx) = D (rf (bx)) = B @ @f(bx) @x @x. @f(bx) @x n@x @f(bx) @x @x n.... @f(bx) @x n@x n C A Kutsumme tätä toisten derivaattojen matriisia funktion f Hessin matriisiksi. Nyt Taylorin teoreema kertoo siis, että pisteille bx; jossa rf (bx) = ; pätee f (bx + h) f (bx) = h D f (bx) h Onko funktiolla minimi, maksimi vai ei kumpaakaan pisteessä bx riippuu siis siitä, onko h D f (bx) h R kaikille h 7
Kvadraattiset muodot ja matriisin de niittisyys Kvadraattinen muoto on homogeeninen toisen asteen polynomi siis polynomi, jonka kaikki termit ovat toista astetta. Ne voidaan aina kirjoittaa muotoon jollekin symmetriselle matriisille A. x Ax Kvadraattinen muoto on positiivisesti de niitti jos kaikille x 6= ; x Ax > Kvadraattinen muoto on positiivisesti semide niitti jos kaikille x; x Ax Kvadraattinen muoto on negatiivisesti de niitti jos kaikille x 6= ; xax < Kvadraattinen muoto on negatiivisesti semide niitti jos kaikille x; xax Muussa tapauksessa sanomme, että kvadraattinen muoto on inde niitti. Taylorin teoreeman perusteella kvadraattisten muotojen de niittisyydellä on selkeä yhtymäkohta funktion lokaalien ääriarvojen laatuun. Olkoon rf (bx) = Tällöin D f (bx) positiivisesti de niitti implikoi, että bx on lokaali minimi. D f (bx) negatiivisesti de niitti impllikoi, että bx on lokaali maksimi. Milloin on A positiivisesti de niitti? Helppo tapaus Jos A on lävistäjämatriisi, on se positiivisesti de niitti jos ja vain jos kaikki sen lävistäjäalkiot ovat positiivisia. Yleisemminkin kaikkien lävistäjäalkioiden tulee olla positiivisia positiivisesti de niitissä matriisissa. Toinen helppo tapaus A on matriisi a b A = ; b c eli kvadraattinen muoto on ax + bx x + cx 8
Tulkitaan tämä ensiksi toisen asteen funktiona x lle. Jos c > ; tällä funktiolla on minimi pisteessä x = bx c Sijoitetaan kvadraattiseen muotoon ax b x c + b x c = a b c x Tämä on positiivinen jos a b c > eli ac > b Toisin sanoen kvadraattinen muoto on positiivisesti de niitti jos i) a > ja ii) det A > Negatiivistä de niittisyyttä varten lähdetään liikkeelle siitä, että a; c < Ratkaistaan maksimaalinen x kullekin x n arvolle sijoitetaan ja vaaditaan, että ax b x c x = bx c ; + b x c = a b c x < Siis a < b c eli eli ac > b det A > Kvadraattisten muotojen luokitus yleisesti Tarkastellaan matriisin A johtavia pääminoreja a a M = det a ; M = det ; a a M 3 = det @ a a a 3 a a a 3 A ; a 3 a 3 a 33 9
Kvadraattinen muoto x Ax on positiivisesti de niitti jos M i > kaikille i Kvadraattinen muoto x Ax on negatiivisesti de niitti jos M i ( ) i > kaikille i Toisin sanoen M i on negatiivinen parittomille i ja positiivinen parillisille i Semide niittisyys Määritellään kaikille i < i < < i n a ii a ii a ii n A n fi = ;i ;;i ng B @ C A Positiivinen semide niittisyys a ini a ini a ini n M n fi ;i ;;i ng = det A n fi ;i ;;i ng Mfi n kaikille n ja kaikille fi ;i ;;i ng ; i ; ; i n g kaikille n ja kaikille fi ; i ; ; i n g Negatiivinen semide niittisyys Mfi n parittomille n ja kaikille fi ;i ;;i ng ; i ; ; i n g; M n fi ;i ;;i ng parillisille n ja kaikille fi ; i ; ; i n g. De niittisyys lineaarisilla rajoitteilla Neliömuodon x Ax de niittisyyttä voidaan tarkastella myös lineaaristen rajoitteiden vallitessa. Vaaditaan siis, että b x = Olkoon x edelleen jokin sarakevektori.rajoite bx = rajaa siis vektoreita, joita tarkastelemme.
Kysyään, onko A de niitti matriisi näihin suuntiin. Miksi tämä on tärkeä kysymys taloustieteessä? Miten määrätään de niittisyys? Tarkastellaan matriisia H = B @ ja oletetaan, että b 6= b b n b a a n. b n a n a nn C A ; A on positiivisesti de niitti suuntiin fx jb x = g jos kaikki matriisin H johtavat pääminorit ensimmäistä lukuunottamatta ovat negatiivisia. A on negatiivisesti de niitti suuntiin fx jb x = g jos kaikki matriisin H johtavat pääminorit ensimmäistä lukuunottamatta vaihtelevat etumerkiltään. Esimerkkejä. Tarkastellaan matriisin A = @ A de niittisyyttä. (a) M = det (a ) = (b) M = det = 3 (c) M 3 = det @ A = ( ) 3+3 det ( ) 3+ det = 3 3 3 = 3 Päätellään siis että A ei ole de niitti. +( ) 3+ det +. Tarkastellaan matriisia A = @ A Matriisi on inde niitti. Miksi?
3. Tarkastellaan matriisin A = @ 4 4 A de niittisyyttä. (a) M = ; M = ; M 3 = (b) M f;g = 6; M f;3g = ; M f;3g = Päätellään siis jo tässä vaiheessa, että A on inde niitti. 4. Tarkastellaan funktiota f (x ; x ; x 3 ) = x x 3 + x x 3 Pisteen (x ; x ; x 3 ) = (; ; ) ympäristössä.gradientti x + x 3 rf (x ; x ; x 3 ) = @ 3x A x lasketaan Hessin matriisi rf (; ; ) = D f (x ; x ; x 3 ) = @ @ A 6x A lasketaan pisteessä (; ; ) D f (; ; ) = @ Tämä matriisi on inde niitti koska M = > ja Mf;3g = det A = 5. Muodostetaan gradientti rf (x ; x ) = f (x ; x ) = x + x @f(x ;x ) @x @f(x ;x ) @x! = x x
Muodostetaan Hessin matriisi derivoimalla gradientti! Saadaan D f (x ; x ) = D f (x ; x ) = @ f(x ;x ) @x @x @ f(x ;x ) @x @x @ f(x ;x ) @x @x @ f(x ;x ) @x @x ( ) x ( ) x D f (x ; x ) on siis negatiivisesti de niitti kun x i 6= ja < < 6. Tarkastellaan funktiota f (x ; x ) = (x + x ) Muodostetaan funktiolle gradientti! rf (x ; x ) = @f(x ;x ) @x @f(x ;x ) @x = (x + x ) x (x + x ) x Muodostetaan Hessin matriisi derivoimalla gradientti D f (x ; x ) = Tulosäännöllä saadaan @ f(x ;x ) @x @x @ f(x ;x ) @x @x @ f(x ;x ) @x @x @ f(x ;x ) @x @x @ f (x ; x ) = ( ) x (x @x @x + x ) + (x + x ) x ; @ f (x ; x ) = (x @x @x + x ) x x ; @ f (x ; x ) = ( ) x (x @x @x + x ) + (x + x ) x Keräämällä yhteiset termit ja sieventämällä saadaan D f (x ; x ) = = (x + x ) @ f(x ;x ) @x @x @ f(x ;x ) @x @x @ f(x ;x ) @x @x @ f(x ;x ) @x @x ( ) x x ( ) x x!! ( ) x x ( ) x x! 3
Determinanttia laskettaessa voidaan erottaa yhteinen tekijä det D f (x ; x ) = (x + x ) x x (( ) ( ) ( ) ( )) = Matriisi D f (x ; x ) on siis negatiivisesti semide niitti jos < ja positiivisesti semide niitti jos > 7. Tarkastellaan matriisin de niittisyyttä rajoitteella A = 5 5 x + x = Muodostetaan reunustettu matriisi @ 5 5 ja tarkastellaan sen kahta viimeistä johtavaa pääminoria. (a) det = (b) det@ 5 A = ( ) + 5 det + ( ) + det 5 5 5 ( ) 3+ det = 6(kehitetty. sarakkeen suhteen) 5 Päättelemme siis, että A = on negatiivisesti de niitti rajoitteella x + x = 5 5 A. De niittisyys ja komparatiivinen statiikka. Tarkastellaan funktion f (y; x) rajoittamatonta optimointia. Valitaan y endogeeniseksi muuttujaksi ja käsitellään x eksogeenisena. Kirjoitetaan maksimaalisen y n etsimisen ongelma seuraavasti max f (y; x) y + 4
Ensimmäisen kertaluvun ehto optimille @f (by; bx) = @y Toisen kertaluvun riittävä ehto lokaalille optimille saadaan Taylorin säännöstä f (by + dy; bx) f (by; bx) = @f @y (by; bx) dy + @ f @y@y (by; bx) (dy) + Jos @ f (by; bx) < ; @y@y tällöin f llä on lokaali maksimi pisteessä (by; bx) Huomatkaa, että tällöin myös funktiolla @f (by; bx) @y on nollasta poikkeava derivaatta endogeenisen muuttujan suhteen pisteessä (by; bx) ja voimme soveltaa implisiittifunktiolausetta optimaalisen y n valinnan määräämiseen eksogeenisen muuttujan funktiona. Koska @f (y (x) ; x) = @y kaikille x pisteen bx ympäristössä, saamme eli @ f (by; bx) dy + @ f (by; bx) @y@y @y@x dx = dy dx = @ f(by;bx) @y@x @ f(by;bx) @y@y Koska @ f(by;bx) @y@y < toisen kertaluvun ehdon nojalla, saamme tuloksen, jonk mukaan dy dx on saman merkkinen kuin @ f(by;bx) @y@x.. Esimerkki Optimaalinen monopolituotanto. Olkoon x monopolistin tuottama määrä. P (q) = b (q) on käänteishintafunktio markkinalle, cq monopolistin kustannusfunktio. Yrityksen maksimointiongelma max (q; ; c) = q ( b (q)) cq q 5
Ensimmäisen kertaluvun ehto Toisen kertaluvun ehto D (q; ; c) = b (q) qb (q) cq = D (q) < Kuinka muuttu optimaalinen tuotos parametrien tai c muuttuessa? Edellisen tuloksen mukaan endogeenisen muuttujan muutoksen etumerkki riippuu @ (q; ; c) @q@ ja etumerkeistä. @ (q; ; c) @q@c 6