Taloustieteen mat.menetelmät syksy 27 materiaali II-4 Ominaisarvot ja lineaariset di erenssiyhtälöt. Idea a b Ajatellaan di erenssiyhtälöä z k+ Az k, A : Jos A olisi diagonaalimatriisi, eli b c, niin muuttujat (z:n komponentit) olisivat toisistaan c d riippumattomia (uncoupled) ja komponentit voisi laskea erikseen. Idea: jos kerroinmatriisi ei ole diagonaalinen, rakennellaan muunnos muuttujien vaihdoksen avulla, joka johtaa diagonaaliseen kerroinmatriisiin! käytetään ominaisarvoja.2 Ominaisarvot Idea neliömatriisille A lähtökohta: voidaanko tehdä sellainen muuttujan vaihdos, että matriisin A sijaan voidaan tarkastella helpommin käsiteltävää matriisia? muuttujan vaihdos: kääntyvä kuvaus (matriisi) P, uudet muuttujat P x miten A toimii kun muuttujat vaihdetaan: otetaan y (uudet muuttujat) ja haetaan sitä vastaava x (vanhat muuttujat), eli x P y, kuvataan A:lla, jolloin saadaan AP y ja suoritetaan taas muuttujan vaihdos P AP y (y:n kuva uusissa muuttujissa) siis muunnettu kuvaus on D P AP eo. kysymys: löytyykö P siten että D on diagonaalimatriisi? Määritelmä: on A:n ominaisarvo ja v 6 on vastaava ominaisvektori jos A I on singulaarinen ja v toteuttaa (A I)v A on neliömatriisi. A:n ominaisarvo on luku. Kun se vähennetään jokaisesta A:n diagonaalialkiosta, A muuttuu singulaariksi. huom. oletetaan, että v 6, koska olisi aina ominaisvektori (eikä siten kovinkaan kiinnostava) on ominaisarvo jos ja vain jos A I on singulaarinen, det(a I), tätä sanotaan A:n karakteristiseksi yhtälöksi, karakteristiseksi polynomiksi tai ominaisarvoyhtälöksi 2 Esim. : A vähentämällä tästä matriisista 2 saadaan 3 matriisi, joka on singulaarinen, eli ominaisarvo on 2, vastaava
v ominaisvektori v (v ; v 2 ) saadaan ratkaisemalla, v 2 eli v 6 ja v 2 muotoa olevat vektorit ovat ominaisvektoreita vastaten ominaisarvoa 2 myös 3 on ominaisarvo sillä A 3I on singulaarinen Faktoja ominaisarvoista ja -vektoreista diagonaalimatriisin diagonaalialkiot ovat ominaisarvoja jos v on ominaisvektori, niin myös v on ominaisvektori kaikilla 6 ominaisvektori määrittää suunnan, jota kuvaus A ei muuta matriisi on singulaarinen jos ja vain jos on sen ominaisarvo jos matriisi on symmetrinen, sillä on n ominaisarvoa, jotka ovat reaalilukuja 3 Esim. 2: A, koska kyseessä ei ole diagonaalimatriisi, on 2 ominaisarvojen laskemisessa turvauduttava karakteristiseen yhtälöön: 3 det(a I) det 2 ( + )( ) 6 2 + 6 ( + 3)( 2) ominaisarvot ovat 3 ja 2 2. Ominaisarvoa vastaava ominaisvektori saadaan yhtälöparista (A ( 3)I)v, es- 2 3 v 2 3 v 2 imerkiksi v ( 3; 2) on ominaisarvo (kuten myös kaikkia vektorit v, 6 ), mikä on toinen ominaisvektori? 2 Esim. 3: A @ 5 A, karakteristinen yhtälö 3 2 det(a 2 I) det @ 5 A 3 2 (5 )( 4)( + ) ominaisarvoja on nyt kolme ;2;3 5; 4; 2 ovat v ;2;3 @ A ; @ A ; @ A (laske!) 3, vastaavat ominaisvektorit Havaintoja 2
karakteristinen yhtälö on n:nnen asteen polynomi! ominaisarvoja n kappaletta, osa voi olla kompleksilukuja (palataan tähän myöhemmin) yleisesti ottaen n:nnen asteen polynomin juurten hakeminen on työlästä.3 Diagonalisointi Määritelmä: matriisi A on diagonalisoituva, jos löytyy kääntyvä matriisi P (muuttujan vaihdos) siten, että D P AP on diagonaalimatriisi Lause: n n matriisi A on diagonalisoituva jos sillä on n erillistä, nollasta poikkeavaa ominaisarvoa kun ominaisvektorit ovat erillisiä ja 6, niin ominaisvektorit ovat lineaarisesti riippumattomia ominaisvektorit ovat matriisin P sarakkeita ja ominaisarvot ovat matriisin D diagonaalialkioita (matriisi voi olla diagonalisoituva myös silloin kun osa ominaisarvoista on samoja, mutta ei välttämättä) Taustaa: Huomataan että D P AP eli AP P D: Minkälainen pitäisi muunnosmatriisin P olla että D:stä tulisi diagonaalimatriisi?. 2D: Edellinen voidaan kirjoittaa A[v v 2 ][v v 2 ] josta saadaan Av 2 v ja Av 2 2 v 2 :(v v 2 ovat siis P :n sarakkeita). Tämä toteutuu kun :t ovat ominaisarvoja ja v:t ominaisvektoreita. Esim. 3 jatkoa 2 5 muunnosmatriisi P @ A ja D @ 4 A 3.4 Ominaisarvojen informaatio A:n määräämän lineaarikuvauksen luonnetta voi hahmotella ominaisvektorien ja ominaisarvojen avullla Jos A:n ominaisarvo on positiivinen, se tarkoittaa sitä, että A skaalaa vektoreita vastaavan ominaisvektorin suuntaan Jos ominaisarvo on negatiivinen, A peilaa ominaisvektorin suunnat ja skaalaa niitä k Esim. pohdi miten A toimii k 2 jos reaalisia ominaisarvoja ei ole, niin A ei toimi edellä kuvatulla tavalla mihinkään suuntaan 3
! matriisi kääntää kaikkia suuntia (ja mahdollisesti skaalaa niitä) cos() sin() Esim. tasossa matriisi A kääntää kuvattavaa sin() cos() vektoria kulman. Ominaisarvojen avulla voi tutkia de niittisyyttä symmetrinen matriisi A on pos.sem.def (neg.sem.def) jos ja vain jos A:n ominaisarvot ovat ( ) vastaavasti pos.def. (neg.def.) jos ominaisarvot > (< ) matriisi on inde niitti jos ja vain jos sillä on positiivinen ja negatiivinen ominaisarvo.5 Di erenssiyhtälöt Jono fx k g k Rn toteutaa T :nnen kertaluvun di erenssiyhtälön jos G(x k ; x k ; : : : ; x k T ) (kaikilla k T ), missä G : R T n 7! R n yleensä, di erenssiyhtälöt voidaan saattaa ensimmäisen kertaluvun muotoon, jolloin esitys on rekursiivinen, eli x k+ F (x k ) tässä tapauksessa di erenssiyhtälön ratkaisulla tarkoitetaan jonoa, joka saadaan rekursion ratkaisuna, kun alkuarvo x on annettu rekursiota kutsutaan myös tilayhtälöksi (state transition equation), liikeyhtälöksi (law of motion) tai dynaamiseksi systeemiksi (dynamic system).6 Esimerkkejä Esim. malli kansantulolle (national income): periodin k kansantulo Y k toteuttaa yhtälön Y k C k + I k + G k, missä C k on kuluttajien menot, I k on investoinnit ja G k julkiset menot oletetaan C k Y k, G k G kaikilla k, I k (C k C k ) saadaan di erenssiyhtälö Y k Y k + (C k C k ) + G ( + )Y k Y k 2 + G kyseessä toisen kertaluvun di erenssiyhtälö valitsemalla muuttujiksi x k Y k ja z k Y k saadaan di erenssiyhtälöyhtälö ensimmäisen kertaluvun/rekursiiviseen muotoon: Esim 2. kasvumalli x k ( + )x k z k + G z k x k 4
tuotantofunktio f(k k ; L k ), K pääoma ja L työ, C k kulutus, pääoman kulumistekijä, K k+ f(k k ; L k ) + ( )K k C k Esim. 3. luonnonvaran käyttö luonnonvaran määrä s k, luonnonvaran käyttö/harvennus x k, kasvufunktio f(s), dynamiikka: s k+ f(s k ) x k.7 Kuluttajan elinkaari X Kuluttajan tehtävä max k u(c k ), 2 (; ) periodin k kulutus c k k oletetaan, että alkupääoma on annettu, w, pääoma kasvaa korkoa, korko r; w k+ ( + r)(w k c k ), missä w k on periodin k pääoma tilayhtälön voi ajatella rajoitteena Ensimmäisen kertaluvun ehdot Lagrangen funktio L(c; ) X k h i k u(c k ) k (w k+ ( + r)(w k c k )) huom. muuttujina c k, w k+, k, eli äärettömästi muuttujia! teoreettinen kysymys: toimiiko ensimmäisen kertaluvun ehdot? derivoidaan L kaikkien muuttujien suhteen ja asetetaan derivaatat nolliksi, saadaan k u (c k ) + k ( + r)( ) (derivointi c k :n suhteen) ( + r) k k (derivointi w k :n suhteen, k ) w k+ ( + r)(w k c k ); k tämä on di erenssiyhtälö, jossa muuttujina ovat c k :t, w k :t ja k :t huom. k :t voi eliminoida.8 Lineaariset Di erenssiyhtälöt Tarkastellaan di erenssiyhtälöitä, jotka ovat muotoa z k+ Az k, k ; ; : : :, ja z annettu tarkoituksena on hyödyntää ominaisarvoteoriaa näiden yhtälöiden ratkaisemisessa 5
huom. epälineaarinen di erenssiyhtälö voidaan linearisoida, jolloin lineaaristen di erenssiyhtälöiden teoriaa voidaan hyödyntää lokaalissa tarkastelussa Esim. : korkolaskua pääoma y k, vuosikorko, y k+ ( + )y k laskemalla periodista alkaen, y ( + )y, y 2 ( + ) 2 y, jne. havaitaan, että y k ( + ) k y (di erenssiyhtälön ratkaisu) Esim. 2: malli työttömyydelle työssäkäyvät keskimäärin x, työttömät keskimäärin y työllistymistodennäköisyys p, työssäpysymistodennäköisyys q x k+ qx k + py k y k+ ( q)x k + ( p)y k xk+ q p xk tai matriisimuodossa y k+ q p y k a b Havaintoja 2d mallista z k+ Az k, A c d jos A olisi diagonaalimatriisi, eli b c, niin muuttujat (z:n komponentit) olisivat toisistaan riippumattomia (uncoupled) ja komponentit voisi laskea erikseen kuten korkoesimerkissä, esim. työttömyysmallissa x ja y eivät näytä erikseen ratkeavan kuten korkoesimerkissä (kokeile)! idea: tehdään muuttujien vaihdos, joka johtaa diagonaaliseen kerroinmatriisiin! käytetään ominaisarvoja.9 Ratkaisu diagonalisoimalla Di erenssiyhtälön z k+ Az k ratkaiseminen Oletus A diagonalisoituva. tehdään muuttujan vaihdos, Z P z ja z P Z vanhat muuttujat z 2 R n ja uudet muuttujat Z 2 R n lasketaan A:n ominaisarvot ja ominaisvektorit, muodostetaan P ominaisvektoreista 2. muodostetaan di erenssiyhtälö Z:lle Z k+ P z k+ P Az k P AP Z k huom. P AP on ominaisarvoista muodostuva diagonaalimatriisi 3. ratkaistaan di erenssiyhtälö Z:lle 4. palataan takaisin alkuperäisiin muuttujiin 6
. Esimerkki Ratkaistaan matriisin A Az k Lasketaan ominaisarvot ja ominaisvektorit 4 määrittämä di erenssiyhtälö z 2 k+ karakteristinen yhtälö det(a I), ( )( ) 4 2! saadaan ominaisarvot ;2 2; 4 v ominaisvektorit, (i) (A I) 2 2 2 4 v (ii) (A 2 I), mm. v 2 v 2 ( 2; ) 2 4 2 muunnosmatriisi P ja P Tehdään muuttujan vaihdos v 2, mm. v (4; ) 6 3 6 23 merkitään z (x; y), uudet muuttujat X ja Y, Z (X; Y ): X 6 3 x x 4 2 X ja Y 6 23 y y Y Johdetaan di erenssiyhtälö Z:lle: eli Z k+ P AP Z k ja P AP on diagonaalimatriisi, jossa ominaisvektorit diagonaalilla, eli P AP 2 tässä di erenssiyhtälössä X ja Y eivät riipu toisistaan, koska B on diagonaalimatriisi! Ratkaistaan Z k : X k 2 k X ja Y k ( ) k Y Siirrytään takaisin alkuperäisiin muuttujiin 4 2 2 z k P Z k k X ( ) k Y 4 2 k X 2 ( ) k Y 2 k X + ( ) k (2 k X Y ) 4 + (( ) k Y ) alkuarvot X ja Y saadaan taas muunnoksella Z P z 2 7
2 Lineaariset di erenssiyhtälöt II - ominaisarvot 2. Ratkaisu ominaisarvojen avulla Di erenssiyhtälö z k+ Az k (z k 2 R n ) Oletus A diagonalisoituva ja sen ominaisarvot ovat reaalilukuja ominaisarvot ; : : : ; n ja ominaisvektorit v ; : : : ; v 2 k B merkitään D @.... C. A, jolloin D k B @.... C. A n k n Lause: Di erenssiyhtälön yleinen ratkaisu on z k c k v + c 2 k 2v 2 + : : : + c n k nv n, missä c i, i ; : : : ; n, ovat vakioita yleisellä ratkaisulla tarkoitetaan sitä että ratkaisu on aina edellä kuvattua muotoa riippumatta alkuarvosta z vakiot c i, i : : : ; n, voidaan ratkaista, kun alkuarvo z on annettu; merkitään c (c ; : : : ; c n ), jolloin c P z Lause: Kun alkuarvo on z niin di erenssiyhtälön ratkaisu on z k P D k P z huom. A k P D k P, tämän avulla diagonalisoitavalle matriisille voi määritellä mm. neliöjuuren A 2 2.2 Esimerkki Ratkaistaan P D k P di erenssiyhtälölle z k+ Az k, A karakteristinen yhtälö det(a I) : 6 2 + 6 3 2 3 2 ( + ) ominaisarvot ;2 ( p + 4 6)2 ( 5)2, 3 ja 2 2 + 3 3 v ominaisvektorit: (i) (A I)v, joten 2 3 v 2 on oltava 2v + 3v 2, esim. v (3; 2) on ominaisvektori 2 3 v (ii) (A 2 I)v, joten 3v 2 2 +3v, esim. v (; ) muunnosmatriisi P v 2 3 ja sen käänteismatriisi P 2 :2 :2 :4 :6 8
matriisi A k P D k P 3 ( 3) k :2 :2 2 2 k :4 :6 3( 3) k 2 k :2 :2 ( 2)( 3) k 2 k :4 :6 :2 ( ) k 3 k+ + :4 2 k :2 ( 3) k+ + :6 2 k :2 ( ) k+ 3 k + :4 2 k :2 ( ) k+2 3 k + :6 2 k 2.3 Kompleksiluvut Diagonalisointiin tarvitaan n ominaisarvoa, mutta mitä jos kaikkia näitä ei löydy reaalilukujen joukosta?! osa ominaisarvoista on kompleksilukuja Määritelmä: kompleksiluku on muotoa a + ib oleva luku missä i:lle pätee i 2 ja a ja b ovat reaalilukuja lukua a sanotaan reaaliosaksi ja lukua b imaginaariosaksi, i on imaginaariyksikkö Määritelmä: Luvun z a + ib kompleksikonjugaatiksi sanotaan lukua z a ib Lause: Jos kompleksiluku z on polynomin juuri niin myös z on polynomin juuri huom. n:nnen asteen polynomilla on enintään n juurta, jos n 2 ja yksi juurista on kompleksiluku niin toisenkin on oltava huom. vaikka kompleksiluvut määritellään toisen asteen yhtälön ratkaisujen kautta (i toteuttaa yhtälön x 2 ), niillä saadaan kaikkien korkeampaakin astetta olevien polynomiyhtälöiden kaikki ratkaisut 2.4 Kompleksiset ominaisarvot Pohditaan 2d tapausta reaalinen ominaisvektori on sellainen, että kuvaukset tämän vektorin suuntaan pysyvät saman suuntaisina! jos ominaisarvot ovat kompleksisia matriisi kääntää kaikkia suuntia reaalisten ominaisarvojen tapauksessa (2d) di erenssiyhtälön Z k+ Az k ratkaisu on muotoa z k c k v + c 2 k 2v 2, missä ja 2 ovat ominaisarvot, v ja v 2 ovat vastaavat ominaisvektorit ja c ja c 2 ovat vakioita 9
jos j i j < niin termi c i k i v i menee kohti nollaveltoria (kerroin k i suppenee nollaan), vastaavasti jos j i j > termi c i k i v i hajaantuu (ei suppene)! mitä tapahtuu jos ja 2 ovat kompleksilukuja? 2 2 (reaalinen) matriisi A, jolla kompleksiset ominaisarvot z i, vastaavat ominaisvektorit u iv di erenssiyhtälön yleinen ratkaisu on z k 2r k [(c cos k c 2 sin k)u (c 2 cos k+c sin k)v], missä c ja c 2 ovat reaalilukuja, jotka määräytyvät alkuarvosta z kompleksiset ominaisarvot johtavat siihen että ratkaisu värähtelee sini- ja kosinitermien johdosta 2.5 Esimerkki A 9 p karakteristinen yhtälö p 2 2 + p, ratkaisut ;2 (2 4 4 )2 (2 36))2 (2 6 )2 i3 3i v ominaisvektorit: (A I), eli 3iv 9 3i v 2 + v 2, esim. v (; 3i) kelpaa, toinen ominaisvektori on (; 3i) ) r p 2 + 3 2 p, arccos( p ) :249 Di erenssiyhtälön ratkaisu, merk. z (x; y) xk p (c k y cos k c 2 sin k) (c k 2 cos k + c sin k) 3 2.6 Stabiilisuus Määritelmä: Vektori x on di erenssiyhtälön x k+ F (x k ) tasapaino jos x F (x ) epälineaarinen di erenssiyhtälö voidaan linearisoida tasapainon ympäristössä: F (x) F (x ) + DF (x )(x x ), tällöin muuttujan vaihdoksella z x x päädytään lineaariseen di erenssiyhtälöön, jossa A DF (x )! epälineaaristen di erenssiyhtälöiden tasapainoja voidaan analysoida lineaaristen di erenssiyhtälöiden avulla Määritelmä: Lineaarisen di erenssiyhtälön z k+ Az k tasapaino z on (globaalisti) asymptoottisesti stabiili, jos di erenssiyhtälön ratkaisut suppenevat kohti vektoria kaikilla alkuarvoilla
reaalisten ominaisarvojen tapauksessa tasapaino on stabiili kun ominaisarvot ovat itseisarvoltaan pienempiä kuin yleisesti ominaisarvojen on oltava kompleksitasossa yksikköympyrän sisäpuolella, eli r p a 2 + b 2 < edellä olleissa esimerkeissä origo on epästabiili 2.7 Markov prosessit Määritelmä: Oletetaan äärellinen määrä tiloja i ; : : : ; n. Stokastinen prosessi on sääntö, joka määrittää todennäköisyydet sille, että periodilla k + ollaan tilassa i. Jos tilojen todennäköisyydet riippuvat vain edellisen periodin tilasta, stokastista prosessia sanotaan Markov-prosessiksi Esimerkki luokitellaan perheet kotipaikan mukaan: () kaupunkilaisiin, (2) esikaupunkien asukkaisiin ja (3) maalaisiin eri luokkia voidaan pitää tiloina ; 2; 3, jos perheen kotipaikan tyyppi muuttuu, niin tila muuttuu Tilansiirtotodennäköisyydet merkitään x i (k) todennäköisyys että jaksolla k ollaan tilassa i siirtymätodennäköisyydet m ij todennäköisyys että jaksolla k + tila on i kun jaksolla k oltiin tilassa j voidaan koota tilansiirtomatriisiksi (Markov-matriisiksi) m m n B M @.... C. A m n m nn Esimerkki (jatkoa) voidaan ajatella että todennäköisyys x i (k) kuvaa osuutta populaatiosta, joka asuu (i ) kaupungissa, (i 2) esikapungissa, (i 3) maalla jaksolla k esim. m j todennäköisyys, jolla pysytään kaupunkilaisena (j ) tai tullaan kaupunkilaiseksi (j 2 tai j 3), voidaan tulkita osuuksina populaatiosta, jotka pysyvät paikoillaan ja muuttavat :75 :2 : oletetaan @ :2 :9 :2A :5 :8 :7 Markov-prosessi di erenssiyhtälönä
todennäköisyys, että jaksolla k + ollaan tilassa i: x i (k + ) (tod. näk. että siirrytään tilasta tilaan i) (tod. näk. että lähdetään tilasta ) + : : : + (tod. näk että siirrytään tilasta n tilaan i) (tod. näk. että lähdetään tilasta n) P j m ijx j (k) tilansiirtomatriisin avulla x(k + ) M x(k), eli x (k + ) m m n x (k) B C B @. A @.... C B C. A @. A x n (k + ) m n m nn x n (k) 2.8 Esimerkki Markov matriisi M :9 :4 : :6 Ominaisarvot, det(m I) (:9 )(:6 ) : :4 2 (:9 + :6) + :9 :6 :4, saadaan ;2 (:5 p :5 2 4 :5)2 (:5 :5)2 ; :5 Ominaisvektoreiksi saadaan v (4; ) ja v 2 (; ) Di erenssiyhtälön yleinen ratkaisu Havaintoja x (k + ) c 4 k + c 2 :5 k x 2 (k + ) c k + c 2 ( ) :5 k toinen ominaisarvo on yksi ja toinen pienempi kuin yksi kun k!, niin raja-arvona on c (4; ) (ominaisarvoa vastaavan ominaisvektorin suunta), koska raja-arvon on oltava todennäköisyysjakauma on 4c + c, eli c 5 yleisesti pätee, että kun M on Markov-matriisi, jonka kaikki komponentit ovat nollasta poikkeavia (tai M k :n alkiot nollasta poikkeavia jollakin k), niin yksi ominaisarvoista on yksi ja loput välillä ( ; ), jolloin prosessi suppenee kohti ominaisarvoa vastaavan ominaisvektorin määrittämää rajajakaumaa! rajajakauma on di erenssiyhtälön stabiili tasapaino (kaikilla todennäköisyysjakaumilla alkutiloina) :8 kokeile eo. esimerkissä mitä on M :2 2.9 Ominaisarvojen ominaisuuksia Lause: Jos ; : : : ; n ovat n n matriisin ominaisarvot, niin + 2 + + n trace(a) ja 2 n det(a). 2
trace(a) on matriisin diagonaalialkioden summa (matriisin jälki) tulos voi helpottaa ominaisarvojen laskemista Esimerkki (kaupunki-maaseutu jatkoa) @ x (k + ) :75 :2 : x 2 (k + ) A @ :2 :9 :2A @ x (k) x 2 (k) A x 3 (k + ) :5 :8 :7 x 3 (k) tiedetään, että yksi ominaisarvoista on, joten + + 2 :75 + :9 + :7 2:35 ja 2 :455, saadaan ominaisarvot :7 ja :65 25 8 ominaisvektorit ovat @ 5A, @ 5A, @ A 35 3 yleinen ratkaisu on @ x (k + ) x 2 (k + ) A @ 225 5A + c 2 @ 8 5A (:7) k + c 3 @ A (:65) k x 3 (k + ) 35 3 3