Matematiikan tukikurssi 3.4. Neliömuodot, Hessen matriisi, deiniittisyys, konveksisuus siinä tämän dokumentin aiheet. Neliömuodot ovat unktioita, jotka ovat muotoa T ( x) = x Ax, missä x = (x 1,, x n ) ja A R n n on symmetrinen neliömatriisi; A:ta sanotaan :n indusoivaksi matriisiksi. ( Indusoida on suurin piirtein johtaa tai saada aikaan, eli ilmeisesti se joka on keksinyt tämän sanan, on jotenkin kelannu että neliömuoto johdetaan A:sta, arvatenkin perusteella että jos tiedät A:n, ja mihin sitä on tarkoitus käyttää, niin osaat myös indusoida :n.) Siten esim. ( x, y, z) = 3x + y + 9z + 4+ 6yz= [ x y z] Neliömuodon Hessen matriisi H on aina yhtä kuin A. 3 0 3 0 x 3 y 9 z Funktion Hessen matriisi puolestaan on matriisi H = [ h ij ], jolle pätee että ( x) h ij = = x x i j ( x) ij Toisin sanoen Hessen matriisin alkiot ovat :n toisen asteen osittaisderivaattoja, missä on derivoitu i:nnen ja j:nnen argumentin suhteen. Matriisin diagonaalilla tietenkin i = j. Matriisi on symmetrinen, koska derivointijärjestyksellä ei ole merkitystä, ts. ( x) = ( x). ij ji Esim. unktion ( x, y, z) = e + 3z 3 + 8yz Hessen matriisi lasketaan seuraavasti. Ensin lasketaan 1. asteen osittaisderivaatat, jotka ovat: x = ye ; y xe + 8z = ; z = 9z + 8y Näitä derivoimalla saadaan Hessen matriisi:
H = xx yx zx yy zy xz yz zz = e y e + e 0 e + e x e 8 0 8 18z Tässä oli helppo osuus. Neliömuodot ja Hessen matriisit ovat käsitteinä aika yksinkertaisia. Seuraavaksi tulee monimutkaisempaa asiaa, eli matriisien (ja neliömuotojen) deiniittisyys ja siihen liittyvänä asiana konveksisuus. Deiniittisyys / indeiniittisyys: Neliömatriisi B R n n on joko - positiivisesti deiniitti, - positiivisesti semideiniitti, - indeiniitti, - negatiivisesti semideiniitti, tai - negatiivisesti deiniitti. Mikä näistä B on, se saadaan selville laskemalla B:n alideterminantteja. Jos et osaa laskea matriisin determinanttia, lopeta tässä kohtaa tämän lukeminen, opettele determinantin laskeminen, ja jatka sitten vasta tätä. Determinantin laskemisen voi opetella KA8 kurssin prujusta (http://www.valt.helsinki.i/sta/palokang/ka8/kirja.pd sivut 1 7). Jos tarvitset harjoitusta matriisien laskemisessa, voit treenata sitä laskemalla 3 3 matriiseja: klikkaa tästä, niin saat näkyviin Excel-taulukon joka generoi kivoja laskutehtäviä ratkaisuineen. Ei niitä kovin paljon tarvitse laskea kun olet laskenut kolme tai neljä, niin se alkaa mennä jo ihan rutiinilla. Ok. Mitä ne alideterminantit sitten ovat? Ne ovat pienempien matriisien determinantteja: niiden matriisien, jotka saadaan poistamalla B:stä jotkut rivit ja vastaavat sarakkeet. Eli jos poistat i:nnen rivin ja i:nnen sarakkeen, niin jäljellä olevan matriisin determinantti on joku B:n alideterminantti. (Jos taas poistat i:nnen rivin ja j:nnen sarakkeen, i j, no, älä vain tee niin, ok?) Jos poistat viimeiset m riviä ja vastaavat sarakkeet, niin jäljellä oleva matriisi muodostaa B:n vasemman yläkulman (alapuolella kuvassa korostettu keltaisella). Tällaista osamatriisia sanotaan B:n johtavaksi alimatriisiksi. Sen determinanttia sanotaan johtavaksi alideterminantiksi.
Esimerkiksi, olkoon B = [ ij ] R 4 4, eli B = 11 1 31 41 1 3 4 13 3 33 43 14 4 34 44 B:n ensimmäinen johtava alideterminantti on d 1 = 11 = 11. 11 1 Toinen johtava alideterminantti on d = = 11 11. Jne. 1 Myös esim. 3 3 33 ja ole johtavia alideterminantteja. 11 31 13 33 ovat B:n alideterminantteja, mutta ne eivät Tässä on korostettu vihreällä eräs B:n 3 3 alimatriisi. Nyt voidaan luetella ehdot, jotka tutkimalla voidaan selvittää B:n deiniittisyys. B on pos. de. Kaikki B:n johtavat alideterminantit d 1,, d n ovat > 0. B on tällöin myös pos. semide. B on neg. de. d 1 < 0, d > 0, d 3 < 0, jne. eli ensimmäinen johtava alideterminantti on miinusmerkkinen, minkä jälkeen miinus- ja plusmerkkiset vuorottelevat. B on tällöin myös neg. semide. Edelleen, olkoon B r sellainen B:n alimatriisi, joka saadaan jättämällä B:stä pois r riviä ja niitä vastaavat sarakkeet. Olkoon S kaikkien tällaisten alimatriisien B r joukko. B on pos. semide. Kaikille B r S pätee: det(b r ) 0. B on neg. semide. Kaikille B r S pätee: ( 1) n r det(b r ) 0. B on inde. B ei ole mikään edellisistä.
Käytännössä, kun haluat tietää jonkun matriisin deiniittisyyden, voit yksinkertaisesti ruveta laskemaan sen johtavia alideterminantteja. d 1 :ssä ei ole mitään laskemista. d on helposti laskettu; nyt jos d < 0, tiedät heti ettei matriisi voi olla mikään muu kuin indeiniitti, koska matriisi jolla d < 0 ei voi täyttää mitään yllämainituista ehdoista. Ja niin edelleen. Jossain vaiheessa sinulla on tarpeeksi tietoa, jotta voit päätellä mitä lajia B on. No, mihin tätä deiniittisyysjankutusta sitten tarvitaan? Vastaus: sen avulla selvitetään unktioiden konveksisuutta, joka on seuraava aihe. Funktion konveksisuus / konkaavisuus: Graaisesti, konveksi unktio kaartuu reunoiltaan ylöspäin. Sen kuvaaja on kuopan kaltainen. Konkaavi unktio kaartuu reunoiltaan alaspäin. Sen kuvaaja on mäenhuipun kaltainen. Tämä on kuitenkin aika kuvaannollista puhetta. Konveksisuudelle on olemassa määritelmä, joka sanoo täsmälleen, mitä konveksisuus on. Määritelmä kannattaa opetella. Se on: Olkoon (x) unktio, : A R, A R n. (x) on konveksi joukossa A ( λx1+ (1 λ ) x) λ ( x1) + (1 λ ) ( x) kaikille x 1, x A, kaikille λ [0,1]. Toisin sanoen jos otetaan pisteiden x 1 ja x väliseltä janalta jokin piste x 3 (joka on siis painotettu keskiarvo pisteistä x 1 ja x ), niin :n arvo tässä pisteessä on pienempi kuin samalla tavalla painotettu keskiarvo :n arvoista pisteissä x 1 ja x. Kuvan avulla havainnollistaen: Tätä on konveksisuus.
Konkaavisuuden määritelmä saadaan vaihtamalla määritelmässä :n paikalle. Tätä havainnollistavassa kuvassa sinisen käyrän paikalle tulee reunoiltaan alaspäin kaartuva käyrä; tällöin käyrä kulkee mustan janan yläpuolella pisteiden x 1 ja x välisellä alueella. Vahvasti konveksi: määritelmään tulee <. Vahvasti konkaavi: määritelmään tulee >. (Vahvasti konveksi on siis sitä, ettei käyrässä ole suoria kohtia. Jos käyrä kulkisi jonkun matkaa aivan suoraan, se olisi siinä kohtaa sekä konkaavi että konveksi, mutta ei vahvasti konkaavi eikä vahvasti konveksi.) Lukion matikan perusteella tiedetään, että yhden muuttujan unktio on konkaavi jos sen. derivaatta on negatiivinen, ja konveksi jos sen. derivaatta on positiivinen. Useamman muuttujan tapauksessa. asteen derivaattoja on enemmän, ja näinollen konveksisuus täytyy selvittää tarkastelemalla Hessen matriisia. Lyhyesti sanoen: olkoon H(x 0 ) unktion Hessen matriisi pisteessä x 0. Nyt vahvasti konveksi jossain x 0 :n ympäristössä H(x 0 ) pos. de. vahvasti konkaavi jossain x 0 :n ympäristössä H(x 0 ) neg. de. konveksi jossain x 0 :n ympäristössä H pos. semide. samassa ympäristössä konkaavi jossain x 0 :n ympäristössä H neg. semide. samassa ympäristössä ei konkaavi eikä konveksi missään x 0 :n ympäristössä x 0 :n jokaiseen ympäristöön kuuluu vähintään yksi piste, jossa H on inde. Vastaavasti, konveksi koko R n :ssä H(x) pos. semide. koko R n :ssä, jne. Vielä sananen neliömuodoista: Toisin kuin muista unktioista, neliömuodosta on tapana sanoa, että se on joko pos. de, neg. de, jne. sen mukaan, onko sen indusoiva matriisi pos. de. vai mikä. Kuten mainittiin jo edellä, neliömuodon Hessen matriisi on yksinkertaisesti sen indusoiva matriisi kerrottuna luvulla. Lisäksi voidaan todeta, että jos neliömuoto on konveksi, se saa vain positiivisia arvoja (paitsi origossa, jossa se saa arvon nolla); ja vastaavasti konkaavi neliömuoto saa vain negatiivisia arvoja. Jos neliömuoto saa sekä pos. että neg. arvoja, se on indeiniitti. Toisin sanoen: olkoon Q(x) neliömuoto; tällöin Q(x) on konveksi Q(x) 0 x R n
Q(x) on vahvasti konveksi Q(x) > 0 x R n \ {0} Q(x) on konkaavi Q(x) 0 x R n Q(x) on vahvasti konkaavi Q(x) < 0 x R n \ {0} Q(x) on inde. x: Q(x) > 0 ja toisaalta myös y: Q(y) < 0 eli Q saa sekä pos. että neg. arvoja. Ja mihin tätä kaikkea sitten tarvitaan? Optimointiin. Siitä varmaan lisää ensi viikolla, olettaisin.