MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt Matriisinormi, häiriöalttius Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2015 1 / 14 R. Kangaslampi matriisiteoriaa
Matriisinormi Vektorin normi mittaa vektorin pituutta. Matriiseille ja lineaarikuvauksille voidaan myös määritellä normeja. Olkoon jokin vektorinormi (esim. 2 tai ). Mitataan matriisin kokoa sillä, kuinka pitkiksi vektoreiksi matriisilla kerrottaessa yksikkövektorit saattavat kuvautua. Matriisille A C m n asetetaan A = max x =1 Ax. Tässä siis oikealla puolella esiintyy vektoreiden x C n ja Ax C m normeja. Näin määritelty A toteuttaa normin määritelmän 4 ehtoa. 2 / 14 R. Kangaslampi matriisiteoriaa
Matriisinormi Kun halutaan korostaa, minkä vektorinormin avulla matriisinormi on, määritelty käytetään vastaavaa merkkiä. Esimerkiksi A 1 = max x 1 =1 Ax 1 ja A 2 = max x 2 =1 Ax 2. Esimerkki 1 1 0 0 Matriisin A = 0 1 0 matriisinormi 2 on A 2 = 4, sillä 0 0 4 matriisi kuvaa yksikköpallon ellipsoidiksi, jonka pisimmän puoliakselin pituus on 4. 3 / 14 R. Kangaslampi matriisiteoriaa
Matriisinormi Matriisinormin laskeminen voi, normista riippuen, olla hyvinkin hankalaa. 1- ja -normit ovat laskuissa monesti käteviä: Lause 2 Olkoon A C m n. Tällöin ja A 1 = max 1 j n A = max 1 i m m a ij eli suurin sarakesumma i=1 n a ij eli suurin rivisumma. j=1 4 / 14 R. Kangaslampi matriisiteoriaa
Matriisinormi Kaikki eri matriisinormit ovat kuitenkin keskenään ekvivalentteja: Lause 3 Olkoot p ja q kaksi matriisinormia. Tällöin on olemassa positiiviset vakiot c 1 (p, q) ja c 2 (p, q) siten, että kaikilla A C m n. c 1 A p A q c 2 A p Matriisinormit siis poikkeavat toisistaan vain vakiolla: jos q-normissa A q < B q, niin p-normissa A p < c B p, missä c on normeista riippuva vakio. (Todistus: G. Zielke, Some remarks on matrix norms, condition numbers, and error estimates for linear equations, Linear Algebra and its Applications, Vol. 110 (1988), pp 29-41.) 5 / 14 R. Kangaslampi matriisiteoriaa
Matriisinormi Matriisinormin ominaisuuksia: Ax A x, AB A B, A k A k, k = 1, 2,.... Seuraavaa tulosta tullaan tarvitsemaan myöhemmin: 6 / 14 R. Kangaslampi matriisiteoriaa
Matriisinormi Lause 4 Olkoon A C n n siten, että A < 1. Tällöin I A on kääntyvä ja (I A) 1 1 1 A. Todistus. Jos I A ei ole kääntyvä, niin on olemassa x C n siten, että x = 1 ja (I A)x = 0. Tällöin A Ax = x = 1, mikä on ristiriita. Oletetaan, että I A on kääntyvä. Jos x = 1 ja v = (I A) 1 x, niin 1 = (I A)v v Av v A v = (1 A ) v. Siten v 1 1 A. 7 / 14 R. Kangaslampi matriisiteoriaa
Käytännön ongelmissa, joita kuvataan lineaarisilla malleilla Ax = b, on usein epätarkkuutta sekä datassa että mallissa, eli niin matriisin A kuin vektorin b kertoimissakin. Nyt halutaan tietää, millainen virhe voi aiheutua ratkaisuun x. Tarkastellaan ensin, miten δb :n suuruinen häiriö vektorissa b vaikuttaa ratkaisuun. Merkitään δx :llä ratkaisuvektorin muutosta. Vähentämällä yhtälöt Ax = b ja A(x + δx) = b + δb puolittain, saadaan δx = A 1 δb. Siten absoluuttisen virheen normille saadaan yläraja δx A 1 δb. 8 / 14 R. Kangaslampi matriisiteoriaa
Paremmin ratkaisun virhettä kuvaa kuitenkin suhteellinen virhe δx / x, sillä lineaarisen yhtälöryhmän ratkaisun voi kerroinmatriisia skaalaamalla saada pienemmäksi, jolloin myös absoluuttinen virhe pienenee. Koska b A x niin suhteelliselle virheelle saadaan yläraja-arvio δx x A A 1 δb b. 9 / 14 R. Kangaslampi matriisiteoriaa
Määritelmä 5 Matriisin häiriöalttius on κ(a) = A A 1. Suuri häiriöalttius merkitsee siten, että pienikin suhteellinen virhe b :ssä voi aiheuttaa ratkaisuun x suuren epävarmuuden. Aivan vastaavasti voidaan tarkastella matriisin A häiriön δa aiheuttamaa virhettä ratkaisuun, ja saadaan δx δa κ(a) x + δx A. 10 / 14 R. Kangaslampi matriisiteoriaa
Esimerkki 6 [ ] 1 ɛ Lasketaan κ 1 (A), kun A =, ɛ (0, 1). 1 ɛ [ ] Nyt A 1 = 1 1 1 2 joten häiriöalttiudeksi saadaan 1/ɛ 1/ɛ κ 1 (A) = A 1 A 1 1 = 2 1 (1 + 1/ɛ) = 1 + 1/ɛ, 2 joka on suuri ɛ :n ollessa pieni. 11 / 14 R. Kangaslampi matriisiteoriaa
Normissa 2 häiriöalttius olisi hankalaa laskea annetun määritelmän perusteella, mutta onneksi se saadaan helposti singulaariarvojen avulla: Lemma 7 κ 2 (A) = σ max(a) σ min (A), missä σ max (A) on matriisin A suurin ja σ min (A) pienin singulaariarvo. Ei todisteta tällä kurssilla. Muistutus: Matriisin A singulaariarvot ovat matriisin A T A ominaisarvojen positiiviset neliöjuuret. 12 / 14 R. Kangaslampi matriisiteoriaa
riippuu (hieman) siitä, missä normissa asioita mitataan. Koska 1 = I = AA 1 A A 1, saadaan tosin κ(a) 1 jokaiselle kääntyvälle matriisille normista riippumatta. Kuten normit, myös häiriöalttiudet eri normeissa mitattuna ovat ekvivalentteja, eli poikkeavat toisistaan vain vakiokertoimella. Tämä nähdään seuraavasta lauseesta: 13 / 14 R. Kangaslampi matriisiteoriaa
Lause 8 Olkoot häiriöalttiudet κ p (A) = A p A 1 p ja κ q (A) = A q A 1 q. Tällöin on olemassa positiiviset vakiot c 1 (p, q) ja c 2 (p, q) siten, että kaikilla A C m n. c 1 κ p (A) κ q (A) c 2 κ p (A) (Todistus: G. Zielke, Some remarks on matrix norms, condition numbers, and error estimates for linear equations, Linear Algebra and its Applications, Vol. 110 (1988), pp 29-41.) 14 / 14 R. Kangaslampi matriisiteoriaa