800350A / S Matriisiteoria

Samankaltaiset tiedostot
Matriisiteoria Harjoitus 1, kevät Olkoon. cos α sin α A(α) = . sin α cos α. Osoita, että A(α + β) = A(α)A(β). Mikä matriisi A(α)A( α) on?

ominaisvektorit. Nyt 2 3 6

5 Ominaisarvot ja ominaisvektorit

800653S Matriisiteoria. Tero Vedenjuoksu

Insinöörimatematiikka D

Osoita, että täsmälleen yksi vektoriavaruuden ehto ei ole voimassa.

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

MS-C1340 Lineaarialgebra ja

1 Ominaisarvot ja ominaisvektorit

5 OMINAISARVOT JA OMINAISVEKTORIT

Matematiikka B2 - TUDI

802320A LINEAARIALGEBRA OSA I

Similaarisuus. Määritelmä. Huom.

1 Lineaariavaruus eli Vektoriavaruus

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Sisätuloavaruudet. 4. lokakuuta 2006

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Lineaarikuvauksen R n R m matriisi

Demorastitiedot saat demonstraattori Markus Niskaselta Lineaarialgebra (muut ko) p. 1/104

Insinöörimatematiikka D

1.1. Määritelmiä ja nimityksiä

Ortogonaalisen kannan etsiminen

Ennakkotehtävän ratkaisu

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä

Ominaisarvo ja ominaisvektori

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Johdatus tekoälyn taustalla olevaan matematiikkaan

Matematiikka B2 - Avoin yliopisto

Insinöörimatematiikka D

Insinöörimatematiikka D

BM20A0700, Matematiikka KoTiB2

Singulaariarvohajotelma ja pseudoinverssi

Päättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1

Alkeismuunnokset matriisille, sivu 57

Lineaarialgebra ja differentiaaliyhtälöt Laskuharjoitus 1 / vko 44

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

Avaruuden R n aliavaruus

Ominaisarvoon 4 liittyvät ominaisvektorit ovat yhtälön Ax = 4x eli yhtälöryhmän x 1 + 2x 2 + x 3 = 4x 1 3x 2 + x 3 = 4x 2 5x 2 x 3 = 4x 3.

Ominaisarvo-hajoitelma ja diagonalisointi

Determinantti 1 / 30

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja

Lineaarialgebra ja matriisilaskenta II. LM2, Kesä /141

MS-C1340 Lineaarialgebra ja

Käänteismatriisi 1 / 14

MS-A0004/A0006 Matriisilaskenta

(1.1) Ae j = a k,j e k.

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

Insinöörimatematiikka D

6. OMINAISARVOT JA DIAGONALISOINTI

Lineaarialgebra (muut ko)

6 MATRIISIN DIAGONALISOINTI

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät

802320A LINEAARIALGEBRA OSA III

Matemaattinen Analyysi / kertaus

802320A LINEAARIALGEBRA OSA II

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Lineaarialgebra ja differentiaaliyhtälöt Harjoitus 4 / Ratkaisut

Kanta ja dimensio 1 / 23

Matriisilaskenta Luento 16: Matriisin ominaisarvot ja ominaisvektorit

1 Sisätulo- ja normiavaruudet

Määritelmä 1. Olkoot V ja W lineaariavaruuksia kunnan K yli. Kuvaus L : V. Termejä: Lineaarikuvaus, Lineaarinen kuvaus.

Matikkapaja keskiviikkoisin klo Lineaarialgebra (muut ko) p. 1/210

1 Matriisit ja lineaariset yhtälöryhmät

Talousmatematiikan perusteet: Luento 9. Matriisien peruskäsitteet Yksinkertaiset laskutoimitukset Transponointi Matriisitulo

Lineaarialgebra ja matriisilaskenta I

6 Vektoriavaruus R n. 6.1 Lineaarikombinaatio

LU-hajotelma. Esimerkki 1 Matriisi on yläkolmiomatriisi ja matriisi. on alakolmiomatriisi. 3 / 24

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

Numeeriset menetelmät

Ominaisarvot ja ominaisvektorit 140 / 170

Insinöörimatematiikka D

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42

LINEAARIALGEBRA P. LUENTOMONISTE ja HARJOITUSTEHTÄVÄT

Lineaarialgebra II P

Liittomatriisi. Liittomatriisi. Määritelmä 16 Olkoon A 2 M(n, n). Matriisin A liittomatriisi on cof A 2 M(n, n), missä. 1) i+j det A ij.

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Lineaarialgebra ja matriisilaskenta II Syksy 2009 Laskuharjoitus 1 ( ) Ratkaisuehdotuksia Vesa Ala-Mattila

2.8. Kannanvaihto R n :ssä

Ratkaisuehdotukset LH 7 / vko 47

9. Lineaaristen differentiaaliyhtälöiden ratkaisuavaruuksista

Matikkapaja keskiviikkoisin klo Lineaarialgebra (muut ko) p. 1/81

Ominaisarvo ja ominaisvektori

Esimerkki 4.4. Esimerkki jatkoa. Määrää matriisin ominaisarvot ja -vektorit. Ratk. Nyt

Numeeriset menetelmät TIEA381. Luento 5. Kirsi Valjus. Jyväskylän yliopisto. Luento 5 () Numeeriset menetelmät / 28

Ortogonaalinen ja ortonormaali kanta

2.5. Matriisin avaruudet ja tunnusluvut

Talousmatematiikan perusteet: Luento 10. Matriisien peruskäsitteet Yksinkertaiset laskutoimitukset Matriisitulo Determinantti

Seuraava luento ti on salissa XXII. Lineaarialgebra (muut ko) p. 1/117

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41

x 2 x 3 x 1 x 2 = 1 2x 1 4 x 2 = 3 x 1 x 5 LINEAARIALGEBRA I Oulun yliopisto Matemaattisten tieteiden laitos 2014 Esa Järvenpää, Hanna Kiili

Bijektio. Voidaan päätellä, että kuvaus on bijektio, jos ja vain jos maalin jokaiselle alkiolle kuvautuu tasan yksi lähdön alkio.

Kanta ja Kannan-vaihto

Matriisihajotelmat. MS-A0007 Matriisilaskenta. 5.1 Diagonalisointi. 5.1 Diagonalisointi

802120P Matriisilaskenta (5 op)

Lineaariset yhtälöryhmät ja matriisit

Lineaarialgebra ja matriisilaskenta I

MS-C1340 Lineaarialgebra ja

Transkriptio:

800350A / 800693S Matriisiteoria Emma Leppälä Tero Vedenjuoksun luentomonisteen pohjalta 15 syyskuuta 2017

Sisältö 1 Lineaarialgebraa 2 11 Merkintöjä 2 12 Matriisien perusominaisuuksia 4 13 Matriisien lohkomuodot 4 14 Vektoriavaruus ja kanta 6 15 Sisätulo ja normi 7 16 Lineaariset kuvaukset 8 17 Determinantti 9 2 Matriisin astehajotelma ja LU-hajotelma 11 21 Matriisin aste 11 22 Matriisin astehajotelma 15 23 LU-hajotelma 16 24 Choleskyn hajotelma 18 3 Ominaisarvot ja ominaisvektorit 21 31 Matriisin ominaisarvot ja karakteristinen polynomi 21 32 Ominaisarvojen kertaluvut 23 4 Similaarisuusmuunnokset 25 41 Similaarisuus 25 42 Diagonalisoituvat matriisit 26 43 Unitaariset similaarisuusmuunnokset 27 44 Jordan-muoto 30 5 Singulaariarvohajotelma ja Moore-Penrose -inverssi 32 51 Definiitit matriisit ja neliöjuuri 32 52 Singulaariarvohajotelma 33 53 Moore-Penrose -inverssi 36 54 Yhtälöryhmän ratkaisuista 38 1

1 Lineaarialgebraa 11 Merkintöjä Olkoon K kunta ja n Z + Käytämme merkintää K n tarkoittamaan n-pituisten pystyvektoreiden x 1 x 2 x = = [ x 1 x 2 t x n (x i K) x n muodostamaa joukkoa Vastaavasti K (n) tarkoittaa n-pituisten vaakavektoreiden x = [ x 1 x 2 x n (x i K) muodostamaa joukkoa Alkiot x i ovat vektorin x komponentteja Tällöin (K n, +, ) ja (K (n), +, ) ovat K-kertoimisia vektoriavaruuksia kun vektoreiden yhteenlasku ja skalaaritulo määritellään normaaliin tapaan komponenteittain Kun m, n Z +, niin kaikkien sellaisten m n-matriisien a 11 a 12 a 1n A = [ a ij m n = a 21 a 22 a 2n, a m1 a m2 a mn joukkoa, missä alkiot a ij K kaikilla i = 1, 2,, m ja j = 1, 2,, n, merkitään K m n Sanotaan, että a ij on matriisin A = [ a ij m n K m n (i, j)-alkio Jos m = n, niin matriisi A = [ a ij n n K n n on neliömatriisi Neliömatriisin (i, i)-alkioita kutsutaan diagonaalialkioiksi Kahden matriisin A K m n ja B K n k tulo AB on matriisi [ c ij m k K m k, missä n c ij = a il b lj l=1 = a i1 b 1j + a i2 b 2j + + a in b nj = (A:n i:s rivi) (B:n j:s sarake) 2

11 MERKINTÖJÄ 3 Matriisin A = [ a ij m n K m n transpoosi on n m-matriisi a 11 a 21 a m1 A t = [ a ji n m = a 12 a 22 a m2 K n m a 1n a 2n a mn Matriisin A = [ a ij m n C m n konjugaattitranspoosi (tai adjungaatti) A on n m-matriisi a 11 a 21 a m1 A = A t = [ a ji n m = a 12 a 22 a m2 C n m, a 1n a 2n a mn missä a ij on alkion a ij kompleksikonjugaatti (liittoluku) Jos A R m n, niin A = A t Määritelmä 11 Neliömatriisi A = [ a ij n n K n n on yläkolmiomatriisi, jos a ij = 0 aina kun i > j; alakolmiomatriisi, jos a ij = 0 aina kun i < j; diagonaalimatriisi, jos a ij = 0 aina kun i j Neliömatriisi A K n n on siis diagonaalimatriisi jos se on sekä ylä- että alakolmiomatriisi Diagonaalimatriisia voidaan merkitä A = diag(a 11, a 22,, a nn ) Määritelmä 12 Matriisia I = I n = diag(1, 1,, 1) K n n sanotaan identiteettimatriisiksi (tai yksikkömatriisiksi) Jos B K m n, niin I m B = BI n = B Määritelmä 13 Neliömatriisi A K n n on säännöllinen tai kääntyvä (en nonsingular, invertible) jos on olemassa sellainen matriisi B K n n, että AB = BA = I Tällöin merkitään B = A 1 ja sanotaan, että A 1 on matriisin A käänteismatriisi Muussa tapauksessa sanotaan, että A on singulaarinen Huomautus Jo yksi ehdoista AB = I ja BA = I riittää takamaan sen, että A on säännöllinen ja B = A 1 Määritelmä 14 Kroneckerin delta δ ij on seuraava kahden muuttujan (i ja j) funktio: { 0 jos i j δ ij = 1 jos i = j Täten esimerkiksi identiteettimatriisin I n (i, j)-alkio on δ ij

12 MATRIISIEN PERUSOMINAISUUKSIA 4 12 Matriisien perusominaisuuksia Matriisien ja vektoreiden peruslaskutoimitukset ja -ominaisuudet oletetaan tunnetuksi Alla kuitenkin listattuna muutamia usein käytettyjä ominaisuuksia Seuraavassa kaikkien matriisitulojen ja -summien oletetaan olevan määriteltyjä: 1) A + B = B + A mutta yleisesti AB BA Matriisit AB ja BA eivät välttämättä ole edes samaa kokoa 2) (AB) 1 = B 1 A 1 ja (A 1 ) 1 = A, kun A ja B ovat säännöllisiä 3) Ehdosta AB = 0 ei välttämättä seuraa, että A = 0 tai B = 0 (vrt esim homogeeninen lineaarinen yhtälöryhmä Ax = 0) 4) Edellisen kohdan nojalla voi olla A C vaikka AB = CB 5) Jos A, B K n n ovat yläkolmiomatriiseja, niin myös AB ja A 1 (jos A on säännöllinen) ovat yläkolmiomatriiseja Vastaava sääntö pätee alakolmiomatriiseille ja siten myös diagonaalimatriiseille 6) (A + B) = A + B ja (AB) = B A 7) (A ) = A ja (A ) 1 = (A 1 ) Huomautus Jos A R m n, niin A = A t, joten kohtien 6) ja 7) ominaisuudet pätevät myös transpooseille 13 Matriisien lohkomuodot Matriisille A K m n saadaan lohkomuotoja kun ositetaan A reunasta reunaan ulottuvilla vaaka- ja pystyviivoilla A 11 A 12 A 1q A 21 A 22 A 2q A = A p1 A p2 A pq Jos lohko A ij on kokoa m i n j, niin m = m 1 + m 2 + + m p ja n = n 1 + n 2 + + n q Huomautus a) Olkoon A K n n Eräs usein käytetty lohkomuoto on: a 11 a 12 a 1,n 1 a 1n a 21 a 22 a 2,n 1 a 2n A = a n 1,1 a n 1,2 a n 1,n 1 a n 1,n a n1 a n2 a n,n 1 a nn = A n 1 v u a nn,

13 MATRIISIEN LOHKOMUODOT 5 missä A n 1 K (n 1) (n 1) ja u, v t K n 1 Tällaista lohkomuotoa voidaan hyödyntää (induktio)todistuksissa b) Yleisessä lohkomuodossa olevien matriisien tulo voidaan muodostaa vastaavasti kuin normaali matriisitulo Olkoon A 11 A 12 A 1q B 11 B 12 B 1s A 21 A 22 A 2q B A = 21 B 22 B 2s ja B = A p1 A p2 A pq B q1 B q2 B qs Tällöin tulon AB (i, j)-lohko on q A il B lj, l=1 kunhan lohkojen koot sopivat yhteen Siis tulon AB (i, j)-lohko on matriisin A i:s lohkorivi kertaa matriisin B j:s lohkosarake Lohkomuotoisten matriisien kertominen siis onnistuu kuten tavanomainen matriisitulo aina, kun tarvittavat lohkotulot ovat määriteltyjä c) Olkoon A K m n ja B K n k Tehdään matriiseille A ja B sarake- ja riviositukset A 1 A 2 A = [ A 1 A 2 A n =, A m B 1 B 2 B = [ B 1 B 2 B k = B n Tällöin saamme [ a1 a 2 a n B = a1 B 1 + a 2 B 2 + + a n B n; b 1 b 2 A = b 1A 1 + b 2 A 2 + + b n A n b n A 1B A 2B AB = = [ AB 1 AB 2 AB k A mb

14 VEKTORIAVARUUS JA KANTA 6 Jokainen A i B on siis B:n rivien ja jokainen AB i on A:n sarakkeiden lineaarinen yhdiste Siis matriisin AB rivit ovat matriisin B rivien lineaarisia yhdisteitä ja sen sarakkeet ovat matriisin A sarakkeiden lineaarisia yhdisteitä Määritelmä 15 Neliömatriisi A K n n on lohkodiagonaalinen, mikäli sillä on lohkoesitys A 1 0 0 0 A 2 0 A =, 0 0 A k missä A i on neliömatriisi kaikilla i ja k 2 Tällöin voidaan merkitä A = diag(a 1, A 2,, A k ) 14 Vektoriavaruus ja kanta Olkoon V epätyhjä joukko ja K kunta Oletetaan, että seuraavat laskutoimitukset on määritelty: (x, y) x + y : V V V (α, x) αx : K V V (yhteenlasku) (skalaaritulo) Määritelmä 16 Joukko V on K-kertoiminen vektoriavaruus, jos edellä määritellyt laskutoimitukset toteuttavat seuraavat ehdot: (VA1) x + (y + z) = (x + y) + z; (VA2) x + y = y + x; (VA3) on olemassa 0 V V (nollavektori), jolle x + 0 V = x; (vasta- (VA4) Jos x V, niin on olemassa sellainen y V, että x + y = 0 V vektori, merkitään y = x); (VA5) α(x + y) = αx + αy; (VA6) (α + β)x = αx + βx; (VA7) (αβ)x = α(βx); (VA8) 1 K x = x, missä 1 K on kunnan K ykkösalkio kaikilla x, y, z V ja α, β K Huomautus Kun kerroinkunnalla K ei ole merkitystä tai se on tiedossa asianyhteydestä, puhutaan usein pelkästään vektoriavaruudesta tai avaruudesta V

15 SISÄTULO JA NORMI 7 Määritelmä 17 Olkoon V vektoriavaruus ja U V Tällöin U on avaruuden V aliavaruus, jos (AA1) x + y U kaikilla x, y U; (AA2) αx U kaikilla α K ja x U; (AA3) 0 U, ts U Määritelmä 18 Olkoon S V epätyhjä Joukon S virittämä avaruuden V osajoukko L(S) koostuu kaikista joukon S vektoreiden lineaarisista yhdisteistä Siis L(S) = {α 1 x 1 + + α k x k x i S, α i K kaikilla i ja k Z + } Määritelmä 19 Sanotaan, että K-kertoimisen vektoriavaruuden V osajoukko S = {x 1, x 2,, x k } on lineaarisesti riippuva (tai lineaarisesti sidottu), jos yhtälöllä α 1 x 1 + α 2 x 2 + + α k x k = 0 (α i K kaikilla i) on epätriviaali ratkaisu, ts α i 0 jollain i = 1, 2,, k Jos yhtälöllä on vain triviaaliratkaisu (α 1 = α 2 = = α k = 0), niin joukko S on lineaarisesti riippumaton (tai lineaarisesti vapaa) Määritelmä 110 Olkoon U vektoriavaruuden V aliavaruus Tällöin joukko S = {x 1, x 2,, x k } U on aliavaruuden U kanta jos (i) U = L(S) ja (ii) S on lineaarisesti riippumaton Lause 111 Jokaisella vektoriavaruudella on kanta Lause 112 Olkoon V {0} vektoriavaruus kunnan K yli Jos avaruudella V on äärellinen kanta, niin sen jokaisessa kannassa on yhtä monta alkiota Jos vektoriavaruuden V kannassa on n vektoria, sanotaan avaruuden V olevan n-ulotteinen tai että avaruudella V on dimensio n ja merkitään dim V = n Jos avaruudella V ei ole äärellistä kantaa, niin V on ääretönulotteinen Lause 113 Jos V on äärellisulotteinen vektoriavaruus ja S = {v 1,, v k } V on lineaarisesti riippumaton joukko, niin S voidaan aina laajentaa avaruuden V kannaksi Esimerkki 114 Joukko S = {e 1, e 2,, e n }, missä e i = (0,, 0, 1, 0,, 0) t kaikilla i, on avaruuden K n luonnollinen kanta Siis dim K n = n 15 Sisätulo ja normi Määritelmä 115 Olkoon V vektoriavaruus, jonka kerroinkunta K on joko R tai C Kuvaus : V V K on avaruuden V sisätulo, mikäli

16 LINEAARISET KUVAUKSET 8 (a) x y = y x ; (b) x + y z = x z + y z ; (c) αx y = α x y ; (d) x x 0 ja x x = 0 x = 0 kaikilla x, y, z V ja kaikilla α K Lause 116 Olkoon x, y C n Kuvaus x y = y x = x 1 y 1 + + x n y n on avaruuden C n sisätulo Määritelmä 117 Olkoon V vektoriavaruus ja sen sisätulo Tällöin x = x x on vektorin x V (sisätulon indusoima) normi Määritelmä 118 Vektorijoukko {x 1,, x k } C n on ortogonaalinen, mikäli x i x j = 0 aina kun i j Joukko {x 1,, x k } C n on ortonormaali, mikäli joukko on ortogonaalinen ja x 1 = = x k = 1 Vektorit x 1,, x k C n ovat siis ortonormaalit jos x i x j = δ ij Ortogonaalinen joukko joka ei sisällä nollavektoria on lineaarisesti riippumaton Lause 119 (Gram-Schmidt) Jokaisella äärellisulotteisella vektoriavaruudella V {0} on ortonormaali kanta Gram-Schmidtin ortogonalisointimenetelmään on tutustuttu Lineaarialgebran kurssilla Lopuksi ortogonalisoidut vektorit normitetaan (jaetaan vektori sen pituudella) 16 Lineaariset kuvaukset Lineaariset kuvaukset ovat tärkeitä matemaattisia työkaluja Esimerkiksi analyysin perusoperaatiot (mm derivaatta ja integraali) ovat lineaarisia kuvauksia Lisäksi lineaariset yhtälöryhmät ovat tulkittavissa lineaarisia kuvauksia koskevina yhtälöinä Oletetaan, että vektoriavaruudet V ja W ovat K-kertoimisia Määritelmä 120 Kuvaus A : V W on lineaarinen, mikäli (i) A(x + y) = A(x) + A(y) (ii) A(cx) = ca(x) kaikilla x, y V ja c K Vektoria A(x) W voidaan merkitä lyhyemmin Ax

17 DETERMINANTTI 9 Määritelmä 121 Olkoon A : V W lineaarinen kuvaus Tällöin kuvauksen A ydin N(A) on joukko N(A) = {x V : Ax = 0 W } = A 1 ({0 W }) ja kuvauksen A kuva-avaruus R(A) on joukko R(A) = {y W : y = Ax jollakin x V } = A(V ) Lause 122 Lineaarisen kuvauksen A : V W ydin N(A) on avaruuden V aliavaruus ja kuva-avaruus R(A) on avaruuden W aliavaruus Lause 123 Jos A : V W on lineaarinen kuvaus ja V on äärellisulotteinen, niin dim V = dim N(A) + dim R(A) Olkoot V ja W äärellisulotteisia K-kertoimisia vektoriavaruuksia Kun niiden kannat on kiinnitetty, voidaan lineaariset kuvaukset samaistaa matriisien kanssa: Lause 124 Olkoon A K m n Määritellään kuvaus L A : K n K m asettamalla L A (x) = Ax kaikilla x K n Tällöin L A on lineaarinen kuvaus Lause 125 Olkoon L : K n K m lineaarinen kuvaus Tällöin on olemassa matriisi A K m n siten, että L(x) = Ax kaikilla x K n Matriisin A i:s sarake on vektori L(e i ) 17 Determinantti Määritelmä 126 Neliömatriisin A K n n ij:s alimatriisi A ij K (n 1) (n 1) saadaan poistamalla matriisista A i:s rivi ja j:s sarake Matriisin A determinantti det A K voidaan laskea nk Laplace-kehitelmän avulla joko i:nnen rivin tai j:nnen sarakkeen suhteen: det A = det A = missä det[a = a kaikilla a K n ( 1) i+k a ik det A ik k=1 n ( 1) k+j a kj det A kj, k=1 Seuraavassa Matriisilaskennan kurssilta tuttuja determinantin ominaisuuksia: D1 Jos A on matriisi joka on saatu matriisista A vaihtamalla kahden rivin tai sarakkeen paikkaa, niin det A = det A D2 Jos matriisissa A on kaksi samaa riviä tai samaa saraketta, niin det A = 0

17 DETERMINANTTI 10 D3 Jos A on matriisi joka on saatu matriisista A kertomalla jotakin sen riviä tai saraketta luvulla λ K, niin det A = λ det A D4 Jos A on matriisi joka on saatu matriisista A lisäämällä johonkin sen riviin (sarakkeeseen) toinen rivi (sarake) kerrottuna jollain luvulla λ K, niin det A = det A D5 Jos matriisin A sarake on A i = A i + A i, niin det A = det A + det A, missä A = [A 1,, A i,, A n ja A = [A 1,, A i,, A n Vastaavasti rivien suhteen D6 det A t = det A ja det A = det A D7 Jos A, B K n n, niin det AB = det A det B D8 Jos matriisi A on säännöllinen, niin det A 1 = 1 det A Lemma 127 Jos A = [ a ij Kn n det A = a 11 a 22 a nn on ylä- tai alakolmiomatriisi, niin Määritelmä 128 Olkoon A = [ a ij Km n Matriisin A kokoa k k oleva minori on a i1j ( ) 1 a i1j 2 a i1j k i1 i A 2 i k a i2j 1 a i2j 2 a i2j k := det j 1 j 2 j k, a ik j 1 a ik j 2 a ik j k missä k = 1, 2,, min{m, n} Matriisista A siis poistetaan ensin kaikki muut rivit paitsi rivit i 1, i 2,, i k (i 1 < i 2 < < i k ) ja sitten kaikki muut sarakkeet paitsi sarakkeet j 1, j 2,, j k (j 1 < j 2 < < j k ) Kokoa k k oleva minori on näin saadun k k-matriisin determinantti Neliömatriisin A K n n kokoa k oleviksi pääminoreiksi (en principal minors) kutsutaan minoreita ( ) i1 i A 2 i k i 1 i 2 i k Neliömatriisin A K n n kokoa 1 olevat pääminorit ovat siis diagonaalialkiot a 11, a 22,, a nn ja sen kokoa n oleva pääminori on det A

2 Matriisin astehajotelma ja LU-hajotelma 21 Matriisin aste Olkoot V ja W K-kertoimisia äärellisulotteisia vektoriavaruuksia Tarkastellaan lineaarista kuvausta A : V W Lineaarisen kuvauksen A aste r(a) määritellään sen kuva-avaruuden R(A) dimensiona, ts r(a) = dim R(A) Käytetään matriisin ytimelle ja kuva-avaruudelle samoja merkintöjä kuin lineaaristen kuvausten tapauksessa Siis jos A K m n, niin N(A) = {x K n : Ax = 0}, R(A) = {y K m : Ax = y jollakin x K n } Usein ytimelle ja kuva-avaruudelle käytetään myös merkintöjä Ker (A) ja Im (A) Matriisin A K m n aste voidaan määritellä usealla (yhtäpitävällä) tavalla Määritelmä 21 Olkoon A K m n (i) Matriisin A riviaste on sen lineaarisesti riippumattomien rivien maksimimäärä Siis matriisin A riviaste on dim Row (A) = dim L{A (1), A (2),, A (m) }, missä A (i) on matriisin A i:s rivi (ii) Matriisin A sarakeaste on sen lineaarisesti riippumattomien sarakkeiden maksimimäärä Siis matriisin A sarakeaste on dim Col (A) = dim L{A 1, A 2,, A n }, missä A j on matriisin A j:s sarake (iii) Matriisin A determinanttiaste on suurin sellainen k, että matriisin A jokin k k-minori on nollasta eroava, ts jokin minori ( ) i1 i A 2 i k 0 j 1 j 2 j k 11

21 MATRIISIN ASTE 12 Lause 22 Jos A K m n, niin dim R(A) = dim Col (A) Todistus Osoitetaan, että R(A) = Col (A) Olkoon A K m n ja e j vektoriavaruuden K n luonnollisen kannan j:s vektori Tällöin Ae j = A j, matriisin A j:s sarake Täten Col (A) R(A) Jos x = [ x 1 x 2 x n t K n, niin Ax = x 1 A 1 + + x n A n, eli jokainen kuva-avaruuden vektori y = Ax R(A) on matriisin A sarakkeiden lineaarinen yhdiste Siis R(A) Col (A) Täten R(A) = Col (A) ja siis dim R(A) = dim Col (A) Lause 23 Jos A K m n, niin dim Row (A) = dim Col (A) Todistus Olkoon A K m n ja dim Col (A) = r Olkoon {C 1, C 2,, C r } sarakeavaruuden Col (A) kanta Muodostetaan matriisi C = [ C 1 C 2 C r K m r Jokainen matriisin A sarake on matriisin C sarakkeiden lineaarinen yhdiste Tällöin siis A = CR, missä a 11 a 12 a 1n a 21 a 22 a 2n R = K r n a r1 a r2 a rn ja A j = a 1j C 1 + + a rj C r kaikilla j = 1,, n Vastaavasti matriisin A rivit ovat matriisin R rivien lineaarisia yhdisteitä Matriisissa R on r riviä, joten voidaan päätellä, että dim Row (A) r = dim Col (A) Voimme tehdä vastaavan päättelyn mille tahansa matriisille, esimerkiksi matriisin A transpoosille Siis dim Row (A t ) dim Col (A t ) Matriisin A t rivit ovat matriisin A sarakkeita ja sen sarakkeet matriisin A rivejä Siis dim Col (A) = dim Row (A t ) dim Col (A t ) = dim Row (A) Täten dim Row (A) = dim Col (A) Lause 24 Matriisin A K m n determinanttiaste on sama kuin sen sarakeaste Todistus Olkoon matriisin A K m n determinanttiaste k ja dim Col (A) = dim Row (A) = r Osoitetaan ensin, että r k Koska rivien tai sarakkeiden järjestyksen muuttaminen matriisissa A ei vaikuta determinanttiasteeseen eikä sarakeasteeseen, voimme olettaa, että ( ) 1 2 k A 0 1 2 k Osoitetaan, että yo minoria vastaavan k k-matriisin sarakkeet ovat lineaarisesti riippumattomat Oletetaan siis, että α 1 a 11 a 12 a 1k a 21 + α a 22 2 + + α a 2k k = 0, a k1 a k2 a kk

21 MATRIISIN ASTE 13 missä α i K kaikilla i Tällöin a 11 a 12 a 1k α 1 a 21 a 22 a 2k α 2 = 0 a k1 } a k2 {{ a kk α k }}{{} merk B merk x ( ) 1 2 k Koska det B = A 0, niin matriisi B on säännöllinen Siis 1 2 k yhtälöllä Bx = 0 on vain triviaaliratkaisu x = 0, eli α 1 = = α k = 0 ja sarakkeet ovat siis lineaarisesti riippumattomia Tällöin myös alkuperäisen matriisin A sarakkeet A 1, A 2,, A k ovat lineaarisesti riippumattomia, joten r = dim Col (A) k Osoitetaan sitten, että k r Koska dim Row (A) = r, niin matriisilla A on r lineaarisesti riippumatonta riviä Muodostetaan matriisi C K r n poistamalla matriisista A kaikki muut rivit Nyt dim Row (C) = r = dim Col (C), joten matriisilla C on r lineaarisesti riippumatonta saraketta Muodostetaan nyt matriisi D K r r poistamalla matriisista C kaikki muut sarakkeet Tällöin matriisin D sarakkeet ovat lineaarisesti riippumattomia, joten yhtälöllä Dx = x 1 D 1 + + x r D r = 0 on vain triviaaliratkaisu x = 0 Täten det D 0 eli matriisilla A on nollasta eroava r r-minori, mistä seuraa, että k r Matriisin A K m n aste r(a) voidaan siis määritellä ekvivalentisti rivi-, saraketai determinanttiasteena tai matriisin kuva-avaruuden dimensiona Lisäksi saamme seuraavan tuloksen käyttämällä hyväksi tuttua lausetta: jos A : V W ( dim V < ) on lineaarinen kuvaus, niin dim V = dim R(A) + dim N(A) Lause 25 Jos A K m n, niin r(a) = dim R(A) = n dim N(A) Seuraus 26 Olkoon A K n n Tällöin seuraavat ehdot ovat yhtäpitäviä: (a) Matriisi A on säännöllinen; (b) Käänteismatriisi A 1 on olemassa; (c) det A 0; (d) r(a) = n; (e) Matriisin A rivit ovat lineaarisesti riippumattomat; (f) Matriisin A sarakkeet ovat lineaarisesti riippumattomat; (g) dim R(A) = n; (h) dim N(A) = 0; (i) Yhtälöllä Ax = b on täsmälleen yksi ratkaisu aina kun b K n ; (j) Homogeeniyhtälöllä Ax = 0 on vain triviaaliratkaisu x = 0

21 MATRIISIN ASTE 14 Lause 27 (i) r(a + B) r(a) + r(b) aina kun A + B on määritelty; (ii) r(ab) min{r(a), r(b)} aina kun AB on määritelty; (iii) r(ab) = r(a) ja r(ba) = r(a) aina kun B on säännöllinen ja matriisien tulo on määritelty, ts säännöllisellä matriisilla kertominen ei vaikuta matriisin asteeseen Todistus (i) Olkoon A = [ A 1 A 2 A n Km n ja B = [ B 1 B 2 B n K m n sarakeosituksia Tällöin joten A + B = [ A 1 + B 1 A 2 + B 2 A n + B n, r(a + B) = dim Col (A + B) = dim L{A 1 + B 1, A 2 + B 2,, A n + B n } dim L{A 1, A 2,, A n, B 1, B 2,, B n } dim L{A 1, A 2,, A n } + dim L{B 1, B 2,, B n } = dim Col (A) + dim Col (B) = r(a) + r(b) (ii) Tarkastellaan matriiseja A K m p ja B K p n ja merkitään matriisien A ja B rivi- ja sarakeosituksia seuraavasti: A 1 A = [ A 2 A 1 A 2 A p = A m B 1 B 2 B p B = [ B 1 B 2 B n = Nyt matriisin AB i:s sarake on b 1i AB i = [ b 2i A 1 A 2 A p = b 1iA 1 + b 2i A 2 + + b pi A p, b pi joten matriisin AB sarakkeet AB i L{A 1, A 2,, A p } = Col (A) kaikilla i = 1, 2,, n Nähdään siis sarakeasteen avulla, että r(ab) r(a)

22 MATRIISIN ASTEHAJOTELMA 15 Toisaalta matriisin AB j:s rivi on B 1 B 2 A jb = [ a j1 a j2 a jp = a j1b 1 + a j2 B 2 + + a jp B p B p Siis matriisin AB rivit A j B L{B 1, B 2,, B p} = Row (B) kaikilla j = 1, 2,, m, joten r(ab) r(b) riviasteen avulla Täten saadaan (iii) Edellisen kohdan nojalla r(ab) min{r(a), r(b)} r(a) = r(abb 1 ) r(ab) r(a), joten r(a) = r(ab) aina kun B on säännöllinen ja tulo AB on määritelty Vastaava päättely osoittaa, että r(a) = r(ba) kun B on säännöllinen ja tulo BA on määritelty 22 Matriisin astehajotelma Seuraava lause osoittaa, että jokainen matriisi A K m n voidaan esittää täyttä astetta olevien matriisien tulona Lause 28 (Astehajotelma) Olkoon matriisin A K m n aste r(a) = r Tällöin matriisi A voidaan esittää muodossa A = P Q, missä P K m r, Q K r n ja r(p ) = r(q) = r Lisäksi on olemassa sellaiset säännölliset matriisit B K m m ja C K n n, että [ Ir 0 A = B C 0 0 m n Todistus Olkoon A K m n ja r(a) = r Tällöin r n ja r m Tehdään matriisille A sarakeositus A = [ A 1 A 2 A n Koska r = r(a), niin sarakeasteen määritelmän mukaan on olemassa sellaiset lineaarisesti riippumattomat sarakkeet A k1, A k2,, A kr, että A i = α 1i A k1 + α 2i A k2 + + α ri A kr = [ α 2i A k1 A k2 A kr α ri α 1i

23 LU-HAJOTELMA 16 aina kun i = 1, 2,, n Täten A = [ A 1 A 2 A n α 11 α 12 α 1n = [ α 21 α 22 α 2n A k1 A k2 A kr }{{} merk P α r1 } α r2 {{ α rn } merk Q Nyt siis P K m r ja Q K r n Jos r(q) < r, niin r = r(a) = r(p Q) min{r(p ), r(q)} < r, mikä on ristiriita Siis sarakeasteen avulla r(p ) = r ja r(q) = r Täydennetään matriisi P m m-matriisiksi B lisäämällä m r kappaletta lineaarisesti riippumattomia sarakkeita Tällöin r(b) = m sarakeasteen määritelmän nojalla Samoin voidaan täydentää matriisi Q sellaiseksi n n-matriisiksi C, että r(c) = n riviasteen määritelmän nojalla Täten B ja C ovat säännöllisiä ja B = [ P R [ Q ja C = S Lisäksi [ Ir 0 B C = [ P R [ [ I r 0 Q 0 0 0 0 S [ Ir 0 missä K 0 0 m n = P Q = A, Edellisen lauseen todistus antaa menetelmän astehajotelman A = P Q laskemiselle Ensin etsitään matriisin A aste r(a) = r ja r kappaletta matriisin A lineaarisesti riippumattomia sarakkeita Näistä kantasarakkeista muodostetaan matriisi P Esitetään sitten kaikki matriisin A sarakkeet kantasarakkeiden lineaarisina yhdisteinä Esitysten kertoimista muodostetaan matriisi Q Kantasarakkeiksi voidaan myös valita mitkä tahansa r pystyvektoria jotka virittävät sarakeavaruuden Col (A) 23 LU-hajotelma Jos neliömatriisi A K n n voidaan hajottaa ala- ja yläkolmiomatriisin tuloksi A = LU, niin esimerkiksi determinantin laskeminen ja lineaarisen yhtälöryhmän Ax = b ratkaiseminen helpottuu huomattavasti Yhtälöryhmä Ax = b voidaan ratkaista nopeasti ratkaisemalla ensin yhtälö Ly = b ja sen jälkeen yhtälö Ux = y Määritelmä 29 Matriisin A K n n johtavat pääminorit ovat minorit ( ( ) ( ) 1 1 2 1 2 n A, A,, A 1) 1 2 1 2 n

23 LU-HAJOTELMA 17 Lause 210 (LU-hajotelma) Olkoon A K n n ja ( ) 1 2 k A 0 1 2 k kaikilla k = 1, 2,, n 1 Tällöin matriisilla A on hajotelma A = LU, missä U on yläkolmiomatriisi ja L on sellainen alakolmiomatriisi, jonka diagonaalialkiot ovat kaikki ykkösiä Lisäksi matriisit L ja U ovat yksikäsitteisiä Todistus Olkoon A i matriisin A vasen i i-yläkulma, ts a 11 a 1i A i = a i1 a ii Tällöin A = A n ja kunkin yläkulman A i johtavat pääminorit ovat myös matriisin A johtavia pääminoreita Lisäksi oletuksen mukaan ne ovat nollasta eroavia kokoon n 1 saakka Osoitetaan induktiolla, että väite pätee matriiseille A i kaikilla i = 1,, n Kun i = 1 niin väite on tosi, sillä A 1 = [a 11 = [1[a 11 on vaadittu LU-hajotelma ja selvästi yksikäsitteinen Oletetaan, että väite pätee matriisille A k 1 (missä k 1 < n), ts A k 1 = L k 1 U k 1, missä matriisit L k 1 ja U k 1 ovat yksikäsitteiset vaadittua muotoa olevat matriisit Nyt oletusten mukaan 0 det A k 1 = det L k 1 det U k 1 = 1 k 1 det U k 1 = det U k 1 Siis det U k 1 0 ja det L k 1 = 1 0, joten matriisit U k 1 ja L k 1 ovat säännöllisiä Tarkastellaan nyt väitettä matriisille A k Lohkotaan matriisi A k seuraavasti: A k = L k = L k 1 0 x 1 A k 1 v k k u a kk U k = k k missä u, v t K k 1 Määritellään nyt matriisit L k ja U k : U k 1 0 α y Osoitetaan, että yhtäsuuruus A k = L k U k pätee sopivilla vektoreiden x t, y K k 1 sekä vakion α K valinnoilla Nyt A k = L k U k jos ja vain jos A k 1 = L k 1 U k 1, u = L k 1 y, v = xu k 1 ja a kk = xy + 1α Siis A k 1 = L k 1 U k 1 (tosi induktio-oletuksen nojalla) x = vu 1 k 1 (onnistuu koska U k 1 on säännöllinen) y = L 1 k 1 u (onnistuu koska L k 1 on säännöllinen) α = a kk xy k k

24 CHOLESKYN HAJOTELMA 18 Lisäksi yo ehdot toteutuvat yksikäsitteisesti, joten matriisi A k on yksikäsitteisesti haluttua muotoa A k = L k U k aina kun k n Siis väite on tosi myös matriisille A = A n Kirjoitetaan hajotelma A = LU auki matriisiyhtälönä 1 0 0 u a 11 a 11 u 12 u 1n 1n = l 21 1 0 u 22 u 2n a n1 a nn 0 l n1 l n,n 1 1 0 0 u nn Ratkaistavana on yhteensä n 2 tuntematonta ja n 2 yhtälöä Kun hajotelmaa ei ole, päädytään ristiriitaan Matriisin LU-hajotelmasta on olemassa myös parempi versio kun matriisi A C n n on positiivisesti definiitti Tällöin matriisille A saadaan nk Choleskyn hajotelma A = LL, missä L on alakolmiomatriisi 24 Choleskyn hajotelma Määritelmä 211 Neliömatriisi A C n n on hermiittinen jos se on itsensä konjugaattitranspoosi, eli jos A = A Huomautus Jos A = [ a ij Cn n on hermiittinen, niin a ii i = 1, 2,, n R kaikilla Määritelmä 212 Neliömatriisi A C n n on positiivisesti definiitti jos se on hermiittinen ja jos x Ax > 0 aina kun x C n \ {0} Huomautus Jos A = [ a ij Cn n on positiivisesti definiitti, niin a ii > 0 kaikilla i = 1, 2,, n, sillä a ii = e i Ae i > 0, missä e i C n on luonnollisen kannan vektori Lemma 213 Jos A C n n on positiivisesti definiitti, niin jokainen matriisi a 11 a 12 a 1k a 21 a 22 a 2k A k = (k n) a k1 a k2 a kk on myös positiivisesti definiitti Todistus Hermiittisyys on selvä Olkoon x k C k \ {0} ja täydennetään vektori x k avaruuden C n vektoriksi x asettamalla koordinaatteihin k + 1, k + 2,, n nollat Tällöin x ka k x k = x Ax > 0 oletuksen nojalla k k

24 CHOLESKYN HAJOTELMA 19 Lemma 214 Jos A C n n on positiivisesti definiitti, niin det A > 0 Todistus Ominaisarvoihin tutustutaan vasta seuraavassa kappaleessa, joten jätetään todistus tässä vaiheessa välistä Olkoon A C n n positiivisesti definiitti Tällöin 0 < x Ax = x (λx) = λ x x = λ x 2 aina kun λ on matriisin A ominaisarvo ja x sitä vastaava ominaisvektori Täten positiivisesti definiitin matriisin ominaisarvot ovat aidosti positiivisia Koska matriisin determinantti on sen ominaisarvojen tulo, niin myös det A > 0 Huomautus Jos A C n n on positiivisesti definiitti, niin det A 0, joten matriisilla A on käänteismatriisi ja jokaisella yhtälöllä Ax = b on yksikäsitteinen ratkaisu x = A 1 b Lemma 215 Olkoon A C n n säännöllinen Tällöin AA on positiivisesti definiitti Todistus Nyt (AA ) = (A ) A = AA, joten AA on hermiittinen Jos x C n \ {0}, niin x (AA )x = (x A)(A x) = (A x) (A x) = A x A x = A x 2 0 Lisäksi A x 0, joten x (AA )x > 0 ja siis AA on positiivisesti definiitti Lause 216 (Choleskyn hajotelma) Olkoon A C n n positiivisesti definiitti Tällöin A = LL, missä L on alakolmiomatriisi jonka diagonaalialkiot ovat aidosti positiivisia Lisäksi hajotelma on yksikäsitteinen Todistus Osoitetaan lause induktiolla matriisin A C n n koon suhteen Jos A on positiivisesti definiitti 1 1-matriisi, niin A = [ a 11, missä a11 > 0 Tällöin A = LL, missä L = [ a11 ja hajotelma on yksikäsitteinen Olkoon matriisin A C n n i i-yläkulma a 11 a 12 a 1i a 21 a 22 a 2i A i = a i1 a i2 a ii Oletetaan, että väite on tosi matriisille A k 1 (k 1 < n), joka on positiivisesti definiitti Siis A k 1 = L k 1 L k 1, missä L k 1 on vaadittua muotoa ja yksikäsit-

24 CHOLESKYN HAJOTELMA 20 teinen Tarkastellaan matriisia A k ja pyritään esittämään se lohkomuodossa A k = A k 1 b b a kk k k = L k 1 0 c α L = k 1 L k 1 c L k 1 L k 1 c 0 α L k 1 c c c + αα Ylläoleva lohkomuotoinen tulo on voimassa jos voidaan valita vektori c C k 1 ja vakio α C siten, että b = L k 1 c ja a kk = c c+ α 2 Koska det L k 1 > 0, niin L k 1 on säännöllinen Täten voidaan valita vektori c = L 1 k 1 b yksikäsitteisesti Osoitetaan vielä, että vakio α C voidaan valita siten, että α 2 = a kk c c Riittää osoittaa, että a kk c c > 0, jolloin voimme valita α = a kk c c Nyt 0 < det A k = det sillä = det A k 1 b A k 1 b = det A k 1 b b A 1 k 1 A k 1 a kk b 0 a kk c c = det A k 1 (a kk c c), b A 1 k 1 b = b (L k 1 L k 1) 1 b = b (L 1 k 1 ) L 1 k 1 b = (L 1 k 1 b) (L 1 k 1 b) = c c det A k det A k 1 b a kk b A 1 k 1 b Nyt myös det A k 1 > 0, joten a kk c c = > 0 Koska matriisin L k diagonaalialkioiden on oltava aidosti positiivisia, myös α = a kk c c > 0 valitaan siis yksikäsitteisesti Siis A k = L k L k, missä L k on vaadittua muotoa ja yksikäsitteinen Väite seuraa induktioperiaatteen nojalla Seuraus 217 Olkoon A C n n säännöllinen Tällöin A on positiivisesti definiitti jos ja vain jos sillä on Choleskyn hajotelma Todistus Lemma 215 ja lause 216

3 Ominaisarvot ja ominaisvektorit 31 Matriisin ominaisarvot ja karakteristinen polynomi Olkoon K algebrallisesti suljettu kunta, eli jokainen K-kertoiminen polynomi voidaan esittää astetta 1 olevien tekijöiden tulona p(λ) = a 0 λ n + a 1 λ n 1 + + a n 1 λ + a n = a 0 (λ λ 1 )(λ λ 2 ) (λ λ n ), missä λ 1, λ 2,, λ n K (a 0 0) Määritelmä 31 Olkoon A K n n Tällöin λ K on matriisin A ominaisarvo jos on olemassa vektori x K n \ {0} siten, että Ax = λx Tällöin x K n on matriisin A ominaisarvoa λ vastaava ominaisvektori Matriisin A spektri σ(a) on matriisin A kaikkien ominaisarvojen muodostama joukko Matriisin ominaisvektorit saadaan siis yhtälöstä Ax = λx, joka voidaan esittää muodossa (λi A)x = 0 Tiedetään, että yhtälöllä on ei-triviaali (eli nollavektorista eroava) ratkaisu jos ja vain jos det(λi A) = 0 Saadaan siis seuraava tulos: Lause 32 Olkoon A K n n Tällöin λ K on matriisin A ominaisarvo jos ja vain jos det(λi A) = 0 Määritelmä 33 Matriisin A K n n karakteristinen polynomi on c A (λ) = det(λi A) = λ n + a 1 λ n 1 + + a n 1 λ + a n Matriisin A K n n ominaisarvot ovat siis karakteristisen polynomin c A (λ) nollakohdat eli yhtälön c A (λ) = 0 ratkaisut Koska kerroinkunta K on algebrallisesti suljettu, niin { c A (λ) = (λ λ 1 )(λ λ 2 ) (λ λ n ) ja λ 1, λ 2,, λ n ovat matriisin A ominaisarvot Kertomalla yhtälön c A (λ) = (λ λ 1 )(λ λ 2 ) (λ λ n ) oikea puoli auki, saadaan seuraava tulos: 21

31 MATRIISIN OMINAISARVOT JA KARAKTERISTINEN POLYNOMI 22 Lause 34 Jos A K n n, niin c A (λ) = λ n + a 1 λ n 1 + + a n 1 λ + a n, missä a k = ( 1) k λ q1 λ q2 λ qk q 1< <q k Edellisen lauseen nojalla saadaan erityisesti { a 1 = (λ 1 + λ 2 + + λ n ) ja a n = ( 1) n λ 1 λ 2 λ n Lause 35 { det A = λ 1 λ 2 λ n tr A := a 11 + a 22 + + a nn = λ 1 + λ 2 + + λ n, missä tr A on matriisin A jälki Todistus Nyt c A (λ) = det(λi A) = (λ λ 1 )(λ λ 2 ) (λ λ n ), joten ja toisaalta c A (0) = det(0i A) = det( A) = ( 1) n det A c A (0) = (0 λ 1 )(0 λ 2 ) (0 λ n ) = ( 1) n λ 1 λ 2 λ n Siis det A = λ 1 λ 2 λ n Jäljen laskemista varten selvitetään termin λ n 1 kerroin a 1 Kehitetään determinantti λ a 11 a 12 a 1n a 21 λ a 22 a 2n det(λi A) = det a n1 a n2 λ a nn 1 rivin suhteen Nyt det(λi A) = (λ a 11 ) det A 11 + q(λ), missä A 11 on matriisi, joka on saatu matriisista A poistamalla sen 1 rivi ja 1 sarake ja q(λ) on polynomi, jonka aste on korkeintaan n 2 Koska etsimme termin λ n 1 kerrointa, voimme jättää polynomin q(λ) huomiotta Kehitetään edelleen matriisin A 11 determinantti 1 rivin suhteen ja jatketaan samalla tavalla loppuun asti Huomataan, että ainoa determinantin osa joka sisältää termiä λ n 1 on (λ a 11 )(λ a 22 ) (λ a nn ) Nyt on helppo laskea, että a 1 = (a 11 + a 22 + + a nn ) Täten tr A = a 11 + a 22 + + a nn = a 1 = λ 1 + λ 2 + + λ n Huomautus Matriisi A K n n on singulaarinen jos ja vain jos det A = 0 Tämä on yhtäpitävää sen kanssa, että 0 on matriisin A ominaisarvo, sillä det A on matriisin ominaisarvojen tulo

32 OMINAISARVOJEN KERTALUVUT 23 32 Ominaisarvojen kertaluvut Jokaisella matriisilla A K n n on n kappaletta ominaisarvoja, jotka saadaan karakteristisen polynomin c A (λ) juurina Olkoon λ 1, λ 2,, λ s matriisin A K n n erisuuret ominaisarvot Tällöin { c A (λ) = (λ λ 1 ) k1 (λ λ 2 ) k2 (λ λ s ) ks, k 1 + k 2 + + k s = n (k i 1) Määritelmä 36 Matriisin A K n n ominaisarvoa λ vastaava ominaisavaruus on matriisin λi A ydin, eli N(λI A) Huomautus Ydin N(λI A) = {x K n : (λi A)x = 0}, eli ominaisavaruus muodostuu ominaisarvoa λ vastaavista ominaisvektoreista yhdessä nollavektorin kanssa Määritelmä 37 Olkoon A K n n ja λ i K matriisin A ominaisarvo Tällöin ominaisarvon λ i (algebrallinen) kertaluku on kerroin k i karakteristisessa polynomissa (ks yllä) Ominaisarvon geometrinen kertaluku on sitä vastaavan ominaisavaruuden dimensio eli dim N(λ i I A) Tästä määritelmästä seuraa, että ominaisarvon λ geometrinen kertaluku on sitä vastaavien lineaarisesti riippumattomien ominaisvektoreiden maksimimäärä Lause 38 Jokaisen ominaisarvon λ (algebrallinen) kertaluku on suurempi tai yhtäsuuri kuin ( ) sen geometrinen kertaluku Todistus Olkoon λ i matriisin A K n n ominaisarvo ja olkoon sen geometrinen kertaluku k Olkoon {v 1,, v k } ominaisavaruuden N(λ i I A) kanta Täydennetään joukko vektoriavaruuden K n kannaksi {v 1,, v k, v k+1,, v n } Olkoon S = [ v 1 v k v k+1 v n sarakeositus Koska matriisin S k ensimmäistä saraketta ovat matriisin A ominaisarvoa λ i vastaavia ominaisvektoreita, voidaan laskea AS = [ Av 1 Av k Av k+1 Av n = [ λ i v 1 λ i v k u k+1 u n, missä u k+1,, u n K n Koska matriisin S sarakkeet ovat lineaarisesti riippumattomia, niin sarakeasteen määritelmän mukaan r(s) = n ja S on siis säännöllinen Voidaan laskea edelleen λ i 0 T S 1 AS = 0 λ i, 0 U

32 OMINAISARVOJEN KERTALUVUT 24 missä T K k (n k) ja U K (n k) (n k) Nyt det(λi S 1 AS) = det(s 1 λis S 1 AS) = det(s 1 (λi A)S) = det(s 1 ) det(λi A) det(s) = det(λi A), joten matriiseilla A ja S 1 AS on sama karakteristinen polynomi Siis c A (λ) = c S 1 AS(λ) = det(λi S 1 AS) = (λ λ i ) k det(λi U) Tästä nähdään, että ominaisarvon λ i algebrallinen kertaluku on vähintään k Lause 39 Olkoot λ 1,, λ k matriisin A K n n erisuuria ominaisarvoja ja v 1,, v k niitä vastaavia ominaisvektoreita Tällöin joukko {v 1,, v k } on lineaarisesti riippumaton Todistus Todistetaan lause induktiolla Joukko {v 1 } on lineaarisesti riippumaton, sillä v 1 0 Oletetaan nyt, että joukko {v 1,, v k 1 } on lineaarisesti riippumaton Oletetaan sitten, että a 1 v 1 + + a k v k = 0 (31) joillain a i K ja osoitetaan, että tällöin a 1 = = a k = 0 Kertomalla yhtälöä (31) matriisilla A vasemmalta saadaan λ 1 a 1 v 1 + + λ k a k v k = 0, (32) ja toisaalta kertomalla yhtälöä (31) alkiolla λ k saadaan λ k a 1 v 1 + + λ k a k v k = 0 (33) Kun vähennetään yhtälöt (33) ja (32) toisistaan, saadaan (λ k λ 1 )a 1 v 1 + + (λ k λ k 1 )a k 1 v k 1 = 0 (34) Induktio-oletuksen mukaan joukko {v 1,, v k 1 } on lineaarisesti riippumaton, joten (λ k λ i )a i = 0 kaikilla i = 1,, k 1 Ominaisarvot λ 1,, λ k ovat erisuuria, joten λ k λ i 0 ja siis a i = 0 aina, kun i = 1,, k 1 Yhtälö (31) sievenee siis muotoon a k v k = 0, josta nähdään, että myös a k = 0 Siis joukko {v 1,, v k } on lineaarisesti riippumaton Seuraus 310 Matriisilla A K n n on n lineaarisesti riippumatonta ominaisvektoria jos ja vain jos jokaisen ominaisarvon algebrallinen ja geometrinen kertaluku ovat yhtäsuuret

4 Similaarisuusmuunnokset 41 Similaarisuus Määritelmä 41 Matriisit A, B K n n ovat similaariset (merk A B) jos on olemassa sellainen säännöllinen matriisi S K n n, että A = SBS 1 On helppo osoittaa, että matriisien similaarisuus on ekvivalenssirelaatio Matriiseille A, B, C K n n pätee siis seuraavat ehdot: (i) A A; (ii) jos A B, niin B A; (iii) jos A B ja B C, niin A C Lause 42 Jos matriisit A ja B ovat similaariset, niin seuraavat ehdot pätevät: (a) r(a) = r(b); (b) c A (λ) = c B (λ); (c) det A = det B ja tr A = tr B Todistus (a) Lauseen 27 kohdan (iii) nojalla r(a) = r(sbs 1 ) = r(bs 1 ) = r(b), sillä S ja S 1 ovat säännöllisiä (b) Nyt joten λi A = λsis 1 A = SλIS 1 SBS 1 = S(λI B)S 1, c A (λ) = det(λi A) = det(s(λi B)S 1 ) = det(s) det(λi B) det(s 1 ) = det S 1 det(λi B) det S = det(λi B) = c B (λ) 25

42 DIAGONALISOITUVAT MATRIISIT 26 (c) Similaarisilla matriiseilla on sama karakteristinen polynomi, joten niillä on samat ominaisarvot Lauseen 35 mukaan matriisin determinantti on sen ominaisarvojen tulo ja jälki niiden summa Siis det A = det B ja tr A = tr B 42 Diagonalisoituvat matriisit Määritelmä 43 Matriisi A K n n on diagonalisoituva jos se on similaarinen jonkin diagonaalimatriisin kanssa Lause 44 Seuraavat ehdot ovat keskenään yhtäpitäviä aina kun A K n n : (a) matriisi A on diagonalisoituva; (b) matriisilla A on n lineaarisesti riippumatonta ominaisvektoria; (c) matriisin A jokaisen ominaisarvon algebrallinen ja geometrinen kertaluku ovat yhtäsuuret Todistus Seurauksen 310 mukaan ehdot (b) ja (c) ovat yhtäpitävät Osoitetaan nyt ehtojen (a) ja (b) yhtäpitävyys: (a) A = SDS 1, missä D = diag(d 1, d 2,, d n ) ja S = [ x 1 x 2 x n on säännöllinen A [ x 1 x 2 x n = [ x1 x 2 x n D Ax i = d i x i (kaikilla i = 1, 2,, n) ja vektorit x 1, x 2,, x n ovat lineaarisesti riippumattomia (b) ja d i :t ovat niitä vastaavat ominaisarvot Seuraus 45 (Ominaisarvohajotelma eli spektraalihajotelma) Jos A on diagonalisoituva ja x 1, x 2,, x n ovat sen lineaarisesti riippumattomat ominaisarvoja λ 1, λ 2,, λ n vastaavat ominaisvektorit, niin A = SDS 1, missä S = [ x 1 x 2 x n ja D = diag(λ1, λ 2,, λ n ) Todistus Väite seuraa tekemällä lauseen 44 todistuksen päättely alhaalta ylös kun d i = λ i

43 UNITAARISET SIMILAARISUUSMUUNNOKSET 27 43 Unitaariset similaarisuusmuunnokset Määritelmä 46 Olkoon A C n n Tällöin matriisi A on (a) symmetrinen jos A t = A; (b) vinosymmetrinen jos A t = A; (c) hermiittinen jos A = A; (d) vinohermiittinen jos A = A; (e) unitaarinen jos A A = I, ts A = A 1 ; ( f ) ortogonaalinen jos A R n n ja A t A = I, ts A t = A 1 ; (g) normaali jos A A = AA Selvästi jokainen hermiittinen, vinohermiittinen ja unitaarinen matriisi on myös normaali Lause 47 Olkoon A C n n unitaarinen Tällöin λ = 1 jokaiselle ominaisarvolle λ Lisäksi A C n n on unitaarinen jos ja vain jos sen sarakkeet (tai rivit) ovat ortonormaalit Todistus Olkoon A C n n unitaarinen Siis A = A 1, eli AA = A A = I Olkoon λ matriisin A ominaisarvo ja x sitä vastaava ominaisvektori Tällöin Nyt x 0, joten λ = 1 λ 2 x 2 = λx 2 = Ax 2 = Ax Ax = (Ax) (Ax) = x (A A)x = x Ix = x x = x 2 Olkoon A = [ a 1 a 2 a n matriisin sarakeositus Tällöin matriisin A A (i, j)-alkio on (A A) ij = a i a j = a j a i Siis A A = I jos ja vain jos a j a i = a i a j = δ ij eli jos ja vain jos matriisin A sarakkeet ovat ortonormaalit Vastaavasti AA = I jos ja vain jos matriisin A rivit ovat ortonormaalit Huomautus Jos A, B C n n ovat unitaarisia, niin myös A t, A, A 1 ja AB ovat unitaarisia Määritelmä 48 Matriisit A, B C n n ovat unitaarisesti similaariset jos on olemassa sellainen unitaarinen matriisi C (ts C = C 1 ), että A = CBC

43 UNITAARISET SIMILAARISUUSMUUNNOKSET 28 Lause 49 (Schurin normaalimuoto) Jokainen matriisi A C n n on unitaarisesti similaarinen jonkin yläkolmiomatriisin kanssa Todistus Olkoon A C n n Osoitetaan lause induktiolla matriisin koon suhteen Kun n = 1, niin A = [ a 11 = [ 1 [ a11 [ 1, missä [ 1 on unitaarinen Oletetaan siis, että lause on tosi aina kun n k Olkoon A C (k+1) (k+1), λ 1 sen ominaisarvo ja x 1 C k+1 sitä vastaava ominaisvektori, jolle x 1 = 1 Valitaan vektorit y 1, y 2,, y k siten, että joukko {x 1, y 1, y 2,, y k } on ortonormaali Tällöin lauseen 47 nojalla matriisi C 1 := [ x 1 y 1 y k C(k+1) (k+1) on unitaarinen Tarkastellaan matriisia C1 AC 1 Nyt x 1 C1 y AC 1 = 1 A [ x 1 y 1 y k y k x 1Ax 1 x 1Ay 1 x 1Ay k y1ax 1 y1ay 1 y1ay k = yk Ax 1 yk Ay 1 yk Ay k (A) Koska Ax 1 = λ 1 x 1, niin { x 1Ax 1 = λ 1 x 1x 1 = λ 1, sillä x 1x 1 = x 1 x 1 = x 1 2 = 1; y i Ax 1 = λ 1 y i x 1 = 0, sillä y i x 1 = x 1 y i = 0 kaikilla i = 1,, k Merkitään matriisin (A) oikeaa alakulmaa M = [ yi Ay j ja oikeaa yläkulmaa R = [ k k x 1Ay 1 x 1Ay k Nyt induktio-oletuksen mukaan on olemassa unitaarinen matriisi C 2 ja yläkolmiomatriisi B 2 siten, että M = C 2 B 2 C2 Täten (A) saa muodon [ C1 λ1 R AC 1 = 0 C 2 B 2 C2 [ [ [ 1 0 λ1 RC = 2 1 0 0 C 2 0 B 2 0 C (B) 2 }{{}}{{}}{{} merk C 3 merk B =C3 Matriisi C 3 on unitaarinen koska C 3 C 3 = I k+1 ja B on yläkolmiomatriisi Koska myös C 1 on unitaarinen, niin yhtälön (B) nojalla A = C 1 (C 3 BC 3 )C 1 = (C 1 C 3 )B(C 1 C 3 ) = CBC, missä C = C 1 C 3 on unitaarinen Siis väite on tosi myös matriiseille A C (k+1) (k+1) Induktioperiaatteen nojalla lause on tosi kaikilla n Huomautus Edellisen lauseen todistuksen mukaan yläkolmiomatriisin B diagonaalille tulee matriisin A ominaisarvot

43 UNITAARISET SIMILAARISUUSMUUNNOKSET 29 Kätevimmin Schurin normaalimuodon saa laskettua nk QR-hajotelmasta (ei kuulu kurssialueeseen) Normaalimuoto löytyy myös ominaisvektoreiden avulla: Olkoon A C n n Selvitetään matriisin A ominaisarvot λ 1,, λ k ja niitä vastaavat ominaisvektorit Olkoon {v 1,, v s } joukko, jossa on suurin mahdollinen määrä matriisin A lineaarisesti riippumattomia ominaisvektoreita (siis s = g 1 + + g k, missä g i on ominaisarvon λ i geometrinen kertaluku) Täydennetään joukko avaruuden C n kannaksi {v 1,, v n } lisäämällä siihen lineaarisesti riippumattomia vektoreita Gram-Schmidtin ortogonalisointimenetelmällä ja normittamalla saadut vektorit saadaan ortonormaali kanta {u 1,, u n } Tällöin lauseen 47 nojalla C := [ u 1 u 2 u n on unitaarinen Ratkaistaan lopuksi B yhtälöstä A = CBC Lemma 410 Yläkolmiomatriisi on normaali jos ja vain jos se on diagonaalimatriisi Todistus Olkoon B = [ b ij n n yläkolmiomatriisi, jolloin b ij = 0 aina kun i > j Jos B on diagonaalimatriisi, niin B B = diag( b 11 2, b 22 2,, b nn 2 ) = BB, ts B on normaali Oletetaan, että B on normaali, ts B B = BB Tarkastellaan tulojen B B ja BB diagonaalialkioita Nyt (1, 1)-alkioista saadaan b 11 2 = b 11 2 + b 12 2 + + b 1n 2, joten täytyy olla b 12 = b 13 = = b 1n = 0 Vastaavasti (2, 2)-alkioista saadaan b 12 2 + b 22 2 = b 22 2 + b 23 2 + + b 2n 2, }{{} =0 joten myös b 23 = = b 2n = 0 Samalla tavalla jatkamalla saadaan lopulta (n 1, n 1)-alkioista b 1,n 1 2 + b 2,n 1 2 + + b n 2,n 1 2 + b n 1,n 1 2 = b n 1,n 1 2 + b n 1,n 2, }{{}}{{}}{{} =0 =0 =0 joten myös b n 1,n = 0 Siis B = diag(b 11, b 22,, b nn ) Lause 411 Matriisi A C n n on normaali jos ja vain jos se on unitaarisesti similaarinen jonkin diagonaalimatriisin kanssa Todistus Oletetaan, että A unitaarisesti similaarinen jonkin diagonaalimatriisin kanssa Tällöin A = CDC, missä C on unitaarinen ja D = diag(d 1, d 2,, d n ) Koska CC = C C = I, niin { AA = CDC CD C = CDD C ja A A = CD C CDC = CD DC Nämä ovat samat koska DD = diag( d 1 2, d 2 2,, d n 2 ) = D D Siis matriisi A on normaali

44 JORDAN-MUOTO 30 Oletetaan nyt, että A on normaali, ts A A = AA Lauseen 49 mukaan A = CBC, missä C on unitaarinen ja B on yläkolmiomatriisi Nyt { AA = CBC CB C = CBB C ja A A = CB C CBC = CB BC Koska AA = A A, niin CBB C = CB BC, eli myös BB = B B Täten B on normaali ja koska B on yläkolmiomatriisi, niin lemman 410 nojalla B on diagonaalimatriisi Seuraava tulos seuraa lauseista 44, 47 ja 411 Tulos myös perustelee nimitystä normaali matriisi Seuraus 412 Matriisi A C n n ortonormaalia ominaisvektoria on normaali jos ja vain jos sillä on n 44 Jordan-muoto Monet neliömatriisien ominaisuudet pysyvät muuttumattomina similaarisuusmuunnoksissa Kun matriisi on similaarinen jonkin yksinkertaisen matriisin (kuten diagonaalimatriisin) kanssa, esimerkiksi matriisin korkeiden potenssien laskeminen nopeutuu Kaikki neliömatriisit eivät kuitenkaan ole diagonalisoituvia Tällöin halutaan löytää mahdollisimman paljon diagonaalimatriisia muistuttava matriisi, jonka kanssa tutkittava matriisi olisi similaarinen Tutustutaan ilman todistusta neliömatriisin Jordan-muotoon Määritelmä 413 Neliömatriisi J C t t on alkiota λ vastaava Jordan-lohko, jos λ 1 0 0 0 λ 1 0 J =, 0 0 0 1 0 0 0 λ missä λ C Kun t = 1, niin määritellään alkiota λ vastaavaksi Jordan-lohkoksi J = [λ Lause 414 (Jordan-muoto) Olkoon A C n n neliömatriisi Tällöin A on similaarinen lohkodiagonaalisen matriisin J = diag(j 1, J 2,, J k ) kanssa, missä J 1, J 2,, J k ovat matriisin A ominaisarvoja vastaavia Jordanlohkoja Lisäksi seuraavat ehdot ovat voimassa: (a) Ominaisarvoa λ i vastaavia Jordan-lohkoja on dim ( N(λ i I A)) kappaletta (ominaisarvon λ i geometrinen kertaluku)

44 JORDAN-MUOTO 31 (b) Ominaisarvoa λ i vastaavien Jordan-lohkojen kokojen summa on k i (ominaisarvon λ i algebrallinen kertaluku) (c) Ominaisarvoa λ i vastaavien, vähintään kokoa j olevien Jordan-lohkojen lukumäärä on dim ( N[(λ i I A) j ) dim ( N[(λ i I A) j 1 ) Matriisia J kutsutaan matriisin A Jordan-muodoksi Matriisin Jordan-muoto on lohkojen järjestystä vaille yksikäsitteinen Jos A C n n on neliömatriisi, niin on siis olemassa säännöllinen matriisi S C n n siten, että A = SJS 1, missä J on matriisin A Jordan-muoto Kun J on selvitetty edellisen lauseen ehtojen avulla, voidaan ratkaista myös matriisi S Merkitään S = [ v 1 v 2 v n ja J = [ J1 J 2 J n Tällöin A = SJS 1 AS = SJ A [ v 1 v 2 v n = S [ J1 J 2 J n [ Av 1 Av 2 Av n = [ SJ1 SJ 2 SJ n Av i = SJ i i Vektorit v i voidaan ratkaista ylläolevasta yhtälöryhmästä Osa yhtälöistä tuottaa ominaisvektoreita Loppuja vektoreita kutsutaan matriisin yleistetyiksi ominaisvektoreiksi Huomautus Jos samaa ominaisarvoa vastaa useita erikokoisia Jordan-lohkoja, vektoreiden v i ratkaiseminen voi olla työlästä Ominaisvektoreiden valinnalla on silloin merkitystä Tällöin voi edetä esimerkiksi kokeilemalla eri (lineaarisesti riippumattomien) ominaisvektoreiden yhdistelmiä Lause 415 Olkoon A C n n Tällöin seuraavat ehdot ovat yhtäpitäviä: (a) matriisi A on diagonalisoituva; (b) matriisin A Jordan-muoto on diagonaalimatriisi

5 Singulaariarvohajotelma ja Moore-Penrose -inverssi 51 Definiitit matriisit ja neliöjuuri Määritelmä 51 Neliömatriisi A C n n on positiivisesti definiitti (vast positiivisesti semidefiniitti) jos se on hermiittinen ja jos x Ax > 0 (vast x Ax 0) aina kun x C n \ {0} Vastaavasti voidaan määritellä negatiivisesti definiitit ja semidefiniitit matriisit Lause 52 Matriisi A C n n on positiivisesti definiitti (vast positiivisesti semidefiniitti) jos ja vain jos A on hermiittinen ja sen kaikki ominaisarvot ovat aidosti positiivisia (vast ei-negatiivisia) Lisäksi jos A on positiivisesti semidefiniitti, niin sen positiivisten ominaisarvojen lukumäärä on r(a) Todistus Olkoon A C n n positiivisesti semidefiniitti, λ sen mielivaltainen ominaisarvo ja x C n \ {0} sitä vastaava ominaisvektori Määritelmän nojalla x Ax = Ax x = λx x = λ x x = λ x 2 0, joten on oltava λ 0 Jos A on positiivisesti definiitti, niin vastaava päättely osoittaa, että λ > 0 Oletetaan nyt, että A on hermiittinen, ts A = A Tällöin A on myös normaali Olkoon λ 1, λ 2,, λ n sen ominaisarvot ja oletetaan, että ne ovat ei-negatiivisia Nyt lauseen 411 mukaan A = CDC, missä C on unitaarinen ja D = diag(λ 1, λ 2,, λ n ) Jos nyt merkitään y = C x, niin x = Cy, jolloin x Ax = y (C AC)y = y Dy λ 1 0 0 y 1 = [ 0 λ 2 0 y 2 y 1 y 2 y n 0 0 λ n y n = λ 1 y 1 2 + λ 2 y 2 2 + + λ n y n 2 0 32

52 SINGULAARIARVOHAJOTELMA 33 kaikilla x 0 Täten A on positiivisesti semidefiniitti Vastaava päättely osoittaa, että jos matriisin A ominaisarvot ovat aidosti positiivisia, on A positiivisesti definiitti, sillä y 0 aina kun x 0 Osoitetaan vielä positiivisten ominaisarvojen lukumäärää koskeva väite Olkoon A C n n positiivisesti semidefiniitti, jolloin A = CDC, missä C on unitaarinen ja D = diag(λ 1, λ 2,, λ n ) Nyt siis λ 1, λ 2,, λ n 0 Koska C ja C ovat säännöllisiä, saadaan r(a) = r(cdc ) = r(d) Diagonaalimatriisin aste on sen nollasta eroavien diagonaalialkioiden lukumäärä Täten matriisin A aste r(a) on sen aidosti positiivisten ominaisarvojen lukumäärä Lause 53 Matriisi H C n n on positiivisesti (semi)definiitti jos ja vain jos on olemassa sellainen positiivisesti (semi)definiitti matriisi H 0 C n n, että H0 2 = H Lisäksi r(h 0 ) = r(h) Todistus Oletetaan, että matriisi H C n n on positiivisesti semidefiniitti Tällöin matriisin H ominaisarvot ovat ei-negatiivisia Voidaan siis määritellä matriisi D 0 = diag( λ 1, λ 2,, λ n ), missä λ 1, λ 2,, λ n ovat matriisin H ominaisarvot Nyt H on normaali, joten H = CDC, missä D = diag(λ 1, λ 2,, λ n ) = D 2 0 ja C on unitaarinen Jos H 0 = CD 0 C, niin H 2 0 = (CD 0 C ) 2 = CD 2 0C = CDC = H Lisäksi lauseen 52 mukaan r(h 0 ) = r(h), sillä matriisin H 0 ominaisarvot ovat matriisin H ominaisarvojen neliöjuuria Oletetaan nyt, että H = H 2 0, missä H 0 on positiivisesti semidefiniitti Tällöin matriisin H ominaisarvot ovat ei-negatiivisia, joten lauseen 52 nojalla H on positiivisesti semidefiniitti Edellisen lauseen avulla voimme määritellä positiivisesti (semi)definiitin matriisin neliöjuuren Määritelmä 54 Olkoon H C n n positiivisesti (semi)definiitti Matriisin H neliöjuuri on positiivisesti (semi)definiitti matriisi H 0 C n n, jolle H 2 0 = H Huomautus Edellisen lauseen nojalla positiivisesti (semi)definiitin matriisin H C n n neliöjuuri on yksikäsitteinen Positiivisesti (semi)definiitin matriisin neliöjuurelle käytetään usein merkintää H 1/2 52 Singulaariarvohajotelma Matriisit A A (vast AA ) ovat selvästi positiivisesti semidefiniittejä kaikilla A C m n Tällöin lauseen 52 nojalla matriisin A A aidosti positiivisten ominaisarvojen lukumäärä on r(a A)

52 SINGULAARIARVOHAJOTELMA 34 Lause 55 (Singulaariarvohajotelma) Olkoon A C m n, r := r(a A) ja λ 1, λ 2,, λ n positiivisesti semidefiniitin matriisin A A ominaisarvot Olkoon lisäksi λ 1, λ 2,, λ r matriisin A A aidosti positiiviset ominaisarvot Tällöin A voidaan esittää muodossa A = UDV, missä U C m m ja V C n n ovat unitaarisia ja [ Dr 0 D = 0 0 missä D r = diag( λ 1, λ 2,, λ r ), m n Todistus Olkoon A C m n ja r := r(a A) Koska matriisi A A C n n on positiivisesti semidefiniitti, sillä on r kappaletta aidosti positiivisia ominaisarvoja λ 1, λ 2,, λ r Nyt A A on myös normaali, joten sillä on n kappaletta ortonormaaleja ominaisvektoreita x 1, x 2,, x n ja niitä vastaavat ominaisarvot λ 1, λ 2,, λ n Muodostetaan nyt unitaariset matriisit U C m m ja V C n n Olkoon ja määritellään matriisi V = [ x 1 x 2 x n Cn n U = [ z 1 z 2 z m Cm m, missä Ax k = λ k z k z k = 1 λk Ax k (k = 1, 2,, r) ( ) Valitaan loput vektorit z r+1, z r+2,, z m siten, että vektorit z 1, z 2,, z m ovat ortonormaaleja (huomaa lisäksi, että r = r(a A) r(a) m) Valinta on mahdollinen sillä vektorit z 1, z 2,, z r ovat jo ortonormaaleja: z i z j = 1 x i A Ax j = λ j x i x j = δ ij λi λ j λi λ j aina kun i, j = 1,, n Täten matriisit U ja V ovat unitaarisia Lisäksi yhtälön ( ) nojalla saadaan { Ax k = λ k z k, kun k = 1, 2,, r Ax k = 0, kun k = r + 1,, n sillä Ax k 2 = Ax k Ax k = x ka Ax k = λ k x kx k = 0 (λ k = 0 r + 1 k n) Täten AV = [ Ax 1 Ax r Ax r+1 Ax n m n = [ λ 1 z 1 λr z r 0 0 m n = UD, missä D = [ D r 0 0 0 ja Dr = diag( λ 1,, λ r ) Siis A = UDV ja U, V ja D ovat vaadittua muotoa