Singulaariarvohajotelma ja pseudoinverssi

Samankaltaiset tiedostot
Matriisiteoria Harjoitus 1, kevät Olkoon. cos α sin α A(α) = . sin α cos α. Osoita, että A(α + β) = A(α)A(β). Mikä matriisi A(α)A( α) on?

Sisätuloavaruudet. 4. lokakuuta 2006

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

Osoita, että täsmälleen yksi vektoriavaruuden ehto ei ole voimassa.

Ortogonaalisen kannan etsiminen

802320A LINEAARIALGEBRA OSA II

MS-C1340 Lineaarialgebra ja

ominaisvektorit. Nyt 2 3 6

5 Ominaisarvot ja ominaisvektorit

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

1 Sisätulo- ja normiavaruudet

Ominaisarvo-hajoitelma ja diagonalisointi

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

MS-C1340 Lineaarialgebra ja

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

Insinöörimatematiikka D

Insinöörimatematiikka D

802320A LINEAARIALGEBRA OSA I

Insinöörimatematiikka D

LU-hajotelma. Esimerkki 1 Matriisi on yläkolmiomatriisi ja matriisi. on alakolmiomatriisi. 3 / 24

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

800350A / S Matriisiteoria

1 Lineaariavaruus eli Vektoriavaruus

Lineaarialgebra ja matriisilaskenta I

Insinöörimatematiikka D

1 Ominaisarvot ja ominaisvektorit

Matemaattinen Analyysi / kertaus

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42

Similaarisuus. Määritelmä. Huom.

(1.1) Ae j = a k,j e k.

Ennakkotehtävän ratkaisu

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

10 Matriisit ja yhtälöryhmät

Determinantti 1 / 30

Lineaarialgebra ja matriisilaskenta II. LM2, Kesä /141

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja

Paikannuksen matematiikka MAT

Käänteismatriisi 1 / 14

5 OMINAISARVOT JA OMINAISVEKTORIT

6 MATRIISIN DIAGONALISOINTI

9 Matriisit. 9.1 Matriisien laskutoimituksia

Matematiikka B2 - TUDI

Ominaisarvo ja ominaisvektori

Johdatus tekoälyn taustalla olevaan matematiikkaan

Lineaarialgebra ja matriisilaskenta I

Lineaarialgebra ja differentiaaliyhtälöt Harjoitus 4 / Ratkaisut

Päättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1

MS-C1340 Lineaarialgebra ja

Lineaarikuvauksen R n R m matriisi

Ratkaisuehdotukset LH 7 / vko 47

Inversio-ongelmien laskennallinen peruskurssi Luento 3

Inversio-ongelmien laskennallinen peruskurssi Luento 2

Ominaisarvoon 4 liittyvät ominaisvektorit ovat yhtälön Ax = 4x eli yhtälöryhmän x 1 + 2x 2 + x 3 = 4x 1 3x 2 + x 3 = 4x 2 5x 2 x 3 = 4x 3.

Demorastitiedot saat demonstraattori Markus Niskaselta Lineaarialgebra (muut ko) p. 1/104

Alkeismuunnokset matriisille, sivu 57

Kanta ja Kannan-vaihto

Avaruuden R n aliavaruus

Esimerkki 19. Esimerkissä 16 miniminormiratkaisu on (ˆx 1, ˆx 2 ) = (1, 0).

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät

2.5. Matriisin avaruudet ja tunnusluvut

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

1. Normi ja sisätulo

i=1 Näistä on helppo näyttää ominaisuudet (1)-(4). Ellei toisin mainita, käytetään R n :ssä

802320A LINEAARIALGEBRA OSA III

Määritelmä 1. Olkoot V ja W lineaariavaruuksia kunnan K yli. Kuvaus L : V. Termejä: Lineaarikuvaus, Lineaarinen kuvaus.

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Esimerkki 4.4. Esimerkki jatkoa. Määrää matriisin ominaisarvot ja -vektorit. Ratk. Nyt

Insinöörimatematiikka D

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

Matriisilaskenta Luento 12: Vektoriavaruuden kannan olemassaolo

Ominaisarvot ja ominaisvektorit 140 / 170

Ominaisvektoreiden lineaarinen riippumattomuus

Lineaarialgebra ja differentiaaliyhtälöt Laskuharjoitus 1 / vko 44

MS-A0004/A0006 Matriisilaskenta

Kertausta: avaruuden R n vektoreiden pistetulo

Matematiikka B2 - Avoin yliopisto

Matriisihajotelmat. MS-A0007 Matriisilaskenta. 5.1 Diagonalisointi. 5.1 Diagonalisointi

LINEAARIALGEBRA P. LUENTOMONISTE ja HARJOITUSTEHTÄVÄT

Matriisilaskenta Luento 16: Matriisin ominaisarvot ja ominaisvektorit

Ominaisarvo ja ominaisvektori

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Numeeriset menetelmät TIEA381. Luento 5. Kirsi Valjus. Jyväskylän yliopisto. Luento 5 () Numeeriset menetelmät / 28

Matriisilaskenta, LH4, 2004, ratkaisut 1. Hae seuraavien R 4 :n aliavaruuksien dimensiot, jotka sisältävät vain

7 Vapaus. 7.1 Vapauden määritelmä

Lineaariset yhtälöryhmät ja matriisit

Lineaarialgebra ja matriisilaskenta II Syksy 2009 Laskuharjoitus 1 ( ) Ratkaisuehdotuksia Vesa Ala-Mattila

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 );

MATRIISIN HESSENBERGIN MUOTO. Niko Holopainen

Insinöörimatematiikka D

Numeeriset menetelmät

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 );

BM20A0700, Matematiikka KoTiB2

6. OMINAISARVOT JA DIAGONALISOINTI

Yleiset lineaarimuunnokset

HY / Avoin yliopisto Lineaarialgebra ja matriisilaskenta II, kesä 2015 Harjoitus 1 Ratkaisut palautettava viimeistään maanantaina klo

Ratkaisuehdotukset LH 3 / alkuvko 45

Insinöörimatematiikka D

C = {(x,y) x,y R} joiden joukossa on määritelty yhteen- ja kertolasku seuraavasti

Talousmatematiikan perusteet: Luento 9. Matriisien peruskäsitteet Yksinkertaiset laskutoimitukset Transponointi Matriisitulo

Transkriptio:

HELSINGIN YLIOPISTO Pro gradu -tutkielma Niko Kaitarinne Singulaariarvohajotelma ja pseudoinverssi Matematiikan ja tilastotieteen laitos Matematiikka Helmikuu 01

Helsingin yliopisto Matematiikan ja tilastotieteen laitos KAITARINNE, NIKO: Singulaariarvohajotelma ja pseudoinverssi Pro gradu -tutkielma, 45 s. Matematiikka Helmikuu 01 Tiivistelmä Tässä tutkielmassa tarkastellaan singulaariarvohajotelmaa ja sen sovelluksena pseudoinverssiä. Lukija johdatellaan aiheeseen esittelemällä ensin joitakin tarvittavia esitietoja. Tämän jälkeen esittelemme unitaariset matriisit, jotka ovat yleistys ortogonaalisista matriiseista. Unitaaristen matriisien avulla esittelemme myös unitaarisen similaarisuuden käsitteen sekä Schurin hajotelmaksi kutsutun lauseen. Seuraavaksi esittelemme normaalit matriisit ja käsittelemme niiden tärkeimmät ominaisuudet. Vielä ennen tutkielman aiheeseen pääsyä käsittelemme hermiittiset matriisit, jotka ovat symmetristen matriisien yleistys, ja definiitit matriisit, jotka ovat hermiittisten matriisien eräänlainen osajoukko. Definiittien matriisien avulla käsitellään singulaariarvot sekä niiden avulla saatava singulaariarvohajotelma. Lopulta määritellään pseudoinverssi ja käydään läpi sen ominaisuudet, jonka jälkeen sovelletaan sitä pienimmän neliösumman probleeman ratkaisuun.

Sisältö 1 Johdanto 4 Esitiedot 5.1 Perusmääritelmiä......................... 5. Ominaisarvot ja ominaisvektorit................. 6.3 Similaarisuus........................... 7.4 Sisätulo ja ortogonaalisuus.................... 7.5 Lineaarisista yhtälöryhmistä................... 9 3 Unitaariset ja normaalit matriisit 11 3.1 Unitaariset matriisit....................... 11 3. Normaalit matriisit........................ 16 4 Hermiittiset ja positiivisesti (semi)definiitit matriisit 0 4.1 Hermiittiset matriisit....................... 0 4. Positiivisesti (semi)definiitit matriisit.............. 3 5 Singulaariarvohajotelma 7 5.1 Singulaariarvot.......................... 7 5. Singulaariarvohajotelma..................... 9 6 Pseudoinverssi ja pienimmän neliösumman probleema 33 6.1 Pseudoinverssi........................... 33 6. Pienimmän neliösumman probleema............... 41 Viitteet 46 3

1 Johdanto Tässä Pro Gradu tutkielmassa tutkielmassa tarkastellaan singulaariarvohajotelmaa, joka on hajotelma mille tahansa matriisille. Vaikka kyseessä ei ole yksikäsitteinen hajotelma, on se kuitenkin tärkeä osa lineaarialgebran teoriaa sekä monien sovellusten lähtökohta. Lähtötietoina lukijalta oletetaan lineaarialgebran alkeiden osaamista, ja joitakin niistä käydään läpi myös toisessa luvussa. Lisäksi lukijan tulee osata kompleksilukujen alkeet. Luvussa käydään läpi tutkielmassa tarvittavia esitietoja. Joitakin lineaarialgebran perusteita kuten matriisin ydin ja kuva sekä ominaisarvot on esitelty lukijalle lähinnä muistuksena ensimmäisiltä lineaarialgebran kursseilta. Jotkin aihealueet voivat olla lukijoille ennestään tuntemattomia, mutta niiden omaksumisen ei pitäisi aiheuttaa ongelmia. Tämän luvun lähteenä on käytetty kirjaa [3]. Luvussa 3 käsitellään unitaarisia ja normaaleja matriiseja. Ensimmäisessä aliluvussa esitellään unitaariset matriisit sekä niiden ominaisuudet. Lisäksi käsitellään unitaarisen similaarisuuden käsite sekä Schurin hajotelma. Kyseinen aliluvun määritelmät ja lauseet perustuvat kirjan [1] luvuissa.1-.3 esitettyihin määritelmiin ja lauseisiin lukuunottamatta lauseen 3.1 kohtaa (7), joka perustuu kirjan [3, s. 189] lauseeseen 5.6.3. Toisessa aliluvussa käydään läpi normaalit matriisit ja niiden ominaisuudet. Tämä aliluku perustuu suurimmilta osin kirjan [3] lukuihin 5. ja 5.6. Luvussa 4 tarkastellaan hermiittisiä matriiseja sekä niiden avulla johdettuja definiittejä matriiseja. Samalla siirrytään kohti singulaariarvon käsitettä, jonka perusteet löytyvät definiiteistä matriiseista. Hermiittisten matriisien osio perustuu kirjan [1] kappaleesta 4.1 ja kirjan [3] kappaleesta 5.3 löytyviin määritelmiin ja lauseisiin. Definiittien matriisien kappaleen lähteenä on käytetty kirjan [3] lukuja 5.3-5.4. Luku 5 on tutkielman pääluku. Siinä käydään läpi singulaariarvohajotelman käsite. Ensin esitellään singulaariarvot, jonka jälkeen voimme muodostaa singulaariarvohajotelman. Singulaariarvoja käsittelevä aliluku perustuu kirjan [3] luvun 5.4 loppuosaan. Aliluku singulaariarvohajotelmasta perustuu kirjan [3] lukujen 5.7 ja 1.8 aihetta käsitteleviin osiohin. Luvussa 6 määrittelemme pseudoinverssin ja joitakin sen ominaisuuksia sekä käytämme sitä pienimmän neliösumman parhaan ratkaisun löytämiseen. Löydämme myös pseudoinverssille eksaktin muodon singulaariarvohajotelmaa hyväksi käyttäen. Tämän luvun lähteenä on käytetty kirjan [3] lukuja 1.8 ja 1.9. 4

Esitiedot Tässä luvussa käsittelemme luettelonomaisesti tutkielman määritelmissä ja lauseiden todistuksissa tarvittavia apulauseita. Kaikkien lauseiden todistukset sivuutetaan tässä luvussa. Käsitellään ensin hieman merkintöjä, joita käytämme tässä tutkielmassa. Nollamatriisia merkitään symbolilla 0 ja nollavektoreita merkitsemme symbolilla Θ, emmekä merkitse niiden kokoa, jos ei sekaantumisen vaaraa ole. Diagonaalimatriisit lyhennetään merkinnällä D = diag(a 1, a,..., a n ), jossa diagonaalialkiot ovat sulkujen sisällä lueteltuina järjestyksessä vasemmasta yläkulmasta oikeaan alakulmaan..1 Perusmääritelmiä Ensiksi käsittelemme joitakin konjugaattitranspoosiin liittyviä määritelmiä ja lauseita sekä muistutetaan mieleen, mikä on matriisin ydin ja kuva. Matriisin ytimeen ja kuvaan liittyviä lauseita käsitellään lisää myöhemmin tässä luvussa. Määritelmä.1. Olkoon A = [ a ij ] C m n. Tällöin matriisia B = A T = [ aji ] kutsutaan matriisin A konjugaattitranspoosiksi ja merkitään B = A. Esimerkki.1. Olkoon Tällöin A = [ ] i i 1. 3 1 + i i + i 3 A = i 1 i. 1 i Lause.1. Konjugaattitranspoosille pätee ehdot (1) (A ) = A, () (A + B) = A + B, (3) (aa) = aa, (4) (AB) = B A, (5) (A 1 ) = (A ) 1, jos matriisi A on kääntyvä, kun A ja B ovat sopivan kokoisia matriiseja ja a C. 5

Määritelmä.. Olkoon A C m n. Tällöin joukkoa Ker A = {x C n Ax = Θ}, kutsutaan matriisin A nolla-avaruudeksi tai ytimeksi ja joukkoa Ran A = {y C n y = Ax jollekin x C n }, kutsutaan matriisin A kuva-avaruudeksi tai kuvaksi. Matriisin A kuva voidaan määritellä myös lineaarikombinaation avulla. Tällöin y Ran A, jos ja vain jos y voidaan esittää matriisin A sarakevektoreiden lineaarikombinaationa. Matriisin kuva-avaruuden dimensiota merkitään joskus myös dim[ran A] = rank A. Esitämme vielä kaksi lausetta liittyen dimenssioihin. Lause.. Olkoon A C m n. Tällöin rank A = rank A T = rank A Lause.3. Olkoon V ja W äärellisulotteisia vektoriavaruuksia. Jos V W ja dim V = dim W, niin V = W.. Ominaisarvot ja ominaisvektorit Seuraavaksi käsittelemme joitakin ominaisarvoihin ja ominaisvektoreihin liittyviä ominaisuuksia. Määritelmä.3. Olkoon A C n n. Skalaaria λ C kutsutaan matriisin A ominaisarvoksi, jos se toteuttaa yhtälön Ax = λx, kun x C n ja x Θ. Tällöin vektoria x kutsutaan ominaisarvoa λ vastaavaksi ominaisvektoriksi. On tärkeää huomata, että kompleksilukuarvoisten matriisien tapauksessa ominaisarvoja löytyy aina n kappaletta, kun jokaista ominaisarvoa otetaan mukaan sen algebrallisen kertaluvun osoittama määrä. Tämä helpottaa niiden käsittelyä verrattuna reaalilukuarvoisiin matriiseihin, joilta ei välttämättä löydy yhtään reaalista ominaisarvoa. Lause.4. Erisuuruisiin ominaisarvoihin liittyvät ominaisvektorit ovat aina lineaarisesti riippumattomia. Määritelmä.4. Olkoot A C n n ja λ C sen ominaisarvo. Tällöin joukkoa A λ = {x C n Ax = λx} kutsutaan ominaisarvoon λ liittyväksi ominaisavaruudeksi. 6

.3 Similaarisuus Seuraavaksi määrittelemme similaariset matriisit ja käsittelemme kaksi niitä koskevaa lausetta. Määritelmä.5. Matriiseja A C n n ja B C n n kutsutaan keskenään similaarisiksi matriiseiksi, jos A = P BP 1, jollakin kääntyvällä matriisilla P C n n. Jos matriisi B on diagonaalimatriisi, niin kutsutaan matriisia A diagonalisoituvaksi. Lause.5. Matriisit A C n n ja B C n n ovat similaarisia, jos ja vain jos niillä on samat ominaisarvot. Lause.6. Olkoon A C n n ja olkoot λ 1, λ,..., λ n sen ominaisarvot. Tällöin matriisi A on diagonalisoituva, jos ja vain jos on olemassa matriisin A ominaisarvoja vastaavat lineaarisesti riippumattomat ominaisvektorit x 1, x,, x n, jotka muodostavat vektoriavaruuden C n kannan. Lisäksi tällöin D = diag(λ i ), kun i = 1,,..., n, ja P = [ x 1 x x n ]..4 Sisätulo ja ortogonaalisuus Tässä luvussa käsittelemme ensin yleisellä tasolla sisätuloa ja normia. Tämän jälkeen siirrymme käsittelemään ortogonalisuutta sekä ortonormaaleja kantoja. Määrittelemme sisätulon vain vektoriavaruudelle C n, mutta se voitaisiin määritellä myös yleisesti vektoriavaruudelle V. Tämä ei kuitenkaan ole tarpeellista, sillä sisätulot on mielekästä määritellä vain kompleksi tai reaalilukuarvoisille vektoriavaruuksille. Määritelmä.6. Tarkastellaan vektoriavaruutta C n, jonka kerroinkuntana on C. Tällöin kuvausta, : C n C n C sanotaan vektoriavaruuden C n sisätuloksi, jos ehdot (1) ax + by, z = a x, z + b y, z, () y, x = x, y, (3) x, x R ja x, x > 0, kun x Θ, ovat voimassa kaikille x, y, z C n ja a, b C. Vektoriavaruutta, jossa on määritelty sisätulo, kutsutaan sisätuloavaruudeksi. Lause.7. Olkoon C n sisätuloavaruus. Tällöin 7

(4) x, ay + bz = a x, y + b x, z, (5) x, y = 0, jos ja vain jos x = Θ tai y = Θ ovat voimassa kaikille x, y C n ja a, b C. Lause.8. Kuvaus, : C n C n C, missä on sisätulo. x, y = y x, Tätä kyseistä sisätuloa kutsutaan vektoriavaruuden C n standardisisätuloksi, ja myöhemmin käsiteltävät sisätulot ovat standardisisätuloja, jollei muuta mainita. Lause.9. Standardisisätulolle pätee kun A C n n ja x, y C n. Ax, y = x, A y, Määritelmä.7. Olkoon C n sisätuloavaruus ja olkoon x C n. Tällöin vektorin (euklidinen) normi saadaan kaavasta x = x, x, jossa, on vektoriavaruuden C n sisätulo. Määritelmä.8. Vektoreita x, y C n kutsutaan keskenään ortogonaalisiksi, jos x, y = 0. Jos lisäksi x = y = 1, niin kutsutaan kyseisiä vektoreita keskenään ortonormaaleiksi. Lisäksi joukkoa S kutsutaan ortogonaaliseksi (ortonormaaliksi) joukoksi, jos kaikki sen sisältämät vektorit ovat keskenään ortogonaalisia (ortonormaaleja). Määritelmä.9. Vektoriavaruuden kantaa kutsutaan ortogonaaliseksi (ortonormaaliksi) kannaksi, jos sen virittäjävektorit ovat keskenään ortogonaalisia (ortonormaaleja). Lause.10 (Pythagoraan lause). Olkoon C n sisätuloavaruus ja olkoot vektorit x, y C n ortogonaalisia. Tällöin x ± y = x + y. Määritelmä.10. Olkoon S sisätuloavaruuden C n epätyhjä osajoukko. Tällöin joukon S ortogonaalikomplementiksi kutsutaan joukkoa S = {x C n x, y = 0, kaikilla y S}. 8

Lause.11. Jokainen äärellisulotteisen vektoriavaruuden lineaarisesti riippumaton osajoukko voidaan täydentää vektoriavaruuden kannaksi. Lause.1 (Gram-Schmidt -ortogonalisointialgoritmi). Muodostakoon vektorit y 1, y... y k vektoriavaruuden C n lineaarisesti riippumattoman osajoukon. Tällöin saamme muodostettua vektoriavaruuden C n ortogonaalisen osajoukon S = {x 1, x... x k } siten, että x 1 = y 1 ja x m = y m m 1 j=1 y m, x j x j, x j x j, kun m =,..., k. Saamme muodostettua vektoreista x 1, x..., x k ortonormaalit vektorit z 1, z..., z k jakamalla jokaisen vektorin x i sen omalla normillaan, eli kun i = 1,,..., k. z i = x i x i, Lause.13. Jokaisella äärellisulotteisella sisätuloavaruudella on ortonormaali kanta. Lause.14. Muodostakoon vektorit x 1, x... x n sisätuloavaruuden C n ortonormaalin kannan. Tällöin vektori y C n voidaan esittää yksikäsitteisessä muodossa n y = β i x i, jossa β i = y, x i, kun i = 1,,..., n. i=1 Lause.15. Olkoon A C m n. Tällöin Ker A = (Ran A) ja Ran A = (Ker A)..5 Lineaarisista yhtälöryhmistä Tässä luvussa kertaamme lineaarisen yhtälöryhmän ja siitä muodostetun matriisiyhtälön peruskäsitteitä kappaletta 6. varten. Määritelmä.11. Tarkastellaan lineaarista yhtälöryhmää a 11 x 1 + a 1 x + + a 1n x n = b 1 a 1 x 1 + a x + + a n x n = b.... a m1 x 1 + a m x + + a mn x n = b m. 9

Tämä yhtälöryhmä voidaan kirjoittaa matriisien avulla ekvivalenttiin muotoon Ax = b, jossa a 11 a 1 a 1n a 1 a a n A =....., x =. a m1 a m a mn x 1 x. x n b 1 b ja b =.. b m Tällöin yhtälöä Ax = b kutsutaan lineaarisen yhtälöryhmän matriisimuodoksi tai lyhyemmin lineaariseksi systeemiksi, ja matriisia A kutsutaan kerroinmatriisiksi. Jos lineaarisella systeemillä on sen toteuttava vektori x 1, niin tätä vektoria kutsutaan lineaarisen systeemin ratkaisuvektoriksi. Lause.16. Olkoon Ax = b lineaarinen systeemi, jossa A C m n, b C m ja x C n. Tällöin systeemillä on ratkaisu, jos ja vain jos b Ran A. Lause.17. Olkoon Ax = b lineaarinen systeemi, jossa A C m n, b C m ja x C n. Tällöin vektori x on sen ratkaisuvektori, jos ja vain jos Ax b = 0. 10

3 Unitaariset ja normaalit matriisit Tässä luvussa käsittelemme unitaarisia ja normaaleja matriiseja. Ensimmäisessä aliluvussa käsittelemme unitaarisia matriiseja ja niiden ominaisuuksia, jotka ovat suuressa roolissa myöhemmin aliluvussa 5 esitettävässä singulaariarvohajotelmassa. Toisessa aliluvussa käsittelemme normaaleja matriiseja, jotka ovat johdattelua aliluvussa 4 käsiteltäviin hermiittisiin ja definiittisiin matriiseihin ja muodostavat itsessäänkin mielenkiintoinen matriisien joukko. 3.1 Unitaariset matriisit Tässä aliluvussa esitellään siis unitaariset matriisit, jotka ovat yleistetty muoto reaalisista ortogonaalisista matriiseista, joille U T U = I. Kaikki aliluvussa käsiteltävät ominaisuudet siis toimivat myös ortogonaalisille matriiseille. Käsittelemme myös unitaarista similaarisuutta, joka on läheistä sukua similaarisuuden käsitteelle. Määritelmä 3.1. Matriisia U C n n sanotaan unitaariseksi, jos U U = I. Jos matriisi U R n n, niin U = U T, jolloin matriisia kutsutaan ortogonaaliseksi. Esimerkki 3.1. Matriisi 1 i i 3 6 U = 1 0 3 6 i 3 1 6 1 on unitaarinen, koska 1 U 0 i 1 i i U = i 3 1 3 1 3 6 1 0 0 3 0 3 1 6 = 0 1 0. i 6 1 i 3 1 6 1 6 6 0 0 1 Seuraavassa lauseessa esittelemme joitakin unitaaristen matriisien tärkeimpiä ominaisuuksia, joita tarvitsemme myöhemmin tutkielmassa. Lause 3.1. Jos U C n n, niin seuraavat ominaisuudet ovat ekvivalentteja. (1) Matriisi U on unitaarinen, () matriisi U on kääntyvä ja U 1 = U, (3) UU = I, (4) matriisi U on unitaarinen, (5) matriisin U sarakkeet muodostavat ortonormaalin joukon, 11

(6) matriisin U rivit muodostavat ortonormaalin joukon, (7) Ux, Uy = x, y kaikilla x, y C n. Todistus. Oletetaan ensin, että U on unitaarinen matriisi, eli U U = I. Tällöin U = U 1, koska U 1 on sellainen yksikäsitteinen matriisi, jolle U 1 U = I. Koska U 1 on olemassa, niin on matriisi U myös kääntyvä. Olemme siis todistaneet, että kohdasta (1) seuraa kohdan () väite. Oletetaan nyt, että U on kääntyvä matriisi ja U 1 = U. Tällöin selvästi niin UU = UU 1 = I, joten kohdasta () seuraa kohdan (3) väite. Oletetaan seuraavaksi, että UU = I. Koska U = (U ), niin (U ) U = I, joten määritelmän 3.1 nojalla myös U on unitaarinen. Olemme siis todistaneet, että kohdasta (3) seuraa kohdan (4) väite. Oletetaan U unitaariseksi ja todistetaan, että myös U on tällöin unitaarinen. Nyt määritelmän 3.1 nojalla (U ) U = I. Koska neliömatriiseille AB = I, jos ja vain jos BA = I ja (U ) = U, niin (U ) U = UU = U U = I, eli myös U on unitaarinen. Täten kohdasta (4) seuraa kohdan (1) väite. Näin olemme siis todistaneet, että kohdat (1)-(4) ovat ekvivalentteja. Osoitetaan vielä, että kohdat (1) ja (5), (4) ja (6) sekä (1) ja (7) ovat ekvivalentteja keskenään, jonka jälkeen olemme todistaneet lauseen. Oletetaan ensin, että vektorit u i C n, kun i = 1,,..., n, muodostavat matriisin U sarakkeet, eli U = [ u 1 u n ], jolloin u 1 u U [ ] 1, u 1 u n, u 1 U =. u1 u n =...... u n u 1, u n u n, u n Oletetaan, että U on unitaarinen, eli U U = I. Tällöin 1, kun i = j u i, u j = 0, kun i j. Tämä tarkoittaa sitä, että vektorit u 1,..., u n muodostavat ortonormaalin joukon. Kääntäen, jos oletetaan, että vektorit u 1,..., u n muodostavat ortonormaalin joukon, niin saamme u 1, u 1 u n, u 1 1 0 U U =..... =..... = I, u 1, u n u n, u n 0 1 joten matriisi U on unitaarinen. Olemme siis todistaneet, että kohdat (1) ja (5) ovat ekvivalentteja. Kohdat (4) ja (6) todistettaisiin ekvivalenteiksi samalla tavalla kuin (1) ja (5), joten sivuutamme kyseisen todistuksen. Osoitetaan vielä, että kohdat (1) ja (7) ovat ekvivalentteja. Oletetaan ensin, että x, y C n ja U U = I. Tällöin Ux, Uy = U Ux, y = x, y. 1

Oletetaan sitten, että Ux, Uy = x, y kaikilla x, y C n, jolloin sisätulon laskusääntöjen nojalla saadaan (U U I)x, y = 0. Jos valitaan y = (U U I)x, niin (U U I)x = 0, joten (U U I)x = Θ kaikilla x C n.täten on oltava (U U I) = 0, eli U U = I, joten matriisi U on unitaarinen. Seuraavassa lauseessa todistamme useamman unitaarisen matriisin tulon olevan myös unitaarinen. Lauseen muotoa on hieman muutettu kirjan [1] vastaavan lauseeseen verrattuna, sillä se todistaa vain kahden unitaarisen matriisin tulon unitaarisuuden. Lause 3.. Olkoon matriisit U 1, U,..., U m C n n unitaarisia. Tällöin myös matriisi U 1 U U m C n n on unitaarinen. Todistus. Jos U 1, U,..., U m C n n ovat unitaarisia, niin (U 1 U U m ) (U 1 U, U m ) = U m U U 1 U 1 U U m = U m U IU U m = U m U U U m = = I, joten myös U 1 U U m on unitaarinen. Unitaarisen matriisien ominaisuuksia tarkastellessa huomasimme, että niille pätee U = U 1. Voimmekin alkaa tarkastella sellaisia similaarisia matriiseja, jonka kääntyvä välittäjämatriisi on lisäksi myös unitaarinen. Määritelmä 3.. Matriiseja A, B C n n kutsutaan keskenään unitaarisesti similaarisiksi matriiseiksi, jos on olemassa unitaarinen matriisi U C n n siten, että A = UBU = UBU 1. Jos lisäksi matriisi B on diagonaalimatriisi, niin matriisia A kutsutaan unitaarisesti diagonalisoituvaksi. Selvästi unitaarisesti similaariset matriisit ovat myös similaarisia, joten kaikki similaarisuuteen liittyvät ominaisuudet pätevät myös unitaarisesti similaarisille matriiseille. Similaarisuuden tavoin myös unitaarinen similaarisuus on ekvivalenssirelaatio, kuten seuraava lause osoittaa. Lause 3.3. Unitaarinen similaarisuus on ekvivalenssirelaatio, eli (1) A = UAU, () jos A = UBU, niin B = V AV, (3) jos A = UBU ja B = V CV, niin A = W CW, missä W = UV, joillakin matriiseilla A, B, C C n n ja unitaarisilla matriiseilla U, V, W C n n. 13

Todistus. Todistetaan ensin kohta (1). Valitaan U = I, joka on unitaarinen, jolloin selvästi IAI = A, joten unitaarinen similaarisuus on refleksiivinen relaatio. Todistetaan seuraavaksi kohta (). Olkoon A = UBU. Nyt jos kerromme kyseisen yhtälön vasemmalta matriisilla U ja oikealta matriisilla U, saamme yhtälön muotoon U UBU U = B = U AU. Koska lauseen 3.1 nojalla U on unitaarinen, jos U on unitaarinen, niin voimme merkitä V = U ja saamme unitaarisesta similaarisuudesta myös symmetrisen relaation. Todistetaan vielä kohta (3). Nyt jos A = UBU ja B = V CV, saamme A = UBU = U(V CV )U = (UV )C(UV ). Koska lauseen 3. nojalla UV on unitaarinen, niin W = UV ja unitaarinen similaarisuus on transitiivinen relaatio. Koska unitaarinen similaarisuus on refleksiivinen, symmetrinen ja transitiivinen relaatio, niin se on ekvivalenssirelaatio. Esimerkki 3.. Vaikka kaikki unitaarisesti similaariset matriisit ovat myös similaarisia, niin toiseen suuntaan tämä ei kuitenkaa päde. Esimerkiksi [ ] [ ] [ ] [ ] 1 0 1 1 1 0 3 1 UBU 1 = = = A, 1 0 1 0 joten matriisit A ja B ovat similaarisia. Ne eivät ole kuitenkaan unitaarisesti similaarisia (todistus sivuutetaan). Unitaarisen similaarisuuden kohdalla nousee esiin kysymys, kuinka yksinkertaisessa muodossa mielivaltainen matriisi voidaan esittää unitaarisen similaarisuuden avulla. Tähän kysymyksen vastauksen antaa Schurin hajotelmaksi kutsuttu lause, jonka mukaan jokainen neliömatriisi on unitaarisesti similaarinen jonkin yläkolmiomatriisin kanssa. Olemme käyttäneet tämän lauseen todistukseen lähteenä kirjan [1] algoritmityyppistä todistusta, mutta lause voitaisiin todistaa myös induktion avulla (katso esimerkiksi [, s. 176-178]). Voisimme myös todistaa, että jokainen matriisi on unitaarisesti similaarinen jonkin alakolmiomatriisin kanssa, mutta sivuutamme kyseisen todistuksen. Yleisesti Schurin hajotelmasta käytetään seuraavaksi esiteltävää yläkolmiomuotoa. Lause 3.4 (Schurin hajotelma). Olkoot A C n n ja λ 1,..., λ n sen ominaisarvot. Tällöin on olemassa yläkolmiomatriisi T C n n, jonka diagonaalialkiot ovat matriisin A ominaisarvot, ja unitaarinen matriisi U C n n siten, että A = UT U. Toisin sanoen jokainen neliömatriisi A on unitaarisesti similaarinen jonkin yläkolmiomatriisin T kanssa, joka sisältää matriisin A ominaisarvot diagonaalialkioinaan. 14

Todistus. Merkitsemme diagonaalin yläpuolella olevia alkioita tai vektoreita merkillä, jos niiden muodolla ei ole todistuksen kannalta olennaista merkitystä. Olkoot λ 1,..., λ n matriisin A ominaisarvot ja x 1 C n ominaisarvoon λ 1 liittyvä ominaisvektori, jolle x 1 = 1. Täydennetään joukko {x 1 } vektoriavaruuden C n kannaksi ja muodostetaan Gram-Schmidtin ortogonalisointialgoritmin avulla tästä kannasta vektoriavaruuden C n ortonormaali kanta β 1 = {x 1, y,..., y n }. Järjestetään kannan β 1 vektorit matriisiksi U 1 = [ x 1 y... y n ] = [ x1 Y ]. Koska Ax 1 = λ 1 x 1 ja x 1, y j = y jx 1 = 0, kun j =,..., n, saamme [ ] x U1 AU 1 = 1 Y A [ x 1 Y ] [ x = 1 Ax 1 x ] 1AY Y Ax 1 Y AY [ ] [ x = 1 λ 1 x 1 λ1 x Y = ] [ ] 1x 1 λ1 λ 1 x 1 A 1 λ 1 Y = = C, x 1 A 1 Θ A 1 jossa A 1 = Y AY. Nyt matriisit A ja C ovat unitaarisesti similaarisina myös similaariset, joten niillä on samat ominaisarvot lauseen.5 nojalla. Tällöin siis matriisin A 1 C (n 1) (n 1) ominaisarvot ovat λ,..., λ n. Olkoon nyt x C (n 1) matriisin A 1 ominaisarvoa λ vastaava ominaisvektori. Tehdään tälle ominaisvektorille samat operaatiot kuin aikaisemmin vektorille x 1, jolloin saadaan vektoriavaruuden C (n 1) kanta β = {x, z 3,..., z n }. Määritellään unitaarinen matriisi U C (n 1) (n 1) siten, että jolloin U = [ x z 3 z n ], [ ] U λ A 1 U =. Θ A Muodostetaan sitten matriisi [ ] 1 Θ V = C n n. Θ U Huomataan, että matriisit V ja U 1 V ovat unitaarisia. Nyt saadaan matriisi V U1 AU 1 V muotoon V U 1 AU 1 V = [ λ1 Θ U A 1 U ] = λ 1 0 λ Θ Θ A Jatkamalla algoritmia unitaarisille matriiseille U i, jossa i = 1,,..., n 1, ja V i, jossa i =,..., n 1, ja merkitsemällä U = U 1 V V n 1 saamme matriisin Vn 1 V U1 AU 1 V V n 1 = U AU = T, 15.

jossa T C n n on haluttua muotoa oleva yläkolmiomatriisi ja matriisi U on unitaarinen. Nyt siis U AU = T, josta saamme A = UT U, eli matriisi A ja yläkolmiomatriisi T ovat unitaarisesti similaarisia. Edeltäneessä Schurin hajotelman todistuksessa osoitimme, että jokainen neliömatriisi on unitaarisesti similaarinen jonkun yläkolmiomatriisin kanssa. Emme kuitenkaan osoittaneet, että kyseinen yläkolmiomatriisi olisi yksikäsitteinen. Näin ei olekaan, sillä todistusta tarkastellessa voimme huomata, että voimme valita ominaisarvot diagonaalille missä järjestyksessä tahansa. Esimerkki 3.3. Tarkastellaan matriisia [ ] 1 0 A =, 0 i joka on selvästi unitaarisesti similaarinen itsensä ja täten jonkin yläkolmiomatriisin kanssa. Toisaalta se on unitaarisesti similaarinen myös yläkolmiomatriisin [ ] i 0 T = 0 1 kanssa, sillä UT U = 3. Normaalit matriisit [ ] [ ] [ ] 0 1 i 0 0 1 1 0 0 1 1 0 = [ ] 1 0 = A. 0 i Tässä aliluvussa esittelemme normaaleja matriiseja ja niiden ominaisuuksia. Olemme määritelleet normaalit matriisit erilailla kuin käyttämämme lähdekirja [3]. Tämä johtuu lähinnä kahdesta syystä. Ensinnäkin normaalit matriisit määritellään yleensä kirjallisuudessa esittämällämme tavalla ja toisekseen määritelmämme on tyyliltään sekä unitaaristen että hermiittisten matriisien määritelmien kanssa yhtäläinen. Määritelmä 3.3. Matriisia A C n n kutsutaan normaaliksi matriisiksi, jos A A = AA, eli jos A kommutoi sen konjugaattitranspoosin kanssa. Tarkastelemalla normaalien matriisien määritelmää voimme huomata helposti, että kaikki unitaariset matriisit ovat myös normaaleja matriiseja, sillä U U = I = UU. Kaikki normaalit matriisit eivät kuitenkaan ole unitaarisia, kuten voimme seuraavasta esimerkistä huomata. Esimerkki 3.4. Tarkastellaan matriisia i 0 1 A = 1 i 0. 0 1 i 16

Koska ja i 1 0 i 0 1 i i A A = 0 i 1 1 i 0 = i i 1 0 i 0 1 i i i i 0 1 i 1 0 i i AA = 1 i 0 0 i 1 = i i, 0 1 i 1 0 i i i niin matriisi A on normaali. Matriisi A ei kuitenkaan ole unitaarinen (eikä hermiittinen). Schurin hajotelma aikaisemmin osoitti, että mikä tahansa neliömatriisi on unitaarisesti similaarinen jonkun yläkolmiomatriisin kanssa. Normaaleista matriiseista voimme unitaarisen similaarisuuden avulla sanoa vielä enemmän, kuten seuraava lause osoittaa. Lause 3.5. Matriisi A C n n on normaali, jos ja vain jos se on unitaarisesti similaarinen sen ominaisarvoista λ 1, λ,..., λ n muodostetun diagonaalimatriisin D C n n kanssa, eli A = UDU, jossa D = diag (λ i ), kun i = 1,,..., n, ja U C n n on unitaarinen. Todistus. Oletetaan ensin, että A = UDU, jossa D on matriisin A ominaisarvoista muodostettu diagonaalimatriisi ja U unitaarinen. Tällöin AA = (UDU )(UDU ) = UDU UD U = UDD U = UD DU = UD U UDU = (UDU ) (UDU ) = A A, joten matriisi A on normaali. Oletetaan nyt, että A on normaali, eli AA = A A. Nyt lauseen 3.4 nojalla on olemassa unitaarinen matriisi U C n n ja yläkolmiomatriisi T C n n siten, että A = UT U. Koska AA = UT U UT U = UT T U ja A A = UT U UT U = UT T U, niin selvästi tulee olla myös (3.1) T T = T T. Nyt yhtälön (3.1) ensimmäisen rivin ensimmäiselle alkiolle saadaan t 11 + t 1 + + t 1n = t 11, josta saamme t 1 + + t 1n = 0, joten t 1i = 0, kun i =, 3,..., n. Yhtälön (3.1) toisen rivin toiselle alkiolle taasen saadaan t + t 3 + + t n = t 1 + t, 17

josta saamme t 3 + + t n = 0, joten t i = 0, kun i = 3,..., n. Näin jatkamalla saamme t jk = 0, kun j k, j = 1,,..., n ja k = 1,,..., n, joten matriisin T on diagonaalimatriisi. Lisäksi lauseen 3.4 nojalla matriisin T diagonaalialkiot ovat matriisin A ominaisarvot, joten olemme todistaneet lauseen. Seuraavaksi esitämme tärkeän lauseen normaalien matriisien ominaisvektoreista. Kirjassa [3] kyseistä ominaisuutta on käytetty normaalien matriisien määrittelyyn. Lause 3.6. Olkoon matriisi A normaali. Tällöin sillä on n kappaletta ortonormaaleja ominaisvektoreita. Todistus. Koska matriisi A on normaali, niin se voidaan kirjoittaa edellisen lauseen avulla muodossa A = UDU, joten se on diagonalisoituva. Tällöin lauseen.6 nojalla huomaamme, että matriisi U koostuu matriisin A ominaisvektoreista. Koska matriisin U sarakkeet ovat ortonormaaleja, niin matriisilla A on täten aina n kappaletta ortonormaaleja ominaisvektoreita. Täten siis huomaamme, että normaaleilla matriiseilla on aina olemassa ortonormaali ominaisvektorikanta. Käytämme tätä huomiota usein tutkielman myöhemmissä osissa, kuten myös normaalien matriisien hajotelmaa A = UDU, joka on erittäin kätevä muoto useissa todistuksissa. Lause 3.7. Olkoon matriisi A C n n normaali, olkoot λ 1, λ,..., λ n sen ominaisarvot ja olkoot x 1, x,..., x n niihin liittyvät ortonormaalit ominaisvektorit. Tällöin matriisin A ominaisarvot ovat λ 1, λ,..., λ n ja ominaisarvoihin liittyvät ortonormaalit ominaisvektorit ovat x 1, x,..., x n. Todistus. Koska matriisi A on normaali, niin se voidaan kirjottaa muotoon A = UDU, jossa D = diag(λ i ) C n n, kun i = 1,,..., n ja U C n n on muodostettu ortonormaaleista ominaisvektoreista x 1, x,..., x n. Nyt saamme A = (UDU ) = UDU. Koska D sisältää nyt diagonaalillaan matriisi A ominaisarvot, niin ne ovat muotoa λ i, kun i = 1,,..., n. Nyt myös U sisältää matriisin A ominaisvektorit, jotka ovat siis samat kuin matriisilla A. Luvun alussa huomasimme, että kaikki unitaariset matriisit ovat aina myös normaaleja. Tästä nousee esille kysymys, millä lisäehdoilla saamme normaalista matriisista unitaarisen. Seuraava lause antaa tähän vastauksen. Lause 3.8. Olkoon matriisi A C n n normaali. Tällöin A on unitaarinen, jos ja vain jos sen kaikki ominaisarvot sijaitsevat yksikköympyrällä. 18

Todistus. Olkoot matriisin A ominaisarvot λ 1, λ,..., λ n ja olkoot niihin liittyvät ortonormaalit ominaisvektorit x 1, x,..., x n. Tällöin Ax i = λ i x i ja x i, x i = 1, kun i = 1,,..., n. Oletetaan ensin, että matriisi A on unitaarinen. Tällöin Toisaalta Ax i, Ax i = A Ax i, x i = x i, x i = 1. Ax i, Ax i = λ i x i, λ i x i = λ i x i, x i = λ i, josta saamme λ i = 1, joten matriisin A kaikki ominaisarvot sijaitsevat yksikköympyrällä. Oletetaan sitten, että normaalin matriisin A kaikki ominaisarvot sijaitsevat yksikköympyrällä. Koska vektorit x 1, x,..., x n muodostavat vektoriavaruuden C n kannan, niin voimme mille tahansa vektorille x C n kirjoittaa jonka avulla saamme A Ax = A n x = α i x i, i=1 n i=1 α i Ax i = A Lauseen 3.7 nojalla A x i = λ i x i, joten saamme n i=1 α i λ i x i. n n n A Ax = α i λ i A x i = α i λ i x i = α i x i = x. i=1 i=1 i=1 Nyt A Ax = x kaikilla x C n, joten A A = I = AA, eli matriisi A on unitaarinen. 19

4 Hermiittiset ja positiivisesti (semi)definiitit matriisit Tässä luvussa käsittelemme ensin hermiittisiä matriiseja, jonka jälkeen käsittelemme niihin liittyviä definiittejä matriiseja. Hermiittisten matriisien käsittely rajoitetaan lähinnä johdattelemaan lukija definiitteihin matriiseihin. Lisäksi hermiittisistä matriiseista käydään läpi joitakin myöhemmin tarvittavia ominaisuuksia. Definiittejä matriiseja käsitellään hieman syvällisemmin kuin hermiittisiä matriiseja, koska ne ovat tärkeässä osassa luvussa 5. Johdattalemmekin definiittien matriisien avulla lukijan singulaariarvojen käsitteeseen, jota käsitellään luvussa 5.1. 4.1 Hermiittiset matriisit Reaaliarvoista matriisia kutsutaan symmetriseksi, jos A = A T. Tässä aliluvussa tutkitaan kompleksiarvoisten matriisen vastaavaa ominaisuutta. Määritelmä 4.1. Matriisia A C n n kutsutaan hermiittiseksi matriisiksi, jos pätee A = A. Jos A = A, niin matriisia A kutsutaan vinohermiittiseksi matriisiksi. Määritelmän perusteella voimme helposti huomata, että hermiittiset ja vinohermiittiset matriisit ovat aina myös normaaleja, sillä hermiittisille matriiseille pätee A A = A = AA ja vinohermiittisille A A = A = AA. Normaalit matriisit eivät kuitenkaan aina ole hermiittisiä tai vinohermiittisiä, kuten voimme huomata edellisen luvun esimerkin 3.4 tapauksessa. Joillakin lisäehdoilla normaalista matriisista tosin saadaan hermiittinen matriisi. Tätä asiaa käsitellään tarkemmin lauseessa 4.6. Seuraavissa kahdessa lauseessa käsittelemme joitain hermiittisyyteen liittyviä ominaisuuksia. Lause 4.1. Jos A C n n, niin matriisit A+A, AA, A A ovat hermiittisiä ja matriisi A A on vinohermiittinen. Todistus. Koska (A + A ) = A + (A ) = A + A, niin A + A on hermiittinen. Nyt (AA ) = (A ) A = AA ja vastaavasti (A A) = A (A ) = A A, joten myös AA ja A A ovat hermiittisiä. Koska (A A ) = A A = (A A ), niin matriisi A A on vinohermiittinen. Lause 4.. Seuraavassa luetellaan joitakin hermiittisiin ja vinohermiittisiin matriiseihin liittyviä ominaisuuksia. 0

(1) Jos A C n n on hermiittinen, niin myös A k on hermiittinen kaikilla k Z +. () Jos A C n n on hermiittinen ja kääntyvä, niin A 1 on hermiittinen. (3) Jos matriisit A, B C n n ovat (vino)hermiittisiä ja skalaarit a, b R, niin myös aa + bb on (vino)hermiittinen. (4) Jos A C n n on (vino)hermiittinen, niin ia on vinohermiittinen (hermiittinen). Todistus. Koska (A k ) = (A} {{ A} ) = } A {{ A } = (A ) k = A k, k kpl k kpl niin A k on hermiittinen ja kohta (1) on voimassa. Kohta () pätee triviaalisti lauseen.1, sillä (A 1 ) = (A ) 1 = A 1. Todistetaan kohta (3) kahdessa osassa, ensin hermiittisyyden osalta ja sitten vinohermiittisyyden osalta. Nyt jos A ja B ovat hermiittisiä, niin (aa + bb) = (aa) + (bb) = A a + B b = aa + bb, joten aa + bb on hermiittinen. Jos taas A ja B ovat vinohermiittisiä, niin (aa + bb) = A a + B b = aa bb = (aa + bb), joten tällöin aa + bb on vinohermiittinen. Todistetaan kohta (4) taas kahdessa osassa. Jos A on hermiittinen, niin (ia) = A i = ia, joten ia on vinohermiittinen. Jos A on vinohermiittinen, niin (ia) = A i = ia, joten tällöin ia on hermiittinen. Tarkastellaan mielivaltaista matriisia A C n n. On helppo huomata, että A voidaan esittää aina muodossa A = 1 (A + A ) + 1 (A A ) = H(A) + S(A). Tällöin lauseketta H(A) = 1 (A + A ) kutsutaan matriisin A hermiittiseksi osaksi ja lauseketta S(A) = 1 (A A ) kutsutaan matriisin A vinohermiittiseksi osaksi. Tässä saamme selvän analogian imaginäärilukujen ja neliömatriisien välille, jota emme tosin käsittele tässä tutkielmassa seuraavaa lausetta enempää. Jos samaistamme joukon C n n joukon C kanssa, niin hermiittiset matriisit ovat analogisia reaalilukujen joukon R kanssa. Seuraava lause vahvistaa tätä analogiaa. Lause 4.3. Jokainen matriisi A C n n voidaan esittää yksikäsitteisesti muodossa A = S + it, jossa S ja T ovat molemmat hermiittisiä. Matriisi A voidaan myös esittää yksikäsitteisesti muodossa A = B + C, jossa B on hermiittinen ja C vinohermiittinen matriisi. 1

Todistus. Osoitetaan ensin, että matriisi A C n n voidaan esittää muodossa A = 1 (A + A ) + i( i (A A )). Nyt nimittäin A = 1 (A + A ) + 1 (A A ) = 1 (A + A ) + i( i (A A )), joten voimme esittää matriisin A kyseisessä muodossa. Merkitään S = 1(A + A ) ja T = i(a A ) ja osoitetaan seuraavaksi, että S ja T ovat hermiittisiä. Lauseen 4.1 nojalla A + A on hermiittinen ja lauseen 4. kohdan (3) nojalla 1 (A+A ) on hermiittinen, joten matriisi S on hermiittinen. Lauseen 4.1 nojalla A A on vinohermiittinen, joten lauseen 4. kohdan (4) nojalla i(a A ) on hermiittinen. Tällöin saman lauseen kohdan (3) nojalla i (A A ) on hermiittinen, joten näin on todistettu, että myös T on hermiittinen. Osoittaaksemme esityksen yksikäsitteisyyden, teemme vastaoletuksen, että on olemassa toiset hermiittiset matriisit E ja F, joilla A = E + if. Tällöin S = A + A = (E + if ) + (E + if ) = E + if + E if = E, joten S = E. Vastaavasti it = A A = (E + if ) (E + if ) = E + if E + if = if, joten T = F. Esitysmuoto A = S + it on siis yksikäsitteinen Esitysmuotoon A = B+C liittyvät tarkastelut samanlaiset kuin muotoon A = S +it liittyvät tarkastelut, koska voimme helposti huomata, että B = S ja C = it. Tällöin tarvitsee vain todistaa matriisin C vinohermiittisyys, joka seuraa suoraan lauseen 4. kohdasta (4). Seuraavan kolmen lauseen avulla todistamme, että normaali matriisi on hermiittinen, jos ja vain jos sen ominaisarvot ovat positiivisia reaalilukuja. Toinen mielenkiintoinen tulos näistä lauseista on se, että hermiittisten matriisien ominaisarvot ovat aina reaalilukuja. Tätä ominaisuutta käsittelemme lisää aliluvussa 4.. Lause 4.4. Olkoon matriisi A C n n hermiittinen. Tällöin Ax, x R jokaisella x C n. Todistus. Merkitään Ax, x = x Ax = z C. Koska niin z = Ax, x R. z = x Ax = x A x = (x Ax) = z = z, Lause 4.5. Olkoon matriisi A C n n kaikki ominaisarvot ovat reaalilukuja. hermiittinen. Tällöin matriisin A

Todistus. Olkoot λ 1, λ,..., λ n matriisin A ominaisarvot ja olkoot vektorit x 1, x,..., x n niihin liittyvät ortonormaalit ominaisvektorit. Koska Ax i = λ i x i ja x i, x i = x i x i = 1, kun i = 1,,..., n, saamme lauseen 4.4 avulla λ i = λ i x i x i = x i λ i x i = x i Ax i = Ax, x R, joten kaikki hermiittisen matriisin ominaisarvot ovat reaalilukuja. Lause 4.6. Olkoon matriisi A C n n normaali. Tällöin matriisi A on hermiittinen, jos ja vain jos sen ominaisarvot ovat reaalilukuja. Todistus. Lauseessa 4.5 todistimme jo, että jos A on hermiittinen, niin sen ominaisarvot ovat reaalilukuja. Oletetaan, että matriisi A on normaali ja että sen kaikki ominaisarvot ovat reaalilukuja. Lauseen 3.5 nojalla voimme kirjoittaa A = UDU, jossa matriisi U C n n on unitaarinen ja D C n n on diagonaalimatriisi, jonka diagonaalialkiot ovat matriisin A ominaisarvot. Tällöin saamme joten matriisi A on hermiittinen. A = (UDU ) = UDU = UDU = A, 4. Positiivisesti (semi)definiitit matriisit Huomasimme edellisessä kappaleessa, että hermiittisten matriisien ominaisarvot ovat aina reaalilukuja. On luonnollista alkaa tutkia minkälaisia ominaisuuksia hermiittinen matriisi saa, jos sen ominaisarvot ovat pelkästään positiivisia tai ei-negatiivisia. Määritelmä 4.. Olkoon matriisi A C n n hermiittinen ja olkoot sen ominaisarvot λ 1,..., λ n. Tällöin matriisia A kutsutaan positiivisesti definiitiksi, jos sen kaikki ominaisarvot ovat positiivisia reaalilukuja, eli λ i > 0, kun i = 1,,..., n. Jos taas matriisin A ominaisarvot ovat kaikki ei-negatiivisia reaalilukuja, eli λ i 0, kun i = 1,,..., n, kutsutaan matriisia positiivisesti semidefiniitiksi. Vastaavasti voidaan määritellä negatiivisesti (semi)definiitit matriisit. On luonnollisempaa tutkia vain positiivisesti (semi)definiittejä matriiseja, sillä niillä on enemmän käyttöä myöhemmin tutkielmassa. Kuitenkin kaikki ominaisuudet, joita käsittelemme tässä luvussa, pätevät tietyillä muutoksilla myös negatiivisesti (semi)definiiteille matriiseille. Tämä johtuu siitä, että tutkiessamme negatiivisesti (semi)definiittiä matriisia A voimme tutkia matriisia A, joka on positiivisesti (semi)definiitti ja johon siten pätee kaikki niiden ominaisuudet. Lause 4.7. Olkoon A C n n positiivisesti semidefiniitti matriisi ja olkoon rank A = r. Tällöin matriisilla A on r kappaletta positiivista ominaisarvoa. 3

Todistus. Koska matriisi A on hermiittinen ja täten myös normaali, voidaan se lauseen 3.5 nojalla kirjottaa muotoon A = UDU, jossa matriisi U C n n on unitaarinen ja matriisi D C n n on diagonaalimatriisi, jonka diagonaalialkiot ovat matriisin A ominaisarvot. Nyt matriisit A ja D ovat unitaarisesti similaarisia, eli myös similaarisia, joten rank A = rank D = r. Tällöin siis matriisilla D on r kappaletta sellaisia rivejä, jotka eivät ole nollarivejä, joten nollasta eroavia diagonaalialkioita myös on r kappaletta. Koska diagonaalialkiot ovat matriisin A ominaisarvot ja matriisi A on oletuksen nojalla positiivisesti semidefiniitti, niin nämä r kappaletta nollasta eroavia ominaisarvoja ovat positiivisia. Seuraavassa lauseessa osoitamme, että positiivisesti (semi)definiitille matriisille löytyy aina sitä vastaava positiivisesti semidefiniitti neliöjuurimatriisi. Tämä tieto osoittautuu myöhemmin tärkeäksi käsitellessämme singulaariarvoja. Lause 4.8. Matriisi A C n n on positiivisesti (semi)definiitti, jos ja vain jos sillä on olemassa yksikäsitteinen positiivisesti (semi)definiitti neliöjuurimatriisi A 0 C n n, jolle A 0 = A. Lisäksi rank A = rank A 0. Todistus. Oletetaan, että matriisi A on positiivisesti definiitti ja λ 1,..., λ n ovat sen ominaisarvot, jolloin määritelmän 4. nojalla ne ovat positiivisia reaalilukuja. Täten voimme määritellä matriisin D 0 = diag ( λ 1,..., λ n ). Koska matriisi A on normaali, on olemassa unitaarinen matriisi U C n n ja diagonaalimatriisi D C n n siten, että A = UDU ja D 0 = D. Nyt haluttu neliöjuurimatriisi on A 0 = UD 0 U, sillä A 0 = (UD 0 U ) = UD 0U = UDU = A. Matriisi A 0 on selvästi positiivisesti definiitti, johtuen matriisin D 0 määrittelystä. Osoitetaan seuraavaksi, että positiivisesti definiitti neliöjuurimatriisi A 0 on yksikäsitteinen. Oletetaan, että on olemassa positiivisesti definiitti matriisi A 1 C n n, jolle pätee A 1 = A. Nyt A 1 = (UD 1 U ) = UD 1U = UDU = A, jossa D 1 = diag (± λ 1,..., ± λ n ). Koska A 1 on positiivisesti definiitti, niin sen ominaisarvot ovat positiivisia, joten tulee olla D 1 = diag ( λ 1,..., λ n ). Nyt D 1 = D 0, joten UD 1 U = UD 0 U, eli A 1 = A 0. Täten siis neliöjuurimatriisi A 0 on yksikäsitteinen. Oletetaan seuraavaksi, että A 0 = A ja A 0 on positiivisesti definiitti. Tällöin matriisin A ominaisarvot ovat matriisin A 0 ominaisarvojen neliöitä, joten ne kaikki ovat ei-negatiivisia, eli matriisi A on myös positiivisesti definiitti. Osoitetaan vielä, että rank A 0 = rank A. Koska matriisin D 0 diagonaalialkiot (eli matriisin A 0 ominaisarvot) ovat matriisin D neliöjuuria, niin matriiseilla D 0 ja D on yhtä monta positiivista diagonaalialkiota. Nyt selvästi rank A 0 = rank D 0 = rank D = rank A. 4

Todistuksesta huomaamme, että λ on matriisin A 0 ominaisarvo, jos ja vain jos λ on matriisin A ominaisarvo, ja että matriisien A ja A 0 ominaisavaruudet vastaavat toisiaan. Jatkossa käytämme neliöjuurimatriisista A 0 tutumpaa merkintää A. Seuraavaksi esitämme lauseen, jota joissakin lineaarialgebraa käsittelevissä kirjoissa käytetään definiittien matriisien määrittelemisessä. Vaikka tätä lausetta ei käytetä myöhemmin tutkielmassa, on se kuitenkin joissakin tapauksissa hyödyllinen työväline definiittien matriisien käsittelyssä. Lause 4.9. Olkoon A C n n hermiittinen matriisi. Tällöin A on positiivisesti (semi)definiitti, jos ja vain jos Ax, x on positiivinen (ei negatiivinen) kaikilla x C n. Todistus. Olkoot vektorit u 1,..., u n matriisin A ominaisarvoja λ 1,..., λ n vastaavat ominaisvektorit, jotka muodostavat vektoriavaruuden C n ortonormaalin kannan. Oletetaan, että Ax, x on positiiviinen kaikilla x C n. Tällöin 0 < Au i, u i = λ i u i, u i = λ i u i, u i = λ i, kun i = 1,,..., n, joten matriisi A on positiivisesti definiitti. Oletetaan seuraavaksi, että A on positiivisesti definiitti matriisi ja osoitetaan, että tällöin Ax, x on positiivinen kaikilla x C n. Lauseen 4.8 nojalla A = ( A), joten Ax, x = ( A) x, x = Ax, ( A) x = Ax, Ax > 0, millä tahansa x C n. Positiivisesti semidefiniittin matriisin tapaus osoitetaan todeksi samalla tavalla kuin positiivisesti definiitti tapaus, joten sivuutamme kyseisen todistuksen. Huomaamme seuraavassa lauseessa, että mielivaltaisesta matriisista tietyllä tavalla muodostetut matriisit ovat aina positiivisesti definiittejä. Tällä tulee olemaan tärkeä merkitys etenkin luvussa 5.1. Lause 4.10. Olkoon A C m n. Tällöin A A C n n ja AA C m m ovat positiivisesti semidefiniittejä matriiseja. Todistus. Lauseen 4.1 nojalla A A ja AA ovat hermiittisiä. Nyt ja A Ax, x = Ax, Ax 0 AA x, x = A x, A x 0, joten lauseen 4.9 nojalla A A ja AA ovat positiivisesti semidefiniittejä. 5

Huomataan, että lauseiden 4.8 ja 4.10 nojalla jokaista mielivaltaista matriisia A C m n kohden on aina olemassa positiivisesti definiitti matriisi A A C n n. Luvussa 5.1 tulemme käsittelemään näin muodostettuja matriiseja ja niiden ominaisarvoja. Lause 4.11. Jokaiselle matriisille A C m n pätee Ker(A A) = Ker A ja Ran(A A) = Ran A. Todistus. Osoitetaan ensin, että Ker(A A) = Ker A. Olkoon x C n. Oletetaan, että x Ker A, eli Ax = Θ. Tällöin x Ker(A A), koska A Ax = A Θ = Θ, joten Ker A Ker(A A). Oletetaan sitten, että x Ker A A, eli A Ax = Θ. Tällöin kertomalla edellisen yhtälön molemmat puolet vasemmalta vektorilla x saamme x A Ax = x Θ = 0, josta seuraa Ax, Ax = 0. Tämä yhtälö pätee vain, jos Ax = Θ, joten x Ker A. Osoitimme siis, että Ker(A A) Ker A, joten Ker(A A) = Ker A. Todistetaan vielä, että Ran(A A) = Ran A. Jos x Ran(A A), eli A Ay = x, jollakin y C n, niin selvästi myös x Ran A. Tällöin siis Ran(A A) Ran A. Nyt vektoriavaruus Ran(A A) on vektoriavaruuden Ran A aliavaruus. Koska Ker(A A) = Ker A, niin rank(a A) = n dim [Ker(A A)] = n dim [Ker(A)] = rank A. Nyt lauseen. nojalla rank(a A) = rank A = rank A, joten lauseen.3 nojalla on oltava Ran(A A) = Ran(A ). 6

5 Singulaariarvohajotelma Tutkiessamme matriisien ominaisuuksia voimme usein tutkia niiden ominaisarvoja. Kuitenkin ominaisarvoja voidaan löytää vain neliömatriiseille, joten mielivaltaisen matriisin tutkiminen ei onnistu ominaisarvojen avulla. Emme myöskään voi tehdä mielivaltaiselle matriisille mielekästä hajotelmaa ominaisarvojen avulla. On kuitenkin mahdollista löytää mielivaltaiselle matriisille siitä kuvaavia skalaareita ja niiden avulla mielivaltaiselle matriisille mielekäs hajotelma. Tämä luku käsittelee näitä aiheita. 5.1 Singulaariarvot Huomasimme edellisessä luvussa, että matriisi A A C n n voidaan aina muodostaa matriisista A C m n ja lisäksi näin muodostettu matriisi on lisäksi aina positiivisesti semidefiniitti. Tässä luvussa käsittelemme kyseisen matriisin ominaisarvoja. Määritelmä 5.1. Olkoot A C m n ja A A siitä muodostettu positiivisesti semidefiniitti matriisi ja olkoot λ 1 λ λ r > λ r+1 = = λ n = 0 matriisin A A ominaisarvot. Tällöin matriisin A A ominaisarvoja λ 1,..., λ r kutsutaan matriisin A singulaariarvoiksi ja merkitään λ i = s i, kun i = 1,,..., r. Koska matriisi A A on positiivisesti semidefiniitti, niin matriisin A singulaariarvot ovat aina positiivisia, eli s i > 0, kun i = 1,,..., r. Usein matriisin A A ominaisarvot λ r+1 = = λ n = 0 määritellään myös matriisin A singulaariarvoiksi, mutta tämä määrittely osoittautuu usein ongelmalliseksi. Jos ottaisimme nollat mukaan singulaariarvoihin, joutuisimme kuitenkin lähes joka lauseessa käsittelemään vain nollasta eroavia singulaariarvoja. Esimerkki 5.1. Etsitään matriisin i 0 A = 0 i i 0 singulaariarvot. Nyt joten A A = [ ] i 0 i 0 i 0 i = 0 i 0 i 0 A A = [ ] 0. 0 1 [ ] 0, 0 1 Koska A A on diagonaalimatriisi, on sen ominaisarvot sen diagonaalialkiot, eli λ 1 = ja λ = 1. Nyt siis matriisin A singulaariarvot ovat s 1 = ja s = 1. 7

Joskus singulaariarvot määritellään matriisin AA nollasta eroavina ominaisarvoina, mutta tällä ei ole merkittävää eroa määritelmäämme, kuten seuraava lause osoittaa. Lause 5.1. Olkoon A C m n. Tälloin matriisien A A C n n ja AA C m m nollasta eroavat ominaisarvot vastaavat toisiaan. Todistus. Lauseen todistamiseksi meidän tarvitsee todistaa lause matriiseille A A ja AA, jolloin saamme halutun lauseen todistettua myös neliöjuurimatriiseille. Olkoot λ 1,..., λ n matriisin A A ominaisarvot ja olkoot x 1,..., x n kyseisiä ominaisarvoja vastaavat ominaisvektorit siten, että ne muodostavat vektoriavaruuden C n ortonormaalin kannan. Tällöin saamme Ax i, Ax i = A Ax i, x i = λ i x i, x i = λ i x i, x i = λ i, kun i = 1,,..., n. Täten siis Ax i = Θ, jos ja vain jos λ i = 0. Nyt AA (Ax i ) = A(A Ax i ) = A(λ i x i ) = λ i (Ax i ), kun i = 1,,..., n. Tällöin huomaamme, että jos λ i 0, niin Ax i on matriisin AA ominaisvektori. Jos siis λ i 0 on matriisin A A ominaisvektoria x i vastaava ominaisarvo, niin λ i on matriisin AA ominaisvektoria Ax i vastaava ominaisarvo. Tällöin siis matriisin A A ominaisarvojen joukko on matriisin AA ominaisarvojen joukon osajoukko. Osajoukkous toiseen suuntaan voidaan todistaa vaihtamalla edellisen todistuksen matriisien A ja A paikat keskenään. Tällöin matriisin A A nollasta eroavia ominaisarvoja vastaavat ominaisvektorit ovat muotoa A x i. Täten olemme siis todistaneet, että matriisien A A ja AA nollasta eroavat ominaisarvot vastaavat toisiaan, joten myös matriisien A A ja AA nollasta eroavat ominaisarvot vastaavat toisiaan. Nyt siis voisimme määritellä matriisin A singulaariarvot myös matriisin AA nollasta eroavina ominaisarvoina, kuten esimerkiksi kirjassa [1] tehdään. Tämä myös helpottaa joissakin tapauksissa singulaariarvojen laskemista. Lause 5.. Olkoon A C m n ja olkoot x 1,..., x r matriisin A A (vaihtoehtoisesti AA ) ortonormaalit ominaisvektorit, jotka vastaavat sen nollasta eroavia ominaisarvoja. Tällöin Ax 1,..., Ax r (A x 1,..., A x r ) ovat matriisin AA (A A) nollasta erovia ominaisarvoja vastaavat ortogonaaliset ominaisvektorit. Todistus. Lauseessa 5.1 osoitimme jo, että matriisien A A ja AA nollasta eroavat ominaisarvot vastaavat toisiaan. Samassa lauseessa osoitimme myös, että jos x 1 on matriisin A A nollasta eroavaa ominaisarvoa vastaava ominaisvektori, niin Ax i on matriisin AA samaa ominaisarvoa vastaava ominaisvektori. Olkoot x 1,..., x r matriisin A A ortonormaalit ominaisvektorit, 8

jotka vastaavat sen nollasta eroavia ominaisarvoja, ja olkoot y 1,..., y r matriisin AA samoja nollasta eroavia ominaisarvoja vastaavat ominaisvektorit, jolloin siis y i = Ax i, kun i = 1,,..., r. Nyt y i, y j = Ax i, Ax j = A Ax i, x j = λ i x i, x j = λ i x i, x j = 0, kun i j, i = 1,,..., r ja j = 1,,..., r. Täten siis vektorit y 1,..., y r ovat ortogonaalisia. Vastaava väite saadaan vaihtamalle matriisien A ja A paikkoja, joten sivuutamme kyseisen todistuksen. Jos siis tiedämme matriisin A A ortonormaalit ominaisvektorit, jotka ovat aina olemassa, koska A A on normaali, voimme ratkaista matriisin AA nollasta erovia ominaisarvoja vastaavat ortonormaalit ominaisvektorit kertomalla matriisin A A ortonormaalit ominaisvektorit matriisilla A ja jakamalla ne normillansa. Tämä matriisijoukko voidaan lisäksi täydentää matriisin AA ortonormaaliksi ominaisvektorikannaksi lisäämällä siihen matriisin AA ytimen ortonormaali kanta. 5. Singulaariarvohajotelma Tässä kappaleessa käsittelemme singulaariarvohajotelmaa, joka liittyy vahvasti singulaariarvoihin. Singulaariarvohajotelma on erittäin mielekäs työkalu mielivaltaisten matriisien tutkimiseen, ja sille löytyykin paljon sovelluksia esimerkiksi tilastotieteessä. Lause 5.3 (Singulaariarvohajotelma). Olkoon A C m n ja olkoot s 1,..., s r matriisin A singulaariarvot. Tällöin matriisi A voidaan esittää muodossa A = UDV, jossa U C m m ja V C n n ovat unitaarisia ja D C m n on matriisi, jossa D(i, i) = s i, kun i = 1,,..., r, ja sen muut alkiot ovat nollia. Todistus. Olkoot λ 1 λ λ r > λ r+1 = = λ n = 0 matriisin A A ominaisarvot ja olkoot x 1,... x n niitä vastaavat ominaisvektorit, jotka muodostavat vektoriavaruuden C n ortonormaalin kannan. Koska lauseen 5. nojalla matriisin AA nollasta eroavia ominaisarvoja vastaavat ominaisvektorit ovat ortogonaalisia, niin saamme matriisin AA ominaisarvoja λ 1,..., λ r vastaavat ortonormaalit ominaisvektorit kaavalla y i = 1 Ax i Ax i = = 1 λ i x i, x i Ax i = 1 Ax i, Ax i Ax i = 1 A Ax i, x i Ax i 1 λi x i, x i Ax i = 1 λi Ax i, 9

kun i = 1,,..., r. Valitaan matriisin AA ytimestä vektorit y r+1,..., y m, jotka muodostavat ytimen ortonormaalin kannan, jolloin vektorit y 1,..., y m muodostavat matriisin AA ortonormaalin ominaisvektorikannan. Nyt saamme edellisestä yhtälöstä (5.1) Ax i = λ i y i = s i y i, kun i = 1,,..., r, ja määritelmänsä mukaan Ax i = Θ, kun i = r + 1,..., n. Olkoot nyt matriisit V ja U muotoa V = [ x 1 x x n ] ja U = [ y 1 y y m ], jolloin lauseen 3.1 nojalla ne ovat unitaarisia. Nyt yhtälön (5.1) avulla voimme muodostaa yhtälön AV = [ Ax 1 Ax n ] = [ s1 y 1 s r y r Θ Θ ] = UD, josta saamme halutun muodon A = UDV. Singulaariarvohajotelman todistuksen perusteella voimme sanoa enemmän matriiseista U ja V. Matriisi U muodostuu matriisin AA ortonormaaleista ominaisvektoreista ja matriisi V matriisin A A ortonormaaleista ominaisvektoreista. Määritelmä 5.. Lauseen 5.3 todistuksessa esiintyviä ortonormaaleja vektoreita x 1, x,..., x n ja y 1, y,..., y m kutsutaan matriisin A oikean- ja vasemmanpuoleisiksi singulaarivektoreiksi. Nämä vektorit muodostavat vektoriavaruuksien C n ja C m ortonormaalit kannat, joita kutsutaan matriisin A oikean- ja vasemmanpuoleisiksi singulaarikannoiksi. Määritelmässä esiintyvät vektorit x 1, x,..., x n siis muodostavat matriisin A A ortonormaalin ominaisvektorikannan ja vektorit y 1, y,..., y m muodostavat matriisin AA ortonormaalin ominaisvektorikannan, eli matriisien V ja U sarakkeet. Seuraava lause kokoaa myös hieman lauseen 5.3 sisältöä ja antaa hieman lisää laskennallisia työkaluja singulaariarvohajotelmien ratkaisemiseen. Lause 5.4. Muodostakoon vektorit x 1, x,..., x n ja y 1, y,..., y m matriisin A C m n singulaarikannat ja olkoot s 1, s,..., s r matriisin A singulaariarvot. Tällöin s i y i, kun i = 1,,..., r Ax i = Θ, kun i = r + 1,..., n ja A s i x i, kun i = 1,,..., r y i = Θ, kun i = r + 1,..., m. 30