Matriisin singulaariarvoista

Samankaltaiset tiedostot
Matriisiteoria Harjoitus 1, kevät Olkoon. cos α sin α A(α) = . sin α cos α. Osoita, että A(α + β) = A(α)A(β). Mikä matriisi A(α)A( α) on?

Sisätuloavaruudet. 4. lokakuuta 2006

Ennakkotehtävän ratkaisu

Ratkaisuehdotukset LH 8 / vko 47

BM20A0700, Matematiikka KoTiB2

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

Ortogonaalisen kannan etsiminen

Käänteismatriisi 1 / 14

1.1. Määritelmiä ja nimityksiä

Ominaisarvo-hajoitelma ja diagonalisointi

Determinantti 1 / 30

(1.1) Ae j = a k,j e k.

Singulaariarvohajotelma ja pseudoinverssi

5 Ominaisarvot ja ominaisvektorit

Insinöörimatematiikka D

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Esimerkki 19. Esimerkissä 16 miniminormiratkaisu on (ˆx 1, ˆx 2 ) = (1, 0).

Insinöörimatematiikka D

Johdatus tekoälyn taustalla olevaan matematiikkaan

Inversio-ongelmien laskennallinen peruskurssi Luento 3

MS-C1340 Lineaarialgebra ja

Inversio-ongelmien laskennallinen peruskurssi Luento 2

Ominaisvektoreiden lineaarinen riippumattomuus

LU-hajotelma. Esimerkki 1 Matriisi on yläkolmiomatriisi ja matriisi. on alakolmiomatriisi. 3 / 24

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä

Matematiikka B2 - TUDI

Matriisit. Määritelmä 1 Reaaliluvuista a ij, missä i = 1,..., k ja j = 1,..., n, muodostettua kaaviota a 11 a 12 a 1n a 21 a 22 a 2n A =

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

Lineaarialgebra ja differentiaaliyhtälöt Harjoitus 4 / Ratkaisut

Insinöörimatematiikka D

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Matematiikan tukikurssi, kurssikerta 3

Lineaarialgebra ja matriisilaskenta II. LM2, Kesä /141

Numeeriset menetelmät

Lineaarikuvauksen R n R m matriisi

7 Vapaus. 7.1 Vapauden määritelmä

Jokaisen parittoman kokonaisluvun toinen potenssi on pariton.

Ominaisarvoon 4 liittyvät ominaisvektorit ovat yhtälön Ax = 4x eli yhtälöryhmän x 1 + 2x 2 + x 3 = 4x 1 3x 2 + x 3 = 4x 2 5x 2 x 3 = 4x 3.

Insinöörimatematiikka D

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja

802320A LINEAARIALGEBRA OSA I

1. Normi ja sisätulo

Sekalaiset tehtävät, 11. syyskuuta 2005, sivu 1 / 13. Tehtäviä

Monissa käytännön ongelmissa ei matriisiyhtälölle Ax = b saada ratkaisua, mutta approksimaatio on silti käyttökelpoinen.

Matriisihajotelmat. MS-A0007 Matriisilaskenta. 5.1 Diagonalisointi. 5.1 Diagonalisointi

1 Lineaariavaruus eli Vektoriavaruus

Insinöörimatematiikka D

Numeeriset menetelmät

Matematiikka B2 - Avoin yliopisto

1 Ominaisarvot ja ominaisvektorit

6 MATRIISIN DIAGONALISOINTI

9 Matriisit. 9.1 Matriisien laskutoimituksia

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Lineaariset kongruenssiyhtälöryhmät

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo.

Ratkaisuehdotukset LH 7 / vko 47

802320A LINEAARIALGEBRA OSA II

6. OMINAISARVOT JA DIAGONALISOINTI

Insinöörimatematiikka D

Lineaarialgebra a, kevät 2018 Harjoitusta 5 Maplella

1 Sisätulo- ja normiavaruudet

Iteratiiviset ratkaisumenetelmät

1 Avaruuksien ja lineaarikuvausten suora summa

Insinöörimatematiikka D

Matematiikan ja tilastotieteen laitos Reaalianalyysi I Harjoitus Malliratkaisut (Sauli Lindberg)

i=1 Näistä on helppo näyttää ominaisuudet (1)-(4). Ellei toisin mainita, käytetään R n :ssä

Matriisilaskenta. Harjoitusten 3 ratkaisut (Kevät 2019) 1. Olkoot AB = ja 2. Osoitetaan, että matriisi B on matriisin A käänteismatriisi.

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

3.1 Lineaarikuvaukset. MS-A0004/A0006 Matriisilaskenta. 3.1 Lineaarikuvaukset. 3.1 Lineaarikuvaukset

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

MATRIISIN HESSENBERGIN MUOTO. Niko Holopainen

10 Matriisit ja yhtälöryhmät

Ortogonaalinen ja ortonormaali kanta

Cantorin joukon suoristuvuus tasossa

Yhteenlaskun ja skalaarilla kertomisen ominaisuuksia

1 Singulaariarvohajoitelma

(0 desimaalia, 2 merkitsevää numeroa).

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Tehtävä 2. Osoita, että seuraavat luvut ovat algebrallisia etsimällä jokin kokonaislukukertoiminen yhtälö jonka ne toteuttavat.

Rollen lause polynomeille

Inversio-ongelmien laskennallinen peruskurssi Luento 4

MS-C1340 Lineaarialgebra ja

Ortogonaaliset matriisit, määritelmä 1

Matematiikan tukikurssi

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Matemaattinen Analyysi / kertaus

Talousmatematiikan perusteet: Luento 9. Matriisien peruskäsitteet Yksinkertaiset laskutoimitukset Transponointi Matriisitulo

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

802320A LINEAARIALGEBRA OSA III

1 Matriisit ja lineaariset yhtälöryhmät

Paikannuksen matematiikka MAT

Esitetään tehtävälle kaksi hieman erilaista ratkaisua. Ratkaisutapa 1. Lähdetään sieventämään epäyhtälön vasenta puolta:

MS-C1340 Lineaarialgebra ja

Lineaariset yhtälöryhmät ja matriisit

Talousmatematiikan perusteet: Luento 10. Lineaarikuvaus Matriisin aste Determinantti Käänteismatriisi

Transkriptio:

TAMPEREEN YLIOPISTO Pro gradu -tutkielma Samuli Saarenpää Matriisin singulaariarvoista Matematiikan ja tilastotieteen laitos Matematiikka Kevät 2008

Tampereen yliopisto Matematiikan ja tilastotieteen laitos SAARENPÄÄ, SAMULI: Matriisin singulaariarvoista Pro gradu -tutkielma, 29 s. Matematiikka Huhtikuu 2008 Tiivistelmä Tutkielmassa käsitellään matriisin singulaariarvoja, niiden välisiä epäyhtälöitä sekä niiden yhteyksiä ominaisarvoihin ja normeihin. Ensimmäisessä luvussa määritellään muutamia merkintöjä ja esitellään matriisin singulaariarvo- ja napahajotelmat. Toisessa luvussa tutustutaan lähemmin singulaariarvoihin ja niiden ominaisuuksiin. Lisäksi käydään läpi useita epäyhtälöitä singulaari- ja ominaisarvoille. Kolmannen luvun pääsisältönä ovat unitaarisesti invariantit normit. Tässä luvussa tutkitaan monia epäyhtälöitä singulaariarvojen summille ja määritellään Ky Fanin k-normit. Neljännessä luvussa esitellään vielä yksi tärkeä luonnehdinta unitaarisesti invarianteille normeille, joka tunnetaan von Neumannin lauseena. Päälähteenä on R.A.Hornin ja C.R.Johnsonin kirja Topics in Matrix Analysis.

Sisältö Tiivistelmä 1 Johdanto 3 1 Singulaariarvo- ja napahajotelma 6 2 Singulaariarvot 7 2.1 Singulaariarvojen ominaisuuksia................. 7 2.2 Singulaariarvoepäyhtälöitä.................... 10 3 Singulaariarvot ja normit 16 3.1 Singulaariarvojen summat: Ky Fanin k-normit......... 16 3.2 Singulaariarvot ja unitaarisesti invariantit normit....... 19 4 von Neumannin lause 25

Johdanto Monet numeerisen lineaarialgebran nykyaikaisista algoritmeista pohjautuvat singulaariarvoihin, sillä yleisen matriisin singulaariarvojen laskeminen on hyvänlaatuinen (well-conditioned) tehtävä. Lisäksi singulaariarvoilla on tärkeä merkitys unitaarisesti invarianttien normien teoriassa, tilastollisissa approksimaatioissa ja monella muullakin alalla. Singulaariarvo- ja napahajotelma ovat nykyajan matriisialgebran kulmakiviä, joten tutustutaan hieman niiden historiaan. Merkitään, että M n on n n -matriisien joukko. Singulaariarvojen tutkimuksen alkuvaiheita hahmotteli Eugenio Beltrami vuonna 1873. Hän osoitti, että jokaiselle reaalimatriisille A M n on aina olemassa sellaiset ortogonaaliset (ja reaaliset) Q 1, Q 2 M n, että Q T 1 AQ 2 = Σ = diag(σ 1 (A),..., σ n (A)), missä σ 1 (A),..., σ n (A) 0 ja σ1(a) 2 σn(a) 2 ovat matriisin A T A (ja myös matriisin AA T ) ominaisarvot. Hän todisti myös, että matriisin Q 1 ja vastaavasti Q 2 (ortonormaalit) sarakkeet ovat matriisin AA T ja vastaavasti A T A ominaisvektoreita. Beltrami ei käyttänyt minkäänlaista termiä tälle esitykselle, mutta sitä kutsutaan nykyisin singulaariarvohajotelmaksi ja luvut σ 1 (A) σ n (A) ovat singulaariarvoja. Vuonna 1874 Camille Jordan päätyi samaan tulokseen kuin Beltrami, mutta täysin erilaisella lähestymistavalla. Hän huomasi, että reaalisen ja symmetrisen matriisin [ ] 0 A A T 0 n suurinta (ja välttämättä reaalista) ominaisarvoa ovat nämä singulaariarvot σ 1 (A),..., σ n (A). Jordanin käyttämää lohkomatriisia on myöhemmin käytetty paljon ja sen avulla on pystytty liittämään Hermiten matriisin ominaisarvot yleisen matriisin singulaariarvoihin. Hämmästyttävää kyllä, vuosina 1889 1890 James Joseph Sylvester päätyi samaan tulokseen kuin Beltrami ja Jordan ilmeisesti täysin tietämättömänä näiden töistä ja esitti kolmannen erilaisen todistuksen kyseiselle esitykselle. Napahajotelman ensivaiheita esitti Leon Autonne vuonna 1902 osoittamalla, että jokainen ei-singulaarinen kompleksimatriisi A M n voidaan esittää muodossa A = UP, missä U M n on unitaarinen ja P M n on positiivisesti definiitti. Hän palasi tulokseensa vuosina 1913 ja 1915 ja onnistui todistamaan, että jokainen kompleksinen neliömatriisi A M n (singulaarinen tai ei) voidaan kirjoittaa muodossa A = V ΣW, missä V, W M n ovat unitaarisia ja Σ on ei-negatiivinen diagonaalimatriisi. Tuolloin hän ei antanut matriisin Σ alkioille mitään nimitystä. Autonne huomasi, että Σ on matriisin A yksikäsitteisesti määräämä, mutta V ja W eivät ole. Hän huomasi myös, että unitaariset tekijät V ja W 3

voidaan valita reaalisiksi ja ortogonaalisiksi, jos A on reaalinen. Täten hän osoitti Beltramin, Jordanin ja Sylvesterin kanonisen muodon olevan erikoistapaus hänen tuloksestaan, mutta oli ilmeisesti tietämätön näistä aiemmista tuloksista. Kirjoittamalla A = V ΣW = (V ΣV )(V W ) Autonne yleisti vuoden 1902 napahajotelmansa koskemaan nyt myös singulaarisia neliömatriiseja. Vaikka hän käsittelikin vain neliömatriisien singulaariarvohajotelmaa vuoden 1915 työssään, seuraa yleinen muoto suoraan hänen neliömatriisitapauksesta. Yleinen versio napahajotelmasta kompleksimatriiseille julkaistiin vuonna 1935 John Williamsonin toimesta. Hän käytti Autonnen vuoden 1902 tulosta ei-singulaarisille neliömatriiseille, mutta ei viitannut lainkaan Autonnen vuoden 1915 yleistettyyn tulokseen. Williamson ei maininnut mitään singulaariarvohajotelmasta, joten yleisen singulaariarvohajotelman ei voida sanoa seuraavan hänen työstään. Viimein vuonna 1939 selkeä ja täydellinen yleistetty singulaariarvohajotelma kompleksimatriiseille esiteltiin Carl Eckartin ja Gale Youngin toimesta. Hekään eivät käyttäneet vielä termiä singulaariarvo. Termi yleistyi vasta vuonna 1950 Alfred Hornin toimesta. Tällöin sitä käytettiin hieman eri yhteydessä, mutta vuonna 1954 Horn yleisti singulaariarvojen käsitteen myös matriisialgebraan. Mielenkiintoisia ja hyödyllisiä singulaariarvoepäyhtälöitä on paljon. Vuosina 1949 1950 Ky Fan kehitti ensimmäisiä versioita ominaisarvojen ja singulaariarvojen summista. Vuonna 1951 hän syvensi työtään summien parissa onnistuen todistamaan useita singulaariarvoepäyhtälöitä. Hänen tulostensa tärkeimpänä piirteenä pidetään sitä, että ne ovat nimenomaan matriisin A funktioita eikä hän ajatellut enää matriisin A A avulla. Niitä pidetäänkin singulaariarvoepäyhtälöiden nykyteorian perustana. Tämän työn lukijan oletetaan hallitsevan lineaarialgebran perusteet. Lisäksi useat matriisialgebran käsitteet, kuten unitaarisuus ja Hermiten matriisi, oletetaan myös tunnetuiksi. Hyvänä lähtökohtana voisi pitää R.A.Hornin ja C.R.Johnsonin kirjaa Matrix Analysis, jota on käsitelty kurssilla Lineaarialgebra III. Ensimmäisessä luvussa määritellään vain muutamia merkintöjä ja esitellään tärkeät singulaariarvo- ja napahajotelmat. Todistuksia näille ei esitetä, sillä ne eivät ole työn kannalta oleellisia, mutta ne löytyvät lähdekirjallisuudesta. Toisessa luvussa tutustutaan lähemmin singulaariarvoihin ja niiden ominaisuuksiin. Lisäksi käydään läpi useita mielenkiintoisia epäyhtälöitä singulaariarvoille ja ominaisarvoille. Kolmannen luvun pääsisältönä ovat unitaarisesti invariantit normit. Tässä luvussa tutkitaan monia mielenkiintoisia epäyhtälöitä singulaariarvojen summille ja määritellään Ky Fanin k-normit. Viimeisessä luvussa esitellään vielä yksi tärkeä luonnehdinta unitaarisesti invarianteille normeille, joka tunnetaan von Neumannin lauseena. Suurin osa esitetyistä lauseista on peräisin R.A.Hornin ja C.R.Johnsonin 4

kirjasta Topics in Matrix Analysis. Vertailun vuoksi lukija voi löytää suurimman osan lauseista myös R.Bhatian kirjasta Matrix Analysis, jossa on käytetty hyvin erilaista formalismia. 5

1 Singulaariarvo- ja napahajotelma Tässä luvussa esitellään matriisialgebran kannalta kaksi erittäin hyödyllistä lausetta. Aivan aluksi käydään kuitenkin läpi joitakin merkintöjä. Joukko M m,n on kaikkien kompleksialkioisten m n -matriisien joukko, ja joukko M n on kaikkien kompleksialkioisten n n -matriisien joukko. Matriisin ominaisarvoja λ i käsitellään sellaisessa järjestyksessä, että λ 1 λ 2 λ n, ellei asiayhteydessä toisin mainita. Seuraavaksi esitellään singulaariarvohajotelma. Lause 1.1 ([2, lause 3.1.1]). Olkoon A M m,n ja merkitään q = min{m, n}. Tällöin on olemassa sellainen matriisi Σ = [ σ ij ] M m,n, jolle σ ij = 0, kun i j ja σ 11 σ 22 σ qq 0, sekä sellaiset unitaariset matriisit V M m ja W M n, että A = V ΣW. Matriisin Σ diagonaalialkioita σ i = σ ii kutsutaan matriisin A singulaariarvoiksi. Ne järjestetään laskevassa järjestyksessä. Matriisin V ja vastaavasti W sarakkeita kutsutaan matriisin A vasemmanpuoleisiksi ja vastaavasti oikeanpuoleisiksi singulaarivektoreiksi. Sitten esitetään napahajotelma, joka seuraa suoraan singulaariarvohajotelmasta. Lause 1.2 ([2, lause 3.1.9]). Olkoon A M m,n. (a) Jos m n, niin A = P Y, missä P M m on ei-negatiivisesti definiitti, P 2 = AA ja matriisin Y M n,m rivit ovat ortonormaalit. (b) Jos m n, niin A = XQ, missä Q M n on ei-negatiivisesti definiitti, Q 2 = A A ja matriisin X M m,n sarakkeet ovat ortonormaalit. (c) Jos m = n, niin A = P U = UQ, missä U M n on unitaarinen, P, Q M n ovat ei-negatiivisesti definiittejä, P 2 = AA ja Q 2 = A A. Matriisit P ja Q ovat matriisin A yksikäsitteisesti määräämiä. Niiden ominaisarvot ovat samat kuin matriisin A singulaariarvot. 6

2 Singulaariarvot 2.1 Singulaariarvojen ominaisuuksia Hermiten matriisin ominaisarvot voidaan esittää tiettyjen optimointiongelmien ratkaisuina. Seuraavat lauseet osoittavat hyvin, minkä takia singulaariarvoja käsitellään usein juuri Hermiten matriisin ominaisarvoina. Lause 2.1.1 (Courant-Fischer [1, lause 4.2.11]). Olkoot A M n Hermiten matriisi ja λ 1 λ 2 λ n sen ominaisarvot. Olkoon lisäksi 1 k n. Tällöin λ k = min max x Ax w 1,...,w n k C n x C n, x 0 x x x w 1,...,w n k min x Ax w 1,...,w k 1 C n x C n, x 0 x w 1,...,w k 1 = max Vastaava lause singulaariarvoille on seuraava. x x. Lause 2.1.2 ([2, lause 3.1.2]). Olkoot A M m,n, q = min{m, n} ja 1 k q. Tällöin σ k (A) = min max Ax 2 = x w 1,...,w k 1 w 1,...,w k 1 C n x C n, = max min Ax 2 = x w 1,...,w n k w 1,...,w n k C n x C n, min P C n max x P dim P =n k+1 max P C n min x P dim P =k Ax 2. Ax 2 Todistus. Olkoot λ 1... λ n Hermiten matriisin A A ominaisarvot. Koska σ 2 k (A) on matriisin A A ominaisarvo, niin σ 2 k (A) = λ n k+1(a A). Tällöin Courantin-Fisherin lauseen nojalla σ 2 k(a) = λ n k+1 (A A) = min max x A Ax w 1,...,w k 1 C n x 0, x C n x x x w 1,...,w k 1 ( ) 2 Ax 2 max w 1,...,w k 1 C n x 0, x C n x 2 x w 1,...,w k 1 = min = min max Ax 2 = x w 1,...,w k 1 w 1,...,w k 1 C n x C n, min max P C n x P dim P =n k+1 Ax 2. 7

Vastaavasti saadaan max min x A Ax w 1,...,w n k C n x 0, x C n x x x w 1,...,w n k ( ) 2 Ax 2 min w 1,...,w n k C n x 0, x C n x 2 x w 1,...,w n k σ 2 k(a) = λ n k+1 (A A) = = max = max min Ax 2 = x w 1,...,w n k w 1,...,w n k C n x C n, max min P C n x P dim P =k Ax 2. Esimerkki 2.1.1. Olkoon A M n. Osoitetaan, että matriisin A singulaariarvot ovat unitaarisesti invariantteja eli σ k (A) = σ k (UAV ), missä matriisit U, V M n ovat unitaarisia. Käyttämällä lauseita 2.1.1 ja 2.1.2 saadaan σ 2 k(uav ) = λ n k+1 (V A U UAV ) = min w 1,...,w k 1 C n = min w 1,...,w k 1 C n = min = min max x V A AV x x 0, x C n x x x w 1,...,w k 1 max x V (A A)V x x 0, x C n x V V x x w 1,...,w k 1 max y A Ay w 1,...,w k 1 C n y 0, y C n y y y w 1,...,w k 1 ( ) 2 Ay 2 max w 1,...,w k 1 C n y 0, y C n y 2 y w 1,...,w k 1 = σ 2 k(a). Esimerkki 2.1.2 ([2, tehtävä 3.1.13]). Osoitetaan, että matriisin A M n singulaariarvot ovat keskenään yhtä suuria, jos ja vain jos matriisi A on kompleksiluvun ja unitaarisen matriisin tulo. Oletetaan, että matriisi U M n on unitaarinen ja c C. Tällöin A = cu σ k (A) = σ k (cu) = λ n k+1 (U ccu) = c 2 λ n k+1 (I) = c 2. Jos σ 1 (A) = = σ n (A) = c, niin A = V ΣW = V (ci)w = cv W, missä V W on unitaarinen. Lause 2.1.3 ([2, seurauslause 3.1.3]). Olkoot A M m,n ja A r matriisin A alimatriisi, joka on saatu poistamalla alkuperäisestä matriisista rivejä ja/tai sarakkeita r kpl. Tällöin σ k (A) σ k (A r ) σ k+r (A), k = 1,..., min{m, n}, 8

missä matriisille X M p,q on voimassa σ j (X) = 0, jos j > min{p, q}. Merkitään S = Span{x 1,..., x k }, jos jokainen joukon S alkio on alkioiden x 1,..., x k lineaarikombinaatio. Lause 2.1.4 ([2, lemma 3.3.15]). Olkoot A M m,n, q = min{m, n} ja A = V ΣW matriisin A singulaariarvohajotelma. Olkoot matriisin W = [ w1... w n ] sarakkeet matriisin A oikeanpuoleisia singulaarivektoreita, joita vastaavat singulaariarvot ovat σ 1 (A) σ q (A). Tällöin σ i (A) = max{ Ax 2 : x S, x 2 = 1}, missä S = Span{w i,..., w n } ja i = 1,..., q. Todistus. Olkoon x = α i w i + + α n w n, missä α i 2 + + α n 2 = 1. Koska matriisin W sarakkeet ovat ortonormaalit, niin w 1w 1 = = w nw n = 1 ja w i w j = 0, kun i j. Tällöin x S, x 2 = 1 ja w j x = α j, kun j = 1,..., q. Nyt Ax 2 2 = V ΣW x 2 2 = ΣW x 2 2, koska V on unitaarinen matriisi. Tätä muokkaamalla saadaan q ΣW x 2 2 = [ σ 2 j (A)(wj x) wj x ] = j=i q [ ] σ 2 j (A)αjα j j=i = σ 2 i (A) α i 2 + + σ 2 q(a) α q 2. Koska matriisin singulaariarvot järjestetään laskevassa järjestyksessä, voidaan kirjoittaa σ 2 i (A) α i 2 + + σ 2 q(a) α q 2 σ 2 i (A) α i 2 + + σ 2 i (A) α q 2 Oletuksen nojalla α i 2 + + α n 2 = 1, joten = σ 2 i (A)( α i 2 + + α q 2 ). σ 2 i (A)( α i 2 + + α q 2 ) σ 2 i (A). Yhtäsuuruus saavutetaan valitsemalla α i = 1 ja α i+1 = = α q = 0. Lause 2.1.5 ([1, lause 7.3.7]). Olkoot A M m,n, q = min{m, n}, ja määritellään à M m+n siten, että [ ] 0 A à = A. 0 Olkoot σ 1, σ 2,..., σ q 0. Matriisin A singulaariarvot ovat σ 1, σ 2,..., σ q, jos ja vain jos matriisin à m + n ominaisarvoa ovat ±σ 1, ±σ 2,..., ±σ q sekä lisäksi 0 ( m n kertaisena). 9

Todistus. Oletetaan, että m n, ja olkoon A = V ΣW matriisin A singulaariarvohajotelma. Merkitään [ ] S Λ = M 0 m,n, 0 M m n,n, missä S = diag(σ 1, σ 2,..., σ n ). Olkoon unitaarinen matriisi V M m määritelty siten, että V = [ ] V 1 V 2, missä V1 M m,n ja V 2 M n,m n. Asettamalla ˆV = 1 2 V 1 ja Ŵ = 1 2 W matriisi U [ ] ˆV ˆV V2 Ŵ Ŵ 0 M m+n, 0 M n,m n on unitaarinen (koska UU = I). Olkoon nyt S 0 0 X = 0 S 0, missä diagonaalin 0 M m n. 0 0 0 Tällöin [ ] [ ˆV S ˆV S 0 ˆV S ˆV UXU = Ŵ S Ŵ S 0 U = ˆV S ˆV ˆV S Ŵ + ˆV ] SŴ Ŵ S ˆV + Ŵ S ˆV Ŵ SŴ Ŵ SŴ [ ] [ ] [ ] 0 V = 1 SW 0 V W SV1 = 1 SW 0 A 0 (V 1 SW ) = 0 A = 0 Ã. Näin ollen väite on tosi. Tapaus m < n voidaan todistaa vastaavasti. 2.2 Singulaariarvoepäyhtälöitä Tässä luvussa perehdytään joihinkin singulaariarvoja koskeviin epäyhtälöihin. Lisäksi tarkastellaan singulaari- ja ominaisarvojen välisiä yhteyksiä. Lause 2.2.1 ([2, lemma 3.3.1]). Olkoot C M m,n, V k M m,k ja W k M n,k. Oletetaan lisäksi, että matriisien V k ja W k sarakkeet ovat ortonormaalit. Tällöin (a) σ i (V k CW k ) σ i (C), i = 1,..., k ja (b) det V k CW k σ 1 (C) σ k (C). Todistus. Koska matriisin V k ja vastaavasti W k sarakkeet voidaan laajentaa avaruuden C m ja vastaavasti C n ortonormaaliksi kannaksi, niin on olemassa unitaariset matriisit V = [V k ] M m sekä W = [W k ] M n. Koska matriisi Vk CW k on matriisin V CW vasemman yläkulman k x k -alimatriisi, niin lauseesta 2.1.3 sekä singulaariarvojen unitaarisesta invarianttisuudesta seuraa, että σ i (V k CW k ) σ i (V CW ) = σ i (C), i = 1,..., k. 10

Tällöin det V k CW k = σ 1 (V k CW k ) σ k (V k CW k ) σ 1 (C) σ k (C), joten lause on todistettu. Seuraavaksi esitellään yksi keskeisimmistä epäyhtälöistä singulaari- ja ominaisarvojen välillä. Lause 2.2.2 ([2, lause 3.3.2]). Olkoon A M n. Tällöin λ 1 (A) λ k (A) σ 1 (A) σ k (A), missä k = 1,..., n, ja yhtäsuuruus on voimassa, kun k = n. Todistus. Schurin kolmiointilauseen (ks. [1, lause 2.3.1]) nojalla on olemassa sellainen unitaarinen matriisi U M n, että = U AU on yläkolmiomatriisi ja diag = (λ 1,..., λ n ). Sisältäköön matriisi U k M n,k matriisin U ensimmäiset k saraketta. Nyt U AU = [ U k ] [ A Uk ] [ ] U = k AU k =. Täten U k AU k = k on yläkolmiomatriisi, sillä se on matriisin vasemman yläkulman k x k -alimatriisi ja diag k = (λ 1,..., λ k ). Soveltamalla nyt lausetta 2.2.1, kun C = A ja V k = W k = U k, saadaan λ 1 (A) λ k (A) = det k = det U k AU k σ 1 (A) σ k (A). Kun k = n, niin λ 1 (A) λ n (A) = det A = det V ΣW = det Σ = σ 1 (A) σ n (A), mikä todistaa lauseen. Esimerkki 2.2.1 ([2, tehtävä 3.3.14]). Olkoon A M n. Osoitetaan, että k λ i (A) = k σ i (A) jokaisella k = 1,..., n, jos ja vain jos A on normaali eli A A = AA. Schurin kolmiointilauseen nojalla on olemassa sellainen unitaarinen U M n, että A = UT U, missä T M n on yläkolmiomatriisi ja t ii = λ i (A). Matriisi A on normaali, jos ja vain jos T on normaali. Vertailemalla matriisien T T ja T T diagonaalialkioita nähdään, että T on diagonaalimatriisi (ks. [1, lause 2.5.4]). Merkitään T = XΣ, missä Σ = diag( λ 1 (A),..., λ n (A) ) ja X = diag(e iθ 1,..., e iθn ). Koska X on unitaarinen, niin A = UT U = UXΣU = V ΣW on matriisin A singulaariarvohajotelma, missä V = UX ja W = U. Täten λ i (A) = σ i (A). Käänteinen implikaatio voidaan osoittaa seuraamalla todistuksen vaiheita lopusta alkuun. 11

Seuraava lause esittelee, miten kahden matriisin singulaariarvojen tulo on yhteydessä tulon singulaariarvoihin. Lause 2.2.3 ([2, lause 3.3.4]). Olkoot A M m,n, B M n,p. Tällöin j σ i (AB) j σ i (A)σ i (B), j = 1,..., k = min{m, n, p}. Jos m = n = p, niin yhtäsuuruus on voimassa, kun j = m. Todistus. Olkoon AB = V ΣW matriisin AB singulaariarvohajotelma, ja sisältäkööt matriisit V j M m,j sekä W j M p,j vastaavien matriisien V ja W ensimmäiset j saraketta. Tällöin V j (AB)W j = diag ( σ 1 (AB),..., σ j (AB) ), sillä se on matriisin V (AB)W = Σ vasemman yläkulman j j -alimatriisi. Koska n j, voidaan käyttää napahajotelmaa ja kirjoittaa BW j = X j Q, missä matriisin X j M n,j sarakkeet ovat ortonormaalit, Q M j on einegatiivisesti definiitti ja Q 2 = (BW j ) BW j = W j B BW j. Tällöin lauseen 2.2.1 nojalla Lisäksi j det Q 2 = det W j B BW j σ 1 (B B) σ j (B B) = σ 2 1(B) σ 2 j (B). σ i (AB) = det V j (AB)W j = det V j AX j Q = det (V j AX j ) det Q. Käyttämällä jälleen lausetta 2.2.1 saadaan det (V j AX j ) det Q (σ1 (A) σ j (A))(σ 1 (B) σ j (B)) j = σ i (A)σ i (B). Jos m = n = p, niin j σ i (AB) = det AB = det A det B = j σ i (A)σ i (B). 12

Seuraavaa tulosta käyttämällä on helppo todistaa jatkossa joitakin singulaariarvoja koskevia epäyhtälöitä. Lause 2.2.4 ([2, s. 174-175]). Olkoot x 1 x 2 x n 0 ja y 1 y 2 y n 0. Jos k k x i y i, k = 1,..., n, niin x i y i, k = 1,..., n. Edellä on käsitelty singulaari- ja ominaisarvojen tulojen välisiä epäyhtälöitä. Seuraavassa lauseessa esitellään puolestaan yhteys singulaari- ja ominaisarvojen summien välillä. Lisäksi syvennetään lauseen 2.2.3 sisältöä osoittamalla, että vastaava väite pätee myös tulomatriisin singulaariarvojen summalle. Lause 2.2.5 ([2, lauseet 3.3.13 ja 3.3.14]). Olkoot A M k, B M m,n, C M n,p ja q = min{m, n, p}. Tällöin (a) (b) j λ i (A) j σ i (BC) j σ i (A), j = 1,..., k, j σ i (B)σ i (C), j = 1,..., q. Todistus. Lauseen 2.2.2 nojalla on voimassa j λ i (A) j σ i (A), j = 1,..., k. Lauseen 2.2.3 perusteella puolestaan pätee j σ i (BC) j σ i (B)σ i (C), j = 1,..., q. Nyt käyttämällä lausetta 2.2.4 saadaan suoraan ja lisäksi j j λ i (A) σ i (A) j j σ i (BC) σ i (B)σ i (C). 13

Edellä on käsitelty paljon peräkkäisten singulaariarvojen ominaisuuksia ja epäyhtälöitä, mutta nyt katsotaan joitakin epäyhtälöitä, jotka koskevat vain yksittäisiä singulaariarvoja. Lause 2.2.6 ([2, lause 3.3.16]). Olkoot A, B M m,n ja q = min{m, n}. Olkoot lisäksi voimassa epäyhtälöt 1 i, j q ja i + j q + 1. Tällöin (a) σ i+j 1 (A + B) σ i (A) + σ j (B), (b) σ i+j 1 (AB ) σ i (A)σ j (B). Erityisesti, kun i = 1,..., q, on voimassa (c) σ i (A + B) σ i (A) σ 1 (B), (d) σ i (AB ) σ i (A)σ 1 (B). Todistus. Olkoot A = V Σ A W ja B = XΣ B Y matriisien A ja B singulaariarvohajotelmat, joissa matriisit W = [w 1... w n ], Y = [y 1... y n ] M n sekä V = [v 1... v m ], X = [x 1... x m ] M m ovat unitaarisia. Olkoot lisäksi 1 i, j q ja i + j q + 1. Tutkitaan ensin kohtaa (a). Määritellään joukot P 1 = Span{w i,..., w n } sekä P 2 = Span{y j,..., y n }, joille on voimassa dim P 1 = n i+1 ja dim P 2 = n j + 1. Tällöin α dim (P 1 P 2 ) = dim P 1 + dim P 2 dim (P 1 + P 2 ) = (n i + 1) + (n j + 1) dim (P 1 + P 2 ) (n i + 1) + (n j + 1) n = n (i + j 1) + 1 n q + 1 1. Täten P 1 P 2 {0} ja n α + 1 i + j 1. Tällöin ja lauseen 2.1.2 nojalla σ i+j 1 (A + B) σ n α+1 (A + B) σ n α+1 (A + B) = min P C n dim P = α Muokkaamalla tätä lauseketta saadaan min P C n dim P = α max x P (A + B)x 2 max max (A + B)x x P 2. x P 1 P 2 (A + B)x 2 max Ax x P 2 + max Bx 1 x P 2. 2 14

Lauseen 2.1.4 perusteella saadaan max Ax x P 2 + max Bx 1 x P 2 = σ i (A) + σ j (B). 2 Täten σ i+j 1 (A + B) σ i (A) + σ j (B), joten kohta (a) on todistettu. Tutkitaan seuraavaksi kohtaa (b). Napahajotelmaa käyttämällä voidaan kirjoittaa AB = UQ, missä U M m on unitaarinen ja Q M m on einegatiivisesti definiitti. Lisäksi matriisin Q singulaariarvot (jotka ovat myös sen ominaisarvoja) ovat samat kuin matriisilla AB. Määritellään lisäksi P 1 = Span{U v i,..., U v m } ja P 2 = Span{U x j,..., U x m }. Tällöin saadaan jälleen, että α = dim (P 1 P 2 ) m (i + j 1) + 1 1. Koska Q = U AB, niin kaikilla x C m on voimassa Lisäksi x Qx = x U AB x = (A Ux) (B x) A Ux 2 B x 2. ja lauseen 2.1.2 nojalla saadaan Tällöin voidaan kirjoittaa min P C n dim P = α σ i+j 1 (AB ) = σ i+j 1 (Q) σ m α+1 (Q) σ m α+1 (Q) = max x P Lauseen 2.1.4 nojalla saadaan min P C n dim P = α x Qx max x P 1 P 2 max x P 1 P 2 max x P 1 P 2 max x Qx. x P x Qx A Ux 2 B x 2 A Ux 2 max x P 1 P 2 B x 2 max A Ux x P 2 max B x 1 x P 2. 2 max A Ux x P 2 max B x 1 x P 2 = σ i (A)σ j (B). 2 Siis σ i+j 1 (AB ) σ i (A)σ j (B), joten kohta (b) on todistettu. Kohta (d) seuraa kohdasta (b) asettamalla j = 1. Tällöin huomataan myös, että σ i (A+B) σ i (A)+σ 1 (B). Koska lisäksi σ i (A) = σ i ([A+B] B) σ i (A + B) + σ 1 ( B) = σ i (A + B) + σ 1 (B), niin kohta (c) on voimassa. 15

3 Singulaariarvot ja normit 3.1 Singulaariarvojen summat: Ky Fanin k-normit Matriisi A M m,n on osittain unitaarinen, jos sen singulaariarvoina esiintyvät vain 1 ja 0. Merkitään (3.1) P m,n;r = {A M m,n : A on r-asteinen osittain unitaarinen matriisi}. Lause 3.1.1 ([2, lause 3.4.1]). Olkoot A M m,n ja q = min{m, n}. Tällöin σ i (A) = max{ tr X AY : X M m,k, Y M n,k, X X = Y Y = I} = max{ tr AB : B M n,m on k-asteinen osittain unitaarinen matriisi}, missä k = 1,..., q. Todistus. Todistetaan aluksi jälkimmäinen yhtälö. Oletetaan ensin, että matriiseille X M m,k ja Y M n,k on voimassa X X = Y Y = I. Yleisesti on voimassa tr X AY = tr AY X. Matriisille B = Y X M n,m pätee nyt B B = (Y X ) Y X = XY Y X = XX. Koska matriisin XX k suurinta ominaisarvoa ovat samat kuin matriisin X X = I M k, voidaan todeta, että matriisi B = Y X on k-asteinen osittain unitaarinen matriisi. Oletetaan sitten, että B M n,m on k-asteinen osittain unitaarinen matriisi. Tällöin sen singulaariarvohajotelma on B = V ΣW = [ V k ] [ ] [ ] I k 0 W k = V 0 0 k Wk, missä matriisi V k M n,k ja vastaavasti W k M m,k sisältää unitaarisen matriisin V M n ja vastaavasti W M m k ensimmäistä saraketta. Tällöin huomataan, että tr AB = tr AV k Wk = tr W k AV k. Koska Vk V k = Wk W k = I k, niin yhtälö on voimassa. Lauseen 2.2.5 avulla tr AB = m λ i (AB) m q λ i (AB) σ i (AB) q σ i (A)σ i (B) = σ i (A), missä kaikki ominaisarvot ja singulaariarvot on järjestetty laskevasti itseisarvojen mukaisesti. Todistetaan vielä, että yhtäsuuruus saavutetaan. Olkoon A = V ΣW matriisin A singulaariarvohajotelma ja [ ] B max = W P k V Ik 0, missä P k = M 0 0 n,m. 16

Tällöin tr AB max = tr V ΣW W P k V = tr V ΣP k V = tr ΣP k V V = tr ΣP k = σ i (A). Luvussa 2.2 esiteltiin kahden matriisin singulaariarvojen yhteyksiä niiden muodostaman tulomatriisin singulaariarvoihin. Nyt tarkastellaan summamatriisin singulaariarvojen vastaavia yhteyksiä. Lause 3.1.2 ([2, seurauslause 3.4.3]). Olkoot A, B M m,n. Tällöin σ i (A + B) σ i (A) + σ i (B), k = 1,..., q = min{m, n}. Todistus. Oletetaan aluksi, että C P m,n;k. Lauseen 3.1.1 nojalla saadaan σ i (A + B) = max{ tr(a + B)C }. Tätä lauseketta muokkaamalla saadaan edelleen max{ tr(a + B)C } = max{ tr(ac + BC) } max{ tr(ac) + tr(bc) } max{ tr(ac) } + max{ tr(bc) }. Lauseen 3.1.1 nojalla huomataan, että max{ tr(ac) } + max{ tr(bc) } = σ i (A) + σ i (B), joten lause on todistettu. Tämä tulos osoittaa, että matriisin k:n suurimman singulaariarvon summa toteuttaa kolmioepäyhtälön. Yksinkertaisella esimerkillä voidaan kuitenkin osoittaa, ettei kolmioepäyhtälö päde kaikille yksittäisille singulaariarvoille. Esimerkki 3.1.1. Olkoot A = [ ] 1 0 ja B = 0 0 [ ] 0 0. 0 1 Tällöin σ 2 (A + B) = σ 2 (I) = 1 0 = σ 2 (A) + σ 2 (B). 17

Funktio : M n R on matriisinormi, jos kaikilla A, B M n ja c C (1) A 0 (ei-negatiivisuus), (1a) A = 0 A = 0 (positiivisuus), (2) ca = c A (homogeenisuus), (3) A + B A + B (kolmioepäyhtälö), (4) AB A B (submultiplikatiivisuus). Jos funktio toteuttaa ehdot (1)-(3), niin se on (vektori)normi. Normin ei siis tarvitse toteuttaa submultiplikatiivisuusehtoa (4). Jos x = [x i ] C n, määritellään x = [ x i ]. Jos x i y i kaikilla i = 1,..., n, niin x y. Joukossa C n määritelty normi on (a) monotoninen, jos x y x y kaikilla x, y C n ja (b) absoluuttinen, jos x = x kaikilla x C n. Lause 3.1.3 ([1, lause 5.5.10]). Joukossa C n määritelty normi on monotoninen, jos ja vain jos se on absoluuttinen. Esimerkki 3.1.2 ([2, tehtävä 3.4.2]). Määritellään joukossa M n funktio f k (A) = λ i (A), k = 1,..., n. Tutkitaan, onko funktio f k normi joukossa M n. Olkoon [ ] 0 0 A =. 1 0 Helposti nähdään, että λ 1 (A) = λ 2 (A) = 0. Täten f 1 (A) = f 2 (A) = 0, mutta A 0. Siis (1a) ei toteudu, joten funktio f k ei ole normi joukossa M n. Lause 3.1.4 ([2, seurauslause 3.4.4]). Olkoot A M m,n ja q = min{m, n}. Merkitään N k (A) = σ 1 (A) + + σ k (A). Tällöin (a) N k on normi joukossa M m,n, k = 1,..., q. (b) Kun m = n, niin N k on matriisinormi joukossa M n, k = 1,..., n. Todistus. (a) Selvästi N k (A) 0, sillä singulaariarvot ovat ei-negatiivisia, jolloin niiden summakin on ei-negatiivinen. Koska N k (A) σ 1 (A), niin N k (A) = 0, jos ja vain jos kaikki matriisin A singulaariarvot ovat nollia, jolloin myös A = 0. Jos taas c C, niin (ca) (ca) = c 2 A A. Tällöin σ i (ca) = c σ i (A), kun i = 1,..., q. Siis N k (ca) = c N k (A), joten N k on homogeeninen. Lauseen 3.1.2 nojalla N k (A + B) N k (A) + N k (B), joten N k toteuttaa kolmioepäyhtälön. 18

(b) Olkoon m = n. Jos A, B M n ja k = 1,..., n, niin lauseesta 2.2.5 seuraa N k (AB) = σ i (AB) σ i (A)σ i (B) σ i (A) j=1 σ j (B) = N k (A)N k (B). Funktiota N k kutsutaan Ky Fanin k-normiksi. 3.2 Singulaariarvot ja unitaarisesti invariantit normit Joukossa M m,n määritelty normi on unitaarisesti invariantti, jos kaikilla A M m,n on voimassa UAV = A, missä U M m ja V M n ovat unitaarisia. Singulaariarvohajotelmasta seuraa suoraan, että kun on unitaarisesti invariantti normi, niin A = V ΣW = Σ on pelkästään matriisin A singulaariarvojen funktio. Tämän funktion ominaisuuksiin keskitytään tässä osiossa. Jos on unitaarisesti invariantti normi joukossa M m,n, se tuottaa unitaarisesti invariantin normin joukossa M r,s, missä 1 r m ja 1 s n, seuraavasti. Jokaisella A M r,s määritellään A = A, missä [ ] A 0 A = M 0 0 m,n. Joukossa M m,n määritellyn normin duaalinormi on A D = max{ tr AC : C M m,n, C = 1}. Lause 3.2.1 ([2, lemma 3.5.1]). Olkoon normi joukossa M m,n. Tällöin on unitaarisesti invariantti, jos ja vain jos D on unitaarisesti invariantti. Todistus. Olkoot ensin unitaarisesti invariantti ja matriisit U M m sekä V M n unitaarisia. Tällöin UAV D = max{ tr(uav )C : C M m,n, C = 1} = max{ tr(a[u CV ] ) : C M m,n, C = 1}. Merkitsemällä E = U CV huomataan, että C = UEV, jolloin saadaan UAV D = max{ tr(a[u CV ] ) : C M m,n, C = 1} = max{ tr(ae ) : E M m,n, UEV = 1}. 19

Koska on unitaarisesti invariantti, niin UEV = E, joten UAV D = max{ tr(ae ) : E M m,n, E = 1}. Duaalinormin määritelmän nojalla saadaan nyt UAV D = A D. Toinen suunta saadaan edellisen mukaisesti, kun käytetään duaalinormin ominaisuutta ( A D ) D = A (ks. [1, s. 287]). Yllä mainittu lause antaa esitystavan (3.2) A = max{ tr AC : C M m,n, C D = 1}, kun se yhdistetään edellä esiteltyyn duaalinormin määritelmään. Määritellään joukko R n + = {x = [x i ] R n : x 1 x n 0}. Kun X M m,n ja α = [α i ] R q +, merkitään X α = α 1 σ 1 (X) + + α q σ q (X), missä q = min{m, n}. Koska matriisin X M m,n singulaariarvovektorin σ(x) alkiot ovat laskevassa järjestyksessä, niin huomataan, että aina σ(x) R q +, missä q = min{m, n}. Jos x, y R n ja x i y i, niin vektori y majoroi heikosti vektoria x. Lause 3.2.2 ([2, lause 3.5.5]). Olkoot m, n positiivisia kokonaislukuja ja q = min{m, n}. (a) Jos 0 α R q +, niin A α = α 1 σ 1 (A) + + α q σ q (A) on unitaarisesti invariantti normi joukossa M m,n (b) Jokaista unitaarisesti invarianttia normia (joukossa M m,n ) kohti on olemassa sellainen kompakti joukko N ( ) R q +, että (3.3) A = max{ A α : α N ( )} kaikilla A M m,n. Joukoksi N ( ) voidaan valita (3.4) N ( ) = {σ(x) : X D = 1}. 20

Todistus. Kohta (a) saadaan muokkaamalla summalauseketta (3.5) A α = q 1 q α i σ i (A) = (α i α i+1 )N i (A) + α q N q (A). Koska vektorin α alkiot ovat monotonisesti laskevat, niin kaavan (3.5) esitys on (unitaarisesti invarianttien) Ky Fanin k-normien ei-negatiivinen lineaarikombinaatio, jossa vähintään yksi kerroin on positiivinen, jos α 0. Siis kohta (a) on tosi. Kohdan (b) todistamiseksi oletetaan, että U 1, U 2 M n ja V 1, V 2 M m ovat unitaarisia. Tällöin, kun X M m,n ja X D = 1, unitaarinen invarianttisuus ja kaava (3.2) implikoivat A = V 2 V 1 AU 1 U 2 tr[(v 2 V 1 AU 1 U 2 )X ] = tr[(v 1 AU 1 )(V 2 XU 2 ) ]. Nyt voidaan käyttää matriisien A ja X singulaariarvohajotelmia ja valita unitaariset matriisit U 1, U 2, V 1, V 2 siten, että V 1 AU 1 = Σ A ja V 2 XU 2 = Σ X, mistä seuraa q A σ(x) = σ i (A)σ i (X) A, kun X M m,n ja X D = 1. Valitaan nyt sellainen X 0 M m,n, jolle X 0 D = 1 ja A = max{ tr AX : C M m,n, X D = 1} = tr AX0 = m λ i (AX0). Lauseen 2.2.5 nojalla saadaan m λ i (AX0) m σ i (AX0) On siis osoitettu, että m σ i (A)σ i (X 0 ) = A σ(x0 ). A = max{ A σ(x0 ) : C M m,n, X D = 1}, mikä on yhtäpitävää kohdan (b) väitteen kanssa. Kaavan (3.3) mukaisella esityksellä on useita hyödyllisiä seurauksia, joita käydään läpi seuraavien seurauslauseiden myötä. Seurauslause 3.2.1 ([2, seurauslause 3.5.9]). Olkoot A, B M m,n ja q = min{m, n}. Tällöin seuraavat ehdot ovat yhtäpitäviä: (a) A B, kun on unitaarisesti invariantti normi joukossa M m,n. (b) N k (A) N k (B), missä k = 1,..., q. (c) A α B α aina, kun 0 α R q +. 21

Todistus. Koska N k (UAV ) = σ 1 (UAV ) + + σ k (UAV ) = σ 1 (A) + + σ k (A) = N k (A) aina, kun U M m ja V M n ovat unitaarisia matriiseja, niin jokainen Ky Fanin k-normi N k on unitaarisesti invariantti. Tällöin selvästi (a) (b). Käyttämällä kaavan (3.5) mukaista summaesitystä huomataan välittömästi, että (b) (c). Kaavasta (3.3) puolestaan nähdään suoraan, että (c) (a). Esimerkki 3.2.1 ([2, tehtävä 3.5.13]). Olkoot A M m,n ja  M r,s matriisin A sellainen alimatriisi, että 1 r m ja 1 s n. Olkoon lisäksi q = min{r, s}. Määritellään, että [ ] 0 à = M 0 0 m,n ja  = Ã, missä on unitaarisesti invariantti normi. Todistetaan, että  A. Lauseen 2.1.3 nojalla huomataan, että σ k (A) σ k (Â), k = 1,..., q. Koska σ i (Ã) = σi(â), kun i = 1,..., q, ja σi(ã) = 0, kun i > q, niin σ k(a) σ k (Ã). Tällöin Nk(Ã) N k(a), joten seurauslauseen 3.2.1 nojalla à =  A. Seurauslause 3.2.2 ([2, seurauslause 3.5.10]). Olkoot unitaarisesti invariantti normi joukossa M m,n ja E 11 M m,n sellainen matriisi, jonka (1, 1)- alkio on 1 ja kaikki muut nollia. Tällöin (a) AB σ 1 (A) B kaikilla A, B M m,n, (b) A σ 1 (A) E 11 kaikilla A M m,n. Todistus. Huomataan helposti, että ja lisäksi N k (AB ) = σ i (AB ) σ i (A)σ i (B ) σ 1 (A)σ i (B ) = σ 1 (A) = σ 1 (A) σ i (B ) σ i (B) = σ 1 (A)N k (B) = N k (σ 1 (A)B), N k (σ 1 (A)E 11 ) = σ 1 (A) 22 σ i (A) = N k (A).

Seurauslauseen 3.2.1 nojalla saadaan nyt AB σ 1 (A)B = σ 1 (A) B ja σ 1 (A)E 11 = σ 1 (A) E 11 A. Esimerkki 3.2.2 ([2, tehtävä 3.5.3]). Olkoon unitaarisesti invariantti normi joukossa M n. Osoitetaan, että seuraavat ehdot ovat yhtäpitäviä: (a) on matriisinormi joukossa M n, (b) A m A m jokaisella A M n ja m Z +, (c) E 11 1, (d) A σ 1 (A) jokaisella A M n. Oletetaan aluksi (a), A M n ja m Z +. Tällöin matriisinormin submultiplikatiivisuusehtoa käyttämällä saadaan A m A A m 1 A A = A m, joten (a) (b). Oletetaan sitten (b). Helposti nähdään, että E 2 11 = E 11. Tällöin E 11 = E 2 11 E 11 2. Koska normi on ei-negatiivinen funktio, on E 11 1. Siis (b) (c). Oletetaan seuraavaksi (c). Tällöin seurauslauseen 3.2.2 nojalla A σ 1 (A) E 11 σ 1 (A), joten (c) (d). Oletetaan lopuksi (d). Olkoon B M n ja B = V ΣW sen singulaariarvohajotelma. Seurauslausetta 3.2.2 ja kohtaa (d) käyttämällä saadaan AB σ 1 (A) B A B. Koska normi on unitaarisesti invariantti, saadaan B = W Σ V = Σ = Σ = V ΣW = B. Täten AB A B eli (d) (a). Olkoon A M m,n. Normi on symmetrinen, jos BAC σ 1 (B)σ 1 (C) A kaikilla B M m, C M n. 23

Esimerkki 3.2.3 ([2, tehtävä 3.5.4]). Todistetaan, että normi on symmetrinen, jos ja vain jos se on unitaarisesti invariantti. Oletetaan aluksi, että on unitaarisesti invariantti, B M m ja C M n. Seurauslauseen 3.2.2 avulla saadaan BAC σ 1 (B) C A σ 1 (B)σ 1 (C ) A = σ 1 (B)σ 1 (C) A, joten on symmetrinen. Oletetaan sitten, että on symmetrinen ja matriisit U M m ja V M n ovat unitaarisia. Tällöin UAV σ 1 (U)σ 1 (V ) A = A = U UAV V σ 1 (U )σ 1 (V ) UAV = UAV. Näin ollen A = UAV eli on unitaarisesti invariantti. Seurauslause 3.2.3 ([2, seurauslause 3.5.11]). Olkoon f(t 1,..., t k ) : R k + R + ei-negatiivinen funktio, joka on kasvava jokaisen muuttujan suhteen. Siis f(t 1,..., t i,..., t k ) f(t 1,..., t i + ɛ,..., t k ) kaikilla ɛ, t 1,..., t k 0, kun i = 1,..., k. Olkoot lisäksi A, B 1,..., B k M m,n ja q = min{m, n}. Tällöin A f( B 1,..., B k ) kaikilla unitaarisesti invarianteilla normeilla, jos ja vain jos A α f( B 1 α,..., B k α ) kaikilla α R q +. Todistus. Osoitetaan ensin implikaatio eteenpäin todeksi. Valitaan mielivaltainen α R q +. Nyt A α A kaavan (3.3) nojalla, ja lisäksi on voimassa f( B 1 α,..., B k α ) f( B 1,..., B k ) funktion f muuttujakohtaisen monotonisuuden nojalla. Kaavan (3.3) määrittelyn sekä oletuksen nojalla nyt A α f( B 1 α,..., B k α ). Todistetaan sitten implikaatio käänteiseen suuntaan. Valitaan mielivaltainen α 0 R q +. Tällöin kaavan (3.3) sekä funktion f muuttujakohtaisen monotonisuuden nojalla saadaan f( B 1,..., B k ) = f(max B 1 α,..., max B k α ) f( B 1 α0,..., B k α0 ) A α0. Koska α 0 on mielivaltaisesti valittu, voidaan päätellä, että A = max A α f( B 1,..., B k ). Kaikissa tapauksissa kyseinen maksimi on otettu yli kaikkien α N ( ), missä N ( ) on kompakti joukko, jolle kaava (3.3) pätee. Esimerkki tällaisesta joukosta on kaavan (3.4) määrittelemä joukko. 24

4 von Neumannin lause Matriisi A M n (R) on kaksoisstokastinen, jos sen kaikki alkiot ovat einegatiivisia ja lisäksi matriisin jokainen rivi- ja sarakesumma on 1. Matriisi P M n (R) on permutaatiomatriisi, jos sen jokaisella rivillä ja sarakkeella on täsmälleen yksi ykkönen ja muut alkiot ovat nollia. Huomataan, että jokainen permutaatiomatriisi P on unitaarinen, sillä P P = P P = I. Funktio m : R q R + on symmetrinen mittafunktio, jos (a) (b) (c) m on normi, m(x) = m( x ) kaikilla x R q, missä x = [ x i ] (absoluuttisuus), m(x) = m(p x) kaikilla x R q ja jokaisella permutaatiomatriisilla P M q (R) (permutaatioinvarianttisuus). Lause 4.1 (von Neumann [2, lause 3.5.18]). Jos on unitaarisesti invariantti normi joukossa M m,n ja q = min{m, n}, niin on olemassa sellainen symmetrinen mittafunktio m joukossa R q, jolle on voimassa A = m(σ(a)) kaikilla A M m,n. Käänteisesti, jos m on symmetrinen mittafunktio joukossa R q, niin A = m(σ(a)) on unitaarisesti invariantti normi joukossa M m,n. Todistus. Oletetaan ensin, että on unitaarisesti invariantti normi joukossa M m,n. Määritellään, että jokaisella x = [x i ] R q on voimassa m(x) = X, missä matriisin X = [x ij ] M m,n alkioille pätee x ii = x i, kun i = 1,..., q, ja x ij = 0 muulloin. Osoitetaan, että m on symmetrinen mittafunktio joukossa R q. (a) Koska on normi joukossa M m,n, niin m on normi joukossa R q. (b) Olkoon G = {D M m D on unitaarinen diagonaalimatriisi}. Tällöin jokaisen joukon G matriisin D diagonaalialkiot ovat itseisarvoltaan 1. Täten on aina olemassa sellainen D G, että jokaisella x R q on voimassa m( x ) = DX = X = m(x), sillä on unitaarisesti invariantti normi. (c) Olkoot P M q permutaatiomatriisi. Tällöin voidaan valita sellaiset permutaatiomatriisit P 1 M m ja P 2 M n, että m(p x) = P 1 XP 2, jolloin normin unitaarisen invarianttisuuden nojalla m(p x) = X = m(x). Olkoot nyt matriisin A M m,n singulaariarvohajotelma A = V ΣW. Tällöin 25

A = V ΣW = Σ. Koska m(σ(a)) = Σ, saadaan A = m(σ(a)). Oletetaan käänteisesti, että m on symmetrinen mittafunktio joukossa R q. Määritellään myös, että A = m(σ(a)), kun A M m,n. Koska funktio m on normi, niin myös on positiivisesti definiitti ja homogeeninen. Funktio on selvästi unitaarisesti invariantti, sillä matriisien singulaariarvot ovat unitaarisesti invariantteja. Osoitetaan vielä, että toteuttaa kolmioepäyhtälön. Olkoot A, B M m,n. Lauseen 3.1.2 nojalla vektori σ(a) + σ(b) majoroi heikosti vektoria σ(a + B). Tällöin on olemassa sellainen kaksoisstokastinen matriisi S M q (R), jolle on voimassa σ(a + B) S[σ(A) + σ(b)] (ks. [2, s. 167]) alkioittain. Birkhoffin lauseen (ks. [1, lause 8.7.1]) nojalla voidaan kirjoittaa S = N µ ip i, missä N µ i = 1, jokainen µ i 0 ja matriisit P 1,..., P N ovat permutaatiomatriiseja. Lauseen 3.1.3 nojalla funktio m on monotoninen, joten A + B = m(σ(a + B)) m(s[σ(a) + σ(b)]). Käyttämällä nyt kolmioepäyhtälöä saadaan m(s[σ(a) + σ(b)]) m(sσ(a)) + m(sσ(b)). Matriisin S määrittelyn mukaan m(sσ(a)) + m(sσ(b)) N µ i [m(p i σ(a)) + m(p i σ(b))]. Koska funktio m on permutaatioinvariantti, saadaan N µ i [m(p i σ(a)) + m(p i σ(b))] = Koska N µ i = 1, niin N µ i [m(σ(a)) + m(σ(b))]. N µ i [m(σ(a)) + m(σ(b))] = m(σ(a)) + m(σ(b)) = A + B. Siis A + B A + B, eli normi toteuttaa kolmioepäyhtälon. Symmetristen mittafunktioiden avulla saadaan useita esimerkkejä joukossa M m,n määritellyistä unitaarisesti invarianteista normeista. Näistä tärkeimmät ovat erikoistapauksia Ky Fanin p k -normeista N k;p (A) = [ k (σ i (A)) p] 1/p, p 1, k = 1,..., q = min{m, n}. 26

Oleellisimpia esimerkkejä ovat Ky Fanin k-normit N k (A) = k σ i(a), k = 1,..., q. Lisäksi mainittakoon Schattenin p-normit S p (A) = N q;p (A) = [ q (σ i (A)) p] 1/p, p 1, q = min{m, n}. Näistä yleisimpiä ovat normit S 1 (A) = N q (A), S (A) = N 1 (A) = σ 1 (A) sekä S 2 (A) = [ q (σ i(a)) 2] 1/2, jota kutsutaan Frobeniuksen normiksi. Sitä voidaan pitää matriisin A euklidisena normina. 27

Viitteet [1] R.A.Horn, C.R.Johnson, Matrix Analysis. Cambridge University Press, 1985. [2] R.A.Horn, C.R.Johnson, Topics in Matrix Analysis. Cambridge University Press, 1991. [3] R.Bhatia Matrix Analysis. Springer-Verlag, New York, 1997. 28