6 MATRIISIN DIAGONALISOINTI

6 MATRIISIN DIAGONALISOINTI Ortogonaaliset matriisit Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja A - = A T Muistutus: vektorien a ja b pistetulo (skalaaritulo, sisätulo) on a b = a T b = a b + + a n b n a n vektorin a pituus on a = a +K + = a T a.

Vektorit a ja b ovat ortogonaalisia (eli kohtisuorassa toisiaan vastaan), jos a b = a T b = Lause 6.. Reaalinen neliömatriisi A on ortogonaalinen jos ja vain jos sen sarakevektorit a j (ja myös rivivektorit) muodostavat ortonormaalin järjestelmän, eli a j a k = a T j a k = kun j kun j = k k ts. vektorit ovat ortogonaalisia yksikkövektoreita (pituus on ).

3 Ortogonaalimatriisin ominaisuuksia: Ortogonaalimatriisin ominaisarvot ovat reaalisia tai pareittain kompleksikonjugaatteja ja niiden itseisarvo on. Ortogonaalimatriisin determinantti on ±. Jos A on ortogonaalimatriisi, niin myös A T on ortogonaalimatriisi.

4 Ortogonaalimuunnokset Muunnos y = Ax on ortogonaalimuunnos, jos A on ortogonaalimatriisi. Se on siis ortogonaalisen matriisin määrittelemä lineaarikuvaus f: R n R n, f(x) = Ax, kun A on kokoa n n.

5 Esimerkki 6.. Kierto tasossa määritellään muunnoksella y = Ax, missä A = cosθ sin θ sin θ cos θ Osoita, että tämä on ortogonaalimuunnos.

Ortogonaalimuunnoksen ominaisuuksia: 6 Ortogonaalimuunnos on bijektio: a) jos x x, niin Ax Ax b) jokaisella y R n on x R n, siten, että y = Ax. Ortogonaalimuunnos säilyttää vektoreiden pistetulon: Jos u = Aa ja v = Ab, niin u v = a b. Ortogonaalimuunnos säilyttää myös vektorin pituuden eli a = Aa.

7 Ominaisvektoreiden ominaisuuksia Lause 6.3. Jos n n-matriisilla A on n erisuurta ominaisarvoa, näihin liittyvät ominaisvektorit ovat lineaarisesti riippumattomat ja muodostavat R n :n kannan. Lause antaa riittävän ehdon, mutta ehto ei ole välttämätön. Esim. 5..3: Ominaisvektorit lineaarisesti riippumattomia ja muodostavat R 3 :n kannan, vaikka A:lla on vain erisuurta ominaisarvoa Lause 6.4.3

8 Lause 6.3. Symmetrisen n n-matriisin A ominaisvektorit muodostavat R n :n ortonormaalin kannan, ts. A:lla on n ominaisvektoria, jotka muodostavat ortonormaalin järjestelmän.

Mitä hyötyä on siitä, että ominaisvektoreista voidaan muodostaa R n :n kanta? 9 Olkoot x,,x n ominaisarvoihin,, n liittyvät ominaisvektorit, jotka muodostavat R n :n kannan. => Mikä tahansa R n :n vektori x voidaan esittää muodossa x = c x + + c n x n. => Lineaarinen muunnos: y = Ax = A(c x + + c n x n ) = c Ax + + c n Ax n = c x + + c n n x n eli y on jokin ominaisvektoreiden lineaarikombinaatio.

Matriisin diagonalisointi n n matriisit A ja B ovat similaariset, jos on olemassa säännöllinen matriisi P siten, että B = P - AP. Muunnos A:sta B:hen on similaarisuusmuunnos. Muunnos voidaan kääntää: A = PBP -.

Lause 6.4. a) Similaarisilla matriiseilla A ja B = P - AP on samat ominaisarvot. b) Jos x on A:n ominaisvektori, niin y = P - x on B:n samaa ominaisarvoa vastaava ominaisvektori. Matriisi on diagonalisoituva jos se on similaarinen diagonaalimatriisin kanssa.

Lause 6.4. Jos n n-matriisin A ominaisvektorit muodostavat R n :n kannan, niin missä D = X - AX D X on diagonaalimatriisi jonka päälävistäjällä on A:n ominaisarvot on matriisi, jonka sarakkeet ovat A:n ominaisvektorit (samassa järjestyksessä kuin vastaavat ominaisarvot). Matriisin diagonalisointi tarkoittaa, että etsitään matriisit D, X, X - joilla yo. kaava pätee. Perustuu ominaisarvo-ongelman ratkaisemiseen.

3 Kun A on diagonalisoituva, D = X - AX A = XDX - Muotoa A = XDX - voidaan kutsua matriisin A ominaisarvohajotelmaksi (eigenvalue decomposition). Kompleksisille ei-neliömatriiseille matriiseille määritellään yleisempi pääakselihajotelma (singular value decomposition).

4 Edellisen perusteella saadaan D k = X - A k X A k = XD k X - missä D k = λ λ λ k n k k L M O M M L L

5 Lause 6.4.3 A on diagonalisoituva jos ja vain jos se ei ole defektiivinen. Silloin sen ominaisvektoreista voidaan muodostaa R n :n kanta. Ei-defektiivisyys tarkoittaa, että kaikille ominaisarvoille pätee: Jos ominaisarvo on karakteristisen yhtälön M:nnen kertaluvun juuri, niin sitä vastaa yhtä monta lineaarisesti riippumatonta ominaisvektoria.

Esimerkki 6.4. 6 a) Diagonalisoi matriisi (Esim. 5..3) A = 3 6 Matriisin ominaisarvot = 5 ja = -3 (kaksinkertainen juuri), joita vastaavat ominaisvektorit: = 5 = -3 x = [ -] T x = [- ] T x 3 = [ 3 ] T

7 A ei ole defektiivinen: ominaisarvojen algebralliset ja geometriset kertaluvut ovat samat: M 5 = m 5 = M -3 = m -3 =

8 X = 3 Gauss-Jordan-eliminoinnilla käänteismatriisi X - = 5 6 4 3 8 Merkitään D = 3 3 5, on voimassa matriisiyhtälö D = X - AX.

9 Tarkistus: X - AX = 5 6 4 3 8 6 3 3 = 3 3 5 = D

b) Onko matriisi A= diagonalisoituva? Vastaus: Ei. Perustelu: A:lla on yksi ominaisarvo, karakteristisen yhtälön kaksikertainen juuri =. Ominaisvektorit ovat x = t [ ] T, t. M =, m =, joten A on defektiivinen. A:lla ei ole kahta lineaarisesti riippumatonta ominaisvektoria, joista voisi muodostaa R :n kannan.

Symmetrisen matriisin diagonalisointi Symmetrinen matriisi A on ortogonaalisesti diagonalisoituva: muunnosmatriisi X on ortogonaalimatriisi eli X - = X T. Silloin D = X T AX

Esimerkki 6.4. Diagonalisoi matriisi A = 3 6 det(a I) = 3 λ 6 λ = (3 )(6 ) 4 = 9 + 4 = Ominaisarvot = 7, =. Vastaavat ominaisvektorit esim. [ ] T ja [- ] T. Pituudet 5.

3 Normalisoidut ominaisvektorit: x = / / 5 5 x = / / 5 5 x T x =, eli vektorit muodostavat ortonormaalin systeemin. X = / / 5 5 / / 5 5 = 5 X on ortogonaalimatriisi: X - = X T Tarkistus: X T X = I

4 A diagonalisointi: X T AX = D eli / 5 / 5 / 5 / 5 3 6 / / 5 5 / / 5 5 7 =

Neliömuodot 5 Olkoon A n n-matriisi ja x = [x,,x n ] T. Toisen asteen polynomifunktio Q(x) = x T Ax = n n i= j= a ij x i x j on muuttujien x,,x n neliömuoto. Esimerkiksi, jos A = 3 6 x T Ax = 3x + 4x x + 6x

Jokainen muuttujien x,,x n toisen asteen polynomi voidaan esittää neliömuotona x T Ax, jossa matriisi A on symmetrinen. 6 Jos neliömuodon määrittelevä matriisi B ei ole symmetrinen, asetetaan A = ½ (B + B T ) joka on symmetrinen. Tällöin x T Ax = x T Bx.

Koska symmetrinen matriisi on ortogonaalisesti diagonalisoituva, voidaan sen ominaisvektoreista muodostaa ortogonalimatriisi X siten, että 7 D = X T AX A = XDX T. Q = x T Ax = x T XDX T x Tehdään ortogonaalimuunnos y = X T x. Koska X - = X T, on x = Xy.

Neliömuoto voidaan esittää y-muuttujien avulla muodossa 8 Q = y T Dy = y + + n y n Tämä on neliömuodon pääakselimuoto. Pääakselimuodon avulla voidaan esim. päätellä, mitä toisen asteen käyrää (ellipsi, hyperbeli jne.) tai kolmen muuttujan tapauksessa toisen asteen pintaa (ellipsoidi, hyperboloidi jne.) esittää yhtälö Q = vakio. Käyrän tai pinnan pääakselit ovat ominaisvektorien suuntaiset.

9 Lause 6.5. (Pääakselilause) Muunnos y = X T x muuntaa neliömuodon Q = x T Ax pääakselimuotoon missä Q = y T Dy D on diagonaalimatriisi, jonka päälävistäjällä on A:n ominaisarvot X on ortogonaalimatriisi, jonka sarakkeet ovat A:n ortonormaalit ominaisvektorit.

3 Esimerkki 6.5. Muuta pääakselimuotoon neliömuoto Q = x T 3 Ax, missä A = 6 Matriisin A ominaisarvot = 7 ja =. Ominaisvektoreista ortogonaalimatriisi X = / / 5 5 / / 5 5

3 Kun y = X T x, saadaan pääakselimuoto Q = 7y + y Lisäkysymys: Mitä käyrää esittää yhtälö Q = 4? Pääakselimuodossa 7y + y = 4