7 NELIÖMATRIISIN DIAGONALISOINTI. Ortogonaaliset matriisit Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja A - = A T () Muistutus: Kokoa n olevien vektorien a ja b pistetulo (skalaaritulo, sisätulo) on a b = a T b = a b + + a n b n Kokoa n tai n olevan vektorin a pituus on a = a n a +K + = a T a. Sanotaan, että vektorit a ja b ovat ortogonaalisia (eli kohtisuorassa toisiaan vastaan), jos a b = a T b =. () Lause.. Reaalinen neliömatriisi A on ortogonaalinen jos ja vain jos sen sarakevektorit a j (ja myös rivivektorit) muodostavat ortonormaalin järjestelmän, eli a j a k = a T kun j k j a k = kun j = k () Tämä tarkoittaa, että vektorit ovat ortogonaalisia yksikkövektoreita, niiden pituus on. Ortogonaalimatriisin ominaisuuksia: Ortogonaalimatriisin ominaisarvot ovat reaalisia tai pareittain kompleksikonjugaatteja ja niiden itseisarvo on. Ortogonaalimatriisin determinantti on tai. Jos A on ortogonaalimatriisi, niin myös A T on ortogonaalimatriisi.. Ortogonaalimuunnokset Muunnos y = Ax (4) on ortogonaalimuunnos, jos A on ortogonaalimatriisi. Se on siis ortogonaalisen matriisin määrittelemä lineaarikuvaus f: R n R n, f(x) = Ax, kun A on kokoa n n. Esimerkki.. Kierto tasossa määritellään muunnoksella y = Ax, missä A = cosθ sin θ sin θ cosθ Osoita, että kyseessä on ortogonaalimuunnos.
Ortogonaalimuunnoksen ominaisuuksia: 8 Ortogonaalimuunnos on bijektio: a) jos x x, niin Ax Ax b) jokaisella y R n on x R n, siten, että y = Ax. Ortogonaalimuunnos säilyttää vektoreiden pistetulon: Jos u = Aa ja v = Ab, niin u v = a b. Ortogonaalimuunnos säilyttää myös vektorin pituuden eli a = Aa.. Ominaisvektoreiden ominaisuuksia Lause.. Jos n n-matriisilla A on n erisuurta ominaisarvoa, näihin liittyvät ominaisvektorit ovat lineaarisesti riippumattomat ja muodostavat siis R n :n kannan. Lause antaa riittävän ehdon, mutta ehto ei ole välttämätön. Esimerkissä.. saadut ominaisvektorit ovat lineaarisesti riippumattomia (osoita!) ja muodostavat R :n kannan, vaikka A:lla oli vain erisuurta ominaisarvoa (ks. Lause.4.). Lause.. Symmetrisellä n n-matriisilla A on n ortogonaalista ominaisvektoria, joista voidaan muodostaat R n :n ortonormaali kanta, ts. nämä ominaisvektorit muodostavat ortonormaalin järjestelmän. Mitä hyötyä on siitä, että ominaisvektoreista voidaan muodostaa R n :n kanta? Olkoot x,,x n ominaisarvoihin,, n liittyvät ominaisvektorit, jotka muodostavat R n :n kannan. Silloin mikä tahansa R n :n vektori x voidaan esittää muodossa x = c x + + c n x n. Silloin lineaarinen muunnos y = Ax voidaan esittää muodossa y = Ax = A(c x + + c n x n ) = c Ax + + c n Ax n = c x + + c n n x n eli muunnettu vektori y on jokin ominaisvektoreiden lineaarikombinaatio..4 Matriisin diagonalisointi n n matriisit A ja B ovat similaariset, jos on olemassa säännöllinen matriisi P siten, että B = P - AP. () Muunnosta A:sta B:hen kutsutaan similaarisuusmuunnokseksi. Muunnos voidaan myös kääntää: A = PBP -. () Lause.4. a) Similaarisilla matriiseilla A ja B = P - AP on samat ominaisarvot. b) Jos x on A:n ominaisvektori, niin y = P - x on B:n samaa ominaisarvoa vastaava ominaisvektori.
Matriisilaskennan sovelluksissa, mm. numeerisissa menetelmissä, on hyödyllistä tietää, onko matriisi diagonalisoituva eli similaarinen diagonaalimatriisin kanssa. Lause.4. Jos n n-matriisin A ominaisvektorit muodostavat R n :n kannan, niin 9 missä D = X - AX (7) D on diagonaalimatriisi, jonka päälävistäjällä on A:n ominaisarvot, X on matriisi, jonka sarakkeet ovat A:n ominaisvektorit (samassa järjestyksessä kuin vastaavat ominaisarvot). Matriisin diagonalisointi tarkoittaa, että etsitään matriisit D, X, X - joilla kaava (7) pätee. Tämä perustuu ominaisarvo-ongelman ratkaisemiseen. Kun A on diagonalisoituva, D = X - AX A = XDX - (8) Muotoa A = XDX - voidaan kutsua matriisin A ominaisarvohajotelmaksi (eigenvalue decomposition). Edellisen perusteella saadaan D k = X - A k X (9) A k = XD k X - () k λ missä D k = M λ k M L L O L M k λ n Lause.4. A on diagonalisoituva jos ja vain jos se ei ole defektiivinen. Silloin sen ominaisvektoreista voidaan muodostaa R n :n kanta. Esimerkki.4. a) Diagonalisoi esimerkin.. (s. ) matriisi A = Matriisilla oli kaksi erisuurta ominaisarvoa = ja = -, ja näihin liittyvät ominaisvektorit ovat x = [ -] T, x = [- ] T, x = [ ] T. A ei ole defektiivinen, koska sen ominaisarvojen algebralliset ja geometriset kertaluvut olivat samat. Muodostetaan ominaisvektoreista matriisi X ja lasketaan sen käänteismatriisi:
X = Gauss-Jordan-eliminoinnilla saadaan käänteismatriisiksi X - = 4 8 Kun merkitään D =, on voimassa matriisiyhtälö D = X - AX. Tarkistetaan: X - AX = 4 8 = = D b) Onko matriisi A = diagonalisoituva? Vastaus: Ei. A:lla on yksi ominaisarvo, karakteristisen yhtälön kaksikertainen juuri =. Tätä vastaavat ominaisvektorit ovat x = t [ ] T, t. M =, m =, joten A on defektiivinen. A.lla ei ole kahta lineaarisesti riippumatonta ominaisvektoria, joista voisi muodostaa R :n kannan. Symmetrisen matriisin diagonalisointi Lauseista.. ja.4. seuraa, että symmetrinen matriisi A on ortogonaalisesti diagonalisoituva: kun valitaan muunnosmatriisin X sarakkeiksi ortonormaalit ominaisvektorit, X on ortogonaalimatriisi eli X - = X T. Silloin pätee D = X T AX () Esimerkki.4. Diagonalisoi matriisi A = det(a I) = λ λ = ( )( ) 4 = - 9 + 4 = Ominaisarvot = 7, =. Vastaavat ominaisvektorit ovat esim. [ ] T ja [- ] T. Näiden pituus on, joten normalisoidut ominaisvektorit ovat
x = / / x = / / Huom. x T x =, eli vektorit muodostavat ortonormaalin systeemin. X = / / / / = X on ortogonaalimatriisi: X - = X T (tarkista laskemalla, että X T X = I). A diagonalisoidaan muunnoksella X T AX = D eli / / / / / / / / 7 =. Neliömuodot Olkoon A n n-matriisi ja x = [x,,x n ] T. Toisen asteen polynomifunktiota Q(x) = x T Ax = n n i= j= kutsutaan muuttujien x,,x n neliömuodoksi. a x x () ij i j Esimerkiksi, jos A = x T Ax = x + 4x x + x Jokainen muuttujien x,,x n toisen asteen polynomi voidaan esittää neliömuotona x T Ax, jossa matriisi A on symmetrinen. Jos neliömuodon määrittelevä matriisi B ei ole symmetrinen, asetetaan A = ½ (B + B T ) () joka on symmetrinen. Tällöin x T Ax = x T Bx. Koska symmetrinen matriisi on ortogonaalisesti diagonalisoituva, voidaan sen ominaisvektoreista muodostaa ortogonalimatriisi X siten, että D = X T AX A = XDX T. Tällöin Q = x T Ax = x T XDX T x (4) Tehdään ortogonaalimuunnos y = X T x. () Koska X - = X T, on x = Xy.
Neliömuoto voidaan esittää y-muuttujien avulla muodossa Q = y T Dy = y + + n y n () Tätä kutsutaan neliömuodon pääakselimuodoksi. Pääakselimuotoa voidaan käyttää esim. sen päättelemiseen, mitä toisen asteen käyrää (ellipsi, hyperbeli jne.) tai kolmen muuttujan tapauksessa toisen asteen pintaa (ellipsoidi, hyperboloidi jne.) yhtälö Q = vakio esittää. Käyrän tai pinnan pääakselit ovat silloin ominaisvektorien suuntaiset. Lause.. (Pääakselilause) Muunnos y = X T x muuntaa neliömuodon Q = x T Ax pääakselimuotoon Q = y T Dy, missä D on diagonaalimatriisi, jonka päälävistäjällä on A:n ominaisarvot, X on ortogonaalimatriisi, jonka sarakkeet ovat A:n ortonormaalit ominaisvektorit. Esimerkki.. Muuta pääakselimuotoon neliömuoto Q = x T Ax, missä A = Esimerkissä.4. diagonalisoitiin matriisi A, jonka ominaisarvot olivat = 7 ja = ja muodostettiin ortogonaalimatriisi X = / / / / Kun y = X T x, saadaan pääakselimuoto Q = 7y + y Mitä käyrää esittää yhtälö Q = 4?