MATRIISIN HESSENBERGIN MUOTO. Niko Holopainen

Samankaltaiset tiedostot
Insinöörimatematiikka D

Ennakkotehtävän ratkaisu

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

MS-C1340 Lineaarialgebra ja

Similaarisuus. Määritelmä. Huom.

Lineaarikuvauksen R n R m matriisi

Ominaisarvo ja ominaisvektori

Johdatus tekoälyn taustalla olevaan matematiikkaan

1 Matriisit ja lineaariset yhtälöryhmät

ominaisvektorit. Nyt 2 3 6

LU-hajotelma. Esimerkki 1 Matriisi on yläkolmiomatriisi ja matriisi. on alakolmiomatriisi. 3 / 24

Esimerkki 4.4. Esimerkki jatkoa. Määrää matriisin ominaisarvot ja -vektorit. Ratk. Nyt

Insinöörimatematiikka D

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja

5 Ominaisarvot ja ominaisvektorit

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä

Ortogonaalisen kannan etsiminen

Ominaisarvoon 4 liittyvät ominaisvektorit ovat yhtälön Ax = 4x eli yhtälöryhmän x 1 + 2x 2 + x 3 = 4x 1 3x 2 + x 3 = 4x 2 5x 2 x 3 = 4x 3.

Käänteismatriisi 1 / 14

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

Matriisiteoria Harjoitus 1, kevät Olkoon. cos α sin α A(α) = . sin α cos α. Osoita, että A(α + β) = A(α)A(β). Mikä matriisi A(α)A( α) on?

Determinantti 1 / 30

9 Matriisit. 9.1 Matriisien laskutoimituksia

Lineaarialgebra ja matriisilaskenta I

Insinöörimatematiikka D

Ominaisarvo ja ominaisvektori

1.1. Määritelmiä ja nimityksiä

1 Ominaisarvot ja ominaisvektorit

6 MATRIISIN DIAGONALISOINTI

MS-A0004/A0006 Matriisilaskenta

Matematiikka B2 - TUDI

Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41

Insinöörimatematiikka D

Matematiikka B2 - Avoin yliopisto

Matriisilaskenta. Harjoitusten 3 ratkaisut (Kevät 2019) 1. Olkoot AB = ja 2. Osoitetaan, että matriisi B on matriisin A käänteismatriisi.

Ominaisarvo-hajoitelma ja diagonalisointi

5 OMINAISARVOT JA OMINAISVEKTORIT

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:

(1.1) Ae j = a k,j e k.

Käänteismatriisin. Aiheet. Käänteismatriisin ominaisuuksia. Rivioperaatiot matriisitulona. Matriisin kääntäminen rivioperaatioiden avulla

Lineaariset yhtälöryhmät ja matriisit

10 Matriisit ja yhtälöryhmät

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42

1 Kannat ja kannanvaihto

BM20A0700, Matematiikka KoTiB2

Päättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1

Matriisit, kertausta. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät

Ominaisvektoreiden lineaarinen riippumattomuus

Ville Turunen: Mat Matematiikan peruskurssi P1 1. välikokeen alueen teoriatiivistelmä 2007

Talousmatematiikan perusteet: Luento 9. Matriisien peruskäsitteet Yksinkertaiset laskutoimitukset Transponointi Matriisitulo

Insinöörimatematiikka D

Lineaarialgebra ja matriisilaskenta I

Ortogonaalinen ja ortonormaali kanta

Matriisihajotelmat. MS-A0007 Matriisilaskenta. 5.1 Diagonalisointi. 5.1 Diagonalisointi

x 2 x 3 x 1 x 2 = 1 2x 1 4 x 2 = 3 x 1 x 5 LINEAARIALGEBRA I Oulun yliopisto Matemaattisten tieteiden laitos 2014 Esa Järvenpää, Hanna Kiili

Insinöörimatematiikka D

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Numeeriset menetelmät TIEA381. Luento 5. Kirsi Valjus. Jyväskylän yliopisto. Luento 5 () Numeeriset menetelmät / 28

2.8. Kannanvaihto R n :ssä

Matriisilaskenta Luento 16: Matriisin ominaisarvot ja ominaisvektorit

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 4 / vko 47

Kaksirivisen matriisin determinantille käytämme myös merkintää. a 11 a 12 a 21 a 22. = a 11a 22 a 12 a 21. (5.1) kaksirivine

Insinöörimatematiikka D, laskuharjoituksien esimerkkiratkaisut

Numeeriset menetelmät

C = {(x,y) x,y R} joiden joukossa on määritelty yhteen- ja kertolasku seuraavasti

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

1 Avaruuksien ja lineaarikuvausten suora summa

Demorastitiedot saat demonstraattori Markus Niskaselta Lineaarialgebra (muut ko) p. 1/104

Talousmatematiikan perusteet: Luento 10. Matriisien peruskäsitteet Yksinkertaiset laskutoimitukset Matriisitulo Determinantti

Lineaarialgebra ja matriisilaskenta II. LM2, Kesä /141

Yhteenlaskun ja skalaarilla kertomisen ominaisuuksia

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

Matriisinormeista. Sanni Carlson. Matematiikan pro gradu

Lineaariset kongruenssiyhtälöryhmät

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

Liittomatriisi. Liittomatriisi. Määritelmä 16 Olkoon A 2 M(n, n). Matriisin A liittomatriisi on cof A 2 M(n, n), missä. 1) i+j det A ij.

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Osoita, että täsmälleen yksi vektoriavaruuden ehto ei ole voimassa.

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

6. OMINAISARVOT JA DIAGONALISOINTI

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. Olkoot A 2 := AA =

Vektoreiden virittämä aliavaruus

Ominaisarvot ja ominaisvektorit 140 / 170

Insinöörimatematiikka D

Matriisialgebra harjoitukset, syksy 2016

Lineaarialgebra ja matriisilaskenta I

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

Sisätuloavaruudet. 4. lokakuuta 2006

OMINAISARVOISTA JA OMINAISVEKTOREISTA

Lineaarialgebra ja matriisilaskenta I, HY Kurssikoe Ratkaisuehdotus. 1. (35 pistettä)

802120P Matriisilaskenta (5 op)

Ositetuista matriiseista

Talousmatematiikan perusteet: Luento 10. Lineaarikuvaus Matriisin aste Determinantti Käänteismatriisi

MS-C1340 Lineaarialgebra ja

Transkriptio:

MATRIISIN HESSENBERGIN MUOTO Niko Holopainen Matematiikan pro gradu Jyväskylän yliopisto Matematiikan ja tilastotieteen laitos Syksy 2013

Tiivistelmä: Niko Holopainen, Matriisin Hessenbergin muoto Matematiikan pro gradu-tutkielma, 55 sivua Jyväskylän yliopisto, Matematiikan ja tilastotieteen laitos, syksy 2013 Tämä tutkielma käsittelee lineaarialgebraa ja erityisesti matriisiteoriaa Erityisesti tutustutaan neliömatriiseihin ja niiden ominaisarvojen karakteristisen polynomin löytämiseen ja sitä kautta ominaisarvojen ratkaisemiseen Mitä yksinkertaisemmassa muodossa matriisi on, sitä helpommin sen karakteristinen polynomi on ratkaistavissa Helpompi muoto jollekin neliömatriisille A tarkoittaa, että etsitään sille jokin yksinkertaisemmassa muodossa oleva matriisi B niin, että ne ovat keskenään similaarisia Tutkielman tarkoituksena on selventää, kuinka yksinkertaisessa muodossa jokin mielivaltainen neliömatriisi on mahdollista esittää Eräs yksinkertainen neliömatriisityyppi on Hessenbergin matriisi, johon tässä tutkielmassa tutustutaan Hessenbergin matriisia on kahta tyyppiä: ylämuotoa ja alamuotoa Hessenbergin ylämuodossa oleva matriisi voi poiketa yläkolmiomatriisista ainoastaan sen ensimmäisen alemman sivudiagonaalin kohdalla Hessenbergin alamuodossa oleva matriisi voi puolestaan poiketa alakolmiomatriisista ainoastaan sen ensimmäisen ylemmän sivudiagonaalin kohdalla Hessenbergin muodon etuna on, että kaikki neliömatriisit voidaan esittää kyseisessä muodossa Tutkielmassa selvitetään erilaisia algoritmeja neliömatriisin muuntamiseksi sekä Hessenbergin ylämuotoon että alamuotoon similaarimuunnoksilla Lisäksi käydään myös läpi neliömatriisin muuntaminen Hessenbergin ylämuotoon Householderin muunnoksen avulla Tutkielmassa näytetään, kuinka redusoimattoman Hessenbergin matriisin ominaisarvot voidaan ratkaista Krylovin menetelmällä Lisäksi näytetään myös, kuinka redusoituvan Hessenbergin matriisin ominaisarvot voidaan selvittää i Avainsanat: Neliömatriisi, karakteristinen polynomi, ominaisarvo, similaarisuus, Hessenbergin matriisi, Householderin muunnos, Krylovin menetelmä

Sisältö Johdantoa 1 Luku 1 Matriisi 3 11 Kompleksinen sisätulo ja normi 3 12 Lineaarikuvaus ja matriisi 6 13 Matriisilaskentaa 7 14 Matriisien lohkomuodot 11 15 Matriisipolynomit 12 Luku 2 Ominaisarvoteoriaa 13 21 Ominaisarvo, ominaisvektori ja ominaisavaruus 13 22 Ominaisarvojen ratkaisemisesta 14 23 Ominaisarvoteoriaa matriisipolynomeille 15 24 Matriisien similaarisuus 18 Luku 3 Hessenbergin matriisi 19 31 Muunnos Hessenbergin muotoon similaarimuunnoksilla 20 32 Hessenbergin matriisin käyttökelpoisuus 28 33 Householderin muunnos 28 Luku 4 Hessenbergin matriisin ominaisarvot 37 41 Krylovin menetelmä 37 42 Redusoituvan Hessenbergin matriisin ominaisarvot 45 Kirjallisuutta 49 iii

Johdantoa Matriisit ovat olennainen osa lineaarialgebraa Tässä työssä tarkastelun kohteena ovat erityisesti neliömatriisit Monissa eri sovelluksissa ollaan kiinnostuneita neliömatriisin ominaisarvoista ja karakteristisesta polynomista Karakteristinen polynomi ja ominaisarvot ovat kytköksissä toisiinsa, koska ominaisarvot saadaan karakteristisen polynomin nollakohdista Matriisin A karakteristinen polynomi p(λ) on p A (λ) = det(a λi) Mitä yksinkertaisemmassa muodossa matriisi on, sitä helpompi karakteristinen polynomi on selvittää Jos tutkittava neliömatriisi A ei alunperin ole siistissä muodossa, se pyritään saattamaan sellaiseen muotoon Käytännössä on löydettävä jokin yksinkertaisemmassa muodossa oleva matriisi B, joka on similaarinen matriisin A kanssa Matriisit A ja B ovat similaarisia keskenään, jos on olemassa sellainen kääntyvä matriisi C, että C 1 AC = B Jos matriisit ovat similaarisia keskenään, niillä on sama karakteristinen polynomi ja tällöin myös samat ominaisarvot Jos matriisi A on similaarinen jonkin diagonaalimatriisin D kanssa, se on diagonalisoituva Diagonaalimatriisin ominaisarvot saadaan luettua suoraan diagonaalilta, joten tällainen muoto olisi ideaali Kaikki matriisit eivät kuitenkaan ole diagonalisoituvia Yksi vaihtoehto yksinkertaisemmaksi muodoksi on Hessenbergin matriisi, jota on kahta tyyppiä: ylämuotoa ja alamuotoa Hessenbergin ylämuodossa oleva matriisi poikkeaakin yläkolmiomatriisista korkeintaan ensimmäisen alemman sivudiagonaalin (engl subdiagonal) kohdalla ja alamuodossa oleva voi poiketa alakolmiomatriisista ainoastaan ensimmäisen ylemmän sivudiagonaalin (engl superdiagonal) kohdalla Tutkielmassa selviää, että itse asiassa kaikki neliömatriisit on mahdollista muuntaa sekä Hessenbergin ylämuotoon että alamuotoon Ensimmäisessä luvussa tutustutaan tutkielman kannalta tärkeimpiin peruskäsitteisiin Aivan ensimmäisenä määritellään kompleksinen sisätulo ja normi Tämän jälkeen tutustutaan lineaarikuvaukseen ja sitä kautta matriisin määritelmään Luvussa tutustutaan muiden muassa erilaisiin neliömatriisityyppeihin, matriisituloon ja determinanttiin Näytetään, kuinka matriisi voidaan osittaa jakamalla se pienempiin 1

2 JOHDANTOA lohkoihin Luvun lopuksi näytetään, kuinka matriiseista voidaan muodostaa polynomeja tavallisten lukujen tapaan Ensimmäisessä luvussa käsitellyt perusasiat löytyvät kirjallisuuslähteistä [1] ja [5]-[9] Osa esiintyvistä lauseista on todistettu, mutta osa sivuutetaan Edellä mainituista lähteistä löytyvät todistukset lauseisiin Toisessa luvussa keskitytään ominaisarvoteoriaan ja erityisesti matriisin karakteristiseen polynomiin ja ominaisarvoihin Selvitetään, miksi matriisin A ominaisarvoja ratkoessa päädytään tutkimaan juuri yhtälöä det(a λi) = 0 Yhtälön vasen puoli määrittelee matriisin karakteristisen polynomin p A (λ) Tarkastellaan karakteristisen polynomin yhteyttä matriisipolynomeihin Määritellään käsite similaarisuus ja todetaan, että similaarisilla matriiseilla todellakin on sama karakteristinen polynomi ja samat ominaisarvot Toisessa luvussa käsiteltävien asioiden pohjana on käytetty pääosin lähdettä [1] ja myös lähteitä [4],[6],[8] ja [9] Kolmannessa luvussa tutustutaan matriisin Hessenbergin muotoon Selvitetään, kuinka matriisi voidaan muuntaa Hessenbergin ylämuotoon ja alamuotoon similaarimuunnoksia käyttäen Luvussa myös todetaan, että jokainen matriisi todellakin voidaan esittää sekä Hessenbergin ylämuodossa että alamuodossa Luvun lopuksi tutustutaan vielä Householderin muunnokseen, jonka avulla matriisi voidaan muuntaa Hessenbergin ylämuotoon Tässä luvussa on käytetty pohjana lähdettä [2] laajentaen sen reaaliset tarkastelut kompleksiseen tapaukseen Viimeisessä luvussa on tutustuttu Hessenbergin matriisin ominaisarvojen ratkaisemiseen Redusoitumattoman Hessenbergin matriisin tapauksessa käytetään Krylovin menetelmää Redusoituva Hessenbergin matriisi voidaan puolestaan jakaa sopiviin lohkoihin Tämän luvun pohjana on pääosin käytetty lähdettä [2] laajentaen sen reaaliset tarkastelut kompleksiseen tapaukseen ja myös lähteitä [3] ja [9]

LUKU 1 Matriisi 11 Kompleksinen sisätulo ja normi Kompleksilukujen kunta C koostuu lukupareista (x, y) R 2 ja ne ovat muotoa z = x + iy, jossa i on imaginaariyksikkö, jolle pätee i 2 = 1 Kompleksiluvun z C liittoluku (tai kompeksikonjugaatti) määritellään asettamalla Kompleksiluvun z reaaliosa on ja imaginääriosa on z = x iy x =: Re(z) R y =: Im(z) R Kompleksiluvun z C itseisarvo (tai moduli) määritetään asettamalla z := zz = (x + iy)(x iy) = x 2 i 2 y 2 = x 2 + y 2 Selvästi Re(z) Re(z) z ja Im(z) Im(z) z kaikilla (x, y) R 2 Tässä Re(z) ja Im(z) ovat tavallisia itseisarvoja avaruudessa R Kannattaa myös huomata, että z + z = (x + iy) + (x iy) = 2x = 2 Re(z) Reaalilukujen joukko R voidaan ajatella kompleksilukujen kunnan C osajoukkona, koska jokainen reaaliluku a R voidaan samaistaa kompleksiluvuksi (a, 0) = a + i 0 = a Jokaiselle muotoa (a, 0) olevalle kompleksiluvulle pätee tällöin selvästi a = a Kompleksinen vektori z C n on muotoa z = (z 1,, z n ), jossa komponentit z 1,, z n ovat kompleksilukuja Kompleksisen vektorin z C n kompleksikonjugaatti saadaan ottamalla jokaisesta komponentista erikseen liittoluku: z = (z 1,, z n ) Vektoreiden z = (z 1,, z n ) ja w = (w 1,, w n ) kompleksinen sisätulo määritetään asettamalla n (z w) = z i w i = z 1 w 1 + z n w n i=1 3

4 1 MATRIISI Jos vektoreiden a, b C n kaikki komponentit ovat reaalisia (se on reaalinen vektori), tällöin n n (a b) = a i b i = a 1 b 1 + + a n b n = a 1 b 1 + + a n b n = a i b i, i=1 jolloin kompleksinen sisätulo vastaa tavallista Eukleideen sisätuloa reaalisille vektoreille Kuvaus : C n R on normi avaruudessa C n, jos se toteuttaa seuraavat ehdot: (1) x 0 kaikilla x C n (2) x = 0, jos ja vain jos x = 0 (3) x + y x + y kaikilla x, y C n (4) αx = α x kaikilla α C ja x C n Tavallinen Eukleideen normi saadaan ottamalla neliöjuuri vektorin sisätulosta itsensä kanssa Kompleksisessa tapauksessa normi määritetään muuten samalla tavalla, mutta tavallisen reaalisen sisätulon sijaan käytetään kompleksista sisätuloa Kompleksisen vektorin z = (z 1,, z n ) C n normiksi saadaan tällöin z = (z z) = n z i z i = z 1 z 1 + z n z n Vektorit x, y C n ovat ortogonaaliset eli kohtisuorat, jos i=1 (x y) = (y x) = 0 Vektorin y ortogonaaliprojektio vektorin x suuntaan määritetään asettamalla (y x) P x y := x x 2 Tällöin pätee (y P x y x) = (y x) (P x y x) = (y x) jolloin y P x y ja x ovat kohtisuorassa keskenään Koska (P x y y P x y) = (P x y P x y) (y P x y) (y x)2 = x 4 x 2 = 0, i=1 (y x) x 2 x 2 = 0, (y x)2 x 2 myös P x y y ja P x y ovat kohtisuorassa keskenään Ortogonaalisille vektoreille pätee Pythagoraan lause, koska x + y 2 = (x + y x + y) = x 2 + (x y) + (y x) + y 2 }{{}}{{} =0 =0 = x 2 + y 2

11 KOMPLEKSINEN SISÄTULO JA NORMI 5 Seuraava tulos antaa hyödyllisen arvion kompleksisille vektoreille avaruudessa C n Lause 11 (Cauchyn-Schwarzin epäyhtälö) Kaikille x, y C n pätee (x y) x y Todistus Tapaus on selvä, kun x = 0 Käsitellään tapaus x 0 Koska y P x y ja P x y ovat kohtisuorassa keskenään, pätee Pythagoraan lauseen perusteella y 2 = y P x y + P x y 2 = y P x y 2 + P x y 2 P x y 2 = (y x) 2 x 2 = x 4 Edellistä muokkaamalla saadaan (y x) 2 x 2 (x y) 2 x 2 y 2, joka on yhtäpitävää sen kanssa, että (x y) x y Lause 12 (Kolmioepäyhtälö) Kaikille x, y C n pätee Todistus x + y x + y x + y 2 = (x + y x + y) = x 2 + (x y) + (y x) + y 2 = x 2 + (x y) + (x y) + y 2 = x 2 + 2 Re((x y)) + y 2 x 2 + 2 (x y) + y 2 x 2 + 2 x y + y 2 = ( x + y ) 2 Edellinen on yhtäpitävää sen kanssa, että x + y x + y Kompleksiselle normille pätevät selvästi normin ehdot (1) ja (2) Ehto (3) saadaan lauseesta 12 Lisäksi kompleksiselle normille pätee αx = αxαx = αα xx = α x, mikä on ehto (4) Kompleksinen normi näin ollen täyttää normin ehdot Jos vektorin z kaikki komponentit ovat reaalisia, kompleksinen normi vastaa tällöin tavallista Eukleideen vektorinormia reealisille vektoreille

6 1 MATRIISI 12 Lineaarikuvaus ja matriisi Tarkastellaan aluksi lineaarista yhtälöryhmää a 11 x 1 + + a 1n x n = b 1 (1) a m1 x 1 + + a mn x n = b m, jossa a ij ja b i (tässä i = 1,, m ja j = 1,, n) ovat kompleksisia vakioita ja x 1,, x n kompleksisia muuttujia Merkitään x = (x 1,, x n ) C n, jolloin x voidaan samaistaa vektoriksi, jolla on n komponenttia: x 1,, x n Yhtälöryhmän (1) yhtälöiden vasemmat puolet määrittelevät kuvauksen L: C n C m : x (a 11 x 1 + + a 1n x n,, a m1 x 1 + + a mn x n ) Tällaista kuvausta L kutsutaan lineaarikuvaukseksi ja sillä on selvästi seuraavat ominaisuudet: (1) L(x + y) = L(x) + L(y) kaikilla x, y C n, (2) L(λx) = λl(x) kaikilla x C n ja λ C Tarkastellaan edelleen lineaarista yhtälöryhmä (1) ja esitetään se muodossa a 11 x 1 + + a 1n x n b 1 (2) = a m1 x 1 + + a mn x n b m Vektori x C n on mahdollista esittää sarakevektorina x 1 x = (x 1,, x n ) = x n Nyt yhtälö (2) voidaan esittää muodossa a 11 x 1 + + a 1n x n a 11 a 1n x 1 =: a m1 x 1 + + a mn x n a m1 a mn x n Yhtälöryhmän kertoimien a ij muodostamaa kaaviota A = A m n = [ a ] 11 a 1n a ij = a m1 a mn kutsutaan matriisiksi, tarkemmin m n-matriisiksi Matriisilla A on selvä yhteys lineaarikuvaukseen L, koska jokainen lineearikuvaus voidaan esittää aina matriisina Matriisi A onkin lineaarikuvausta L vastaava matriisi

13 MATRIISILASKENTAA 7 Matriisi koostuu riveista ja sarakkeista Matriisin A sarakkeet a 1j ā j = a mj ovat vektoreina sen sarakevektoreita ā j = (a 1j,, a mj ) C m Matriisin A rivit a i = [ ] a i1 a in ovat vektoreina sen rivivektoreita a i = (a i1,, a in ) C n Matriisi voidaan näin ollen esittää myös muodossa a 1 A = [ ] ā 1 ā n = a m 13 Matriisilaskentaa 131 Neliömatriisi Matriisia, jolla on sama määrä rivejä ja sarakkeita, kutsutaan neliömatriisiksi: a 11 a 1n A = A n n = a n1 a nn Neliömatriisilla on joitakin erikoistapauksia Neliömatriisia, joiden alkioille pätee a ij = 0 silloin, kun i > j, sanotaan yläkolmiomatriisiksi: a 11 a 1n 0 A = A n n = 0 0 a nn Vastaavasti neliömatriisia, joiden alkioille pätee a ij = 0 silloin, kun i < j, sanotaan alakolmiomatriisiksi: a 11 0 0 A = A n n = 0 a n1 a nn Ylä- ja alakolmiomatriiseille käytetään yhteisnimitystä kolmiomatriisi Neliömatriisia, joiden alkioille pätee a ij = 0 silloin, kun i j, kutsutaan lävistäjä- tai diagonaalimatriisiksi: a 11 0 0 0 A = A n n = 0 0 0 a nn

8 1 MATRIISI Diagonaalimatriisille käytetään myös merkintää A = diag(a 11,, a nn ) Diagonaalimatriisin erikoistapaus on yksikkömatriisi I, joissa kaikki diagonaalin alkiot ovat ykkösiä Tällöin I = diag(1,, 1): 1 0 0 0 I = I n = 0 0 0 1 Lause 13 Matriisille A m n pätee aina AI n = A = I m A Jos neliömatriisille A löytyy sellainen neliömatriisi B, että AB = I, sanotaan, että matriisi A on kääntyvä ja silloin B on sen käänteismatriisi Tällöin myös BA = I Matriisin A käänteismatriisille käytetään merkintää A 1 Jos matriisi ei ole kääntyvä, sitä kutsutaan singulaariseksi Lause 14 Matriisi A n n on singulaarinen, jos ja vain jos on olemassa sellainen x C n (x 0), jolle pätee Ax = 0 Neliömatriisille A n n voidaan määrittää potensseja samaan tapaan kuin reaaliluvuille Asetetaan ensin, että A 0 = I, jolloin yksikkömatriisi I voidaan ikään kuin samaistaa ykköseksi matriisien tapauksessa Matriisia voidaan tunnetusti kertoa reaaliluvulla Yleisemmin reaaliluku λ voidaan samaistaa matriisiksi λi Toisaalta voidaan ajatella, että A 1 = A ja A 2 = AA Sitä suuremmat potenssit voidaan määrittää rekursiivisesti A k = AA k 1, jolloin edellinen voidaan puolestaan samaistaa matriisien potensseiksi Matriisia, jonka kaikki alkiot ovat nollia, kutsutaan nollamatriisiksi ja sitä merkitään usein yksinkertaisesti vain nollalla: 0 0 =: 0 0 0 Nollamatriisi ei tosin aina ole neliömatriisi 132 Matriisin adjungaatti Matriisin A m n = [ a ij ] transpoosi on matriisi B n m, jonka alkioille pätee a ij = b ji kaikilla indekseillä i ja j Matriisin A transpoosi saadaankin vaihtamalla sarakkeet riveiksi ja rivit sarakkeiksi Matriisin A transpoosille käytetään merkintää A T Matriisin A m n = [a ij ] kompleksikonjugaatti on matriisi B n m, jonka alkioille pätee b ij = a ij kaikilla indekseillä i ja j Matriisin A kompleksikonjugaatille käytetään merkintää A

13 MATRIISILASKENTAA 9 Matriisin A adjungaatti määritetään asettamalla A = A T Matriisin A adjungaatti on sen kompleksikonjugaatin transpoosi Matriisin A adjungaatin B alkioille pätee b ji = a ij kaikilla indekseillä i ja j Reaalisessa tapauksessa matriisin A adjungaatti vastaa sen transpoosia Matriisia A kutsutaan itseadjungoituvaksi, jos A = A Reaalisessa tapauksessa tämä vastaa symmetristä matriisia Neliömatriisia U n n kutsutaan unitaariseksi, jos sen käänteismatriisi on sen adjungaatti, jolloin U 1 = U Reaalisessa tapauksessa tämä vastaa ortogonaalista matriisia 133 Matriisitulo Matriisien A l m ja B m n tulomatriisin C l n alkioille pätee m c ij = a ik b kj kaikilla indekseillä i ja j k=1 Matriisien A l m ja B m n tulo on tällöin muotoa a 11 a 1m b 11 b 1n AB = a l1 a lm b m1 b mn a 11 b 11 + + a 1m b m1 a 11 b 1n + + a 1m b mn = a l1 b 11 + + a lm b m1 a l1 b 1n + + a lm b mn Jotta tulo olisi mahdollista laskea, matriisin A sarakkeiden ja matriisin B rivien lukumäärät on oltava samat 134 Determinantti Determinantin määrittämiseen on useita erilaisia tapoja Käydään lyhyesti läpi yhtä tapaa näistä Määritellään ensin alimatriisin käsite Kun matriisilta A n n poistetaan i rivi ja j sarake, muodostuvaa (n 1) (n 1)-matriisia kutsutaan matriisin A alimatriisiksi paikan (i, j) suhteen, ja merkitään A ij Kokoa 1 1 olevan matriisin A = [a] determinantti on sen ainoan alkion arvo: det A := a Kokoa 2 2 olevan matriisin [ ] a11 a A = 12 a 21 a 22 determinantti det A määritellään asettamalla det A := a 11 a 12 a 21 a 22 := a 11a 22 a 21 a 12

10 1 MATRIISI Suurempien neliömatriisien determinantit voidaan määrittää rekursiivisesti Neliömatriisin A n n (n 3) determinantti voidaan hajottaa sen alimatriisien determinanttien lineaarikombinaatioksi asettamalla det A = a 11 det A 11 a 21 det A 21 + + ( 1) n+1 a n1 A n1 n = ( 1) k+1 a k1 det A k1 k=1 Vastaavasti jokaisen alimatriisin A k1 determinantti voidaan hajottaa pienempien matriisien determinanttien lineaarikombinaatioksi Samalla periaatteella edetään rekursiivisesti, kunnes päästään laskemaan kokoa 2 2 olevien matriisien determinantteja Esimerkiksi 3 3-matriisin determinantti on a 11 a 12 a 13 det A = a 21 a 22 a 23 a 31 a 32 a 33 = a 11 a 22 a 23 a 32 a 33 a 21 a 12 a 13 a 32 a 33 + a 31 a 12 a 13 a 22 a 23 Matriisin A n n alkion a ij kofaktori cof a ij määritetään asettamalla cof a ij = ( 1) i+j det A ij Matriisia B, jonka alkioille pätee b ij = cof a ij kaikilla indekseillä i ja j, sanotaan matriisin B liittomatriisiksi (tai kofaktorimatriisiksi) Tällöin merkitään B =: à Lause 15 Olkoon à matriisin A liittomatriisi Tällöin Aà = ÃA = (det A)I Lause 16 Matriisi A n n on kääntyvä jos ja vain jos det A 0 Lause 17 Kolmiomatriisin A n n = [a ij ] determinantti on sen diagonaalialkoiden tulo, toisin sanoen n det A = a jj = a 11 a nn j=1 135 Rivioperaatiot ja alkeismatriisit Matriisimuotoinen lineaariyhtälöryhmä voidaan ratkaista Gaussin-Jordanin mene tel mää käyttäen Menetelmä perustuu ns rivioperaatioihin, joita on kolmea eri tyyppiä Kukin rivioperaatio saadaan tehtyä kertomalla muokattavaa matriisia vasemmalta jollakin sopivalla alkeismatriisilla Alkeismatriiseja muodostettaessa tarvitaan ensin kantamatriisin käsite Kantamatriisin E ij alkiot ovat muotoa { 1, kun i = k ja j = l, [E ij ] kl = 0, muulloin Kantamatriisilla E ij nollia on ykkönen paikassa (i, j) ja muut alkiot ovat

14 MATRIISIEN LOHKOMUODOT 11 Ensimmäinen alkeismatriisi määritetään asettamalla M i (λ) = I + (λ 1)E ii, jossa λ C, λ 0 Matriisi M i (λ) saadaan käytännössä vaihtamalla yksikkömatriisissa paikassa (i, i) ykkönen luvuksi λ Tämä operaatio kertoo matriisin A riviä i luvulla λ Toinen alkeismatriisi määritetään asettamalla P ij = I E ii E jj + E ij + E ji, jossa i j Matriisi P ij saadaan vaihtamalla yksikkömatriisista paikoissa (i, i) ja (j, j) ykköset nolliksi ja vaihtamalla paikoissa (i, j) ja (j, i) nollat ykkösiksi Tämä operaatio vaihtaa matriisin A rivit i ja j keskenään Kolmas ja viimeinen alkeismatriisi määritetään asettamalla A ij (λ) = I + λe ji, jossa i j Matriisi A ij (λ) saadaan vaihtamalla yksikkömatriisin paikassa (j, i) nolla luvuksi λ Tämä operaatio lisää rivin i kerrottuna luvulla λ riviin j Kaikille kolmelle operaatiolle on olemassa käänteisoperaatiot, ja ne saadaan vastaavien alkeismatriisien käänteismatriiseina Alkeismatriisien käänteismatriisit ovat ( ) 1 M i (λ) 1 = M i, λ P 1 ij = P ij, A ij (λ) 1 = A ij ( λ) 14 Matriisien lohkomuodot Oletetaan, että matriisille A m n pätee m 1 + m 2 = m joillakin m 1, m 2 1 Tällöin matriisi voidaan esittää lohkomuodossa [ ] A11 A =, A 21 jossa A 11 on m 1 n-matriisi ja A 21 on m 2 n-matriisi Tällöin matriisin A rivivektorit a 1,, a m1 muodostavat matriisin A 21 rivit ja rivivektorit a m1 +1,, a m muodostavat matriisin A 22 rivit Oletetaan, että matriisille A m n pätee n 2 ja n 1 +n 2 = n Tällöin matriisi voidaan esittää muodossa A = [ A 11 A 12 ], jossa A 11 m n 1 -matriisi ja A 12 on m n 2 -matriisi Tällöin matriisin A sarakevektorit ā 1,, ā n1 muodostavat matriisin A 11 sarakkeet ja sarakevektorit ā n1 +1,, ā n muodostavat matriisin A 12 sarakkeet

12 1 MATRIISI Jos matriisille A m n pätee m 2 ja m 1 + m 2 = m, sekä n 2 ja n 1 + n 2 = n, se voidaan esittää muodossa [ ] A11 A A = 12 A 21 A 22 Yleistyksenä matriisi voidaan vastaavalla periaatteella jakaa sekä rivien että sarakkeiden suhteen mielivaltaiseen määrään lohkoja Lause 18 Oletetaan, että matriisi A voidaan esittää lohkomuodossa [ ] A11 A 12, 0 A 22 jossa A 11 ja A 22 ovat neliömatriiseja Tällöin Olkoon polynomi p muotoa Tällöin matriisia det A = det A 11 det A 22 15 Matriisipolynomit p(t) = a k t k + + a 1 t + a 0 p(a) = a k A k + + a 1 A + a 0 I sanotaan matriisin A matriisipolynomiksi

LUKU 2 Ominaisarvoteoriaa 21 Ominaisarvo, ominaisvektori ja ominaisavaruus Tutkitaan tilannetta, missä lineearikuvaukselle L: C n C n halutaan löytää jokin sellainen vektori x C n, että x ja Lx ovat yhdensuuntaisia Tällöin on löydettävä jokin λ C, jolle pätee Lx = λx Oletetaan, että a 11 a 1n A = A n n = a n1 a nn on lineearikuvausta L vastaava matriisi Arvoa λ C kutsutaan matriisin A ominaisarvoksi, mikäli on olemassa sellainen vektori x C n (x 0), että Ax = λx Vektoria x kutsutaan puolestaan ominaisarvoa λ vastaavaksi ominaisvektoriksi Matriisin A kaikkien ominaisarvojen joukkoa kutsutaan sen spektriksi ja merkitään σ(a) Aliavaruudelle V λ = {x C n : Ax = λx} käytetään nimitystä matriisin A ominaisarvoa λ vastaava ominaisavaruus Esimerkki 21 Tarkastellaan 2 2 matriisia [ ] 6 7 A = 9 10 ja vektoria x 1 = (7, 9) Tällöin [ [ ] 6 7 7 Ax 1 = = 9 10] 9 [ ] [ 21 7 = 3 27 9] Matriisin A yksi ominaisarvo on λ 1 = 3 ja eräs sitä vastaava ominaisvektori x 1 Toisaalta vektorilla x 2 = (1, 1) saadaan [ [ ] [ ] [ 6 7 1 1 1 Ax 2 = = = 1 9 10] 1 1 1] Matriisin A toinen ominaisarvo on λ 2 = 1 ja sitä vastaava ominaisvektori x 2 13

14 2 OMINAISARVOTEORIAA 22 Ominaisarvojen ratkaisemisesta Ominaisarvot voidaan ratkaista muutenkin kuin kokeilemalla Tarkastellaan yksikkömatriisia I Tällöin kaikille vektoreille x C n pätee Ix = x Tässä tapauksessa 1 on selvästi ainoa mahdollinen ominaisarvo Matriisin A ominaisarvolle λ pätee Ax = λx = λix, jolloin Ax λix = 0 jollakin vektorilla x C n Ominaisarvoja selvittäessä päädytään tutkitaan yhtälöä (A λi)x = 0 Lause 21 Olkoon A kokoa n n oleva matriisi Tällöin λ on matriisin ominaisarvo jos, ja vain jos det(a λi) = 0 Todistus Osoitetaan ensin, että jos det(a λi) = 0, luku λ on ominaisarvo Koska det(a λi) = 0, lauseen 16 perusteella tiedetään, että matriisi A on singulaarinen On olemassa sellainen x C n (x 0), että (A λi)x = 0 (lause 14) Nyt (A λi)x = Ax λix = Ax λx = 0 Tällöin Ax = λx, jolloin λ on ominaisarvo Osoitetaan vielä toisin päin: jos λ on ominaisarvo, pätee det(a λi) = 0 Tehdään antiteesi: λ on matriisin A ominaisarvo, mutta det(a λi) 0 Tällöin matriisi (A λi) olisi kääntyvä, jolloin sille löytyisi käänteismatriisi (A λi) 1 Kertomalla yhtälö (A λi)x = 0 puolittain vasemmalta käänteismatriisilla (A λi) 1 saadaan (A λi) 1 (A λi)x = (A λi) 1 0 Ix = 0 x = 0 Yhtälön (A λi)x = 0 ainoa mahdollinen ratkaisu on nollavektori x = 0, mikä on ristiriita Polynomia det(a λi) kutsutaan matriisin A karakteriseksi polynomiksi ja yhtälöä det(a λi) = 0 matriisin A karakteristiseksi yhtälöksi Matriisin karakteristiselle polynomille käytetään myös merkintää p A (λ) := det(a λi) Laskemalla lauseke det(a λi) auki huomataan, että kyseessä todellakin on polynomi Esimerkki 22 Ratkaistaan ominaisarvot matriisille [ ] 5 2 A = 7 4

Nyt 23 OMINAISARVOTEORIAA MATRIISIPOLYNOMEILLE 15 [ ] [ ] [ ] 5 2 1 0 5 2 A λi = λ = 7 4 0 1 7 4 [ ] 5 λ 2 = 7 4 λ [ ] λ 0 0 λ Karakteristiseksi polynomiksi saadaan tällöin p(λ) = 5 λ 2 7 4 λ = (5 λ)( 4 λ) 2 ( 7) = λ 2 λ + 6 Ratkaisemalla karakteristinen yhtälö λ 2 λ + 6 = 0 saadaan matriisin A ominaisarvoiksi λ 1 = 2 ja λ 2 = 3 on Lause 22 Kolmiomatriisin A n n = [a ij ] karakteristinen polynomi p(λ) = n (a jj λ) = (a 11 λ) (a nn λ) j=1 Todistus Matriisin A karakteristinen polynomi on p(λ) = det(a λi) Koska A on kolmiomatriisi, myös A λi on kolmiomatriisi Lauseen 17 perusteella matriisin A λi determinantti on sen diagonaalialkioiden tulo, jolloin n det(a λ) = (a jj λ) = (a 11 λ) (a nn λ) j=1 23 Ominaisarvoteoriaa matriisipolynomeille Jos matriisilla A n n on ominaisarvo λ C ja eräs sitä vastaava ominaisvektori x C n, määritelmän perusteella pätee Toisaalta Vastaavasti Ax = λx A 2 x = A(Ax) = Aλx = λ(ax) = λ(λx) = λ 2 x A 3 x = A(A 2 x) = Aλ 2 x = λ 2 (Ax) = λ 2 (λx) = λ 3 x Edelliset voidaankin kirjoittaa induktiivisesti yleisessä muodossa Lause 23 Olkoon λ C matriisin A n n ominaisarvo ja x C n tätä ominaisarvoa vastaava ominaisvektori Tällöin A i x = λ i x kaikilla i = 1, 2

16 2 OMINAISARVOTEORIAA Todistus Käytetään induktiota Kun i = 1, tällöin suoraan määritelmästä saadaan A i x = Ax = λx = λ i x Tehdään induktio-oletus: oletetaan, että väite pätee, kun i = k: A k x = λ k x Osoitetaan, että jos väite pätee tapauksessa i = k, se pätee silloin myös tapauksessa i = k + 1 : A k+1 x = A(A k x) = Aλ k x = λ k (Ax) = λ k (λx) = λ k+1 x Käytännössä edellinen lause tarkoittaa, että jos x C n on matriisin A n n ominaisvektori, se on myös matriisin A k ominaisvektori Matriisin A k tapauksessa ominaisvektoria x vastaa ominaisarvo λ k Lause 24 Olkoot p polynomi ja matriisi A n n, jonka ominaisarvoa λ vastaa ominaisvektori x 0 Tällöin p(a)x = p(λ)x Todistus Lauseen 23 perusteella tiedetään, että Olkoon polynomi p(t) muotoa A i x = λ i x kaikilla i = 1, 2 p(t) = a k t k + + a 1 t + a 0, jolloin matriisipolynomiksi saadaan Nyt p(a) = a k A k + + a 1 A + a 0 I p(a)x = ( a k A k + + a 1 A + a 0 I ) x = a k A k x + + a 1 Ax + a 0 x = a k λ k x + + a 1 λx + a 0 x = ( a k λ k + + a 1 λ + a 0 ) x = p(λ)x Lause 25 (Cayleyn-Hamiltonin lause) Olkoon p matriisin A n n karakteristinen polynomi Tällöin p(a) = 0

23 OMINAISARVOTEORIAA MATRIISIPOLYNOMEILLE 17 Todistus Matriisin A karakteristinen polynomi on muotoa p(λ) = det(a λi) = ( 1) n (λ n + + a 1 λ + a 0 ) Olkoon B matriisin A λi liittomatriisi Matriisin B kaikille alkioille pätee b ij = ( 1) i+j det(a λi) ij Koska det(a λi) on muuttujan λ suhteen n asteen polynomi, det(a λi) ij voi siten olla korkeintaan astetta n 1, jolloin matriisin B alkiot b ij voivat olla korkeintaan tätä astetta Tämän perusteella tiedetään, että B voidaan esittää muodossa B = λ n 1 B n 1 + λ n 2 B n 2 + + λb 1 + B 0, jossa B 0, B 1,, B n 2, B n 1 ovat matriiseja, joiden alkiot ovat kompleksia vakioita Nyt B(A λi) =(λ n 1 B n 1 + λ n 2 B n 2 + + λb 1 + B 0 )(A λi) =λ n 1 B n 1 A + λ n 2 B n 2 A + + λb 1 A + B 0 A λ n B n 1 λ n 1 B n 2 λ 2 B 1 λb 0 = λ n B n 1 + λ n 1 (B n 1 A B n 2 ) + λ(b A 1 + B 0 ) + B 0 A Edellinen hieman yleisemmin kirjoitettuna on ( n 1 ) B(A λi) = B 0 A + λ i (B i A B i 1 ) λ n B n 1 i=1 Toisaalta lauseen 15 perusteella (A λi)b = B(A λi) = det(a λi)i, joten (A λi)b = det(a λi)i = p(λ)i = ( 1) n λ n I + + a 1 λi + a 0 I Koska (A λi)b = B(A λi), saadaan yhtälöryhmä B 0 A = a 0 I, B i A B i 1 = a i I kaikilla i = 1,, n 1, B n 1 = ( 1) n I Kertomalla keskimmäiset yhtälöt puolittain matriisin potenssilla A i, saadaan B i A i+1 B i 1 A i = a i A i kaikilla i = 1,, n 1 Kertomalla vielä viimeinen yhtälö puolittain matriisin potenssilla A n, saadaan B n 1 A n = ( 1) n A n Yhtälöryhmäksi saadaan, että B 0 A = a 0 I, B i A i+1 B i 1 A i = a i A i, kaikilla i = 1,, n 1, B n 1 A n = ( 1) n A n

18 2 OMINAISARVOTEORIAA Laskemalla yhtälöryhmän vasemmat puolet yhteen saadaan, että B 0 A+B 1 A 2 B 0 A+B 2 A 3 B 1 A 2 + +B n 1 A n B n 1 A n 1 B n 1 A n = (B 0 A B 0 A) + (B 1 A 2 B 1 A 2 ) + + (B n 1 A n B n 1 A n ) = 0 Laskemalla yhtälöryhmän oikeat puolet yhteen saadaan Tällöin p(a) = 0 a 0 I + a 1 A + + a n 1 A n 1 + ( 1) n A n = p(a) 24 Matriisien similaarisuus Eräs oleellinen käsite neliömatriiseihin liittyen on similaarisuus Matriisit A ja B ovat keskenään similaarisia, mikäli on olemassa sellainen kääntyvä matriisi B n n, että B = P 1 AP Similaarisia matriiseita vastaa sama lineaarikuvaus Matriisi P on niin sanottu kannanvaihtomatriisi luonnollisesta kannasta johonkin toiseen kantaan Lause 26 Similaarisilla matriiseilla A ja B on sama karakteristinen polynomi Todistus Olkoon λ C Koska B = P 1 AP jollakin kääntyvällä matriisilla P, voidaan kirjoittaa B λi = P 1 AP λi = P 1 AP λp 1 P = P 1 AP P 1 λp = P 1 AP P 1 λip = P 1 (A λi)p Determinantin ominaisuuksien avulla saadaan nyt det(b λi) = det(p 1 (A λi)p ) = det P 1 det(a λi) det P = det P 1 det P det(a λi) = det(p 1 P ) det(a λi) = det I det(a λi) = det(a λi) Koska similaarisien matriisien karakteristiset polynomit ovat samat, niillä on tietenkin myös samat ominaisarvot

LUKU 3 Hessenbergin matriisi Matriisien ominaisarvojen selvittäminen voi joskus olla laskennallisesti työlästä varsinkin isojen matriisien kohdalla Kuten aikaisemmin todettiin, similaarisilla matriiseilla on samat ominaisarvot Ominaisarvojen selvittämistä voidaan helpottaa etsimällä jokin similaarinen, mutta laskennallisesti yksinkertaisempi matriisi kuin alkuperäinen Diagonaalimatriisi on yksinkertaisessa muodossa, koska ominaisarvot saadaan luettua suoraan diagonaalilta Matriisi A on diagonalisoituva, jos se on similaarinen jonkin diagonaalimatriisin kanssa Käytännössä tämä tarkoittaa, että on olemassa sellainen kääntyvä matriisi C ja diagonaalimatriisi D, että C 1 AC = D Koska matriisit A ja D ovat similaarisia keskenään, niillä on samat ominaisarvot Kun muodostettaisiin aluksi sopiva kannanvaihtomatriisi C, saataisiin matriisin A ominaisarvot luettua suoraan matriisin C 1 AC = D diagonaalilta Kaikki matriisit eivät kuitenkaan diagonalisoituvia Miten yksinkertaisessa muodossa jokin täysin mielivaltainen matriisi voidaan esittää, jotta se säilyisi similaarisena alkuperäisen kanssa? Eräs ratkaisu tähän on Hessenbergin matriisi Hessenbergin matriisia on kahta tyyppiä Neliömatriisi H n n = [h ij ] on Hessenbergin ylämuotoa (engl upper Hessenberg form), jos sen alkioille pätee h ij = 0, kun i > j + 1 Tällöin matriisi on muotoa h 11 h 1n h 21 (3) H = 0 0 0 h n,n 1 h nn Neliömatriisi H n n = [h ij ] on Hessenbergin alamuotoa (engl lower Hessenberg form), jos sen alkioille pätee h ij = 0, kun j > i + 1 19

20 3 HESSENBERGIN MATRIISI Tällöin matriisi on muotoa h 11 h 12 0 0 (4) H = 0 hn 1,n h n1 h nn Hessenbergin muodossa oleva matriisi on melkein kolmiomatriisi Hessenbergin alamuodossa oleva matriisi voi poiketa alakolmiomatriisista ainoastaan ensimmäisen ylemmän sivudiagonaalin (engl superdiagonal) h 12,, h n 1,n kohdalla (alakolmiomatriisissa nämä alkiot olisivat kaikki nollia) Vastaavasti ylämuodossa oleva Hessenbergin matriisi voi poiketa yläkolmiomatriisista ainoastaan ensimmäisen alemman sivudiagonaalin (engl subdiagonal) h 21,, h n,n 1 kohdalla (yläkolmiomatriisissa nämä alkiot olisivat kaikki nollia) 31 Muunnos Hessenbergin muotoon similaarimuunnoksilla 311 Matriisin muuntaminen Hessenbergin ylämuotoon similaarimuunnoksilla Tarkastellaan johdatteluna, kuinka 4 4- matriisi a 11 a 12 a 13 a 14 A = a 21 a 22 a 23 a 24 a 31 a 32 a 33 a 34 a 41 a 42 a 43 a 44 voidaan muuntaa Hessenbergin ylämuotoon Oletetaan aluksi, että a 21 0 Muodostetaan alkeismatriiseja (katso 135) hyödyntäen matriisi S 1 asettamalla ( A 23 a ) ( 31 A 24 a ) 41 = a 21 a 21 1 0 0 0 0 1 0 0 0 a 31 1 0 21 0 a =: S 1 41 0 1 a 21 Edellisten käänteisoperaatioilla muodostetaan matriisi S1 1 asettamalla 1 0 0 0 ( ) ( ) 0 1 0 0 a31 a41 A 23 A 24 = a 21 a 21 0 a 31 1 0 21 0 a =: S 1 1 41 0 1 a 21

31 MUUNNOS HESSENBERGIN MUOTOON SIMILAARIMUUNNOKSILLA 21 Nähdään, että S 1 S1 1 = I, joten S 1 ja S1 1 ovat toistensa käänteismatriiseja Matriisit B := S 1 AS1 1 ja A ovat selvästi similaarisia Laskemalla matriisien kertolaskut nähdään, että matriisi B on muotoa b 11 b 12 b 13 b 14 (5) B = S 1 AS 1 1 = b 21 b 22 b 23 b 24 0 b 32 b 33 b 34 0 b 42 b 43 b 44 Matriisi B ei ole vielä Hessenbergin matriisi, jos b 42 0, joten sitä pitää vielä muokata Oletetaan aluksi, että b 32 0 Muodostetaan alkeismatriiseja hyödyntäen matriisi S 2 asettamalla 1 0 0 0 ( A 34 b ) 0 1 0 0 42 = 0 0 1 0 b 32 0 0 b =: S 2 42 1 b 32 Edellisen käänteisoperaatioilla muodostetaan matriisi S2 1 asettamalla 1 0 0 0 ( ) b42 0 1 0 0 A 34 = 0 0 1 0 =: S 1 b 32 0 0 b 2 42 1 b 32 Nyt S 2 S2 1 = I, joten S 2 ja S2 1 ovat toistensa käänteismatriiseja Matriisit H := S 2 BS2 1 ja B ovat similaarisia Laskemalla kertolaskut nähdään, että matriisi H on muotoa h 11 h 12 h 13 h 14 H = S 2 BS 1 2 = h 21 h 22 h 23 h 24 0 h 32 h 33 h 34 0 0 h 43 h 44 Matriisille A on nyt löydetty Hessenbergin ylämuodossa oleva similaarinen matriisi H Jos matriisille A päteekin a 21 = 0, on matriisia muokattava erilaiseen muotoon Tarkalleen ottaen halutaankin jokin matriisi Ã, joka on similaarinen matriisin A kanssa ja jolle ã 21 0 Jos a 31 0, vaihtamalla alkioiden a 21 ja a 31 paikkaa keskenään ongelma olisi ratkaistu Hyödynnetään tässä alkeismatriiseja asettamalla 1 0 0 0 P 23 = 0 0 1 0 0 1 0 0 =: P 1 0 0 0 1

22 3 HESSENBERGIN MATRIISI Nyt P 1 P 1 = I, jolloin P 1 on itsensä käänteismatriisi Erityisesti matriisi à := P 1 AP 1 on similaarinen matriisin A kanssa ja se on muotoa a 11 a 13 a 12 a 14 à = a 31 a 33 a 32 a 34 a 22 a 23 a 22 a 24 a 41 a 43 a 42 a 44 Nyt ã 21 = a 31 0, joten Hessenbergin matriisia voidaan muodostaa aiemmin esitetyllä tavalla Jos matriisille A pätee myös a 31 = 0, asetetaan 1 0 0 0 P 24 = 0 0 0 1 0 0 1 0 =: P 2 0 1 0 0 jolle pätee P 2 P 2 = I Matriisi à = P 2 AP 2 on similaarinen matriisin A kanssa ja se on muotoa a 11 a 14 a 13 a 12 à = a 41 a 44 a 43 a 42 a 31 a 34 a 33 a 32 a 21 a 24 a 23 a 22 Koska ã 31 = a 31 = 0 ja ã 41 = a 21 = 0, matriisilla on ensimmäisessä sarakkeessa jo halutuissa alkioissa nollat Hessenbergin muodon kannalta, joten voidaan siirtyä käsittelemään toista saraketta Jos matriisille A pätee jo alun perin a 21 = a 31 = a 41 = 0, sillä on ensimmäisessä sarakkeessa jo sellaisenaan halutuissa alkioissa nollat, jolloin voidaan suoraan lähteä muokkaamaan toista saraketta Oletetaan, että matriisilla B on ensimmäinen sarake halutussa muodossa Hessenbergin muodon kannalta (5), jolloin voidaan lähteä muokkaamaan toista saraketta Jos b 42 = 0, matriisi on jo valmiiksi Hessenbergin muodossa, jolloin sille ei tarvitse tehdä enää mitään Jos b 32 = 0 ja b 42 0, matriisia joudutaan muokkaamaan Asetetaan 1 0 0 0 P 34 = 0 1 0 0 0 0 0 1 =: P 3 0 0 1 0 jolloin pätee P 3 P 3 = I Erityisesti B = P 3 BP 3 on similaarinen matriisin B kanssa ja on muotoa b 11 b 12 b 14 b 13 B = b 21 b 22 b 24 b 23 0 b 42 b 44 b 43 0 b 32 b 34 b 33 Nyt b 42 = b 32 = 0, jolloin B on Hessenbergin muodossa

31 MUUNNOS HESSENBERGIN MUOTOON SIMILAARIMUUNNOKSILLA 23 Tarkastellaan seuraavaksi yleistä tapausta, jossa matriisille A n n etsitään sellainen Hessenbergin muoto, jossa nolla-alkiot löytyvät lävistäjän alapuolelta a 11 a 1n A = a n1 a nn Olkoon n 3 Aletaan järjestyksessä nollata kustakin sarakkeesta halutut alkiot Täten on ensin löydettävä matriisin A kanssa similaarinen matriisi B 1, jonka ensimmäisen sarakkeen n 2 viimeistä alkiota ovat nollia Oletetaan, että a 21 0 Muodostetaan alkeismatriiseja hyödyntäen matriisi S 1 asettamalla ( A 23 a ) ( 31 A 2n a ) n ( n1 = A 2i a ) i1 := S 1 a 21 a 21 a 21 Edellisten käänteisoperaatioilla muodostetaan matriisi S1 1 asettamalla ( ) ( ) a31 an1 n ( ) ai1 A 23 A 2n = A 2i := S1 1 a 21 a 21 a 21 Koska S 1 S1 1 = I, ovat S 1 ja S1 1 toistensa käänteismatriisit Näin ollen matriisit B 1 := S 1 AS1 1 ja A ovat similaarisia keskenään Laskemalla matriisien kertolaskut havaitaan, että B 1 on muotoa b 11 b 12 b 1n b 21 b 22 B 1 = 0 0 b 11 b 11 Matriisilla B on tällöin ensimmäisessä sarakkeessa halutuissa alkioissa nollat Seuraavaksi nollataan toisesta sarakkeesta haluttavat alkiot Halutaan löytää matriisin B 1 kanssa similaarinen matriisi B 2, jonka toisen sarakkeen n 3 viimeistä alkiota ovat nollia Oletetaan, että b 32 0 Muodostetaan matriisi S 2 asettamalla n ( A 3i b ) i2 =: S 2 b 32 i=4 ja matriisi S2 1 edellisten käänteisoperaatiolla asettamalla n ( ) bi2 A 3i =: S2 1 b 32 i=4 Koska S 2 S2 1 = I, ovat S 2 ja S2 1 toistensa käänteismatriisit Näin ollen matriisit B 2 := S 2 B 1 S2 1 ja B ovat similaarisia keskenään Laskemalla i=3 i=3

24 3 HESSENBERGIN MATRIISI matriisien kertolaskut havaitaan, että B 2 on muotoa c 11 c 12 c 13 c 1n c 21 c 22 c 23 B 2 = 0 c 32 c 33 0 0 0 c n3 c nn Nyt matriisilla C on ensimmäisessä ja toisessa sarakkeessa halutuissa alkioissa nollat Samalla periaatteella käydään läpi loput sarakkeet niin, että matriisi on saatettu Hessenbergin muotoon Yleisesti kirjoitettuna muokattaessa saraketta j muodostetaan matriisi S j (a j+1,j 0) asettamalla n ( A j+1,i a ) ij := S j a j+1,j ja matriisi S 1 j i=j+2 edellisten käänteisoperaatioilla: n ( ) aij A j+1,i a j+1,j i=j+2 := S 1 j Jos a j+1,j = 0, korjataan asia samalla periaatteella, kuin 4 4-matriisin tapauksessakin Valitaan jokin sarakkeen j lopuista alkioista a j+2,j,, a nj, jolle pätee a ij 0 Jos alkio a kj 0, asetetaan P j+1,k =: P Koska P P = I, matriisi A on similaarinen matriisin à = P AP kanssa Jos a ij = 0 kaikilla i = j + 2,, n, matriisilla on kyseisessä sarakkeessa jo valmiiksi halutuissa alkioissa nollat ja voidaan siirtyä muokkaamaan seuraavaa saraketta Matriisilla S j B j 1 S 1 j on sarakkeissa 1,, j nollattu tarvittavat alkiot (tässä B 0 = A) Toistetaan algoritmia aina (n 2) sarakkeeseen asti, jonka jälkeen matriisi on Hessenbergin muodossa Algoritmissa on oleellista, että matriisit A, B 1,, B n 2 ovat keskenään similaarisia, jolloin niillä on samat ominaisarvot Jokainen matriisi B j on similaarinen matriisin A kanssa Jos sarakkeella j on jo valmiiksi halutuissa alkioissa nollat, asetetaan yksinkertaisesti S j = I Koska B j = S j B j 1 S 1 j kaikilla j = 1,, n 2 (tässä B 0 = A), tällöin S n 2 S 1 AS 1 1 S 1 n 2 = H, jossa H on Hessenbergin ylämuodossa Merkitään S n 2 S 1 =: S, jolloin S1 1 Sn 2 1 = S 1 Nyt tiedetään, että jokaiselle matriisille

31 MUUNNOS HESSENBERGIN MUOTOON SIMILAARIMUUNNOKSILLA 25 A n n löytyy jokin sellainen kääntyvä matriisi S, että SAS 1 = H Erityisesti jokainen neliömatriisi on muunnettavissa Hessenbergin ylämuotoon Esimerkki 31 Etsitään similaarimuunnoksien avulla Hessenbergin ylämuoto matriisille 3 2 3 1 A = 1 5 6 5 1 0 2 4 2 5 12 10 Aikaisemmin esitetyllä tavalla valitaan 1 0 0 0 1 0 0 0 S 1 = 0 1 0 0 0 1 1 0 ja S 1 1 = 0 1 0 0 0 1 1 0 0 2 0 1 0 2 0 1 Tällöin B 1 = S 1 AS 1 1 = 3 1 3 1 1 11 6 5 0 1 4 1 0 5 0 0 Matriisilla B 1 on ensimmäisessä sarakkeessa halutuissa alkioissa nollat Hessenbergin muodon kannalta, joten lähdetään muokkaamaan toista saraketta Valitaan matriisit 1 0 0 0 1 0 0 0 Tällöin S 2 = 0 1 0 0 0 0 1 0 0 0 5 1 H = S 2 B 1 S 1 2 = missä H on Hessenbergin matriisi ja S 1 2 = 0 1 0 0 0 0 1 0 0 0 5 1 3 1 8 1 1 11 19 5 0 1 1 1, 0 0 5 5 Esimerkki 32 Etsitään similaarimuunnoksilla Hessenbergin ylämuoto matriisille 6 0 1 1 A = 0 3 1 1 1 1 4 1 1 1 1 8 Ensimmäisessä sarakkeessa on nolla väärässä kohdassa, koska a 21 = 0 Asia voidaan korjata vaihtamalla 2 ja 3 rivin ensimmäiset

26 3 HESSENBERGIN MATRIISI alkiot keskenään (säilyttämällä uusi matriisi kuitenkin similaarisena alkuperäisen kanssa) Asetetaan 1 0 0 0 P 23 = 0 0 1 0 0 1 0 0 =: P 0 0 0 1 Tällöin P P = I, joten P on itsensä käänteismatriisi Matriisi 6 1 0 1 à = P AP = 1 4 1 1 0 1 3 1 1 1 1 8 on tällöin similaarinen matriisin A kanssa Aikaisemmin esitetyllä tavalla valitaan nyt matriisit 1 0 0 0 1 0 0 0 S 1 = 0 1 0 0 0 0 1 0 ja S 1 1 = 0 1 0 0 0 0 1 0 0 1 0 1 0 1 0 1 Nyt matriisi B 1 = S 1 ÃS 1 1 = 6 2 0 1 1 3 1 1 0 2 3 1 0 4 0 9 on similaarinen matriisin à kanssa Edelleen aikaisemmin esitetyllä tavalla saadaan matriisit 1 0 0 0 1 0 0 0 S 2 = 0 1 0 0 0 0 1 0 ja S 1 2 = 0 1 0 0 0 0 1 0 0 0 2 1 0 0 2 1 Matriisi H = S 2 B 1 S 1 2 = 6 2 2 1 1 3 1 1 0 2 5 1 0 0 8 7 on Hessenbergin muodossa ja se on similaarinen alkuperäisen matriisin A kanssa 312 Matriisin muuntaminen Hessenbergin alamuotoon similaarimuunnoksilla Matriisi A n n voidaan vastaavasti muokata myös Hessenbergin matriisin alamuotoon (4) Tässä tapauksessa aletaan nollata sarakkeista tarvittavat alkiot oikealta lähtien aloittaen n sarakkeesta Olkoon n 3 Hessenbergin alamuotoa varten matriisilta

31 MUUNNOS HESSENBERGIN MUOTOON SIMILAARIMUUNNOKSILLA 27 A n n halutaan nollata sarakkeesta j ensimmäiset j 2 alkiota Yleisesti kirjoitettuna sarakkeella j muodostetaan matriisi S j (a j 1,j 0) asettamalla j 2 ( A j 1,i a ) ij = S j a j 1,j ja matriisiksi S 1 j i=1 edellisten käänteisoperaatioilla j 2 ( ) aij A j 1,i = S 1 j a j 1,j i=1 Tällöin S j ja S 1 j ovat toistensa käänteismatriiseja, koska S j S 1 j = I Matriisilta A n n nollataan ensin halutut alkiot n sarakkeesta, jolloin uusi matriisi on muotoa S n ASn 1 =: B n Seuraavaksi matriisilta B n nollataan halutut alkiot (n 1) sarakkeesta Halutut alkiot nollataan aina 3 sarakkeeseen asti Jokainen matriisi S j B j+1 S 1 j =: B j kaikilla j = 3,, n (tässä B n+1 = A) on similaarinen matriisin A kanssa ja sillä ovat j 2 ensimmäistä alkiota nollia Esimerkiksi 5 5-matriisin tapauksessa 5 saraketta muokattaessa matriisiksi S 5 valitaan ja matriisiksi S 1 A 41 ( a15 a 45 5 valitaan A 41 ( a 15 a 45 ) A 42 ( a25 a 45 ) A 42 ( a 25 a 45 ) A 43 ( a35 a 45 ) = S 5, ) ( A 43 a ) 35 = S5 1 a 45 Uusi matriisi on muotoa b 11 b 12 b 13 b 14 0 b 21 b 22 b 23 b 24 0 S 5 AS5 1 = b 31 b 32 b 33 b 34 0 b 41 b 42 b 43 b 44 b 45 = B 5 b 51 b 52 b 53 b 54 b 55 Jos jotakin saraketta muokatessa onkin a j 1,j = 0, nolla-alkion paikka kyseisessä sarakkeessa voidaan vaihtaa sopivalla alkeismatriisilla samalla periaatteella, kuin Hessenbergin matriisin ylämuodon tapauksessa Jokainen matriisi B j on similaarinen matriisin A kanssa Jos sarakkeella j on jo valmiiksi halutuissa alkioissa nolllat, asetetaan yksinkertaisesti S j = I Koska B j = S j B j 1 S 1 j kaikilla j = 3,, n (tässä B n+1 = A), tällöin S 3 S n ASn 1 S3 1 = H, jossa H on Hessenbergin alamuodossa Merkitään S 3 S n =: S, jolloin Sn 1 S3 1 = S 1 Nyt tiedetään, että jokaiselle matriisille A n n löytyy jokin sellainen kääntyvä matriisi S, että SAS 1 = H

28 3 HESSENBERGIN MATRIISI Erityisesti jokainen neliömatriisi on muunnettavissa Hessenbergin alamuotoon Esimerkki 33 Muokataan matriisi 1 1 1 1 A = 1 1 1 1 1 1 1 1 1 1 1 1 Hessenbergin alamuotoon similaarimuunnoksilla Valitaan ensin matriisit 1 0 1 0 1 0 1 0 S 1 = 0 1 1 0 0 0 1 0 ja S 1 1 = 0 1 1 0 0 0 1 0 0 0 0 1 0 0 0 1 Nyt 2 0 0 0 S 1 HS1 1 = 0 2 0 0 1 1 1 1 := H 1 1 3 1 Matriisilla H on viimeisessä sarakkeessa halutuissa alkioissa nollat Hessenbergin muodon kannalta ja lisäksi h 13 = 0, joten se on itse asiassa jo nyt Hessenbergin muodossa 32 Hessenbergin matriisin käyttökelpoisuus Tässä luvussa on käyty tapoja erilaisten neliömatriisien muokkaamiseksi sekä Hessenbergin ylämuotoon että alamuotoon On huomattu, että itse asiassa jokainen neliömatriisi voidaan muuntaa sekä Hessenbergin ylämuotoon että alamuotoon Seuraavaksi voidaan esittää tämän tutkielman tärkein lause Lause 31 Jokaiselle matriisille A n n löytyy kääntyvä matriisi S siten, että SAS 1 = H, jossa H on Hessenbergin muodossa matriisi Todistus Tässä luvussa on käsitelty kaikentyyppisille neliömatriiseille menetelmä Hessenbergin muotoon muuntamiseksi 33 Householderin muunnos Tutustutaan toiseen tapaan matriisin Hessenbergin muodon löytämiseksi, Householderin muunnokseen Oletetaan, että u C n (u 0) Householderin matriisi (tai Householderin muunnos) määritellään asettamalla Q = I 2uu u u

33 HOUSEHOLDERIN MUUNNOS 29 Lause 32 Householderin matriisi on itseadjungoituva ja unitaarinen Todistus Osoitetaan ensin itseadjungoituvuus Määritelmän mukaan Householderin matriisi Q n n on itseadjungoituva, kun Q = Q Merkitään lyhyemmin b = 2 R, jolloin u u Q = I buu Nyt Q = (I buu ) = I (buu ) = I b (uu ) = I b(u ) u = I buu = Q Osoitetaan vielä unitaarisuus Määritelmän mukaan Householderin matriisi Q n n on unitaarinen, kun Q = Q 1 Itseadjungoituvuuden nojalla Q = Q, joten unitaarisuus voidaan todeta osoittamalla, että Q = Q 1 Tällöin QQ = I Merkitään aluksi lyhyemmin b = 2 R Nyt u u QQ = (I buu ) (I buu ) = I 2 2Ibuu + (buu ) (buu ) = I 2buu + b 2 (uu ) (uu ) = I 2buu + b 2 u (u u) }{{} R = I 2buu + b 2 (u u)uu = I 2 2 ( ) 2 2 u u uu + (u u)uu u u = I 4uu u u + 4(u u)(uu ) (u u)(u u) = I 4uu u u + 4uu u u = I Lauseen 32 perusteella Householderin matriisille Q pätee u Q = Q = Q 1 Matriisi Q onkin samaan aikaan sekä itsensä adjungaatti että käänteismatriisi Kun matriisille A n n etsitään Hessenbergin muotoa, lähdetään ensimmäisestä sarakkeesta lähtien nollaamaan riittävä määrä sarakevektorin komponentteja lopusta Lähdetään tarkastelemaan, miten Householderin matriisi on muodostettava, jotta sitä voitaisiin hyödyntää Tarkemmin halutaankin tietää, miten vektori u C n valitaan

30 3 HESSENBERGIN MATRIISI Olkoon matriisilla A sarakevektorit ā 1,, ā n, jolloin A = [ ā 1 ā n ] Kun matriisia A kerrotaan vasemmalta puolelta matriisilla Q, tulomatriisin sarakevektorit ovat muotoa Oletetaan, että sarakevektorilta QA = [ Qā 1 Qā n ] v 1 v = v n haluttaisiin nollata n k viimeistä komponenttia kertomalla sitä Householderin matriisilla Q Tutkitaan, miten päästään tulokseen Qx = w, jossa w olisi tarkalleen muotoa w = v 1 v k 1 s 0 0 C n Kun Householderin matriisilla Q kerrotaan vektoria v C n, saadaan ) Qv = (I 2uu v = v 2uu v u u u u Merkitään lyhyemmin 2u v u u = γ, jolloin Qv = v γu Jos haluttaisiin päätyä tulokseen Qv = w, olisi oltava v v 1 u 1 1 v v Qv = v γu = k 1 u γ k 1 k 1 = s v k u k 0 v n u n 0 Huomataan, että edelliseen tulokseen voidaan päätyä, kun seuraavat neljä ehtoa ovat voimassa: (1) u i = 0, kun i = 1,, k 1, (2) γ = 1, (3) v k u k = s,

33 HOUSEHOLDERIN MUUNNOS 31 (4) u i = v i, kun i = k + 1,, n Householderin matriisissa esiintyvän vektorin u C on oltava muotoa 0 0 u = v k s v k+1 v n Vielä on määritettävä s sellaiseksi, että γ = 1 Asetetaan s = v k vk v k 2 + v k+1 2 + + v n 2 Koska v k R ja v k 2 + v k+1 2 + + v n 2 R, pätee selvästi Tällöin saadaan Lisäksi Toisaalta s = v k vk v k 2 + v k+1 2 + + v n 2 s 2 = ss = v kv k v k 2 ( vk 2 + v k+1 2 + + v n 2) = v k 2 v k 2 ( vk 2 + v k+1 2 + + v n 2) = v k 2 + v k+1 2 + + v n 2 R v k s = v kv k vk v k 2 + v k+1 2 + + v n 2 = v k 2 vk v k 2 + v k+1 2 + + v n 2 = v k v k 2 + v k+1 2 + + v n 2 v k s = v kv k vk v k 2 + v k+1 2 + + v n 2 = v k 2 vk v k 2 + v k+1 2 + + v n 2 = v k v k 2 + v k+1 2 + + v n 2 = v k s

32 3 HESSENBERGIN MATRIISI Edellisten perusteella saadaan Toisaalta Tällöin u u = (v k s)(v k s) + v k+1 2 + + v n 2 = (v k s)(v k s) + v k+1 2 + + v n 2 = v k 2 v k s v }{{} k s + s 2 + v k+1 2 + + v n 2 =v k s = v k 2 + v k+1 2 + + v n 2 + s 2 v }{{} k s v k s = s 2 = 2 s 2 2v k s u v = (v k s)v k + v k+1 2 + + v n 2 = (v k s)v k + v k+1 2 + + v n 2 = v k v k sv k + v k+1 2 + + v n 2 = v k 2 + v k+1 2 + + v n 2 v k s = s 2 v k s γ = 2u v u u = 1, jolloin ehdossa (2) asetettu vaatimus komponentille s C pätee Jos Householderin matriisi Q = [q ij ] on määritetty edellä käsitellyllä tavalla, matriisilla QA = [b ij ] on halutuissa sarakkeissa halutuissa alkioissa nollat Kun matriisille A etsitään Hessenbergin muotoa, uuden matriisin on oltava similaarinen alkuperäisen matriisin kanssa Koska Householderin matriisille pätee Q = Q 1, matriisi QAQ on similaarinen matriisin A kanssa Mutta onko matriisilla QAQ myös halutuissa alkioissa nollat kuten matriisilla QA? Hessenbergin matriisin ylämuodossa on ensimmäisessä sarakkeessa n 2 viimeistä alkiota nollia ja toisessa sarakkeessa n 3 viimeistä alkiota nollia Yleisesti voidaan ilmaista, että kokoa n n olevan Hessenbergin matriisin k sarakkeen n k 1 viimeistä alkiota ovat nollia Muokattaessa saraketta k on vektorilla u C n nollat k ensimmäisessä sarakkeessa Havaitaan, että muodostettava Householderin matriisi lohkomuodossa ilmaistuna on tällöin (6) Q = [ Ik 0 0 U jossa I k on kokoa k k oleva yksikkömatriisi ja U kokoa (n k) (n k) oleva matriisi, jonka kaikki alkiot u ij voivat olla nollasta poikkeavia Kun matriisin A n n ensimmäistä saraketta muokataan, matriisien Q ja ],

A tulo on muotoa 33 HOUSEHOLDERIN MUUNNOS 33 b 11 b 12 b 1n b 21 b 22 QA = 0 0 b n2 b nn Yleisesti kirjoittetuna matriisin QAQ = [c ij ] ensimmäisen sarakkeen alkio c i1 on matriisitulon määritelmän mukaan n c i1 = b ij q j1 kaikilla i = 1,, n j=1 Matriisille QA pätee b i1 = 0 kaikilla i = 3,, n Toisaalta q j1 = 0 kaikilla i = 2,, n Täten c i1 = 0 kaikilla i = 3,, n Näin ollen matriisi QAQ on muotoa c 11 c 12 c 1n c 21 c 22 c 2n QAQ = 0, 0 c n2 c nn jolloin silläkin on ensimmäisessä sarakkeessa halutuissa alkioissa nollat Tarkastellaan yleisempää tapausta, jossa matriisilla A n n on nollattu k 1 ensimmäisessä sarakkeessa halutut alkiot Hessenbergin muodon kannalta Seuraavaksi matriisilta halutaan nollata sarakkeesta k viimeiset n k 1 alkiota Muodostetaan aiemmin esitetyllä tavalla Householderin matriisi (6) Yleisesti kirjoitettuna matriisin QAQ sarakkeen k alkio c i1 on matriisitulon määritelmän mukaan n c ik = b ij q jk kaikilla i = 1,, n Matriisille QA pätee j=1 b i1 = b i2 = = b ik = 0 kaikilla i = k + 2,, n Toisaalta q j1 = 0 kaikilla i = k + 1,, n Täten c ik = 0 kaikilla i = k + 2,, n Tällöin matriisin QAQ sarakkeen k viimeiset n k 1 alkiota ovat nollia Havaitaan, että muokattaessa matriisia A Hessenbergin muotoon matriiseilla QA ja QAQ on molemmilla halutuissa alkioissa nollat Householderin muunnoksessakin lähdetään nollaamaan matriisilta sarake kerrallaan halutut alkiot Householderin matriisilla Q 1 nollataan

34 3 HESSENBERGIN MATRIISI alkioita ensimmäisestä sarakkeesta, jolloin matriisi Q 1 AQ 1 =: B 1 on similaarinen matriisin A kanssa Householderin matriisilla Q 2 nollataan alkioita toisesta sarakkeesta, jolloin Q 2 Q 1 AQ 1 Q 2 =: B 2 on similaarinen matriisin A kanssa Nollataan tarvittavat alkiot aina (n 2) sarakkeeseen asti Yleisesti jokainen matriisi B j (jossa i = 1,, n 2) on tällöin similaarinen matriisin A kanssa Jos sarakkeella j on jo valmiiksi halutuissa alkioissa nollat, asetetaan yksinkertaisesti Q j = I Esimerkki 34 Etsitään Hessenbergin ylämuoto Householderin muunnoksen avulla matriisille A = 1 3 4 3 1 1 4 1 1 Koska matriisi on 3 3-muotoa, se saadaan Hessenbergin ylämuotoon nollaamalla ensimmäisen sarakkeen viimeinen alkio Merkitään nyt jolloin s = v = 1 3, 4 v 2 2 + v 2 3 = 3 2 + 4 2 = 5 tällöin u 2 = v 2 s = 3 5 = 2, jolloin saadaan Householderin matriisissa esiintyväksi vektoriksi u = 0 2 4 Nyt u u = 12 ja uu = 0 2 [ 0 2 4 ] = 0 0 0 0 4 8 4 0 8 16 Householderin matriisiksi saadaan tällöin Q = I 2uu u u = 1 0 0 0 3 4 5 5 0 4 3 5 5 Nyt mikä on Hessenbergin muodossa QAQ = 1 5 0 5 49 7, 25 7 0 25 25 1 25