B2 Jouni Sampo 4. maaliskuuta 2013
Sisältö 1 Johdanto 2 1.1 Matriisin käsite.................................... 2 1.2 Mihin matriiseja tarvitaan?............................. 2 1.3 Matriiseihin liittyvät peruskäsitteet......................... 2 2 Matriisien laskutoimitukset 4 2.1 Matriisien yhteenlasku ja kertominen skalaarilla.................. 4 2.2 Matriisien kertolasku................................. 5 2.2.1 Lineaarimuunnokset ja matriisitulo..................... 6 3 Lineaariset yhtälöryhmät 7 3.1 Gaussin eliminointi.................................. 8 3.2 Lineaarinen riippumattomuus, vektoriavaruus ja matriisin aste.......... 11 3.2.1 Lineaarinen riippumattomuus........................ 11 3.2.2 Virittäjäjoukko ja kanta........................... 11 3.3 Lineaariset yhtälöryhmät: Ratkaisujen yleisiä ominaisuuksia........... 12 3.4 Käänteismatriisi.................................... 13 4 Determinantit 15 4.1 Determinantin määritelmä.............................. 15 4.2 Determinanttien perusominaisuuksia........................ 16 4.3 Cramerin sääntö................................... 17 5 Ominaisarvot ja ominaisvektorit 17 5.1 Määritelmä ja laskenta................................ 17 5.2 Matriisien ja ominaisvektorien ominaisuuksia.................... 18 5.3 Diagonalisointi ja neliömuodot............................ 20
1 Johdanto 1.1 Matriisin käsite Matriisilla tarkoitetaan luku tai funktiojoukkoa, joka on järjestetty hakasulkujen (tai kaarisulkujen) ympäröimäksi suorakulmaiseksi taulukoksi. Näitä lukuja tai funktioita kutsutaan matriisin alkioiksi tai elementeiksi. Esimerkkejä matriiseista: [ 4 28 1 11 0.27 0 ], [ 4 7 ], [ a1 a 2 a 3 ], [ e x sin x e 2x x 2 ] (1) 1.2 Mihin matriiseja tarvitaan? Tiedon kompaktiin ja tehokkaaseen esittämiseen, analysointiin ja muokkaukseen. Erityisesti lineaariset yhtälöryhmät, esim. { 5x 2y + z = 0 3x + 4z = 0 (2) on kätevää esittää kerroinmatriisin avulla. Sovelluksia esimerkiksi: A = [ 5 2 ] 1 3 0 4 (3) sähkö, tie ym. verkostojen mallintaminen säätötekniikka kemialliset reaktiot tilastollisen tiedon analysointi mekaniikka tietokonegrafiikka lukuisia sovelluksia eri fysiikan aloilla 1.3 Matriiseihin liittyvät peruskäsitteet Termillä rivi viitataan lyhyesti matriisin vaakariviin ja termillä sarake matriisin pystyriviin. Yleensä matriisia merkitään isolla kirjaimella (A, B, C jne. tai kirjoittamalla yleinen matriisielementti haka- tai kaarisulkuihin: A = [a jk ]. Ensimmäinen indeksi ilmoittaa rivin ja toinen sarakkeen, josta kyseinen elementti löytyy. a 11 a 12 a 1n a 21 a 22 a 2n A = [a jk ] = (4)... a m1 a m2 a mn Matriisi, jossa on m riviä ja n saraketta on m n matriisi. Mikäli matriiisin A elementit ovat reaalilukuja niin voidaan merkitä A R m n. Tärkeitä erikoistapauksia: 2
Jos m = n, on kyseessä n n neliömatriisi. Neliömatriisin diagonaali, jolla ovat alkiot a 11, a 22,..., a nn on matriisin päälävistäjä. Jos m = 1 ja n > 1 kutsutaan matriisia yleensä rivivektoriksi tai vaakavektoriksi ja merkintänä käytetään ison kirjaimen sijasta pientä kirjainta, esim. v = [2 4 1]. Jos n = 1 ja m > 1 kutsutaan matriisia yleensä sarakevektoriksi tai [ pystyvektoriksi ] ja b1 merkintänä käytetään ison kirjaimen sijasta pientä kirjainta, esim b = Matriisin A R m n alimatriisi (tai osamatriisi, engl. submatrix) saadaan jättämällä A:sta rivejä ja/tai sarakkeita pois. Esim. 2 3 matriisin [ ] a11 a A = 12 a 13 (5) a 21 a 22 a 23 2 2 alimatriisit ovat [ ] a11 a 12, a 21 a 22 [ ] a11 a 13 a 21 a 23 ja [ ] a12 a 13 a 22 a 23 Yo. matriisilla A on myös kaksi 1 3, kolme 2 1, kuusi 1 2 ja kuusi 1 1 alimatriisia. Pienemmistä matriiseja (erityisesti vektoreita) yhdistetään usein myös suuremmiksi matriiseiksi esim. vaakavektoreista a i = [ a i1 a i2 a in ], i = 1,..., m (7) voidaan koota m n matriisi Samoin esim. pystyvektoreista voidaan koota n x matriisi a 1 a 2 a m A =. b i = [ b 1i b 2i b ni ] T, i = 1,..., m (9) B = [ b 1, b 2,..., b m ] Esitysmuodossa (10) jätetään pilkut usein myös merkitsemättä tai sitten vektorit b i erotellaan väli- tai katkoviivalla. Vektorin a transpoosi a T saadaan vaihtamalla pystyvektori vaakavektoriksi tai päinvastoin. Vastaavasti matriisin A transpoosi A T saadaan vaihtamalla matriisin rivit ja sarakkeet keskenään: a 11 a 21 a m1 A T a 12 a 22 a m2 = [a kj ] = (11)... a 1n a 2n a mn Jos A T = A, matriisi A on symmetrinen. Symmetriset matriisit ovat varsin yleisiä sovelluksissa. Jos A T = A, matriisi A on vinosymmetrinen (skew symmetric). b 2 (6) (8) (10) 3
Neliömatriisi, jonka päälävistäjän yläpuolella olevat alkiot ovat nollia, on alakolmiomatriisi. Esim. 1 0 0 2 3 0 (12) 5 0 2 Neliömatriisi, jonka päälävistäjän alapuolella olevat alkiot ovat nollia, on yläkolmiomatriisi. 1 6 1 0 3 2 (13) 0 0 2 Molemmissa tapauksessa päälävistäjän alkiot voivat olla tai olla olematta nollia. Neliömatriisi A = [a jk ], jonka päälävistäjän ylä ja alapuoliset alkiot ovat nollia, ts. a jk = 0, kun j k, on diagonaalimatriisi. Diagonaalimatriisi, jonka päälävistäjän alkiot ovat kaikki ykkösiä, on identtinen matriisi eli yksikkömatriisi, merkitään I n tai I. Esim. 3 3 yksikkömatriisi: 1 0 0 I = 0 1 0 (14) 0 0 1 Matriisien yhtäsuuruus: Matriisit A ja B ovat yhtäsuuria, ts. A = B, jos niiden kaikki alkiot ovat yhtäsuuria, eli a jk = b jk kaikilla j:n ja k:n arvoilla. 2 Matriisien laskutoimitukset 2.1 Matriisien yhteenlasku ja kertominen skalaarilla Yhteenlasku: Jos A = [a jk ] ja B = [b jk ], niin A + B = [a jk + b jk ] (15) Skalaarilla kertominen: Olkoon A = [a jk ] m n matriisi ja c skalaari (yleensä reaali- tai kompleksiluku). Tällöin ca = [ca jk ] (16) Kuten yleensäkin, luvulla 1 kertominen voidaan esittää lyhyesti: ( 1)A = A ja yleisemmin ( k)a = ka. Negatiivisten skalaarien avulla matriisien vähennyslasku tulee määriteltyä myös luonnollisella tavalla: A + ( B) = A B. erotus). Nollamatriisi: m n matriisi on m n nollamatriisi, jos kaikki sen elementit ovat nollia, merkitään 0 (tai 0, jos ei ole vaaraa sekoittaa nollamatriisia reaalilukuun). Toisinsanoen A = B jos ja vain jos A B on nollamatriisi. Edellisistä määritelmistä seuraa selvästi mm. seuraavat tutut ominaisuudet: A + B = B + A (17) (U + V) + W = U + (V + W) (18) 4
A + 0 = A (19) A + ( A) = 0 (20) c(a + B) = ca + cb (21) (c + k)a = ca + ka (22) c(ka) = (ck)a (23) 1A = A (24) Huom. Matriisien on oltava samankokoisia, jotta yhteenlasku olisi määritelty. Selvästi pätee myös että Esimerkki 2.1. Olkoon A = (A + B) T = A T + B T (25) (ca) T = ca T (26) [ ] 1 3 2, B = 1 2 3 [ ] 0 4 0. (27) 1 2 1 Laske 4A, A + B, 2B 2A, A T +BT, A B T, tai perustele miksi lasku ei ole määritelty. Määritä a siten että a 2 A + 2aA + A = 0 2.2 Matriisien kertolasku Tähän loppuikin sitten samankaltaisuus matriisien ja reaalinumeroiden välisten operaatioiden välillä, matriisin kertolasku määritellään seuraavasti: m n matriisin A = [a jk ] ja r p matriisin B = [b jk ] tulo C = AB on määritelty jos ja vain jos r = n (B:n rivien määrä = A:n sarakkeiden määrä) ja määritellään m p matriisina C = [c jk ], jonka elementit ovat c jk = n a jl b lk = a j1 b 1k + a j2 b 2k + + a jn b nk (28) l=1 Huom. Vaikka olisi AB = 0, niin välttämättä ei ole A = 0, B = 0 tai BA = 0. Esim. [ ] [ ] [ ] [ ] 1 1 1 1 1 1 1 1 vs. 2 2 1 1 1 1 2 2 (29) Yleisessä tapauksessa siis AB BA, esim. [ ] [ ] 9 3 1 4 vs. 2 0 2 5 [ ] [ ] 1 4 9 3 2 5 2 0 (30) Intuitiivisesti selvempiä matriisitulon ominaisuuksia ovat: (ka)b = (kab) = A(kB) (31) A(BC) = (AB)C (32) (A + B)C = AC + BC (33) C(A + B) = CA + CB (34) Vähemmän intuitiivinen taasen on ominaisuus (AB) T = B T A T (35) 5
Esimerkki 2.2. A = [ ] 1 3 2, B = 1 2 3 [ ] 0 4 0. (36) 1 2 1 Laske AB, BA, A T B, AB T, A T B T ja B T A T tai perustele miksi kertolasku ei ole määritelty. Esimerkki 2.3. Jos A on 4 5 matriisi ja B on 3 4 matriisi niin minkä kokoisia täytyy matriisien C ja D olla jotta lauseke AC + DB olisi määritelty? Matriisien tulon määritelmästä seuraa: Jos a ja b ovat n:n alkion pystyvektoreita, a T on vaakavektori ja vektorien kertolaskun tulos on 1 1 matriisi, ts. reaaliluku. Tätä lukua kutsutaan vektorien a ja b sisätuloksi tai pistetuloksi, merkitään a b: b 1 a b = a T b = [a 1 a n ]. = 2.2.1 Lineaarimuunnokset ja matriisitulo b n n a l b l = a 1 b 1 + + a n b n. (37) Vektoreita x = [x 1,..., x n ] on tavallista ajatella avaruuden R n pisteenä (mikäli tietysti luvut x i ovat reaalilukuja). Eräs tärkeä matriisien sovellus on pisteen x R n kuvaaminen pisteeksi y R m lineaarisella muunnoksella. Esimerkiksi tapauksessa jossa m = n = 2 tämä tarkoittaa että kuvaus { y 1 = a 11 x 1 + a 12 x 2 y 2 = a 21 x 1 + a 22 x 2 (38) voidaan kirjoittaa matriisimerkinnöin y = Ax. Matriisiesityksen mahdollistanut oleellinen ominaisuus yhtäläryhmässä (38) on se että yhtälöt ovat lineaarisia. Tälläisten yhtälöryhmien käsittely ja analysointi on yleensä oleellisesti helpompaa matriisimuoto käyttämällä. Otetaan yksinkertainen esimerkki: Jos pisteet (y 1, y 2 ) ja (x 1, x 2 ) on sidottu toisiinsa yhtälöryhmän (38) mukaisesti ja toisaalta (x 1, x 2 ) ja (w 1, w 2 ) on sidottu toisiinsa yhtälöiden { x 1 = b 11 w 1 + b 12 w 2 x 2 = b 21 w 1 + b 22 w 2 (39) avulla niin tällöin (y 1, y 2 ) saadaan suoraan pisteen (w 1, w 2 ) avulla sijoittamalla (39) (38):een: { y 1 = a 11 (b 11 w 1 + b 12 w 2 ) + a 12 (b 21 w 1 + b 22 w 2 ) (40) y 2 = a 21 (b 11 w 1 + b 12 w 2 ) + a 22 (b 21 w 1 + b 22 w 2 ) Toisaalta tämä voitaisiin esittää kompaktisti matriisien avulla: l=1 y = Ax = ABw. (41) Esimerkki 2.4. Matriisi A (jonka koko on 2 2) kuvaan pisteen x R 2 pisteeksi y = Ax. Määritä matrsiisin A alkiot kun tiedetään että [ ] [ ] [ ] [ ] 0 1/ 2 = A 1 1/ 1 1/ 2, = A 2 0 1/. (42) 2 Jos nyt w = x 2y ja tiedetään että Ax = [1, 2] T = y niin mitä on Aw? 6
3 Lineaariset yhtälöryhmät Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a 21 x 1 + + a 2n x n = b 2 (43) a m1 x 1 + + a mn x n = b m Esim. kahden yhtälön ja kolmen tuntemattoman yhtälöryhmä: { 5x 1 + 2x 2 x 3 = 4 Lukuja a jk kutsutaan ryhmän kertoimiksi. x 1 4x 2 + 3x 3 = 6 Jos kaikki luvut b i ovat nollia, kyseessä on homogeeninen yhtälöryhmä. Jos ainakin yksi b i on nollasta poikkeava, on kyseessä epähomogeeninen ryhmä. Yhtälöryhmän ratkaisu on lukujoukko x 1,, x n, joka toteuttaa kaikki m yhtälöä. Yhtälöryhmän ratkaisuvektori on vektori x, jonka komponentit muodostavat ryhmän ratkaisun. Jos yhtälöryhmä on homogeeninen, on olemassa ainakin triviaaliratkaisu x 1 = 0,, x n = 0. Erityisen kiinnostavia kysymyksiä Kuinka yhtälöryhmä ratkaistaan algoritmillisesti? (Muutama tapa esitetään tällä kurssilla) Ratkaisujen määrä: Onko ratkaisua? Jos on, niin millaisia erilaista ratkaisua löytyy? (tämän kurssin ydinainesta) Kuinka herkkä ratkaisu on matriisin lukujen a ij tai b i muutoksille, eli tilanteelle jossa joko systeemi muuttuu tai häiriöitä esiintyy? (käsitellään hieman myös tällä kurssilla) Kuten edellisessä kappaleessa lineaarinen muunnos, yhtälöryhmä (43) voidaan kirjoittaa matriisien avulla: Ax = b, (45) missä kerroinmatriisi A = [a jk ] on m n matriisi a 11 a 12 a 1n a 21 a 22 a 2n A =... a m1 a m2 a mn (44) (46) ja pystyvektorit x 1 x =. x n b = b 1. b m (47) 7
Matriisi a 11 a 12 a 1n b 1 a 21 a 22 a 2n b 2 à =.... a m1 a m2 a mn b m (48) on yhtälöryhmän lisätty matriisi (augmented matrix). Matriisi à sisältää yhtälöryhmän kaikki annetut luvut ja määrittää siten yhtälöryhmän täydellisesti. Yhtälöryhmän ratkaisemiseksi tarvitsee näin ollen tarkastella ainoastaan lisättyä matriisia. Käytännön resepti: Gaussin eliminointi. Esimerkki 3.1. Kirjoita yhtälöryhmä { 5x 1 + 2x 2 x 3 = 4 x 1 4x 2 + 3x 3 = 6 (49) matriisimuodossa ja esitä myös yhtälöryhmää kuvaava lisätty matriisi. 3.1 Gaussin eliminointi Tässä kappaleessa esitetään eräs yksinkertainen algoritmi, Gaussin eliminaatio, lineaarisin yhtälöryhmän ratkaisemiseksi. Tämä algoritmi ei ole erityisen tehokas (vaatii paljon laskutoimituksia) mutta antaa tarkan ratkaisun ja on käyttökelpoinen pieniä yhtälöryhmiä käsin ratkaistaessa. Yleisesti: yhtälöryhmän ratkaisut pysyvät samoina, jos tehdään perusoperaatiot yhtälöille: Yhtälöiden järjestys vaihdetaan (ei vaikuta ratkaisuihin) Yksi tai useampi yhtälö kerrotaan nollasta poikkeavalla vakiolla Yhtälö lisätään (puolittin) toiseen yhtälöön. Gaussin eliminointi käyttää näitä operaatioita lineaariseen yhtälöryhmään. Jos yhtälöryhmä kuvataan lisätyn matriisin avulla niin operaatiot on nopeampi suorittaa koska x i symboleja ja ylimääräisiä "+"symboleja ei tarvitse kirjoittaa näkyviin. Vastaavat lineaarisenvyhtälöryhmän käsittelyn perusoperaatiot lisätylle matriisille: Vaihdetaan kaksi riviä keskenään Yksi tai useampi rivi kerrotaan nollasta poikkeavalla vakiolla Lisätään vakiolla kerrottu rivi toiseen riviin Gaussin eliminaation tarkoituksena on muokata yhtälöryhmän lisättymatriisi niinkutsuttuun porrasmuotoon. 1. Vähennetään ylin rivi sopivalla kertoimella kerrottuna kaikista muista riveistä. Kerroin valitaan aina siten että ensimmäisen sarakkeeseen tulee nolla. Tämän toimenpiteen jälkeen ensimmäisessä sarakkeessa on ainoastaan ylimmällä rivillä nollasta poikkeava alkio. 2. Vähennetään toinen rivii sopivalla kertoimella kerrottuna kaikista alapuoleisista riveistä. Kerroin valitaan aina siten että kullakin rivillä toiseen sarakkeeseen (lävistäjän alapuolella) tulee nollia. 3. Jatketaan vastaavasti kunnes lävistäjän alapuolella on pelkkiä nollia. 8
4. Ratkaistaan alimmalta riviltä viimeisen muuttujan arvo ja sijoitetaan se toiseksi alimpaan yhtälöön (riviin). 5. Ratkaistaan toiseksi alimmalta riviltä (yhtälöstä) toiseksi viimeisen muuttujan arvo ja sijoitetaan se kolmanneksi alimpaan yhtälöön (riviin). Jatketaan muuttujen ratkaisua tällä tavalla kunnes kaikki muuttujat on ratkaistu. HUOM! Edellisessä algoritmissa voi tulla välillä vastaan tilanne jossa ei voida edetä koska lävistäjällä on jossain vaiheessa lukuarvo 0. Tällöin voidaan toimia seuraavasti: a) Jos kyseisessä sarakkeessa on lävistäjän alapuolella vielä nollasta poikkeavia arvoja, vaihdetaan rivejä keskenään. b) Jos lävistäjäalkio ja kaikki sen alapuolella ovat nollia niin siirrytään seuraavaan sarakkeeseen. Jotta tällöin algoritmissa voitaisiin puhua vielä lävistäjäalkioista, pitää "unohtaa"matriisin ensimmäinen saraka (jota ei muutenkaan enää tarvita mihinkään) ennen vaiheita 4 ja 5. Tätä "lävistäjäalkiota"kutsutaankin yleensä tukialkioksi". Huomionarvoista on myös että mikä tahansa rivi voidaan missä tahansa vaiheessa kertoa millä tahasa nollasta poikkeavalla luvulla: näin kannattaa tehdä joskus esim. murtolukujen välttämiseksi tai algoritmin numeerisen stabiilisuuden parantamiseksi (ei käsitellä tällä kurssilla). Esimerkki 3.2. Olkoon x R 3 ja 1 0 4 A = 2 0 3 (50) 1 2 1 a) Ratkaise Gaussin eliminoinnilla yhtälöryhmä Ax = 0. b) Etsi ne vektorit x R 3 joille Ax = x. Edellistä algoritmia voidaan käyttää myös tapauksissa joissa muuttujia on enemmän kuin yhtälöitä. Tässä tapauksessa (mikäli ratkaisua on ylipäätään olemassa) jotkut luvuista x j jäävät varmasti vapaasti valittaviksi. Ratkaisuja voi siis olla äärettömän monta. Esimerkiksi kolmen muuttujan (x 1, x 2 ja x 3 ) tapauksessa voidaan sanoa että yhtälörymän ratkaisuiksi kelpaavat (x 1, x 2, x 3 ) pisteet muodostavat jonkin seuraavista a) tyhjän joukon (eli ei ole olemassa ratkaisua) b) yksittäisen pisteen avaruudessa R 3 c) suoran avaruudessa R 3 d) tason avaruudessa R 3 (melko harvinainen tapaus) Esimerkki 3.3. Yhtälö 1 0 4 1 2 0 3 x = 1 (51) 1 2 1 a kuvaa erästä prosessia jossa x on alkutuotteiden määrä ja oikean puolen vektori ilmaiseen haluttujen lopputuotteiden määrään. Millä parametrin a arvoilla yhtälöllä a) on yksi ratkaisu? 9
a) ei ole yhtään ratkaisua? c) on ääretön määrä ratkaisuja? Esimerkki 3.4. Tutkitaan yhtälöryhmää Ax = b. Yhtälöryhmää kuvaava lisätty matriisi à = [A b] voidaan Gaussin reduktiolla muokata porrasmatriisimuotoon (katso edelliset harjoitukset). Merkitään näin saatua porrasmatriisia symbolilla B. Tutkitaan viittä erilaista yhtälöryhmää : (i) B = [ 2 4 0 0 2 1 ], (ii) B = [ ] 2 4 0 (iii) B = 0 0 1 2 4 0 1 1 B = 0 0 1 1 0 0 0 0 2 4 0 0 0 0 0 Kussakin tapauksessa vastaa seuraaviin kysymyksiin: 2 4 0 2 2 4 0 1 0 0 0 0 0, (iv) B = 0 0 1 1 1, (v) 0 0 0 0 0 0 0 0 0 a) Onko yksikään edellisessä kohdassa tutkituista yhtälörymistä homogeeninen? Jollei, niin kuinka matriisi B muuttuisi jos alkup yhtälöryhmä olisi homogeeninen (mutta A ei muuttuisi)? b) Ratkaise matriisin B kuvaama htälöryhmä. Mikäli mahdollista, anna ratkaisu muodossa x = b + c 1 v 1 +... c k v k, missä c i R (eli etsi vektorit b ja v i ). c) Tulkitse geometrisesti edelliset ratkaisut kohtien (i)-(iii) matriiseille. d) Ratkaise vastaavat homogeeniset yhtälöryhmät. Tulkitse ratkaisut geometrisesti kohdissa (i)-(iii). Kappaleen lopuksi esittelemme vielä hieman kehittyneen version edellä esitetystä algoritmista: Gaussin-Jordan eliminaation. Tässä algoritmissa suoritetaan edellisen algoritmin vaiheen 3 jälkeen seuraavat askeleet 1. "nollataan"viimeisen "ei nolla"rivin ensimmäisen nollasta poikkeavan alkion (n.k. tukialkion) yläpuolelta kaikki luvut lisäämällä kyseistä riviä yläpuoleisiin riveihin sopivilla kertoimilla kerrottuna. 2. Siirrytään seuraavaksi ylimpään "ei nolla"riviin ja toistetaan edellinen. Jatketaan niin kauan että kaikki rivit on käyty läpi. Tällöion saatavassa porrasmatriisissa on yleensä huomattavasti enemmän nollia ja alkuperäisen algoritmin vaiheet 4 ja 5 on nopeampi suorittaa. Lisäksi usein Gaussin tai Gauss-Jordanin eliminaatiossa muutetaan ensin arvoon 1 tukialkio, eli se lisättävän rivin alkio jonka alapuoleisia alkioita viedään nollaksi. Tämä tapahtuu yksinkertaisesti kertomalla koko kyseinen rivi sopivalla luvulla. Esimerkki 3.5. Ratkaise Gauss-Jordan eliminaatiolla seuraavat yhtälöryhmät 3x + 2y 6z = 6 2x 1 x 2 + 1x 3 = 1 (a) 5x + 7y 5z = 6 (b) 3x 1 + 2x 2 4x 3 = 4 x + 4y 2z = 8 6x 1 + 3x 2 3x 3 = 2 10
3.2 Lineaarinen riippumattomuus, vektoriavaruus ja matriisin aste Kappaleen otsikon käsitteet ovat yleisiä eikä niiden käyttö rajoitu vain yhtälöryhmien yhteyteen. Tämän kurssin aihepiirissä nämä ovat erityisesti hyödyllisiä yhtälöryhmien ja niiden ratkaisujen ominaisuuksien kuvaamisessa. 3.2.1 Lineaarinen riippumattomuus Vektorien a 1,, a m lineaarikombinaatio on muotoa missä c 1,, c m ovat skalaareja (tässä tapauksessa reaalilukuja). c 1 a 1 + + c m a m, (52) Vektorit a 1,, a m ovat lineaarisesti riippumattomia, jos ja vain jos c 1 a 1 + c 2 a 2 + + c m a m = 0 c 1 = c 2 = = c m = 0 (53) Jos lineaarikombinaatio on nolla siten, että jokin kertoimista on nollasta poikkeava, vektorit ovat lineaarisesti riippuvia. Tällöin ainakin jokin niistä voidaan ilmaista toisten lineaarikombinaationa. Matriisin A = [a jk ] lineaarisesti riippumattomien rivien tai sarakkeiden maksimimäärä on matriisin A aste (rank), merkitään ranka. Edellä esitetyssä matriisin asteen määritelmä pitää sisällään seuraavan tuloksen: matriisin A ja sen transpoosin A T aste on sama. Tämä tulos ei ole millään muotoa triviaali ja useissa lähteissä matriisin asteen määritelmä pitääkin sisällään vain maininnan joko sarakkeesta tai rivistä, ei molemmista. On täysin sovelluskohtaista kiinnostaako matriisin lineaarisesti riippumattomien rivi- vai sarakevektorien määrä. Gaussin eliminaation yhteydessä esitetyt perusoperaatiot (rivien vaihto etc) eivät muuta matriisin astetta. Matriisin aste saadaankin siis eliminaation lopputuloksena saatavan porrasmatriisin ei nollarivien lukumääränä (osaatko perustella miksi?). Edellisistä määritelmisät ja ominaisuuksista seuraa: p rivivektoria(sarakevektoria) a 1,, a p ovat lineaarisesti riippumattomia, jos matriisin, jonka rivit(sarakkeet) ovat a 1,, a p aste on p; jos aste on pienempi kuin p, ne ovat vektorit lineaarisesti riippuvia. Esimerkki 3.6. a) Tutki ovatko vektorit [ 1 0 3 ], [ 3 1 4 ] ja [ 2 1 1 ] lineaarisesti riiippumattomia. b) Olkoon v 1 R 3 ja v 2 R 3 lineaarisesti riippumattomia vektoreita. Mikä ehto vektorin v 3 R 3 täytyy toteuttaa jotta se olisi lineaarisesti riippuva vektoreista v 1 ja v 2? 3.2.2 Virittäjäjoukko ja kanta Oletetaan että a 1,, a m R n. Näiden vektorien virittämä vektoriavaruus on kaikkien mahdollisten lineaarikombinaatioiden joukko: m V = span{a 1,, a m } = {v R n v = c i a i, c i R} (54) 11 i=1
Yleisesti ei tarvitse rajoittua tapaukseen a i R n ja c i R vaan esimerkiksi laajennus kompleksilukuihin on usein tarpeellinen. Avaruuden V lineaarisesti riippumattomien vektorien maksimimäärä on V :n dimensio, merkitään dim(v ) Olkoon joukko S = {v 1, v 2,..., v n } avaruuden V vektoreita. Tällöin: Jos joukosta S löytyy m n lineaarisesti riippumatonta vektoria ja avaruuden V dimensio on m niin joukko S virittää avaruuden V. Jos joukon S vektorit ovat lineaarisesti riippumattomia ja avaruuden V dimension on n niin joukkoa S kutsutaan V :n kannaksi. Käytännössä edelliset tarkoittavat etät jos S virittää V :n niin mikä tahansa vektori v V voidaan esittää muodossa v = c 1 v 1 + c 2 v 2 + + c n v n, (55) missä kertoimet c i ovat vektorista v riippuvia vakioita. Mikäli S on V :n kanta niin e.m. kertoimet ovat yksikäsitteisiä, eli v vaihtuu varmasti jos yksikin kertoimista c i vaihtuu. Mikäli joukko S ei viritä avaruutta V niin (vektorista v riippuen) voi olla ettei sellaisia kertoimia c i löydy joilla yhtälö (??) olisi tosi. Esimerkki 3.7. Olkoon V = R n. Anna tapauksissa n = 2, n = 3 ja n = 4 esimerkki joukosta sarakevektoreista joka a) on avaruuden V kanta, b) virittää avaruuden V mutta ei ole sen kanta. Esimerkki 3.8. Millä vakion a arvoilla vektori [ a 2 4 ] kuuluu vektoreiden [ 1-3 5 ] ja [ 4-4 14 ] virittämään avaruuteen V? Lopuksi luettelemme vektoriavaruuden yleisiä ominaisuuksia (oletetaan, että a, b ja c kuuluvat V :hen ja k ja l ovat reaalilukuja): a + b = b + a (a + b) + c = a + (b + c) a + 0 = a a + ( a) = 0, k(la) = (kl)a 1a = a k(a + b) = ka + kb Vaikka tällä kurssilla käsitellään vain matriiseja joiden alkiot ovat kompleksi tai reaalilukuja, voisivat vektoriavaruuden alkiot ja/tai komponentit olla yleisesti myös muunlaisia otuksia, esim. funktioita. (56) 3.3 Lineaariset yhtälöryhmät: Ratkaisujen yleisiä ominaisuuksia Lineaarisella yhtälöryhmällä a 11 x 1 + a 12 x 2 + + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + + a 2n x n = b 2 a m1 x 1 + a m2 x 2 + + a mn x n = b m (57) eli Ax = b 12
1. on ratkaisuja jos ja vain jos r = rank(a) = rank(ã) 2. on täsmälleen yksi ratkaisu, jos r = n 3. on ääretön määrä ratkaisuja, jos r < n Homogeeninen lineaarinen yhtälöryhmä: a 11 x 1 + a 12 x 2 + + a 1n x n = 0 a 21 x 1 + a 22 x 2 + + a 2n x n = 0 a m1 x 1 + a m2 x 2 + + a mn x n = 0 (58) Triviaaliratkaisu x = 0 aina olemassa Ei triviaaliratkaisuja olemassa jos ja vain jos r = rank(a) < n Jos r < n, triviaali ja ei triviaaliratkaisut yhdessä muodostavat ratkaisuavaruuden, jonka dimensio on n r (ei päde epähomogeenisille yhtälöryhmille, osaatko sanoa miksi?) Ratkaisuavaruuden dimensio = A:n nulliteetti, merk. null(a). Pätee siis rank(a) + null(a) = n (59) Käytännössä null(a) on yhtälöryhmän ratkaisussa vapaiksi jäävien muuttujien lukumäärä (epähomogeenisen yhtälöryhmän tapauksessa sillä oletuksella että ratkaisua on ylipäätään olemassa). Esimerkki 3.9. Olkoon B matriisi joka saadaan kun matriisi A muokataan Gaussin eliminaatiolla porrasmatriisimuotoon. Määritä rank(a), null(a) sekä yhtälöryhmän Ax = 0 ratkaisuavaruuden dimensio (eli ratkaisussa vapaaksi jäävien muuttujien lukumäärä) kun 2 4 0 1 1 2 4 0 2 4 0 1 a) B = 0 0 1 1, b) B = 0 0 1 1 0 2 4, c) B = 0 0, d) B = 0 0 1. 0 0 0 2 0 0 0 0 0 2 4 0 0 0 0 0 0 0 0 0 0 0 Esimerkki 3.10. Olkoon B matriisi joka saadaan kun yhtälöryhmään Ax = b liittyvä lisätty matriisi à = [A b] muokataan Gaussin eliminaatiolla porrasmatriisimuotoon. Määritä rank(a), null(a) sekä yhtälöryhmän Ax = b ratkaisussa vapaaksi jäävien muuttujien lukumäärä kun 2 4 0 1 1 0 2 4 0 1 2 4 0 1 1 a) B = 0 0 1 1 1, b) B = 0 0 1 1 0 3 2 4 1, c) B = 0 0 1, d) B = 0 0 1 2. 0 0 0 2 0 0 0 0 3.4 Käänteismatriisi 0 0 0 2 4 0 0 0 0 0 0 0 Tarkastellaan neliömatriiseja n n matriisin A = [a jk ] käänteismatriisi A 1 on matriisi, jolle pätee 0 0 0 0 0 0 0 0 AA 1 = A 1 A = I (60) [ ] 3 1 Esimerkki 3.11. Olkoon A =. Muotoile lineaarinen yhtälöryhmä joka ratkaisemalla 2 4 saataisiin käänteismatriisi A 1. 13
Käänteismatriisi voidaan määrittää esim. Gauss Jordan eliminoinnilla. Idea: muodostetaan lisätty matriisi à = [A I] ja saatetaan se Gauss-Jordan eliminoinnilla muotoon [I K], jossa tällöin K = A 1. Myöhemmin esitetään menetelmä, jolla käänteismatriisin voi määrittää determinanttien avulla 1 1 1 Esimerkki 3.12. Määritä matriisille A = 0 0 1 käänteismatriisi. 5 5 0 Epähomogeenisella yhtälöryhmällä ei välttämättä ole ratkaisua. Niinpä käänteismatriisiakaan ei kaikille matriiseille voida määrittää. Jos A:lla on käänteismatriisi, kutsutaan matriisia ei singulaariseksi, muussa tapauksessa se on singulaarinen. Mihinkä käänteismatriisia sitten käytetään? Käänteismatriisin määritelmästä seuraa että jos käänteismatriisi A 1 on olemassa niin yhtälöryhmä Ax = b voidaan ratkaista kun yhtälö kerrotaa puolittain käänteismatriisilla: A 1 Ax = Ix = x, eli x = A 1 b. Siis jos kerroinmatriisin käänteismatriisi on valmiina, voidaan yhtälöryhmä ratkaista suoraan matriisin ja vektorin kertolaskuna. Jokainen vektorin x arvo voidaan lisäksi laskea toisistaan riippumatta, jolloin laskenta on mahdollista toteuttaa tehokkaasti esim. rinnakkaislaskentaa hyväksi käyttäen. Esimerkki 3.13. 1 1 1 2 Ratkaise yhtälöryhmä Ax = b käänteismatriisin avulla kun A = 0 0 1 ja b = 0 5 5 0 1 Muutamia käänteismatriisiin liittyviä ominaisuuksia: Käänteismatriisi on yksikäsitteinen. n n matriisilla A on käänteismatriisi jos ja vain jos rank A = n Käänteismatriisin käänteismatriisi: (A 1 ) 1 = A Tulon käänteismatriisi: (AC 1 ) = C 1 A 1 Edellisistä ominaisuuksista seuraa että A,B ja C ovat n n matriiseja, niin Jos rank A = n ja AB = AC, niin B = C Jos rank A = n, niin AB = 0 B = 0 Jos A on singulaarinen, niin ovat myös AB ja BA Esimerkki 3.14. Oletetaan että A ja B ovat ei-singulaarisia 3 3 matriiseja ja x, y ja b ovat 3 1 matriiseja (sarakevektoreita). a) Ratkaise x kun tiedetään että Ab + B(x y) = b. b) Millä ehdolla yhtälöllä Ab + B(x y) = x on i) yksikäsitteinen ratkaisu ii) ääretön määrä ratkaisuja? Esimerkki 3.15. Eräs tyypillinen sovellus käänteismatriisille on pienimmän neliösumman menetelmä jossa data-pisteisiin (x i, y i ), i = 1,..., n yritetään sovittaa mallia y = a 1 f 1 (x) + a 2 f 2 (x) + + a m f m (x) missä m n. Mikäli tällä ongelmalla on yksikäsitteinen ratkaisu niin se voidaan muotoilla yhtälöryhmän A T Aa = A T b ratkaisuna, missä matriisi A riippuu pisteistä x i ja funktioista f j ja vektori b riippuu y i pisteistä. Mitä tässä tapauksessa voidaan sanoa matriisin A T A asteesta? Muodosta matriisi A ja vektori b kun sovitettavana on lineaarinen malli y = a 1 x + a 2. 14
4 Determinantit Determinantti on neliömatriiseihin liittyvä käsite. Determinanttia voidaan käyttää mm. kun ratkaistaan yhtälöryhmiä, luokitella kriittisiä pisteitä, tutkitaan lineaarista riippuvuutta, määritetään käänteismatriisia, tehdään muuttujanvaihtoja, määritetään ristituloa jne. Determinantin sovelluskohteet ovat siis moninaiset, joskin ilman determinanttejakin voitaisiin pärjätä: determinantti on pohjimmiltaan laskusääntö jolla suhteellisen monimutkainen asia voidaan joskus esittää melko helposti muistettavasa ja toteutettavassa muodossa. 4.1 Determinantin määritelmä Käsitellään siis n n matriiseja, merkitään a 11 a 12 a 1n a 21 a 22 a 2n A =.... (61) a n1 a n2 a nn Tapauksessa n = 2 determinantti määritellään kaavalla deta = a 11 a 12 a 21 a 22 = a 11a 22 a 12 a 21 (62) Tämä 2 2 matriisin determinantin laskukaava on peruskaava joka löytyy useimmista kaavastoista. Myös 3 3 matriisin determinantin laskukaava löytyy usein jossain muodossa kaavastoista, esim. seuraava muoto on hyvin yleisesti käytetty: a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 = a 11 a 22 a 23 a 32 a 33 a 21 a 12 a 13 a 32 a 33 + a 31 a 12 a 13 a 22 a 23 (63) Huom. merkit: + - + Yhtälön oikealla puolella olevat alideterminantit saadaan poistamalla D:stä ko. determinantin kerrointa vastaava rivi ja sarake, esim. a 11 :n tapauksessa ensimmäinen rivi ja sarake jne. Tämä on itseasiassa erikoistapaus rekursiokaavasta jolla suurempien matriisien determinantti on kätevää määritellä: a 11 a 12 a 13 a 1n a 21 a 22 a 23 a 2n n = ( 1) j+k a jk M jk. k=1 a 31 a 32 a 33 a nn missä alideterminantti M jk on n 1:en kertaluvun determinantti, joka saadaan poistamalla matriisista j:s rivi ja k:s sarake. Indeksi j voi siis viitata mihin tahansa riviin. Tällä tavalla laskettua determinanttia kutsutaan rivin suhteen auki kehitetyksi. Determinantti voidaan myös kehittää auki sarakkeen suhteen: a 11 a 12 a 13 a 1n a 21 a 22 a 23 a 2n n = ( 1) j+k a jk M jk,. k=1 a 31 a 32 a 33 a nn lopputulos on sama. 15
0 1 0 1 Esimerkki 4.1. Määritä det(a) käyttämällä rekursiokaavaa kun A = 1 0 0 2 2 1 3 0. 0 4 0 2 Usein käytetään käsitettä liittotekijä (cofactor): a jk :n liittotekijä on C jk = ( 1) j+k M jk ja determinantti liittotekijöiden avulla: det(a) = a j1 C j1 + a j2 C j2 + + a jn C jn = a 1k C 1k + a 2k C 2k + + a nk C nk (64) 4.2 Determinanttien perusominaisuuksia Determinantilla on useita ominaisuuksia joista kaikki eivät ensisilmäyksellä ole välttämättä aivan itsestäänselviä listaamme näistä joitakin: Jos determinantin rivit ja sarakkeet vaihdetaan keskenään, determinantin arvo ei muutu. Jos determinantin jokin rivi tai sarake kerrotaan vakiolla k, determinantin arvo muuttuu k kertaiseksi. Jos jonkin rivin tai sarakkeen kaikki alkiot ovat nollia, on determinantin arvo = 0. Jos determinantin kaksi riviä tai saraketta vaihdetaan keskenään, vaihtuu determinantin merkki. Jos jokin rivi tai sarake saadaan toisesta vakiolla kertomalla, on determinantin arvo = 0. Jos jokin rivi tai sarake lisätään toiseen vakiolla kerrottuna, determinantin arvo ei muutu. n n matriiseille A ja B, det(ab) = det(ba) = det(a)det(b) (65) Jos determinantin alkiot ovat funktioita, determinantin D derivaatta D on missä D (j) saadaan derivoimalla j:nnen rivin alkiot. D = D (1) + D (2) + D (n), (66) Transpoosin determinantti: deta T = deta (67) Käänteismatriisin determinantti: deta 1 = 1 deta Neliömatriisin rivit (tai sarakkeet) ovat lineaarisesti riippumattomia jos ja vain jos matriisin determinantti ei ole nolla. Homogeenisen yhtälöryhmälle (jonka kerroinmatriisi on neliömatriisi) triviaaliratkaisu on ainut ratkaisu jos ja vain jos kerroinmatriisin determinantti ei ole nolla. Edellisiä ominaisuuksia käyttäen voidaan osoittaa että determinantin arvo voidaan laskea viemällä matriisi porrasmuotoon Gaussin eliminaatiota käyttämällä ja sen jälkeen kertomalla diagonaalialkiot keskenään. 1 0 1 Esimerkki 4.2. Määritä det(a) käyttämällä Gaussin eliminaatiota kun 1 1 0. 2 1 3 (68) 16
4.3 Cramerin sääntö Cramerin säääntöä voidaan käyttää tietyissä tilanteissa raktaisemaan lineaarinen yhtälöryhmä determinantteja hyväksi käyttäen: Jos n:n yhtälön ja n:n muuttujan yhtälöryhmällä a 11 x 1 + + a 1n x n = b 1 a 21 x 1 + + a 2n x n = b 2 (69) a n1 x 1 + + a nn x n = b n on nollasta poikkeava kerroin matriisin determinantti, eli D = det(a) 0, ryhmällä on täsmälleen yksi ratkaisu, joka saadaan kaavasta x 1 = D 1 D, x 2 = D 2 D,, x n = D n D, (70) missä D k on determinantti, joka saadaan D:stä korvaamalla k:s sarake alkioilla b 1,, b n. Cramerin säännön seurauksena saadaan kääteismatriisin laskemiselle determinanttien avulla sääntö A 11 A 21 A n1 A 1 = 1 deta [A jk] T = 1 A 12 A 22 A n2 deta... (71) A 1n A 2n A nn, missä A jk on a jk :ta vastaava liittotekijä. Huom. Cramerin sääntö on joskus kätevä käsin laskettaessa ja sitä on helppo soveltaa vaikka matriisi A sisältäisi parametreja (eli jotkut tai jopa kaikki alkiot olisivat tuntemattomia). Se ei myöskään sisällä jakolaskuja, mikä usein saattaa auttaa numeriikan kanssa. Myös teoreettisia tuloksia johdettaessa, Cramerin sääntö voi yksinkertaistaa välivaiheita huomattavasti. Kuitenkin kun lasketaan kuinka monta laskutoimenpidettä joudutaan tekemään determinanttien aukikehityksessä, huomataan tämän olevan niin suuri ettei tätä menetelmää kovin usein sovelleta käytännön sovelluksissa. 5 Ominaisarvot ja ominaisvektorit Ominaisvektorit ja ominaisarvot ovat suuressa roolissa lineaaristen systeemien käyttäytymistä tutkittaessa. Monet matemaattiset apuneuvot (mm. tässä kappaleessa esitettävä diagonalisointi) myös käyttävät ominaisarvoja ja vektoreita hyödykseen. 5.1 Määritelmä ja laskenta Olkoon A = [a jk ] n n matriisi. Tarkastellaan vektoriyhtälöä Ax = λx, (72) missä λ on luku. Sellaista λ:n arvoa, jolla yhtälöllä on ratkaisu x 0, kutsutaan matriisin A ominaisarvoksi (eigenvalue). Vastaavasti ratkaisut x 0 ovat A:n ominaisarvoa λ vastaavia ominaisvektoreita. Suoraan määritelmästä seuraa että jos x on matriisin A ominaisarvoa λ vastaava ominaisvektori, niin on myös kx k 0. Ominaisarvojen joukko = A:n spektri (kirjallisuudessa usein puhutaan kuvauksen tai operaattorin A spektristä). 17
Ominaisarvoon λ liittyvät ominaisvektorit yhdessä vektorin 0 kanssa muodostavat tähän ominaisarvoon liittyvän A:n ominaisavaruuden. Matriisin ominaisarvojen ja vektorien määräämistä kutsutaan ominaisarvo ongelmaksi (eigenvalue problem). Ominaisarvoyhtälö voidaan kirjoittaa muotoon (A λi)x = 0 (73) Tällä yhtälöllä on nollasta poikkeavia ratkaisuja jos ja vain jos a 11 λ a 12 a 1n a 21 a 22 λ a 2n D(λ) = det(a λi) =.... = 0 (74).. a n1 a n2 a nn λ Yo. yhtälö on matriisin A karakteristinen yhtälö, ja D(λ) karakteristinen determinantti. Kun D(λ) kehitetään, saadaan λ:n suhteen n:nnen asteen polynomi, joka on matriisin A karakteristinen polynomi. Edellisestä nähdään suoraan että n n matriisilla on siis vähintään yksi ominaisarvo ja enintään n erilaista ominaisarvoa. Kuinka monta erilaista (lineaarisesti riippumatonta) ominaisvektoria sitten kuhunkin ominaisarvoon liittyy? Tätä ei voi suoraan ominaisarvon perusteella täsmällisesti ennustaa sen paremmin kuin että yksi niitä vähintään on. Jos ajatellaan matriisia A lineaarimuunnoksena, ominaisvektorit ovat niitä vektoreita jotka säilyttävät suuntansa tässä kuvauksessa. Näissä tapauksissa kuvaus on siis vain tietyn skalaarin sanelema pituuden skaalaus, ja tämä skalaari on kyseistä ominaisvektoria vastaava ominaisarvo. Käsin laskien ominaisarvot laskettava ensin, sen jälkeen voidaan laskea ominaisvektorit esim. Gaussin eliminoinnilla. Suurille matriiseille ominaisarvot (ja ominaisvektorit) lasketaan yleensä tietokoneella. Jos matriisin A ominaisarvo λ on karakteristisen yhtälön M λ :nnen kertaluvun juuri, M λ on λ:n algebrallinen kertaluku (algebraic multiplicity). Ominaisarvoon λ liittyvien lineaarisesti riippumattomien ominaisvektorien lukumäärä m λ on λ:n geometrinen kertaluku (geometric multiplicity). 1 0 0 Esimerkki 5.1. Määritä matriisin C = 3 0 1 ominaisarvot sekä niiden algebraalinen että 1 1 0 geometrinen monikerta. Määritä myös näihin ominaisarvoihin liittyvät ominaisvektorit. Huom. reaalisen matriisin ominaisarvot ja vektorit voivat olla kompleksisia. [ ] 0 1 Esimerkki 5.2. Laske matriisin ominaisarvot ja ominaisvektorit. 1 0 5.2 Matriisien ja ominaisvektorien ominaisuuksia Määritellään aluksi muutama erityyppinen matriisi: Reaalinen neliömatriisi A = [a jk ] on symmetrinen, jos A T = A (75) 18
vinosymmetrinen, jos ja ortogonaalinen, jos A T = A (76) A T = A 1 (77) Jokainen reaalinen neliömatriisi A voidaankin esittää symmetrisen matriisin R = 1 2 (A + AT ) ja vinosymmetrisen matriisin S = 1 2 (A AT ) summana. 0 0 1/ 2 1/ 2 Esimerkki 5.3. Osoita että matriisi 1/ 2 1/ 2 0 0 1/2 1/2 1/2 1/2 on ortogonaalinen 1/2 1/2 1/2 1/2 Eräitä usein hyödyllisiä ominaivektorien ominaisuuksia: Olkoot λ 1, λ 2,, λ k n n matriisin keskenään erilaisia ominaisarvoja. Tällöin niitä vastaavat ominaisvektorit x 1, x 2, x k muodostavat lineaarisesti riippumattoman joukon. Edellisestä lauseesta seuraa, että jos A:lla on n keskenään erilaista ominaisarvoa, A:n ominaisvektorit muodostavat C n :n kannan. Huom. Kerroinkunnan (eli skalaarien) täytyy olla silloin kompleksilukuja, reaaliluvut eivät enää riitä. Symmetrisen, vinosymmetrisen ja unitaarisen ortogonaalisen matriisin ominaisvektorit ovat ortogohaalisia. Jos kaikki n kpl ominaisarvoja ovat reaalisia ja erisuuria niin tällöin ominaisvektorit muodostavat R n kannan. Tällöin kerroinkunnaksikin riittää R. Jos matriisilla A R n n on n lineaarisesti riippumatonta ominaisvektoria niin muunnos y = Ax voidaan esittää ominaisvektorien x 1, x n avulla muodossa y = Ax = A(c 1 x 1 + + c n x n ) = c 1 Ax 1 + + c n Ax n = c 1 λ 1 x 1 + + c n λ n x n (78) Esimerkki 5.4. a) Olkoon v 1 = [ 1 0 1 ] T, v2 = [ 1 1 0 ] T, v3 = [ 0 1 1 ] T ja b = [ 3 2 3 ] T. Määritä (Gaussin algoritmilla) kertoimet c1, c 2 ja c 3 siten että b = c 1 v 1 + c 2 v 2 + c 3 v 3. b) Voivatko edelliset vektorit v i, i = 1, 2, 3 virittää avaruuden R 3? Jos voivat, niin muodostavatko ne edellisen avaruuden kannan? c) Jos vektorit v i ovat matriisin B ominaisvektoreita joihin liittyvät ominaisarvot ovat λ 1 = 0.01, λ 2 = 1 ja λ 3 = 100, määritä Bb. Huomaa ettei matriisia B tarvitse määrittää. d) Voiko matriisi B olla symmetrinen? Esimerkki 5.5. Olkoon matriisi B kuten edellisessä tehtävässä. Prosessissa alkutuotteista x 1, x 2 ja x 3 tuotetaan lopputuotteita y 1, y 2 ja y 3 kaavan Bx = y mukaisesti. Ratkaise seuraavat ongelmat jokaiselle i = 1, 2, 3: a) Jos alkutuotteiden määrä laskee määrästä [1000, 1000, 1000] T määrään [1000, 1000, 1000] T 2v i niin kuinka paljon muuttuu lopputuotteiden määrä? b) Jos lopputuotteiden määrän on noustava määrästä [1000, 1000, 1000] T määrään [1000, 1000, 1000] T + 2v i, niin paljonko on alkutuotteiden määrän noustava? 19
5.3 Diagonalisointi ja neliömuodot Olkoon sarakevektorit x i, i = 1,..., n, neliömatriisin A R n n matriisin ominaisvektoreja ja λ i näihin liittyvät ominaisarvot, eli Ax i = λ i x i. Jos nyt X = [x 1 x 2 x n ] ja D on diagonaalimatriisi jonka diagonaalialkiot ovat ominaisarvot λ i, niin AX = [Ax 1 Ax 2 Ax n ] = [λ 1 x 1 λ 2 x 2 λ n x n ] = XD. (79) Jos vektorit x i ovat lineaarisesti riippumattomia, niin matriisilla X on olemassa käänteismatriisi ja A = XDX 1. (80) Edellisestä kaavasta seuraa XD m X 1 = A m (81) Esimerkki [ ] 5.6. [ Mitkä ] ovat[ matriisin ] [ ] A R 2 2 ominaisarvot ja ominaisvektorit kun tiedetään 1 4 1 2 että A = ja A =. Käyttäen diagonalisointia, määritä matriisi A ja laske 1 4 2 4 A 100. Tarkastellaan niinkutsuttua neliömuotoa Q = x T Ax (82) Oletetaan, että matriisi A on reaalinen ja symmetrinen. Tällöin A:lla on n:n ortonormaalin ominaisvektorin kanta. Näiden vektorien muodostama matriisi X on ortogonaalinen ja X 1 = X T. Näin ollen A = XDX 1 = XDX T ja Asettamalla X T x = y, saadaan (X 1 = X T ) jolloin Q tulee muotoon Q = x T XDX T x (83) x = Xy, (84) Q = y T Dy = λ 1 y 2 1 + λ 2 y 2 2 + + λ n y 2 n (85) Näin ollen on voimassa pääakselilause: Muunnos (84) muuntaa neliöllisen muodon Q = x T Ax = n n a jk x j x k (86) j=1 k=1 pääakselimuotoon (85), missä λ 1,, λ n ovat symmetrisen matriisin A ominaisarvoja ja X on ortogonaalinen matriisi, jonka pystyvektorit ovat vastaavia ominaisvektoreita x 1,, x n. Esimerkki 5.7. Muuta pääakselimuotoon neliömuoto Mitä käyrää neliömuoto esittää? Q = 17x 2 1 30x 1 x 2 + 17x 2 2 = 128. (87) 20