1. Ominaisarvot ja -vektorit

Samankaltaiset tiedostot
1. Normi ja sisätulo

i=1 Näistä on helppo näyttää ominaisuudet (1)-(4). Ellei toisin mainita, käytetään R n :ssä

Kurssimateriaalia K3/P3-kursille syksyllä Heikki Apiola. 1. Ominaisarvot ja -vektorit

5 Ominaisarvot ja ominaisvektorit

1 Ominaisarvot ja ominaisvektorit

Ortogonaalisen kannan etsiminen

MS-C1340 Lineaarialgebra ja

6. OMINAISARVOT JA DIAGONALISOINTI

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Osoita, että täsmälleen yksi vektoriavaruuden ehto ei ole voimassa.

802320A LINEAARIALGEBRA OSA II

1 Sisätulo- ja normiavaruudet

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja

5 OMINAISARVOT JA OMINAISVEKTORIT

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät

1 Ominaisarvot ja -vektorit

6 MATRIISIN DIAGONALISOINTI

MS-A0004/A0006 Matriisilaskenta

1 Matriisit ja lineaariset yhtälöryhmät

Similaarisuus. Määritelmä. Huom.

Ominaisarvo ja ominaisvektori

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

Lineaarikuvauksen R n R m matriisi

Sisätuloavaruudet. 4. lokakuuta 2006

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42

Matematiikka B2 - TUDI

Matemaattinen Analyysi / kertaus

Lineaarialgebra ja matriisilaskenta II. LM2, Kesä /141

C = {(x,y) x,y R} joiden joukossa on määritelty yhteen- ja kertolasku seuraavasti

Insinöörimatematiikka D

ominaisvektorit. Nyt 2 3 6

MS-C1340 Lineaarialgebra ja

Ominaisarvoon 4 liittyvät ominaisvektorit ovat yhtälön Ax = 4x eli yhtälöryhmän x 1 + 2x 2 + x 3 = 4x 1 3x 2 + x 3 = 4x 2 5x 2 x 3 = 4x 3.

(1.1) Ae j = a k,j e k.

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo.

Alkeismuunnokset matriisille, sivu 57

Matriisiteoria Harjoitus 1, kevät Olkoon. cos α sin α A(α) = . sin α cos α. Osoita, että A(α + β) = A(α)A(β). Mikä matriisi A(α)A( α) on?

Numeeriset menetelmät

1 Lineaariavaruus eli Vektoriavaruus

Insinöörimatematiikka D

Matematiikka B2 - Avoin yliopisto

Ominaisarvo-hajoitelma ja diagonalisointi

Insinöörimatematiikka D

Päättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1

Ortogonaaliset matriisit, määritelmä 1

802320A LINEAARIALGEBRA OSA I

Avaruuden R n aliavaruus

Kanta ja Kannan-vaihto

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Esimerkki 4.4. Esimerkki jatkoa. Määrää matriisin ominaisarvot ja -vektorit. Ratk. Nyt

OMINAISARVOISTA JA OMINAISVEKTOREISTA

Lineaarialgebra ja differentiaaliyhtälöt Laskuharjoitus 1 / vko 44

Kertausta: avaruuden R n vektoreiden pistetulo

Matriisilaskenta Luento 16: Matriisin ominaisarvot ja ominaisvektorit

Luento 8: Epälineaarinen optimointi

Lineaarialgebra II P

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

Luennon ti kalvoja + ominaisarvopruju

Ratkaisuehdotukset LH 7 / vko 47

Numeeriset menetelmät TIEA381. Luento 5. Kirsi Valjus. Jyväskylän yliopisto. Luento 5 () Numeeriset menetelmät / 28

Luento 8: Epälineaarinen optimointi

Lineaarialgebra ja matriisilaskenta I

Ominaisvektoreiden lineaarinen riippumattomuus

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

Lineaarikuvausten. Lineaarikuvaus. Lineaarikuvauksia. Ydin. Matriisin ydin. aiheita. Aiheet. Lineaarikuvaus. Lineaarikuvauksen matriisi

Ville Turunen: Mat Matematiikan peruskurssi P1 1. välikokeen alueen teoriatiivistelmä 2007

Determinantti 1 / 30

HY / Avoin yliopisto Lineaarialgebra ja matriisilaskenta II, kesä 2015 Harjoitus 1 Ratkaisut palautettava viimeistään maanantaina klo

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 );

Ennakkotehtävän ratkaisu

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 );

Demorastitiedot saat demonstraattori Markus Niskaselta Lineaarialgebra (muut ko) p. 1/104

Insinöörimatematiikka D

Ominaisarvot ja ominaisvektorit 140 / 170

Kertausta: avaruuden R n vektoreiden pistetulo

Matriisilaskenta Luento 12: Vektoriavaruuden kannan olemassaolo

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

Insinöörimatematiikka D

802320A LINEAARIALGEBRA OSA III

MS-A0003/A0005 Matriisilaskenta Laskuharjoitus 2 / vko 45

BM20A0700, Matematiikka KoTiB2

Määritelmä 1. Olkoot V ja W lineaariavaruuksia kunnan K yli. Kuvaus L : V. Termejä: Lineaarikuvaus, Lineaarinen kuvaus.

Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41

Insinöörimatematiikka D

Kuvaus. Määritelmä. LM2, Kesä /160

Matriisilaskenta, LH4, 2004, ratkaisut 1. Hae seuraavien R 4 :n aliavaruuksien dimensiot, jotka sisältävät vain

Ominaisarvo ja ominaisvektori

Numeeriset menetelmät TIEA381. Luento 8. Kirsi Valjus. Jyväskylän yliopisto. Luento 8 () Numeeriset menetelmät / 35

Tehtäväsarja I Kerrataan lineaarikuvauksiin liittyviä todistuksia ja lineaarikuvauksen muodostamista. Sarjaan liittyvät Stack-tehtävät: 1 ja 2.

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Matriisihajotelmat. MS-A0007 Matriisilaskenta. 5.1 Diagonalisointi. 5.1 Diagonalisointi

802320A LINEAARIALGEBRA OSA II/PART II

Matriisit ja vektorit Matriisin käsite Matriisialgebra. Olkoon A = , B = Laske A + B, , 1 3 3

Ortogonaalinen ja ortonormaali kanta

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

Talousmatematiikan perusteet: Luento 13. Rajoittamaton optimointi Hessen matriisi Ominaisarvot ja vektorit Ääriarvon laadun tarkastelu

Transkriptio:

Kurssimateriaalia K3/P3-kursille syksyllä 004. 4. marraskuuta 004 Heikki Apiola Kirjallisuutta. [KRE Kreyszig. Advanced Engineering Mathematics, 8 th ed.,wiley,1999. [Lay Lay. Linear Algebra, 3 rd ed.,addison Wesley,003. [TE Timo Eirola. Lineaarialgebra, L3-kurssimoniste 1. Ominaisarvot ja -vektorit Tarkasteltavana oleva matriisi on koko ajan neliömatriisi, A(n n). Johdanto. Ajatellaan neliömatriisia A ennen kaikkea sen määräämään lineaarikuvauksen kannalta. Tähän asti staattisia ongelmia: lineaarisen yhtälöryhmän ratkaisu. Nyt käsittelemme dynaamisia tehtäviä. Tyypillisesti tarkastelemme iteraatiota Alkupiste x 0, x k+1 = Ax k, k = 0, 1,,.... Tällöin joudumme laskemaan matriisin potensseja (joita neliömatriisille voidaan laskea). Sovellutuksina näemme mm. dikreettejä dynaamisia systeemejä (dierenssiyhtälösysteemejä) ja dierentiaaliyhtälösysteemejä. Ominaisarvotehtäviä tulee luonnontieteellissä sovelluksissa vastaan hyvin monessa paikassa. Kyseessä on myös insinöörimatematiikan kaikkein tärkeimpään ydinalueeseen kuuluva aihepiiri. Lisäksi: kaunis kappale lineaarialgebraa. 1.1. Määritelmä ja perusominaisuudet. (Eigenvalues, eigenvectors) A on neliömatriisi (n n) Tarkastellaan yhtälöä (1.1) Ax = λx, λ C Yhtälöllä on aina triviaaliratkaisu x=0, olipa λ mikä tahansa kompleksiluku. Tehtävä: (a) Määritä luku λ siten, että yhtälöllä (1.) on ei-triviaaleja ratkaisuvektoreita x. (b) Määritä sitten kutakin ratkaisua λ kohti ao. ratkaisuvektorit x. Määritelmä 1.1. Lukua λ sanotaan matriisin A ominaisarvoksi ja vektoria x 0 vastaavaksi ominaisvektoriksi, jos Ax = λx. Geometrisesti ominaisvektori tarkoittaa suuntaa, joka säilyy samana (tai vastakkaisena) sovellettaessa lineaarikuvausta A. Ominaisarvo kuvaa venytys/kutistussuhdetta, negatiivisessa tapauksessa lisäksi suunnan vaihtoa. Tämä kuvailu pätee reaalisiin ominaisarvoihin (ja -vektoreihin) nähden. Kompleksisessa tapauksessa tilanne voi olla "epäintuitiivisempi", kannattaa muistaa, että esim. i:llä kertominen merkitsee kiertoa tasossa kulman π/ verran, joten skalaarilla kertominen ei tarkoita (reaalisella) suoralla pysyttelemistä. 1

Tehtävän muokkaus ratkaistavaan muotoon. (1.) Ax = λx, λ C (A λi)x = 0 Kyseessä on siis homogeeniyhtälö, jonka kerroinmatriisi sisältää parametrin λ. Se pitää valita siten, että HY:llä on ei-triv. ratkaisuja, ts. Gaussin eliminaation on tuotettava ainakin 1 nollarivi, joten on oltava det(a λi) = 0. Esimerkki 1.1. A = mukava tekijöihin jako: Lasketaan ominaisvektorit 0 4 0 6 0 4 0 Muodostetaan D(λ) = det(a λi), tässä tapauksessa saadaan D(λ) = (λ + ) (λ 6) Sijoitetaan karakteristiseen matriisiin K λ = A λi λ:n paikalle vuorollaan kukin ominaisarvo. Ominaisarvoon λ 1 = liittyvät ominaisvektorit K λ1 = 4 0 4 0 8 0 4 0 4 Tässä ei rivioperaatioita tarvita. Alin rivi voidaan jättää pois (identtinen ylimmän kanssa). Voidaan haluttaessa jakaa 1. rivi 4:llä ja toinen 8:lla, muttei sekään ole tarpeen.. rivi = x 3 vapaa ja x = 0. 1. rivi = x 1 = x 3. Jos valitaan: x 3 = 1, saadaan v 1 = [ 1, 0, 1 T. Saadaan 1-ulotteinen ominaisavaruus, kuten pitääkin, koska aina pätee: 1 m λ M λ ja viimemainittu on = 1. Yleisesti voitaisiin muodostaa ref (tai rref). 64 4 0 4 3 ref (K λ1 ) = 0 8 0 75 Tästä nähdään heti, että nolla-avaruuden dimensio = 1. (n-tukisarakkeiden lkm = nollarvien lkm, kun kerran on 0 0 0 neliömatriisi.) Tässä tapauksessa laskut eivät edellisestä yksinkertaistu, koska matriisi oli jo heti yhtä rivioperaatiota ja normeerausta vaille jopa rref-muodossa. (Huomaa, että -systeemissä riittää aina rajoittua toiseen yhtälöön (jos ominaisarvot on oikein laskettu, ellei, niin who cares :-)), rivioperaatiota ei siten tarvita ollenkaan.) Ominaisarvoon λ = 6 liittyvät ominaisvektorit K λ = 4 0 4 0 0 0 4 0 4 Nyt jää vain yksi yhtälö, jossa voidaan kaksi muuttujaa valita vapaasti, vaikkapa x 3 ja x, ja ratkaisemalla x 1 = x 3. Saadaan kaksi LRT ominaisvektoria valitsemalla ensin x 3 = 1, x = 0 ja sitten päinvastoin x 3 = 0, x = 1 u 1 = [1, 0, 1 T, u = [0, 1, 0 T. Kertaluvut ovat taas samat: m λ = M λ =. Siis ominaisavaruudet ovat: E =sp{[ 1, 0, 1} ja E 6 =sp{[1, 0, 1, [0, 1, 0}

Jäljempänä esitettävän lauseen mukaan eri ominaisarvoihin liittyvät ominaisvektorit ovat LRT, joten voimme sen turvin suoraan päätellä, että laskemamme 3 ominaisvektoria ovat LRT ja siis R 3 :n kanta. Ilman tuota lausetta täytyisi turvautua ref:iin. Huomautus 1.1. Varo harhaluulemasta, että lineaarinen riippumattomuus voitaisiin todistaa osissa niin, että osoitettaisiin vaikka kaksi vektoria LRT:ksi ja kolmas kummastakin LRT:ksi. Tokihan kolmas voi sijaita kahden virittämässä tasossa (ja muodostaa siis ensinmainittujen kanssa LRV joukon) ja olla kummankin kanssa eri suuntainen. Edellä mainitussa (jäljempänä esitettävässä) lauseessa esiintyvässä "ominaisvektoriniputuksessa"on kyse siitä, että kaikki mahdolliset valinnat eri ominaisavaruuksista antavat LRT vektorijoukon. Palataan tähän vielä tuon lauseen todistuksen yhteydessä. Samalla täydennetään kuennolla kenties hiukan kevyesti käsiteltyä kohtaa. Kaksi peruslausetta. Jos determinantti D(λ) = det(a λi) kehitetään vaikkapa 1. sarakkeen mukaan, nähdään, että se on polynomi, joka on muotoa: 3 D(λ) = ( 1) n λ n +... + det A. Polynomi, jota sanotaan karakteristiseksi polynomiksi, on siis aina astetta n. Algebran peruslauseen mukaan sillä on ainakin yksi 0-kohta kompleksitasossa. Saadaan siten: Lause 1.1 (KRE8 Thm. 1 s. 373). Neliömatriisilla A (n n) on ainakin yksi ja korkeintaan n erillistä ominaisarvoa. Ne voivat olla kompleksisia, vaikka matriisi olisi reaalinen. Karakteristinen polynomi voidaan kirjoittaa muotoon: D(λ) = (λ λ 1 ) k1 (λ λ n ) k n Ominaisarvon λ k algebrallinen kertaluku M λ tarkoittaa kyseisen polynomin nollakohdan kertalukua. Siten M λk ilmaisee siis potenssin p k, jossa tekijä (λ λ k ) esiintyy. Voidaan sanoa, että n n-matriisilla on n kappaletta ominaisarvoja, kun kukin otetaan niin monta kertaa kuin sen algebrallinen kertaluku ilmaisee. Muistutamme, että ominaisarvoon λ liittyvä ominaisavaruus E λ koostuu kaikista λ:aan liittyvistä ominaisvektoreista ja nollavektorista. E λ on vektorialiavaruus, koska se on (A λi):n nolla-avaruus. Tämä on "se toinen lause": Lause 1. (KRE8 Thm s. 373). Ominaisavaruus E λ on "nimensä veroinen", siis aliavaruus. KRE- kirjan lause sanoo vain, että vakio kertaa ominaisvektori on edelleen samaan ominaisarvoon liittyvä ominaisvektori. Tämä sinänsä tärkeä huomio on erikoistapaus edellä olevasta. Ominaisarvojen ja -vektorien laskeminen. Edellisen esimerkin mallin mukaan voidaan kirjoittaa yleinen toimintaohje: 1. Muodostetaan karakteristinen polynomi D(λ) = det(a λi) ja ratkaistaan sen nollakohdat, näin saadaan ominaisarvot.. Ratkaistaan homogeeniyhtälö (A λi)x = 0, ts. määrätään nolla-avaruus N(A λi) kullakin ominaisarvolla λ.

4 Ratkaisussa on ainakin yksi vapaa parametri, sanokaamme t, joka voidaan valita mielivaltaisesti (esim. t=1). Jos vapaita parametrejä on useita, täytyy pitää huoli siitä, että saadaan lineaarisesti riippumattomat ratkaisuvektorit. Varma valinta esim. tapauksessa "3 vapaata parametria"on: 1. om. vekt. : parametrit: 1, 0, 0. om. vekt. : parametrit: 0, 1, 0 3. om. vekt. : parametrit: 0, 0, 1. Huomautus 1.. 1. Ominaisarvot ovat 1-käs, ominaisvektorit eivät.. Kuhunkin ominaisarvoon liittyy ominaisavaruus, päämääränä on löytää jokin kanta ominaisavaruudelle. Käytännön (numeerisista) laskentamenetelmistä Polynomiyhtälön ratkaisussa on useimmiten turvauduttava numeerisiin menetelmiin. Matlabissa on tähän tarkoitukseen funktio roots. Oikeissa numeerisissa menetelmissä lasketaan ensin ominaisvektorit (tai esim. muutama dominoiva ominaisvektori sellaiset, jotka vastaavat muutamaa suurinta ominaisarvoa). Ominaisarvot lasketaan vasta sitten. Itse asiassa Matlabin roots-komennon käyttö ominaisarvotehtävissä on lievää "itsepetosta". Se perustuu algoritmiin, joka laskee annettuun polynomiin liittyvän matriisin, ns. companion matrix:n ominaisvektorit ja sitten ominaisarvot. Sivutuotteena, eräänlaisena kuriositeettina, siitä saadaan helposti kohtuullinen polynomiyhtälön ratkaisija. Ominaisarvojen laskenta tätä kautta on siten hyödyllistä pelkästään perusasioiden opetteluun. Oikeaan laskentaan käytetään komentoa eig. Matlabin isä Cleve Moler, joka on eräs nykyaikaisen tieteellisen laskennan huomattavia vaikuttajapersoonallisuuksia, pitänee polynomiyhtälön ratkaisemista nykyaikana hieman numeerisen analyysin sivuraiteille kuuluvaksi. Siitä syystä hän ei luultavasti ole kiiruhtanut ottamaan Matlabiin parasta alan algoritmia käyttöön. Myös Matlabin historia on hyvin vahvasti juuri lineaarialgebrassa. Sillä alueella on erityisesti panostettu parhaisiin algoritmeihin, toki sitten myös mm. dierentiaaliyhtälöissä. 1.. Perusesimerkit: defektiivinen, kompleksinen. Edellä oli esimerkki tapauksesta, jossa algebralliset ja geometriset kertaluvut olivat samoja. Näin ei aina ole. [ 0 1 Esimerkki 1.. Olkoon A = 0 0 D(λ) = λ, joten λ = 0 on kaksinkertainen ominaisarvo. Ominaisavaruus on sama kuin A:n nolla-avaruus, jonka virittää vektori [1, 0 T. Siis ominaisarvon 0 geometrinen kertaluku on 1. Matriisi on defektiivinen, ominaisvektoreita ei ole "tarpeeksi". Lause 1.3. Yleisesti pätee: m λ M λ. Aito < on mahdollinen. Tod. Edellinen on jossain määrin syvällinen asia, perustelu on pakko sivuuttaa. Jälkimmäisen perustelee vaikkapa edellinen esimerkki. Esimerkki 1.3. KRE esim. 4 s. 375. Reaalinen matriisi, jolla on kompleksiset ominaisarvot (ja -vektorit) A = [ 0 1 1 0 Ominaisarvot λ = ±i, ominaisvektorit: λ = i Ratkaistavaksi tulee yhtälö ix 1 + x = 0. Jos valitaan x = 1, on x 1 = 1/i = i. Saadaan ominaisvektoriksi [ i, 1 T. Yhtä hyvin voidaan kertoa vaikka i:llä, joka antaa: [1, i.

Ominaisarvoa λ = i vastaava ominaisvektori saadaan samalla tavalla. Itse asiassa sitä ei tarvitse koskaan laskea, koska se on aina liittolukua vastaavan ominaisvektorin liittovektori. (Tällä tarkoitamme vektoria, jonka koordinaatit ovat edellisen liittolukuja.) Todistetaan tämä oikein lauseena. Lause 1.4. Reaalisen matriisin kompleksiset ominaisarvot ovat pareittain liittolukuja. Liittolukuja vastaavat ominaisvektorit ovat toistensa liittovektoreita. Tod. Ominaisarvoja koskeva johtopäätös voidaan tehdä kompleksiprujussa olevasta lauseesta: reaalikertoimisen polynomin kompleksiset juuret ovat toistensa liittolukuja. Itse asiassa tätäkään ei tarvita, kun huomataan, että edellisen perustana olevasta, liittolukujen laskutoimituksia koskevasta lauseesta saadaan myös välittömästi sääntö Av = Av. 5 Niinpä, jos Av = λ v, niin Av }{{} = A on reaalinen Av = A v }{{} = λv = λv. Av=λv Johtopäätös seuraa siten suoraan ominaisarvon/-vektorin määritelmästä. Yhteenveto käsitteistä ja määritelmistä. 1. Ominaisavaruus: E λ ominaisarvoon λ kuuluvien ominaisvektorien joukko täydennettynä 0-vektorilla (jotta saadaan VA).. Spektri = ominaisarvojen joukko (kompleksitason osajoukko) 3. Spektraalisäde: itseisarvoltaan suurimman ominaisarvon itseisarvo. Se antaa ympyrän säteen, jonka sisällä kaikki ominaisarvot (eli spektrin pisteet) ovat. 4. Karakteristinen polynomi : D(λ) = det(a λi). 5. Ominaisarvon λ k algebrallinen kertaluku = p k, kun karakteristinen polynomi esitetään tekijöihin jaetussa muodossa: D(λ) = ( 1) n (λ λ 1 ) p1 (λ λ n ) p n Ominaisarvon λ k algebrallinen kertaluku M λk ilmaisee siis potenssin p k, jossa tekijä (λ λ k ) esiintyy. 6. Geometrinen kertaluku m λ tarkoittaa vastaavan ominaisavaruuden dimensiota. 7. Pätee: m λ M λ 8. Matriisi A on defektiivinen, jos jollain ominaisarvolla λ pätee aito pienemmyys: m λ < M λ 1.3. Sovellutusesimerkkejä. 1.3.1. Joustavan kalvon venytys, lineaarikuvauksen pääakselit. Yksikkökiekko olkoon joustava kalvo, jota muotoilee "siirtymämatriisi" [ 5 3 A = 3 5. Määritä pääsuunnat, eli vektorit, joille siirtymävektori on saman tai vastakkaissuuntainen tuon annetun vektorin kanssa.

6 Ratkaisu Lasketaan ominaisarvot ja -vektorit, helppo homma: λ 1 = 8, λ =. Vastaavat ominaisvektorit: u 1 = [1, 1 T, u = [ 1, 1 T (Laskettu myös Matlabilla alla.) Esitetään mielivaltainen tason vektori u ominaisvektorikannassa: u = ξ 1 u 1 + ξ u. Tällöin z = Au = ξ 1 Au 1 + Aξ u = ξ 1 λ 1 u 1 + ξ λ u = 8ξ 1 u 1 + ξ u. Koordinaattien välinen kuvaus on ihana: [ξ 1, ξ [8ξ 1, ξ. (Kumpikin kuvakoordinaatti riippuu vain omasta lähtökoordinaatistaan, ts. se saadaan diagonaalimatriisilla kertomalla.) Tässä tapauksessa sattuu vielä niin onnellisesti, että ominaisvektorit ovat toisiaan vastaan kohtisuorassa 1, jolloin meillä on uusi luonteva suorakulmainen koordinaatisto, johon voimme astua ja esittää pisteiden koordinaatit normaalissa napakoordinaatistossa u 1 u -akselien suhteen. Otetaanpa siis jokin yksikköympyrän piste: cos φu 1 + sin φu. Sen kuvapiste on siis 8 cos φu 1 + sin φu. Kuvapisteet piirtävät siten ellipsin, jonka esitys pääakselikoordinaatistossa u 1 u on Toisin sanoen Matlab-ajo { η 1 = 8 cos φ η = sin φ ( η1 8 ) ( η ) + = 1., Tiedostossa../L/paakseli.m % paakseli.m clear; clf t=linspace(-pi,pi); Yymp=exp(i*t); Yymp=[real(Yymp);imag(Yymp); plot(yymp(1,:),yymp(,:),'b') axis square A=[5 3;3 5 kuva=a*yymp; hold on plot(kuva(1,:),kuva(,:),'r') shg % Jako 100:aan osaan. % Yksikköympyrän 100 pistettä. % Pisteet matriisin sarakkeiksi % ympyrän kuvapisteet Lasketaan nyt ominaisarvot ja -vektorit. figure() [V,D=eig(A) lam=diag(d) lam = 1 Jos osaisimme teoriaa enemmän, tietäisimme jo matriisin ulkonäöstä, että näin käy, koska matriisi on symmetrinen.

7 Kuva 1. Yksikköympyrä ja sen kuva 8 clf phi=linspace(-pi,pi); z1=lam(1)*cos(phi);z=lam()*sin(phi); % tai % z=d*[cos(phi);sin(phi); plot(z1,z,'--g') % jolloin % plot(z(1,:),z(,:)) axis square axis equal % Kierretään oikeaan asentoon: ell=v*[z1;z; % tai % ell=v*z; hold on plot(ell(1,:),ell(,:),'r') axis square axis equal u1aks=[[0;0 lam(1)*v(:,1); plot(u1aks(1,:),u1aks(,:),'k') uaks=[[0;0 lam()*v(:,); plot(uaks(1,:),uaks(,:),'k') shg Matlab halusi valita pienemmän ominaisarvon ensin, no annettiin sen tehdä, jolloin peruskoordinaatistossa ellipsi nousi pystyasentoon, mutta samaanpa päätyi koordinaattimuunnoksen (kierron) jälkeen. 1.3.. Stokastinen matriisi, Markovin prosessi. KRE8 s. 318 (matrix multiplication) Oletetaan, että vuonna 004 erään kaupungin maankäyttö jakaantuu näin: I asuntoalue 30% II kaupallinen käyttöalue 0% III teollisuusalue 50%

8 Kuva. Kuvaellipsi peruskoordinaatistossa ja kierrettynä pääakseleille Oletetaan, että siirtymätodennäköisyydet 5-vuotisjakson aikana saadaan matriisista P= I:stä II:sta III:sta 0.8 0.1 0 I:een 0.1 0.7 0.1 II:een 0.1 0. 0.9 III:een Matlabilla voidaan iteroida vaikka tähän tapaan. Tulostetaan vaakavektoreina tilan säästön ja selkeyden vuoksi. >> P=[0.8 0.1 0;0.1 0.7 0.1;0.1 0. 0.9 >> x0=[30;0;50; >> x0' 30 0 50 % v. 004 >> x=x0 % x olkoon muuttuja, johon iterointi kohdistuu. >> x=p*x; x' % Selkeyden takia katsotaan vaakasuorassa. 6 5 % v. 009 >> x=p*x; x' 3.0000 3.000 53.8000 % v. 014 >> x=p*x; x' 0.700 3.900 55.3600 % v. 019 Tämä oli siis pelkkää matriisikertolaskuharjoittelua. Ominaisarvoteoria tulee mukaan, kun kysellään, mitä tapahtuu pitkällä aikavälillä. Voidaan tietysti harrastaa matriisikertolaskua raakaan voimaan turvautuen, mutta se ei anna eväitä analysoida tilannetta. Lasketaanpa ominaisarvot ja -vektorit: P on sama kuin KRE-kirjan A T

9 >> [V,D=eig(P) V = -0.186-0.7071 0.408-0.3651 0.0000-0.8165-0.919 0.7071 0.408 D = 1.0000 0 0 0 0.8000 0 0 0 0.6000 Nähdään, että kaikki ominaisarvot ovat positiivisia, suurin on 1 ja muut ovat pienempiä. Myöhemmin osoitetaan, että eri ominaisarvoihin liittyvät ominaisvektorit ovat LRT, niinpä tässä tapauksessa on. Kun ei sitä vielä ole ollut, katsotaan vanhoilla yleisluontoisilla konsteilla. >> rref(v) 1 0 0 0 1 0 0 0 1 No kyllä vaan! Siispä ne muodostavat R 3 :n kannan. Aivan, kuten äskeisessä esimerkissä, saadaan mahdollisimman yksinkertainen tilanne operoimalla ominaisvektorikannassa. Merkitään ominaisvektoreita: v 1, v, v 3, ja esitetään: x 0 = c 1 v 1 + c v + c 3 v 3. No mutta tällöinhän: x 1 = P x 0 = c 1 λ 1 v 1 + c λ v + c 3 λ 3 v 3, missä λ 1 = 1. Jatkamalla iterointia, saadaan: x k = c 1 v 1 + c λ k v + c 3 λ k 3v 3. Koska 0 < λ j < 1, kun j =, 3, lähenevät viimeistä termiä kohti 0:aa, kun k kasvaa. Siten prosessia dominoi ykköstä (suurinta) ominaisarvoa vastaava ominaisvektori. Rajalla päädytään vektoriin c 1 v 1. Tässä tapauksessa: >> Vx0=[V x0 % Edellähän tehtiin [V,D = eig(p); Vx0 = -0.186-0.7071 0.408 30.0000-0.3651 0.0000-0.8165 0.0000-0.919 0.7071 0.408 50.0000 >> rref(vx0) 1.0000 0 0-68.4653 0 1.0000 0-1.13

10 0 0 1.0000 6.137 Niinpä c 1 = 68.4653, joten pitkällä aikavälillä tilanne stabiloituu jakaumaan: >> -68.4653*V(:,1) 1.5000 5.0000 6.5000 Maagista!! Siten saadaan (lähtöpisteestä riippumatta) sellainen ominaisarvoa 1 vastaavan ominaisvektorin suuntainen tulos, jonka koordinaattien summa = 100. Maagiselta tuntuu kenties se, että c 1 -kerroin on sama riippumatta alkupisteestä. Se selittyy lisäehdosta x 1 + x + x 3 = 100. Tämä ominaisuus säilyy P -matriisilla kerrottaessa, joten rajavektorilla on sama ominaisuus. Siten raja-vektori on sellainen dominoivan ominaisvektorin suuntainen vektori, jonka koordinaatit 0 ja x 1 + x + x 3 = 100. Taatusti siis riippumaton alkupisteen valinnasta. (Koordinaattisumma säilyy sillä: i p i,j = 1 j. Olkoon y i = p ij x j. i y i = i j p ijx j = j ( i p ij)x j = j x j. ) 1.3.3. Populaatiodynamiikkaa. Esimerkki 1.4 (Täpläpöllöjen henkiinjäämistaistelu Kaliforniassa). Vuonna 1990 oli vastakkainasettelu puuteollisuuden ja ympäristönsuojelijoiden välillä. Vanhojen ikimetsien hakkuut ja sen seurauksena mm. täpläpöllöjen tuhoutuminen, vastaan 30000... 100000 työpaikan menetys puuteollisuudessa. Matemaatikot ryhtyivät viileän objektiivisesti tutkimaan. Täpläpöllön elinkaari voidaan jakaa kolmeen luokkaan: 1. Lapsuus, 0 1 v.,. esiaikuisuus, 1 v., 3. aikuisuus, yli v. Keskimääräinen elinikä n. 0 v. Kriittinen ajanjakso on silloin, kun lapsipöllö lähtee pesästään, jolloin sen on löydettävä uusi kotialue ja pari. Mallinnetaan tilannetta tarkastelemalla populaatiota vuoden välein ja jakamalle se näihin kolmeen luokkaan. Oletetaan, että naaraita ja uroita on samanverran, jolloin tarvitsee tarkastella vain naisväkeä. Populaatiovektori vuonna k olkoon x k = [l k, e k, a k ("lapsi", "esiaikuinen", "aikuinen"). l k+1 e k+1 a k+1 = 0 0 0.33 0.18 0 0 0 0.71 0.94 l k e k a k 1. rivi: Kukin aikuinen naaras synnyttää keskimäärin 0.33 tyttölapsipöllöä vuonna k (vuoden k+1 alkuun mennessä).. rivi: Keskimäärin 0.18 tyttölasta selviytyy esiaikuiseksi vuoden k + 1 alkuun. 3. rivi: Vuoden k esiaikuisista 0.71 selviytyy aikuisuuteen ja aikuisista 0.94 jatkaa aikuiselämää vuonna k + 1. Yllä olevaa matriisia A voidaan kutsua "vaihematriisiksi"("stage matrix"). Tämä on peräisin oikeasta tutkimusaineistosta: Lamberson et. al: Dynamic analysis of the viability of the Northern spotted owl in a fragmented forest environment, julkaisussa: Conservation biology vuodelta 199.

Tässä matriisissa alkio a,1 = 0.18 on se, kriittsin ympäristötekijöiden vaikutuksille. Jos ikimetsät hakataan aukeiksi, niin tämä arvo käy liian pieneksi. Arvo 0.18 on jo liian pieni, kuten nähdään, jos analyysi viedään päätökseen. Muotoa x k+1 = Ax k olevaa systeemiä sanotaan dierenssiyhtälöksi, usein puhutaan myös diskreetistä dynaamisesta systeemistä. Yllä oleva esimerkki on peräisin kirjasta [Lay KRE-kirjassa [KRE vastaavanlainen esimerkki esiintyy nimellä Leslie model s. 378, Example 3 Palattaneen tähän esmerkkiin myöhemmin. 1.4. Matriisin diagonalisointi (KRE 7.5). Tutkitaan erityisesti ominaisvektorien ominaisuuksia. Jos ominaisvektoreita on tarpeeksi (n lineaarisesti riippumatonta, kun matriisin koko on n n, saadaan herkkupöytä katetuksi. Määritelmä 1.. Neliömatriisit A ja B ovat similaariset, jos on olemassa säännöllinen (kääntyvä) P siten, että B = P 1 AP. Merkitään A B. Lause 1.5. [Similaarisuus säilyttää ominaisarvot, KRE Thm 1 Tod. Joko suoraan oma/omv-määritelmästä, nähdään, että jos x on A:n λ:aan liittyvä ominaisvektori, niin y = P 1 x on samaa λ:aa vastaava B:n ominaisvektori, missä B = P 1 AP. Vaihtoehtoinen todistus: D B (λ) = det(b λi) =... = det(a λi) = D A (λ). 11 Ominaisvektorien ominaisuuksia Lause 1.6 (KRE s. 39). Olkoot λ 1,..., λ k matriisin A erillisiä ominaisarvoja. Tällöin vastaavat ominaisvektorit ovat LRT Tod. Tässä kuvataan juoni. Tämä ei riitä harjoitustehtävän tai koetehtävän todistukseksi. 1) Todistetaan ensin :n ominaisvektorin tapauksessa. Olk. λ 1 λ, ja olkoot v 1 ja v vastaavat ominaisvektorit. Kirjoitetaan vektoriyhtälö c 1 v 1 + c v = 0. Sovelletaan siihen A:ta (eli kerrotaan vasemmalta A:lla) ja käytetään ominaisuutta Av j = λ j v j, j = 1,. Gaussin eliminaatiolla saadaan v 1 -osuus nollatuksi, jolloin ehdosta c (λ λ 1 )v = 0 seuraa: c = 0, koska λ λ 1 0. Siten myös c 1 = 0. ) Askel tapauksesta k = tapaukseen k = 3 saadaan lähtemällä vektoriyhtälöstä c 1 v 1 + c v + c 3 v 3 = 0. Aivan samanlaisella eliminaatioaskeleella kuin edellä, päästään jo todistettuun tapaukseen k =, josta päätellään: c = c 3 = 0, mistä edelleen seuraa: c 1 = 0. Yleinen askel k k + 1 on periaatteessa aivan samanlainen. Tästä seuraa välittömästi:

1 Lause 1.7. Jos n n-matriisilla A on n erillistä ominaisarvoa, niin R n :llä (kompl. tap. C n :llä) on A:n ominaisvektoreista koostuva kanta. Tätä käyttäen oltaisiin Markov-prosessi-tehtävässä voitu välttyä ei-dominoivien ominaisvektoreiden laskemiselta. Huomautus 1.3. Ominaisvektorikanta voi olla, vaikka esiintyisi moninkertaisia ominaisarvoja, kuten on nähty. Toisaalta olemme nähneet esimerkkejä (ainakin yhden), jossa käy huonosti: -matriisilla on vain yksi ominaissuora. Lause 1.8. R n :llä (C n :llä) on A:n ominaisvektorikanta, jos ja vain jos A:n jokaisella ominaisarvolla λ on m λ = M λ. Tod. Kyse on yksinkertaisesti siitä, että jos niputetaan kutakin erillistä ominaisarvoa vastaavien ominaisavaruuksien kannat omiksi nipuikseen, saadaan yhteensä n vektoria, jotka ovat LRT. Otetaan havainnollisuuden vuoksi vaikka kolme ominaisarvoa λ 1, λ, λ 3, joiden kertaluvut olkoot 1,, 3 vastaavasti. Olkoot vektoriniput {u}, {v 1, v }, {w 1, w, w 3 }. Olkoon (c 1 u) + (c v 1 + c 3 v ) + (c 4 w 1 + c 5 w + c 6 w 3 ) = 0. Suluissa olevat vektorilausekkeet ovat kaikki nollavektoreita. Jos nimittäin joku ei olisi, niin otettaisiin summaan kaikki nollasta erilliset sulkulausekkeet. Nämä ovat eri ominaisrvoihin liittyviä ominaisvektoreita, ja siis LRT. Niiden summa = 0, joten ristiriita LRT:n kanssa on valmis. Kussakin sulkulausekkeessa esiintyvät vektorit ovat ao. ominaisavaruuden kantavektoreita (siis LRT), joten on oltava: (c 1 = 0), (c = c 3 = 0), (c 4 = c 5 = c 6 = 0). Erilaisten matriisityyppien (kuten symmetristen, ortogonaalisten ym.) ominaisvektorikäytöstä selvitetään jatkossa. Ominaisarvokannan arvo, diagonalisointi Jos avaruudella on A:n ominaisvektorikanta {u 1,..., u n }, voidaan laskea aivan samoin kuin edellä mm. ellipsiesimerkissä:... Lause 1.9 (Diagonalisointi).... Tod.... Esimerkki 1.5. Laske lauseke A k :lle, kun A = Ratkaisu Diagonalisoidaan: [ 1 1 5 A = V DV 1, [ [ [ 4 3 1 0 1 3 V =, D =, V 1 =. 1 1 0 1 4 [ [ [ 4 3 1 0 1 3 Nyt A k = V D k V 1 =. 1 1 0 k 1 4 Kun suoritetaan kertolaskut, saadaan:.

13 A k = [ 3 k + 4 1 k 1 k + 1 4 k 3 Tässä tapauksessa saatiin jopa yksinkertainen kaava A k :lle. Yleensä nyt ei ihan näin pitkälle päästä. Joka tapauksessa saadaan valtava säästö aritmetiikassa ja usein saadaan selkeä näkemys alunperin sotkuiseen asiaan. Lasketaan yksi pieni esimerkki Matlabilla: >> A=[0-4 -6;-1 0-3;1 5 A = 0-4 -6-1 0-3 1 5 >> [V,D=eig(A) V = -0.8165 0.5774-0.969-0.408 0.5774-0.0850 0.408-0.5774 0.3656 D = 1.0000 0 0 0.0000 0 0 0.0000 >> VI=inv(V) VI = -.4495-4.8990-7.3485-1.731-1.075-4.6716 0 3.5634 3.5634 Tarkistetaan, laitetaan A ja V DV 1 vierekkäin (ja lisätään rajaviiva editoimalla). >> [A V*D*VI 0-4.0000-6.0000-0.0000-4.0000-6.0000-1.0000 0-3.0000-1.0000-0.0000-3.0000 1.0000.0000 5.0000 1.0000.0000 5.0000 Lasketaan vaikkapa A 16. >> A^16-65534 -6140-39310 -65535-65534 -196605 65535 131070 6141

14 Lasketaan diagonalisoimalla: >> D16=D^16 D16 = 1.0e+04 * 0.0001 0 0 0 6.5536 0 0 0 6.5536 Näin ei oikeastaan kannattaisi laskea. Nyt voimme nimittäin laskea pisteittäisen potenssin, kun on kyse diagonaalimatriisista. Silloin aritmetiikkaa on paljon vähemmän. >> D16=D.^16 D16 = 1.0e+04 * 0.0001 0 0 0 6.5536 0 0 0 6.5536 >> format bank >> V*D16*VI -65534.00-6140.00-39310.00-65535.00-65534.00-196605.00 65535.00 131070.00 6141.00 >> A^16 % Tässä taas vertailuksi raakaa voimaa: -65534.00-6140.00-39310.00-65535.00-65534.00-196605.00 65535.00 131070.00 6141.00 Maankäyttöesimerkki diagonalisoimalla. Edellä esitettiin lähtövektori ominaisvektorikannan avulla. Katsotaan, miltä homma näyttäisi diagonalisoimalla. Esitetään matriisi P muodossa P = V DV 1. Iteraatiojonon k:s termi on x k = P k x 0. Mutta P k = V D k V 1. D k = 1 0 0 0 0.8 k 0 0 0 0.6 k Kun k, niin 1 0 0 Dlim = 0 0 0 0 0 0 >> P=[0.8 0.1 0;0.1 0.7 0.1;0.1 0. 0.9 >> [V,D=eig(P)

15 V = -0.186-0.7071 0.408-0.3651-0.0000-0.8165-0.919 0.7071 0.408 D = 1.0000 0 0 0 0.8000 0 0 0 0.6000 >> VI=inv(V) VI = -0.6847-0.6847-0.6847-1.0607-0.3536 0.3536 0.306-0.9186 0.306 >> Dlim=diag([1,0,0) Dlim = 1 0 0 0 0 0 0 0 0 >> V*Dlim*VI 0.150 0.150 0.150 0.500 0.500 0.500 0.650 0.650 0.650 >> Plim=V*Dlim*VI Plim = 0.150 0.150 0.150 0.500 0.500 0.500 0.650 0.650 0.650 >> Plim*[30 0 50' 1.5000 5.0000 6.5000

16 >> Plim*[99.5.5' 1.5000 5.0000 6.5000 Ominaisvektorikanta vai diagonalisointi Kysehän on samasta asiasta esitettynä eri muodossa. Tämäntyyppisissä tehtävissä näyttäisi kirjoittajan (HA) mielestä ominaisvektorikannalla operointi hiukan diagonalisointiesitystä selkeämmältä ja myös käsin laskettaessa ehkä lyhyemmältä tavalta.

17 Sisältää otteita Timo Eirolan L3-kurssin lineaarialgebramonisteesta, jonka lähdekoodin Timo on ystävällisesti antanut käyttööni.. Normi ja sisätulo Vektoriavaruuden määritelmässä riitti olettaa, että joukon alkioille on määritelty aksioomat toteuttavat yhteenlasku ja skalaarilla kertominen. Kuitenkin monissa vektoriavaruuksissa voidaan tunnetusti tehdä muitakin laskutoimituksia. Esim. R :ssa tai R 3 :ssa voidaan laskea vektoreiden pituuksia, välisiä kulmia ja pistetuloja. Jatkuvia funktioita voidaan kertoa keskenään, integroida, niiden maksimeja voi etsiä jne. Normiavaruus on sellainen vektoriavaruus, jossa vektoreille on määritelty pituusfunktio, jota kutsutaan normiksi. Sisätuloavaruus on puolestaan normiavaruus, jossa lisäksi kulmien mittaaminen on mahdollista ja erityisesti kohtisuoruus eli ortogonaalisuus on määritelty. Seuraavassa tarkastellaan lähemmin, miten tällaisia pituus- ja kulmafunktioita voidaan määritellä. Määritelmä.1. Olkoon V toteuttaa K -kertoiminen vektoriavaruus. Kuvaus : V R on normi, jos se (1) v 0 v V. () v = 0 = v = 0. (3) u + v u + v u, v V. (4) α v = α v α K, v V. Vektoriavaruutta, jossa on määritelty jokin normi kutsutaan normiavaruudeksi. Esimerkki.1. Vektoriavaruudessa R n tavallisin normi on nk. euklidinen normi ( n ) x = x i 1. i=1 Selvästi tämä toteuttaa ehdot (1), () ja (4). Ominaisuuden (3) eli kolmioepäyhtälön näytämme hieman myöhemmin. Muita usein käytettyjä normeja R n :ssä ovat 3 n x 1 = x i ja x = max x i. 1 i n i=1 Näistä on helppo näyttää ominaisuudet (1)-(4). Ellei toisin mainita, käytetään R n :ssä normia =. Avaruudessa C n käytetään myös aivan samalla tavalla määriteltyjä normeja. Määritelmä.. Olkoon V K -kertoiminen vektoriavaruus. Kuvaus, : V V K on sisätulo, jos se toteuttaa ehdot (1) v, v 0 kaikilla v V. () v, v = 0 = v = 0. (3) u + v, w = u, w + v, w kaikilla u, v, w V. (4) αu, v = α u, v kaikilla α K, u, v V. (5) v, u = u, v kaikilla u, v V. 3 Normia 1 kutsutaan taksikuskin normiksi. Miksiköhän?

18 Sisätulolla varustettua vektoriavaruutta sanotaan sisätuloavaruudeksi. Reaalisessa tapauksessa (5) saa muodon v, u = u, v eli reaalinen sisätulo on symmetrinen. Ominaisuudet (3) ja (4) sanovat, että sisätulo on lineaarinen ensimmäisen argumentin suhteen. Toisen argumentin suhteen saadaan: (.1) u, α v + β w (5) = α v + β w, u (3),(4) = α v, u + β w, u = α v, u + β w, u (5) = α u, v + β u, w. Täten sisätulo on konjugoidusti lineaarinen toisen argumentin suhteen: skalaarit saadaan ulos kompleksikonjugaatteina. Reaalisessa tapauksessa sisätulo on siten lineaarinen myös toisen argumentin suhteen. Vektoriavaruudesta R n tuttu vektoreiden välinen pistetulo 4 : x, y = x T y = n i=1 x i y i toteuttaa sisätulon ehdot. Vastaavasti C n :n vektoreille määritellään x, y = x T y = n i=1 x i y i. Esimerkki.. Avaruudessa C[a, b voidaan määritellä f, g = b f(x)g(x) dx. a Ehdot (1)-(5) seuraavat suoraan integraalin ominaisuuksista. Esimerkiksi C[ π, π :ssä funktioiden f(x) = sin x ja g(x) = cos x väliset sisätulot ovat Samoin g, g = π. f, g = π π sin x cos x dx = π f, f = π π sin x dx = π 1 π 1 π sin x dx = 0 (1 cos x) dx = π. Sisätulon tärkeä ominaisuus on, että se määrittelee heti myös normin: jos V on sisätuloavaruus, asetetaan (.) v = v, v. Sisätulon ehdoista saadaan normin ehdot (1),() ja (4) helposti. (3) eli kolmioepäyhtälö vaatii hieman laskemista. Esitellään ensin Schwarzin epäyhtälö 5 : sisätulo ja sen avulla kaavalla (.) määritelty (jota vielä ei tiedetä normiksi) toteuttavat: (.3) u, v u v. Tod. Viittaamme L3-prujuun [TE tai moninisiin oppikirjoihin. Todistus on tyylipuhdas minimointitehtävä, jossa tarkastellaan toisen asteen polynomia, sopiva vaikka koulukurssiin. Emme kuitenkaan tässä paneudu siihen. Näytetään nyt, että kaavalla (.) määritelty toteuttaa normin ehdon (3) eli kolmioepäyhtälön u + v u + v. Tod. Käyttäen sisätulon ominaisuuksia ja Schwarzin epäyhtälöä saadaan u + v = u + v, u + v = u, u + u, v + v, u + v, v u + u, v + v u + u v + v = ( u + v ), josta väite seuraa. 4 Lausekkeessa xt y vektorit on ajateltu n 1 -matriiseiksi, jolloin x T on 1 n -matriisi ja x T y on 1 1 -matriisi eli skalaari. 5 Täydellisemmin: Cauchy-Schwarz-Bunjakovskin epäyhtälö.

Kysmys: Onko jokaisen normin taustalla aina sisätulo? Vastaus: Ei. Esimerkiksi edellä esiintyneet. 1 (taksikuski) ja. eivät ole peräisin mistään sisätulosta..1. Ortogonaalisuus. Vektorit u ja v ovat ortogonaaliset, kun u, v = 0. Ortogonaalisuus määritellään samoin kompleksikertoimisissa vektoriavaruuksissa. Täten [ 1 i ja [ i 1 ovat ortogonaaliset C :ssa. Sisätuloavaruuden vektorijoukkoa S = {v 1,..., v k } sanotaan ortogonaaliseksi, jos kaikki sen vektorit ovat keskenään ortogonaaliset: v i, v j = 0, kun i j. Ortogonaalinen vektorijoukko {v 1,..., v n } on myös lineaarisesti riippumaton edellyttäen, että se ei sisällä nollavektoria. Tämä nähdään seuraavasti. Jos c 1 v 1 + + c n v n = 0, otetaan tämän sisätulo v k :n kanssa, jolloin 0 = c 1 v 1 + + c n v n, v k = c 1 v 1, v k + + c k v k, v k + + c n v n, v k = c k v k ja koska v k 0, saadaan c k = 0. Näin kaikki kertoimet saadaan yksitellen nolliksi, joten {v 1,..., v n } on lineaarisesti riippumaton. Jos ortogonaalisen joukon vektorit ovat lisäksi pituudeltaan ykkösiä kutsutaan joukkoa ortonormaaliksi. Annetun vektorin koordinaatit ortonormaalin kannan suhteen on helppo laskea: Olkoon B = {b 1,..., b n } sisätuloavaruuden V ortonormaali kanta. Jos v = c 1 b 1 + + c n b n, otetaan tämän sisätulo b k :n kanssa, jolloin v, b k = c k b k, b k = c k. Näin saadaan kaikki kertoimet. Siis esitys ortonormaalissa kannassa saadaan: n v = v, b k b k, kaikilla v V. k=1 19 Ortonormaaleja kantoja voidaan muodostaa nk. GramSchmidtin prosessilla. Tätä ei vaadita K3/P3-kurssilla v. 004. Siihen voidaan kuitenkin vedota ja sen tulosta soveltaa, mutta välikokeissa tulos annetaan, jos sitä tarvitaan. Olkoon (v 1, v,... ) (äärellinen tai ääretön) jono lineaarisesti riippumattomia sisätuloavaruuden vektoreita. Muodostetaan yhtä pitkä jono (q 1, q,... ) ortonormaaleja vektoreita seuraavasti: (.4) q 1 = v 1 / v 1, w k = v k k 1 j=1 q k = w k / w k. v k, q j q j, } k =, 3,... Tässä keskimmäisellä rivillä v k :sta poistetaan sen komponentit jo muodostetuilla suunnilla q 1,..., q k 1. Viimeisellä rivillä jäljelle jäävä osa normeerataan ykkösen pituiseksi. Lause.1. Edellä esitetylle Gram-Schmidtin prosessille pätee: a) (q 1, q,... ) on ortonormaali. b) sp(q 1,..., q k ) = sp(v 1,..., v k ) kaikilla k 1. Erityisesti, jos V on äärellisdimensioinen ja {v 1,..., v n } on sen kanta, niin {q 1,..., q n } on V :n ortonormaali kanta.

0 Tod. Prosessi pyörii niin kauan, kun w k = 0 (tai v j -vektorit loppuvat). Näytetään aluksi, että b) on voimassa tähän asti. Koska k 1 v k = w k q k + v k, q j q j, saadaan kaikilla k : v k sp(q 1,..., q k ), josta sp(v 1,..., v k ) sp(q 1,..., q k ). Toisaalta, jokaiselle q k selvästi pätee q k sp(q 1,..., q k 1, v k ). Täten induktiivisesti j=1 q k sp(q 1,..., q k 1, v k ) sp(q 1,..., q k, v k 1, v k ) sp(v 1,..., v k ). Näin kaikilla k, joten sp(q 1,..., q k ) sp(v 1,..., v k ) ja b) on voimassa. Jos olisi w k = 0 jollakin k, tämä tarkoittaisi, että v k = k 1 j=1 v k, q j q j sp(v 1,..., v k 1 ) (sillä b) on voimassa vielä edellisellä kierroksella). Mutta tämä on mahdotonta, koska v 1,..., v k ovat lineaarisesti riippumattomat. Siispä w k :t eivät koskaan tule nolliksi. Todistetaan a) induktiolla: Selvästi {q 1 } on ortonormaali. Oletetaan, että {q 1,..., q k } on ortonormaali. Tällöin, kun i k, saadaan q k+1, q i ( 1 = v k+1 k j=1 v k+1, q j q j), q i w k+1 = 1 w k+1 ( v k+1, q i k j=1 v k+1, q j q j, q i ) = 1 w k+1 ( v k+1, q i v k+1, q i ) = 0. Näin q k+1 on kohtisuorassa kaikkia q i, i k vastaan. Selvästi q k+1 = 1. Ja kun muutkin ovat keskenään ortonormaalit, {q 1,..., q k+1 } on ortonormaali. Huomaa, että saatava ortonormaali joukko riippuu paitsi vektoreista v j myös niiden järjestyksestä. Tehtävä.1. Näytä, että äärellisdimensioisen sisätuloavaruuden mielivaltainen ortonormaali joukko voidaan täydentää ortonormaaliksi kannaksi. Esimerkki.3. Lähdetään liikkeelle R 3 :n kannasta {v 1, v, v 3 } = { [ [ 1 1 [ 11 } 10,,. Saadaan: q 1 = 1 [ 110 w = [ 1 0 q = 1 1 [ 11 w 3 = [ q 3 00 =. 1 Näin saatiin ortonormaali kanta { [ 1 110 3 1 [ 110 = [ 1 [ 1 = 1 1 10 0 1 [ 110, 1 [ 1 10, [ 1 1 0 [ 1 1 + 0 1 = 0 [ 00 1 }. [ 00 0

1 Kurssimateriaalia K3/P3-kursille syksyllä 003/004. 1.11.04 Heikki Apiola 3. Ortogonaalisuus, matriisityyppejä ja spektrejä Reaalinen Kompleksinen Symmetrinen: A T = A Hermiittinen: A T = A Vinosymmetrinen: A T = A A T = A Ortogonaalinen: A T = A 1 A T = A 1. Merkintöjä: A = A T, usein merkitään myös A, myös A H esiintyy ("hermitointi"). Merkintä A on sama kuin Matlab:ssa. Käyttämällä merkintää A (tai vastaavaa synonyymia), voidaan yllä olevat ehdot lausua yhtenäisesti: Hermiittinen tai symmetrisen ehto on: A = A, jne. Aloitamme lemmalla, joka on hyödyllinen monissa seuraavissa todistuksissa. Huomaa, että vaikka olisimme kiinnostuneita vain reaalisista matriiseista, on alla olevat laskut suoritettava kompleksiluvuilla, koska ominaisarvot ja ominaisvektorit saattavat sisältää kompleksilukuja. Lemma 3.1. Olkoon A (m n)- matriisi ja olkoot u C n ja v C m. Tällöin Au, v = u, A v. Tod. Au, v = (Au) T v = u T A T v = }{{} A T =A u T A v = u, A v. 3.1. Ortogonaaliset matriisit. Ortogonaalisen matriisin prototyyppi on tason kierto. Toinen tyypillinen on heijastus jonkin origon kautta kulkevan suoran suhteen. Näiden matriisit ovat [ cos (φ) sin (φ) sin (φ) cos (φ) ja [ cos (φ) sin (φ) sin (φ) cos (φ). Edellisen determinantti = 1 ja jälkimmäisen 1. Determinanttien kertosäännön perusteella ortogonaaliselle matriisille pätee aina: (det A) = det(aa T ) = det I = 1, joten det A = ±1. Lause 3. (KRE Thm. 3). Reaalinen matriisi A on ortogonaalinen, jos ja vain jos sen rivit muodostavat ortonormaalin joukon, jos ja vain jos sen sarakkeet muodostavat ortonormaalin joukon. Tod. Eipä muuta, kuin ajatellaan matriisitulon määritelmää yhtälössä A T A = I. Jos merkitään rivivektoreita a i. ja sarakevektoreita a.j, niin (A T A) ij = a T i.a.j = a.i, a.j. Jos merkitään δ ij :llä ns. Kroneckerin deltaa, joka lyhyesti sanottuna tarkoittaa yksikkömatriisin alkiota (I) ij, niin ehto A T A = I merkitsee samaa kuin (A T A) ij = δ ij, eli a.i, a.j = δ ij, joka tarkoittaa juuri sarakevektorien ortonormaalisuutta. Rivivektoreilla aivan vastaavasti tarkastelemalla tuloa AA T = I.

Kääntäen muistamme "lineaarialgebran ihmeen": r(a T ) = r(a), jonka perusteella jo toinen ehdoista AA T = I tai A T A = I takaa käänteismatriisin olemassaolon, eli sen, että molemmat ovat voimassa. Siten sarakkeiden (ja yhtä hyvin rivien) ortonormaalisuudesta seuraa matriisin ortogonaalisuus. Lause 3.3 (KRE s. 38, Lop. s. 730). Ortogonaalinen kuvaus säilyttää sisätulon ja siten vektorin normin, ts. Au, Av = u, v. Tod. Olkoon u = Aa, v = Ab. u, v = Aa, Ab = A Aa, b = a, b, koska A A = I. Erityisesti u = u, u = a, a = a. Listataan myös edellä laskettu det ominaisuus lauseeksi: Lause 3.4. Ortogonaalisen matriisin det = ±1. Lause 3.5. Ortogonaalisen matriisin ominaisarvot ovat yksikköympyrällä, ts, λ = 1 kaikille ominaisarvoille λ. Tod. Kuten edellä totesimme, Au = u. Jos u, λ on omisarvo/-vektoripari, niin Au = λu, u 0. u = Au = λ u. Koska u = 0, voidaan sillä jakaa, ja saadaan λ = 1. Huomautus 3.1. Yllä oleva todistus menee sanasta sanaan myös unitaariselle. 3.. Symmetrinen (hermiittinen) ja vinosymmetrinen matriisi. Lause 3.6 (Lop s. 73, KRE8 s. 387). (Hiukan eri muodot) Olkoon A symmetrinen reaalinen matriisi (kohdassa (1b) vinosymmetrinen). (1) A:n ominaisarvot ovat reaaliset. (1 b) Vinosymmtrisen A :n puhtaasti imaginaariset () A:n eri ominaisarvoja vastaavat ominaisvektorit ovat ortogonaaliset. (3) A:n ominaisvektoreista voidaan muodostaa jopa ortonormaali kanta R n :lle. (4) A on diagonalisoituva, diagonalisoiva matriisi voidaan valita ortogonaaliseksi, ts. voidaan kirjoittaa A = SDS T, missä S on ortogonaalinen. Tod. (1) Olkoon Ax = λx, x 0. Huomaa, että seuraavat laskut on tehtävä kompleksiluvuilla, koska emmehän voi todistuksessa käyttää väitettä hyväksi! :-) Turvaudumme tuohon mainioon lemmaan, jonka jälkeen kaikki risuaidat saadaan jättää taakse. Ax, x = λ x, x = λ x. Tuon mainitun mainion mukaan vasen puoli on: x, A T x = x, Ax = x, λx = λ x, x. Siis λ x = λ x, josta jakamalla x : lla ( 0) saadaan λ = λ, eli λ R.

Vinosymmtrinen tapaus menee aivan samoin, paitsi -merkki, joka antaa johtopäätöksen: λ = λ, joka merkitsee sitä, että reaaliosa on nolla, kuten väitettiin. () Olkoon Ax = λx, Ay = µy, λ µ. Ax, y = x, Ay Ax, y = λx, y = λ x, y x, Ay = x, µy =µ x, y (µ = µ). Koska λ = µ, on oltava x, y = 0. (3) Tämä on syvällisempi tulos, todistetaan kylläkin L3:ssa (kts. [TE), perustuu ns. Schur'n hajoitelmaan. (4) Kanta voidaan valita ortonormaaliksi, koska eri ominaisarvoja vastaavat ominaisavaruudet ovat keskenään ortogonaalisia. Kussakin ominaisavaruudessa voidaan suorittaa edellä esitetty Gram-Schmidt'n ortonormalisointi, jolloin saadaan koko avaruuden ON kanta. 6 A voidaan siis diagonalisointilauseen mukaan kirjoittaa muotoon A = V DV 1, missä V :n sarakkeet ovat A :n ominaisvektoreita (samassa järjestyksessä kuin vastaavat ominaisarvot D :ssä. Voidaan siis valitaa V : n sarakkeet ortonormaaleiksi, eli V ortogonaaliseksi, jolloin V 1 = V T. Huomautus 3.. Symmetrisen matriisin diagonaaliesitys ei automaattisesti ole muotoa V DV T, vaan sitä varten on huolehdittava, että (a) V:n sarakkeet on normeerattu ykkösiksi. (b) Useampikertaisia ominaisarvoja vastaavat ominaisvektorit on ortonormeerattu. Huomautus 3.3. Jos käytämme jotain ominaisarvot laskevaa ohjelmaa, emme voi (ilman dokumentointiin perehtymistä) tietää, saadaanko automaattisesti tällainen muoto. Matlab:n tapauksessa helptekstikään ei kerro. Esimerkki-istunto: >> A=rand(10,10); % 10 x 10-satunnaismatriisi. >> A=A*A'; % Eräs tapa tehdä symmetrinen (toinen: A+A') >> [V,D=eig(A); 3 >> V*V' Columns 1 through 8 1.0000-0.0000-0.0000-0.0000 0.0000-0.0000 0.0000-0.0000-0.0000 1.0000-0.0000 0.0000 0.0000 0.0000-0.0000 0.0000-0.0000-0.0000 1.0000-0.0000 0.0000 0.0000 0.0000-0.0000-0.0000 0.0000-0.0000 1.0000 0.0000-0.0000 0.0000-0.0000 0.0000 0.0000 0.0000 0.0000 1.0000-0.0000-0.0000 0.0000-0.0000 0.0000 0.0000-0.0000-0.0000 1.0000 0.0000 0.0000 0.0000-0.0000 0.0000 0.0000-0.0000 0.0000 1.0000 0.0000-0.0000 0.0000-0.0000-0.0000 0.0000 0.0000 0.0000 1.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000-0.0000 0.0000 0.0000-0.0000-0.0000-0.0000 0.0000-0.0000-0.0000 >> format long % Suurempi tulostustarkkuus. >> V*V'; ans(1:5,1:5) 6 ON: ortonormaali, OG: ortogonaalinen

4 1.00000000000000-0.00000000000000-0.00000000000000-0.00000000000000 0.00000000000000-0.00000000000000 1.00000000000000-0.00000000000000 0.00000000000000 0.00000000000000-0.00000000000000-0.00000000000000 1.00000000000000-0.00000000000000 0.00000000000000-0.00000000000000 0.00000000000000-0.00000000000000 1.00000000000000 0.00000000000000 0.00000000000000 0.00000000000000 0.00000000000000 0.00000000000000 1.00000000000000 % Laskentatarkkuuden puitteissa V on ortogonaalinen. >> format % Palataan alkuperäiseen >> diag(d)'; ans(1:9) % Katsotaan vain 9 ekaa, että mahtuu sivulle. 0.004 0.0385 0.199 0.11 0.3841 0.5493 0.9745 1.5073 1.5950 % Ominaisarvot ovat erillisiä. Tämä koe oli vain osittain paljastava. On luonnollista, että satunnaisesti generoidun matriisin ominaisarvot ovat erilliset, niinpä ominaisvektorit ovat automaattisesti ortogonaaliset (koska teimme matriisista symmetrisen), ja kun Matlab aina normeeraa, niin ne ovat ortonormaalit. Yleisesti voidaan asia hoitaa varmasti oikein soveltamalla V matriisiin funktiota orth. >> help orth ORTH Orthogonalization. Q = ORTH(A) is an orthonormal basis for the range of A. That is, Q'*Q = I, the columns of Q span the same space as the columns of A, and the number of columns of Q is the rank of A. See also SVD, RANK, NULL.