Kurssimateriaalia K3/P3-kursille syksyllä Heikki Apiola. 1. Ominaisarvot ja -vektorit

Samankaltaiset tiedostot
1. Ominaisarvot ja -vektorit

1 Ominaisarvot ja -vektorit

MS-C1340 Lineaarialgebra ja

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

5 OMINAISARVOT JA OMINAISVEKTORIT

Ominaisarvo ja ominaisvektori

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

MS-A0004/A0006 Matriisilaskenta

Similaarisuus. Määritelmä. Huom.

5 Ominaisarvot ja ominaisvektorit

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät

1 Ominaisarvot ja ominaisvektorit

Ortogonaalisen kannan etsiminen

Lineaarikuvauksen R n R m matriisi

Matriisilaskenta Luento 16: Matriisin ominaisarvot ja ominaisvektorit

Esimerkki 4.4. Esimerkki jatkoa. Määrää matriisin ominaisarvot ja -vektorit. Ratk. Nyt

6. OMINAISARVOT JA DIAGONALISOINTI

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja

Päättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1

Luennon ti kalvoja + ominaisarvopruju

6 MATRIISIN DIAGONALISOINTI

1 Matriisit ja lineaariset yhtälöryhmät

Ominaisarvoon 4 liittyvät ominaisvektorit ovat yhtälön Ax = 4x eli yhtälöryhmän x 1 + 2x 2 + x 3 = 4x 1 3x 2 + x 3 = 4x 2 5x 2 x 3 = 4x 3.

Numeeriset menetelmät TIEA381. Luento 5. Kirsi Valjus. Jyväskylän yliopisto. Luento 5 () Numeeriset menetelmät / 28

ominaisvektorit. Nyt 2 3 6

Insinöörimatematiikka D

Ortogonaaliset matriisit, määritelmä 1

Alkeismuunnokset matriisille, sivu 57

C = {(x,y) x,y R} joiden joukossa on määritelty yhteen- ja kertolasku seuraavasti

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Osoita, että täsmälleen yksi vektoriavaruuden ehto ei ole voimassa.

Numeeriset menetelmät

OMINAISARVOISTA JA OMINAISVEKTOREISTA

Insinöörimatematiikka D

Ominaisarvo-hajoitelma ja diagonalisointi

Ominaisarvo ja ominaisvektori

Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41

Matematiikka B2 - TUDI

Ominaisarvot ja ominaisvektorit 140 / 170

Matematiikka B2 - Avoin yliopisto

Lineaarialgebra ja matriisilaskenta I

Kanta ja Kannan-vaihto

Matriisiteoria Harjoitus 1, kevät Olkoon. cos α sin α A(α) = . sin α cos α. Osoita, että A(α + β) = A(α)A(β). Mikä matriisi A(α)A( α) on?

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42

Matemaattinen Analyysi / kertaus

Insinöörimatematiikka D

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Demorastitiedot saat demonstraattori Markus Niskaselta Lineaarialgebra (muut ko) p. 1/104

Lineaarialgebra ja differentiaaliyhtälöt Laskuharjoitus 1 / vko 44

(1.1) Ae j = a k,j e k.

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Determinantti 1 / 30

MS-A0003/A0005 Matriisilaskenta Laskuharjoitus 2 / vko 45

Ennakkotehtävän ratkaisu

Matriisilaskenta, LH4, 2004, ratkaisut 1. Hae seuraavien R 4 :n aliavaruuksien dimensiot, jotka sisältävät vain

Lineaarialgebra ja matriisilaskenta I, HY Kurssikoe Ratkaisuehdotus. 1. (35 pistettä)

Avaruuden R n aliavaruus

Lineaarikuvausten. Lineaarikuvaus. Lineaarikuvauksia. Ydin. Matriisin ydin. aiheita. Aiheet. Lineaarikuvaus. Lineaarikuvauksen matriisi

Tehtäväsarja I Seuraavat tehtävät liittyvät kurssimateriaalin lukuun 7 eli vapauden käsitteeseen ja homogeenisiin

Ominaisvektoreiden lineaarinen riippumattomuus

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

ax + y + 2z = 0 2x + y + az = b 2. Kuvassa alla on esitetty nesteen virtaus eräässä putkistossa.

Tehtäväsarja I Seuraavat tehtävät liittyvät kurssimateriaalin lukuun 7 eli vapauden käsitteeseen ja homogeenisiin

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:

Matriisit ja vektorit Matriisin käsite Matriisialgebra. Olkoon A = , B = Laske A + B, , 1 3 3

Insinöörimatematiikka D

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

1 Avaruuksien ja lineaarikuvausten suora summa

Insinöörimatematiikka D, laskuharjoituksien esimerkkiratkaisut

MS-C1340 Lineaarialgebra ja

2.5. Matriisin avaruudet ja tunnusluvut

Lineaarialgebra ja matriisilaskenta I

MS-C1340 Lineaarialgebra ja

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Talousmatematiikan perusteet: Luento 13. Rajoittamaton optimointi Hessen matriisi Ominaisarvot ja vektorit Ääriarvon laadun tarkastelu

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

1 Lineaariavaruus eli Vektoriavaruus

Lineaarialgebra, kertausta aiheita

Talousmatematiikan perusteet: Luento 10. Lineaarikuvaus Matriisin aste Determinantti Käänteismatriisi

MS-A0003/A0005 Matriisilaskenta Laskuharjoitus 3 /

3.1 Lineaarikuvaukset. MS-A0004/A0006 Matriisilaskenta. 3.1 Lineaarikuvaukset. 3.1 Lineaarikuvaukset

Luento 8: Epälineaarinen optimointi

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

1.1 Vektorit. MS-A0004/A0006 Matriisilaskenta. 1.1 Vektorit. 1.1 Vektorit. Reaalinen n-ulotteinen avaruus on joukko. x 1. R n.

Lineaarialgebra ja differentiaaliyhtälöt Harjoitus 4 / Ratkaisut

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 4 / vko 47

Sisätuloavaruudet. 4. lokakuuta 2006

Insinöörimatematiikka D

Milloin A diagonalisoituva?

Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

802320A LINEAARIALGEBRA OSA I

Ratkaisuehdotukset LH 3 / alkuvko 45

802320A LINEAARIALGEBRA OSA III

Lineaarialgebra ja matriisilaskenta II. LM2, Kesä /141

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Luento 8: Epälineaarinen optimointi

6 Vektoriavaruus R n. 6.1 Lineaarikombinaatio

Talousmatematiikan perusteet: Luento 14. Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu

Transkriptio:

Kurssimateriaalia K3/P3-kursille syksyllä 2003. 8.10.2003 Heikki Apiola Tämä pruju on kiireellä kirjoitettu. Viimeistely viivyttäisi liikaa 1. välikoetta ajatellen. Pyydän kertomaan havaituista virheistä ja puutteista. Kirjoitan tarpeellisen määrän korjaussivuja www-sivulle, joka löytyy hakemistosta...l/. 1. Ominaisarvot ja -vektorit Tarkasteltavana oleva matriisi on koko ajan neliömatriisi, A(n n). Johdanto. Ajatellaan neliömatriisia ennen kaikkea A sen määräämään lineaarikuvauksen kannalta. Tähän asti staattisia ongelmia: lineaarisen yhtälöryhmän ratkaisu. Nyt käsittelemme dynaamisia tehtäviä. Tyypillisesti tarkastelemme iteraatiota Alkupiste x 0, x k+1 = Ax k, k = 0, 1, 2,.... Tällöin joudumme laskemaan matriisin potensseja (joita neliömatriisille voidaan laskea). Sovellutuksina näemme mm. dikreettejä dynaamisia systeemejä (dierenssiyhtälösysteemejä) ja dierentiaaliyhtälösysteemejä. Ominaisarvotehtäviä tulee luonnontieteellissä sovelluksissa vastaan hyvin monessa paikassa. Kyseessä on myös insinöörimatematiikan kaikkein tärkeimpään ydinalueeseen kuuluva aihepiiri. Lisäksi: kaunis kappale lineaarialgebraa. 1.1. Määritelmä ja perusominaisuudet. (Eigenvalues, eigenvectors) A on neliömatriisi (n n) Tarkastellaan yhtälöä (1.1) Ax = λx, λ C Yhtälöllä on aina triviaaliratkaisu x=0, olipa λ mikä tahansa kompleksiluku. Tehtävä: (a) Määritä luku λ siten, että yhtälöllä (1.2) on ei-triviaaleja ratkaisuvektoreita x. (b) Määritä sitten kutakin ratkaisua λ kohti ao. ratkaisuvektorit x. Määritelmä 1.1. Lukua λ sanotaan matriisin A ominaisarvoksi ja vektoria x 0 vastaavaksi ominaisvektoriksi, jos Ax = λx. Geometrisesti ominaisvektori tarkoittaa suuntaa, joka säilyy samana (tai vastakkaisena) sovellettaessa lineaarikuvausta A. Ominaisarvo kuvaa venytys/kutistussuhdetta, negatiivisessa tapauksessa lisäksi suunnan vaihtoa. Tämä kuvailu pätee reaalisiin ominaisarvoihin 1

2 (ja -vektoreihin) nähden. Kompleksisessa tapauksessa tilanne voi olla "epäintuitiivisempi", kannattaa muistaa, että esim. i:llä kertominen merkitsee kiertoa tasossa kulman π/2 verran, joten skalaarilla kertominen ei tarkoita (reaalisella) suoralla pysyttelemistä. Tehtävän muokkaus ratkaistavaan muotoon. (1.2) Ax = λx, λ C (A λi)x = 0 Kyseessä on siis homogeeniyhtälö, jonka kerroinmatriisi sisältää parametrin λ. Se pitää valita siten, että HY:llä on ei-triv. ratkaisuja, ts. Gaussin eliminaation on tuotettava ainakin 1 nollarivi, joten on oltava det(a λi) = 0. Esimerkki 1.1. A = 2 0 4 0 6 0 4 0 2 saadaan mukava tekijöihin jako: Lasketaan ominaisvektorit Muodostetaan D(λ) = det(a λi), tässä tapauksessa D(λ) = (λ + 2) (λ 6) 2 Sijoitetaan karakteristiseen matriisiin K λ = A λi λ:n paikalle vuorollaan kukin ominaisarvo. Ominaisarvoon λ 1 = 2 liittyvät ominaisvektorit K λ1 = 4 0 4 0 8 0 4 0 4 Tässä ei rivioperaatioita tarvita. Alin rivi voidaan jättää pois (identtinen ylimmän kanssa). Voidaan haluttaessa jakaa 1. rivi 4:llä ja toinen 8:lla, muttei sekään ole tarpeen. 2. rivi = x 3 vapaa ja x 2 = 0. 1. rivi = x 1 = x 3. Jos valitaan: x 3 = 1, saadaan v 1 = [ 1, 0, 1] T. Saadaan 1-ulotteinen ominaisavaruus, kuten pitääkin, koska aina pätee: 1 m λ M λ ja viimemainittu on = 1. Yleisesti voitaisiin muodostaa ref (tai rref). ref (K λ1 ) = 2 6 4 4 0 4 0 8 0 3 5 7 Tästä nähdään heti, että nolla-avaruuden dimensio = 1. (n-tukisarakkeiden lkm = nollarvien 0 0 0 lkm, kun kerran on neliömatriisi.) Tässä tapauksessa laskut eivät edellisestä yksinkertaistu, koska matriisi oli jo heti yhtä rivioperaatiota ja normeerausta vaille jopa rref-muodossa. (Huomaa, että 2 2-systeemissä riittää aina rajoittua toiseen yhtälöön (jos ominaisarvot on oikein laskettu, ellei, niin who cares :-)), rivioperaatiota ei siten tarvita ollenkaan.)

Ominaisarvoon λ 2 = 6 liittyvät ominaisvektorit K λ2 = 4 0 4 0 0 0 4 0 4 Nyt jää vain yksi yhtälö, jossa voidaan kaksi muuttujaa valita vapaasti, vaikkapa x 3 ja x 2, ja ratkaisemalla x 1 = x 3. Saadaan kaksi LRT ominaisvektoria valitsemalla ensin x 3 = 1, x 2 = 0 ja sitten päinvastoin x 3 = 0, x 2 = 1 u 1 = [ 1, 0, 1] T, u 2 = [0, 1, 0] T. Kertaluvut ovat taas samat: m λ2 = M λ2 = 2. Jäljempänä esitettävän lauseen mukaan eri ominaisarvoihin liittyvät ominaisvektorit ovat LRT, joten voimme sen turvin suoraan päätellä, että laskemamme 3 ominaisvektoria ovat LRT ja siis R 3 :n kanta. Ilman tuota lausetta täytyisi turvautua ref:iin. Huomautus 1.1. Varo harhaluulemasta, että lineaarinen riippumattomuus voitaisiin todistaa osissa niin, että osoitettaisiin vaikka kaksi vektoria LRT:ksi ja kolmas kummastakin LRT:ksi. Tokihan kolmas voi sijaita kahden virittämässä tasossa (ja muodostaa siis ensinmainittujen kanssa LRV joukon) ja olla kummankin kanssa eri suuntainen. Edellä mainitussa (jäljempänä esitettävässä) lauseessa esiintyvässä "ominaisvektoriniputuksessa"on kyse siitä, että kaikki mahdolliset valinnat eri ominaisavaruuksista antavat LRT vektorijoukon. Palataan tähän vielä tuon lauseen todistuksen yhteydessä. Samalla täydennetään kuennolla kenties hiukan kevyesti käsiteltyä kohtaa. 3 Kaksi peruslausetta. Jos determinantti D(λ) = det(a λi) kehitetään vaikkapa 1. sarakkeen mukaan, nähdään, että se on polynomi, joka on muotoa: D(λ) = ( 1) n λ n +... + det A. Polynomi, jota sanotaan karakteristiseksi polynomiksi, on siis aina astetta n. Algebran peruslauseen mukaan sillä on ainakin yksi 0-kohta kompleksitasossa. Saadaan siten: Lause 1.1 (KRE8 Thm. 1 s. 373). Neliömatriisilla A (n n) on ainakin yksi ja korkeintaan n erillistä ominaisarvoa. Ne voivat olla kompleksisia, vaikka matriisi olisi reaalinen. Karakteristinen polynomi voidaan kirjoittaa muotoon: D(λ) = (λ λ 1 ) k1 (λ λ n ) kn Ominaisarvon λ k algebrallinen kertaluku M λ tarkoittaa kyseisen polynomin nollakohdan kertalukua. Siten M λk ilmaisee siis potenssin p k, jossa tekijä (λ λ k ) esiintyy. Voidaan sanoa, että n n-matriisilla on n kappaletta ominaisarvoja, kun kukin otetaan niin monta kertaa kuin sen algebrallinen kertaluku ilmaisee.

4 Muistutamme, että ominaisarvoon λ liittyvä ominaisavaruus E λ koostuu kaikista λ:aan liittyvistä ominaisvektoreista ja nollavektorista. E λ on vektorialiavaruus, koska se on (A λi):n nolla-avaruus. Tämä on "se toinen lause": Lause 1.2 (KRE8 Thm 2 s. 373). Ominaisavaruus E λ on "nimensä veroinen", siis aliavaruus. KRE- kirjan lause sanoo vain, että vakio kertaa ominaisvektori on edelleen samaan ominaisarvoon liittyvä ominaisvektori. Tämä sinänsä tärkeä huomio on erikoistapaus edellä olevasta. Ominaisarvojen ja -vektorien laskeminen. Edellisen esimerkin mallin mukaan voidaan kirjoittaa yleinen toimintaohje: 1. Muodostetaan karakteristinen polynomi D(λ) = det(a λi) ja ratkaistaan sen nollakohdat, näin saadaan ominaisarvot. 2. Ratkaistaan homogeeniyhtälö (A λi)x = 0, ts. määrätään nolla-avaruus N(A λi) kullakin ominaisarvolla λ. Ratkaisussa on ainakin yksi vapaa parametri, sanokaamme t, joka voidaan valita mielivaltaisesti (esim. t=1). Jos vapaita parametrejä on useita, täytyy pitää huoli siitä, että saadaan lineaarisesti riippumattomat ratkaisuvektorit. Varma valinta esim. tapauksessa "3 vapaata parametria"on: 1. om. vekt. : parametrit: 1, 0, 0 2. om. vekt. : parametrit: 0, 1, 0 3. om. vekt. : parametrit: 0, 0, 1. Huomautus 1.2. 1. Ominaisarvot ovat 1-käs, ominaisvektorit eivät. 2. Kuhunkin ominaisarvoon liittyy ominaisavaruus, päämääränä on löytää jokin kanta ominaisavaruudelle. Käytännön (numeerisista) laskentamenetelmistä Polynomiyhtälön ratkaisussa on useimmiten turvauduttava numeerisiin menetelmiin. Matlabissa on tähän tarkoitukseen funktio roots. Oikeissa numeerisissa menetelmissä lasketaan ensin ominaisvektorit (tai esim. muutama dominoiva ominaisvektori sellaiset, jotka vastaavat muutamaa suurinta ominaisarvoa). Ominaisarvot lasketaan vasta sitten. Itse asiassa Matlabin roots-komennon käyttö ominaisarvotehtävissä on lievää "itsepetosta". Se perustuu algoritmiin, joka laskee annettuun polynomiin liittyvän matriisin, ns. companion matrix:n ominaisvektorit ja sitten ominaisarvot. Sivutuotteena, eräänlaisena kuriositeettina, siitä saadaan helposti kohtuullinen polynomiyhtälön ratkaisija. Ominaisarvojen laskenta tätä kautta on siten hyödyllistä pelkästään perusasioiden opetteluun. Oikeaan laskentaan käytetään komentoa eig.

Matlabin isä Cleve Moler, joka on eräs nykyaikaisen tieteellisen laskennan huomattavia vaikuttajapersoonallisuuksia, pitänee polynomiyhtälön ratkaisemista nykyaikana hieman numeerisen analyysin sivuraiteille kuuluvaksi. Siitä syystä hän ei luultavasti ole kiiruhtanut ottamaan Matlabiin parasta alan algoritmia käyttöön. Myös Matlabin historia on hyvin vahvasti juuri lineaarialgebrassa. Sillä alueella on erityisesti panostettu parhaisiin algoritmeihin, toki sitten myös mm. dierentiaaliyhtälöissä. 1.2. Perusesimerkit: defektiivinen, kompleksinen. Edellä oli esimerkki tapauksesta, jossa algebralliset ja geometriset kertaluvut olivat samoja. Näin ei aina ole. [ ] 0 1 Esimerkki 1.2. Olkoon A = 0 0 D(λ) = λ 2, joten λ = 0 on kaksinkertainen ominaisarvo. Ominaisavaruus on sama kuin A:n nolla-avaruus, jonka virittää vektori [1, 0] T. Siis ominaisarvon 0 geometrinen kertaluku on 1. Matriisi on defektiivinen, ominaisvektoreita ei ole "tarpeeksi". Lause 1.3. Yleisesti pätee: m λ M λ. Aito < on mahdollinen. Tod. Edellinen on jossain määrin syvällinen asia, perustelu on pakko sivuuttaa. Jälkimmäisen perustelee vaikkapa edellinen esimerkki. Esimerkki 1.3. KRE esim. 4 s. 375. Reaalinen matriisi, jolla on kompleksiset ominaisarvot (ja -vektorit) A = [ 0 1 1 0 ] Ominaisarvot λ = ±i, ominaisvektorit: λ = i Ratkaistavaksi tulee yhtälö ix 1 +x 2 = 0. Jos valitaan x 2 = 1, on x 1 = 1/i = i. Saadaan ominaisvektoriksi [ i, 1] T. Yhtä hyvin voidaan kertoa vaikka i:llä, joka antaa: [1, i]. Ominaisarvoa λ = i vastaava ominaisvektori saadaan samalla tavalla. Itse asiassa sitä ei tarvitse koskaan laskea, koska se on aina liittolukua vastaavan ominaisvektorin liittovektori. (Tällä tarkoitamme vektoria, jonka koordinaatit ovat edellisen liittolukuja.) Todistetaan tämä oikein lauseena. Lause 1.4. Reaalisen matriisin kompleksiset ominaisarvot ovat pareittain liittolukuja. Liittolukuja vastaavat ominaisvektorit ovat toistensa liittovektoreita. Tod. 1. D(λ) on reaalikertoiminen polynomi, joten väite seuraa kompleksilukujen peruslauseesta (kts. vaikka kompleksilukupruju). 2. Olkoon u ominaisarvoon λ = α + iβ liittyvä ominaisvektori. Kirjoitetaan u muodossa x + iy. Au = (α + iβ)u = (α + iβ)(x + iy) = αx βy + i(βx + αy). Au = Au = (αx βy)(x iy) = λu. 5

6 Yhteenveto käsitteistä ja määritelmistä. 1. Ominaisavaruus: Tiettyyn ominaisarvoon kuuluvien ominaisvektorien joukko täydennettynä 0-vektorilla (jotta saadaan VA). 2. Spektri= ominaisarvojen joukko (kompleksitason osajoukko) 3. Spektraalisäde: itseisarvoltaan suurimman ominaisarvon itseisarvo. Se antaa ympyrän säteen, jonka sisällä kaikki ominaisarvot (eli spektrin pisteet) ovat. 4. Karakteristinen polynomi : D(λ) = det(a λi). 5. Ominaisarvon λ k algebrallinen kertaluku = p k, kun karakteristinen polynomi esitetään tekijöihin jaetussa muodossa: D(λ) = (λ λ 1 ) k1 (λ λ n ) k n Ominaisarvon λ k algebrallinen kertaluku M λ ilmaisee siis potenssin p k, jossa tekijä (λ λ k ) esiintyy. 6. Geometrinen kertaluku m λ tarkoittaa vastaavan ominaisavaruuden dimensiota. 7. Pätee: m λ M λ 8. Matriisi A on defektiivinen, jos jollain ominaisarvolla λ pätee aito pienemmyys: m λ < M λ 1.3. Sovellutusesimerkkejä. 1.3.1. Joustavan kalvon venytys, lineaarikuvauksen pääakselit. Yksikkökiekko olkoon joustava kalvo, jota muotoilee lineaarikuvauksen [ ] 5 3 A = 3 5 määräämä voimakenttä. Määritä pääsuunnat, eli vektorit, joille siirtymävektori on saman tai vastakkaissuuntainen tuon annetun vektorin kanssa. Ratkaisu Lasketaan ominaisarvot ja -vektorit, helppo homma: λ 1 = 8, λ 2 = 2. Vastaavat ominaisvektorit: u 1 = [1, 1] T, u 2 = [ 1, 1] T (Laskettu myös Matlabilla alla.) Esitetään mielivaltainen tason vektori u ominaisvektorikannassa: u = ξ 1 u 1 + ξ 2 u 2. Tällöin z = Au = ξ 1 Au 1 + Aξ 2 u 2 = ξ 1 λ 1 u 1 + ξ 2 λ 2 u 2 = 8ξ 1 u 1 + 2ξ 2 u 2. Koordinaattien välinen kuvaus on ihana: [ξ 1, ξ 2 ] [8ξ 1, 2ξ 2 ]. (Kumpikin kuvakoordinaatti riippuu vain omasta lähtökoordinaatistaan.)

Tässä tapauksessa sattuu vielä niin onnellisesti, että ominaisvektorit ovat toisiaan vastaan kohtisuorassa 1, jolloin meillä on uusi luonteva suorakulmainen koordinaatisto, johon voimme astua ja esittää pisteiden koordinaatit normaalissa napakoordinaatistossa u 1 u 2 -akselien suhteen. Otetaanpa siis jokin yksikköympyrän piste: cos φu 1 + sin φu 2. Sen kuvapiste on siis 8 cos φu 1 + 2 sin φu 2. Kuvapisteet piirtävät siten ellipsin, jonka esitys pääakselikoordinaatistossa u 1 u 2 on 7 Toisin sanoen Matlab-ajo Tiedostossa../L/paakseli.m { ξ 1 = 8 cos φ ξ 2 = 2 sin φ ( ) 2 ξ1 + 8, ( ) 2 ξ2 = 1. 2 % paakseli.m clear; clf t=linspace(-pi,pi); Yymp=exp(i*t); Yymp=[real(Yymp);imag(Yymp)]; plot(yymp(1,:),yymp(2,:),'b') axis square A=[5 3;3 5] kuva=a*yymp; hold on plot(kuva(1,:),kuva(2,:),'r') shg % Jako 100:aan osaan. % Yksikköympyrän 100 pistettä. % Pisteet matriisin sarakkeiksi % ympyrän kuvapisteet Lasketaan nyt ominaisarvot ja -vektorit. figure(2) [V,D]=eig(A) lam=diag(d) lam = 2 8 clf phi=linspace(-pi,pi); z1=lam(1)*cos(phi);z2=lam(2)*sin(phi); plot(z1,z2,'--g') 1 Jos osaisimme teoriaa enemmän, tietäisimme jo matriisin ulkonäöstä, että näin käy, koska matriisi on symmetrinen.

8 Kuva 1. Yksikköympyrä ja sen kuva axis square axis equal % Kierretään oikeaan asentoon: ell=v*[z1;z2]; hold on plot(ell(1,:),ell(2,:),'r') axis square axis equal u1aks=[[0;0] lam(1)*v(:,1)]; plot(u1aks(1,:),u1aks(2,:),'k') u2aks=[[0;0] lam(2)*v(:,2)]; plot(u2aks(1,:),u2aks(2,:),'k') shg Matlab halusi valita pienemmän ominaisarvon ensin, no annettiin sen tehdä, jolloin peruskoordinaatistossa ellipsi nousi pystyasentoon, mutta samaanpa päätyi koordinaattimuunnoksen (kierron) jälkeen. 1.3.2. Stokastinen matriisi, Markovin prosessi. KRE8 s. 318 (matrix multiplication) Oletetaan, että vuonna 2003 erään kaupungin maankäyttö jakaantuu näin: I asuntoalue 30% II kaupallinen käyttöalue 20% III teollisuusalue 50%

9 Kuva 2. Kuvaellipsi peruskoordinaatistossa ja kierrettynä pääakseleille Oletetaan, että siirtymätodennäköisyydet 5-vuotisjakson aikana saadaan matriisista P= I:stä II:sta III:sta 0.8 0.1 0 I:een 0.1 0.7 0.1 II:een 0.1 0.2 0.9 III:een 2 Matlabilla voidaan iteroida vaikka tähän tapaan. Tulostetaan vaakavektoreina tilan säästön ja selkeyden vuoksi. >> P=[0.8 0.1 0;0.1 0.7 0.1;0.1 0.2 0.9] >> x0=[30;20;50]; >> x0' 30 20 50 % v. 2003 >> x=x0 % x olkoon muuttuja, johon iterointi kohdistuu. >> x=p*x; x' % Selkeyden takia katsotaan vaakasuorassa. 26 22 52 % v. 2008 >> x=p*x; x' 23.0000 23.2000 53.8000 % v. 2013 >> x=p*x; x' 20.7200 23.9200 55.3600 % v. 2018 Tämä oli siis pelkkää matriisikertolaskuharjoittelua. 2 P on sama kuin KRE-kirjan A T

10 Ominaisarvoteoria tulee mukaan, kun kysellään, mitä tapahtuu pitkällä aikavälillä. Voidaan tietysti harrastaa matriisikertolaskua raakaan voimaan turvautuen, mutta se ei anna eväitä analysoida tilannetta. Lasketaanpa ominaisarvot ja -vektorit: >> [V,D]=eig(P) V = -0.1826-0.7071 0.4082-0.3651 0.0000-0.8165-0.9129 0.7071 0.4082 D = 1.0000 0 0 0 0.8000 0 0 0 0.6000 Nähdään, että kaikki ominaisarvot ovat positiivisia, suurin on 1 ja muut ovat pienempiä. Myöhemmin osoitetaan, että eri ominaisarvoihin liittyvät ominaisvektorit ovat LRT, niinpä tässä tapauksessa on. Kun ei sitä vielä ole ollut, katsotaan vanhoilla yleisluontoisilla konsteilla. >> rref(v) 1 0 0 0 1 0 0 0 1 No kyllä vaan! Siispä ne muodostavat R 3 :n kannan. Aivan, kuten äskeisessä esimerkissä, saadaan mahdollisimman yksinkertainen tilanne operoimalla ominaisvektorikannassa. Merkitään ominaisvektoreita: v 1, v 2, v 3, ja esitetään: x 0 = c 1 v 1 + c 2 v 2 + c 3 v 3. No mutta tällöinhän: x 1 = P x 0 = c 1 λ 1 v 1 + c 2 λ 2 v 2 + c 3 λ 3 v 3, missä λ 1 = 1. Jatkamalla iterointia, saadaan: x k = c 1 v 1 + c 2 λ k 2v 2 + c 3 λ k 3v 3. Koska 0 < λ j < 1, kun j = 2, 3, lähenevät 2 viimeistä termiä kohti 0:aa, kun k kasvaa. Siten prosessia dominoi ykköstä (suurinta) ominaisarvoa vastaava ominaisvektori. Rajalla päädytään vektoriin c 1 v 1.

11 Tässä tapauksessa: >> Vx0=[V x0] % Edellähän tehtiin [V,D] = eig(p); Vx0 = -0.1826-0.7071 0.4082 30.0000-0.3651 0.0000-0.8165 20.0000-0.9129 0.7071 0.4082 50.0000 >> rref(vx0) 1.0000 0 0-68.4653 0 1.0000 0-21.2132 0 0 1.0000 6.1237 Niinpä c 1 = 68.4653, joten pitkällä aikavälillä tilanne stabiloituu jakaumaan: >> -68.4653*V(:,1) 12.5000 25.0000 62.5000 Maagista!! Siten saadaan (lähtöpisteestä riippumatta) sellainen ominaisarvoa 1 vastaavan ominaisvektorin suuntainen tulos, jonka koordinaattien summa = 100. small Maagiselta tuntuu kenties se, että c 1 -kerroin on sama riippumatta alkupisteestä. Se selittyy lisäehdosta x 1 + x 2 + x 3 = 100. Tämä ominaisuus säilyy P-matriisilla kerrottaessa, joten rajavektorilla on sama ominaisuus. Siten raja-vektori on sellainen dominoivan ominaisvektorin suuntainen vektori, jonka koordinaatit 0 ja x 1 + x 2 + x 3 = 100. Taatusti siis riippumaton alkupisteen valinnasta. (Koordinaattisumma säilyy sillä: i p i,j = 1 j. Olkoon y i = p ij x j. i y i = i j p ijx j = j ( i p ij)x j = j x j. ) 1.3.3. Populaatiodynamiikkaa. Esimerkki 1.4 (Täpläpöllöjen henkiinjäämistaistelu Kaliforniassa). Vuonna 1990 oli vastakkainasettelu puuteollisuuden ja ympäristönsuojelijoiden välillä. Vanhojen ikimetsien hakkuut ja sen seurauksena mm. täpläpöllöjen tuhoutuminen, vastaan 30000... 100000 työpaikan menetys puuteollisuudessa. Matemaatikot ryhtyivät viileän objektiivisesti tutkimaan. Täpläpöllön elinkaari voidaan jakaa kolmeen luokkaan: 1. Lapsuus, 0 1 v., 2. esiaikuisuus, 1 2 v., 3. aikuisuus, yli 2 v. Keskimääräinen elinikä n. 20 v. Kriittinen ajanjakso on silloin, kun lapsipöllö lähtee pesästään, jolloin sen on löydettävä uusi kotialue ja pari.

12 Mallinnetaan tilannetta tarkastelemalla populaatiota vuoden välein ja jakamalle se näihin kolmeen luokkaan. Oletetaan, että naaraita ja uroita on samanverran, jolloin tarvitsee tarkastella vain naisväkeä. Populaatiovektori vuonna k olkoon x k = [l k, e k, a k ] ("lapsi", "esiaikuinen", "aikuinen"). l k+1 e k+1 a k+1 = 0.18 0 0 0 0 0.33 0 0.71 0.94 l k e k a k 1. rivi: Kukin aikuinen naaras synnyttää keskimäärin 0.33 tyttölapsipöllöä vuonna k (vuoden k+1 alkuun mennessä). 2. rivi: Keskimäärin 0.18 tyttölasta selviytyy esiaikuiseksi vuoden k + 1 alkuun. 3. rivi: Vuoden k esiaikuisista 0.71 selviytyy aikuisuuteen ja aikuisista 0.94 jatkaa aikuiselämää vuonna k + 1. Yllä olevaa matriisia A voidaan kutsua "vaihematriisiksi"("stage matrix"). Tämä on peräisin oikeasta tutkimusaineistosta: Lamberson et. al: Dynamic analysis of the viability of the Northern spotted owl in a fragmented forest environment, julkaisussa: Conservation biology vuodelta 1992. Tässä matriisissa alkio a 2,1 = 0.18 on se, joihin ympäristötekijät eniten vaikuttavat. Jos ikimetsät hakataan aukeiksi, niin tämä arvo käy liian pieneksi. Arvo 0.18 on jo liian pieni, kuten nähdään. Muotoa x k+1 = Ax k olevaa systeemiä sanotaan dierenssiyhtälöksi, usein puhutaan myös diskreetistä dynaamisesta systeemistä. Yllä oleva esimerkki on peräisin kirjasta [?], [?]-kirjassa vastaavanlainen esimerkki esiintyy nimellä Leslie model s. 378, Example 3 Palattaneen tähän esmerkkiin myöhemmin. 1.4. Matriisin diagonalisointi (KRE 7.5). Tutkitaan erityisesti ominaisvektorien ominaisuuksia. Jos ominaisvektoreita on tarpeeksi (n lineaarisesti riippumatonta, kun matriisin koko on n n, saadaan herkkupöytä katetuksi. Määritelmä 1.2. Neliömatriisit A ja B ovat similaariset, jos on olemassa säännöllinen (kääntyvä) P siten, että B = P 1 AP. Merkitään A B. Lause 1.5 (Similaarisuus säilyttää ominaisarvot, KRE Thm 1). Tod. Joko suoraan oma/omvmääritelmästä, nähdään, että jos x on A:n λ:aan liittyvä ominaisvektori, niin y = P 1 x on samaa λ:aa vastaava B:n ominaisvektori, missä B = P 1 AP. Vaihtoehtoinen todistus: D B (λ) = det(b λi) =... = det(a λi) = D A (λ).

Ominaisvektorien ominaisuuksia Lause 1.6 (KRE s. 392). Olkoot λ 1,..., λ k matriisin A erillisiä ominaisarvoja. Tällöin vastaavat ominaisvektorit ovat LRT Tod. 1) Todistetaan ensin 2:n ominaisvektorin tapauksessa. Olk. λ 1 λ 2, ja olkoot v 1 ja v 2 vastaavat ominaisvektorit. Kirjoitetaan vektoriyhtälö c 1 v 1 + c 2 v 2 = 0. Sovelletaan siihen A:ta (eli kerrotaan vasemmalta A:lla) ja käytetään ominaisuutta Av j = λ j v j, j = 1, 2. Gaussin eliminaatiolla saadaan v 1 -osuus nollatuksi, jolloin ehdosta c 2 (λ 2 λ 1 )v 2 = 0 seuraa: c 2 = 0, koska λ 2 λ 1 0. Siten myös c 1 = 0. 2) Askel tapauksesta k = 2 tapaukseen k = 3 saadaan lähtemällä vektoriyhtälöstä 13 c 1 v 1 + c 2 v 2 + c 3 v 3 = 0. Aivan samanlaisella eliminaatioaskeleella kuin edellä, päästään jo todistettuun tapaukseen k = 2, josta päätellään: c 2 = c 3 = 0, mistä edelleen seuraa: c 1 = 0. Yleinen askel k k + 1 on periaatteessa aivan samanlainen. Tästä seuraa välittömästi: Lause 1.7. Jos n n-matriisilla A on n erillistä ominaisarvoa, niin R n :llä (kompl. tap. C n :llä) on A:n ominaisvektoreista koostuva kanta. Tätä käyttäen oltaisiin Markov-prosessi-tehtävässä voitu välttyä ei-dominoivien ominaisvektoreiden laskemiselta. Huomautus 1.3. Ominaisvektorikanta voi olla, vaikka esiintyisi moninkertaisia ominaisarvoja, kuten on nähty. Toisaalta olemme nähneet esimerkkejä (ainakin yhden), jossa käy huonosti: 2 2-matriisilla on vain yksi ominaissuora. Lause 1.8. R n :llä (C n :llä) on A:n ominaisvektorikanta, jos ja vain jos A:n jokaisella ominaisarvolla λ on m λ = M λ. Tod. Kyse on yksinkertaisesti siitä, että jos niputetaan kutakin erillistä ominaisarvoa vastaavien ominaisavaruuksien kannat omiksi nipuikseen, saadaan yhteensä n vektoria, jotka ovat LRT. Otetaan havainnollisuuden vuoksi vaikka kolme ominaisarvoa λ 1, λ 2, λ 3, joiden kertaluvut olkoot 1, 2, 3 vastaavasti. Olkoot vektoriniput {u}, {v 1, v 2 }, {w 1, w 2, w 3 }. Olkoon (c 1 u) + (c 2 v 1 + c 3 v 2 ) + (c 4 w 1 + c 5 w 2 + c 6 w 3 ) = 0. Suluissa olevat vektorilausekkeet ovat kaikki nollavektoreita. Jos nimittäin joku ei olisi, niin otettaisiin summaan kaikki nollasta erilliset sulkulausekkeet. Nämä ovat eri ominaisrvoihin liittyviä ominaisvektoreita, ja siis LRT. Niiden summa = 0, joten ristiriita LRT:n kanssa on valmis.

14 Kussakin sulkulausekkeessa esiintyvät vektorit ovat ao. ominaisavaruuden kantavektoreita (siis LRT), joten on oltava: (c 1 = 0), (c 2 = c 3 = 0), (c 4 = c 5 = c 6 = 0). Erilaisten matriisityyppien (kuten symmetristen, ortogonaalisten ym.) ominaisvektorikäytöstä selvitetään jatkossa. Ne jäävät 1. välikoealueen ulkopuolelle. Ominaisarvokannan arvo, diagonalisointi Jos avaruudella on A:n ominaisvektorikanta {u 1,..., u n, voidaan laskea aivan samoin kuin edellä mm. ellipsiesimerkissä:... Lause 1.9 (Diagonalisointi).... Tod.... [ ] 2 12 Esimerkki 1.5. Laske lauseke A k :lle, kun A =. 1 5 Ratkaisu Diagonalisoidaan: A = V DV 1, [ ] [ ] [ ] 4 3 1 0 1 3 V =, D =, V 1 =. 1 1 0 2 1 4 [ ] [ ] [ ] 4 3 1 0 1 3 Nyt A k = V D k V 1 =. 1 1 0 2 k 1 4 Kun suoritetaan kertolaskut, saadaan: [ ] 3 2 k + 4 12 2 k 12 A k = 2 k + 1 4 2 k 3 Tässä tapauksessa saatiin jopa yksinkertainen kaava A k :lle. Yleensä nyt ei ihan näin pitkälle päästä. Joka tapauksessa saadaan valtava säästö aritmetiikassa ja usein saadaan selkeä näkemys alunperin sotkuiseen asiaan. Lasketaan yksi pieni esimerkki Matlabilla: >> A=[0-4 -6;-1 0-3;1 2 5] A = 0-4 -6-1 0-3 1 2 5 >> [V,D]=eig(A)

15 V = -0.8165 0.5774-0.9269-0.4082 0.5774-0.0850 0.4082-0.5774 0.3656 D = 1.0000 0 0 0 2.0000 0 0 0 2.0000 >> VI=inv(V) VI = -2.4495-4.8990-7.3485-1.7321-1.2075-4.6716 0 3.5634 3.5634 Tarkistetaan, laitetaan A ja V DV 1 vierekkäin (ja lisätään rajaviiva editoimalla). >> [A V*D*VI] 0-4.0000-6.0000-0.0000-4.0000-6.0000-1.0000 0-3.0000-1.0000-0.0000-3.0000 1.0000 2.0000 5.0000 1.0000 2.0000 5.0000 Lasketaan vaikkapa A 16. >> A^16-65534 -262140-393210 -65535-65534 -196605 65535 131070 262141 Lasketaan diagonalisoimalla: >> D16=D^16 D16 = 1.0e+04 * 0.0001 0 0 0 6.5536 0 0 0 6.5536

16 Näin ei oikeastaan kannattaisi laskea. Nyt voimme nimittäin laskea pisteittäisen potenssin, kun on kyse diagonaalimatriisista. Silloin aritmetiikkaa on paljon vähemmän. >> D16=D.^16 D16 = 1.0e+04 * 0.0001 0 0 0 6.5536 0 0 0 6.5536 >> format bank >> V*D16*VI -65534.00-262140.00-393210.00-65535.00-65534.00-196605.00 65535.00 131070.00 262141.00 >> A^16 % Tässä taas vertailuksi raakaa voimaa: -65534.00-262140.00-393210.00-65535.00-65534.00-196605.00 65535.00 131070.00 262141.00 Maankäyttöesimerkki diagonalisoimalla. Edellä esitettiin lähtövektori ominaisvektorikannan avulla. Katsotaan, miltä homma näyttäisi diagonalisoimalla. Esitetään matriisi P muodossa P = V DV 1. Iteraatiojonon k:s termi on x k = P k x 0. Mutta P k = V D k V 1. D k = 1 0 0 0 0.8 k 0 0 0 0.6 k Kun k, niin 1 0 0 Dlim = 0 0 0 0 0 0 >> P=[0.8 0.1 0;0.1 0.7 0.1;0.1 0.2 0.9] >> [V,D]=eig(P) V = -0.1826-0.7071 0.4082-0.3651-0.0000-0.8165

17-0.9129 0.7071 0.4082 D = 1.0000 0 0 0 0.8000 0 0 0 0.6000 >> VI=inv(V) VI = -0.6847-0.6847-0.6847-1.0607-0.3536 0.3536 0.3062-0.9186 0.3062 >> Dlim=diag([1,0,0]) Dlim = 1 0 0 0 0 0 0 0 0 >> V*Dlim*VI 0.1250 0.1250 0.1250 0.2500 0.2500 0.2500 0.6250 0.6250 0.6250 >> Plim=V*Dlim*VI Plim = 0.1250 0.1250 0.1250 0.2500 0.2500 0.2500 0.6250 0.6250 0.6250 >> Plim*[30 20 50]'

18 12.5000 25.0000 62.5000 >> Plim*[99.5.5]' 12.5000 25.0000 62.5000 Muokkaamatonta stua - - Lause 1.10 (SYM). Symmetrisen (yleisemmin hermiittisen) matriisin ominaisarvot ovat reaaliset ja eri ominaisarvoihin liittyvät ominaisvektorit ovat ortogonaaliset. Ei vaikea. [QED] Lause 1.11 (SYMDIAG). Syvällinen. Symmetrisen matriisin jokaisen ominaisarvon algebrallinen ja geometrinen kertaluku on sama. Ts. ominaisvektoreista voidaan muodostaa (jopa ortonormeerattu kanta.) R n :ään. Merkitsee myös: Symmetrinen matriisi on diagonalisoituva "Syvällinen"tarkoittaa: todistus ylittää kurssin vaatimustason, vaan ei tuloksen soveltaminen. [QED] Joitakin esimerkkejä on laskettu (Maplella ja Matlabilla) http://www.math.hut.fi/teaching/k3/03/l/oa1.html-dokussa.