Numeeriset menetelmät Luento 6 To 22.9.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 1/38 p. 1/38
Ominaisarvotehtävät Monet sovellukset johtavat ominaisarvotehtäviin Yksi numeerisen matematiikan perustehtävistä (kuten lineaariset yhtälöryhmät) Ominaisarvotehtävien numeerinen ratkaiseminen työläämpää kuin lineaaristen yhtälöryhmien ratkaiseminen Saatavana tehokkaita ja hyvin testattuja implementointeja Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 2/38 p. 2/38
Ominaisarvotehtävät Jos λ R ja x R n, x 0 siten että niin Ax = λx λ on matriisin A R n n ominaisarvo x on sitä vastaava ominaisvektori Ominaisvektori x ei ole yksikäsitteinen: Jos α 0 niin myös αx on ominaisvektori Usein ominaisvektorit skaalataan: x/ x Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 3/38 p. 3/38
Karakteristinen polynomi Koska Ax = λx (A λi)x = 0 niin ominaisarvot ovat karakteristisen polynomin juuret p n (λ) = det(a λi) n-asteisella polynomilla n juurta C n n-matriisilla n ominaisarvoa C Käytännössä ominaisarvoja ei kannata laskea ratkaisemalla karakteristisen polynomin juuret Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 4/38 p. 4/38
Ominaisarvot ja -vektorit Vaikka matriisi on reaalinen, ominaisarvot voivat olla kompleksisia Jos reaalinen matriisi on symmetrinen, ominaisarvot ovat reaalisia Ominaisarvon algebrallinen kertaluku: Kuinka moninkertainen karakteristisen polynomin juuri ominaisarvo on Ominaisarvon geometrinen kertaluku: Ominaisarvoon liittyvien lineaarisesti riippumattomien ominaisvektorien lukumäärä Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 5/38 p. 5/38
Ominaisarvot Matriisi diagonaalimatriisi ala- tai yläkolmiomatriisi reaalinen ja symmetrinen positiivisesti definiitti Ominaisarvot diagonaalialkiot diagonaalialkiot reaaliset aidosti positiiviset Q kääntyvä Matriiseilla A ja Q 1 AQ on samat ominaisarvot A reaalinen ja symmetrinen On olemassa Q T = Q 1 siten, että Q T AQ on diag.matriisi Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 6/38 p. 6/38
Esimerkki 3 1 0 A = 1 2 1 0 1 3 3 λ 1 0 det(a λi) = 1 2 λ 1 0 1 3 λ Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 7/38 p. 7/38
Esimerkki jatkuu 3 λ 1 0 1 2 λ 1 0 1 3 λ 2 λ 1 = (3 λ) 1 3 λ ( 1) 1 1 0 3 λ = (3 λ)(2 λ)(3 λ) (3 λ) (3 λ) = λ 3 + 8λ 2 19λ + 12 λ 1 = 1, λ 2 = 3, λ 3 = 4 Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 8/38 p. 8/38
Esimerkki jatkuu λ 1 = 1 2 1 0 1 1 1 0 1 2 x 1 x 2 x 3 = 0 2x 1 x 2 = 0 x 1 + x 2 x 3 = 0 x 2 + 2x 3 = 0 (x 1, x 2, x 3 ) = (a, 2a, a), missä a R Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 9/38 p. 9/38
Esimerkki jatkuu λ 2 = 3 0 1 0 1 1 1 0 1 0 x 1 x 2 x 3 = 0 x 2 = 0 x 1 x 2 x 3 = 0 x 2 = 0 (x 1, x 2, x 3 ) = (b, 0, b), missä b R Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 10/38 p. 10/38
Esimerkki jatkuu λ 3 = 4 1 1 0 1 2 1 0 1 1 x 1 x 2 x 3 = 0 x 1 x 2 = 0 x 1 2x 2 x 3 = 0 x 2 x 3 = 0 (x 1, x 2, x 3 ) = (c, c, c), missä c R Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 11/38 p. 11/38
Potenssiinkorotusmenetelmä Oletukset: A:n ominaisarvoille on voimassa λ 1 > λ 2 λ 3 λ n Ominaisvektorit normeerattu ν (j) = 1 kaikilla j = 1, 2,..., n Ominaisvektorit lineaarisesti riippumattomat Alkuarvaus x (0) = n i=1 β iν (i), missä β 1 0 Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 12/38 p. 12/38
Potenssiinkorotusmenetelmä Iteraatio: y (k) = Ax (k) c k+1 = y (k) j, missä j siten että y (k) j = max 1 p n { y p (k) } x (k+1) = 1 c k+1 y (k) lim x (k) = ν (1) ja lim c k = λ 1 k k (Saadaan itseisarvoltaan suurin ominaisarvo) Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 13/38 p. 13/38
Pot.kor.men. ominaisuuksia Plussaa: Yksinkertainen ohjelmoida Ei tarvita A:ta kokonaan, riittää että voidaan laskea Ax kaikille x Miinusta: Konvergenssi hidasta, jos λ 2 / λ 1 1 Vaikea tietää etukäteen, ovatko oletukset voimassa Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 14/38 p. 14/38
Käänteinen pot.kor.men. Ax = λx A 1 x = λ 1 x Jos λ n 1 > λ n, voidaan soveltaa menetelmää matriisille A 1 lim x (k) = ν (n) ja lim c k = λ 1 n k k (Saadaan itseisarvoltaan pienin ominaisarvo) Huom: Käänteismatriisia A 1 ei lasketa, vaan ratkaistaan lin. yhtälöryhmä Ay (k) = x (k) Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 15/38 p. 15/38
Siirretty käänteinen pot.kor.men. Ax = λx (A σi) 1 x = (λ σ) 1 x Jos λ 1 > λ 2 > > λ n, voidaan soveltaa menetelmää matriisille (A σi) 1 lim x (k) = ν (j) ja lim c k = (λ j σ) 1 k k missä λ j on lukua σ lähimpänä oleva om.arvo Huom: Ratkaistaan (A σi)y (k) = x (k) Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 16/38 p. 16/38
Similaariset matriisit Matriisit similaarisia, jos niillä on samat om.arvot Olkoon Q kääntyvä Ax = λx AQQ 1 x = λx Q 1 AQQ 1 x = λq 1 x (Q 1 AQ)(Q 1 x) = λ(q 1 x) A ja Q 1 AQ ovat similaarisia Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 17/38 p. 17/38
QR-hajotelma Jokainen reaalinen matriisi A voidaan esittää tulona A = QR missä Q on ortogonaalinen, ts. Q 1 = Q T R on yläkolmiomatriisi QR-hajotelma voidaan muodostaa Householderja/tai Givens-muunnoksilla (ei käsitellä) Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 18/38 p. 18/38
QR-menetelmä A (0) = A Q (k) R (k) = A (k) A (k+1) = R (k) Q (k) Koska A (k+1) = R (k) Q (k) = (Q (k) ) 1 A (k) Q (k) A (k+1) ja A (k) similaarisia Kaikki A (k) :t ja A similaarisia Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 19/38 p. 19/38
QR-menetelmän konvergenssi Jos ominaisarvot reaalisia ja yksinkertaisia lim A (k) = yläkolmiomatriisi k Jos lisäksi A reaalinen ja symmetrinen lim A (k) = diagonaalimatriisi k Molemmissa tapauksissa ominaisarvot diagonaalilla Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 20/38 p. 20/38
Hessenberg-muoto Yleinen matriisi Hessenbergmuodossa 0 Symmetrinen matriisi Hessenberg-muodossa (tridiagonaalinen) 0 0 Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 21/38 p. 21/38
QR-menetelmän soveltaminen Käytännössä QR-menetelmää ei sovelleta täydelle matriisille Yleiselle matriisille: Similaarimuunnos Hessenberg-matriisiksi QR-iteraatio Hessenberg-matriisille Symmetriselle matriisille: Similaarimuunnos tridiagonaalimatriisiksi QR-iteraatio tridiagonaalimatriisille Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 22/38 p. 22/38
Interpolointi Ei tunneta funktion f : R R lauseketta, mutta tiedetään funktion arvot tietyissä pisteissä Tavoite: Arvioidaan funktion arvoja myös muissa pisteissä Korvataan f funktiolla p : R R, jonka lauseke tunnetaan, ja approksimoidaan f(x) p(x) Taulukoidut pisteet: (x i, y i ), missä y i = f(x i ) Interpolantti: p(x i ) = y i kaikilla i = 0, 1,..., n Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 23/38 p. 23/38
Interpolointi Interpolointi: Piste x, jossa arvo halutaan, on jossain havaintopisteiden x i ja x j välissä Ekstrapolointi: Piste x on havaintopisteiden ulkopuolella (x < min{x i } tai x > max{x i }) Approksimointi eli yleinen käyränsovitus: Ei vaadita, että p(x i ) = y i, vaan yleisemmin p(x) f(x) koko välillä Pisteiden ei tarvitse olla järjestyksessä x 0 < x 1 < < x n, mutta se voi olla hyvä ominaisuus esimerkiksi visualisoitaessa Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 24/38 p. 24/38
Interpolantti Interpolantti valitaan jostain yksinkertaisesta funktioluokasta Esimerkiksi: Polynomit, paloittaiset polynomit, rationaalifunktiot Lisäksi voi olla vaatimuksia mm. derivoituvuudesta Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 25/38 p. 25/38
Polynomi-interpolaatio Datapisteet: (x i, y i ), i = 0, 1,..., n, siten että x i x j kun i j Kantafunktiot: ϕ 0, ϕ 1,..., ϕ n Interpolantti kantafunktioiden lineaarikombinaationa: n p(x) = a j ϕ j (x) j=0 missä a 0, a 1,..., a n vapaita parametreja Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 26/38 p. 26/38
Polynomi-interpolaatio Interpolaatioehto: p(x i ) = y i i = 0, 1,..., n Lineaarinen yhtälöryhmä n j=0 a j ϕ j (x i ) = y i, i = 0, 1,..., n Xa = y missä a = [a 0, a 1,..., a n ] T, y = [y 0, y 1,..., y n ] T ja X = (ϕ j (x i )) i,j Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 27/38 p. 27/38
Vandermonden interpolaatiopol. Valitaan kantafunktioiksi monomit: ϕ j (x) = x j p on n-asteinen polynomi ja Vandermonden matriisi on 1 x 0 x 2 0 x 3 0... x n 0 1 x 1 x 2 1 x 3 1... x n 1 X = 1 x 2 x 2 2 x 3 2... x n 2..... 1 x n x 2 n x 3 n... x n n Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 28/38 p. 28/38
Interpolaatiopolynomi Lause: Olkoot datapisteet (x i, y i ), i = 0, 1,..., n, siten että x i x j kun i j On olemassa enintään astetta n oleva polynomi p, jolle p(x i ) = y i i = 0, 1,..., n ja polynomi p on yksikäsitteinen korkeintaan astetta n olevien polynomien joukossa Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 29/38 p. 29/38
Todistus Olkoon z R n+1 siten että Xz = 0 p(x i ) = n j=0 z j x j i = 0 i = 0, 1,..., n p korkeintaan astetta n oleva polynomi, jolla on n + 1 nollakohtaa p 0 z 0 Yhtälöryhmällä Xa = y yksikäs. ratkaisu Interpolaatiopolynomin olemassaolo Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 30/38 p. 30/38
Todistus jatkuu Olkoot p ja q kaksi korkeintaan astetta n olevia interpolaatiopolynomeja Olkoon r = p q r(x i ) = p(x i ) q(x i ) = 0 i = 0, 1,..., n r korkeintaan astetta n oleva polynomi, jolla on n + 1 nollakohtaa r 0 p = q Interpolaatiopolynomin yksikäsitteisyys Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 31/38 p. 31/38
Interpolaatiopol. muodostaminen Vandermonden matriisi häiriöaltis Tarvitaan lineaarisen yhtälöryhmän ratkaiseminen Käytännössä interpolaatiopolynomia ei muodosteta Vandermonden matriisin avulla Lause Interpolaatiopolynomi on aina sama riippumatta siitä miten kantafunktiot on valittu Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 32/38 p. 32/38
Lagrangen muoto Valitaan kantafunktioiksi n ( x xk ) l j (x) = x j x k k=0 k j = (x x 0)...(x x j 1 )(x x j+1 )...(x x n ) (x j x 0 )...(x j x j 1 )(x j x j+1 )...(x j x n ) { 1, i = j l j (x i ) = δ ij = 0, i j Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 33/38 p. 33/38
Lagrangen muoto jatkuu X = (l j (x i )) i,j = δ ij X = I a = y p(x) = n j=0 y j l j (x) Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 34/38 p. 34/38
Esimerkki n = 1: l j (x) = n k=0 k j ( x xk x j x k ) l 0 (x) = x x 1 x 0 x 1, l 1 (x) = x x 0 x 1 x 0 p 1 (x) = y 0 x x 1 x 0 x 1 + y 1 x x 0 x 1 x 0 Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 35/38 p. 35/38
Esimerkki n = 2: l 0 (x) = (x x 1)(x x 2 ) (x 0 x 1 )(x 0 x 2 ) l 1 (x) = (x x 0)(x x 2 ) (x 1 x 0 )(x 1 x 2 ) l 2 (x) = (x x 0)(x x 1 ) (x 2 x 0 )(x 2 x 1 ) p 2 (x) = y 0 l 0 (x) + y 1 l 1 (x) + y 2 l 2 (x) Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 36/38 p. 36/38
Esimerkki jatkuu n = 2: Datapisteet (0, 1), ( 1, 2), (1, 3) (x ( 1))(x 1) p 2 (x) = 1 (0 ( 1))(0 1) (x 0)(x 1) + 2 (( 1) 0)(( 1) 1) (x 0)(x ( 1)) + 3 (1 0)(1 ( 1)) = 1 + 1 2 x + 3 2 x2 Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 37/38 p. 37/38
Lagrangen muoto Kertoimien a j laskeminen triviaalia (a j = y j ) Kantafunktiot l j melko monimutkaisia Jos tunnetaan p n 1, siitä ei ole mitään apua p n :ää laskettaessa Kaikki l j :t joudutaan laskemaan uudestaan Jos halutaan parempi tasapaino kertoimien ja kantafunktioiden vaatiman laskennan välillä Newtonin muoto Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 38/38 p. 38/38