Lemma 1. Olkoon V R n lineaarinen aliavaruus. Lineaarisen kuvauksen F : V R m kuvajoukko F (V R m on lineaarinen aliavaruus, joka koostuu lineaarisen kuvauksen F matriisin M pystyvektorien {M i : i 1,... n} lineaariyhdisteistä y a i M i, missä a (a 1,..., a n V. Todistus. Koska V on lineaarinen aliavaruus, ax 1 + bx 2 V aina kun x 1, x 2 V ja a, b R. Tällöin kuvauksen F lineaarisuuden nojalla F (ax 1 + bx 2 af (x 1 + bf (x 2 F (V. Täten F (V on lineaarinen aliavaruus. Lisäksi vektori y (y 1,..., y m F (V jos (ja vain jos löytyy sellaiset kertoimet x 1,... x n että (x 1,..., x n V ja y i M ij x j, i 1,..., m (2.1 Merkitään yhtälössä (2.1 (M i j : M ij matriisin M i:nen pystyvektorin j:tä elementtiä. Huomautus 6. Kun V R n, W R m ja n < m, niin inversio-ongelma ( on huonosti asetettu, sillä kuva-avaruus R(M {Mx : x V } R m on Lemman 1 nojalla lineaarinen aliavaruus, jonka dimensio on korkeintaan n ja nyt n < m. Esimerkki 7. Olkoon Tarkastellaan inversio-ongelmaa 1 0 M 0 1. 1 1 ( Määrää sellainen x V R 2, että Mx y, missä y W R 3 on annettu. Tutki, onko inversio-ongelma ( hyvin asetettu. Tarkastellaan ensin inversio-ongelman injektiivisyys: Kun vaaditaan, että 0 M x 0 1 0 ( x 1 0 0 1 x1 x x 2 0 1 1 2 x 1 + x 2 niin x 1 x 2 0. Täten inversio-ongelman ratkaisu on aina yksikäsitteinen, kun ratkaisu on olemassa. Tarkastellaan ratkaisun olemassaoloa. Koska maalijoukon W dimensio on 3 ja matriisin M kuva-avaruuden R(M dimensio on 2, niin yhtälöllä ei ole ratkaisua kaikilla y R 3. (Tämän voi havaita myös yrittämällä ratkaista yhtälö 1 0 y 1 y 2 y 3 0 1 1 1 27 ( x1 x 2
esim. Gaussin ja Jordanin elimointimenetelmällä. Täten inversio-ongelma ( on huonosti asetettu. Kerrataan lineaarialgebraa. Matriisin M R m n transpoosi on matriisi Avaruuden R n sisätuloa merkitään (M T ij M ji missä j 1,..., m, i 1,..., n. (x, y x y y T x ( y 1 y n. missä x (x 1,..., x n, y (y 1,..., y n R n. x 1 y n x i y i, Lineaarisen aliavaruuden V R n kanta on lineaarisesti riippumattomien vektorien joukko {e 1,..., e k } V, jolle pätee V {x R n : x k a i e i, a i R, i 1,..., k}. Lineaarisen alivaruuden V R n kanta {e 1,... e k } on ortonormaali, jos { 1, kun i j (e i, e j 0, kun i j, missä i, j 1,..., k. Avaruuden R m luonnollinen kanta koostuu vektoreista e 1 (1, 0, 0,..., 0, e 2 (0.1, 0,..., 0,..., e m (0,..., 0, 1. Määritelmä 5. Olkoon V avaruuden R n lineaarinen aliavaruus ja {e 1,..., e k } sen ortonormaali kanta. Vektorin x R n ortogonaalinen projektio aliavaruudelle V on vektori P (x k (x, e i e i. (2.2 Olkoon Q V R n n linaarisen kuvauksen x P (x matriisi, Matriisia Q V kutsutaan ortogonaaliprojektioksi aliavaruudelle V. Huomautus 7. Ortogonaaliprojektio on muotoa Q V ( e e 1 e 2 e k n k T 2. e T 1. e T k k n 28
Lause 2. Olkoon Q V (i Q T V Q V, ortogonaaliprojektio aliavaruudelle V R n. Silloin (ii Q 2 V Q V ja (iii x V jos ja vain jos Q V x x. Todistus. Kohta (i on harjoitustehtävä. Huomautuksen 7 nojalla Q 2 V Q V Q V ( e T ( e e 1 e 2 e k e1 e 2 e k 2. T 2. e T 1 e T k (e 1, e 1 (e 1, e 2 (e 1, e n e T ( 1 (e 2, e 1 (e 2, e 2 (e 2, e n e T e 1 e 2 e k... 2. (e n, e 1 (e n, e 2 (e n, e n e T k 1 0 0 e T ( 1 0 1 0 e T e 1 e 2 e k... 2. Q V 0 0 1 Jos x V, niin silloin x voidaan esittää aliavaruuden V kantavektorien e 1,..., e k avulla muodossa x k (x, e ie i ja Jos Q V x x, niin ( e1 e 2 e k n k Q V x e T 1 e T 2. e T k k (x, e i Q V e i k n e T k k (x, e i e i x. (e 1, x x n 1 ( (e 2, x e 1 e 2 e k. (e k, x e T 1 e T k k (x, e i e i. Lause 3 (Karakterisaatio. Inversio-ongelmalla ( on ratkaisu, jos ja vain jos Q F (V y y, missä Q F (V on ortogonaalinen projektio kuvajoukolle F (V. Todistus. Lineaarisella inversio-ongelmalla on ratkaisu, jos y F (V, missä F (V on Lemman 2.2.1 nojalla lineaarinen alivaruus. Tämä on Lauseen 2.2.2 kohdan (iii nojalla yhtäpitävää sen kanssa, että Q F (V y y. Karakterisaation avulla voimme tunnistaa ne annetut havainnot y, joilla inversioongelma on ratkaistavissa. Kun matriisi Q F (V on saatu määrittyä, niin riittää laskea matriisikertolasku. Matriisi Q F (V on mahdollista määrätä esim. suorittamalla Gram- Schmidt-menettely matriisin M pystyriveille. 29
2.2.3 Käänteiskuvauksen jatkuvuus Näytetään, että äärellisulotteisissa lineaarisissa inversio-ongelmissa käänteiskuvaus jos se on olemassa on aina jatkuva. Tätä varten palautetaan mieleen Cauchyn ja Schwartzin epäyhtälö. Kun x (x 1,..., x n ja y (y 1,..., y n R n, niin vektorien x ja y sisätulolle pätee Cauchyn ja Schwartz epäyhtälö (x, y x y ( 1 ( 1 2 2 x i y i x i 2 y i 2. Lause 4. Olkoon V R n lineaarinen aliavaruus. Lineaarinen kuvaus F : V R m on jatkuva. Todistus. Näytetään ensin, että väite on totta kun V R n. Merkitään M ij (F (e j i, i 1,..., m, j 1,..., n, missä {e 1,... e n } on avaruuden R n luonnollinen kanta. Lineaarisuuden nojalla F (x F (y 2 F (x y 2 ( 2 M ij (x j y j. Käytetään Cauchy-Schwartzin epäyhtälöä ( 2 ( ( ( M ij (x j y j ij (M 2 (x j y j 2 (M ij 2 x y 2, F (x F (y 2 ( m (M ij 2 x y 2. Täten F on jatkuva. Oletetaan nyt, että V on lineaarinen aliavaruus ja {ẽ 1,... ẽ k } sen ortonormaali kanta avaruuden R n sisätulon suhteen. Kun x k x jẽ j ja y k ỹjẽ j. Samoin kuin yllä F (x F (y 2 ( m k ( M ij 2 k ( x j ỹ j 2, missä Lisäksi M ij (F (ẽ j i, i 1,..., m, j 1,..., k. ( k k k ( x j ỹ j 2 x j ẽ j ỹ j ẽ j, x j ẽ j ỹ j ẽ j x y 2. 30
Korollaari 2 (Ratkaisun jatkuvuus. Inversio-ongelman ( ratkaisu on jatkuva jos kuvaus V x Mx W on bijektio. Todistus. Kuvaus F : x Mx on lineaarinen. Jos F on bijektio, niin F 1 on olemassa. Lineaarisen kuvauksen käänteiskuvaus on myös lineaarinen, sillä jos y F x ja ỹ F x, niin F 1 (ay + bỹ F 1 (af x + bf x F 1 (F (ax + b x ax + b x af 1 (y + bf 1 (ỹ. Lauseen 4 nojalla F 1 on silloin jatkuva. Huomautus 8. Lineaarisessa äärellisulotteisessa inversio-ongelmassa ratkaisun jatkuva riippuminen annetusta datasta seuraa automaattisesti suoran teorian bijektiivisyydestä. Tämä ei päde yleisemmissä tapauksissa. Esimerkki 8. Olkoon suoran teorian matriisi. M ( 1 2 3 1 Tarkastellaan inversio-ongelmaa ( : määrää x R 2 jolle y Mx kun y R 2 on annettu. Tutki, onko inversio-ongelma ( hyvin asetettu. Ratkaisu: Olkoon y (y 1, y 2 R 2. Merkitään x (x 1, x 2, jolloin y Mx ( ( ( y1 1 2 x1. 3 1 y 2 Palautetaan mieleen lineaarialgebrasta, että neliömatriisi M on kääntyvä kun sen determinantti det(m 0. Tällöin M 1 adj(m, missä adj(m on matriisin M liittomatriisi. 2 2-matriisin tapauksessa det(m ( ( 1 ( a b a b 1 d b det ad bc ja. c d c d ad bc c a Koska det(m 1 1 2 3 5 0, niin neliömatriisilla M on käänteismatriisi ( 1 1 2 M 1 1 ( 1 2. 3 1 5 3 1 Tällöin ongelmalla ( on ratkaisu ( ( 1 ( x1 1 2 y1 1 x 2 3 1 y 2 5 Lisäksi ratkaisu on yksikäsitteinen, sillä ( 1 2 3 1 x 2 ( y1 Mx M x M 1 Mx M 1 M x x x. y 2 ( 1 y 5 1 + 2y 5 2 3 y 5 1 1y. 5 2 Ratkaisu riippuu jatkuvasti annetusta datasta Korollaarin 2 nojalla. Inversio-ongelma ( on täten hyvin asetettu. 31
Lause 5 (Neliömatriisin tapaus. Olkoon M R n n ja V W R n. Inversio-ongelma ( on hyvin asetetu, jos ja vain jos det(m 0. Todistus. Kun det(m 0, on olemassa käänteismatriisi M 1. Tällöin ratkaisu on olemassa (x M 1 y, se on yksikäsitteinen (Mx M x M 1 Mx M 1 M x ja ratkaisu riippuu Korollaarin 2 nojalla jatkuvasti annetusta datasta. Täten inversio-ongelma on hyvin asetettu. Meidän tulee vielä näyttää, että inversio-ongelma on huonosti asetettu, kun det(m 0. Tällöin matriisi M ei ole kääntyvä, joten vastaava linearikuvaus F ei voi olla bijektio. Koska hvyin asetetun inversio-ongelman suora teoria on bijektio, niin ongelma on tällöin huonosti asetettu. Esimerkki 9. Olkoon 11 10 14 M 12 11 13 14 13 66 suoran teorian matriisi, V W R 3. Tutki, onko inversio-ongelma ( hyvin asetettu. Ratkaisu: Suoran teorian matriisi M on neliömatriisi ja suora teoria on määritelty koko avaruudessa. Lauseen 5 nojalla riittää tarkastella matriisin M determinanttia det(m 11 (11 ( 66 ( 13 13 10 (12 ( 66 ( 13 14 + 14 (12 13 11 14 11 11 66 + 11 13 13 + 10 12 66 10 13 14 + 14 12 13 14 11 14 ( 121 + 120 66 + 11 13 13 + 2 13 14 14 11 14 66 + 11 13 13 + 2 13 14 14 11 14 66 + 11 13 13 + (26 154 14 66 + 11 13 13 128 (13 + 1 66 + (143 128 13 128 15 13 194 15 (3 + 10 194 45 44 1. Täten inversio-ongelma on hyvin asetettu. 2.3 Ratkaisun häiriöalttius Huonosti asetetun ongelman ratkaisu voi olla altis häiriöille, mutta myös hyvin asetetuilla ongelmilla voi olla erilainen häiriöalttius. Löysästi puhuen voidaan sanoa että ongelma A on huonommin asetettu tai häiriöalttiimpi (eng. more ill-posed/ill-conditioned kuin ongelma B, jos samansuuruinen häiriö datassa muuttaa ongelman A ratkaisua voimakkaammin kuin ongelman B ratkaisua. Esimerkki 10. Tuntemattomasta x on saatu kaksi häiriöistä havaintoa y, ỹ R 8, jotka ovat muotoa y Mx + ε ja ỹ Mx + ε, missä suoran teorian matriisi M, M R 8 ovat muotoa M ij 1 i δ ij ja M ij 2 i δ ij. Tässä δ ij on Kroneckerin delta: δ ij 0 jos i j ja δ ij 1 jos i j. Oletetaan, että 32
tuntemattoman todellinen arvo on (1, 1, 1, 1, 1, 1, 1, 1 ja tehtyyn havaintoon sisältyvä additivinen häiriö ε (0, 0, 0, 0, 0, 0, 0, 0.02. Matriisit M ja M ovat säännöllisiä, mutta M 1 y x + M 1 ε (1, 1, 1, 1, 1, 1, 1, 1.16 ja M 1 ỹ x + M 1 ε (1, 1, 1, 1, 1, 1, 1, 1 + 2 8 0.02 Viimeiseen elementtiin summautuu 2 8 0.02 5.12. Vaikka ongelma on Hadamardin mielessä hyvin asetettu, ei häiriöisellä datalla saatua ratkaisua voi pitää erityisen hyvänä approksimaationa tuntemattomalle. Hyvin asetettu ongelma, jolla on hyvin suuri häiriöalttius, on ominaisuuksiltaan samankaltainen kuin huonosti asetettu ongelma, jonka ratkaisu ei riipu jatkuvasti datasta. Häiriöalttius on vakava asia, sillä suurimmassa osaa käytännön inversio-ongelmista data sisältää epätarkkuuksia ja häiriöitä. 2.3.1 Ehtoluvun määritelmä matriisin M M m n C m n Hermiten liittomatriisi on M M T. Lisäksi luku λ on matriisin M n n ominaisarvo, jos löytyy vektori R n x 0, jolle M x λx. Tällöin vektoria x kutsutaan ominaisvektoriksi. Tiedetään myös, että neliömatriisin M ominaisarvot löytyvät karakteristisen polynomin p(λ det(m λi nollakohdista. Determinantille pätee laskusääntö det(ab det(a det(b. Tulon käänteismatriisille pätee laskusääntö (AB 1 B 1 A 1 Tulon Hermiten liittomatriisille pätee laskusääntö (AB B A. Sisätulolle pätee (Mx, y ( M ij x j y i x j ( M ij y i (x, M T y ja kompleksiarvoisessa tapauksessa (Mx, y M ij x i y j (x, M T y (x, M y. i, Matriisien häiriöalttiuden kvantitaviivisessa vertailussa käytetään ehtolukuja (eng. condition numbers. Määritelmä 6. Matriisin M m n C m n singulaariarvot σ i (M ovat matriisin M M ominaisarvojen λ i nelijöjuuria eli σ i (M λ i, missä i 1,..., n. 33
Huomaa, että matriisin M M ominaisarvot λ i ovat ei-negatiivisia, sillä niitä vastaaville ominaisvektoreille e i pätee 0 (Me i, Me i (M Me i, e i λ i (e i, e i λ i e i 2. Lisäksi det(m M det(m det(m det(m T det(m det(m 2 0 säännöllisille matriiseille, joten nolla ei ole matriisin M M ominaisarvo, kun M on säännöllinen. Määritelmä 7. Säännöllisen matriisin M M n n C n n ehtoluku κ(m on luku κ(m M M 1, missä matriisinormi M σ max (M on matriisin M suurin singulaariarvo. Erilaisia ehtolukuja saataisiin käyttämällä muita matriisinormia. Tällä kurssilla käytetään ainoastaan tavanomaista normia määritelmästä 7. Lause 6. Olkoon M C n n säännöllinen matriisi. Matriisin M 1 suurin singulaariarvo on σ max (M 1 1 σ min (M, missä σ min (M on matriisin M pienin singulaariarvo. Todistuksessa käytetään seuraavia lemmoja. Lemma 2. Olkoon A, B C n n säännöllisiä matriiseja. Silloin matriiseilla AB ja BA on samat ominaisarvot. Todistus. Etsitään ominaisarvoja karakteristisen polynomin avulla. Nyt determinantin laskusääntöjen nojalla det(ab λi det(a(b λa 1 det(a det(b λa 1 det(b λa 1 det(a det((b λa 1 A det(ba λi. Täten matriisien AB ja BA karakteristiset polynomit ovat samat, jolloin myös niiden ominaisarvot ovat samat. Lemma 3. Olkoon A C n n säännöllinen matriisi. Matriisin A 1 ominaisarvot ovat matriisin A ominaisarvojen käänteislukuja. Todistus. Tarkastellaan karakteristista polynomia det(a λi det(a(λ 1 I A 1 λ λ n det(a det(λ 1 I A 1. Koska A on säännöllinen, niin nolla ei ole sen ominaisarvo. Täten λ on matriisin A karakteristisen polynomin nollakohda jos ja vain jos λ 1 on matriisin A 1 karakteristisen polynomin nollakohta. 34
Todistus. (Lause 6 Määrätään matriisin M 1 singulaariarvot. Tätä varten lasketaan (M 1 M 1 (M 1 M 1 (MM 1, jonka ominaisarvot ovat Lemman 3 nojalla matriisin MM ominaisarvojen käänteislukuja. Lemman 2 nojalla matriisin MM ominaisarvot ovat samat kuin matriisilla M M. Täten matriisin M 1 singulaariarvot ovat matriisin M singulaariarvojen käänteislukuja. Erityisesti matriisinormi σ max (M 1 1 σ min (M. Korollaari 3. Olkoon M C n n säännöllinen matriisi. Matriisin M ehtoluku κ(m σ max(m σ min (M, missä σ max (M on matriisin M suurin singulaariarvo ja σ min (M on matriisin M pienin ominaisarvo. 2.3.2 Ehtoluvun tulkinta Olkoon x R n ratkaisu yhtälölle y Mx. Olkoon annettu data y + δy, missä δy R n edustaa häiriötä. Häiriö δy datassa johtaa häiriöiseen ratkaisuun x + δx joka toteuttaa yhtälön y + δy M(x + δx. Ryhdytään vertailemaan häiriöiden suhteellisia suuruuksia δx x Tarkastellaan ensin termiä Mx y. Normin ja sisätulon välisen yhteyden nojalla ja δy y. Mx 2 (Mx, Mx (M Mx, x. (2.3 Palautetaan lineaarialgebrasta mieleen spektraalilause. Lause 7. Olkoon A : V V itseadjungoitu lineaarinen kuvaus äärellisulotteisessa sisätuloavaruudessa V. Tällöin avaruudella V on ortonormaali kanta, joka koostuu kuvauksen A ominaisvektoreista. Nyt M M on itseadjuntoitu matriisi (eli (M M M M. Merkitään λ i matriisin M M ominaisarvoja ja e i niitä vastaavia ominaisvektoreita. Lauseen 7 nojalla vektorilla x on esitys x n x ie i, missä (x 1,..., x n R n ovat vektorin x koordinaatit matriisin M M ominaisvektorien e i muodostamassa ortonormaalikannassa. Silloin neliömuoto (2.3 voidaan kirjoittaa spektraalilauseen avulla muodossa ( (M Mx, x x im Me i, x ie i λ i x i 2. Arvioimalla ominaisarvoja ylöspäin suurimmalla ominaisarvolla saadaan epäyhtälö y Mx max λi x σ max (M x x 1 i n 35 y σ max (M. (2.4
Sama pätee myös käänteismatriisille M 1 muodossa δx M 1 δy 1 min 1 i n λi δy δx δy σ min (M, (2.5 missä on käytetty Lemmaa 3. Ratkaisun suhteellinen virheelle pätee epäyhtälöiden (2.4 ja (2.5 nojalla δx x δy σ min(m 1 y σ 1 max κ(m δy y. Ehtoluku antaa ratkaisun suhteelliselle virheelle ylärajan. Kun ehtoluku on hyvin suuri (luokkaa > 10 5, niin pelkät pyöristysvirheet alkavat haitata yhtälön numeerista ratkaisua. Esimerkki 11. Identtisen matriisin ehtoluku on 1. Tämä on myös pienin mahdollinen ehtoluku. Esimerkki 12. Esimerkissä 10 matriisien ehtoluvut ovat κ(m 8 ja κ( M 1 2 28 128 Esimerkki 13. Lasketaan matriisin 11 10 14 M 12 11 13 14 13 66 ehtoluku. Lasketaan ensin 11 10 14 M T M 12 11 13 14 13 66 11 10 14 461 424 926 12 11 13 424 390 861. 14 13 66 926 861 4721 T Tämän matriisin ominaisarvot löytyvät karakteristisen polynomin 461 λ 424 926 p(λ det 424 390 λ 861 926 861 4721 λ nollakohdista eli asetetaan p(λ (461 λ ((390 λ (4721 λ 861 2 424 (424 (4721 λ 861 926 0. 926 (424 ( 861 (390 λ ( 926 Yhtälöllä (2.6 on kolme ratkaisua λ 1, λ 2 ja λ 3, joiden neliöjuuret ovat ( λ 1, λ 2, λ 3 (0.0006, 21.8, 71.4. 36 (2.6
Tällöin ehtoluku on κ(m 71.4 0.0006 105. Olkoon y Mx + ε annettu. Jos ε 1/5, niin mitä saadaan selville vektorista x? Tarkastellaan tilannetta, jossa tuntematon x (0, 0, 1 ja ɛ (0.1, 0.1, 0.1. Silloin ja Koska matriisin M determinantti Mx ( 14 13 66 T y Mx + ε ( 14.1 13.1 65.9 T. det(m 11 (11 ( 66 ( 13 13 10 (12 ( 66 ( 13 14+14 (12 13 11 14 1, niin sen käänteismatriisi on 11 ( 66 ( 13 13 (12 ( 66 ( 13 14 12 13 11 14 M 1 (10 ( 66 14 13 11 ( 66 14 14 (11 13 10 14 10 ( 13 14 11 (11 ( 13 14 12 11 11 10 12 557 842 284 610 922 311 2 3 1 Käyttämällä matriisin M käänteismatriisia saadaan T M 1 (Mx + ɛ x + ( 168 3 10 184 3 10 6 10 T, mikä on sangen kaukana vektorista x (0, 0, 1. Esimerkki 14. Työstetään vielä inversio-ongelmien kannalta hiukan patologisempi esimerkki dekonvoluutiosta. Lähdetään tarkastelemaan konvoluutiota g( θ π π R( θ θf(θdθ, missä θ [ π, π] ja funktiot R ja f ovat kahdesti jatkuvasti derivoituvia 2π-periodisia funktioita eli R(θ + n2π R(θ ja f(θ + n2π f(θ jokaisella n Z. Oletetaan lisäksi, että R on symmetrinen ja ei-negatiivinen funktio eli R(θ R( θ ja R(θ 0, t [0, π]. Oletetaan, että meille on annettu data g(θ 1,..., g(θ n, missä θ j hj π, j 1,.., n ja h 2π n, n 2m jollakin m > 3 ja funktio R tunnetaan. Mitä silloin tiedetään funktiosta f? Tiedämme, että Riemannin integraali g( θ saadaan raja-arvona Riemannin summista S n ( θ R( θ θ (n j f(θ (n j h n, 37
kun välin jakoa tihennetään (erityisesti dyadisesti kun n 2 m ja m. Kirjoitetaan nyt annetut arvot muodossa ( π g(θ k R(θ k θf(θdθ S n (θ k + S n (θ k missä approksimaatiovirhe Merkitään sekä π R(θ k θ j f(θ j h + e k, e k π π R(θ k θf(θdθ S n (θ k. M kj R(θ k θ j h x k f(θ k ja y k g(θ k kun k, j 1,..., n. Voimme korvata alkuperäisen ongelman matriisiyhtälöllä, y Mx + e. jossa annettu data y on epätarkka. Ryhdytään arvioimaan matriisin M ehtolukua. Matriisi M on R(0 R( h R( 2h R( (n 2h R( (n 1h R(h R(0 R( h R( (n 3h R( (n 2h M h R(2h R(h R(0 R( (n 4h R( (n 2h..... R((n 1h R((n 2h R((n 3h R(h R(0 Funktion R jaksollisuuden ansiosta matriisi M on ns. sirkulantti matriisi. Yleisesti matriisia M R n n kutsutaan sirkulantiksi (eng. circulant matrix, jos se on muotoa m 1 m n m n 1 m 3 m 2 m 2 m 1 m n m 4 m 3 M m 3 m 2 m 1 m 5 m 4..... m n m n 1 m n 2 m 2 m 1 jollakin vektorilla (m 1,..., m n R n. 38
Lemma 4. Sirkulantin matriisin M R n n ominaisarvot ovat λ k m j exp( 2πi(j 1(k 1/n, k 1,.., n. ja sirkulantti matriisi M on unitaarisesti similaarinen diagonaalimatriisin kanssa (eli on olemassa unitaarinen matriisi U, jolle U MU on diagonaalimatriisi. Todistus. Näytetään ensin, että on olemassa ei-triviaali vektori F (k R n, jolle MF (k λ k F (k jokaisella k 1,..., n. Valitaan Lasketaan mitä on (MF (k j F (k j exp(2πi(j 1(k 1/n, k, j 1,..., n. l1 M jl F (k l m (j l+1mod n exp(2πi(l 1(k 1/n l1 m L exp(2πi(j L(k 1/n λ k exp(2π(j 1(k 1 L1 λ k F (k j. Selvästi F (k 0, joten λ k on ominaisarvo. Osoitetaan seuraavaksi, että ominaisvektorit ovat ortogonaalisia. Jos k l, niin ominaisvektoreiden F (k ja F (l sisätulo (F (k, F (l exp(2πi(j 1(k 1/n exp( 2πi(j 1(l 1/n exp(2πi(j 1(k l/n n 1 z j 1 j 0 z j 1 zn 1 z 1 exp(2πi(k l 1 exp(2πi(k l/n 0, missä käytimme geometrisen sarjan osasummaa luvulle z exp(2πi(k l/n 1. Lisäksi jos k l, niin sisätulo (F (k, F (k exp(2πi(j 1(k 1/n exp( 2πi(j 1(k 1/n n. Asetetaan U 1 n (F (1,..., F (n. Tällöin U U 1 n F (1T. F (nt (F (1,..., F (n I n n. Siis U on unitaarinen. Lisäksi MU Udiag(λ 1,..., λ n, josta similaarisuus seuraa. 39
Sirkulantin matriisin M ominaisarvojen itseisarvot ovat sen singulaariarvoja, sillä matriisi M M Udiag( λ 1,..., λ n U Udiag(λ 1,..., λ n U Udiag( λ 1 2,..., λ n 2 U on similaarinen matriisin diag( λ 1 2,..., λ n 2 kanssa ja similaarisilla matriiseilla on samat ominaisarvot. Olkoon nyt m j R(h(j 1h, j 1,..., n. Vastaavan sirkulantin matriisin M ominaisarvot ovat λ k hr(h(j 1 exp( 2πi(j 1(k 1/n. Oletetaan, että matriisi M on säännöllinen. Jos k 1, niin λ 1 hr(h(j 1 Jos k n/2 + 1 (n on parillinen, niin Matriisin ehtoluvulle saadaan arvio λ n/2+1 ( 1 j 1 hr(h(j 1. κ(m λ 1 λ n/2+1. Sievennetään summalauseketta käyttäen hyväksi funktion R jaksollisuutta ja symmetriaa. Kirjoitetaan aluksi λ n/2+1 parilliset ja parittomat j analyysin peruslause ( 1 j 1 hr(h(j 1 n/2 1 h R(h(2J + 1 + R(h(2J J0 n/2 1 h (2J+1h (2Jh dθ (θdθ. J0 Jaetaan summalauseke kahteen osaa: integraaleihin välin [0, π] osavälien yli ja integraa- 40
leihin välin [π, 2π] osavälien yli : λ n/2+1 h J0 J J n/4 h J0 π nh 2 h J0 jaksollisuus h J0 Tehdään muuttujan vaihto θ θ λ n/2+1 h J0 R antisymmetrinen h (2J+1h (2Jh (2J+1h (2Jh (2J+1h (2Jh (2J+1h (2Jh (2J+1h (2Jh (2J+1h J0 (2Jh n/2 1 dθ (θdθ + (2J+1h Jn/4 (2Jh dθ (θdθ dθ (θdθ + (2(J +n/4+1h J 0 (2(J +n/4h dθ (θdθ dθ (θdθ + (2J +1h+π J 0 (2J h+π dθ (θdθ dθ (θdθ + (2J +1h π (2J h π dθ (θdθ. J 0 dθ (θdθ + dθ (θdθ + J 0 J 0 π (2J h π (2J +1h π (2J h π (2J +1h dθ ( θ dθ dθ (θ dθ Vaihdetaan vielä summausindeksiksi J n/4 J 1 (2J+1h λ n/2+1 h J0 (2Jh dθ (θdθ + π 2(n/4 J 1h J0 π 2(n/4 J 1h h dθ (θ dθ (2J+1h h (2J+1h+h J0 (2Jh dθ (θdθ + (2Jh+h dθ (θ dθ (2J+1h θθ h h (θ (θ + hdθ (2Jh dθ dθ. J0 Käytetään analyysin peruslausetta vielä uudestaan (2J+1h θ+h λ n/2+1 h d 2 R (2Jh θ dθ 2 (θ dθ dθ. Viemällä itseisarvomerkit integraalien sisälle saamme arvion π θ+h λ n/2+1 h sup d 2 R 0 θ θ dθ 2 (θ dθ dθ h 2 π sup d 2 R θ dθ 2 (θ, J0 41
jolloin κ(m n n hr(0 h 2 π sup θ R (θ R(0 2π 2 sup θ R (θ O(n. Mitä suurempi n on sitä epästabiilimpaa on matriisin M n n kääntäminen. Tämä on tyypillistä käytöstä silottavien konvoluutioiden äärellisulotteisille approksimaatioille. 2.4 Yhteenveto Äärellisulotteisessa lineaarisessa inversio-ongelmassa suora teoria F : V W on lineaarinen kuvaus kahden äärellisulotteisen lineaarisen aliavaruuden V, W välillä. Suora teoria voidaan esittää matriisin M avulla. Äärellisulotteinen lineaarinen inversio-ongelma on hyvin asetettu, jos jokaisella y W yhtälölle y Mx löytyy ratkaisu x V. yhtälöllä Mx 0 on aliavaruudessa V ainoastaan triviaali ratkaisu x 0. Äärellisulotteinen lineaarinen inversio-ongelma on huonosti asetettu, jos edes toinen seuraavista väitteistä on totta: jollakin y W yhtälöllä y Mx ei ole ratkaisua x V. löytyy x V, jolle x 0 ja Mx 0. Kun neliömatriisin M tapauksessa pyritään selvittämään onko ongelma hyvin asetettu, riittää tarkastella onko matriisi säännöllinen (eli det(m 0. Jos datassa on liikaa häiriöitä, voi hyvin asetetun ongelman ratkaisu olla etäällä tarkasta ratkaisusta. Hyvin asetettu ongelma, jolla on hyvin suuri häiriöalttius, on ominaisuuksiltaan samankaltainen kuin huonosti asetettu ongelma, jonka ratkaisu ei riipu jatkuvasti datasta. Osattava: tutkia onko annettu äärellisulotteinen lineaarinen inversio-ongelma hyvin asetettu. tunnistaa ja antaa esimerkkejä äärellisulotteisista lineaarisista huonosti asetetuista ongelmista. määritellä matriisin ehtoluku laskea annetun matriisin ehtoluku Ymmärrettävä: mitä eroa on häiriöherkällä ja huonosti asetetulla ongelmalla miten ehtoluku liittyy häirityn yhtälöryhmän ratkaisujen tarkkuuteen. Tiedettävä: 42
mitä tarkoittaa tarkka data ja häiriöinen data että funktioita approksimoidaan numeerisessa laskennassa äärellisulotteisilla vektoreilla. että huonosti asetettua inversio-ongelmaa approksimoivan hyvin asetetun inversioongelman häiriöalttius voi kasvaa kun approksimaatiota pyritään tarkentamaan. 43