TMA.111 Matemaattinen analyysi c Matti Laaksonen, 2003

Koko: px
Aloita esitys sivulta:

Download "TMA.111 Matemaattinen analyysi c Matti Laaksonen, 2003"

Transkriptio

1 Matemaattinen analyysi 003, sisältö:. Johdanto.. Kurssin tavoitteet TMA. Matemaattinen analyysi c Matti Laaksonen, 003 Vaasan Yliopisto, 003 Teknillinen tiedekunta Matemaattisten tieteiden laitos PL 700 (Wolffintie 34) 650 VAASA Vaasan yliopisto. Matriisilaskentaa 3.. Lineaarialgebran kertausta 3.. Sisätulo janormi 5.. Lineaarinen riippumattomuus ja kanta 7..3 Kannanvaihto 3.. Matriisin rangi 7.3. Lineaarikuvaus 0.3. Lineaarikuvauksen matriisi 0.3. Ydin ja kuva 4.4. Matriisin ominaisarvot 7.5. Similaarisuus Matriisin diagonalisointi Matriisin LU-hajoitelma Matriisin QR-hajoitelma Matriisin singulaariarvohajoitelma 4.0. Matriisin definiittisyys 43.. Yleinen lineaariavaruus* * 3. Ääriarvotehtäviä Yhden muuttujan tapaus, kertaus Kahden muuttujan tapaus ilman rajoitteita Gradientti, välttämätön ehto Hessian, riittävä ehto Optimin etsiminen numeerisesti Esimerkkejä Monen muuttujan tapaus ilman rajoitteita Rajoitteellinen optimointi, yhtälörajoite Sijoituskeino Lagrangen kertojat, yhtälörajoite Resurssirajoite, resurssin varjohinta Rajoitteellinen optimointi, epäyhtälörajoite Graafinen ratkaisu Laskeva ja käypä suunta Lagrangen kertojat, epäyhtälörajoite Optimointitehtävän relaksaatio Pienimmän neliösumman menetelmä Approksimointi polynomilla 9

2 0.. Kurssin tavoitteet 3.6. Lineaarisen mallin sovitus Jonot ja sarjat Supremum ja infimum Jonon suppeneminen Sarjan suppeneminen Majoranttiperiaate, suppenemistestejä Transientin kassavirran nykyarvo Potenssisarja, suppenemisväli Taylorin ja MacLaurinin sarjat Taylorin polynomi 9 5. Dynaamisen ilmiön mallinnus Differentiaaliyhtälö Ensimmäisen kertaluvun DY Separoituva DY Muotoa y f( y x ) oleva DY Lineaarinen. kertaluvun diff.yhtälö Sovelluksia Lääkkeen määrä elimistössä Eksponentiaalinen kasvu Logistinen kasvu Auton hinta Numeerinen simulointi kertaluvun lineaarinen vakiokert. DY kertaluvun lin. vakiokert. DY-ryhmä Yleinen tasapainon stabiilisuus Kirjallisuutta *. Johdanto. Kurssin tavoitteet Tämän kurssin tavoite on antaa opiskelijalle matemaattiset valmiudet jatkaa operaatioanalyysin ja taloustieteiden opiskelua. Jatkossa opiskelija saa tutustua sovelluksiin, joissa saatu hyöty riippuu monesta muuttujasta. Luonnollinen tehtävä silloin on löytää muuttujille sellaiset arvot, että hyöty saadaan mahdollisimman suureksi. Tämän perustehtävän ratkaisemista sanotaan optimoinniksi. Jo talousmatematiikan perusteissa tutustuttiin lineaariseen optimointiin. Tällä kurssilla tavoitefunktio ja rajoitteet saavat olla epälineaarisia. Kurssin sisältö jakautuu karkeasti neljään osaan:. matriisilaskentaa. optimointia 3. jonoja ja sarjoja 4. differentiaaliyhtälöitä Kurssin alussa esitettäviä matriisien ominaisuuksia tarvitaan myöhemmin optimoinnin ja differentiaaliyhtälöiden yhteydessä. Matriiseja opiskelija tulee tarvitsemaan muillakin kursseilla, joten asiakokonaisuus on tärkeä. Matriisiosuus alkaa lineaarialgebran kertauksella, jota luultavasti ei tämän kurssin tentissä tulla kysymään. Missä kertaus loppuu ja uusi materiaali alkaa riippuu kulloisenkin vuoden luennoijasta ja edeltävien kurssien toteutuksesta. * merkinnät, sanonnat * matriisilaskut Excel:llä *graafiset esitykset * analyysi, harjoittele kirjainten käsittelyä lausekkeissa

3 . Johdanto.. Lineaarialgebran kertausta 3. Matriisilaskentaa. Lineaarialgebran kertausta Merkitsemme koulumatematiikasta tuttua vektoria ~v ~i + 3~j sarake matriisilla v ( 3) T 3 Merkintätavan muutos helpottaa jatkossa siirtymistä useammankuinkahdenko- ordinaatin vektoreihin. Yhteenlasku ja reaaliluvulla kertominen on nyt helposti määriteltävissä Perinteinen ja hyvä tapa saada mielikuva edellä olleista vektoreista on ajatella ne siirtymisinä. ( 3 ) T kaksi oikealle ja kolme ylös, ( 5 ) T viisi oikealle ja yksi ylös ja ( 3 ) T +(5 ) T kaksi oikealle ja kolme ylös ja vielä viisi oikealle ja yksi ylös seitsemän oikealle ja neljä ylös (ks. Kuva.). Käytämme n-alkioisten vektoreiden joukolle merkintää IR n {a (a a... a n ) T a j IR,j,,...,n}. Sanomme IR n :ää n-ulotteiseksi Euklidiseksi vektoriavaruudeksi. IR,IR ja IR 3 ovat lukion matematiikasta tutut lukusuora, taso ja kolmiulotteinen avaruus. (Meidän käyttämämme merkintä IR n muistuttaa siitä, että vekrotin koordinaatit a j ovat reaalilukuja. Monessa kirjassa halutaan korostaa Eukleideen nimeä, ja sillon vastaava merkintä yleensä one n.)

4 4. Matriisilaskentaa.. Lineaarialgebran kertausta 5.. Sisätulo ja normi Kahden vektorin a IR 3 ja b IR 3 sisätulo ha bi ja vektorin a IR 3 normi kak määritellään seuraavasti ha bi a T b (a a a 3 ) b b a b + a b + a 3 b 3 (.6) b 3 kak p q ha ai a + a + a 3 (.7) Sisätulo on siis lukiosta tuttu pistetulo ja normi on vektorin pituus. Nyt yleistämme seuraavasti. Figure.: ( 3 ) T +(5 ) T (7 4) T Yleistämme IR :ssa niin luonnolliset yhteenlasku- ja reaaliluvulla kertomis-säännöt IR n :ään seuraavasti. Olkoot a (a a... a n ) IR n, b (b b... b n ) IR n, c (c c... c n ) IR n ja µ IR. a + b c c j a j + b j, j,...,n (.) µa c c j µa j, j,...,n (.) On tärkeätä huomata, että vektoreille on sovittu kahden vektorin yhteenlasku ja vektorin kertominen reaaliluvulla, mutta kahden vektorin kertomista ei ole määritelty. Yllä sovittu merkintä, noudattelee matriisinotaatiota. Joskus on tarpeen erotella matriisin alkioita (vektorin koordinaatteja) toisistaan. Seuraavassa kaksi esimerkkiä, joissa erottimet ovat tarpeen. ax yz (ax, yz ) T, Sovitaan vielä merkinnöistä.4 (.4;.3) T,.3 0 ( ) T (.3) (... ) T (.4) e k (δ k δ k... δ nk ) T, (.5) missä δ kk, ja δ jk 0, kun j 6 k Esimerkiksi IR 3 :ssa 0 0 0,, e 0, e 0, e Määritelmä.. Kahden vektorin a IR n ja b IR n sisätulo ha bi ja vektorin a IR n normi kak ovat ha bi a T b a b + a b a n b n (.8) kak p q ha ai a + a a n (.9) Sisätulon arvo on reaaliluku, joten sisätulo ei ole vektoreiden välinen laskutoimitus. (Siksi vältämme nyt pistetulomerkintää.) Kahden vektorin sanotaan olevan kohtisuorassa toisiaan vastaan eli ortogonaaliset (merkitään a b) jos niiden sisätulo on nolla, a b ha bi 0. Normi on mitta vektorin suuruudelle. Kaksi vektoria ovat lähellä toisiaan, jos niiden erotuksen normi on pieni Esimerkki.. Olkoon a IR N N:stä havaintoarvosta muodostuva havaintovektori (aikasarja). Havaintosarjan keskiarvo on µ a (a + a a N )/N N ha i (.0) Havaintojen poikkeama keskiarvosta (vaihtelu) saadaan vähentämällä keskiarvojo- kaisesta havainnosta ã (a µ a,a µ a,...,a N µ a ) T a µ a (.) Vaihtelun suuruutta on tapana mitata varianssilla s a,jokaon s a kãk N (N ) ha µ a a µ a i (N ) (ha ai µ a ha i µ a h ai + µ ah i) at a Nµ a N ( IR) (.) Olkoon b IR N toinen aikasarja ja µ b sen keskiarvo ja b IR N sen poikkeama keskiarvosta. Jos kummankin aikasarjan poikkeamat keskiarvosta noudattavat yhteistä rytmiä, niin tulo ã j bj on useimmiten positiivinen. Silloin hã bi P ã j bj on

5 6. Matriisilaskentaa positiivinen. Tätä yhteisvaihtelua on tapana mitata kovarianssilla cov(a, b) hã bi N (N a) ha µ a b µ b i (N a) (ha bi µ b ha i µ a h bi + µ a µ b h i) at b Nµ a µ b (.3) N Kahden aikasarjan välinen korrelaatio r ab määritellään lausekkeella r ab cov(a, b) s a s b (.4) Seuraavassa taulukossa on kolme aikasarjaa ja vastaavat varianssit, kovarianssit ja korrelaatiokertoimet. j a j b j c j µ a.03 µ b.959 µ c s a 0.9 s b 0.49 s c cov(a, b) 0.0, r a,b 0.6 cov(a, c) 0.3, r a,c 0.94 cov(b, c) 0.04, r b,c Esimerkki.. Yhteisvaihtelua käsitellään paljon riippuvuusanalyysin kurssilla. Tälä kurssilla emme jatka aiheen käsittelyä enempää kuin yhdellä huomiolla. Koska usein taloudelliset aikasarjat esitetään muodossa, jossa havaintojen keskiarvo on likimain nolla, ymmärretään helposti aikasarjojen ortogonaalisuus ja korreloimattomuus samaksi asiaksi. Tämä ei kuitenkaan ole totta. Seuraava vastaesimerkki osoittaa eron. j a j b j -,000 3,000,000 5, ,000, ,000 3, ,000 4,000 6,000 5,000 µ s.. cov(a, b). r a,b.000, ha bi 0.. Lineaarialgebran kertausta 7 Aikasarjat korreloivat täydellisesti, vaikka ovatkin keskenään ortogonaaliset... lineaarinen riippumattomuus ja kanta Esimerkki..3 Olkoon yrityksen A osakkeen arvo 0 C ja yrityksen B osakkeen arvo 0 C. Sijoittaja tarkastelee omaisuutensa rakennetta ryhmittelemällä sijoittamansa rahat kolmeen osaan mekaaninen puunjalostus, paperi ja kemianteollisuus. Yrityksen A liikevaihdosta puolet tulee sahatavarasta ja puolet paperin valmistuksesta. Yrityksen B liikevaihdosta puolet tulee hienopaperista ja puolet värikemikaalien myynnistä. Yritysten osakkeiden arvojen jakautumiset eri toimialoille voidaan esittää vektoreilla v A 0 0, v B 0 5. (.5) 0 5 Sijoittaja haluaa sijoittaa 000 C siten, että 50% sijoituksesta menee paperinvalmistukseen loppu jakautuu tasan mekaanisen puunjalostuksen ja kemian teollisuuden kesken. Tavoitteena on siis jakauma w (.6) 50 Tämä onnistuu ostamalla 5 kappaletta A-osaketta ja 50 kappaletta B-osaketta, sillä w v A +50v B (.7) Toinen sijoittaja haluaa sijoittaa 000 C siten, että 50% sijoituksesta menee mekaaniseen puuhun ja loput tasan paperiteollisuuteen ja kemian teollisuuteen. (Siis

6 8. Matriisilaskentaa w (500; 50; 50) T.) Tämä on jo vaikeampaa. Perusteellinen ratkaisuyritys johtaa seuraavaan päättelyketjuun Gauss Sovimme seuraavista sanonnoista. xv A + yv B w (.8) x y x y :0 : : ei ratkaisua! Määritelmä.. Olkoon u, v, v,...v m IR n vektoreita ja λ, λ,...,λ m IR reaalilukuja. () Jos u λ v + λ v λ mv m niin sanomme, ettävektoriu on lineaarikombinaatio (linear combination) vektoreista {v, v,...,v m }. () Vektorijoukon {v, v,...,v m } IR n kaikkien lineaarikombinaatioiden joukko on sen virittämä aliavaruus (a subspace of IR n spanned by {v, v,...,v m }) span{v, v,...,v m } {u IR n u on lineaarikombinaatio vektoreista v j } ///.. Lineaarialgebran kertausta 9 Määritelmä..3 () Vektorijoukko {v, v,...,v m } IR n on lineaarisesti riippuva (sidottu) (linearly dependent), jos on olemassa reaaliluvut λ, λ,...,λ m IR, joista ainakin yksi ei ole nolla, niin että λ v + λ v λ m v m 0 () Vektorijoukko {v, v,...,v m } IR n on lineaarisesti riippumaton (vapaa) (linearly independent), jos se ei ole sidottu, eli (λ v + λ v λ m v m 0) (λ λ... λ m 0) Lineaarisesti riippuva eli sidottu vektorijoukko voidaan myös luonnehtia sanomalla, että vektorijoukko on sidottu, jos ainakin yksi vektoreista voidaan lausua muiden lineaarikombinaationa. Vektorijoukko ei välttämättä viritä kokoir n :ää. Esimerkissä..3 toisen sijoittajan tavoitejakauma w ei ole toteutettavissa v A :n ja v B :n lineaarikombinaationa (w / span{v A, v B }). Jos toinen sijoittaja haluaa toteuttaa suunnitelmansa, niin hänen tulee etsiä kolmas yritys C niin, että w Span{v A, v B, v C }.Asiaonselvä, jos Span{v A, v B, v C } IR 3. Tämän kappaleen lopussa saamme ehdon sille, että vektorijoukko virittää IR n :n. Määritelmä..4 Jos vektorijoukko E {v, v,...,v m } IR n on lineaarisesti riippumaton, niin sanomme että se on virittämänsä aliavaruuden span{v, v,...,v m } kanta (base). Vektoreita v j E sanotaan kantavektoreiksi. Jos kantavektorit ovat keskenään ortogonaaliset eli hv j v k i 0, kun j 6 k, niin kanta on ortogonaalinen (orthogonal). Jos kanta on ortogonaalinen ja lisäksi kv jk,j,...,m, niin kanta on ortonormitettu (orthonormal). Esimerkki..4 Tutkitaan muodostavatko esimerkin..3 vektorit {v A, v B } virittämänsä aliavaruuden kannan. Lineaarisen riippumattomuuden määritelmän perusteella riittää osoittaa, että (λ v A + λ v B 0) (λ λ 0) Osoitamme tämän seuraavasti λ v A + λ v B 0 λ λ λ 0 0λ + 5λ 0 5λ 0 λ λ

7 0. Matriisilaskentaa Siis vektorit muodostavat kannan. /// Esimerkki..5 Olkoon esimerkin..3 sijoittajilla käytettävissään kolmas osake, C-osake, johon liittyvä jakauma on v C (050) T. Sijoitusneuvoja neuvottelee asiakkaidensa kanssa ja määrittää kullekin sopivan jakauman w. Voidaanko tämä jakauma aina toteuttaa lineaarikombinaationa vektoreista {v A, v B, v C }, eli onko span{v A, v B, v C} IR 3? Olkoon nyt w IR 3 mikä tahansa asiakkaan toivoma painovektori. Määritämme sitä vastaavat lineaarikombinaation kertoimet λ, λ ja λ 3 siten, että λ v A + λ v B + λ 3 v C w (.9) λ λ λ w w (.0) w λ λ λ 3 w w. (.) w 3 Tästä yhtälöryhmästä saadaan λ:t aina ratkaistua, sillä yhtälöryhmän kerroinmatriisin determinantti ei ole nolla. Siis span{v A, v B, v C } IR 3 ja mikä tahansa asiakkaan toivoma painovektori voidaan toteuttaa vektoreiden {v A, v B, v C } lineaarikombinaationa. /// Pian esimerkkimme sijoitusneuvoja saa vastauksen muutamaan peruskysymykseensä. Sitä ennen määrittelemme vielä aliavaruuden dimension ja annamme muutaman muutaman kantoihin liittyvän ominaisuuden lauseiden muodossa. Voidaan osoittaa, että jos lineaarisesti riipppumattomat vektorijoukot E {v, v,...,v p } IR n ja E {u, u,...,u k } IR n virittävät saman lineaarisen aliavaruuden H span(e )span(e ), niin kannoissa E ja E on yhtä monta kantavektoria. Tämä oikeuttaamäärittelemään. Määritelmä..5 Lineaarisen aliavaruuden H IR n dimensio, dim(h) onsen kannan kantavektoreiden lukumäärä... Lineaarialgebran kertausta Lause.. Olkoon E {v, v,...,v m } IR n joukko vektoreita ja olkoon V matriisi, jonka sarakkeina ovat vektorit v, v,...,v m.(v on siis (n m)-matriisi.) Silloin E on IR n :n kanta, jos ja vain jos m n ja lisäksi det(v) 6 0. Todistus. [ ] Oletetaan ensin, että E on IR n :n kanta. Lauseen (..) mukaan m n. Koska m n matriisi V on neliömatriisi ja voimme päätellä seuraavasti (vertaa esimerkin..5päättelyyn) E on kanta E {v, v,...,v n } on lineaarisesti riippumaton ((λ v + λ v λ n v n 0) (λ λ... λ n 0)) λ 0 λ ryhmällä V. 0.. on vain triviaali ratkaisu λ n 0 det(v) 6 0 [ ] Oletetaan toiseksi, että m n ja det(v ) 6 0. Vastaavapäättely kuin edellä osoittaa, että E on lineaarisesti riippumaton. Lisäksi voimme päätellä, että det(v) 6 0 λ λ ryhmällä V. n w on ratkaisu kaikilla w IR λ n jokainen w IR n voidaan lausua lineaarikombinaationa w λ v + λ v λ n v n E virittää IR n :n Siis E on IR n :n kanta. Esimerkki..6 a) Vektorijoukko E 0, 3, Lause.. dim(ir n )n Todistus. Selvästi E {e, e,...,e n} on IR n :n kanta. on IR 3 :n kanta sillä

8 . Matriisilaskentaa b) Vektorijoukko E 0, 3, 7 0 ei ole IR 3 :n kanta sillä c) Vektorijoukko E 3 0, 3 0 ei ole IR 3 :n kanta sillä kantavektoreita on liian vähän (E 3 ei viritä IR 3 :a). d) Vektorijoukko E 4 0, 3, 0, ei ole IR 3 :n kanta sillä kantavektoreita on liian monta (E 4 ei ole vapaa). /// Joissakin tilanteissa laskeminen helpottuu, jos lineaariselle aliavaruudelle H span{v, v,...,v m } on käytettävissä ortonormaali kanta. Voidaan osoittaa, että ortonormaali kanta aina löytyy. Seuraava menettely antaa ortogonaalisen kannan, josta ortonormaali kanta saadaan kertomalla jokainen kantavektori norminsa käänteisluvulla. Lause..3 (Gram-Schmidt) Olkoon {v, v,...,v m } lineaarisesti riippumaton ja H span({v, v,...,v m }) IR n. Jos asetetaan u v u v hv u i hu u i u u 3 v 3 hv 3 u i hu u i u hv 3 u i hu u i u. u m v m hv m u i hu u i u hv m u i hu u i u hv m u m i hu u m i um niin {u, u,...,u m } on H:n ortogonaalinen kanta. Lisäksi Todistus. HT. span{u, u,...,u k } span{v, v,...,v k }, kun k m... Lineaarialgebran kertausta 3 Määritelmä..6 Olkoon H IR n lineaarinen aliavaruus. H:n ortogonaalikomplementti (orthogonal complement) H koostuu niistä IR n :n vektoreista, jotka ovat kohtisuorassa kaikkia H:n vektoreita vastaan. Siis H {x IR n hx hi 0, kaikille h H} Olkoon H IR n lineaarinen aliavaruus ja V {v, v,...,v k } sen kanta. Nyt siis dim(h) k n. Laajennetaan vektorijoukko V kanonisen kannan vektoreilla joukoksi V asettamalla v j v j,kunj,...,k ja v k+i e i,kuni,...,n. Soveltamalla Gram-Schmidt -prosessia tähän vektorijoukkoon sillä muutoksella, että jos askeleella i saadaan u i 0, niin hylätään u i ja jätetään jatkossa u i lausekkeista pois. Tämä Gram-Schmidt -prosessin muunnelma johtaa ortonormaaliin IR n :n kantaan, jonka ensimmäiset k kantavektoria {u, u,...,u k } virittävät H:n ja loput n k kantavektoria {u k+, u k+,...,u n } virittävät H:n ortogonaalikomplementin H. Erityisesti siis dim(h)+dim(h )n (.) ja jokainen x IR n voidaan yksikäsitteisellä tavalla esittää muodossa..3 Kannanvaihto x λ u λ k u {z k + λ } k+ u k λ n u n (.3) {z } H H Laskeminen on aina helpointa, jos käytetään kanonista kantaa E {e, e,...,e n }. (Huomaa merkintäsopimus (.5).) Valitettavasti joskus on pakko vaihtaa kantaa. Seuraava tarkastelu kannattaa ensimmäisellä lukukerralla lukea kursoorisesti. Lue se uudelleen ja tarkemmin, kun siihen myöhemmin viitataan.

9 4. Matriisilaskentaa Määritelmä..7 Olkoon E {u, u,...,u n } lineaariavaruuden IR n kanta. Jos x IR n ja sen esitys kannassa E on Silloin.. Lineaarialgebran kertausta 5 x x u + x u x nu n (.7) x x u + x u x n u n, niin kertoimista muodostamme vektorin x x ~x ~x E. IR n, jota sanomme vektorin x IR n koordinaattivektoriksi kannassa E. (Jos kanta on selvä se jätetään merkitsemättä.) Olkoon seuraavassa E {u, u,...,u n } ja E {u, u,...,u n} kaksi IR n :n kantaa. Koska jokainen E:n kantavektori voidaan lausua yksikäsitteisellä tavalla kannassa E, on olemassa reaaliluvut a ij siten, että u a u + a u a n u n u a u + a u a n u n (.4). u n a n u + a n u a nn u n u u u. u AT. (.5) u n u n Määritelmä..8 Jos kaava (.5) on voimassa, niin sanomme, että A T on kannanvaihtomatriisi. Huomaa, että kaavan (.5) vasen (oikea) puoli ei oikeastaan ole matriisi. Matriisihan on lukukaavio, mutta (.5):ssa on kaavio, jonka alkiot ovat kaavioita. Tällaista tietorakennetta sanomme tensoriksi. Tällä kurssilla emme opettele tensorilaskentaa, mutta on hyvä tuntea termi. Kun lasketaan Mathematica -ohjelmalla tai vastaavalla muulla ohjelmalla matriisilaskuja, tulee lausekkeita kirjoittaessa helposti syntaksivirheitä. Jos silloin virheilmoituksessa esiintyy sana tensor, niin kannattaa tarkistaa, ettei ole sijoittanut matriisin alkioksi vektoria. Olkoon nyt x vektori, jolla on eri kannoissa esitykset x x u + x u x nu n x u + x u x nu n. (.6) x n x (a u + a u a n u n) (.8) + x (a u + a u a n u n) x n (a n u + a n u a nn u n) (a x + a x a n x n )u (.9) +(a x + a x a n x n )u +...+(a n x + a n x a nn x n )u n x a x + a x a n x n x a x + a x a n x n. x n a n x + a n x a nn x n (.30) ~x A~x (.3) Kokoamme joitakin kannanvaihdon ominaisuuksia lauseiksi, joihin vetoamme myöhemmissä kappaleissa. Lause..4 Olkoon E {u, u,...,u n } ja E {u, u,...,u n} kaksi IR n :n kantaa ja x IR n.josa T on kannanvaihtomatriisi siten, että u u u. u AT., u n niin koordinaattivektoreille on voimassa u n ~x A~x ~x A ~x Todistus. Edellä tuli perusteltua kaikki muu paitsi käänteismatriisin A olemassaolo. Matriisin A sarakkeiden tulee olla lineaarisesti riippumattomat, sillä muuten kannan E kantavektorit eivät olisi lineaarisesti riippumattomat. Siis det(a) 6 0. Mistä edelleen seuraa käänteismatriisin olemassaolo. Esimerkki..7 Tarkastellaan IR :n kantoja E {u, u } ja E {u, u }, joille ½ u 0.5u u.5u u A T (.3).5

10 6. Matriisilaskentaa.. Matriisin rangi 7 Todistus. Käytämme matriisin A j:nnestä sarakeesta merkintää a j (a j,a j,...,a nj ) T.Nyt nx nx δ ij hu i u j i h a ki u k a pj u pi (.38) k p à nx n! X nx a ki a pjδ kp a kia kj a T ia j k ha i a j i p k Siis Figure.: Eräs mahdollinen esimerkin..7 realisaatio. A ja A (.33) Vektorin x 3u + u esitys kannassa E saadaan laskemalla ~x A~x 0 (.34) x 3u u (.35) Vektorin y u u esitys kannassa E saadaan laskemalla ~y A ~y µ µ µ (.36) y u + u (.37) Kuvassa. on piirretty esimerkkitilanne, jossa kannanvaihtomatriisi on sama kuin edellä. Huomaa kuitenkin, että laskut edellä laskettiinkäyttän koordinaattivektoreita ja kannanvaihtomatriisia. Lause..5 Olkoon E {u, u,...,u n } ja E {u, u,...,u n} kaksi IR n :n ortonormitettua kantaa. Jos A T on kannanvaihtomatriisi siten, että (u, u,...,u n) T A T (u, u,...,u n) T, niin A T A I eli matriisin A sarakkeet ovat keskenään ortogonaaliset yksikkövektorit ja siis muodostavat IR n :n ortonormitetun kannan. Lause..6 Olkoon E {e, e,...,e n } lineaariavaruuden IR n kanoninen kanta ja E {u, u,...,u n } toinen IR n :n kanta. Olkoon U matriisi, jonka j:s sarake on kannan Ej:s kantavektori u j.olkoonx IR n vektori ja ~x sen koordinaattivektori kannassa E. Silloin x U~x ja ~x U x Todistus. HT. Matriisin rangi Edellisen kappaleen esimerkin..3 sijoittajien käytettävissäonenemmän kuin kaksi tai kolme osaketta. Kun sijoitusneuvoja alkaa muodostaa ratkaisuehdotusta asiakkaalleen, hän ensin määrittää asiakkaan toiveiden mukaisen tavoitejakauman w. Sitten hän valitsee tavoitejakauman mukaisen lineaarikombinaation osakkeista, joita hän nyt pitää parhaina sijoituskohteina w λ v + λ v λ m v m. (.39) Sijoitusneuvojan toimintaa helpottaa suuresti, jos hän jo etukäteen varmistuu siitä, että span{v, v,...,v m } IR 3, (.40) jolloin lineaarikombinaatio (.39) on aina olemassa. Jos m 3, niin {v, v, v 3 } on IR 3 :n kanta ja lineaarikombinaation kertoimet λ, λ, λ 3 ovat yksikäsitteiset. Tämä helpottaa neuvojan työtä, mutta ei ole optimaalista sijoittajan kannalta. Periaatteessa osakkeen j arvo markkinoilla on u (m) j hv j i. Jos kuitenkin sijoittaja antaa osakkeille tästä poikkeavat arvot u j ja tavoitefunktio on lineaarinen, niin lineaarikombinaation (.39) arvo on z u λ + u λ u m λ m. Muodostetaan matriisi V, jonka sarakkeet ovat v, v,..., v m. Sijoittajan kokema höty maksimoituu, kun neuvoja ratkaisee lineaarikombinaation kertoimet

11 8. Matriisilaskentaa λ, λ, λ 3 LP-mallista ½ max z u λ + u λ u m λ m ehdoin λ v + λ v λ m v m w max z u λ + u λ u m λ m ehdoin λ v + λ v λ m v m w λ v + λ v λ m v m w λ v 3 + λ v λ mv 3m w 3 ½ max z ehdoin u T λ Vλ w Tällaisia LP-malleja on käsitelty talousmatematiikan perusteiden kurssilla ja operaatioanalyysin kurssilla niihin paneudutaan lisää. Nyt jätämme sijoitusneuvojan hetkeksi. Palaamme miettimään milloin vektorijoukossa {v, v,...,v m } on riittävästi vektoreita virittämään IR n :n. Ehto (.40) on tosi, jos matriisissa V on n lineaarisesti riippumatonta saraketta. Käytämme jatkossa seuraavia nimityksiä. Määritelmä.. Olkoon a a... a m a A a... a m a n a n... a nm (n m)-matriisi. Matriisin A i:s rivi ja j:s sarake ovat a i (a i a i... a im ) T ja a j... a nj Matriisin A sarakkeiden virittämä IR n :n aliavaruus on Col(A) span{a, a,...,a m } IR n Matriisin A rivien virittämä IR m :n aliavaruus on Row(A) span{a, a,...,a n } IR m a j a j.. Matriisin rangi 9 Määritelmä.. Matriisin A lineaarisesti riippumattomien sarakkeiden lukumäärä on matriisin säännöllisyysaste eli rangi (rank). Toisin sanoen Rank(A) dim(span{a, a,...,a m })dim(col(a)) Englanninkielisissä kirjoissa sanotaan usein (n n)-neliömatriisista A, ettäse on a matrix of full rank jos Rank(A) n. Tämä onyhtäpitävääseuraavien ilmaisujen kanssa A on full rank Rank(A) n dim(col(a)) n matriisin A sarakkeet ovat lineaarisesti riippumattomat det(a) 6 0 A on säännöllinen (eli on olemassa A ) Esimerkki.. Onko span 0, 3,, 3 3, 7 IR3? 0 (.4) Asian voi tarkistaa helposti MatLab-ohjelmalla seuraavasti EDU>> V[ ; - 3 ; 0 ] V EDU>> rank(v) ans Mathematica-ohjelma ei tunne Rank-funktiota vaan TensorRank-funktion. Lyhyt ohje kuuluu: TensorRank[expr] gives the depth to which expr is a full array, with all the parts at a particular level being lists of the same length.

12 0. Matriisilaskentaa In[]: Vlist{{0,,},{3,,0},{,-,},{3,3,},{7,,}} Out[] {{0,,},{3,,0},{,-,},{3,3,},{7,,}} In[]: TensorRank[Vlist] Out[] Siis vektorit eivät viritä IR 3 :a. /// Rangin määrittämistä emme nyt opettele. Periaatteessa on melko helppo kehittää Gram-Schmidt n menetelmästä muunnos, jonka avulla matriisin rangi voidaan selvittää. Käytännössä ongelmaksi muodostuu se, että pyöristysvirheiden takia joskus saadaan laskutoimituksen tuloksena nollan sijasta hyvin pieni luku, joka ei ole nolla. (Esimerkiksi ).3 Lineaarikuvaus.3. Lineaarikuvauksen matriisi Tarkastellaan ensin kuvausta f :IR n IR m. Kuvauksen lineaarisuus määritellään seuraavasti Määritelmä.3. Kuvaus f :IR n IR m, v 7 f(v) onlineaarinen (linear), joss () kaikilla u, v IR n on voimassa f(u + v) f(u)+f(v) () kaikilla u IR n, λ IR on voimassa f(λu) λf(u) Seuraava kuvio saattaa tehdä asian konkreettiseksi. Prosessi panos u prosessi f tuotos f(u) on lineaarinen, jos kahdesta osapanoksesta saatu kokonaistuotos on osatuotosten summa.3. Lineaarikuvaus u + v prosessi f f(u)+ f(v) ja panoksen puolittaminen (lambdaaminen) puolittaa (lambdaa) myös tuotoksen 0.5u prosessi f 0.5f(u). Lineaarisuus oli keskeinen oletus peruskurssilla käsiteltyjen LP-mallien tavoitefunktiolle. Nyt erona LP-mallin tavoitefunktioon on, että sekä panos, että tuotos ovat vektoreita. Esimerkki.3. Yritys valmistaa kahta tuotetta A ja B. Yhden tuotteen valmistamiseen tarvittavat tuotannontekijöiden määrät on luetteloitu seuraavassa taulukossa. tuot. tekijä A B työ (min) 0 30 lasi (m ) 3 alumiinilista (m) 8 Muodostetaan A:n valmistusmäärästä x ja B:n valmistusmäärästä x (päätösmuuttujista) valmistusmäärä-vektori x x. (.4) Tuotannontekijöiden tarpeet, d (työ /min),d (lasi / m ), d 3 (alum.lista / m), kootaan myös vektoriksi d d d. (.43) d 3 Tuotannontekijöiden tarve on funktio tuotantomäärä-vektorista d d 0 30 d 3 x def f(x). (.44) x d 3 8 {z } A Funktio d f(x) Ax on lineaarinen, sillä matriisikertolasku x 7 Ax toteuttaa määritelmän.3. ehdot () ja (). /// Edellisen esimerkin funktio todetaan helposti lineaariseksi, koska se voidaan tulkita matriisilla kertomiseksi. Käänteinen on myös totta. Lause.3. Jos kuvaus f :IR n IR m on lineaarinen, niin on olemassa (m n)- matriisi A siten, että f(x) Ax. Todistus. Olkoon E {e, e,...,e n } vektoriavaruuden IR n kanoninen kanta ja vastaavasti E {e, e,...,e m} vektoriavaruuden IR m kanoninen kanta. (Huomaa x

13 . Matriisilaskentaa merkintäsopimus (.5).) Vektorit f(e i ) IR n voidaan lausua kannan E avulla yksikäsitteisellä tavalla. f(e j )a j e + a j e a mj e m (.45) Kootaan näistä lineaarikombinaatioiden kertoimista matriisi A (a ij ). Jos x ( x x... x n ) IR T, niin merkitään Ax b, jolloin f(x) f(x e + x e x n e n ) f(x e )+f(x e )+...+ f(x n e n ) x f(e )+x f(e )+...+ x n f(e n ) x (a e + a e a m e m)+x (a e + a e a m e m) x n (a n e + a n e a mn e à m) n! à X n! à X n! X a k x k e + a k x k e a mk x k e m k k k 0 0 b 0 b.. + b b 0 m.. b. Ax 0 0 Joskus joudumme käyttämään ei-kanonisia kantoja. (y f(x)) ~y F A F E ~xe f(x):n koordinaatit kannassa F saadaan kertomalla matriisilla A F E vektorin x koordinaatit kannassa E Lause.3. Olkoon L lineaariavaruus ja E {v, v,...,v n } L sen kanta ja olkoon H lineaariavaruus ja F {w, w,...,w m } H sen kanta. Olkoon V matriisi, jonka sarakkeina onat kannan E kantavektorit ja olkoon W matriisi, jonka sarakkeina ovat kannan F kantavektorit. Jos A on lineaarikuvauksen f : L H matriisi kanoonisissa kannoissa, niin f:n matriisi kannoissa E ja F on A F E W AV b m.3. Lineaarikuvaus 3 Todistus. Olkoon y f(x). Suora lasku ja lause..6 antavat ~y F W y W Ax W AV~x E (.46) Määritelmä.3. Olkoon L lineaariavaruus ja E {v, v,...,v n } L sen kanta ja olkoon H lineaariavaruus ja F {w, w,...,w m } H sen kanta. (m n)- matriisi A F E on lineaarikuvauksen f : L H matriisi kannoissa E ja F, jos kaikilla x L ja y H on voimassa Esimerkki.3. Tutkitaan uudelleen esimerkin (.3.) yritystä. Josyritysmyy tuotantonsa kampanjapaketteina seuraavasti myynti- myyntipaketti paketti tuotetta A tuotetta B 0 Suunnittelukauden valmistusmäärä-vektorix (x x ) T jasamankaudenmyynti y (y y ) T (paketteina mitattuna) toteuttavat ehdon x x y x + y 0. (.47) Toisin sanoen myyntivektori y on valmistusmäärä -vektorin koordinaattivektori kannassa E ½µ 0, µ ¾ (.48) Josyrityshankkiitarvitsemansatuotannontekijät kolmelta alihankkijalta panoksina seuraavasti panos panos panos 3 työ (min) lasi (m ) 0 alum.lista (m) Suunnittelukauden tuotannontekijöiden tarve -vektori d (d d d 3 ) T ja saman kauden alihankinta s (s s s 3 ) T (panoksina mitattuna) toteuttavat ehdon d d d s s 0 + s 3 0. (.49) d Toisin sanoen alihankinta-vektori s on tuotannontekijöiden tarve -vektorin koordinaattivektori kannassa F 60 0, 0, 0 (.50) Lauseen (.3.) merkinnöin siis V ja W 0 (.5) 0 0 0

14 4. Matriisilaskentaa ja panosten tarve myynnin funktiona on s W d W Ax W AVy (.5) y /60 /6 / /0 3 y / y Ydin ja kuva Tarkastellaan lineaarikuvausta f :IR n IR m, jonka matriisi kanonisissa kannoissa on (m n)-matriisi A. Määritelmä.3.3 Lineaarikuvauksen f :IR n IR m ydin (kernel) on määrittelyavaruuden IR n osajoukko Ker(f) {x IR n f(x) 0} ja kuva (range) on maaliavaruuden IR m osajoukko f(ir n ){y IR m x IR n siten, että y f(x)} Helposti nähdään, että f:n matriisin A sarakevektoreiden virittämä aliavaruus Col(A) on sama kuin f:n kuva. Seuraavan määritelmän toinen osa ei siis ole ristiriidassa aiemman kanssa Määritelmä.3.4 (m n)-matriisin ydin (null space) on IR n :n aliavaruus Nul(A) {x IR n Ax 0} ja kuva (column space) on IR m :n aliavaruus Col(A) {y IR m x IR n siten, että y Ax} ///.3. Lineaarikuvaus 5 Huomaa, että ytimen määritelmässä tapaamme taas peruskurssilla mainitun asian: Ax voi olla nolla-vektori, vaikka A ei ole nollamatriisi eikä x ole nollavektori. Esimerkki.3.3 Määritetään (3 5)-matriisin 3 A (.53) ydin eli ratkaistaan kaikki yhtälön Ax 0 ratkaisut. Ratkaistaan ryhmä Gaussin algoritmilla 3 Ax 0 Gauss (.54) (.55) (.56) x x x 4 + x 5 0 x 3 + x 4 x 5 0 (.57) 0 0 ½ x x + x 4 x 5 (.58) x 3 x 4 +x 5 Toisin sanoen x, x 4 ja x 5 voidaan valita vapaasti ja x ja x 3 lasketaan sen jälkeen yhtälöistä (.58). Jos asetamme x λ, x 4 λ ja x 5 λ 3, niin x x + x 4 x 5 3 x x x x 4 +x 5 λ 0 +λ +λ 3 (.59) x 4 x x 5 x {z } {z } {z } Siis jokainen x Nul(A) on lausuttavissa yksikäsitteisellä tavalla x λ u +λ u + λ 3u 3. Siis kolmikko U {u, u, u 3 } 0,, (.60) virittää ytimen, eli span{u, u, u 3 } Nul(A). Se on myös vapaa (sivuutamme osoituksen) joten se on ytimen kanta. /// u u u3

15 6. Matriisilaskentaa Esimerkki.3.4 Toiseksi määritämme kannan matriisin 3 A (.6) Todistus..4. Matriisin ominaisarvot 7 Rank(A) dim(col(a)). m dim(col(a) ) (.64).63 m dim(nul(a T )) L.3.3 Rank(A T ) kuvalle, Col(A). Gaussin algoritmin mukaisissa kaavioissa (.54)... (.56) on pivot - alkiot merkitty vahvennettuina. Pivot sarakkeet ovat ensimmäinen ja kolmas. Muissa sarakkeissa ei pivot alkioita ole löytynyt. Helposti nähdään, että sarake, johon ei pivot-alkiota saada, on alkuperäisessä matriisissa lausuttavissa edeltävien sarakkeiden lineaarikombinaationa. Siis lineaarisesti riippumattomien A:n sarakkeiden lukumäärä saadaan laskemalla pivot-sarakkeiden lukumäärä kaaviosta (.56). Vastaavat A:n sarakkeet {a, a 3 }, 5 (.6) 3 ovat Col(A):n kanta. /// Edeltävät esimerkit antavat perustelun seuraavalle väitteelle. Lause.3.3 Olkoon A mikä tahansa (m n)-matriisi. Silloin () dim(nul(a)) + Rank(A) n () (m <n) (dim(nul(a)) > 0) Todistus. Emme esitä tarkkaa todistusta, vaan vetoamme esimerkkeihin.3.3 ja.3.4. Esimerkkien tapauksessa Rank(A) saatiin laskemalla pivot-sarakkeiden lukumäärä kaaviosta (.56) ja dim(nul(a)) saadaan laskemalla ei-pivot -sarakkeet kaaviosta (.56). Sarakkeita (RHS ei ole mukana luvussa) on n kappaletta, joten esimerkin tapauksessa väite on voimassa. Yleisempi todistus sivuutetaan. () seuraa ():stä koska Rank(A) m. Suoraan kokeilemalla näkee, että (Row(A)) Nul(A) ja (Col(A)) Nul(A T ) (.63) Yhdistämällä nämä ja yhtälö (.) lauseeseen.3.3 saadaan. Lause.3.4 Jos A on (m n)-matriisi, niin Rank(A) Rank(A T ).4 Matriisin ominaisarvot Tässä kappaleessa tutkimme asiaa, jonka täydellinen käsittely olisi tämän kurssin kannalta liian raskas kokonaisuus. Siksi poimimme rusinat pullasta, eli esitämme asian viidessä vaiheessa Helppo osa. Ominaisarvot ja ominaisvektorit on helppo määritellä. ( / sivua) Esimerkit. Laskemme läpipariesimerkkiä. Niistä käy ilmi, että ominaisarvo saattaa olla kompleksiluku. Tämä on sovellusten kannalta hankalaa. ( 3sivua) Selityksiä. Tässä osiossa esitellään joitakin nimityksia kompleksisten matriisien teoriasta. Kaikki todistukset sivuutetaan. ( sivu) Rusinat pullasta. Todetaan muutama määritelmistä helposti seuraava ominaisuus. Erityisesti todetaan, että symmetrisen (n n)-matriisin ominaisarvot ovat reaaliset, ja sen ominaisvektorit virittävät IR n :n. Tämä tekee jatkon helpoksi. ( sivu) Sovellukset. Sovellukset ovat myöhemmissä kappaleissa. Mainittakoon: () matriisin diagonalisointi () jälki ja determinantti (3) singulaariarvot (4) definiittisyys (5) dynaamisen mallin kiintopisteen stabiilisuus. Määritelmä.4. Olkoon A (n n)-matriisi ja x IR n. Niitä arvojaλ 0C (tai λ IR), joilla yhtälöryhmällä Ax λx on ei-triviaaleja (x 6 0) ratkaisuja, sanotaan matriisin A ominaisarvoiksi (eigenvalue). Jos Ax λx, niinx on ominaisarvoon λ liittyvä ominaisvektori (eigenvector). Jos määritelmän yhtälöryhmä muutetaan homogeeniseksi Ax λx (.65) Ax λx 0 (A λi)x 0 (.66)

16 8. Matriisilaskentaa niin peruskurssin tietojen perusteella on selvää, että homogeenisella yhtälöryhmällä (.66) on ei-triviaaleja ratkaisuja, jos ja vain jos det(a λi) 0. (.67) Tapaus λ..4. Matriisin ominaisarvot 9 µ 6 µ x x µ x x Edellinen yhtälö tulee niin usein käyttöön, että sovimme seuraavista nimityksistä. Määritelmä.4. Yhtälö det(a λi) 0 on matriisiin A liittyvä karakteristinen yhtälö ja sen vasen puoli P (λ) det(a λi) on matriisiin A liittyvä karakteristinen polynomi. Edeltävistä määritelmistä seuraa nyrkkisääntö ominaisarvot karakteristisen yhtälön juuret Esimerkki.4. Perustapaus. Ratkaistaan matriisin A (.68) 6 ominaisarvot. Muodostetaan karakteristinen polynomi ja ratkaistaan sen nollakohdat. µ 0 P (λ) det(a λi) det λ 6 0 λ 6 λ ( λ)( λ) ( ) ( 6) (.69) λ 3λ 4(λ +)(λ 4) Saamme ominaisarvot (karakteristisen polynomin nollakohdat) λ ja λ 4 (.70) Esimerkki.4. (Perusesimerkki jatkuu.) Ratkaistaan edellisen esimerkin ominaisarvoihin liittyvät ominaisvektorit. /// ½ x x x x 6x + x x 3x x a,a6 0 x 3a Siis: x Tapaus λ 4. x x 4 6 x x ½ x x 4x x 6x + x 4x x x b Siis: x,b6 0 x b Voimme valita a jab ja antaa seuraavan vastauksen. Matriisin ominaisarvot ja vastaavat ominaisvektorit ovat λ, x 3 Tarkistus: 6 3 µ 6 ja λ 4, x. 3 4 /// Esimerkki.4.3 (Kaksinkertainen ominaisarvo.) Ratkaistaan matriisin A 0 0 (.7) 0 3 ominaisarvot ja ominaisvektorit. P (λ) λ 0 0 λ 0 3 λ (.7) ( λ)[( λ)(3 λ) 0] 0+( )[0 ( λ)] ( + λ)(λ 4λ +4) (λ +)(λ )(λ ) OK OK

17 30. Matriisilaskentaa Ominaisarvot ovat siis λ (yksinkertainen juuri) ja λ (karakteristisen yhtälön kertalukua kaksi oleva juuri). Seuraavaksi ratkaisemme ominaisvektorit. Tapaus λ. 0 0 x x x x 0 3 x 3 x 3 Siis: x x x 3 x x + x 3 x x + 3x 3 x 3 x x 3 0 x 3 0 x + 4x a 0 Tapaus λ. 0 0 Siis: x,a6 0 x x x x 0 3 x 3 x 3 x x 3 x x + x 3 x x + 3x 3 x 3 x x 3 0 3x x 3 0 x + x 3 0 x x 3 0 3x + x b b 3b,b6 0 x x ½ x x 3 3x x 3 Voimme valita a jab, jolloin ominaisarvot ja vastaavat ominaisvektorit ovat λ, x 0 ja λ, x ///.4. Matriisin ominaisarvot 3 Esimerkki.4.4 (Kompleksinen ominaisarvo.) Ratkaistaan matriisin A (.73) 0 0 ominaisarvot ja ominaisvektorit. P (λ) λ λ 0 λ (.74) ( λ)(λ +)( λ)(λ + i)(λ i) (.75) Ominaisarvot ovat siis λ, λ i ja λ 3 i. Kompleksiset ominaisarvot ovat uutta ja outoa. Voimme laskea nytkin ominaisvektorit, mutta joudumme hyväksymään sen, että ominaisvektorien koordinaatit ovat kompleksiset. Lasku,jonka nyt sivuutamme, johtaa tulokseen λ, x 0 ja λ i, x 0 ja λ 3 i, x i i /// Kompleksisten matriisien teoria on oleellisesti yksinkertaisempi, kuin teoria joka syntyisi, jos hyväksyisimme vain reaaliset matriisit. Yksi oleellinen syy tähän on se, että hyväksyessämme kompleksiset arvot voimme aina olettaa, että n n-matriisin karakteristinen polynomi voidaan kirjoittaa muotoon P (λ) ( ) n (λ λ )(λ λ ) (λ λ n ). (.76) Sama juuri voi esiintyä edellä useampaan kertaan (kertaluku). Kun korkeampaa kertalukua oleva juuri lasketaan niin monta kertaa, kuin se esiintyy polynomissa (.76), niin voimme sanoa, että (n n)-matriisilla on tasan n ominaisarvoa λ, λ,...,λ n. Lause.4. Olkoon (n n)-matriisin A ominaisarvot λ, λ,...,λ n. Silloin Todistus. det(a) λ λ λ n det(a) det(a 0 I) P (0) (.77).76 ny ( ) n (0 λ )(0 λ ) (0 λ n ) ny k λ k k λ k

18 3. Matriisilaskentaa Lause.4. (n n)-matriisi A on säännöllinen (eli sillä on käänteismatriisi), jos ja vain jos sen ominaisarvot λ, λ,...,λ n ovat kaikki eri suuria kuin 0. Todistus. A det(a) 6 0 (.78) λ λ λ n 6 0 (.79) Matriisin A diagonaalialkioiden summaa kutsutaan matriisin jäljeksi (trace) trace(a) a + a a nn nx a kk. (.80) Lause.4.3 Olkoon (n n)-matriisin A ominaisarvot λ, λ,...,λ n. Silloin Todistus. Sivuutetaan. trace(a) λ + λ λ n Esimerkki.4.5 Esimerkin (.4.3) matriisille A 0 0 ominaisarvot λ, λ, λ 3 (.8) 0 3 Siis λ λ λ 3 ( ) 4 det(a) ok (.8) λ + λ + λ 3 ( )++3trace(A) ok (.83) /// Kompleksisten matriisien tapauksessa sisätulo ja normi on määriteltävä uudelleen. Kompleksiluvun z x + iy liittoluku on z x iy. Silloin k nx k zz(x iy)(x + iy) x + y {z } 0 (.84) z Kompleksisen matriisin A liittomatriisi A saadaan korvaamalla sen jokainen alkio liittoalkiollaan ja matriisin transponointi korvataan matriisin Hermitoinnilla A H A T. λ k.4. Matriisin ominaisarvot 33 Esimerkki.4.6 jos A +i i 0 i 0 5i 3 i i niin A 0 +i ja A H 0 i 0 5i 0 5i 3 i +i 3 /// Erityisesti kompleksiselle vektoreille z (z,z,...,z n ) T 0C n ja w (w,w,...,w n ) T 0C n asetamme nx hz wi z H w z kw k (.85) k v kzk ux z H z t n z k IR (.86) Määritelmä.4.3 Neliömatriisi on normaali (normal), jos A H A AA H. Neliömatriisi on hermiittinen (hermitian), jos A H A. Neliömatriisi on unitaarinen (unitary), jos A H A. Kompleksisten matriisien teoriassa voidaan osoittaa, että normaalin matriisin ominaisvektoreista voidaan valita n vektoria, joista muodostuu lineaarisesti riippumaton joukko, ja hermiittisen matriisin ominaisarvot ovat reaaliset. Reaalisen matriisin hermiittisyys merkitsee symmetrisyyttä A T A, jolloin matriisi on symmetrinen diagonaalinsa suhteen. Esimerkki.4.7 A on symmetrinen sillä A T A (.87) /// Reaalisten matriisien tapauksessa edellä mainitut kompleksisten matriisien teoriasta saadut yleiset tulokset kääntyvät erittäin käyttökelpoiseen muotoon. Seuraava tulos perustuu siihen, että reaalinen symmetrinen matriisi on sekä hermiittinen että normaali. (Käyttökelpoisuus tulee siitä, että useissa sovelluksissa matriisit ovat symmetrisiä.) Lause.4.4 Olkoon A reaalinen (n n)-matriisi. Jos A on symmetrinen A T A, niin sen kaikki ominaisarvot ovat reaalisia ja sen ominaisvektoreista voidaan valita lineaarisesti riippumaton joukko {x, x,...,x n } niin, että Ax j λ j x j kaikilla j,...,n. Valitut ominaisvektorit siis virittävät IR n :n. k

19 34. Matriisilaskentaa Huomaa, että ylläoleva lause on JOS-lause (se ei ole jos ja vain jos-lause ). Esimerkkien matriiseista yksikään ei ole symmetrinen tai edes normaali. Silti kahden ominaisarvot ovat reaaliset ja yhden ominaisvektoreista saadaan valittua n riippumatonta (esimerkki.4.). Lauseen merkitys tulee nähdä siten, että reaalisen symmetrisen matriisin tapauksessa tiedämme jo etukäteen, että ominaisarvojen ja ominaisvektorien laskemisessa ei tule ongelmia..5 Similaarisuus Määritelmä.5. (n n)-matriisit A ja B ovat similaariset (similar), jos on olemassa säännöllinen matriisi T (similariteettimuunnos -matriisi) siten,että A T BT. Jos muunnosmatriisi T on unitaarinen (T T T ) niin A ja B ovat unitaarisimilaariset eli A T T BT. Lause.5. Jos matriisit A ja B ovat similaariset, A T BT, niin () niillä on samat ominaisarvot, () jos x j on A:n ominaisvektori, niin Tx j on samaan ominaisarvoon liittyvä B:n ominaisvektori. Todistus: Matriiseilla on samat karakteristiset polynomit, sillä P B (λ) det(b λi) det(t (B λi)t) (.88) det(t BT λt IT) det(a λi) P A (λ) B(Tx j )TT BTx j TAx j Tλ j x j λ j (Tx j ) (.89).6 Matriisin diagonalisointi.6. Matriisin diagonalisointi 35 Määritelmä.6. Diagonaalimatriisi diag(d,d,...,d n )onn n-matriisi d d diag(d,d,...,d n ) d n Diagonaalimatriisin D diag(d,d,...,d n ) ominaisarvot ja vastaavat ominaisvektorit ovat λ j d j, x j e j (.90) sillä esimerkiksi, kun n 4jaj saamme d d De 0 0 d d 0 0 d e (.9) d Jos lineaarisen kuvauksen f :IR n IR n, y f(x) Dx matriisi on diagonaalinen D diag(d,d,...,d n ), niin kuvaus on varsin yksinkertainen y d x y. d x.. (.9) y n d n x n y:n ensimmäinen koordinaatti riippuu vain x:n ensimmäisestä koordinaatista, jne. Yllä esitetystä herää kysymys. Voidaanko sopivalla kannanvaihdolla (vert. lause.3.) muuttaa lineaarikuvauksen matriisi diagonaaliseksi? Aina se ei onnistu, mutta tietyin ehdoin se onnistuu! Lause.6. Olkoon (n n)-matriisin A ominaisarvot λ, λ,...,λ n. Olkoon x, x,...,x n niitä vastaavat ominaisvektorit (Ax j λ j x j, j,...,n)jaolkoon X matriisi, jonka j:s sarake on j:s ominaisarvo x j. Jos ominaisvektorit x, x,...,x n muodostavat vapaan joukon, niin X AX diag(λ, λ,...,λ n )

20 36. Matriisilaskentaa Esimerkki.6. Esimerkeissä ( ) oli Siis A, λ 6, x 3 X X AX 3 ja λ 4, x ja X /5 /5 3/5 /5 /5 /5 3/5 /5 6 3 /5 /5 4 3/5 / (.93) (.94) (.95) (.96) ///.7. Matriisin LU-hajoitelma 37 Viimeisessä lausekkeessa on nolla-vektori lausuttu lineaarikombinaationa vektoreista x, x,...,x p, joten oletuksen () mukaan lineaarikombinaation kertoimet ovat nollia. Siis b b... b p 0. Silloin yhtälöstä (.97) seuraa, että myös b p 0. Lopputuloson (b x + b x b px p 0) (b b...b n 0), (.98) eli p ensimmäistä ominaisvektoria ovat vapaat. Toistamalla päättely p:n arvoilla, 3,..., n saadaan väite todistettua loppuun. Yhdistämällä edellinen lause ja lause.4.4 lauseeseen.6. saadaan. Lause.6.3 () Jos neliömatriisin kaikki ominaisarvot ovat eri suuria, niin matriisi on diagonalisoituva. () Symmetrinen matriisi (A T A) on diagonalisoituva. Määritelmä.6. Sanomme, että neliömatriisi on diagonalisoituva, jos se on similaarinen diagonaalimatriisin kanssa. Seuraavat lauseet ovat hyödyksi. Lause.6. Jos (n n)-matriisin A ominaisarvot λ, λ,...,λ n ovat kaikki eri suuret, niin vastaavat ominaisvektorit muodostavat linearisesti riippumattoman joukon. Todistus. Oletamme ensin, että () p ensimmäista ominaisvektoria muodostavat vapaan joukon ja osoitamme, että silloin myös () p ensimmästä ominaisvektoria ovat vapaat. jos v px b kx k 0 (.97) k niin 0 Av λ p v px px b kλ kx k b kλ px k k p k X b k (λ k λ p )x k k.7 Matriisin LU-hajoitelma Tässä jakahdessaseuraavassakappaleessakäsitellään matriisien erilaisia hajoitelmia. On tärkeätä huomata, että näitä hajoitelmia on useita. Kirjallisuudesta niitä löytyy vielä lisää. Ratkaistaan kertauksen vuoksi yhtälöryhmä x x 3 0 (.99) x 3 Kun yhtälöryhmä ratkaistaan Gaussin menetelmällä voidaan menetellä seuraavasti (.00) (.0) # yläkolmiomuoto # (row echelon form) (.0) 0 0 #3 #3 x 3 # x ( 6 6x 3)/ ( 6+6)/ 0 (.03) # x 3 4x 7x

21 38. Matriisilaskentaa Jokainen Gaussin algoritmin vaihe voidaan tulkita matriisilla kertomisena. Seuraavat esimerkit selventävät asiaa kerro rivi viidell a: lisää rivi riviin : vaihdarivitja: Kirjoittamalla rivioperaatiot matriisikertolsakuina saadaan {z } 3 6 {z 0 } L A (.04) (.05) (.06) (.07) (.08) 0 0 {z } U Kertomalla vasemmalta ensimmäisen matriisin käänteismatriisilla saadaan {z 0 } 3 {z } 0 0 {z } A L U (.09) Jos Gaussin algoritmin kuluessa (.00.0) joudutaan vaihtamaan rivejä, ei L tule alakolmiomatriisiksi. Toisaalta yhtälöryhmän yhtälöt voidaan aina järjestää niin, ettei Gaussin algoritmissa tarvitse vaihtaa rivejä. Huomaa, että alakolmiomatriisin L diagonaalin alapuoliset alkiot ovat Gaussin algoritmin (.00.0 kuluessa käytettyjen kertoimien vastalukuja. Yläkolmiomatriisi U on kaavion (.0) vasen osa. LU-hajoitelma A LU, (.0) jossa L on alakolmiomatriisi (diagonaalilla ykkösiä)ja U on yläkolmiomatriisi, saadaan siis suoraan Gaussin algoritmin aikana. Jos nyt joudumme ratkaisemaan uuden yhtälöryhmän, jossa kerroinmatriisi on sama kuin edellisessä yhtälöryhmässä, mutta RHS on muuttunut, niin voimme.7. Matriisin LU-hajoitelma 39 hyödyntää LU-hajoitelmaa ja ratkaista ryhmä kaksivaiheisesti Ax b (.) LUx {z} b (.) y b Ly b y Ux y x Esimerkki.7. Ratkaistaan yhtälöryhmä x x 5 (.3) x 3 9 käyttäen hyväksi tietoa A LU (.4) Ly b Ux y (.5) 3 9 y y 5+ 3 y ( 3) (.6) x 3 0 x ( 3 6 0)/3 x 4( ) 7 05

22 40. Matriisilaskentaa.8 Matriisin QR-hajoitelma Lause.8. Jos A on (m n)-matriisi, jonka sarakkeet muodostavat lineaarisesti riippumattoman vektorijoukon, niin A voidaan hajoittaa tuloksi A QR, missä Q on matriisin A sarakkeiden virittämän aliavaruuden ortonormitettu kanta (Q T Q I) jar on yläkolmiomuodossa oleva säännöllinen (n n)-matriisi ja sen diagonaalialkiot ovat positiiviset. Perustelu. Emme todista lausetta, mutta kerromme karkean perustelun. Ortonormitettu kanta voidaan muodostaa Gram-Schmidt -prosessilla. Nämä kantavektorit asetetaan Q:n sarakkeiksi. Prosessin tarkka tutkiminen osoittaa, että A:n k:s sarake voidaan lausua k:n ensimmäisen Q:n sarakkeen lineaarikombinaationa. Matriisi R saadaan keräämälläedellämainitut lineaarikombinaatioiden kertoimet R:n sarakkeiksi. Vielä pitäisi osoittaa, että R on säännöllinen, mutta sivuutamme tämän nyt. Joka tapauksessa Q saadaan Gram-Schmidt -prosessilla ja R saadaan sen jälkeen lausekkeesta R Q T QR Q T A (.7) Lauseen ehto, että matriisin A sarakkeet ovat lineaarisesti riippumattomat, merkitsee että m n. Jos m>n, niin matriisi A ei ole neliömatriisi, eikä sillä siisvoi olla käänteismatriisia. Kuitenkin A T A on symmetrinen (n n)-matriisi ja A T A (QR) T QR R T Q T QR R T R (.8) Koska R on säännöllinen, on myös R T säännöllinen. Siis myös A T A on sä nnöllinen. Voimme siis määritellä matriisin A + (A T A) A T R Q T (.9) Jos A on n n-matriisi, niin voimme päätellä Jos A on säännöllinen (full rank), (.0) niin Ax b x A b Vastaavasti jos A on m n-matriisi ja m > n, niin käänteismatriisia ei ole olemassa. Silti voimme päätellä seuraavasti.8. Matriisin QR-hajoitelma 4 Jos Rank(A) n (fullrank),jab Col(A), (.) niin Ax b x A + b Perustelu kaavalle (.): Ax b A + Ax A + b (.) (A T A) A T Ax A + b x A + b x A + b Ax AA + b QRR Q T b b (.3) Esimerkki.8. Jos A (.4) 0 niin A T A 3 (.5) 0 0 A + (A T A) A T (.6) 3/ (.7) / / Siis voimme ratkaista yhälön x (.8) 0 5 x A (.9) / / /// Jos QR-hajoitelma on tiedossa, niin helpoin tapa ratkaista yhtälöryhmä Ax b on toimia seuraavasti Ax b QRx b (.30) Rx Q T b (.3) Yhtälöryhmän kerroinmatriisi on nyt yläkolmiomuodossa, joten ryhmä ratkeaa helposti kuten LU-hajoitelman yhteydessä.

23 4. Matriisilaskentaa Jos b / Col(A), niin vektori ˆx A + b voidaan laskea, mutta se ei voi olla yhtälön Ax b ratkaisu. Tietyssä mielessä se on kuitenkin paras likiarvo. Palaamme tähän uudelleen pienimmän neliösumman yhteydessä optimointiosassa..9 Matriisin singulaariarvohajoitelma Kun halutaan saada saada mielikuva lineaarikuvauksesta.0. Matriisin definiittisyys 43 Lause.9. Jos (m n)-matriisin A säännöllisyysaste on Rank(A) r, niinon olemassa hajoitelma A UΣV T, missä U on ortogonaalinen (m m)-matriisi ja V on ortogonaalinen (n n)-matriisi ja Σ D 0, D diag(σ 0 0, σ,...,σ r ) f :IR n IR n, x 7 Ax, (.3) niin eräs hyvä tapa on laskea kuvavektorin pituus, kun kxk. Jos λ on matriisin ominaisarvo ja x on sitä vastaava normeerattu ominaisvektori, niin kaxk kλxk λ (.33) Jos ominaisvektorit virittävät IR n :n, niin saamme varsin hyvän käsityksen kuvauksesta. Valitettavasti kaikkien matriisien ominaisvektorit eivät ole reaalisia. Onneksi tähän löytyy seuraava ratkaisu. Olkoon A mikä tahansa (!) (m n)-matriisi. Tutkitaan kuvavektorin normin sijasta normin neliötä kaxk (Ax) T Ax x T A T Ax (.34) Matriisi A T A on symmetrinen, sen ominaisarvot ovat reaaliset. Jos λ j on matriisin A T A ominaisarvo ja v j on sitä vastaava normeerattu ominaisvektori, niin kav j k v j T A T Av j v j T λ j v λ j (.35) Matriisin A T A ominaisarvot ovat siis ei-negatiiviset ja ne yleensä järjestetään suuruusjärjestykseen λ λ...λ n 0. Voimme määritellä Määritelmä.9. (m n)-matriisin A singulaariarvot (singular values) ovat σ j p λ j,j,...,n missä λ,...λ n ovat matriisin A T A ominaisarvot. Siis kav jk σ j..0 Matriisin definiittisyys Seuraavassa määriteltävä neliömuoto ei ole lineaarikuvaus, vaikka sen ominaisuuksia tutkitaan matriisien avulla. Tässä kurssissa käsiteltävät sovellukset liittyvät optimointiin. Määritelmä.0.(Epälineaarinen) kuvaus IR n IR on IR n :n neliömuoto. Q(x) X q ij x i x j Neliömuoto voidaan aina esittää symmetrisen matriisin avulla. Esimerkki.0. x + x +4x x x x 3 (.36) x x + x x +x x +x x x x 3 x 3 x x (x +x )+x (x +x x 3 ) x 3 (x ) (x x x 3 ) x + x x 3 x +x x (x x x 3 ) 0 x x (.37) 0 0 x 3 Voimme siis aina olettaa, että neliömuoto voidaan esittää symmetrisen matriisin A avulla Q(x) x T Ax (.38) ///

24 44. Matriisilaskentaa Määritelmä.0. Symmetrinen (n n)-neliömatriisi A on positiivisesti definiitti, jos negatiivisesti definiitti, jos positiivisesti semidefiniitti, jos negatiivisesti semidefiniitti, jos x T Ax > 0, kaikilla x 6 0. x T Ax < 0, kaikilla x 6 0, x T Ax 0, kaikilla x IR n, x T Ax 0, kaikilla x IR n, indefiniitti, jos se ei ole mitään edeltävistä. Lause.0. Olkoon A symmetrinen (n n)-neliömatriisi, jonka reaaliset ominaisarvot ovat λ, λ,...,λ n. () Jos kaikki ominaisarvot ovat positiivisia (λ j > 0), niin A on positiivisesti definiitti. () Jos kaikki ominaisarvot ovat negatiivisia (λ j < 0), niin A on negatiivisesti definiitti. (3) Jos kaikki ominaisarvot ovat ei-negatiivisia (λ j 0), niin A on positiivisesti semidefiniitti. (4) Jos kaikki ominaisarvot ovat ei-positiivisia (λ j 0), niin A on negatiivisesti semidefiniitti. (5) Jos on olemassa sekä positiivinen ominaisarvo, että negatiivinen ominaisarvo, niin A on indefiniitti. Esimerkki.0. Tutkitaan definiittisyys matriisille A 0 (.39) 0 0 Lasketaan ensin ominaisarvot karakteristisesta yhtälöstä det(a λi) 0 (.40).0. Matriisin definiittisyys 45 λ 0 λ 0 λ 0 (.4) ( λ)[( λ)( λ) ] ( λ) 0 ( λ)(λ λ ) + 4λ 0 λ 3 +λ +λ 0 (λ +)( λ +3λ ) 0 (λ +)(λ 3+ 5 )(λ 3 5 )0 Ominaisarvot ovat siis λ λ Siis matriisi on indefiniitti. λ 3 Pienten yksinkertaisten matriisien tapauksessa on usein helpompaa soveltaa seuraavaa lausetta Lause.0. Olkoon A (n n) neliömuoto. Lasketaan apudeterminantit (vasemmasta ylänurkasta) D, D,..., D n asettamalla a a... a k a D a ja D k a... a k a k a k... a kk Jos kaikki apudeterminantit ovat positiivisia, D k > 0, niin matriisi on positiivisesti definiitti. Jos parittomat apudeterminantit ovat negatiivisia, D k < 0, kun k, 3,...,ja parilliset ovat positiivisia, D k > 0, kun k, 4,..., niin matriisi on negatiivisesti definiitti. Todistus. Siuvuutetaan. Esimerkki.0.3 Tutkitaan vielä kerran definiittisyys matriisille A 0 (.4) 0 0 Apudeterminantit ovat D > 0 (.43)

25 46. Matriisilaskentaa D < 0 (.44) 0 D 3 < 0 (.45) Yhden muuttujan tapaus, kertaus 47 Siis matriisi on indefiniitti. 3. Ääriarvotehtäviä Lineaarista optimointia on sivuttu peruskurssilla ja sitä käsitellään paljon operaatioanalyysin kurssilla. Epälineaarista optimointia tullaan käsittelemään tarkemmin optimoinnin jatkokurssilla, muttanytkäydään läpi perusteet. Rajoitumme tässä johdannossa jatkuvien ja sileiden funktioiden optimointiin. Toisin sanoen funktiota voidaan derivoida niin monta kertaa kuin on tarvetta. Koska emme voi kerrata kaikkea, on tärkeätä, että opiskelijatarvittaessakertaa sen, mitä on aiemmin oppinut derivoinnista ja osittaisderivaatoista. 3. Yhden muuttujan tapaus, kertaus 3.. Ääriarvon tyyppi Aloitamme tutusta asiasta eli suljetulla välillä määritellystä yhden muuttujan funktiosta. Kuvassa 3.3 on funktion f(x) 5 5x 4 +3(x 3)3 3x +5 (3.) kuvaaja välillä [, 4]. Kuvasta näkee, että funktiolla on kaksi lokaalia minimiä ja kolme lokaalia maksimia. Välin päätepisteissä on tällä kertaa lokaalit maksimit. Globaalit ääriarvokohdat ovat maksimikohta x.000 ja minimikohta x.5. Vastaavat globaalit ääriarvot ovat maksimiarvo f(x )3.000 ja minimiarvo f(x ) 3, 77.

26 48 3. Ääriarvotehtäviä 3.. Yhden muuttujan tapaus, kertaus 49 Figure 3.3: Funktion ääriarvot. Määritelmä 3.. (A) Olkoon f :[a, b] IR jatkuva välillä [a, b] I määritelty funktio. Määrittelyvälin piste x I on globaali maksimi(minimi)-kohta, josf saa suurimman(pienimmän) arvonsa välillä I kohdassa x. (A ) Globaali maksimi(minimi) -kohta on siis optimointitehtävän max(min) z f(x) ½ max(min) z f(x) ehdolla x a ehdolla x I x b optimipiste. (B) Avoin väli J (α, β) onx:n avoin ympäristö, josα <x<β. (C) Olkoon f : [a, b] IR jatkuva välillä I [a, b] määritelty funktio. Määrittelyvälin piste x I on lokaali maksimi(minimi)-kohta, jos on olemassa x :n avoin ymäristö J niin, että f saa suurimman(pienimmän) arvonsa joukossa J I kohdassa x. (C ) Voimme yhtäpitävästi määritellä, että x I on lokaali maksimi(minimi) - kohta, jos on olemassa x :n avoin ympäristö J siten, että x on optimointitehtävän max(min) z f(x) max(min) z f(x) ehdolla x a ehdolla x I x b x J x>α x<β optimipiste. Figure 3.4: y f (x). (C ) Vielä voimme yhtäpitävästi määritellä, että x [a, b] on lokaali maksimi(minimi) -kohta, jos on olemassa x :n avoin ympäristö J siten, että kaikille x J I on voimassa x 6 x f(x) ( )f(x ) (3.) (D) Jos epäyhtälössä (3.) erisuuruus on aito kaikilla x (J I) \{x } (eli x on ainoa optimikohta J I:ssä) niin sanomme, että ääriarvo on vahva ääriarvo. Jos ääriarvo ei ole vahva, niin se on heikko. Esimerkki 3.. Kuvasta 3.3 näkee helposti funktion (3.) ääriarvojen tyypit, mutta ääriarvokohtia on usein vaikea nähdä tarkasti. Lukiossa ongelma ratkaistiin etsimällä derivaattafunktion nollakohdat, f (x) 0. Nyt ratkaistavaksi tuleva yhtälö on neljättä astetta, joten emme osaa ratkaista sitä tarkasti. Hieman paremmin ääriarvokohta näkyy derivaattafunktion kuvaajasta, jonka voi piirtää vaikkapa Excelillä. Lokaalissa maksimikohdassa derivaatan merkkikaaviossa on + jamin- imikohdassa on derivaatan merkkikaaviossa +. Kuvassa 3.4 on derivaattafunktion kuvaaja. Kuvasta näemme, että funktiolla on lokaali maksimikohta kohdassa x.. Jos haluamme tietää ääriarvokohdan tarkemmin, tulee kuvaajan tutkiminen työlääksi. Jatkamme esimerkin käsittelyä numeerisesti luvussa 5.4. ///

27 50 3. Ääriarvotehtäviä 3.. Yhden muuttujan tapaus, kertaus 5 Figure 3.5: (a) Konveksi funktio (b) konkaavi funktio. 3.. Konveksisuus ja konkaavisuus Yhden muuttujan funktio f(x)onkonveksi (konkaavi), jos mitä tahansa kahta funktion kuvaajan pistettä yhdistävä janaei missään ole kuvaajan alapuolella (yläpuolella). Täsmällisempi määritelmä on seuraavassa: Määritelmä 3.. (A) Funktio f :[a, b] IR on konveksi, jos kaikilla x, y [a, b] ja t [0, ] on voimassa f(tx +( t)y) t(f(x)+( t)f(y) (B) Funktio f :[a, b] IR on konkaavi, jos kaikilla x, y [a, b] jat [0, ] on voimassa f(tx +( t)y) t(f(x)+( t)f(y) (C) Funktio f :IR IR on lineaarinen, jos kaikilla x, y IR ja α, β IR on voimassa f(αx + βy) αf(x)+ βf(y) /// Lause 3.. (A) Jos f :[a, b] IR on konveksi funktio ja x on sen lokaali minimikohta välillä [a, b], niin x on f:n globaali minimikohta välillä [a, b]. (B) Jos f :[a, b] IR on konkaavi funktio ja x on sen lokaali maksimikohta välillä [a, b], niin x on f:n globaali maksimikohta välillä [a, b]. Todistus. (A) Koska x on lokaali minimikohta on olemassa väli (α, β) 3 x siten, että f(x) f(x ), x [α, β] Jos y>β, niin on olemassa t [0, ] siten, että β tx +( t)y. Konveksisuudesta seuraa nyt, että f(x ) f(β) f(tx +( t)y) tf(x )+( t)f(y) f(x ) f(y) Jos y<α nähdään vastaavalla tavalla, että f(x ) f(y). (B) Mutatis mutandis. Lause 3.. (A) Jos f :[a, b] IR on konveksi funktio ja x on sen vahva lokaali maksimikohta välillä [a, b], niin x a tai x b. (B) Jos f :[a, b] IR on konkaavi funktio ja x on sen vahva lokaali minimikohta välillä [a, b], niin x a tai x b. Todistus. HT. Huomautus: Lineaarinen funktio on sekä konveksi,ettäkonkaavi. Käänteinen tulos ei kuitenkaan pidä paikkaansa, sillä funktio on yhtaikaa konveksi ja konkaavi jos sen kuvaaja on suora, mutta lineaarisuus edellyttää lisäksi, että f(0) 0. Konveksi (konkaavi) funktio on jatkuva, mutta sen ei tarvitse olla derivoituva. Jos kuitenkin funktio on jatkuvasti derivoituva, niin voimme antaa uuden tavan tutkia funktion konveksisuutta.

28 5 3. Ääriarvotehtäviä 3.. Yhden muuttujan tapaus, kertaus 53 tarkistamme ensin konveksisuuden. Koska f (x) x cos x f (x) +sinx>0, x Siis f on konveksi ja se saa maksimiarvonsa määrittelyvälin päätepisteessä. f(0) 0 ja f(π/) π /4, joten kysytty maksimi on π /4. /// Esimerkki 3..3 Tutkitaan yritystä, jonka kysyntää ja kustannuksia arvioidaan kuvaavan alla olevat kuvat. Kuvista ei saada kovin yksityiskohtaista tietoa, mutta ensimmäisten ja toisten derivaattojen merkit nähdään kuvista. Figure 3.6: Sileän funktion konveksisuus Idea perustuu siihen, että alkuperäinen konveksisuuden määritelmä on yhtäpitävä sen ominaisuuden kanssa, että funktion kuvaaja ei missään jääminkään tangenttinsa alapuolelle. Lause 3..3 Olkoon f :[a, b] IR funktio. (A) Jos f ja f ovat jatkuvia, niin f on konveksi, jos ja vain jos f(x) f(x 0 )+f (x 0 )(x x 0 ), x 0,x [a, b] (B) Jos f on jatkuva, niin f on konveksi, joss f (x) 0, x [a, b] (C) Jos f ja f ovat jatkuvia, niin f on konkaavi, joss f(x) f(x 0 )+f (x 0 )(x x 0 ), x 0,x [a, b] (D) Jos f on jatkuva, niin f on konkaavi, joss Todistus. HT. Esimerkki 3.. Määritetään funktion f (x) 0, x [a, b] f :[0, π/] IR,f(x) x sin x suurin arvo. Eräs tapa lähestyä asiaa on tehdä derivaatan merkkikaavio, mutta nyt p q < 0 ja p q < 0 q p < 0 ja q p < 0 C q > 0 ja C q > 0 Merkitään p f(q) jac C(q) jolloin tiedämme kuvien perusteella funktioiden f ja C ensimmäisten ja toisten derivaattojen merkit f (q) p q < 0, f (q) p q < 0, C (q) > 0, ja C (q) > 0 (3.3) Voittofunktio on P (q) R(q) C(q) q f(q) C(q) (3.4) ja sen derivaatat ovat P (q) MR(q) MC(q) f(q)+q f (q) C (q) (3.5) P (q) f (q)+f (q) + q f (q) C (q) < 0 {z } {z } {z } (3.6) <0 <0 >0 Siis voittofunktio on konkaavi, joten voitto maksimoituu täsmälleen yhdellä tuotannon määrällä. Optimia kuvaa yhtälöt 0 MR MC f(q)+q f (q) MC (3.7) p( + f (q) q p ) MC 0 p( + ) MC (3.8) η

29 54 3. Ääriarvotehtäviä Yhtälö (3.8) kuvaa onnistuneesti opitimaalista toimintaa. Funktiot f ja C eivät suoraan esiinny yhtälössä, mutta niistä riippuvat kysynnän hintajousto η ja rajakustannus MC ovat kohtuullisen hyvin arvioitavissa, joten ehdon (3.8) voimassaolo voidaan ajoittain tarkistaa. Jos ehto ei ole voimassa, tulee harkita tuotantomäärän muuttamista. /// 3. Kahden muuttujan tapaus ilman rajoitteita Seuraavaksi tarkastelemme optimointitehtävää, jossa päätösmuuttujia on kaksi kappaletta, x (x,x ). Olkoon epälineaarinen tavoitefunktio z f(x) hyvin määritelty IR :ssa. Voimme kirjoittaa optimointitehtävän muotoon max z f(x) st x IR. Kahden ratkaisuvektorin välinen etäisyys on tavallinen euklidinen q kx x k (x x ) +(x x ) Ratkaisuvektorin x r-säteinen avoin palloympäristö B r (x ) muodostuu niistäratkaisuvektoreista, jotka ovat lähempänä kuinr:n etäisyydellä x :stä B r(x ){x IR n kx x k <rk} Joukko U IR on avoin, jos sen jokaisella pisteellä w U on U:hun sisältyvä palloympäristö, B r (w) U. (Toisin sanoen: mikään U:n piste ei ole U:n reunapiste.) Jos U IR n on avoin ja x U, niin sanomme että U on x:n avoin ympäristö. Määrittelemme seuraavaksi ääriarvon tyypit monen muuttujan funktion tapauksessa. (Huomaa, että määritelmät ovat lähes sanasta sanaan samat kuin edellä.) Määritelmä 3.. (A) Olkoon f :IR IR jatkuva funktio. Piste x IR on globaali maksimi(minimi)-kohta, josf saa suurimman(pienimmän) arvonsa IR :ssa kohdassa x. (A ) Globaali maksimi(minimi) -kohta on siis optimointitehtävän ½ max(min) z f(x) ehdolla x IR optimipiste. 3.. Kahden muuttujan tapaus ilman rajoitteita 55 Määritelmä 3.. (B) Olkoon f :IR IR jatkuva funktio. Piste x IR on lokaali maksimi(minimi)-kohta, jos on olemassa x :n avoin ymäristö U niin, että f saa suurimman(pienimmän) arvonsa joukossa U kohdassa x. (B ) Voimme yhtäpitävästi määritellä, että x IR on lokaali maksimi(minimi) -kohta, jos on olemassa x :n avoin ympäristö U siten, että x on optimointitehtävän ½ max(min) z f(x) ehdolla x U optimipiste. Määritelmä 3..3 (B ) Vielä voimmeyhtäpitävästi määritellä, että x IR on lokaali maksimi(minimi) -kohta, jos on olemassa x :n avoin ympäristö U siten, että kaikille x U on voimassa x 6 x f(x) ( )f(x ) (3.9) (C) Jos epäyhtälössä (3.9) erisuuruus on aito kaikilla x U \{x } (eli x on ainoa optimikohta U:ssa) niin sanomme, että ääriarvo on vahva ääriarvo. Jos ääriarvo ei ole vahva, niin se on heikko. Esimerkki 3.. Kahden muuttujan funktiota voi olla vaikea hahmottaa. Kuvissa 3.7 (a) ja (b) on piirretty funktion f(x,x )30e (x +x ) + x 4x +4x 8x + 8 (3.0) kuvaaja, kun x 3ja x. Kuvassa (a, Plot3D ) on piirretty funktion määräämä pinta. Pinta on joskus vaikea hahmottaa ja siksi on kuvan (a) avuksi piirretty kuva (b, ContourPlot ), jossa on funktion tasa-arvokäyrät. Kuvat yhdessä tekevät selväksi, että funktiolla on lokaali maksimi lähellä pistettä ( 0.; 0.) T ja lokaali minimi lähellä kohtaa(3.; ) T. Kuvasta saatavat arviot eivät ole kovin tarkkoja, mutta kuvan tarkoitus onkin vain selvittää pinnan muoto katsojalle. Tarkat ääriarvojen paikat saadaan numeerisilla menetelmillä, joita sivutaan myöhemmin ja käsitellää tarkemmin numeerisen matematiikan kurssilla. /// Eräs tehokas ja monesti helppo tapa hahmottaa funktiota on piirtää funktion arvot viivalla. Kiinnitetään IR :n piste x 0 ja suuntavektori u. (Suuntavektoria ei tarvitse normittaa, mutta joskus normittaminen helpottaa kuvien tulkintaa.) Silloin piste x t x 0 + tu (3.)

30 56 3. Ääriarvotehtäviä 3.. Kahden muuttujan tapaus ilman rajoitteita 57 (a) (b) (a) (b) Figure 3.7: (a) Funktion f(x,x )30e (x +x ) + x 4x +4x 8x +8 kuvaaja ja (b)funktion tasa-arvokäyrät. Käytetyt Mathematica-komennot: f[x,x ]:30 Exp[-x^ -x^ ] + x^ -4 x+4 x^ -8x+8 Plot3D[f[x,x], {x,-,3}, {x,-,}] ContourPlot[f[x,x], {x,-,3},{x,-,},{contourshading->false}] on suoralla (viivalla), joka kulkee piteen x 0 kautta ja on vektorin u suuntainen. Nyt funktion f x0,u(t) f(x t ) (3.) kuvaaja kertoo, mitä arvoja funktio saa vastaavalla viivalla. Esimerkki 3.. Tutkitaan edellisen esimerkin funktion arvoja viivalla, joka kulkee pisteen x 0 (0; 0) T kautta ja on vektorin u (; ) T suuntainen. Kuvassa (a) on piirretty tämä viivatasa-arvokäyrien päälle. Nyt µ 0+t f x0,u(t) f(x t )f 0+t f t t (3.3) 30e (t +(t) ) + t 4t +4(t) 8(t) + 8 (3.4) 30e 5t +7t 0t + 8 (3.5) Kuva 3.8 (eli lausekkeen (3.5) kuvaaja) ei ole enää hankalapiirtää. Piirtäminen onnistuu graafisella laskimella tai vaikkapa excelillä. Kuvasta nähdään, ettei (0; 0) T ole ääriarvokohta, sillä viivalta löytyy parempikin piste. /// Tarkastelemme ongelmaa yleisemmin. Olkoon f(x,x ) funktio ja haluamme tutkia mahdollisuutta, että sen eräs ääriarvokohta olisi piste p (p ; p ). Tätä varten tutkimme funktion arvoja viivalla, joka kulkee pisteen p kautta ja on vektorin u (u,u ) T ) suuntainen. Silloin viivafunktiolle pätee f p,u(t) f(x t)f( x x z } { z } { p + u t, p + u t ) (3.6) Figure 3.8: (a) Funktion f(x,x )30e (x +x ) + x 4x +4x 8x +8 tasaarvokäyrät ja viiva pisteen (0; 0) T kautta vektorin (; ) T suuntaan. (b) Funktion arvot viivalla. f p,u(t) u f x (x t )+u f x (x t )u T f(x t ) (3.7) missä esiintyvää f:n gradienttivektoria f ( f x f x )T tutkimme tarkemmin seuraavassa kappaleessa. Vastaavasti saamme viivafunktion toisen derivaatan f p,u(t) u f x ( x x z } { z } { p + u t, p + u t ) (3.8) z x x } { z } { + u f x ( p + u t, p + u t ) fp,u(t) u f (x xx t)u + u f (x xx t)u (3.9) + u f (x xx t)u + u f (x xx t)u (3.0) fxx f (u u ) xx u u T Hu (3.) f xx f xx u missä esiintyvää matriisi H on f:n Hessin matriisi (Hessian). Myös tätä matriisia käsittelemme seuraavissa kappaleissa. 3.. Gradientti ja välttämätön ehto Edellä esiintynyt gradientti on erittäin usein kÿttöön tuleva olio. Optimoinnin yhteydessä se helpottaa asioiden esittämistä. Määrittelemme sen nyt ja toteamme sen yhteyden tasa-arvokäyrästöihin (ContourPlot).

31 58 3. Ääriarvotehtäviä 3.. Kahden muuttujan tapaus ilman rajoitteita 59 Määritelmä 3..4 Olkoon f :IR IR sileä funktio. Funktion f gradientti pisteessä x on f(x)/ x fx f(x). f(x)/ x f x (Lukuohje f funktion f gradientti tai nabla f.) Esimerkki 3..3 x Jos f x +x x + x x + x (3.) x x ++x niin f (3.3) x x +x Gradientti on vektori ja lauseke (3.3) kertoo miten tämän vektorin koordinaatit lasketaan eri pisteissä. Esimerkiksi ++ 5 f (3.4) f (3.5) 0+ 4 /// Peruskurssilla jo käsiteltiin kahden muuttujan funktioita. Funktion f(x, y) arvon muutos, kun x:n ja y:n arvot muuttuvat, saatiin kokonaisdifferentiaalina df f f dx + dy (3.6) x y Jos kuk on pieni, niin sama asia voidaan ilmaista nyt käsillä olevin merkinnöin seuraavasti f(x + u) f(x)+u T f(x) (3.7) Esimerkki 3..4 Olkoon f(x,x ) T x +x + x x + x ja x (; ) T ja u (0.0; 0.0) T. Silloin.0 f f(x + u) f(x)+u T f(x) (3.8).0 f + u T f (3.9) 5 5+(.0;.0) (3.30) 3 5. (3.3) /// Figure 3.9: Gradientti on kohtisuorassa tasa-arvokäyrää vastaan. Toinen yhtä tärkeä gradientin ominaisuus nähdään, kun valitaan kaksi pistettä p x ja p x + u siten, että pisteet ovat lähellä toisiaan ja samalla tasaarvokäyrällä. Silloin Muistisääntö: 0df u T f hu fi u f (3.3) Gradienttivektori on kohtisuorassa tasa-arvokäyrää vastaan. f osoittaa ylämäen. Lause 3.. Jos f :IR IR on sileä funktio ja x on sen lokaali ääriarvokohta, niin on välttämättä ½ fx (x ) 0 f x (x eli f(x ) 0 )0 Todistus. Jos f x (x ) 6 0, niin valitaa u ε(; 0) T. Silloin df u T f(x )ε ( 0)µ fx f x εf x 6 0 (3.33) Siirtymällä nyt vaakasuoraa viivaa pitkin oikealle tai vasemmalle löytyy parempi piste, joten x ei ole optimikohta. Tapaus f x (x ) 6 0: Mutatis mutandis. Tiivistämme lauseen mahdollisimman tiiviiksi muistisäännöksi.

32 60 3. Ääriarvotehtäviä Välttämätön ehto: 3.. Kahden muuttujan tapaus ilman rajoitteita 6 Löytyi siis yksi piste, joka toteuttaa välttämättömän ehdon. /// Jos x on lokaali maksimi- tai minimikohta, niin f(x )0 Vain välttämättömän ehdon toteuttava piste voi olla ääriarvokohta. Jos välttämättömän ehdon toteuttavia pisteita on vain muutama, niin niistä voidaan suoralla f:n arvon laskulla valita paras. Esimerkki 3..5 Tarkastellaan varastomallia, jossa varaston kautta toimitetaan tuotteita asiakkaille. Asiakkaiden kysyntä ond tuotetta vuodessa. Tuotteet tuodaan varastoon x tuotteen erissä. Jos asiakas ei saa haluamaansa tuotetta, niin asiakas jää odottamaan. Kun seuraava täydennyserä saapuu, toimitetaan ensin odottavien asiakkaiden tarve ja loput sijoitetaan varastoon. Tilaukset ajoitetaan siten, että varaston maksimikoko on x.joskysyntäontasaista, niin varaston koko ajan funktiona on seuraavan kuvan mukainen. Keskimääräinen varaston koko on x /(x ). Keskimääräinen puutteen määrä on (x x ) /(x ). Ja tilauksia tehtdään D/x (per vuosi). Kustannukset ovat: varaston ylläpitokustannus h (/tuote/vuosi), puutekustannus s (/tuote/vuosi), tilauskustannus K (/tilaus) Vuotuinen kokonaiskustannus on nyt f(x) x h + (x x ) s + KD (3.34) x x x µ s/+(s + h)x f(x) /(x ) KD/x (3.35) (s + h)x /x s Haluamme nyt määrittää päätösmuuttujien x ja x optimiarvot, joilla f saa minimiarvonsa. Välttämätön ehto on ½ s/ (s + h)x f 0 /(x ) KD/x 0 (3.36) (s + h)x /x s 0 ½ x p KD(s + h)/(sh) x p (3.37) KDs/((s + h)h) 3.. Hessin matriisi, riittävä ehto Määritelmä 3..5 Olkoon f :IR IR sileä funktio. Funktion f Hessin matriisi (Hessian) pisteessä p on H(p) Ã f x f x x f x x f x! xp Esimerkki 3..6 Jos f(x,x ) T x 3 +x 3x x, niin x f x f xx f xx f xx f xx x H x µ fxx f xx f xx f xx xp 3x +4x 3x 6x x (3.38) (3x +4x 3x x )6x + 4 (3.39) (3x +4x 3x x ) 6x (3.40) ( 6x x ) 6x x (3.4) ( 6x x ) 6x (3.4) x µ 6x +4 6x (3.43) 6x 6x Jos nyt halutaan tietää gradienttivektori ja Hessin matriisi tietyssä pisteessä p, niin sijoitetaan p:n koordinaatit x:n koordinaattien paikalle kaavoihin (3.38) ja (3.43). Esimerkiksi p f(p) H(p) µ 0 µ (3.44) (3.45) ///

33 6 3. Ääriarvotehtäviä Lause 3.. Olkoon f :IR IR sileä funktiojax IR. () Jos f(x ) 0 ja Hessin matriisi pisteessä x on positiivisesti definiitti, niin x on lokaali minimikohta. () Jos f(x ) 0 ja Hessin matriisi pisteessä x on negatiivisesti definiitti, niin x on lokaali maksimikohta. Todistus. () Olkoon u 6 0 mikä tahansa suuntavektori. Tarkastellaan funktiota viivalla, joka kulkee pisteen x kautta ja on vektorin u suuntainen. Tutkitaan funktion arvoja tällä viivalla. 3.. Kahden muuttujan tapaus ilman rajoitteita 63 Esimerkki 3..7 Tarkastellaan uudelleen esimerkin 3..5 varastomallia, jossa varaston kautta toimitetaan tuotteita asiakkaille. Vuotuinen kokonaiskustannus on nyt f(x) x h + (x x ) s + KD x x x (3.48) f x (x) s/+(s + h)x /(x ) KD/x (3.49) f x (x) (s + h)x /x s (3.50) ((s + h)x H +KD)/x 3 (s + h)x /x (s + h)x /x (3.5) (s + h)/x Esimerkissä 3..5 löydettiin yksi piste x, joka toteutti välttämättömän ehdon. Koska päätösmuuttujat x ja x sekä parametrit K, D, h, s kaikki saavat positiiviset arvot, voimme päätellä h ((s + h)x +KD)/x 3 > 0 ja (3.5) H H (s + h)kd/x 4 > 0 (3.53) joten H on positiivisesti definiitti ja piste x toteuttaa riittävän ehdon minimille. /// Funktiolle g(t), joka antaa funktion arvot viivalla, pätee g (0) fx,u(t) (3.7) u T f 0 (3.46) g (0) fx,u(t) (3.) u T Hu > 0 (3.47) Koska (3.46) ja (3.47) ovat voimassa kaikilla u 6 0, onx lokaali minimikohta. () Mutatis mutandis. Tiivistetään tämäkin lause mahdollisimman tiiviiksi muistisännöksi. Riittävä ehto minimille: Jos f(x )0 ja, niin x on lokaali minimikohta. H(x )onpositiivisestidefiniitti 3..3 Optimin etsiminen numeerisesti Välttämätön ehto johtaa epälineaariseen yhtälöryhmään, jonka ratkaiseminen on usein liian työlästä. Silloin voidaan menetellä seuraavasti. (Taas käymme läpi perustelut kahden muuttujan tapauksessa, mutta johtopäätökset on helppo yleistää.) Olkoon päätösmuuttujien alkuarvovektori ξ 0 (x 0,y 0 ) T. Jos seuraava likiarvo on ξ (x,y ) T ja merkitsemme dx u ξ ξ 0 dy niin kokonaisdifferentiaalin mukaan vastaavien funktion f :IR 3 IR arvo jen erotus on f(ξ ) f(ξ 0 )f x (ξ 0 )dx + f y (ξ 0 )dy + f z (ξ 0 )dz u T f Olkoon h>0. Jos nyt valitsemme u h f, niin f(ξ ) f(ξ 0 )h( f) f 0 Jos vastaavasti valitsemme u h f, niin f(ξ ) f(ξ 0 ) h( f) T f 0 Siis: Etsittäessä maksimia otetaan askelia gradientin suuntaan. Etsittäessä minimiä otetaan askelia gradientin vastavektorin suuntaan.

34 64 3. Ääriarvotehtäviä 3.. Kahden muuttujan tapaus ilman rajoitteita 65 Esimerkki 3..8 Tarkastellaan uudelleen esimerkin 3.. funktiota f(x, y) 30e (x +y ) + x 4x +4y 8y +8. Määritämme funktion lokaalin maksimikohdan. Valitaan Rekursio yhtälö on xk+ xk +h y k+ y k µ x0 y 0, ja h xke (x k +y k ) +x k 4 60y k e (x k +y k ) +8y k 8 6xke (x k +y k ) +.x k 0.4 6y k e (x k +y k ) +.8y k 0.8 Figure 3.0: Esimerkin 3..8 numeerinen ääriarvon määritys. Alkuarvot x 0 ja y Karkea algoritmi maksimin etsimiseksi on seuraava: Valitse alkuarvo ξ 0 ja parametrit h>0, ε > 0. Toista kunnes kξ k+ ξ k k < ε ξ k+ ξ k + h f(ξ k ) Ongelmaksi muodostuu joskus se, että epälineaarisen funktion osittaisderivaatat saattavat saada itseisarvoltaan melko suuria arvoja, jolloin gradienttivektori on pitkä. Edellä kuvattu rekursio karkaa helposti käsistä. Eräs mahdollisuus on korjata algoritmi muotoon Valitse alkuarvo ξ 0 ja parametrit h>0, ε > 0. Toista kunnes k f(ξ k+ )k < ε ξ k+ ξ k + h f 0 (ξ k )ξ k + h f(ξ k) k f(ξ k )k Kolmas versio samasta naivista ideasta on Valitse alkuarvo ξ 0 ja parametrit h>0, ε > 0. Toista kunnes h<ε u k+ f(ξ k ) ξ k+ ξ k + hu 0 k+ jos u T k+ u k < 0, niin pienennä h:ta Kun numeerinen optimin etsintätehdään oikeaoppisesti, suoritetaan niin sanottu viivahaku. Tämä menettely käsitellään optimoinnin jatkokurssilla. Edellä esitellyt algoritmit ovat hyödyllisiä siksi,että ne on helppo toteuttaa vaikkapa excelillä. ja excelin antama likiarvopisteiden jono tasossa lähestyy pienellä h:n arvolla pistettä 3..4 Esimerkkejä µ xk y k Esimerkki 3..9 Yritys valmistaa kahta tuotetta A ja B. Valmistusmäärät ovat x ja x. Kysyntä- ja kustannus-funktiot ovat /// p 0.0x 0.0x (3.54) p 50 0.x (3.55) C 5x +7x +0.0x +0.0x x x (3.56) Voittofunktio on silloin x P x (p x )+(p x ) C (3.57) (x 0.0x 0.0x x )+(50x 0.x ) (3.58) (5x +7x +0.0x +0.0x x x ) 7x +43x 0.03x 0.05x x 0.x (3.59) Voittofuktion lauseke on nyt jaettavissa lineaariseen osaan ja neliömuotoon. Voiton maksimointi tarkoittaa nyt globaalin maksimin löytämistä P :lle. Nyt välttämätön ehto on ½ Px 0 P x 0 ½ x 0.05x x 0.4x 0 ½ x 73.0 x 74.6 (3.60)

35 66 3. Ääriarvotehtäviä 3.3. Monen muuttujan tapaus ilman rajoitteita 67 Tutkimme vielä Hessin matriisin definiittisyyden H µ Pxx P xx P xx P xx (3.6) D h 0.06 < 0 (3.6) D > 0 (3.63) H on negatiivisesti definiitti löydetty piste on maksimikohta. Riittävä ehto minimille: f(x )0 ja Jos H(x )onpositiivisestidefiniitti Riittävä ehto maksimille:, niin x on lokaali minimikohta. /// Jos f(x )0 ja H(x ) on negatiivisesti definiitti, niin x on lokaali maksimikohta. 3.3 Monen muuttujan tapaus ilman rajoitteita Edellisissä kappaleissa johdetut tulokset ovat sellaisinaan yleistettävissä useamman muuttujan tapauksiin. Teemme yhteenvedon Olkoon f :IR n IR sileä funktio. Sen gradientti on Hessin matriisi on f x f x f (3.64). f xn f xx f xx... f xxn f H xx f xx... f xxn (3.65) f xnx f xnx... f xnxn Ääriarvokohtien määritelmät ja välttämätön sekä riittävä ehto ääriarvolle saavat nyt täsmälleen samat muodot, kuin kahden muuttujan tapauksessa. Välttämätön ehto: Jos x on lokaali maksimi- tai minimikohta, niin f(x )0 Esimerkki 3.3. Hintadifferointi. Yritys valmistaa tuotetta ja myy sitä kolmella eri markkinoilla (Eurooppa, Aasia, Afrikka). Eri markkinoilla on eri kysyntäfunktiot, joten hinnat eroavat markkinoiden välillä. Yritys myy tuotteita vuosittain Eurooppaan x kpl, Aasiaan x kpl ja Afrikkaan x 3 kpl. Vastaavat kysyntäfunktiot ovat p a b x, (3.66) p a b x, (3.67) p 3 a 3 b 3 x 3. (3.68) Kustannusfunktio on normaali C(x) C(x + x + x 3 ), C > 0, C > 0. (3.69) Voittofunktio on P (x,x,x 3 ) (3.70) p x + p x + p 3 x 3 C(x + x + x 3 ) a x b x + a x b x + a 3 x 3 b 3 x 3 C(x + x + x 3 ) Gradientti ja Hessin matriisi ovat P a b x C (x + x + x 3 ) a b x C (x + x + x 3) (3.7) a 3 b 3 x 3 C (x + x + x 3 ) H b C C C C b C C (3.7) C C b 3 C Välttämätön ehto P 0 voidaan nyt tulkita siten, että jokaisella markkinaalueella (i,, 3) tulee alueen rajatuoton MR i d(p i x i )/dx i olla yhtä suuri kuin tuotantolaitoksen rajakustannus MC dc(x)/dx, missä x x + x + x 3.

36 68 3. Ääriarvotehtäviä Tarkistamme vielä Hessin matriisin definiittisyyden. D h b C < 0 (3.73) D b C C C b C (3.74) 4b b +(b + b )C > 0 D 3 b C C C C b C C C C b 3 C 8b b b 3 4C (b b + b b 3 + b b 3 ) < 0 (3.75) Hessin matriisi on negatiivisesti definiitti, joten välttämättömän ehdon toteuttava ratkaisu maksimoi voittofunktion. /// 3.4. Sijoituskeino 3.4. Rajoitteellinen optimointi, yhtälörajoite 69 Jos optimointitehtävässä on yhtälörajoite, ja jokin muuttuja voidaan ratkaista rajoiteyhtälöstä, niin sijoitetaan saatu lauseke muuttujan paikalle funktioon ja muihin rajoitteisiin. Esimerkki 3.4. ½ Min f(x,x,x 3 )x + x + x 3 st x + x + x 3 Rajoitteesta voimme ratkaista jolloin optimointitehtävä menee muotoon (3.76) x 3 x x (3.77) Min f(x,x )x + x +x x x + (3.78) 3.4 Rajoitteellinen optimointi, yhtälörajoite Välttämätön ehto optimille antaa f µ x +x x +x 0 0 (3.79) Tässä luvussa rajoitumme tutkimaan optimointiongelmia, jotka ovat muotoa Oletamme siis, että min ehdoin. ongelma on minimointiongelma, f(x) h j (x) 0,j,...,m. lisäksi oletamme, että kaikki funktiot (f, h j ) voidaan derivoida jatkuvasti niin monta kertaa kuin kulloinkin haluamme. Oletus saadaan aina järjestettyä, mutta sileysvaatimus ei ole aina järjestettävissä. Sivuutamme nyt tämän ongelman. Rajoittuminen minimointiongelmaan saattaa tuntua oudolta, mutta valitsemamme kaavamaisuus helpottaa asioiden esittämistä ja myös asioiden omaksumista. Jos sovellustehtävässä kohtaamme maksimointitehtävän, voimme aina muuntaa sen laskuja varten seuraavasti Tällä yhtälöllä ei selvästi ole ratkaisua, joten alkuperäisellä ongelmalla ei ole ääriarvokohtaa. /// Esimerkki 3.4. min f(x,x ) x x (3.80) ehdolla x +5x 0 Rajoitteesta saamme ratkaistua toisen muuttujan ensimmäisen avulla, x 0.4x. Silloin optimointitehtävä meneemuotoon min f(x ) x +0.4x (3.8) Derivaatan nollakohdasta ja rajoitteesta saamme optimiarvot f (x ) +0.8x 0 x.5 (3.8) f (x ) 0.8 > 0 x on minimikohta (3.83) x 0.4x.0 (3.84) ALKUPERÄINEN ½ max f(x) ehdoin h j (x) 0,j,...,m MUUNNETTU ½ min f(x) ehdoin h j (x) 0,j,...,m Siis optimointitehtävän ratkaisu on x µ x x µ.5.0 ja f (3.85) ///

37 70 3. Ääriarvotehtäviä Esimerkki Väärä ratkaisuyritys. Sijoituskeino ei aina ole helppo ratkaisu. Esimerkiksi ongelma Min x + x + x 3 st x + x + x 3 0 (3.86) x + x + x 3 on hankala. Yhtälörajoitteen käsittely vaatii huolellisuutta. Tarjolla oleva helpon tuntuinen temppu Min x + x + x 3 st x + x + x 3 0 x + x + x 3 ½ x +x x 3 Min x + x + x 3 st x 3 + x 3 9 (3.87) on virheellinen. Yksinkertaistetussa optimointitehtävässä eimuuttujienx ja x arvoja enää rajoiteta millää ehdolla, vaikka alkuperäisessä tehtävässä x + x. Yksinkertaistetun optimointitehtävän tavoitefunktion arvo saadaan siis miten pieneksi tai miten suureksi tahansa, koska x :lle ja x :lle voidaan antaa mitä tahansa arvoja! /// Esimerkki Oikea ratkaisu. Ratkaistaan edellinen ongelma oikein. Min x + x + x 3 st x + x + x 3 0 x + x + x 3 ½ Min x + x + x 3 st x + x + x 3 (3.88) sillä ensimmäinen rajoite on voimassa aina kun toinen on voimassa. Voimme nyt ratkaista rajoitteesta x 3:n ja sijoittaa sen malliin ½ Min f(x,x )x + x + x x st x + x (3.89) Välttämättömän ehdon toteuttava piste x f 0 (3.90) x 0.5 ei toteuta (3.89):n ehtoa! Optimipisteen onsiisoltavakäyvän alueen reunapiste, jossa x +x elix ± p x. Lopulta saamme x :n optimiarvon määräämiseksi tehtävän ½ Min f(x )x p x (3.9) st x Tämä on lukio-tason ongelma, jolle x f (x ) + p 0 x x (3.9) Rajoitteellinen optimointi, yhtälörajoite 7 Purkamalla tehdyt sijoitukset saamme x (3.96) 5 q x x (3.97) 5 x 3 ± p x? x? 0 (3.98) Saatujen ratkaisujen mielekkyys kannattaa aina tarkistaa alkuperäisten rajoitteiden avulla. Sijoituskeinoa parempi menetelmä on Lagrangen kertojat, jotka esitellään seuraavassa Lagrangen kertojat, yhtälörajoite Lähestymme päätulosta useassa vaiheessa ja aloitamme melko yksinkertaisesta ongelmasta. Tapaus: yksi yhtälörajoite Tarkastellaan ensin perusongelmaa, jossa on yksi yhtälörajoite min f(x), x (x,x,...,x n ) st h(x) 0 (Huomaa: Vaikka yhtälörajoite tasossa merkitsee sitä, että käypä alue rajoittuu jonkin käyrän pisteiksi, niin useamman päätösmuuttujan tilanteessa (n 3) käypä alue ei ole käyrän osa vaan sillä on vapausasteita enemmän kuin yksi.) Olkoon x (x,x,...,x n) optimipiste ja olkoon differentiaali dx (dx,dx,...,dx n ) sellainen, että Silloin koska x on optimipiste, niin x + dx K h(x + dx) 0 df f dx + f dx f dx n 0 (3.99) x x x n ja koska x + dx K, niin /// f( ) (3.93) f( / 5) 5 pienin (3.94) f(+) + (3.95) Toisin sanoen dh h x dx + h x dx h x n dx n 0. (3.00)

38 7 3. Ääriarvotehtäviä 3.4. Rajoitteellinen optimointi, yhtälörajoite 73 f(x ) dx 0ja h(x ) dx 0 Yhtälön (3.00) takia differentiaalia dx ei voi valita miten tahansa. Oletamme, nyt että optimipisteessä h 6 0 (3.0) x n (Tarvittaessa vaihdetaan muuttujien järjestystä.) Differentiaalin dx komponentit dx,dx,...,dx n voidaan nyt valita vapaasti. ¾ h:n sileys dx ehto (3.0) n voidaan ratkaista ehdosta (3.00) Olkoon λ IR. Ehdoista (3.99) ja (3.00) seuraa, että nx i µ f + λ h dx i 0 (3.0) x i x i Valitaan λ siten, että f + λ h 0 (3.03) x n x n Siis yhtälö (3.0) voidaan kirjoittaa n X µ f + λ h dx i 0 (3.04) x i x i i Koska dx,dx,...,dx n voidaan valita vapaasti, voi yhtälö (3.04) olla tosi vain ehdolla f + λ h 0, i,,...,n (3.05) x i x i Saadut n+ yhtälöä(h(x) 0, (3.03),(3.05)) muodostavat ryhmän, josta ratkaistaan n + tuntematonta x,x,...,x n, λ Määritelmä 3.4. On tapana määritellä Lagrangen funktio (engl. Lagrangian) L f(x)+λh(x) L(x,x,...,x n, λ) Lause 3.4. Jos optimointitehtävällä ½ Min f(x) st h(x) 0 on minimipiste x, niin on olemassa λ IR siten, että pisteessä (x, λ ) Lagrangen funktio toteuttaa ehdot (eli L 0) L(x, λ) f(x)+λh(x) L f + λ h 0,i,...,n x i x i x i L λ h(x )0 Huomaa, ettätämä onvälttämätön mutta ei riittävä ehto. Yleensä saadaan monta ehdokasta, joista yksi on optimi. Esimerkki ½ Min x + x + x 3 st. x + x + x 3 0 Lagrangen funktio on L x + x + x 3 + λ(x + x + x 3 ) Välttämätön ehto optimille on +λx 0 +λx L 0 0 x 3 +λx 3 0 x + x + x 3 0 Kolmannen yhtälön perusteella joko x 3 0taiλ. Tapaus x 3 0 +λx 0 () +λx 0 () x + x 0 (3) ()&() x λ x (4) (3)&(4) x ±/ 5 Saamme kaksi välttämättömät ehdot toteuttavaa pistettä ehdokas #: x # / 5 / 5, λ # 5/, f(x # )5/ 5 0

39 74 3. Ääriarvotehtäviä ehdokas #: Tapaus λ x # / 5 / 5, λ # 5/, f(x # ) 5/ p (5) 0 x 0 x x 0 x / x + x + x 3 0 x 3 / (mahdotonta!) Paras ehdokas on # eli x / 5 / 5, λ 5/,f(x ) 5 (3.06) 0 Tapaus: monta yhtälörajoitetta Vastaavalla tavalla kuin edellä voidaan perustella seuraava lause Lause 3.4. Jos optimointitehtävällä ½ Min f(x) st h j (x) 0, j,...,m on minimipiste x, niin on olemassa reaaliluvut λ j,j,...,msiten, että pisteessä (x, λ ) Lagrangen funktio mx L(x, λ) f(x)+ λ j h j (x) toteuttaa ehdot (eli L 0) L f + x i x i mx j j λ j h j x i 0, i,...,n L λ j h j (x )0, j,...,m Huomaa, että tämä on välttämätön mutta ei riittävä ehto. Yleensä saadaan monta ehdokasta, joista yksi on optimi Rajoitteellinen optimointi, yhtälörajoite 75 Esimerkki Min x + x + x 3 st. x + x x + x + x 3 0 Lagrangen funktio on L x + x + x 3 + λ (x + x 3 0) + λ (x + x + x 3 ) Välttämätön ehto optimille on +λ x + λ 0 +λ 0 L 0 x 3 +λ x 3 + λ 0 x + x x + x + x 3 0 Toinen yhtälö λ λ x x /(λ ) ( + λ )x 3 / x 3 /( + λ ) x + x 3 0 x + x + x 3 Kun sijoitetaan x ja x 3 kolmanteen yhtälöön ja tehdään muuttujan vaihto λ u /, saadaan 4λ + 4( + λ ) 0 ( + λ ) + λ 40λ ( + λ ) (u +/) +(u /) 40(u /) (u +/) u +/ 40(u /4) 40u 4 u + 0 s λ ± ± 4 40 Saamme neljä ehdokasta minimipisteeksi λ x x 3 x f(x) Paras ehdokas on ensimmäinen, joten minimi on x , λ µ , f(x ).3780

40 76 3. Ääriarvotehtäviä Resurssirajoite, resurssin varjohinta ma3d3.tex Tutkitaan aluksi yleistä ongelmaa ½ min z f(x,p) st. h j (x,p) 0, j,...,m missä p IR on mallin reaaliarvoinen parametri. Kun parametrin arvo muuttuu hieman, muuttuu myös optimikohta ja tavoitefunktion optimiarvo. ½ x p p + p x + x z z + z Raja-arvo on reaaliluku ja raja-arvo z lim p 0 p dz dp IR x lim p 0 p dx dp on vektori. Kokonaisdifferentiaalin mukaan optimipisteessä Vastaavasti dz dp λ j dh j dp dx /dp. dx n/dp IR n f dx x dp + f dx f dx n +... x dp x n dp + f p dx f dp + f p λ j h j Optimipisteessä pätee edellisen kappaleen mukaan x f + (3.07) dx dp + λ h j j 0, j,...m (3.08) p x L 0 mx λ j h j 0 j mx f λ j h j (3.09) j 3.4. Rajoitteellinen optimointi, yhtälörajoite 77 Yhdistämällä kaavat (3.07), (3.09) ja (3.08) saadaan tavoitefunktion optimiarvon muutosherkkyys df (x,p) dp Resurssin varjohinta f m p + X j λ j h j p Tarkastellaan erityisesti resurssia parametrina. ½ ½ min f(x) min f(x) st. hj (x) β j st. h j (x) h j (x) β j 0 Kaavan (3.0) avulla saamme resurssin β k varjohinnan. Siis dz f + dβ k β k mx j λ j h j β k λ k λ j on resurssin j varjohinta (3.0) Esimerkki Tarkastellaan uudelleen esimerkin ongelmaa. min z f(x,x ) x x ehdolla x +5x 0β (3.) Rajoite on tyypillinen resurssikulutukseen liittyvä ehto. Jos niukkaa resurssia on olemassa 0 yksikköä, niin yrittäjää usein kiinnostaa tietää miten paljon tavoitefunktion arvo paranee, jos niukkaa resurssia saadaan dβ:n verran lisää. Muodostetaan Lagrangen funktio L x x + λ(x +5x 0) (3.) Välttämätön ehto optimille on x +λ 0 L 0 x +5λ 0, (3.3) x +5x 0 0 josta ratkaistu optimi on x.5, x.0 jaλ 0.5, joten dz 0.5 (3.4) dβ ///

41 78 3. Ääriarvotehtäviä Esimerkki Tarkastellaan uudelleen esimerkin yritystä. Yritys valmistaa kahta tuotetta A ja B. Viikottaiset valmistusmäärät ovat x ja x. Kysyntä- ja kustannusfunktiot ovat p 0.0x 0.0x (3.5) p 50 0.x (3.6) C 5x +7x +0.0x +0.0x x x (3.7) Voittofunktio on silloin x P x 7x +43x 0.03x 0.05x x 0.x (3.8) Yhden A-tuotteen valmistaminen vaatii.5 tuntia työtä jayhdenb-tuotteenvalmistaminen vaatii 0.75 tuntia työtä ja viikossa on työresurssia käytettävissä 60 tuntia. Yritys päättää toimia täydellä kapasiteetilla, jolloin.5x +0.75x 60 (3.9) Voiton maksimointi johtaa nyt rajoitteelliseen optimointitehtävään ½ Max P 7x +43x 0.03x 0.05x x 0.x st..5x +0.75x 60 ½ Min z P 7x 43x +0.03x +0.05x x +0.x st..5x +0.75x 60 L P + λ(.5x +0.75x 60) Välttämätön ehto saa muodon L x +0.05x +.50λ x +0.4x +0.75λ 0.5x +0.75x 60 0 x x 7 λ. P 3900 (3.0) (3.) (3.) Varjohinta λ. kertoo miten paljon yhdestä lisätyöresurssista (työtunti) enintään kannattaa maksaa yli normaalin taksan. Kaksi C /tunti on melko pieni varjohinta, joten ainakaan ylityötä tuskin kannattaa teettää. /// 3.5. Rajoitteellinen optimointi, epäyhtälörajoite Rajoitteellinen optimointi, epäyhtälörajoite Tässä luvussa rajoitumme tutkimaan optimointiongelmia, jotka ovat muotoa min f(x) st g i(x) 0, i,...,n h j (x) 0,j,...,m Oletamme siis, että. ongelma on minimointiongelma,. epäyhtälörajoitteet ovat tyyppiä ja 3. lisäksi oletamme, että kaikki funktiot (f, g i, h j ) voidaan derivoida jatkuvasti niin monta kertaa kuin kulloinkin haluamme. Oletukset ja saadaan aina järjestettyä, mutta sileysvaatimus 3 ei ole aina järjestettävissä. Sivuutamme nyt tämän ongelman Graafinen ratkaisu Kun x (x, y) IR voidaan ongelmaa tutkia graafisesti (x, y)-tasossa. Ongelman min f(x) st g i (x) 0 (h j (x) 0) graafisen ratkaisemisen vaiheet voidaan kuvata karkeasti seuraavasti. () Piirrä käypä aluek (.) Kaikilla i: Piirrä käyrä g i (x, y) 0japiirräkäyrän pisteeseen x pieni nuoli suuntaan g i. (Nuoli osoittaa käyvän puolen.) (.3) Piirrä käyrä h(x, y) 0. (.4) Merkitse kuvaan K () Piirrä kuvaan tasa-arvokäyriä Muutamalla z:n arvolla: Piirrä käyrä f(x, y) z ja piirrä käyrälle f (3) Tee johtopäätös Esimerkki 3.5. Tutkitaan ongelmaa min x + y st x y 3 0 x + y 3 0 µ g (x, y) x x y 3 g g 4

42 80 3. Ääriarvotehtäviä 3.5. Rajoitteellinen optimointi, epäyhtälörajoite 8 Figure 3.: Esimerkin 3.5. graafinen ratkaisu. g (x, y) x x + y 3 g g 4 f(x, y) x + y f Kuvasta 3. näemme, että optimipiste on paikassa, jossa tavoitesuora sivuaa käyrää g (x, y) 0. Siis f g µ x µ ½ x y Esimerkki 3.5. Tarkastellaan yritystä, joka toimittaa varastonsa kautta tuotteita asiakkaille. Vuotuinen kysyntä ond 000 (tuotetta/vuosi), varaston yksikköylläpitokustannus on h 9 (/tuote/vuosi), puutekustannus on s 6 (/tuote/vuosi) ja tilauskustannus on K 5 (/tilaus). Yritys määrittää tilauserän koon x ja maksimivaraston koon x puutteen sallivan varastomallin mukaisesti. Päätösmuuttujien optimiarvoiksi saadaan x p KD(s + h)/(sh) p (6 + 9)/(6 9) 500/ 4 x p KDs/((s + h)h) p /((6 + 9) 9) 400/5 7 Yrityksen käytettävissä olevaan varastoon mahtuu vain 0 tuotetta. Alkuperäisen optimointimallin min f(x,x ) x h + (x x ) s x x + KD x Figure 3.: Esimerkin 3.5. graafinen ratkaisu a) alkuperäinen ja b) lisäehdolla x 0. ehdolla x x 0 x,x 0 sijasta on siis ratkaistava rajoitettu versio min f(x,x ) x h + (x x ) s x x ehdolla x x 0 x 0 0 x,x 0 + KD x Kummankin mallin graafinen tarkastelu on kuvassa (3.). Kuvasta nähdään, että ratkaisu on x 0(tasan)jax 35. Asia varmistuu kokeilemalla f(34; 0) f(35; 0) f(36; 0) ,

43 8 3. Ääriarvotehtäviä 3.5. Rajoitteellinen optimointi, epäyhtälörajoite Laskeva ja käypä suunta Kun ratkaistaan numeerisesti optimointitehtävää min st f(x) g i (x) 0, i,...,n lähdetään liikkeelle alkuratkaisusta x 0. Parannetaan ratkaisua siirtymällä askelen d verran uuteen ratkaisuun x x 0 + d Oletamme nyt, että askeld on nyt niin lyhyt, että voimme arvioida funktioiden arvojen muutoksia kokonaisdifferentiaalin avulla df f(x ) f(x 0 ) f d f d n f d x x n ja dg i g i (x ) g i (x 0 ) g i d g i d n gi d x x n Mahdollinen askelvektori d on laskeva suunta, jos f d < 0 ja aktiivisen rajoitteen g i kannalta käypä suunta, jos g i d 0. Jos x 0 on käyvän alueen sisäpiste (ei aktiivisia rajoitteita), niin kannattaa valita d f(x 0 ). Jos f:n gradientti pisteessä x 0 ei ole nolla, niin uusi ratkaisu x on edellistä parempi. Jos f:n gradientti pisteessä x 0 on nolla, niin prosessi pysähtyy välttämättömän ehdon ( f(x 0)0) toteuttavaan pisteeseen. (Huom: Tämä ei todista, että x 0 olisi optimiratkaisu!). Jos x 0 on käyvän alueen reunapiste (aktiiviset rajoitteet g i (x) 0, i,...,p), niin edellä tehty askelvalinta ei välttämättä olekäypä. Nyt on valittava mahdollisimman hyvä käypä suunta. Ratkaistaan siis tehtävä Min z f d st. gi d 0, i,...,p d k h, k,...,n missä h>0 on valittu askelpituus. Jos LP-mallin tavoitefunktion optimiarvo z < 0, niin d on laskeva käypä askelsuunta ja asetamme x x 0 + d. Jos z 0, niin emme löydä laskevaakäypää askelsuuntaa, ja x 0 on lokaali minimikohta. Figure 3.3: Esimerkin käypä alue. Esimerkki Min f(x,x ) x x st. g (x,x ) x x 0 g (x,x ) 3x + x 6 0 g 3 (x,x ) 4x + x + x 0 Tutkimme nyt käyvän alueen nurkkapisteet (ks. kuva (3.3)) Pisteessä A: f x A, g 0, x 0 B.5, x.5 C, g x 4 Paras käypä laskevaaskelsuunta löytyy mallilla Min z d d st. d d 0 LINDO 4d + d 0 z 3, d d Siis A ei ole minimipiste. d

44 84 3. Ääriarvotehtäviä 3.5. Rajoitteellinen optimointi, epäyhtälörajoite 85 Pisteessä B: f, g, g 3, Lause 3.5. Jos optimointitehtävällä Min f(x), x IR n st g i (x) 0, i,...,p h j (x) 0, j,...,m Paras käypä laskeva askelsuunta löytyy mallilla Pisteessä C: Min z d d st. d d 0 3d + d 0 d d f, g z.67, d /3 Siis B ei ole minimipiste. LINDO 3, g 3 Paras käypä laskeva askelsuunta löytyy mallilla Min z d d st. 3d + d 0 6d + d 0 d d LINDO 4+x 6 z 0, d 0 0 Siis C on lokaali minimipiste. on minimipiste x, niin on olemassa reaaliluvut µ i 0, i,...,p ja λ j,j,...,m siten, että optimipisteessä (x,µ, λ ) Lagrangen funktio toteuttaa ehdot L(x, λ) f(x)+ L f + x k x k px i px mx µ i g i (x)+ λ j h j (x) i µ i g i x k + µ i 0, i,...,p µ i g i (x ) 0, i,...,p g i (x ) 0, i,...,p h j (x ) 0, j,...,m Käytämme ehdoille nimityksiä mx j j λ j h j x k 0, k,...,n x L 0 optimaalisuus (optimality) µ 0 ei-negatiivisuus (non-negativity) µ g 0 komplementtaarisuus (complementarity) g 0, h 0 käypyys (feasibility) Komplementaarieuusehto sanoo, ettäjosrajoiteg i (x) 0 ei ole aktiivinen optimissa, niin µ i 0. Vastaavasti, jos optimissa µ i > 0, niin g i (x ) 0 eli ollaan sillä käyän alueen reunan osalla, jossa g i(x) Lagrangen kertojat, epäyhtälörajoite Esimerkki Min f(x, y) x + y st. g (x, y) x y 4 0 g (x, y) x + y 4 0 Seuraavaksi tutkimme yleistä ongelmaa. Muotoilemme ensin lauseen ja annamme esimerkin. Todistus jätetään jatkokurssille. L x + y + µ (x y 4) + µ (x + y 4)

45 86 3. Ääriarvotehtäviä Välttämätön ehto minimille saa muodon +µ x +µ x 0 µ + µ 0 µ (x y 4) 0 µ (x + y 4) 0 µ 0 µ 0 x y 4 0 x + y 4 0 Tapaus µ µ 0eli käyvän alueen sisäpisteet. Välttämätön ehto saa muodon ( 0 rr. ( x L 0) (µ ig i 0) (µ i 0) (g i 0) Tapaus µ 0,µ > 0 (g on aktiivinen). Välttämätön ehto saa muodon +µ x 0 +µ 0 µ x + y 4 0 µ > 0 rr x y 4 0 Ei siis ehdokaspisteitä tässä reunanosassa. Tapaus µ > 0,µ 0(g on aktiivinen). Välttämätön ehto saa muodon +µ x 0 x µ 0 µ x y 4 0 y 3 µ > 0 ok x + y 4 0 ok Saadaan ehdokaspiste x, y 3, f(, 3) ( ) + ( 3) 5. Tapaus µ > 0,µ > 0 (g ja g aktiivisia). Välttämätön ehto saa muodon +µ x +µ x 0 µ 3/ µ + µ 0 µ / x y 4 0 y 0 x + y 4 0 x µ > 0 ok µ > 0 ok 3.5. Rajoitteellinen optimointi, epäyhtälörajoite 87 Saadaan ehdokaspiste x, y 0,f(, 0) ( ) + (0) 4. Valitsemalla ehdokkaista paras, saamme µ x y 3, µ, f(x ) 5 0 Esimerkki Seuraavaa esimerkkiä emme ratkaise loppuun saakka, vaan kirjoitamme vain välttämättömät ehdot minimille. Tarkastellaan tuotevalintaongelmaa, kun yhden tuotteen kysyntä riippuu voimakkaasti myyntihinnasta (eli tuotteesta saatava kate riippuu valmistusmäärästä). Yritys valmistaa kolmea tuotetta seuraavalla tavalla tuote tuote tuote 3 resurssi valmistusmäärät x 5 x 0 x 3 70 kate / tuote valmistusaika / tuote 4 00 raaka-aine / tuote raaka-aine / tuote tuotteen myyntihinta on nyt 0 ja valmistuskustannus 6, joista erotuksena saadaan kate 4. Kysynnän hintajousto on markkinointiosaston arvion mukaan 0., joten voimme arvioida hinnan muutosta, jos tuotannon määrää muutetaan 0. p dx x dp 0 5 dx dp dp dx 0.5 Jos mallinnamme kysynnän lineaarisella kysyntäfunktiolla, niin p 0 0.5(x 5) x kokonaiskate (p 6)x 0.5x 0.5x Kun otamme huomioon tuotteen hintajouston, saamme optimoitavaksi tuotevalintaongelman max 0.5x 0.5x + 5x + 3x 3 st. x + 4x + x x + 6x + x 3 0 0x + 5x + 0x x 0 x 0 x 3 0 min z 0.5x +0.5x 5x 3x 3 st. x +4x + x x +6x +x x +5x +0x x 0 x 0 x 3 0

46 88 3. Ääriarvotehtäviä Lagrangen funktio on L 0.5x +0.5x 5x 3x 3 + µ (x +4x + x 3 00) +µ (0x +6x +x 3 0) + µ 3 (0x +5x +0x 3 500) µ 4 x µ 5 x µ 6 x 3 ja minimin välttämättömät ehdot saavat muodon x +µ +0µ +0µ 3 µ µ +6µ +5µ 3 µ µ +µ +0µ 3 µ 6 0 µ (x +4x + x 3 00) 0 µ (0x +6x +x 3 0) 0 µ 3 (0x +5x +0x 3 500) 0 µ 4 x 0 µ 5 x 0 µ 6x 3 0 µ 0 µ 0 µ 3 0 µ 4 0 µ 5 0 µ 6 0 x +4x + x x +6x +x x +5x +0x x 0 x 0 x 3 0 Vaihtoehtoisia tapauksia (µ i 0 / µ i > 0) on 6 64 tapausta, joista eräät näkee helposti mahdottomiksi. Jos esimerkiksi µ µ µ 3 0,niintoinenja kolmas ehto ovat epätosia (tämä poistaa listalta 8 tapausta.) Tapausten läpikäynti on suoraviivainen, mutta työläs tehtävä, jonka nyt jätämme kesken. Tutkitaan kuitenkin yrityksen nykyinen toimintapiste, jossa kaikki resurssirajoitteet ovat aktiivisia (µ > 0,µ > 0,µ 3 > 0) ja kaikki merkkirajoitteet ovat epäaktiivisia (µ 4 µ 5 µ6 0). Minimin välttämẗtömät ehdot menevät silloin 3.5. Rajoitteellinen optimointi, epäyhtälörajoite 89 muotoon 0.5x +µ +0µ +0µ µ +6µ +5µ 3 5 µ +µ +0µ 3 3 x +4x + x x +6x +x 3 0 0x +5x +0x µ > 0 µ > 0 µ 3 > 0 x > 0 x > 0 x 3 > 0 x 5 x 0 x 3 70 µ 3.03 µ 0.59 µ EI OPTIMI Siis toteamme, että yrityksen nykyinen toimintatapa, joka on lineaarisen mallin mukainen optimiratkaisu, ei ole epälineaarisen mallin optimiratkaisu Optimointitehtävän relaksaatio Jos rajoitteita on monta, on ongelman täydellinen tutkiminen usein työläs tehtävä. Seuraavassa esitettävä keino auttaa säästämään vaivoja. Ryhdymme vertaamaan kahta optimointitehtävää ½ ½ Min z f(x) Min z f(x) O : ja O st x K : st x K Tavoitefunktiot ovat siis samat, mutta käyvät alueet eroavat toisistaan. Sanomme, että ongelmao on perusongelman O relaksaatio, josk K. Tavallisin tapa muodostaa relaksaatio, on jättää yksi tai useampi perusongelman rajoite pois, jolloin käypä aluelaajenee. Lause 3.5. Olkoon x relaksaation globaali ääriarvokohta. Jos x toteuttaa kaikki perusongelman rajoitteet, niin x on perusongelman globaali ääriarvokohta. Todistus. Jos x on paras joukon K pisteistä jax K K, niin se on myös paras (pienemmän) joukon K pisteistä. Esimerkki Tarkastellaan vielä kerran yritystä, joka valmistaa tuotteita A ja B (Ks. esimerkit ja 3.4.8). Kysyntä reagoi joustavasti ja työresurssi on rajoitettu. Nyt kuitenkin työresurssia on 00 tuntia, eli enemmän kuin esimerkissä Kaikkea työresurssia ei tarvitse käyttää tuotteiden A ja B tekemiseen, vaan

47 90 3. Ääriarvotehtäviä resurssia voidaan ohjata muualle. Optimointitehtävä on siis seuraava. Min z P 7x 43x +0.03x +0.05x x +0.x st..5x +0.75x 00 x 0 x 0 (3.3) Muodostetaan perusongelmasta (3.3) relaksaatio jättämällä merkkirajoitteet pois. ½ Min z P 7x 43x +0.03x +0.05x x +0.x (3.4) st..5x +0.75x 00 Lagrangen funktio on L P + µ(.5x +0.75x 00) (3.5) ja välttämätön ehto optimille on x +0.05x +.5µ x +0.4x +0.75µ 0 µ(.5x +0.75x 00) 0 µ 0.5x +0.75x 00 0 Jos µ 0,niin x +0.05x x +0.4x 0.5x +0.75x 00 0 Jos µ>0, niin x +0.05x +.5µ x +0.4x +0.75µ 0.5x +0.75x 00 0 µ 0 ( x L 0) (µg 0) (µ 0) (g 0) ½ x 73.0 x 74.6 rr x 46.9 x 7.9 µ.06 ok (3.6) (3.7) (3.8) Koska lim x z + ja lim x z +, on (3.8) relaksaation optimiratkaisu. Koska se toteuttaa myös perusongelman merkkirajoitteet, se on alkuperäisen ongelman optimiratkaisu. /// Esimerkki Esimerkissä jäi todellinen optimi ratkaisematta. Yrityksen johtaja arvelee laajan kokemuksensa perusteella, että optimissa kolmatta resurssia jää käyttämättä ja kaikkia tuotteita valmistetaan. Siksi teemme perusongelmasta (3.9) relaksaation jättämällä merkkirajoitteet ja kolmas resurssirajoite pois. min z 0.5x +0.5x 5x 3x 3 st. x +4x + x (3.9) 0x +6x +x Pienimmän neliösumman menetelmä 9 L 0.5x +0.5x 5x 3x 3 (3.30) +µ (x +4x + x 3 00) + µ (0x +6x +x 3 0) ja minimin välttämättömät ehdot saavat muodon x +µ +0µ 0 ½ x µ +6µ 0 µ 3+µ +µ 0 µ /6 µ (x +4x + x 3 00) 0 x 3.94 µ (0x +6x +x 3 0) 0 x µ 0 ok µ 0 ok x +4x + x ok 0x +6x +x ok Saimme siis relaksaation optimiratkaisun. Tämä ratkaisu toteuttaa kaikki relaksaatiosta pois jätetyt perusongelman rajoitteet, 0x +5x +0x (3.3) x 0 (3.3) x 0 (3.33) x 3 0 (3.34) joten se on perusongelman optimiratkaisu. Johtaja oli siis oikeassa ja hänen arvionsa on nyt osoitettu laskien oikeaksi. /// 3.6 Pienimmän neliösumman menetelmä 3.6. Approksimointi polynomilla Olkoon lähtökohtana joukko havaintoja {(x,y ), (x,y ),...,(x N,y N )}. Muodostetaan polynomifunktio P (x) siten,että mahdollisimman tarkasti olisi voimassa y k P (x k ). Olkoon polynomi P (x) astettan, eli P (x) b 0 + b x + b x b n x n (3.35) Määritetään kertoimet b i siten, että neliösumma NX NX f(b) (P (x k ) y k ) (b 0 + b x k b n x n k y k ) (3.36) k k

48 9 3. Ääriarvotehtäviä saa pienimmän mahdollisen arvon. Minimin välttämätön ehto on nyt f b j Jos asetamme NX (b 0 + b x k b n x n k y k )x j k (3.37) k ³ X b 0 x j k + b X X x j+ k b n x j+n k X y k x j k (3.38) 0, kaikilla j 0,...,n P P N xk... x n P P P P k b 0 yk xk x k... x n+ P k b P P. yk x k x n k x n+ P. (3.39) P k... x n k b n yk x n k x x... x n x x... x n A x 3 x 3... x n x N x N... xn N ja Rank(A) n, niin yhtälöryhmä (3.39) voidaan kirjoittaa (3.40) (3.39) A T Ab A T y (3.4) b A + y (3.4) Seuraavaksi pohdimme riittävän ehdon toteutumista edellä käsitellylle minimointitehtävälle. Hessin matriisi saadaan osittaisderivoimalla vielä kerran (3.38). Osoittautuu, että Hessin matriisi on sama kuin yhtälöryhmän (3.39) kerroinmatriisi Mutta jos Rank(A) n, niin A:n ydin on triviaali ja H A T A (3.43) x T Hx x T A T Ax (Ax) T Ax kaxk > 0, x 6 0, (3.44) joten Hessin matriisi on positiivisesti definiitti, ja välttämättömän ehdon toteuttava piste on minimointitehtävän globaali optimikohta. Parhaan approksimoivan polynomin kertoimet saadaan siis kaavasta (3.4). Esimerkki 3.6. Olemme tehneet havainnot x k y k Pienimmän neliösumman menetelmä 93 Jos haluamme sovittaa pienimmän neliösumman menetelmällä toisen asteen polynomifunktion pisteisiin, niin matriisit A ja A + (A T A) A T ovat , 95, 7 0, , 63, 055 0, , 370 0, 486 0, , 57 0, 04 0, , 07 0, 36 0, , 5 0, 640 0, , 46 0, 8 0, 48 A.0.00 ja A + 0, 30 0, 905 0, , 37 0, 89 0, , 94 0, 78 0, , 3 0, 576 0, , 9 0, 7 0, , 03 0, 8 0, , 94 0, 66 0, , 45, 0, 735 T (3.45) Havaintopisteisiin sovitetun polynomifunktion kerroinvektoriksi saadaan, 77 b A + y 0, 467 (3.46) 0, 8048 Kuvaan 3.4 on piirretty havaintopisteet ja polynomin P (x) b + b x + b 3 x kuvaaja.

49 94 3. Ääriarvotehtäviä 3.6. Pienimmän neliösumman menetelmä 95 Yhtälö (3.49) voidaan kirjoittaa muotoon kax yk on pieni, (3.5) missä Ratkaisemme siis minimointitehtävän u w u w u 3 w 3 u A 4 w 4 u 5 w 5 u 6 w 6 u 7 w 7 u 8 w 8 (3.5) min f(x) kax yk x T A T Ax y T Ax + kyk (3.53) Figure 3.4: Esimerkin 3.6. havaintopisteet ja niihin PNS-menetelmällä sovitetun polynomifunktion kuvaaja Lineaarisen mallin sovitus Yritys tuottaa eläinten rehua ja sen suurimmat asiakkaat ovat turkistarhoja ja suurkanaloita. Tulevaa neljännevuotta suunniteltaessa on käytettävissä kokoturkistarha- alan liikevaihto neljännesvuosittain (u k,k,...,8) kahden viime vuoden ajalta sekä tulevanneljännesvuoden ennuste ũ 9. Vastaavasti on käytettävissä siipikarjan kasvattajien yhteenlaskettu liikevaihto neljännesvuosittain (w k,k,...,8) kahden viime vuoden ajalta sekä tulevan neljännesvuoden ennuste w 9. Rehun myynti (y k,k,...,8) on myös tiedossa neljännesvuosittain kahden viime vuoden ajalta. Yritys haluaa laskea mahdollisimman hyvän ennusteen tulevan neljännesvuoden myynnille ŷ 9. Tietty osuus kaikista turkistarhoista on yrityksemme asiakkaita ja vastaavasti tietty osa kaikista suurkanaloista on yrityksemme asiakkaita. Siksi on luonnollista olettaa, että sopivasti valituilla kertoimilla x,x,x 3,pätee x + x u k + x 3 w k ŷ k y k (3.47) Kaava (3.47) on lineaarinen selitysmalli, jossa myynti y k on selitettävä muuttuja ja asiakastoimialojen liikevaihdot u k ja w k ovat selittäviä muuttujia. Jos kertoimet x,x,x 3 saadaan valittua siten, että ŷ k y k, k (3.48) eli kŷ yk on pieni (3.49) niin saamme hyvän ennusteen tulevan neljännesvuoden myynnille asettamalla ŷ 9 x + x ũ 9 + x 3 w 9. (3.50) Ennen kuin laskemme tavoitefunktion gradientin, toteamme kaksi kaavaa tätä laskua varten. Olkoon b IR 3 ja olkoon B symmetrinen (3 3)-matriisi. Silloin (b T x) (b x + b x + b 3 x 3 )b k (3.54) x k x k (x T Bx) (x b x + x b x + x b 3 x (3.55) x k x k...+ x b x + x b x + x b 3 x x 3 b 3 x + x 3 b 3 x + x 3 b 33 x 3 ) b kx +b kx +b k3x 3 Siis f(x) (A T A) k x +(A T A) k x +(A T A) k3 x 3 (A T y) k (3.56) x k Minimin välttämätön ehto saa siis nyt muodon f 0 (3.57) (A T A) x +(A T A) x +(A T A) 3 x 3 (A T y) (A T A) x +(A T A) x +(A T A) 3x 3 (A T y) (3.58) (A T A) 3 x +(A T A) 3 x +(A T A) 33 x 3 (A T y) 3 A T Ax A T y (3.59) x (A T A) A T y A + y (3.60) Vastaavasti kuin edellisessä kappaleessa näemme, että minimointitehtävän Hessin matriisi H A T A on positiivisesti definiitti, jos Rank(A) n. Jos siis A on full rank, niin (3.60) antaa parhaan lineaarisen selitysmallin kertoimet.

50 96 3. Ääriarvotehtäviä 3.7. Tuotantofunktio, resurssien jakaminen 97 Esimerkki 3.6. Olkoon alussa mainitun eläinrehua valmistavan yrityksen tilannetta kuvaavat aikasarjat (u k ), (w k )ja(y k ) seuraavan taulukon mukaiset k u k w k y k 535,53 96,37 43,6 404,93 8,33 0, ,68 3,77 5, ,5,48 94,34 5 4,70 37,99, ,57 36,8 3, ,89 84,45 4, 8 393,06 349,95 70,4 9 55,6 3,69 Kaavasta (3.60) saamme kertoimet optimaaliselle mallille ŷ k 0, , 986u k +0, 43w k (3.6) Mallin hyvyyttä voimme nyt tutkia piirtämällä toteutuneet ja mallin ennustama myynti samaan kuvaan (ks kuva 3.5). Malli ei välttämättä ainaonnistuennus- tamisessa täsmällisesti, mutta silti se antaa melko luotettavan pohjan tulevan kauden suunnittelulle. /// 3.7 Tuotantofunktio, resurssien jakaminen Usein yrityksen tuotantotoiminta voidaan nähdä toimintana, jossa tuotetta valmistettaessa tarvitaan kahta tai useampaa resurssia. Resurssit voivat olla työ japääoma, oma valmistus ja alihankinta. Eräs ajankohtainen sovellus on valmistus, jossa tuote voidaan tehdä nopeastisu- urella energian kulutuksella (raaka voima), tai tuote voidaan valmistaa energiaa säästäen, kun käytetään monimutkaisempia prosesseja (enemmän koneita ja enemmän työtä). Seuraavassa käytämme klassista jakoa kahteen tuotannontekijään: työ L ja pääoma K. Yrityksen kokonaistuotanto z riippuu käytetyistä tuotannontekijöistä tavalla jonka ilmaisee tuotantofunktio z f(l, K) (3.6) Normaalisti, kun yritys toimii normaalilla tavalla, sen rajatuottavuudet ovat positiivisia MP L z L > 0 ja MP K z K > 0 (3.63) mutta väheneviä z L < 0 ja z K < 0 (3.64) Figure 3.5: Esimerkin 3.6. asiakastoimialojen liikevaihdot sekä yrityksen toteutunut myynti ja selitysmallin ennustama myynti. Optimointitehtävän kannalta saman asian saa esitettyä parhaiten piirtämällä LKtasoon tuotantofunktion tasa-arvokäyriä (ks. kuva3.7). Piirretään samaan kuvaan vielä budjettisuora wl + rk B (3.65) missä w on työn yksikköhinta, r on pääoman yksikköhinta ja B on suunnittelujaksolle budjetoitu resurssi. Jos yritys haluaa saada budjetoidulla resurssilla mahdollisimman suuren tuotoksen, niin tehtävänä on siis löytää budjettisuoralta mahdollisimman hyvä piste. Optimipisteessä (L,K ) rajoitesuora sivuaa tasa-arvokäyrää. Rajoitesuoran kulmakerroin w/r on siis optimissa yhtäsuuri kuin rajakorvaavuusaste dk/dl optimikohdassa, (marginal rate of substitution). Koska budjettisuora sivuaa tasaarvokäyrää, ei pieni siirros (dl, dk) budjettisuoraa pitkin muuta tuotantofunktion arvoa dz z z dl + dk 0 (3.66) L K MP L dk MP K dl w (3.67) r Siis rajakorvaavuusaste on MRS L,K MP L MP K w r (3.68)

51 98 3. Ääriarvotehtäviä 3.7. Tuotantofunktio, resurssien jakaminen 99 Figure 3.7: Budjettisuora wl + rk B sekä tuotantofunktion z f(l, K) tasaarvokäyriä. Yhtälössä (3.68) esiintyviä työn ja pääoman rajatuottavuuksia voidaan arvioida nykyisessä toimintatilanteessa, vaikka tuotantofunktion tarkka muoto jäisikin selvittämättä. Jos arvion mukaan MP nyt L MP nyt > w r K (3.69) Figure 3.6: a) Tuotanto työn funktiona, kun pääoma on kiinnitetty ja b) tuotanto pääoman funktiona, kun työn määrä on kiinnitetty. niin päättelemme seuraavasti. Jos siirrämme toimintapistettä hieman budjettisuoraa pitkin oikealle, niin L kasvaa hieman (dl > 0) ja K pienenee hieman (dk < 0). Koska rajatuottavuudet ovat väheneviä, niin silloin MP L pienenee hieman ja MP K kasvaa hieman. Nämä muutokset korjaavat epäyhtälöä (3.69) oikeaan suuntaan. Siis nykyistä toimintatapaa tulee muuttaa vähemmän pääomaa ja enemmän työvoimaa käyttävään suuntaan Homogeeninen tuotantofunktio Tuotantofunktion muotoa ei kannata määrittää liian pikkutarkalla tavalla. Pääasia on, että tuotantofunktio toimii hyvin nykyisen toimintapisteen ja optimipisteen ympäristössä. (Nokiaa ei kiinosta tuotantofunktion z f(l, K) muoto, kun L on pieni ja K on pieni!) Tuotantofunktion tapauksessa usein lähtökohtana on ajatus lineaarisesta prosessista

52 00 3. Ääriarvotehtäviä Lineaariselle prosessille on voimassa Jos f(l, K) z, niin f(αl, αk) αz Käytännössä lineaarisuus tarkoittaa sitä, että kun kumpaakin tuotannontekijää hankitaan 0% lisää, niin tuotantokin kasvaa 0%:lla. Toisaalta massatuotantoa ei aina kuvaa lineaarisuus, vaan 0%:n lisäys tuotannontekijöissä voi synnyttä enemmän kuin 0%:n kasvun tuotannossa. Määritelmä 3.7. Sanomme, että tuotantofunktio f(l, K) on astetta s oleva homogeeninen funktio, jos f(αl, αk) α s f(l, K) Astetta s olevalla homogeenisella tuotantofunktiolla voidaan mallintaa kasvavia skaalatuottoja (s >, increasing returns to scale) tai laskevia skaalatuottoja (0 < s<, decreasing returns to scale). Kasvavat skaalatuotot ovat tyypillisiä kasvavalle uudelle yritykselle, joka kaikin tavoin pyrkii hyödyntämään massatuotannon etuja. Myöhemmin kasvun jatkuessa skaalatuotot muuttuvat laskeviksi. Tähän oppikirjat mainitsevat mahdollisiksi syiksi esimerkiksi hitaasti uusiutuvien resurssien rajallisuuden sekä kasvunyhteydessä helposti tapahtuvan mopon karkaaminen johdolta. Esimerkki 3.7. Funktio f(x, y) x 3 +5x y +y 3 on astetta 3 oleva homogeeninen funktio sillä f(αx, αy) α 3 x 3 +5α x αy +α 3 y 3 α 3 (x 3 +5x y +y 3 ) (3.70) Huomaa, että jokainen termi on astetta 3. /// Lause 3.7. Jos g(x, y) f(x, y) h(x, y) missä g(x, y) on astetta s oleva homogeeninen funktio ja h(x, y) onastettap oleva homogeeninen funktio, niin f(x, y) onastettas p oleva homogeeninen funktio. Todistus. HT Lause 3.7. (Euler) Josz f(x, y) onastettas oleva homogeeninen funktio, niin x z x + y z sf(x, y) y 3.7. Tuotantofunktio, resurssien jakaminen 0 Todistus. HT Käytännössä usein käytetty tuotantofunktio on seuraava Coubb Douglas -tuotantofunktio. Määritelmä 3.7. Coubb Douglas -tuotantofunktio on z al b K b. (3.7) Funktio on astetta s b + b oleva homogeeninen funktio. Lineaarinen Coubb Douglas -tuotantofunktio on Coubb Douglas -tuotantofunktiolle z al b K b. (3.7) MP L K L (alb b )b al b z K b b L MP K K K (alb b )b al b K b z b K MRS L,K MP L b K MP K b L Esimerkki 3.7. Yritys tuottaa yhtä tuotetta ja sen tuotantofunktio on kysyntäfunktio on budjettirajoite on ja voittofunktio on (3.73) (3.74) (3.75) z 00L / K /, (3.76) p z, (3.77) 0L + 5K 000 (3.78) P pz L / K / 0LK 000 (3.79) Tällä hetkellä yrityksen tuotannontekijöiden määrät ovat L 00 ja K Tarkistetaan ensin onko MRS L,K w/r (ehto (3.68)). MRS L,K b K.667 (3.80) b L w/r 0/ (3.8) Näyttää siis siltä, että yrityksen pitäisi käyttää enemmän työvoimaa ja vähemmän pääomaa. Ehto (3.68) ei nyt kuitenkaan huomioi kysyntäfunktion vaikutusta.

53 0 3. Ääriarvotehtäviä 4.. Supremum ja infimum 03 Haluamme maksimoida voiton, joten ratkaisemme optimointitehtävän ½ min P 000L / K / +0LK ehdolla 0L +5K (3.8) Lagrangen funktio on Lagr(L, K) 000L / K / +0LK λ(0l +5K 000). (3.83) Välttämätön ehto minimille on 000L / K / +0K +0λ 0 000L / K / +0L +5λ 0 0L +5K (3.84) λ K + 00L / K / 000L K / +0L 5K + 500L / K / 0 0L +5K ½ 0L K / +5L / K / 0 0.L 0L +5K (3.85) ½ 00L/K K/L 400 8L +0.04L 0L +5K (3.86) ½ 00L + 5K 700LK 8L K +0.04L 3 K L 00.5K (3.87) 00(00.5K) + 5K 700(00.5K)K + 8(00.5K) K 0.04(00.5K) 3 K 0 (3.88) Viimeisen yhtälön ratkaisu löytyy piirtämällä EXCELillä vasemman puolen lausekkeen kuvaaja. Kuvaajasta nähdään, että K Siis K 66.7 (3.89) L (3.90) λ p 00/ (3.9) z (3.9) p (3.93) P p z (3.94) 4. Jonot ja sarjat Aluksi määrittelemme supremumin ja infimumin käsitteet. Käsitteet eivät ole välttämättömiä potenssisarjojen ymmärtämiseksi. Alan kirjallisuudessa ja tutkimusjulkaisuissa käsitteitä käytetään eikä niitä enää selitetä, vaan lukijan oletetaan tuntevan ne. Kyse on lähinnä merkintätavasta, joka on hyvä tuntea. 4. Supremum ja infimum Toistuvasti syntyy tilanteita, joissa viitataan reaalilukujoukon suurimpaan lukuun eli maksimiin. Tällainen puhetapa aiheuttaa joskus ongelmia, sillä kaikilla reaalilukujoukoilla ei ole maksimia. Esimerkiksi joukoilla A {, 3,..., n,...} ja B {,,...,n,...} (4.) n + ei ole maksimia. Ongelma kierretään seuraavan määritelmän ja aksiooman avulla. Määritelmä 4.. Olkoon A joukko reaalilukuja. Reaaliluku M on joukon A yläraja (upper bound), jos x M, x A. Joukkoonylhäältä rajoitettu, jossillä on yläraja. Reaaliluku S on joukon A supremum, jos se on joukon A pienin yläraja (least upper bound) eli jokaiselle A:n ylärajalle M on voimassa S M. Supremumille käytetään merkintää sup A Vastaavasti määritellään alaraja, alhaalta rajoitettu ja suurin alaraja eli infimum, jota merkitsemme inf A

54 04 4. Jonot ja sarjat 4.. Jonon suppeneminen 05 Jos joukolla A ei ole yhtään ylärajaa, merkitsemme sup A ja jos joukolla ei ole yhtään alarajaa, merkitsemme inf A. Funktion f joukossa D saamien arvojen supremumille ja infimumille käytämme merkintöjä sup f sup{f(x) x D} D inf f D inf{f(x) x D} Aksiooma (reaalilukujoukon täydellisyysaksiooma): Ylhäältä rajoitetulla reaalilukujoukolla on aina supremum. (Vastaavasti alhaalta rajoitetulla reaalilukujoukolla on aina infimum.) Aksiooma ilmaisee reaalilukujoukon ominaisuuden, joka on niin ilmeinen, ettei sitä todisteta vaan asia otetaan aksioomana, josta edelleen voidaan johtaa uusia ominaisuuksia. Rationaalilukujen joukossa ei aksiooma ole voimassa. Esimerkki 4.. Joukossa A {, 3,..., n,...} (4.) n + ei ole suurinta lukua, mutta on sen yläraja. Jos M <, niin jokin joukon A luvuista on suurempi kuin M. Siis on joukon A pienin yläraja, eli sup A. /// 4. Jonon suppeneminen Lause 4.. Jos reaalilukujono (a n )onnousevajaylhäältä rajoitettu, niin se suppenee ja lim n a n sup{a n }. Jos reaalilukujono (b n ) on laskeva ja alhaalta rajoitettu, niin se suppenee ja lim n b n inf{b n }. Todistus. (Todistusta ei kysytä tentissä.) Täydellisyysaksiooman mukaan luku s sup{a n } on olemassa. Jokaista lukua ε > 0 kohti on olemassa n ε IN siten, että a nε >s ε. Jos edellinen ei pitäisi paikkansa, olisi luku s ε/ joukon{a n } yläraja, mikä onmahdotontakoskas on supremum eli pienin ylärajoista. Koska jono on nouseva ja s sen yläraja, on siis s a n s ε kaikille n>n ε. Mutta tämä merkitsee sitä, että lauseen väite on tosi. Jono {b n } vastaavasti. Lause 4.. (Cauchy n yleinen suppenemiskriteeri jonoille): Reaalilukujono (a n) suppenee, jos ja vain jos jokaista lukua ε > 0 kohti on olemassa n ε IN siten, että pätee ehto a n a n+p < ε, kaikilla n>n ε,p IN. (4.3) Todistus. (Todistusta ei kysytä tentissä.) (ehdon välttämättömyys) Oletamme, että(a n ) suppenee ja sen raja-arvo on a. Silloin jokaista lukua ε > 0 kohti on olemassa n ε IN siten, että a n a < ε/, kun n>n ε. Jos nyt n>n ε, niin a n a n+p (a n a) (a a n+p ) a n a + a a n+p ε/+ε/ ε (4.4) (ehdon riittävyys) Oletamme, että ehto (4.3) on voimassa. Valitsemalla ε, ehdosta seuraa luvun m IN olemassaolo siten, että a m a m+p <, p IN. Tästä seuraa, että joukko{a n } on rajoitettu (sekä ylhäältä, että alhaalta). Voimme siis muodostaa uudet jonot Määritelmä 4.. Reaalilukujono (a n ) suppenee kohden lukua a, jos jokaista lukua ε > 0 kohti on olemassa n ε IN siten, että a n a ε, kun n n ε. Merkitsemme tällöin lim n a n a Sanomme, että jono(a n )onnouseva, josa n+ a n, n ja laskeva, josa n+ a n, n. Jono(a n )onylhäältä rajoitettu, jos vastaava pistejoukko {a n } on ylhäältärajoitettu, eli on olemassa reaaliluku M siten, että a n M, n. Vastaavasti määritellään käsite alhaalta rajoitettu jono. β n sup{a k k n} loppujonon suppremum, (4.5) γ n inf{a k k n} loppujonon infimum. (4.6) Jono (β n) on laskeva ja rajoitettu, joten se suppenee. Vastaavasti jono (γ n)on nouseva ja rajoitettu, joten sekin suppenee. Olkoon lim n β n β ja lim n γ n γ. Toteamme seuraavaksi, että β γ. Jos olisi β γ 3ε > 0, niin jokaista n ε kohti löytyisi n>n ε ja m>n ε siten, että a n > β ε ja a m < γ + ε, eli a n a m > (β ε) (γ + ε) > ε. Tämä on mahdotonta, koska oletamme Cauchy n suppenemisehdon (4.3) olevan voimassa. Siis β γ. Koska β n a n γ n ja lim n β n lim n γ n, suppenee myös jono (a n ).

55 06 4. Jonot ja sarjat 4.3 Sarjan suppeneminen Siirrymme nyt sarjoihin. Tarkastellaan reaalilukujonoa (a n ). Muodostetaan uusi jono (s n ) asettamalla s a 4.4. Majoranttiperiaate, suppenemistestejä 07 Todistus. Seuraa jonoja koskevasta Cauchy n suppenemiskriteeristä. 4.4 Majoranttiperiaate, suppenemistestejä s a + a Määritelmä 4.3. Sarja s 3 a + a + a 3. nx s n a k k X k suppenee ja sarjan summa on s, jos osasummien jono (s n )( P n k a k) suppenee ja sen raja-arvo on s. Siis à X n! X a k s lim a k s n k a k k Jos sarja ei suppene, niin sanomme että se hajaantuu. Esimerkki 4.3. Tarkastellaan geometrista sarjaa P k0 aqk. Silloin s n a + aq + aq aq n a( qn+ ). (4.7) q Osasummien lausekkeesta näemme, että geometrinen sarja hajaantuu, kun q ja suppenee, kun q <. Suppenevan sarjan summa on X k0 aq k lim s a( q n+ ) n lim a n n q q (4.8) Lause 4.3. (Cauchy n yleinen suppenemiskriteeri sarjoille): Sarja P k a k suppenee, jos ja vain jos jokaista lukua ε > 0 kohti on olemassa n ε IN siten, että pätee ehto a n + a n a n+p < ε, kaikilla n>n ε,p IN (4.9) /// Lause 4.4. (Majorantti- eli vertailuperiaate). Olkoon P u k positiiviterminen sarja. (a) Jos u k a k jostakin k:n arvosta alkaen ja sarja P a k suppenee, niin myös P u k suppenee. (a ) Jos u k a k, k, niin P u k P a k. (Sanomme, että sarja P a k on suppeneva majorantti.) (b) Jos 0 b k u k jostakin k:n arvosta alkaen ja sarja P P b k hajaantuu, niin myös uk hajaantuu. (Sanomme, että P b k on termistä k alkaen hajaantuva minorantti.) Todistus. (a) Koska P a k suppenee, se toteuttaa Cauchy n suppenemisehdon. Koska toisaalta eräästä k:n arvosta alkaen pätee u n + u n u n+p u n + u n u n+p a n + a n a n+p a n + a n a n+p (4.0) myös P u k toteuttaa Cauchy n suppenemisehdon ja siis suppenee. (b) vastaavasti. (a ) triviaali. Lause 4.4. Sarja X n p n suppenee, kun p> ja hajaantuu, kun p. Todistus. Tapaus p>. Olkoon u k /k p ja Z k a k dx (4.) k xp Silloin 0 <u k <a k termistä k alkaenja X a k lim k n k lim n nx Z n a k lim n µ n p p p dx (4.) xp p (4.3)

56 08 4. Jonot ja sarjat Siis sarja P a k on sarjan P u k suppeneva majorantti ja edellisen lauseen nojalla sarja P u k suppenee. Tapaus p. Olkoon Z k+ b k dx (4.4) k xp Silloin 0 <b k <u k termistä k alkaenja X b k lim k nx n k lim n b k lim n µ (n +) p p Z n+ p dx (4.5) xp (4.6) Siis sarja P b k on sarjan P u k hajaantuva minorantti ja edellisen lauseen nojalla sarja P u k hajaantuu. Lause (Juuritesti) Olkoon P a k positiiviterminen sarja. (a) Jos n a n r<jostakinn:n arvosta alkaen, niin P a k suppenee. (b) Jos n a n > jostakinn:n arvosta alkaen, niin P a k hajaantuu. Todistus. (a) Koska a n r n jostakin n:n arvosta alkaen ja P r k suppenee geometrisena sarjana, on sarjalla suppeneva majorantti. Vertailuperiaatteen nojalla sarja P a k suppenee. (b) Koska a n, on selvää, että sarja P a k hajaantuu. Lause (Suhdetesti) Olkoon P a k positiiviterminen sarja. (a) Jos lim a n+ n (b) Jos lim n a n a n+ a n <, niin X a k suppenee. >, niin X a k hajaantuu. Todistus. (a) Olkoon lim n a n+ /a n <. On olemassa r<jan 0 siten, että a n+ <a n r kun n>n 0. Siis sarjalla on termistä n 0 alkaen geometrinen majorantti. (b) Vastaavasti. Esimerkki 4.4. Olkoon a n n/ n. Silloin a n+ n + lim lim n a n n n+ n n + lim n n n < (4.7) joten edellisen kriteerin perusteella sarja X k k suppenee. (4.8) k 4.5. Transientin kassavirran nykyarvo 09 Lause (alternoiva sarja, Leibniz). Tarkastellaan vuorottelevaa (alternoivaa) sarjaa P ( ) n+ a n missä a n 0, n. Jos lukujono (a n )onjostakinn:n arvosta alkaen aidosti vähenevä (a n+ <a n ) ja lim n a n 0, niin sarja suppenee. Todistus. HT X ( ) n+ a n n Esimerkki 4.4. Harmoninen sarja X n (4.9) 4 n hajaantuu, mutta vastaava vuorotteleva sarja suppenee. X ( ) n+ n (4.0) 4 n (4.) 5 6 Määritelmä 4.4. Sanomme, että sarja P k a k suppenee itseisesti, jos sarja P k a k suppenee. Lause Itseisesti suppeneva sarja suppenee. Todistus. HT 4.5 Transientin kassavirran nykyarvo Seuraavassa mietimme vähittäiskaupan yritystä jonka asiakkaat (perheet) voidaan jakaa neljään ryhmään (A) Aina meillä asioivat,(u) Usein meillä asioivat,(j) Joskus meillä asioivat ja(e) Ei koskaan meillä asioivat. Kaikkiaan vaikutusalueella asuu 000 mahdollista asiakasperhettä. Kauppias suunnitelee tulevaa toimintaa ja

57 0 4. Jonot ja sarjat 4.5. Transientin kassavirran nykyarvo tätä varten hän selvittää asiakaskunnan jakauman. Tuloksena on jakaumavektori n a 400 n n u 00 (4.) n j 00 n e 00 Eri ryhmiin kuuluvien asiakkaiden keskimääräinen kuukausittainen myynti/asiakas on y a 500 y y k u 00 (4.3) y j 50 y e 0 Kokonaismyynti kuukaudessa on siis y tot n a y a + n u y u + n j y j yk T n (4.4) Myynnistä saatava kate on k 00% 0% eli Palkkamenot kuukaudessa ovat R ky T k n (4.5) C wl (4.6) missä L on siis myyjien lukumäärä ja w on yhden myyjän keskimääräinen kuukausipalkka sivukuluineen. Kiinteät kustannukset kuukaudessa ovat F 0 000, joten voitto kuukaudessa on P R C F ky T k n wl F (4.7) Laskentakorolla i 0. (korkointensiteetti ρ ln( + i) ) nettokassavirran nykyarvo on NPV P (4.8) ρ/ Seuraavaksi kauppias ottaa yhteyttä mainostoimistoon ja vertailee erilaisia markkinointikeinoja. Jos kauppias aloittaa lehtimainonnan paikallislehtien kautta, arvioidaan eri asiakasryhmissä tapahtuvan kuukauden aikana siirtymiä kuvassa 4.8 esitetyin todennäköisyyksin. Jos alkuhetken jakauma on n a0 400 n n 0 u0 00, (4.9) n j0 00 n e0 00 Figure 4.8: Tilojen väliset siirtymätodennäköisyydet. niin seuraavan kuukauden jakauman odotusarvo on n a 0.85n a n u n j n e0 n u 0.0n a n u n j n e0 n j 0.05n a n u n j n e0 n e 0.00n a n u n j n e0 (4.30) n a n a0 n u n u0 n j n j0 (4.3) n e {z 0.65 } n e0 S n Sn 0 (4.3) n Sn (4.33). Kuukausi kuukaudelta jakaumat muuttuvat ja lopulta päädytään tasapainoon n T, jossa ½ nt Sn T (4.34) n at + n ut + n jt + n et N 0.85n at + 0.5n ut + 0.0n jt + 0.0n et n at 0.0n at n ut + 0.5n jt + 0.0n et n ut 0.05n at n ut n jt + 0.5n et n jt 0.00n at n ut n jt n et n et n at + n ut + n jt + n et 000

58 4. Jonot ja sarjat n jt 5 n et 6 n at n ut (4.35) Jos lehtimainokset maksavat 4 000/kk, niin tasapainossa voitto kuukaudessa on P R T C F 4000 kyk T n T wl F (4.36) ( ) (4.37) (4.38) Myynnin kasvu on niin merkittävä, että tuleemyös varautua siihen, että työvoimaa tarvitaan suhteessa myyntiin. Siis L αy T n. Alkutilanteesta voimme arvioida α 5/ / Korjattu voittolaskelma on P R T C F 4000 (k wα)yk T n T F (4.39) 50 ( ) ( ) (4.40) (4.4) Jos uusi tasapaino saavutettaisiin heti, niin kaupan nettokassavirran nykyarvo olisi NPV P ρ/ (4.4) Kuvassa 4.9 on Excelillä simuloituna nettokassavirran kehitys alkuarvosta 7 500/kk loppuarvoon 400/kk. Tasapaino saavutetaan noin vuodessa. Ensimmäiset kuukautta mainoskakampanjan alusta muodostavat transientin vaiheen, jossa markkinatilanne siirtyy aikaisemmasta tasapainosta uuteen tasapainoon. Seuraavaksi haluamme laskea nettokassavirran nykyarvon ottaen huomioon, ettei tasapainoon päästä heti, vaan transientin vaiheen kautta. Lasku on periaatteessa selvä. Otamme summaan mukaan N kuukautta (N iso). NPV N NX P j ( + i) j (4.43) j NX µ (k wα)y T k S j x 0 F ( + i) j (4.44) j NX (k wα)yk T ( + i) j S j x 0 F (4.45) ρ/ j {z } BN 4.5. Transientin kassavirran nykyarvo 3 Figure 4.9: Nettokassavirta kuukausittain. Tasapaino saavutetaan noin vuoden kestävä transientin vaiheen jälkeen. Matriisisumma B N muistuttaa geometrista sarjaa. Voimme arvioida sen summa samoin kuin koulussa arvioitiin geometrisen sarjan summaa. Merkitään ( + i) r, jolloin rb N S + r S r N+ S N SB N r S... r N+ S N r N S N+ Siis ja (ri S)B N S r N S N+ B N (ri S) (S r N S N+ ) (4.46) B N x 0 (ri S) (x r N x N+ ) (ri S) x, N (4.47) NPV (k wα)yk T (ri S) (F ) x (4.48) ρ/ (4.49) Mainonnasta saatu hyöty olisi , jos tasapaino saavutettaisiin heti ja transientti vaihe huomioiden saatu hyöty on Transientin vaikutus on siis eli 4% kampanjan antamasta hyödystä. Kampanjan alussa nettokassakertymässä tapahtuu notkahdus, joka on nimellisillä arvoilla laskien jakson t lopussa ero(t) tx P j t (4.50) j

59 4 4. Jonot ja sarjat 4.6. Potenssisarja, suppenemisväli 5 0! Seuraavaksi tarkastelemme erityistä sarjaa, jossa termi on muotoa a k c k (x a) k. (4.5) Sarja ei yleensä suppene kaikilla x:n arvoilla. Niillä x:n arvoilla, joilla sarja suppenee, se määrittelee x:n funktion Figure 4.0: Nettokassakertymän muutos. Notkahdus on enimmillään tx , yk T x j t (3 500) (4.5) Sama Excel-taulu, jolla laskimme jakaumien odotusarvot, antaa nyt pohjan kassakertymän maksiminotkahduksen esittämiselle graafisesti (kuva 4.0). Ennen markkinointikampanjan aloittamista pitää siis varmistaa 5600 C rahoitus kattamaan kassakertymän notkahdus. Rahoituksen saaminen ei pitäisi olla vaikeata, sillä kokonaisuutena hanke on selvästi erittäin kannattava. j f(x) X c k (x a) k (4.53) k0 c 0 + c (x a)+c (x a) + c 3(x a) (4.54) Emme nyt yritä ratkaista potenssisarjan suppenemiskysymystä täydellisesti. Seuraavat säännöt riittävät käytännössä ongelmien hallitsemiseen. Lause 4.6. (a) Jos potenssisarja P k0 c k(x a) k suppenee kun x b, niinse suppenee myös aina, kun x a < b a. (b) Jos potenssisarja P k0 c k(x a) k hajaantuu kun x B, niin se hajaantuu myös aina, kun x a > B a. Todistus. (a) Olkoon x a / b a r<. Koska P c k (b a) k suppenee, on lim k c k (b a) k 0. On siis olemassa M IN siten, että 4.6 Potenssisarja, suppenemisväli Ennen varsinaiseen aiheeseen siirtymistä kertaamme tutun asian, jka on saattanut unohtua. Määritelmä 4.6. Jos k on positiivinen kokonaisluku, niin sanomme että k:n ensimmäisen positiivisen kokonaisluvun tulo on k-kertoma, jota merkitsemme Silloin c k (b a) k <, aina kun k>m (4.55) c k (x a) k c k (b a) k (x a) k (b a) k (4.56) k c k (b a) k x a b a <r k, kun k>m (4.57) k! 3 k Laajennamme vielä määritelmää sopimalla, että 0! ja! Kertomien arvot kasvavat melko nopeasti. Suoraan määritelmästä saaarvot:!, 3! 6, 4! 4, 5! 0, 6! 70, 7! 5 040, 8! 40 30, 9! , Sarjalla P c k (b a) k on siis suppeneva majorantti P r k (termistä M alkaen). (b) Vastaavalla tavalla. Määritelmä 4.6. Jos on olemassa reaaliluku R>0(taiR ) niin, että sarja suppenee jos x a <R, ja hajaantuu jos x a >R, niin lukua R sanotaan sarjan suppenemissäteeksi.

60 6 4. Jonot ja sarjat Lause 4.6. Tarkastellaan potenssisarjaa P k0 c k(x a) k. Jos raja-arvo lim c k+ k c k L on olemassa, niin voimme erottaa kaksi tapausta: () Jos L 0, niin sarjan suppenemissäde on R, eli sarja suppenee kaikikka x IR. () Jos 0 <L<, niin sarjan suppenemissäde on R /L ja sarja suppenee, kun x a <R/L ja hajaantuu, kun x a >R/L. Todistus. Todistamme vain suppenemisosan tapauksesta (). Olkoon x a L +ε < L, missä ε > 0. Silloin jostakin indeksin arvosta k k ε alkaen on c k+ c k <L+ ε (4.58) c k <c ke (L + ε) k kε γ ε (L + ε) k (4.59) Silloin indeksin arvosta k k ε alkaen on c k(x a) k L + ε k < γ ε L +ε (4.60) joten tarkastelemallamme potenssisarjalla on suppeneva geometrinen majorantti (termistä k k ε alkaen). Esimerkki 4.6. Määritä suppenemissäde sarjalle X k0 k k! (x )k (4.6) Suora lasku antaa lim c k+ k c k lim k+ /(k +)! k k /k! lim k+ k (k +)! k! k (4.6) lim k k k!(k +) k! k lim k k + 0 (4.63) Joten R ja potenssisarja suppenee kaikilla x IR. /// 4.7. Taylorin ja MacLaurinin sarjat 7 Esimerkki 4.6. Määritä suppenemissäde sarjalle X k0 k k (x )k (4.64) Suora lasku antaa lim c k+ k c k lim k+ /(k +) k k /k lim k k k + (4.65) Suppenemissäde on R /, joten potenssisarja suppenee, kun x < 4.7 Taylorin ja MacLaurinin sarjat.5 <x<.5 (4.66) Potenssisarja P c k (x a) k f(x) määrittelee x:n funktion. Seuraavaksi toteamme mikä yhteys potenssisarjalla on sen määrittelemän funktion derivaattoihin f(a),f (a),f (a),f (3) (a),... Potenssisarjan suppenemisvälin x a < Rsisäpisteissä funktiof(x) voidaan derivoida derivoimalla sarjaa. Tämä ei ole ihan itsestään selvä asia. Oikeastaan pitäisi ensin osoittaa, että Ã d dx lim n k0! nx c k (x a) k lim nx n k0 d dx c k(x a) k Sivuutamme nyt tämän tarkastelun ja hyväksymme annettuna asiana, että potenssisarjan määrittelemä funktio voidaan suppenemisvälillä x a <Rderivoida sarjasta ja näin saatu derivaattafunktion potenssisaja suppenee samalla välillä x a < R. Siis f(x) c 0 + c (x a)+c (x a) + c 3 (x a) f (x) c +c (x a)+3c 3 (x a) +4c 4 (x a) f (x) c +3 c 3 (x a)+4 3c 4 (x a) +5 4c 5 (x a) f (3) (x) 3 c c 4(x a)+5 4 3c 5(x a) +... f (4) (x) 4 3 c c 5 (x a) c 6 (x a) ///

61 8 4. Jonot ja sarjat Ylläolevat ovat totta erityisesti, kun x a eli f(a) c 0 0! c 0 f (a) c! c f (a) c! c f (3) (a) 3 c 3 3! c 3 f (4) (a) 4 3 c 4 4! c 4. Saamme siis c k f (k) (a) k! f(x) X k0 (4.67) f (k) (a) (x a) k, kun x a <R (4.68) k! Sarjaa (4.68) sanotaan Taylorin sarjaksi ja jos a 0, niin sarjaa sanotaan MacLaurinin sarjaksi. Eräiden tuttujen funktioiden Taylorin sarja -esitykset löytyvät taulukkokirjoista. Esimerkki 4.7. f(x) e x (4.69) f (x) e x (4.70) f (x) e x (4.7). e x f(x) +x +! x + 3! x3 + 4! x (4.7) X k! xk k0 (R ) (4.73) Esimerkki 4.7. f(x) ln(+x) (4.74) f (x) +x (4.75) f (x) ( + x) (4.76) Esimerkki Taylorin polynomi 9 f (x) ( + x) 3 (4.77) f (4) (x) 3 ( + x) 4 (4.78). ln ( + x) f(x) x! x +! 3! x3 3! 4! x (4.79) x x + 3 x3 4 x (4.80) X ( ) k+ k xk (R ) (4.8) k f(x) +x (+x) / (4.8) f (x) ( + x) / (4.83) f (x) ( + x) 3/ (4.84) f (x) 3 3 ( + x) 5/ (4.85) f (4) (x) ( + x) 7/ (4.86). +x f(x) + x! x ! x ! x4... (4.87) X ( ) k+ (k )! + k (k )!k! xk (R ) (4.88) k 4.8 Taylorin polynomi

62 0 5. Dynaamisen ilmiön mallinnus 5.. Differentiaaliyhtälö 5. Dynaamisen ilmiön mallinnus Figure 5.: Funktion x 7 f(x) kuvaaja. 5. Differentiaaliyhtälö 5.. Taustaa ja merkintöjä Differentiaaliyhtälöiden avulla mallinnetaan ilmiöitä, jotka ovat ajan kuluessa muuttuvia. Jos y on ilmiöön liittyvä muuttuja, joka muuttuu ajan kuluessa siten, että y f(t), niin sen muutosnopeuden antaa f:n derivaatta f (t). Merkitsemme tätä muuttujan y muutosnopeutta y :lla. (Siis y f (t).) Esimerkki 5.. Jos y on radioaktiivisen aineen määrä säiliössä, niin radioaktiivisten ytimien määrä vähenee hajoamisten kautta nopeudella, joka on suoraan verrannollinen ytimien määrään. Siis y αy. (5.) Yhtälö (5.) on esimerkki differentiaaliyhtälöstä, joka sitoo muuttujan y ja sen derivaata y toisiinsa. Standardiratkaisu, jota käsittelemme myöhemmin johtaa ratkaisuun y(t) Ce αt. (5.) Vakion C arvo ei määräydy differentiaaliyhtälöstä (5.), vaan se riippuu radioaktiivisten ytimien määrästä alkuhetkellä (sillä selvästi y(0) C). Radioaktiivinen hajoaminen on satunnaisilmiö, mutta ytimien suuresta määrästä johtuen, malli kuvaa ilmiötä varsin tarkasti. Kuva 5. esittää funktionf kuvaajaa. Derivaatta antaa tangentin kulmakertoimen. Siten f (x) tanα. Derivaatan määritelmän mukaan f f(x + x) f(x) (x) lim (5.3) x 0 x Määritellään x:n muutosta x vastaava funktion y f(x) arvon muutos y f ja differentiaali dy df seuraavasti y f(x + x) f(x) (5.4) dy f (x) x (5.5) Arvon muutos ja differentiaali saavat yleensä eri arvon (kuten kuvasta 5. näemme). Jos x on kuitenkin pieni, niin arvon muutos ja differentiaali ovat lähes samat. Tämän näkee seuraavalla raja-arvotarkastelulla: y dy dy y f (x) x (5.6) f(x+ x) f(x) x f (x) 0, kun x 0. (5.7) Kun x on hyvin pieni, sanomme sitädifferentiaalisen pieneksi, ja merkitsemme sitä x dx. Kunx:n muutos on differentiaalisen pieni, on siis dy f (x)dx (5.8) dy dx y (5.9) Derivaatan esittäminen differentiaalien suhteena, y dy dx,jadifferentiaalien erottaminen, dy y dx, auttavat mallien muodostamisessa. Yleensä tarkastellaan lyhyttä aikaväliä dt ja esitetään lauseke muuttujan arvon muutokselle aikavälin dt kuluessa.

63 5. Dynaamisen ilmiön mallinnus Figure 5.: Heiluri. Esimerkki 5.. Yritys tuo uuden tuotteen markkinoille. Karkeasti arvioidaan markkinointiponnistusten olevan sellaisia, että viikon mittaisena aikavälinä 5% niistä, jotka eivät periodin alussa käyttäneet tuotetta, siirtyvät tuotteen käyttäjiksi. Toisaalta saman periodin kuluessa % niistä, jotka periodin alussa käyttivät tuotetta, vaihtavat eri tuotteeseen. Muuttujana on nyt suhteellinen markkinaosuus y, joka saa arvoja nollasta yhteen. Markkinaosuuden kehittymistä aikavälin dt aikana voidaan kuvata seuraavasti (aikavälin pituus dt ilmoitetaan nyt viikkoina) dy uudet luopujat dy 0.05( y) dt 0.0ydt y +0.06y 0.05 (5.0) Diff.yhtälö (5.0) on helppo ratkaista (kuten pian näemme), mutta se antaa kovin yksinkertaistetun kuvan ilmiöstä. Jos lisäämme malliin piirteitä, jotka tekevät siitä uskottavamman, niin syntyvä diff.yhtälö tulee vaikeaksi käsitellä. Tämä ristiriitatilanne on käytännössä enemmän sääntö kuin poikkeus. Otamme vielä yhden esimerkin fysiikan alalta. Esimerkki 5..3 Harrastelijafyysikko tutkii heilureita. Koska hänen teoreettiset taitonsa massapisteen mekaniikasta eivät aluksi riitä asian ratkaisemiseen, hän alkaa tarkkailla erilaisia heilureita. Fyysikko tekee havainnoistaan muistiinpanoja. Hänen tulee päättää, millaisia asioita hän kirjoittaa muistiin näkemistään heilureista. Hän päättää kirjata heilurin massan m, pituuden L, heilahdusajan T ja heilahduksen laajuuden A. Kerättyään laajahkon materiaalin fyysikko päätyy johtopäätökseen, että heilahdusajalla ja heilurin pituudella on yhteys, mutta muilla suureilla ei ole. Opiskeltuaan massapisteen dynamiikkaa, harrastelija oppii, että heilurin liikkeen kannalta oleellinen muuttuja on heilahduskulma θ. Mekaniikan peruslait johtavat nyt yhtälöön θ g sin θ, (5.) L 5.. Differentiaaliyhtälö 3 missä g on maan vetovoiman normaalikiihtyvyys. D.y. (5.) on vaikea ratkaistava. Yleensä heilahduskulma on niin pieni, että sinθ θ. Silloin oikea d.y. (5.) voidaan korvata väärällä mallilla θ g θ. (5.) L Viimeinen yhtälö onhelpporatkaista,jasiksisitäuseinkäytetään heilurin mallintamiseen. Malli (5.) on hyvä, jos heilahduskulma on pieni (muutama aste), ja silloin se antaa heilahdusajaksi T p g/l. Siis heilahdusaika on riippumaton heilurin massasta, kuten harrastelijamme postuloi. Asia nähdään jo yhtälöstä (5.), sillä seeisisällä massaa m. Vaikka emme osaa ratkaista yhtälöä (5.), se silti kertoo meille ilmiöstä oleellisen seikan. Dynaamisen mallin muodostamista helpottaa, jos ilmiöön liittyy selvät päämuuttujat, ja muiden tekijöiden vaikutus on vähäinen. Fyysikko voi aina sijoittaa heilurinsa tyhjiöön ja muutenkin minimoida ulkoisten tekijöiden vaikutuksen. Taloudellisten ilmiöiden mallinnuksessa tämä ei koskaan ole mahdollista. Mikään malli ei täysin vastaa todellisuutta, eikä malleilta saa täydellisyyttä vaatiakaan. Jos malli on sellainen, että se antaa keinon ymmärtää jaohjatataloudellisiatapahtumiajärkevällä tavalla, niin malli on hyvä. Dynaamisen mallin muodostamisessa voi erottaa seuraavia vaiheita: Ilmiö: Dynaaminen malli on aina malli reaalimaailman ilmiölle. Oppikirjojen esimerkit saattavat helposti saada tämän asian unohtumaan. Ilmiö on olemassa, kun se osataan tunnistaa taustastaan. Ilmiö onolemassavaikkasitä ei, ymmärrettäisikään. Revontulet on ilmiö, jota ei täysin ymmärretä, ja pallosalama on ilmiö, jonka olemassaolokin on epävarma. Esimerkki: radioaktiivisuus. Teoria: Ilmiö liittyy aina johonkin teoreettiseen viitekehykseen, josta voi-daan saada ilmiön kuvaamiseen tarvittavat käsitteet, muuttujat ja lait. Teoriasta yleensä voidaan myös muodostaa esikäsitys siitä, millainen malli luultavasti on. Esikäsitys saattaa suuresti vaikuttaa siihen, miten malli lopulta muodostetaan. Esimerkki: Käsitteitä: ydin, α-, β-jaγ-säteily, ytimen hajoaminen. Laki: ytimen hajoamisen todennäköisyys tietyn mittaisen aikavälin aikana on riippumaton ytimen ulkopuolisista ilmiöistä jasiitämitenpitkään ydin on ollut nykyisessä muodossaan olemassa. Esikäsitys: aktiivisuus laskee ajan kuluessa. Mallin yhtälö: Ensimmäinen muodostettava yhtälö kuvaa mallin muuttujien ja niiden pienten muutosten (differentiaalien) välisiä riippuvuuksia. Tämä differentiaaleja koskeva yhtälö yleensä muutetaan muuttujia ja niiden derivaattoja koskevaksi yhtälöksi. Yhtälöä muodostettaessa tehdään aina oletuksia ja yksinkertaistuksia mm. sen suhteen, mitä muuttujia malliin sisällytetään ja mitä muuttujiajätetään mallista pois. Esimerkki: Jos N(t) on radioaktiivisten ytimien määrä hetkellä t, niinn:n differentiaali (muutos) on suoraan verrannollinen radioaktiivisten ytimien määrään ja tarkasteltavan aikavälin dt pituuteen. Siis dn λn dt

64 4 5. Dynaamisen ilmiön mallinnus N λn. (5.3) Ratkaisu: Saadun yhtälön ratkaiseminen on puhtaasti matemaattinen tehtävä, ja usein oppimateriaalissa keskitytään vain tähän. Esimerkki: Diff.yhtälön (5.3) ratkaisu on N(t) N 0 e λt, missä N 0 on radioaktiivisten ytimien määrä alkuhetkellä. Tulkinta: Saatua ratkaisua ei koskaan saisi hyväksyä kritiikittömästi, vaan sen järkevyys tulee harkita ilmiöstä tiedetyn kokemustiedon valossa. Siitä, että yhtälö on ratkaistu matemaattisesti moitteettomalla tavalla ei seuraa, että malli kuvaisi välttämättä oikein ilmiötä. 5.. Määritelmiä Systeemin dynamiikkaa joudutaan usein kuvaamaan yhtälöillä, jotka sisältävät muuttujiajaniidenderivaattoja. Tällaista yhtälöä sanotaan differentiaaliyhtälöksi. Differentiaaliyhtälö (DY) on muotoa: F (x, y, dy dx, d y dx,..., dn y dx n ) 0 (5.4) F (x, y, y,y,...,y (n) ) 0 (5.5) Differentiaaliyhtälön ratkaisu on funktio y f(x), joka on määritelty ja jatkuva reaalilukuvälillä. Osittaisdifferentiaaliyhtälössä on usean muuttujan funktio ja sen osittaisderivaattoja. Esimerkki 5..4 a) Funktio y f(x) e x on DY:n y y 0 ratkaisu joukossa IR, koska y f (x) e x y y y 0 b) DY:n yy +x 0eräs ratkaisu on y x välillä [, ], sillä yy p x ( x ) ( x) x c) DY:n y x ratkaisuja ovat funktiot y x + C, missä C on vakio. Jokainen C:n vakioarvo antaa ratkaisun. Ratkaisuja on siis ääretön määrä! d) DY:llä (y ) + x y +0eioleratkaisua! {z } e) DY:n (y ) + y 0 ainoa ratkaisu on vakiofunktio y(t) Ikertaluvundifferentiaaliyhtälöistä 5 Differentiaaliyhtälön kertaluku on yhtälössä esiintyvän korkeimman derivaatan kertaluku. (Esim. y +x 3 y 0 on toisen kertaluvun differentiaaliyhtälöjay x 0 on kolmannen kertaluvun diff.yhtälö.) DY on lineaarinen, jos se on muotoa a 0 (x)y (n) + a (x)y (n ) a n (x)y + a n (x)y g(x), (5.6) missä a 0 (x), a (x),...,a n (x) ovatx:n funktioita. Esimerkiksi diff.yhtälö y + x 3 y + x sinx on lineaarinen. Kertalukua n olevan DY:n ratkaisu sisältää yleensä n parametria (vakiota). Tällaista ratkaisua sanotaan yleiseksi ratkaisuksi. Kun parametreille valitaan arvot, saadaan DY:n jokin yksityisratkaisu. Jos ratkaisua ei saada yleisestä ratkaisusta millään parametrien arvoilla, sanotaan ratkaisua erikoisratkaisuksi. Esimerkki 5..5 DY:n (y ) xy + y 0yleinenratkaisuony Cx C.DY:n toteuttaa myös erikoisratkaisu y x /4, jota ei saada yleisestä ratkaisusta millään parametrin C arvolla. 5. I kertaluvun differentiaaliyhtälöistä 5.. Separoituva DY DY on separoituva, jos se voidaan saattaa muotoon DY g(y)y f(x) g(y) dy dx f(x) g(y)dy f(x)dx (5.7) josta yleinen ratkaisu saadaan integroimalla Z Z g(y)dy f(x)dx + C (5.8) G(y) F (x)+c. (5.9) Perustelu: Malli kuvaa muuttujien x ja y muutosten suhdetta. Yhtälön (5.7) vasen puoli on funktion G(y) differentiaali ja oikea puoli on funktion F (x) differentiaali. Kun muuttujien x ja y arvoissa tapahtuu differentiaalisen pieni muutos, niin differentiaaliyhtälön (5.7) mukaan muutokset ovat sellaisia, että G:n ja F muutokset (differentiaalit) ovatyhtäsuuret. Jos nyt vakio C valitaan siten, että (5.9) on voimassa tarkastelun alussa, niin yhtälö on voimassa koko muutoksen ajan. Esimerkki 5.. Ratkaise DY: y xy.

65 6 5. Dynaamisen ilmiön mallinnus DY dy dx xy dy xdx y Z Z dy xdx+ C y ln y x + C y e x +C y Ce x / Esimerkki 5.. Ratkaise DY: y x y x. DY dy dx x y x dy xdx y x Z Z dy xdx + C y x p y p x + C (5.0) Huomaa, että yhtälö (5.0) on tehtävän implisiittinen ratkaisu. Ratkaisu voidaan esittää myös eksplisiittisessä muodossa y 4 (p x C) Usein on makuasia, kumpi muoto on havainnollisempi. Esimerkki 5..3 Ratkaise DY dy dx x + y 4 + Differentiaaliyhtälö onselvästi separoituva Z Z DY (y 4 +)dy (x +)dx 5 y5 + y x + x + C Ratkaisu saatiin helposti, mutta se on taas implisiittinen. 5.. Ikertaluvundifferentiaaliyhtälöistä 7 Esimerkki 5..4 Ratkaise DY dy dx ex y +e x dy dx ex e y Z Z +e x e y e x dy +e x dx + C e y ln(+e x )+C y ln(ln(+e x )+C) (Huomaa, että josc<0, niin y(x) onmääritelty vain, kun x>ln(e C )) 5.. Muotoa y f( y ) oleva DY x Jos DY on muotoa y f( y x ), niin sanomme sen olevan homogeenifunktion määräämän. Homogeenifunktion määräämä DY voidaan palauttaa separoituvaksi sijoituksella y x u y ux dy dx du dx x + u Kun tämä sijoitetaan DY:öön, saadaan du dx x + u f(u) du Z du f(u) u Esimerkki 5..5 Ratkaise DY dx x f(u) u Z dx x + C dy dx y + xy x x Sijoitetaan yhtälöön ½ y y ux x u y u x + u Sijoutuksen jälkeen saamme DY du dx x + u (ux) + xux x x du dx x + u u + u Z Z du dx u x + C

66 8 5. Dynaamisen ilmiön mallinnus ln u u + ln x +lnc ln u u + lnx +lnc u Cx u + u +Cx Cx y ux x + Cx3 Cx Esimerkki 5..6 Ratkaise DY dy dx x y x DY on homogeenifunktion määräämää muotoa, sillä RHS/( y x ) f( y x ). Siis sijoitetaan y x u y ux dy dx u + xdu dx jolloin DY menee muotoon DY u + x du dx x ux x u x du dx u u Z u Z u u u du x dx + C Z µ /3 u + /3 du ln x + C u + 3 ln u 3 ln u + ln x +lnc ln (u )(u +) ln x 3 +lnc 3 ³ y ³ y x + C x x Lineaarinen. kertaluvun diff.yhtälö ma5c.tex Ensimmäisen kertaluvun lineaarinen DY on muotoa y + f(x)y g(x). (DY) 5.. Ikertaluvundifferentiaaliyhtälöistä 9 Tätä vastaavahomogeeninen diff.yhtälö on y + f(x)y 0. (HY) Homogeeninen yhtälö (HY) on separoituva. Yhtälön (HY) ratkaisu voidaan kirjoittaa muotoon HY dy dx f(x)y dy f(x)dx y Z ln y f(x)dx +lnc R y Ce f(x)dx (5.) Kaavaa (5.) tärkeämpää on muistaa, että lineaarista DY:tä vastaava homogeeninen HY separoituu aina. Lause 5.3. Jos y y 0 (x) on homogeenisen yhtälön (HY) yleinen ratkaisu ja y y (x) onyhtälön (DY) eräs yksityisratkaisu, niin yhtälön (DY) yleinen ratkaisu on y(x) y 0 (x)+y (x) Perustelu: Sijoitetaan y(x) yhtälön (DY) vasenpaan puoleen, jolloin saadaan y + f(x)y (y 0 + y )+f(x)(y 0 + y ) y 0 + f(x)y 0 + y + f(x)y g(x). {z } {z } 0 g(x) Lauseen perusteella siis ensimmäisen kertaluvun lineaarisen differentiaaliyhtälön yleisen ratkaisun löytämiseksi tulee määrittää vastaavan homogeeniyhtälön yleinen ratkaisu sekä alkuperäisen yhtälön jokin yksityisratkaisu. Ensimmäinen tehtävän osa on yleensä helppo, sillä HY separoituu aina. DY:n yksityisratkaisun löytäminen on usein vaikeampaa. Ennen kuin pohdimme yksityisratkaisun määrittämista, käymme läpi yksinkertaisen esimerkin siitä, miten edellä olluttalausettakäytetään. Esimerkki 5.3. y y x (A) Etsitään ensin homogeenisen yhtälön yleinen ratkaisu y 0. (HY) dy 0 dx y 0 0 Z Z dy0 dx + C y 0 ln y 0 x + C y 0 Ce x

67 30 5. Dynaamisen ilmiön mallinnus (B) Toiseksi etsimme täydellisen yhtälön yksityisratkaisun. y x Systemaattinen menetelmä yksityisratkaisun löytämiseksi esitetää heti esimerkin jälkeen. Nyt tyydymme tarkistamaan, että arvauksemme on kelvollinen. (y y ( ) ( x ) x (Ok).) LauseenmukaanDY:nyleinenratkaisuonnyty y 0 +y eli y Ce x x. yksityisratkaisun löytäminen Yksityisratkaisun löytämiseksi on kaksi keinoa, joista ensimmäinen (yrite) on helpoissa tapauksissa nopea ja tehokas, mutta ei aina onnistu. Toinen keino (vakion variointi) antaa aina ratkaisun, mutta on hieman työläämpi. Tarkastellaan differentiaaliyhtälöä y + f(x)y g(x) (5.) (B) Yksityisratkaisun etsiminen yritteellä Arvataan yhtälön (5.) yksityisratkaisu lausekkeen g(x) perusteella. Arvaus sisältää vakioita, jotka pitää määrittää sijoittamalla yrite yhtälöön. Arvaaminen tuntuu epämatemaattiselta, mutta taitava laskija oppii pian hyvksi arvaajaksi niin, että lopulta kyse on lähinnä vakoiden arvojen laskemisesta. Seuraava taulukko auttaa oikean yritteen löytämisessa: g(x) yrite y ax + b y Ax + B ax + bx + c y Ax + Bx + c ae kx y Ae kx Yritteen teossa on kaksi selvää sääntöä: () yritefunktio on samaa muotoa, kuin g(x), () yritefunktio ei saa olla samaa muotoa, kuin homogeeniyhtälön yleisen ratkaisun jokin termi. Jos y (x) olisi luonnollinen yrite, mutta toinen sääntö estää senkäytön, niin yritetään funktiota xy (x). Esimerkki 5.3. y y e kx,k 6. Homogeeniyhtälö on HY y 0 y 0 0 y 0 Ce x Yksityisratkaisun löytämiseksi teemme yritteen y Ae kx y Ake kx Sijoitetaan yrite DY:öön. DY:n yleinen ratkaisu on siis 5.. Ikertaluvundifferentiaaliyhtälöistä 3 y DY y y e kx Ake kx Ae kx e kx A(k )e kx e kx A /(k ) y k ekx y Ce x + k ekx. Esimerkki y y e x. Homogeeniyhtälön yleinen ratkaisu on sama kuin edellisessä esimerkissä. HY y 0 y 0 0 y 0 Ce x Yritteeksi ei nyt kelpaa y Ae x. Teemme siis yritteen Sijoitetaan yrite DY:öön. y Axe x y A( + x)e x y DY y y e x A( + x)e x Axe x e x A y xe x DY:n yleinen ratkaisu on siis y Ce x + xe x. (B) Yksityisratkaisun määritys vakiota varioimalla Homogeeniyhtälön (HY) yleisen ratkaisun R y 0 Ce f(x)dx vakioparametri C korvataan x:n funktiolla C(x)siten,ettäalkuperäinen yhtälö(dy) toteutuu. Siis y C(x)e R f(x)dx y C (x)e R f(x)dx C(x)f(x)e R f(x)dx (5.3) (5.4)

68 3 5. Dynaamisen ilmiön mallinnus 5.4. Sovelluksia 33 Sijotetaan (5.3) ja (5.4) alkuperäiseen yhtälöön (5.) y + f(x)y g(x) R R R C (x)e f(x)dx C(x)f(x)e f(x)dx + f(x)c(x)e f(x)dx g(x) R C f(x)dx (x) g(x)e h R C(x) Z i f(x)dx g(x)e dx Alkuperäisen yhtälön yksityisratkaisu on nyt Z h R i R f(x)dx y g(x)e dx e f(x)dx (5.5) Yleinen ratkaisu on tapana kirjoittaa muotoon Z y(x) e h e h gdx + C, missä (5.6) Z h f(x)dx (5.7) Esimerkki y y e x. Nyt f(x) g(x) e x Z Z h(x) f(x)dx dx x Siis Z y(x) e h e h gdx + C Z e x e x e x dx + C e x [e x + C] Ce x + e x Esimerkki y y e x. Ratkaistaan edellinen tehtävä ilman kaavaa (5.6). Homogeeniyhtälön yleinen ratkaisu on y 0 y 0 0 y 0 Ce x Vakiota varioiden teemme yritteen y C(x)e x y C (x)e x + C(x)e x (5.8) Sijoitetaan nämä DY:öön Yleinen ratkaisu on siis DY y y ex (5.9) C (x)e x + C(x)e x C(x)e x e x (5.30) C (x)e x e x (5.3) C (x) e x (5.3) C(x) e x (5.33) y C(x)e x e x (5.34) y y 0 + y Ce x + e x Edelläolevat kaksi esimerkkiä osoittavat, että kaavaa (5.6) ei tarvitse osata ulkoa, kunhan ymmärtää vakion varioinnin idean ja pystyy suorittamaan tarvittavat laskut (5.8) (5.34). Toisaalta kaavojen soveltaminen antaa tuloksen nopeasti. 5.4 Sovelluksia Myöhemmin tässä monisteessa sovellusesimerkit ovat usein kovin teknisiä jaesittävät vain asian teknisen toteutuksen. Tässä kappaleessa sovellusten osalta yritetään tuoda esiin mallin muodostamisen yleisiä piirteitä. Mallia (DY:öä)muodostettaessa tehdään aina joukko oletuksia, jotka myöhemmin helposti unohdetaan. Usein oletukset ovat niin itsestään selviä, että niiden jatkuva toistelu tuntuisi typerältä. Sovelluksesta riippuu miten oletukset esitetään. Tärkeintä nyton,että opiskelija tottuu jokaisen mallin yhteydessä ainapohti- maan seuraavia seikkoja: Luonnolliset ehdot: mitkä ovat ne, usein ääneen lausumattomat oletukset, jotka mallia laadittaessa tehdään. Rajat: missä on raja, jonka takana malli ei enää toimi. (Kysymys on tässä muotoiltu varsin epämääräisesti, ja se saa sovelluksesta riippuen yleensä muodon, jossa kysytään, millä alueilla mallin parametrien arvot saavat olla, jotta malli antaisi oikeita tuloksia.) Uskottavuus: onko mallin ennustama käyttäytyminen uskottavaa. On tärkeätä tajuta se sinänsä aivan yksinkertainen tosiasia, että matemaattisesti täysin oikein ratkaistu DY saattaa sovelluksen kannalta olla epäonnistunut kuvaus tutkittavasta ilmiöstä. Pysyvyys: onko mallin parametrit vakioita? Onko mallin kuvaama lainalaisuus pysyvää? Voiko mallilla ennustaa tulevaisuutta?

69 34 5. Dynaamisen ilmiön mallinnus 5.4. Lääkkeen määrä elimistössä Olkoon N(t)elimistössä hetkellä t olevan lääkeaineen määrä. Oletamme, että munuaiset poistavat lääkettä λ 00% aikayksikössä. (Huomaa, että aikayksikkö voi nyt olla vuorokausi, tunti tai sekunti. Jos aikayksikön kohdalla nyt erehdytään, saattaa tunaroinnista olla fataaleja seurauksia!) Tarkastellaan lyhyttä aikaväliä dt. Sen aikana lääkeaineen määrä elimistössä muuttuu määrällä dn λndt (5.35) Yhtälö (5.35) on selvästikin differentiaaliyhtälö, joka on helppo separoida ja ratkaista. (5.35) dn N λdt Z Z dn N λdt + C ln N λt +lnn 0 N N 0 e λt (5.36) Jos aikayksikkö on tunti, niin aikavakion λ yksikkö on /tunti, sillä eksponentin kaavassa (5.36) pitää olla laaduton. Esimerkki 5.4. Potilaan massa on 9kg ja hänelle annetaan lääkettä, jota halutaan olevan elimistössä vähintää 50µg/kg ja enintään 75µg/kg. Elimistö poistaa lääkeestä 3% tunnissa. Miten lääkettä tulee potilaalle antaa? Ensimmäinen lääkeannos on enintään 9kg 75 µg kg 6.9mg. Aikavakio on nyt λ Lääkeaineen pitoisuus laskee ylärajalta alarajalle ajassa T, joka mallin (5.36) mukaan ratkaistaan yhtälöstä (5.36) N N 0 e λt 50 µg kg 75µg kg e 0.03 T 50/75 e 0.03 T ln 50 ln 75 T 3.5(tuntia) 0.03 Käytännössä lääkettä voidaan siis antaa joko tunnin tai 8 tunnin välein. tunnissa lääkeainetta poistuu kehosta N 0 N e 0,03 30.% N 0 eli ainemääränä mg.mg. Malliin (5.36) ei pidä suhtautua kritiikittöm sti. Joidenkin lääkeaineiden kohdalla sitä on turvallista soveltaa, mutta aina niin ei suinkaan ole. Mallin soveltaminen on luonnollista silloin, kun yksinkertainen korkolasku antaa vääriä tuloksia. Tällainen 5.4. Sovelluksia 35 tehtävä on esimerkiksi selvittää miten kauan lääkeainetta on kehossa lääkityksen lopettamisen jälkeen. Mallissa oletetaan, että λ on vakio, ja että sen arvo tunnetaan riittävän tarkasti. Todellisuudessa λ riippuu potilaan tilasta, ja sen arvo voi hoidon aikana muuttua merkittävästi. Jos λ eli elimistö poistaa lääkeaineesta 00% tunnissa (!!!), niin se ei tarkoita sitä, että lääke poistuisi puolessa tunnissa. Esimerkki 5.4. Potilaan elimistössä on.0mg nukutusainetta. Seuraava lääkitys voidaan aloittaa vasta, kun nukutusaineen määrä on laskenut tasolle.5µg. Milloin seuraava lääkitys voidaan aloittaa, kun nukutusaine poistuu elimistöstä aikavakiolla λ.0. (Siis 00% tunnissa!?) Kysytty aika T ratkaistaan mallista (5.36) sijoittamalla siihen N 0.0mg ja N N(T ).5µg mg.0mg e T T ln( ) 3.5 T 3 tuntia 5 minuuttia 5.4. Eksponentiaalinen kasvu Edellinen esimerkki käsitteli määrän pienenemistä. Muutos oli suoraan verrannollinen määrään. Jos muuttujan y kasvuun liittyvä muutos on vastaavalla tavalla suoraan verrannollinen määrään, niin dy ρydt Z Z dy y ρdt y y 0 e ρt (5.37) ρ on jatkuvan korkolaskun korkointensiteetti (growth rate). Tässä yhteydessäolisi ehkä luontevampaa puhua kasvuasteesta. Kirkointensiteetti ρ ja vuotuinen korkokanta i liittyvät toisiinsa yhtälön e ρ + i mukaan. Siis ρ ln( + i) ja i e ρ. Esimerkki Imatran voima arvioi Suomen energian kulutuksen kasvavan vuosittain 5%. Samaan aikaan EU arvioi energian kulutuksen kasvavan vuosittain 4%. Suomen osuus EU-maiden energian kulutuksesta on nyt noin 5%. Missä vaiheessa IVO arvelee Suomen kuluttavan puolet EU:n energiasta? Olkoon E S (t) Suomen energian kulutus ja E E (t) Euroopan energian kulutus. Esitettyjen arvioiden perusteella kasvuintensiteetit ovat e ρs.5 ρ S e ρe.04 ρ E 0.039

70 36 5. Dynaamisen ilmiön mallinnus Tehtävässä annettujen tietojen perusteella E S (t) E S (0) e ρst E E (t) E E (0) e ρet E S (0) 0.05 E E (0) Kun Suomen energian kulutus on puolet Euroopan energian kulutuksesta hetkellä T, niin E S (T ) 0.5 E E (T ) E S(0) e ρst 0.5 E E(0) e ρet 0.05 e ρst 0.5 e ρet e (ρs ρe)t 0.5/0.05 e T 0 T ln(0)/0.006 T.9(vuotta) Esimerkki Valmistelemme vuosiennustetta yritykselle, jonka myynnin volyymi (tonneina) kasvaa arviolta 0% vuodessa, raaka-aineiden ja työpanoksen hinta kasvaa vuodessa noin 7% ja lopputuotteen hinnan arvellaan nousevan noin 5% vuodessa. Miten vuodessa muuttuu käyttökateprosentti, joka nyt on 0%, kun valmisvaraston kiertonopeus on /vuosi? käyttökate% käyttökate liikevaihto 00% liikevaihto - menot + varastojen kasvu 00% liikevaihto (5.38) Merkitään kasvavia suureita seuraavasti p(t) p oe ρpt tuotteen yksikköhinta, (5.39) n(t) n o e ρnt tuotteen tuotantonopeus (yks./vuosi), (5.40) c(t) c o e ρct tuotteen tuotantokustannus (mk/yks.). (5.4) Tämän vuoden tuloslaskelman eriä voidaan kuvata mallin (5.39)-(5.4) mukaisesti seuraavasti Z 0 liikevaihto p(t)n(t 0.5)dt Z 0 p on oe ρn/ e (ρp+ρn)t dt p o n ³ (ρp+ρn) o (ρ p + ρ n ) e +i n µ p on o (ρ p + ρ n ) +i n ( + i p )( + i n ) p o n o Z Sovelluksia 37 menot c(t)n(t)dt Z 0 c o n o e (ρc+ρn)t dt c ³ on (ρc+ρn) o e ρ c + ρ n µ c o n o 0.98 c o n o ρ c + ρ n ( + i c )( + i n ) Z 0 Z var. kasvu c(t)n(t)dt c(t)n(t)dt µz 0 Z c o n o e (ρc+ρn)t dt e (ρc+ρn)t dt c o n ³ 3(ρc+ρn)/ o e (ρc+ρn)/ e (ρc+ρn) + e ρ c + ρ n c o n ³ o ( e (ρc+ρn)/ )( e (ρc+ρn) ) 0.07 c o n o ρ c + ρ n Sijoittamalla edelliset tulokset kaavaan (5.38)saadaan käyttökateprosentille lauseke kk% o p on o c o n o 0.98 c o n o p o n o 00% (5.4) µ kk% o.00 co 00% (5.43) p o Koska nyt käyttökateprosentti on 0%, niin.00 co 0. p o c o /p o (5.44) Vuoden kuluttua käyttökateprosentti lasketaan täsmälleen samalla tavalla paitsi, että kaavassa (5.43)c o on kasvanut 7% ja p o on kasvanut 5%. Sijoittamalla nämä uudet arvot ja kaava (5.44) kaavaan (5.43) saadaan käyttökateprosentin uudeksi arvoksi µ kk% c o 00%.5 p o µ % 5.9%

71 38 5. Dynaamisen ilmiön mallinnus 5.4. Sovelluksia 39 Kritiikkiä: Kertymien laskeminen integroimalla virtaamista, johtaa monimutkaisiin laskelmiin. Lausekkeet ovat epähavainnollisa, vaikka lopputulos onkin uskottava. Mallin käyttöä yleisessä tapauksessa puoltaa se, että mallin avulla saadaan selville c o /p o. Käytännössä tämä suhde tiedetään. Jos suhde on sama kuin mallin ennustama, niin mallin soveltaminen tuntuu hyväksyttävältä. Jos suhde poikkeaa mallin ennustamasta, niin malli tulee hylätä. Edellä varaston kasvu 0.07 c o n o p o n o p on o liikevaihto Pidetään tätä suhdetta tunnettuna ja ratkaistaan tehtävä yksinkertaisella korkolaskulla. Merkitään tämän vuoden tuotannon määrää N o :lla ja vuoden keskihintoja C o :lla ja P o :lla. Käyttökateprosentti on kk% 0 P on o P o N o C o N o 00% P o N o (.0679 C o /P o ) 00% Koska tänävuonnakäyttökate% on 0%, saamme edellisestäyhtälöstä, että C o /P o Ensi vuonna siis uusi arvo on kk% (.0679 C /P ) 00% µ C o 00%.5 P o µ % 6.0% Yksinkertainen korkolasku antaa siis melkein saman tuloksen, joten eksponentiaalisesti kasvaviin virtoihin perustuva malli ei tässä tapauksessa tunnu kovin tarpeelliselta. Lisäksi malli olettaa kaikkien kasvulukujen pysyvän vakioina kahden vuoden ajan, mikä onmelkoepäuskottavaa Logistinen kasvu Pieni eläinpopulaatio kasvaa eksponentiaalisesti yhtälön dn ANdt. Toisaalta populaation kasvaessa, tulee vastaan raja, jossa ymäritö eienää pysty antamaan riittävästi ravintoa ja suojaa populaatiolle. P.F.Verhulst mallinsi populaation kasvua yhtälöllä dn dt AN BN (5.45) Figure 5.3: Kun t,niinn(t) A B. Yhtälön viimeinen termi saa aikaan sen, että populaation kasvaessa sen kasvunopeus pienenee. Yhtälö separoituu seuraavasti Z Z dn (5.45) N(A BN) dt + C Z A Z N dn + BA Z A BN dn dt + C A ln N A ln A BN C t e At N C A BN Kun t 0, niin N(0) N o ja C A BNo. Siis No e At N(t) A BN(t) A BN o N o (5.46) N(t) A t B +(AN A o B)e At B (5.47) Ratkaisu on parhaiten ymmärrettävissä funktion N N(t) kuvaajan avulla (ks kuva(5.3)). Esimerkki Muodostetaan yksinkertainen malli teknisen innovaation käyttöönotolle. Olkoon R yritysten lukumäärä, N(t) innovaatiota käyttävien yritysten määrä.

72 40 5. Dynaamisen ilmiön mallinnus Malli perustuu ajatukseen, jonka mukaan yritys alkaa käyttää uutta innovaatiota yleensä vasta kun se vertaa omaa toimintaansa kilpailijaan, joka jo käyttää innovaatiota. Tämän todennäköisyys on suoraan verrannollinen lukuun N(R N). Siis dn k N (R N) dt dn dt Malli on samaa muotoa kuin (5.45), joten {z} kr N {z} k N. A B R t N(t) +(RN R. o )e krt Innovaation käyttöönottoa kuvaa siis logistinen käyrä (5.3). Mallin mukaan siis kaikki yritykset lopulta ottavat teknisen innovaation käyttöön Auton hinta. Auton hinnalle ei voi muodostaa sellaista mallia, joka kuvaisi oikein sekä kalliin urheiluauton, että halvan kansanauton hintaa, niiden käyttöaikana. Lähtökohdaksi otamme naivin mallin (M) dp ap dt, (5.48) jonka ratkaisu on P (t) P o e at. (5.49) Ratkaisu (5.49) ei tyydytä kahdestasyystä. Ensiksi ratkaisun mukainen hinta menee nollaan ajan kasvaessa rajatta. Tämä ei vastaa todellisuutta, sillä yleensä autolla on loppuun ajettunakin romuarvo. Toiseksi ratkaisun mukaan hinnan suhteellinen muutosnopeus P (t)/p (t) a on vakio, mikä ei lainkaan vastaa empiiristä aineistoa. Yleensä auton hinnan suhteellinen muutosnopeus (%/vuosi) on voimakkain alussa ja pienenee myöhemmin. Parannamme mallia vaiheittain. Mallin parantelu johtaa, yleensä sarjaan yhä monimutkaisempia malleja, jotka sopivat yhä paremmin dataan, mutta joiden ratkaisut myös samalla monimutkaistuvat ja muuttuvat epähavainnollisiksi tai vaikeiksi soveltaa. Lukija tarkatkoon tätä ilmiötä, kun seuraavassa yrit mme parantaa mallia. Tartumme ensin romuarvon ongelmaan. Teemme sen helpon ratkaisun, että sanomme autolla olevan romuarvon b, jakäyttöarvon P b, jokavähenee naivin mallin (5.48) mukaisesti. Siis malli (M) on d (P b) a(p b) dt dp a(p b) Z dt Z dp adt + C P b ln P b at + C Silloin 5.4. Sovelluksia 4 P Ce at + b P (t) (P o b)e at + b P (t)/p (t) a(p o b)e at (P o b)e at + b ab a + (P o b)e at + b Siis P (0)/P (0) a( b/p o )jap /P 0, kun t. Suhteellinen muutosnopeus ei siis enää ole vakio. Jotta saisimme mallin, joka sopii havaintojen kanssa, merkitsemme käyttöarvon suhteellista muutosta lausekkeella af(t), missä painofunktio f on jatkuva, vähenevä jaf(0). Olkoon F (t) R t f(u)du, jolloin 0 F(0)0. Saamme kolmannen mallin (M3) ja Painofunktioksi käyvät esimerkiksi d af(t)dt + C P b (P b) dt Z dp af(t)(p b) Z ln P b af (t)+c P Ce af (t) + b P (t) (P o b)e af (t) + b f (t) e kt F (t) k( e kt ) P (t) (P o b)e ak( e kt) + b, (5.50) f (t) +kt F (t) ln( + kt) k P (t) (P o b)( + kt) a/k + b. (5.5) Ratkaisut on saatu samalla periaatteella käyttäen hieman toisistaan eroavia painofunktioita. Ratkaisuissa on silti merkittävä ero, sillä lim (t) t (P o b)e ak + b>b ja lim (t) t b,

73 4 5. Dynaamisen ilmiön mallinnus 5.5. Numeerinen simulointi 43 Figure 5.4: PP(t), kun k 0., k 0.5, k.0 jak.0. joten painofunktion f käyttö johtaa ratkaisuun, jossa auton käyttöarvo ei koskaan kulu kokonaan pois. Tämä ei tunnu kovin uskottavalta, joten toistaiseksi parhaalta tuntuu malli (5.5), jonka DY on a(p b) dp dt. (5.5) +kt Parametri a määräytyy hinnan muutoksesta ensimmäisen vuoden aikana ja parametri b on auton romuarvo, joka myös voidaan melko luotettavasti arvioida auton ostohetkellä. Jäljelle jää parametri k, jonkamerkitystä voi tulkita kuvasta (5.4), jossa on piirretty hintakäyrät, kun k 0., k 0.5, k.0 jak.0. Kuva osoittaa, että vaikka periaatteessa käyttöarvo meneekin aina nollaan, niin tämä saattaa olla niin hidasta, että se ei tapahdu realistisessa ajassa. 5.5 Numeerinen simulointi Joskus differentiaaliyhtälön täydellinen ratkaiseminen on vaikeata, mutta silti haluamme tietää ratkaisufunktion arvon tietyllä hetkellä tulevaisuudessa. Tämä voidaan tehdä numeerisesti. Ratkaisemme yhden esimerkin kahdella tavalla, mutta emme kehitä ideaa pidemmälle, koska asiaa käsitellään lisää muilla kursseilla. Valitsemme esimerkki DY:ksi helposti separoituvan ja ratkeavan DY:n, jotta voimme verrata numeerisesti saamaamme ratkaisua oikeaan ratkaisuun. Esimerkki 5.5. Mikä on funktion y(x) arvo hetkellä x,kuny(0) ja y toteuttaa differentiaaliyhtälön y xy x 3 x. (5.53) Figure 5.5: Differentiaaliyhtälön y xy x 3 x oikea ja epätarkasti simuloitu ratkaisu. Helposti näkee sijoittamalla, että oikea ratkaisu on y(x) e x x. Lähestytään ongelmaa kirjoittamalla DY muotoon y xy x 3 x (5.54) dy dx x3 x +xy (5.55) dy dx(x 3 x +xy) (5.56) Jos h>0on pieni ja merkitsemme x t t h ja y t y(x t ), niin (5.56) voidaan kirjoittaa y t+ y t h(x 3 t x t +x t y t ) (5.57) y t+ y t + h(x 3 t x t +x t y t ) (5.58) Valitaan askelpituudeksi h 0. ja asetetaan alkuarvot x 0 0 (5.59) y 0 (5.60) h 0. (5.6) ja toistetaan askeleita x t+ x t + h (5.6) y t+ y t + h(x 3 t x t +x t y t ) (5.63) Kahdenkymmenen askeleen jälkeen saamme y() y ( Oikea arvo on y() e ) Tulos on siis virheellinen. Lyhennämme askelta asettamalla h 0.0, jolloin 00 askeleen jälkeen saamme y() y 00 47, 6. Tulos on parempi, mutta edelleen virheellinen. ///

Matemaattinen Analyysi / kertaus

Matemaattinen Analyysi / kertaus Matemaattinen Analyysi / kertaus Ensimmäinen välikoe o { 2x + 3y 4z = 2 5x 2y + 5z = 7 ( ) x 2 3 4 y = 5 2 5 z ) ( 3 + y 2 ( 2 x 5 ( 2 7 ) ) ( 4 + z 5 ) = ( 2 7 ) yhteys determinanttiin Yhtälöryhmän ratkaiseminen

Lisätiedot

Matemaattinen Analyysi, k2012, L1

Matemaattinen Analyysi, k2012, L1 Matemaattinen Analyysi, k22, L Vektorit Merkitsemme koulumatematiikasta tuttua vektoria v = 2 i + 3 j sarake matriisilla ( ) 2 v = v = = ( 2 3 ) T 3 Merkintätavan muutos helpottaa jatkossa siirtymistä

Lisätiedot

Matemaattinen Analyysi, k2011, L2

Matemaattinen Analyysi, k2011, L2 Matemaattinen Analyysi, k2011, L2 Lineaarikombinaatio 1 Esimerkki 1 Olkoon yrityksen A osakkeen arvo 20eja yrityksen B osakkeen arvo 10e. Sijoittaja tarkastelee omaisuutensa rakennetta ryhmittelemällä

Lisätiedot

Ominaisarvo-hajoitelma ja diagonalisointi

Ominaisarvo-hajoitelma ja diagonalisointi Ominaisarvo-hajoitelma ja a 1 Lause 1: Jos reaalisella n n matriisilla A on n eri suurta reaalista ominaisarvoa λ 1,λ 2,...,λ n, λ i λ j, kun i j, niin vastaavat ominaisvektorit x 1, x 2,..., x n muodostavat

Lisätiedot

Lineaarialgebra, kertausta aiheita

Lineaarialgebra, kertausta aiheita Lineaarialgebra, kertausta aiheita Matriisitulo käänteismatriisi determinantin kehittäminen determinantin ominaisuudet adjungaatti ja Cramerin kaavat yhtälöryhmän eri esitystavat Gauss-Jordan -algoritmi

Lisätiedot

(1.1) Ae j = a k,j e k.

(1.1) Ae j = a k,j e k. Lineaarikuvauksen determinantti ja jälki 1. Lineaarikuvauksen matriisi. Palautetaan mieleen, mikä lineaarikuvauksen matriisi annetun kannan suhteen on. Olkoot V äärellisulotteinen vektoriavaruus, n = dim

Lisätiedot

Kanta ja Kannan-vaihto

Kanta ja Kannan-vaihto ja Kannan-vaihto 1 Olkoon L vektoriavaruus. Äärellinen joukko L:n vektoreita V = { v 1, v 2,..., v n } on kanta, jos (1) Jokainen L:n vektori voidaan lausua v-vektoreiden lineaarikombinaationa. (Ts. Span(V

Lisätiedot

Ortogonaalisen kannan etsiminen

Ortogonaalisen kannan etsiminen Ortogonaalisen kannan etsiminen Lause 94 (Gramin-Schmidtin menetelmä) Oletetaan, että B = ( v 1,..., v n ) on sisätuloavaruuden V kanta. Merkitään V k = span( v 1,..., v k ) ja w 1 = v 1 w 2 = v 2 v 2,

Lisätiedot

5 Ominaisarvot ja ominaisvektorit

5 Ominaisarvot ja ominaisvektorit 5 Ominaisarvot ja ominaisvektorit Olkoon A = [a jk ] n n matriisi. Tarkastellaan vektoriyhtälöä Ax = λx, (1) missä λ on luku. Sellaista λ:n arvoa, jolla yhtälöllä on ratkaisu x 0, kutsutaan matriisin A

Lisätiedot

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg Vaasan yliopisto, syksy 218 Lineaarialgebra II, MATH124 Matti laaksonen, Lassi Lilleberg Tentti T1, 284218 Ratkaise 4 tehtävää Kokeessa saa käyttää laskinta (myös graafista ja CAS-laskinta), mutta ei taulukkokirjaa

Lisätiedot

6 MATRIISIN DIAGONALISOINTI

6 MATRIISIN DIAGONALISOINTI 6 MATRIISIN DIAGONALISOINTI Ortogonaaliset matriisit Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja A - = A T Muistutus: vektorien a ja b pistetulo (skalaaritulo,

Lisätiedot

1 Ominaisarvot ja ominaisvektorit

1 Ominaisarvot ja ominaisvektorit 1 Ominaisarvot ja ominaisvektorit Olkoon A = [a jk ] n n matriisi. Tarkastellaan vektoriyhtälöä Ax = λx, (1) 1 missä λ on luku. Sellaista λ:n arvoa, jolla yhtälöllä on ratkaisu x 0, kutsutaan matriisin

Lisätiedot

Lineaarikuvausten. Lineaarikuvaus. Lineaarikuvauksia. Ydin. Matriisin ydin. aiheita. Aiheet. Lineaarikuvaus. Lineaarikuvauksen matriisi

Lineaarikuvausten. Lineaarikuvaus. Lineaarikuvauksia. Ydin. Matriisin ydin. aiheita. Aiheet. Lineaarikuvaus. Lineaarikuvauksen matriisi Lineaarikuvaukset aiheita ten ten 1 Matematiikassa sana lineaarinen liitetään kahden lineaariavaruuden väliseen kuvaukseen. ten Määritelmä Olkoon (L, +, ) ja (M, ˆ+, ˆ ) reaalisia lineaariavaruuksia, ja

Lisätiedot

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja 7 NELIÖMATRIISIN DIAGONALISOINTI. Ortogonaaliset matriisit Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja A - = A T () Muistutus: Kokoa n olevien vektorien

Lisätiedot

Lineaarikuvauksen R n R m matriisi

Lineaarikuvauksen R n R m matriisi Lineaarikuvauksen R n R m matriisi Lauseessa 21 osoitettiin, että jokaista m n -matriisia A vastaa lineaarikuvaus L A : R n R m, jolla L A ( v) = A v kaikilla v R n. Osoitetaan seuraavaksi käänteinen tulos:

Lisätiedot

Demorastitiedot saat demonstraattori Markus Niskaselta Lineaarialgebra (muut ko) p. 1/104

Demorastitiedot saat demonstraattori Markus Niskaselta Lineaarialgebra (muut ko) p. 1/104 Lineaarialgebra (muut ko) p. 1/104 Ensi viikolla luennot salissa X Torstaina 7.12. viimeiset demot (12.12. ja 13.12. viimeiset luennot). Torstaina 14.12 on välikoe 2, muista ilmoittautua! Demorastitiedot

Lisätiedot

Osoita, että täsmälleen yksi vektoriavaruuden ehto ei ole voimassa.

Osoita, että täsmälleen yksi vektoriavaruuden ehto ei ole voimassa. LINEAARIALGEBRA Harjoituksia 2016 1. Olkoon V = R 2 varustettuna tavallisella yhteenlaskulla. Määritellään reaaliluvulla kertominen seuraavasti: λ (x 1, x 2 ) = (λx 1, 0) (x 1, x 2 ) R 2 ja λ R. Osoita,

Lisätiedot

MS-C1340 Lineaarialgebra ja

MS-C1340 Lineaarialgebra ja MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt Vektoriavaruudet Riikka Kangaslampi kevät 2017 Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Idea Lineaarisen systeemin ratkaiseminen Olkoon

Lisätiedot

Alkeismuunnokset matriisille, sivu 57

Alkeismuunnokset matriisille, sivu 57 Lineaarialgebra (muut ko) p. 1/88 Alkeismuunnokset matriisille, sivu 57 AM1: Kahden vaakarivin vaihto AM2: Vaakarivin kertominen skalaarilla c 0 AM3: Vaakarivin lisääminen toiseen skalaarilla c kerrottuna

Lisätiedot

Lineaarialgebra ja differentiaaliyhtälöt Laskuharjoitus 1 / vko 44

Lineaarialgebra ja differentiaaliyhtälöt Laskuharjoitus 1 / vko 44 Lineaarialgebra ja differentiaaliyhtälöt Laskuharjoitus 1 / vko 44 Tehtävät 1-3 lasketaan alkuviikon harjoituksissa, verkkotehtävien dl on lauantaina aamuyöllä. Tehtävät 4 ja 5 lasketaan loppuviikon harjoituksissa.

Lisätiedot

Sisätuloavaruudet. 4. lokakuuta 2006

Sisätuloavaruudet. 4. lokakuuta 2006 Sisätuloavaruudet 4. lokakuuta 2006 Tässä esityksessä vektoriavaruudet V ja W ovat kompleksisia ja äärellisulotteisia. Käydään ensin lyhyesti läpi määritelmiä ja perustuloksia. Merkitään L(V, W ) :llä

Lisätiedot

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät Matematiikan peruskurssi K3/P3, syksy 25 Kenrick Bingham 825 Toisen välikokeen alueen ydinasioita Alla on lueteltu joitakin koealueen ydinkäsitteitä, joiden on hyvä olla ensiksi selvillä kokeeseen valmistauduttaessa

Lisätiedot

Insinöörimatematiikka D

Insinöörimatematiikka D Insinöörimatematiikka D M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Matematiikan ja tilastotieteen laitos Turun yliopisto 2015 M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Luentokalvot

Lisätiedot

C = {(x,y) x,y R} joiden joukossa on määritelty yhteen- ja kertolasku seuraavasti

C = {(x,y) x,y R} joiden joukossa on määritelty yhteen- ja kertolasku seuraavasti Vaasan yliopiston julkaisuja 189 9 OMINAISARVOTEHTÄVÄ Ch:EigSystem Sec:CMatrix 9.1 Kompleksinen lineaariavaruus 9.1.1 Kompleksiluvut Pian tulemme tarvitsemaan kompleksisen lineaariavaruuden alkeita. Tätä

Lisätiedot

TMA.111 Matemaattinen analyysi c Matti Laaksonen, 2003

TMA.111 Matemaattinen analyysi c Matti Laaksonen, 2003 TMA.111 Matemaattinen analyysi c Matti Laaksonen, 2003 Vaasan Yliopisto, 2003 Teknillinen tiedekunta Matemaattisten tieteiden laitos PL 700 (Wolffintie 34) 65101 VAASA Vaasan yliopisto Matemaattinen analyysi

Lisätiedot

Matematiikka B2 - Avoin yliopisto

Matematiikka B2 - Avoin yliopisto 6. elokuuta 2012 Opetusjärjestelyt Luennot 9:15-11:30 Harjoitukset 12:30-15:00 Tentti Kurssin sisältö (1/2) Matriisit Laskutoimitukset Lineaariset yhtälöryhmät Gaussin eliminointi Lineaarinen riippumattomuus

Lisätiedot

Ominaisarvoon 4 liittyvät ominaisvektorit ovat yhtälön Ax = 4x eli yhtälöryhmän x 1 + 2x 2 + x 3 = 4x 1 3x 2 + x 3 = 4x 2 5x 2 x 3 = 4x 3.

Ominaisarvoon 4 liittyvät ominaisvektorit ovat yhtälön Ax = 4x eli yhtälöryhmän x 1 + 2x 2 + x 3 = 4x 1 3x 2 + x 3 = 4x 2 5x 2 x 3 = 4x 3. Matematiikan ja tilastotieteen laitos Lineaarialgebra ja matriisilaskenta II Ylimääräinen harjoitus 6 Ratkaisut A:n karakteristinen funktio p A on λ p A (λ) det(a λi ) 0 λ ( λ) 0 5 λ λ 5 λ ( λ) (( λ) (

Lisätiedot

8 KANNAT JA ORTOGONAALISUUS. 8.1 Lineaarinen riippumattomuus. Vaasan yliopiston julkaisuja 151

8 KANNAT JA ORTOGONAALISUUS. 8.1 Lineaarinen riippumattomuus. Vaasan yliopiston julkaisuja 151 Vaasan yliopiston julkaisuja 151 8 KANNAT JA ORTOGONAALISUUS KantaOrthogon Sec:LinIndep 8.1 Lineaarinen riippumattomuus Lineaarinen riippumattomuus on oikeastaan jo määritelty, mutta kirjoitamme määritelmät

Lisätiedot

Numeeriset menetelmät

Numeeriset menetelmät Numeeriset menetelmät Luento 6 To 22.9.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 6 To 22.9.2011 p. 1/38 p. 1/38 Ominaisarvotehtävät Monet sovellukset johtavat ominaisarvotehtäviin Yksi

Lisätiedot

Päättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1

Päättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1 Lineaarialgebran kertaustehtävien b ratkaisuista. Määritä jokin kanta sille reaalikertoimisten polynomien lineaariavaruuden P aliavaruudelle, jonka virittää polynomijoukko {x, x+, x x }. Ratkaisu. Olkoon

Lisätiedot

Matematiikka B2 - TUDI

Matematiikka B2 - TUDI Matematiikka B2 - TUDI Miika Tolonen 3. syyskuuta 2012 Miika Tolonen Matematiikka B2 - TUDI 1 Kurssin sisältö (1/2) Matriisit Laskutoimitukset Lineaariset yhtälöryhmät Gaussin eliminointi Lineaarinen riippumattomuus

Lisätiedot

Ennakkotehtävän ratkaisu

Ennakkotehtävän ratkaisu Ennakkotehtävän ratkaisu Ratkaisu [ ] [ ] 1 3 4 3 A = ja B =. 1 4 1 1 [ ] [ ] 4 3 12 12 1 0 a) BA = =. 1 + 1 3 + 4 0 1 [ ] [ ] [ ] 1 0 x1 x1 b) (BA)x = =. 0 1 x 2 x [ ] [ ] [ 2 ] [ ] 4 3 1 4 9 5 c) Bb

Lisätiedot

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo.

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo. Lineaariavaruudet aiheita 1 määritelmä Nelikko (L, R, +, ) on reaalinen (eli reaalinen vektoriavaruus), jos yhteenlasku L L L, ( u, v) a + b ja reaaliluvulla kertominen R L L, (λ, u) λ u toteuttavat seuraavat

Lisätiedot

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt Vektoriavaruudet Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2015 1 / 17 R. Kangaslampi Vektoriavaruudet Vektoriavaruus

Lisätiedot

Ortogonaaliset matriisit, määritelmä 1

Ortogonaaliset matriisit, määritelmä 1 , määritelmä 1 Määritelmä (a). Neliömatriisi Q on ortogonaalinen, jos Q T Q = I. Määritelmästä voidaan antaa samaa tarkoittavat, mutta erilaiselta näyttävät muodot: Määritelmä (b). n n neliömatriisi Q,

Lisätiedot

1 Matriisit ja lineaariset yhtälöryhmät

1 Matriisit ja lineaariset yhtälöryhmät 1 Matriisit ja lineaariset yhtälöryhmät 11 Yhtälöryhmä matriisimuodossa m n-matriisi sisältää mn kpl reaali- tai kompleksilukuja, jotka on asetetettu suorakaiteen muotoiseksi kaavioksi: a 11 a 12 a 1n

Lisätiedot

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

MS-A0003/A Matriisilaskenta Laskuharjoitus 6 MS-A3/A - Matriisilaskenta Laskuharjoitus 6 Ratkaisuehdotelmia. Diagonalisointi on hajotelma A SΛS, jossa diagonaalimatriisi Λ sisältää matriisin A ominaisarvot ja matriisin S sarakkeet ovat näitä ominaisarvoja

Lisätiedot

Ratkaisuehdotukset LH 7 / vko 47

Ratkaisuehdotukset LH 7 / vko 47 MS-C34 Lineaarialgebra, II/7 Ratkaisuehdotukset LH 7 / vko 47 Tehtävä : Olkoot M R symmetrinen ja positiividefiniitti matriisi (i) Näytä, että m > ja m > (ii) Etsi Eliminaatiomatriisi E R siten, että [

Lisätiedot

MS-C1340 Lineaarialgebra ja

MS-C1340 Lineaarialgebra ja MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt Ominaisarvoteoriaa Riikka Kangaslampi Kevät 2017 Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Ominaisarvot Kertaus: ominaisarvot Määritelmä

Lisätiedot

5 OMINAISARVOT JA OMINAISVEKTORIT

5 OMINAISARVOT JA OMINAISVEKTORIT 5 OMINAISARVOT JA OMINAISVEKTORIT Ominaisarvo-ongelma Käsitellään neliömatriiseja: olkoon A n n-matriisi. Luku on matriisin A ominaisarvo (eigenvalue), jos on olemassa vektori x siten, että Ax = x () Yhtälön

Lisätiedot

1 Lineaariavaruus eli Vektoriavaruus

1 Lineaariavaruus eli Vektoriavaruus 1 Lineaariavaruus eli Vektoriavaruus 1.1 Määritelmä ja esimerkkejä Olkoon K kunta, jonka nolla-alkio on 0 ja ykkösalkio on 1 sekä V epätyhjä joukko. Oletetaan, että joukossa V on määritelty laskutoimitus

Lisätiedot

Insinöörimatematiikka D

Insinöörimatematiikka D Insinöörimatematiikka D M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi A. Lepistö alepisto@utu.fi Matematiikan ja tilastotieteen laitos Turun yliopisto 2016 M. Hirvensalo V. Junnila A. Lepistö

Lisätiedot

Esimerkki 4.4. Esimerkki jatkoa. Määrää matriisin ominaisarvot ja -vektorit. Ratk. Nyt

Esimerkki 4.4. Esimerkki jatkoa. Määrää matriisin ominaisarvot ja -vektorit. Ratk. Nyt Esimerkki 4.4. Määrää matriisin 2 2 1 A = 1 3 1 2 4 3 ominaisarvot ja -vektorit. Ratk. Nyt det(a λi ) = 1 + 2 λ 2 1 + 1 λ 1 λ 1 3 λ 1 = 1 3 λ 1 2 4 3 λ 2 4 3 λ 1 λ = 1 4 λ 1 = (1 λ)( 1)1+1 4 λ 1 2 6 3

Lisätiedot

802320A LINEAARIALGEBRA OSA I

802320A LINEAARIALGEBRA OSA I 802320A LINEAARIALGEBRA OSA I Tapani Matala-aho MATEMATIIKKA/LUTK/OULUN YLIOPISTO SYKSY 2016 LINEAARIALGEBRA 1 / 72 Määritelmä ja esimerkkejä Olkoon K kunta, jonka nolla-alkio on 0 ja ykkösalkio on 1 sekä

Lisätiedot

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt Ominaisarvoteoriaa Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2015 1 / 22 R. Kangaslampi matriisiteoriaa Kertaus: ominaisarvot

Lisätiedot

1 Avaruuksien ja lineaarikuvausten suora summa

1 Avaruuksien ja lineaarikuvausten suora summa MAT-33500 Differentiaaliyhtälöt, kevät 2006 Luennot 27.-28.2.2006 Samuli Siltanen 1 Avaruuksien ja lineaarikuvausten suora summa Tämä asialöytyy myös Hirschin ja Smalen kirjasta, luku 3, pykälä 1F. Olkoon

Lisätiedot

ominaisvektorit. Nyt 2 3 6

ominaisvektorit. Nyt 2 3 6 Esimerkki 2 6 8 Olkoon A = 40 0 6 5. Etsitäänmatriisinominaisarvotja 0 0 2 ominaisvektorit. Nyt 2 0 2 6 8 2 6 8 I A = 40 05 40 0 6 5 = 4 0 6 5 0 0 0 0 2 0 0 2 15 / 172 Täten c A ( )=det( I A) =( ) ( 2)

Lisätiedot

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus 1 / 51 Lineaarikombinaatio Johdattelua seuraavaan asiaan (ei tarkkoja määritelmiä): Millaisen kuvan muodostaa joukko {λv λ R, v R 3 }? Millaisen

Lisätiedot

Ominaisarvo ja ominaisvektori

Ominaisarvo ja ominaisvektori Ominaisarvo ja ominaisvektori Määritelmä Oletetaan, että A on n n -neliömatriisi. Reaaliluku λ on matriisin ominaisarvo, jos on olemassa sellainen vektori v R n, että v 0 ja A v = λ v. Vektoria v, joka

Lisätiedot

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä Matriisien tulo Lause Olkoot A, B ja C matriiseja ja R Tällöin (a) A(B + C) =AB + AC, (b) (A + B)C = AC + BC, (c) A(BC) =(AB)C, (d) ( A)B = A( B) = (AB), aina, kun kyseiset laskutoimitukset on määritelty

Lisätiedot

2.5. Matriisin avaruudet ja tunnusluvut

2.5. Matriisin avaruudet ja tunnusluvut 2.5. Matriisin avaruudet ja tunnusluvut m n-matriisi A Lineaarikuvaus A : V Z, missä V ja Z ovat sopivasti valittuja, dim V = n, dim Z = m (yleensä V = R n tai C n ja Z = R m tai C m ) Kuva-avaruus ja

Lisätiedot

Johdatus tekoälyn taustalla olevaan matematiikkaan

Johdatus tekoälyn taustalla olevaan matematiikkaan Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 5. luento.2.27 Lineaarialgebraa - Miksi? Neuroverkon parametreihin liittyvät kaavat annetaan monesti

Lisätiedot

Avaruuden R n aliavaruus

Avaruuden R n aliavaruus Avaruuden R n aliavaruus 1 / 41 Aliavaruus Esimerkki 1 Kuva: Suora on suljettu yhteenlaskun ja skalaarilla kertomisen suhteen. 2 / 41 Esimerkki 2 Kuva: Suora ei ole suljettu yhteenlaskun ja skalaarilla

Lisätiedot

MS-A0004/A0006 Matriisilaskenta

MS-A0004/A0006 Matriisilaskenta 4. MS-A4/A6 Matriisilaskenta 4. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto..25 Tarkastellaan neliömatriiseja. Kun matriisilla kerrotaan vektoria, vektorin

Lisätiedot

Matriisiteoria Harjoitus 1, kevät Olkoon. cos α sin α A(α) = . sin α cos α. Osoita, että A(α + β) = A(α)A(β). Mikä matriisi A(α)A( α) on?

Matriisiteoria Harjoitus 1, kevät Olkoon. cos α sin α A(α) = . sin α cos α. Osoita, että A(α + β) = A(α)A(β). Mikä matriisi A(α)A( α) on? Harjoitus 1, kevät 007 1. Olkoon [ ] cos α sin α A(α) =. sin α cos α Osoita, että A(α + β) = A(α)A(β). Mikä matriisi A(α)A( α) on?. Olkoon a x y A = 0 b z, 0 0 c missä a, b, c 0. Määrää käänteismatriisi

Lisätiedot

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos: 8 Kanta Tässä luvussa tarkastellaan aliavaruuden virittäjävektoreita, jotka muodostavat lineaarisesti riippumattoman jonon. Merkintöjen helpottamiseksi oletetaan luvussa koko ajan, että W on vektoreiden

Lisätiedot

6. OMINAISARVOT JA DIAGONALISOINTI

6. OMINAISARVOT JA DIAGONALISOINTI 0 6 OMINAISARVOT JA DIAGONALISOINTI 6 Ominaisarvot ja ominaisvektorit Olkoon V äärellisulotteinen vektoriavaruus, dim(v ) = n ja L : V V lineaarikuvaus Määritelmä 6 Skalaari λ R on L:n ominaisarvo, jos

Lisätiedot

Matemaattinen Analyysi, s2016, L2

Matemaattinen Analyysi, s2016, L2 Matemaattinen Analyysi, s2016, L2 riippumattomuus, 1 Esimerkkejä esimerkki Dieetti-välipala 1: Opiskelija Ken Obi on dieetillä. Lenkin jälkeen Ken pysähtyy välipalalle. Dieetin mukaan hänen pitäisi saada

Lisätiedot

Kaksirivisen matriisin determinantille käytämme myös merkintää. a 11 a 12 a 21 a 22. = a 11a 22 a 12 a 21. (5.1) kaksirivine

Kaksirivisen matriisin determinantille käytämme myös merkintää. a 11 a 12 a 21 a 22. = a 11a 22 a 12 a 21. (5.1) kaksirivine Vaasan yliopiston julkaisuja 97 5 DETERMINANTIT Ch:Determ Sec:DetDef 5.1 Determinantti Tämä kappale jakautuu kolmeen alakappaleeseen. Ensimmäisessä alakappaleessa määrittelemme kaksi- ja kolmiriviset determinantit.

Lisätiedot

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48 MS-A3/A5 Matriisilaskenta Malliratkaisut 5 / vko 48 Tehtävä (L): a) Onko 4 3 sitä vastaava ominaisarvo? b) Onko λ = 3 matriisin matriisin 2 2 3 2 3 7 9 4 5 2 4 4 ominaisvektori? Jos on, mikä on ominaisarvo?

Lisätiedot

Matriisilaskenta Luento 12: Vektoriavaruuden kannan olemassaolo

Matriisilaskenta Luento 12: Vektoriavaruuden kannan olemassaolo Matriisilaskenta Luento 12: Vektoriavaruuden kannan olemassaolo Antti Rasila 2016 Vektoriavaruuden kannan olemassaolo Jos {v 1, v 2,..., v k } on äärellisulotteisen vektoriavaruuden V lineaarisesti riippumaton

Lisätiedot

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi Talousmatematiikan perusteet: Luento 11 Lineaarikuvaus Matriisin aste Käänteismatriisi Viime luennolla Käsittelimme matriisien peruskäsitteitä ja laskutoimituksia Vakiolla kertominen, yhteenlasku ja vähennyslasku

Lisätiedot

Matriisilaskenta, LH4, 2004, ratkaisut 1. Hae seuraavien R 4 :n aliavaruuksien dimensiot, jotka sisältävät vain

Matriisilaskenta, LH4, 2004, ratkaisut 1. Hae seuraavien R 4 :n aliavaruuksien dimensiot, jotka sisältävät vain Matriisilaskenta LH4 24 ratkaisut 1 Hae seuraavien R 4 :n aliavaruuksien dimensiot jotka sisältävät vain a) Kaikki muotoa (a b c d) olevat vektorit joilla d a + b b) Kaikki muotoa (a b c d) olevat vektorit

Lisätiedot

Insinöörimatematiikka D

Insinöörimatematiikka D Insinöörimatematiikka D M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Matematiikan ja tilastotieteen laitos Turun yliopisto 2015 M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Luentokalvot

Lisätiedot

Insinöörimatematiikka D

Insinöörimatematiikka D Insinöörimatematiikka D M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Matematiikan ja tilastotieteen laitos Turun yliopisto 2015 M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Luentokalvot

Lisätiedot

Lineaarialgebra ja matriisilaskenta II. LM2, Kesä /141

Lineaarialgebra ja matriisilaskenta II. LM2, Kesä /141 Lineaarialgebra ja matriisilaskenta II LM2, Kesä 2012 1/141 Kertausta: avaruuden R n vektorit Määritelmä Oletetaan, että n {1, 2, 3,...}. Avaruuden R n alkiot ovat jonoja, joissa on n kappaletta reaalilukuja.

Lisätiedot

Käänteismatriisi 1 / 14

Käänteismatriisi 1 / 14 1 / 14 Jokaisella nollasta eroavalla reaaliluvulla on käänteisluku, jolla kerrottaessa tuloksena on 1. Seuraavaksi tarkastellaan vastaavaa ominaisuutta matriiseille ja määritellään käänteismatriisi. Jokaisella

Lisätiedot

Similaarisuus. Määritelmä. Huom.

Similaarisuus. Määritelmä. Huom. Similaarisuus Määritelmä Neliömatriisi A M n n on similaarinen neliömatriisin B M n n kanssa, jos on olemassa kääntyvä matriisi P M n n, jolle pätee Tällöin merkitään A B. Huom. Havaitaan, että P 1 AP

Lisätiedot

Lineaarialgebra ja matriisilaskenta I

Lineaarialgebra ja matriisilaskenta I Lineaarialgebra ja matriisilaskenta I 6.6.2013 HY / Avoin yliopisto Jokke Häsä, 1/22 Kertausta: Kääntyvien matriisien lause Lause 1 Oletetaan, että A on n n -neliömatriisi. Seuraavat ehdot ovat yhtäpitäviä.

Lisätiedot

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä 3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a 21

Lisätiedot

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0. Vapaus Määritelmä Oletetaan, että v 1, v 2,..., v k R n, missä n {1, 2,... }. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee: jos c 1 v 1 + c 2 v 2 +

Lisätiedot

802320A LINEAARIALGEBRA OSA III

802320A LINEAARIALGEBRA OSA III 802320A LINEAARIALGEBRA OSA III Tapani Matala-aho MATEMATIIKKA/LUTK/OULUN YLIOPISTO SYKSY 2016 LINEAARIALGEBRA 1 / 56 Määritelmä Määritelmä 1 Olkoot V ja W lineaariavaruuksia kunnan K yli. Kuvaus L : V

Lisätiedot

Tyyppi metalli puu lasi työ I 2 8 6 6 II 3 7 4 7 III 3 10 3 5

Tyyppi metalli puu lasi työ I 2 8 6 6 II 3 7 4 7 III 3 10 3 5 MATRIISIALGEBRA Harjoitustehtäviä syksy 2014 Tehtävissä 1-3 käytetään seuraavia matriiseja: ( ) 6 2 3, B = 7 1 2 2 3, C = 4 4 2 5 3, E = ( 1 2 4 3 ) 1 1 2 3 ja F = 1 2 3 0 3 0 1 1. 6 2 1 4 2 3 2 1. Määrää

Lisätiedot

Määritelmä 1. Olkoot V ja W lineaariavaruuksia kunnan K yli. Kuvaus L : V. Termejä: Lineaarikuvaus, Lineaarinen kuvaus.

Määritelmä 1. Olkoot V ja W lineaariavaruuksia kunnan K yli. Kuvaus L : V. Termejä: Lineaarikuvaus, Lineaarinen kuvaus. 1 Lineaarikuvaus 1.1 Määritelmä Määritelmä 1. Olkoot V ja W lineaariavaruuksia kunnan K yli. Kuvaus L : V W on lineaarinen, jos (a) L(v + w) = L(v) + L(w); (b) L(λv) = λl(v) aina, kun v, w V ja λ K. Termejä:

Lisätiedot

9. Lineaaristen differentiaaliyhtälöiden ratkaisuavaruuksista

9. Lineaaristen differentiaaliyhtälöiden ratkaisuavaruuksista 29 9 Lineaaristen differentiaaliyhtälöiden ratkaisuavaruuksista Tarkastelemme kertalukua n olevia lineaarisia differentiaaliyhtälöitä y ( x) + a ( x) y ( x) + + a ( x) y( x) + a ( x) y= b( x) ( n) ( n

Lisätiedot

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt ja pienimmän neliösumman menetelmä Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2015 1 / 18 R. Kangaslampi QR ja PNS PNS-ongelma

Lisätiedot

802118P Lineaarialgebra I (4 op)

802118P Lineaarialgebra I (4 op) 802118P Lineaarialgebra I (4 op) Tero Vedenjuoksu Oulun yliopisto Matemaattisten tieteiden laitos 2012 Lineaarialgebra I Yhteystiedot: Tero Vedenjuoksu tero.vedenjuoksu@oulu.fi Työhuone M206 Kurssin kotisivu

Lisätiedot

Numeeriset menetelmät TIEA381. Luento 5. Kirsi Valjus. Jyväskylän yliopisto. Luento 5 () Numeeriset menetelmät / 28

Numeeriset menetelmät TIEA381. Luento 5. Kirsi Valjus. Jyväskylän yliopisto. Luento 5 () Numeeriset menetelmät / 28 Numeeriset menetelmät TIEA381 Luento 5 Kirsi Valjus Jyväskylän yliopisto Luento 5 () Numeeriset menetelmät 3.4.2013 1 / 28 Luennon 5 sisältö Luku 4: Ominaisarvotehtävistä Potenssiinkorotusmenetelmä QR-menetelmä

Lisätiedot

Ominaisvektoreiden lineaarinen riippumattomuus

Ominaisvektoreiden lineaarinen riippumattomuus Ominaisvektoreiden lineaarinen riippumattomuus Lause 17 Oletetaan, että A on n n -matriisi. Oletetaan, että λ 1,..., λ m ovat matriisin A eri ominaisarvoja, ja oletetaan, että v 1,..., v m ovat jotkin

Lisätiedot

MS-C1340 Lineaarialgebra ja

MS-C1340 Lineaarialgebra ja MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt QR-hajotelma ja pienimmän neliösumman menetelmä Riikka Kangaslampi Kevät 2017 Matematiikan ja systeemianalyysin laitos Aalto-yliopisto PNS-ongelma PNS-ongelma

Lisätiedot

Tehtäväsarja I Kerrataan lineaarikuvauksiin liittyviä todistuksia ja lineaarikuvauksen muodostamista. Sarjaan liittyvät Stack-tehtävät: 1 ja 2.

Tehtäväsarja I Kerrataan lineaarikuvauksiin liittyviä todistuksia ja lineaarikuvauksen muodostamista. Sarjaan liittyvät Stack-tehtävät: 1 ja 2. HY / Avoin yliopisto Lineaarialgebra ja matriisilaskenta II, kesä 2016 Harjoitus 3 Ratkaisut palautettava viimeistään maanantaina 29.8.2016 klo 13.15. Tehtäväsarja I Kerrataan lineaarikuvauksiin liittyviä

Lisätiedot

Lineaarialgebra ja matriisilaskenta I

Lineaarialgebra ja matriisilaskenta I Lineaarialgebra ja matriisilaskenta I 30.5.2013 HY / Avoin yliopisto Jokke Häsä, 1/19 Käytännön asioita Kurssi on suunnilleen puolessa välissä. Kannattaa tarkistaa tavoitetaulukosta, mitä on oppinut ja

Lisätiedot

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä 1 3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a

Lisätiedot

Talousmatematiikan perusteet: Luento 10. Lineaarikuvaus Matriisin aste Determinantti Käänteismatriisi

Talousmatematiikan perusteet: Luento 10. Lineaarikuvaus Matriisin aste Determinantti Käänteismatriisi Talousmatematiikan perusteet: Luento 10 Lineaarikuvaus Matriisin aste Determinantti Käänteismatriisi Lineaarikuvaus Esim. Yritys tekee elintarviketeollisuuden käyttämää puolivalmistetta, jossa käytetään

Lisätiedot

Ortogonaalinen ja ortonormaali kanta

Ortogonaalinen ja ortonormaali kanta Ortogonaalinen ja ortonormaali kanta Määritelmä Kantaa ( w 1,..., w k ) kutsutaan ortogonaaliseksi, jos sen vektorit ovat kohtisuorassa toisiaan vastaan eli w i w j = 0 kaikilla i, j {1, 2,..., k}, missä

Lisätiedot

Kanta ja dimensio 1 / 23

Kanta ja dimensio 1 / 23 1 / 23 Kuten ollaan huomattu, saman aliavaruuden voi virittää eri määrä vektoreita. Seuraavaksi määritellään mahdollisimman pieni vektorijoukko, joka virittää aliavaruuden. Jokainen aliavaruuden alkio

Lisätiedot

Ominaisarvot ja ominaisvektorit 140 / 170

Ominaisarvot ja ominaisvektorit 140 / 170 Ominaisarvot ja ominaisvektorit 140 / 170 Seuraavissa luvuissa matriisit ja vektori ajatellaan kompleksisiksi, ts. kertojakuntana oletetaan olevan aina kompleksilukujoukko C Huomaa, että reaalilukujoukko

Lisätiedot

Lineaarialgebra ja matriisilaskenta I

Lineaarialgebra ja matriisilaskenta I Lineaarialgebra ja matriisilaskenta I 29.5.2013 HY / Avoin yliopisto Jokke Häsä, 1/26 Kertausta: Kanta Määritelmä Oletetaan, että w 1, w 2,..., w k W. Vektorijono ( w 1, w 2,..., w k ) on aliavaruuden

Lisätiedot

Determinantti 1 / 30

Determinantti 1 / 30 1 / 30 on reaaliluku, joka on määritelty neliömatriiseille Determinantin avulla voidaan esimerkiksi selvittää, onko matriisi kääntyvä a voidaan käyttää käänteismatriisin määräämisessä ja siten lineaarisen

Lisätiedot

Talousmatematiikan perusteet: Luento 14. Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu

Talousmatematiikan perusteet: Luento 14. Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu Talousmatematiikan perusteet: Luento 14 Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu Luennolla 6 Tarkastelimme yhden muuttujan funktion f(x) rajoittamatonta optimointia

Lisätiedot

Ville Turunen: Mat Matematiikan peruskurssi P1 1. välikokeen alueen teoriatiivistelmä 2007

Ville Turunen: Mat Matematiikan peruskurssi P1 1. välikokeen alueen teoriatiivistelmä 2007 Ville Turunen: Mat-1.1410 Matematiikan peruskurssi P1 1. välikokeen alueen teoriatiivistelmä 2007 Materiaali: kirjat [Adams R. A. Adams: Calculus, a complete course (6th edition), [Lay D. C. Lay: Linear

Lisätiedot

1.1. Määritelmiä ja nimityksiä

1.1. Määritelmiä ja nimityksiä 1.1. Määritelmiä ja nimityksiä Luku joko reaali- tai kompleksiluku. R = {reaaliluvut}, C = {kompleksiluvut} R n = {(x 1, x 2,..., x n ) x 1, x 2,..., x n R} C n = {(x 1, x 2,..., x n ) x 1, x 2,..., x

Lisätiedot

Talousmatematiikan perusteet: Luento 13. Rajoittamaton optimointi Hessen matriisi Ominaisarvot ja vektorit Ääriarvon laadun tarkastelu

Talousmatematiikan perusteet: Luento 13. Rajoittamaton optimointi Hessen matriisi Ominaisarvot ja vektorit Ääriarvon laadun tarkastelu Talousmatematiikan perusteet: Luento 13 Rajoittamaton optimointi Hessen matriisi Ominaisarvot ja vektorit Ääriarvon laadun tarkastelu Viime luennolla Aloimme tarkastella yleisiä, usean muuttujan funktioita

Lisätiedot

Insinöörimatematiikka D

Insinöörimatematiikka D Insinöörimatematiikka D Mika Hirvensalo mikhirve@utu.fi Matematiikan ja tilastotieteen laitos Turun yliopisto 2014 Mika Hirvensalo mikhirve@utu.fi Luentokalvot 3 1 of 16 Kertausta Lineaarinen riippuvuus

Lisätiedot

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 );

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 ); LINEAARIALGEBRA Harjoituksia/Exercises 2017 1. Olkoon n Z +. Osoita, että (R n, +, ) on lineaariavaruus, kun vektoreiden x = (x 1,..., x n ), y = (y 1,..., y n ) identtisyys, yhteenlasku ja reaaliluvulla

Lisätiedot

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 );

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 ); LINEAARIALGEBRA Ratkaisuluonnoksia, Syksy 2016 1. Olkoon n Z +. Osoita, että (R n, +, ) on lineaariavaruus, kun vektoreiden x = (x 1,..., x n ), y = (y 1,..., y n ) identtisyys, yhteenlasku ja reaaliluvulla

Lisätiedot

Insinöörimatematiikka D, laskuharjoituksien esimerkkiratkaisut

Insinöörimatematiikka D, laskuharjoituksien esimerkkiratkaisut Insinöörimatematiikka D, 06 laskuharjoituksien esimerkkiratkaisut Alla olevat esimerkkiratkaisut ovat melko ksitiskohtaisia Tenttivastauksissa ei leensä tarvitse muistaa lauseiden, määritelmien, esimerkkien

Lisätiedot

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42 MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42 Tehtävät 1-4 lasketaan alkuviikon harjoituksissa ryhmissä, ja ryhmien ratkaisut esitetään harjoitustilaisuudessa (merkitty kirjaimella L = Lasketaan).

Lisätiedot

Lineaarialgebra ja matriisilaskenta I

Lineaarialgebra ja matriisilaskenta I Lineaarialgebra ja matriisilaskenta I 13.6.2013 HY / Avoin yliopisto Jokke Häsä, 1/12 Käytännön asioita Kesäkuun tentti: ke 19.6. klo 17-20, päärakennuksen sali 1. Anna palautetta kurssisivulle ilmestyvällä

Lisätiedot

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 );

x = y x i = y i i = 1, 2; x + y = (x 1 + y 1, x 2 + y 2 ); x y = (x 1 y 1, x 2 + y 2 ); LINEAARIALGEBRA Harjoituksia, Syksy 2016 1. Olkoon n Z +. Osoita, että (R n, +, ) on lineaariavaruus, kun vektoreiden x = (x 1,..., x n ), y = (y 1,..., y n ) identtisyys, yhteenlasku ja reaaliluvulla

Lisätiedot