HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 07 Harjoitus Ratkaisuehdotuksia Tehtäväsarja I Osa tämän viikon tehtävistä ovat varsin haastavia, joten ei todellakaan kannata huolestua, jos niiden kanssa on tekemistä ja jos ne eivät heti avaudu. Nämä syventävät paljon Todennäköisyyslaskenta IIa -kurssin ajatuksia ja ensi viikolla palaamme taas helpompiin asioihin. Eli älä huolestu vaan vinkkejä kannattaa kysyä lisää.. Ajatellaan, että meillä on 3000000 (kolme miljoonaa) kokonaislukua, joiden keskiarvo on 6 ja neliöiden keskiarvo on 37. Olkoon X diskreetti satunnaismuuttuja, jonka ptnf f X määräytyy näiden lukujen avulla seuraavasti: jos luku k esiintyy n k kertaa, niin f X (k) = n k /3000000. Laske EX ja var X sekä laske Tšebyševin epäyhtälön avulla yläraja-arvio todennäköisyydelle P(X 0). Kuinka paljon lukuja 3, 4,..., 8 ja 9 on vähintään? Ratkaisu: X on diskreetti satunnaismuuttuja, jonka äärellinen arvojoukko on niiden kokonaislukujen joukko, jotka esiintyvät kyseisten kolmen miljoonan luvun joukossa vähintään kerran, sillä muilla kokonaisluvuilla n k = 0 ja siten f X (k) = P(X = k) = 0. Merkitään tätä arvojoukkoa S :llä. Tehtävänannosta saadaan, että kolmen miljoonan kokonaisluvun keskiarvo on 6. Siispä jos luku k S esiintyy n k kertaa, niin kn 3 0 6 k = 6. Koska X on diskreetti satunnaismuuttuja äärellisellä arvojoukolla, sille voidaan laskea odotusarvo kaavalla EX = kf X (k) = n k k 3 0 = kn 6 3 0 6 k = 6. Lisäksi saadaan, että kolmen miljoonan kokonaisluvun neliöiden keskiarvo on 37 eli 3 0 6 k n k = 37. X :n varianssin laskemiseksi on laskettava toinen momentti EX. Diskreetille satunnaismuuttujalle tämä saadaan EX = k f X (k) = k n k 3 0 = 6 Satunnaismuuttujan X varianssiksi saadaan siten k n 3 0 6 k = 37. var X = EX (EX) = 37 6 =. Arvioidaan todennäköisyyttä P(X 0). Merkitään µ = EX ja σ = var X. Nyt µ = 6 ja σ =. Tšebyševin epäyhtälö sanoo, että kaikilla k > 0, P[ X µ kσ] k Nyt P[X 0] P[X ] + P[X 0] = P[ X 6 4],
joten P[X 0] P[ X 6 4] = P[ X µ 4] Tsebysev 4 = 6, joka on siis yläraja-arvio todennäköisyydelle P(X 0). Koska tämä on yhtä lailla myös yläraja-arvio todennäköisyydelle P[ X 6 4], niin luvusta 6 vähintään neljän verran poikkeavia arvoja (eli ysiä suurempia ja kolmosta pienempiä lukuja) on korkeintaan 6 3 000 000 = 87 500. Tällöin kysyttyjä lukuja, eli tähän väliin jääviä lukuja on oltava vähintään 8 500.. Olkoon X > 0 sellainen satunnaismuuttuja, että odotusarvot EX, E(/X ) ja E (X) ovat kaikki reaalilukuja. Mitä voit sanoa Jensenin epäyhtälön avulla a) lukujen /EX ja E(/X ) suuruusjärjestyksestä, ja b) lukujen EX ja E( X) suuruusjärjestyksestä? c) Laske edellä kerrotut neljä suuretta (tai niiden likiarvot), kun X :llä on välin (, ) tasajakauma, ja tarkista tällä tavalla, että sait edellä järkeiltyä suuruusjärjestyksen oikein päin. Ratkaisu: Määritellään funktiot g ja h(0, ) R : g(x) = x ja h(x) = x. (a) Nyt g (x) = x ja g (x) = x 3 > 0 x > 0, joten lauseen 6.5 nojalla g on konveksi funktio. Merkitään Y = X. Nyt koska g on konveksi ja EY = EX sekä Eg(Y ) = E(/X ) ovat olemassa, niin Jensenin epäyhtälön nojalla EX = ( ) EY = g(ey ) Eg(Y ) = E. X (b) Nyt h (x) = ja x h (x) = > 0 x > 0, joten lauseen 6.5 nojalla h on 4x 3/ konveksi funktio. Koska EX on olemassa, niin myös EX on olemassa. Lisäksi tiedetään, että E( X) on olemassa ja koska h on konveksi funktio, niin Jensenin epäyhtälön nojalla EX = h(ex) E(h(X)) = E( X) = E( X), mistä seuraa, että EX E( X). (c) X noudattaa välin (,) tasajakaumaa, jolloin f X (x) = {<x<}. Nyt ensinnäkin / EX = x dx = 3 x3 = 7 3, jolloin Lisäksi EX = 3 7 0.49. ( ) E = X x dx = / x =,
joten EX < E ( X ), kuten pitääkin. Lasketaan vielä jolloin EX = + = 3, EX = 3.5. Lisäksi E ( X ) = x dx = / joten EX > E ( X ), kuten pitääkin. 3 x3/ = 4 3 3.9, 3. Näytä luentojen lauseesta 6.4. puolet, eli että jos g on konveksi välillä I, niin g(b) g(a) b a g(c) g(b) c b aina kun a < b < c ovat välin I alkioita. Toimi seuraavasti: etsi sellainen λ (0, ), että b = λa + ( λ)c. Sovella sitten konveksisuuden määritelmää kun x = a, y = c ja kun λ on äsken saamasi λ. Järjestele termit (mahdollisesti lisäämällä ja vähentämällä termejä) kunnes saat yllä olevan epäyhtälön. Piirrä myös kuva ja selitä erotusosamäärät geometrisesti. Ratkaisu: Olkoon g konveksi välillä I R ja a < b < c välin I alkioita. Noudatetaan tehtävänannon ohjetta ja huomataan, että Nyt konveksisuuden määritelmän nojalla Näin ollen saadaan g(b) = g b = c b ( a + c b ) c. c a c a }{{}}{{} λ λ ( c b c a a + b a ) c a c c b c a g(a) + b a c a g(c). (c a)g(b) (c b)g(a) + (b a)g(c) cg(b) ag(b) cg(a) bg(a) + bg(c) ag(c) cg(b) cg(a) + bg(a) ag(b) ag(c) + bg(c) cg(b) cg(a) + bg(a) bg(b) ag(b) ag(c) + bg(c) bg(b) (c b)[g(b) g(a)] (b a)[g(c) g(b)] g(b) g(a) b a g(c) g(b). c b Erotusosamäärää voi geometrisesti ajatella funktion kuvaajan kahden pisteen välille piirretyn sekantin kulmakertoimena. Alla olevassa kuvassa punaisen sekantin kulmakerroin olisi ja sinisen g(c) g(b). Jos g on konveksi ja a < b < c, niin si- g(b) g(a) b a c b nisen sekantin kulmakerroin on aina vähintään punaisen kulmakerroin, olipa pisteet a < b < c valittu miten tahansa.
4. Mitkä seuraavista funktioista on konvekseja? Kerro myös millä seuraavista voit ja millä et voi perustella vastaustasi: käyttämällä Lausetta 6.4, Lausetta 6.5 a) ja/tai Lausetta 6.5 b)? a) f(x) = x 8 b) f(x) = x 4/3 c) f(x) = x { x > 0 } d) f(x) = sin x Ratkaisu: (a) Funktio f : R R, f(x) = x 8 on konveksi, sillä se on kahdesti derivoituva koko R:ssä ja f (x) = 8x 7 ja f (x) = 5x 6 0 x R. Perusteluna siis lauseen 6.5 b-kohta. Luonnollisesti myös lauseen a-kohta kävisi perusteluksi, sillä f on jatkuvasti derivoituva koko R:ssä ja f :n derivaatta on kasvava koko R:ssä. Koska lause 6.4 pätee molempiin suuntiin ja f on konveksi, niin lauseen 6.4 epäyhtälön on oltava tosi f :lle kaikilla a < b < c R ja konveksisuuden voisi siten perustella myös sitä käyttäen. (b) Funktio f : R R, f(x) = x 4/3 on konveksi. Se on derivoituva kaikilla avoimilla väleillä I, myös origossa. Lisäksi derivaatta f (x) = 4 3 x/3 on jatkuva ja kasvava koko R:ssä. Siten lauseen 6.5 a-kohdan nojalla funktio on konveksi. Lauseen 6.5 b-kohtaa ei voi käyttää perusteluna, sillä funktion toista derivaattaa ei ole määritelty origossa. Koska funktio on konveksi, myös lauseen 6.4 epäyhtälö pätee kaikilla a < b < c R, jolloin konveksisuuden voisi perustella myös sitä käyttäen. (c) Funktio f : R R, f(x) = x {x > 0} on konveksi lauseen 6.5 a nojalla, sillä
se on jatkuvasti derivoituva ja derivaatta f x, kun x > 0 (x) = 0, muualla on kasvava koko R:ssä. Koska funktio on konveksi, myös lauseen 6.4 epäyhtälö pätee kaikilla a < b < c I, jolloin konveksisuuden voisi perustella myös sitä käyttäen. Lauseen 6.5 b-kohtaa ei voi käyttää perusteluna, sillä funktio ei ole kahdesti derivoituva origossa. (d) Funktio f : R R, f(x) = sin x ei ole konveksi, sillä valitsemalla a =, b = ja c = 3 saadaan f(b) f(a) b a = sin sin = sin sin > sin 3 sin = sin 3 sin 3 = f(c) f(b), c b Lauseen 6.4 mukaan f olisi konveksi, jos ja vain jos epäyhtälö pätisi kaikilla a < b < c R. Nyt näin ei ole, joten f ei ole konveksi. Lauseella 6.5 ei voi perustella sitä, että funktio ei ole konveksi, sillä kyseinen lause on muotoa: jos ehto, niin konveksi. Lause 6.5 ei näin ollen kerro konveksisuudesta tilanteessa, jossa ehto ei päde. 5. Osa Lauseen 6.9. todistuksesta. Oletetaan, että X :n momenttiemäfunktio on äärellinen t < h. a) Päättele Cauchyn Schwarzin epäyhtälön avulla, että kunhan t < h. (EXe tx ) E(X e tx )Ee tx b) Oletetaan, että tiedämme, että momenttiemäfunktiota voi derivoida odotusarvon sisällä (kuten Luvun 4 kalvoissa sivulla 47), kunhan t < h. Päättele a)-kohdan ja momenttiemäfunktiota derivoimalla, että kumulanttiemäfunktion toinen derivaatta K (t) 0, kun t < h. c) Selitä b)-kohdan avulla, miksi kumulanttiemäfunktio K on konveksi välillä ( h, h). Ratkaisu: (a) Todetaan, että Xe tx = Xe tx e tx, jolloin lauseen 4.4 ja Cauchyn-Schwarzin epäyhtälön avulla voidaan päätellä, että ( (EXe tx ) = EXe tx L 4.4 (E Xe tx C-S ey. ) E ( Xe tx) E ( ) e tx) = E ( Xe tx) E ( e tx) = E(X e tx )Ee tx (b) Momenttiemäfunktio M X (t) = Ee tx. Nyt jos tiedämme, että momenttiemäfunktiota voi derivoida odotusarvon sisällä, kunhan t < h, niin M X(t) = E t etx = EXe tx ja M X(t) = E t XetX = X e tx.
Nyt kumulanttiemäfunktion ensimmäinen derivaatta K X(t) = M X (t) M X (t), jolloin osamäärän derivoimissäännöllä saadaan toinen derivaatta K X(t) = M X(t)M X (t) (M X (t)) = EX e tx Ee tx (EXe tx ) (M X (t)) (Ee tx ) Koska a-kohdan perusteella tiedetään, että (EXe tx ) E(X e tx )Ee tx, eli E(X e tx )Ee tx (EXe tx ) 0, niin nyt K X(t) 0, kun t < h. (c) Koska K X(t) 0, kun t < h, eli kun h < t < h, niin lauseen 6.5 nojalla K on konveksi tällä välillä. 6. Olkoon X satunnaismuuttuja, jonka momenttiemäfunktio on M X (t) = e4t e t + 4t, kun t 0 ja M X (0) =. Merkitään g(t) = e ta M(t). (a) Laske lim t g(t) kun a > 4, a = 4 ja a < 4. (b) Mitä pystyt Lauseen 6.9. avulla päättelemään satunnaismuuttujan häntätodennäköisyyksistä P(X a) kun a > 4 näistä raja-arvoista? Entä kun a < 4? Ratkaisu: (a) Lasketaan raja-arvo lim t g(t) = lim e4t e t + t e ta 4t 0, kun a 4 =, kun a < 4 e t(4 a) = lim et( a) + e at t 4t 4t 4t (b) Nyt e 4t e t + = (e t ) > 0 kaikilla t > 0, joten myös g(t) > 0. Näin ollen, kun a > 4, on inf g(t) = lim g(t) = 0, t>0 t jolloin lauseen 6.9 avulla voidaan sanoa, että P(X a) inf t>0 e ta M X (t) = inf g(t) = 0. t>0 Toisaalta koska todennäköisyys on aina vähintään nolla, niin nyt P (X a) = 0.