MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Samankaltaiset tiedostot
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien summa ja keskiarvo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien summa ja keskiarvo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Keskihajonta ja korrelaatio

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Tilastomatematiikka Kevät 2008

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin (2008) 1/5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

30A02000 Tilastotieteen perusteet

031021P Tilastomatematiikka (5 op) viikko 3

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

031021P Tilastomatematiikka (5 op) viikot 5 6

11 Raja-arvolauseita ja approksimaatioita

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

Poisson-prosessien ominaisuuksia ja esimerkkilaskuja

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien muunnokset ja niiden jakaumat

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Mat Sovellettu todennäköisyyslasku A

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Satunnaismuuttujan odotusarvo ja laskusäännöt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3

6. laskuharjoitusten vastaukset (viikot 10 11)

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

Harjoitus 2: Matlab - Statistical Toolbox

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden ominaisuuksia

Todennäköisyyslaskun kertaus. Heliövaara 1

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Johdatus tn-laskentaan torstai

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujan odotusarvo ja laskusäännöt

Moniulotteisia todennäköisyysjakaumia

V ar(m n ) = V ar(x i ).

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

Tutkimustiedonhallinnan peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

riippumattomia ja noudattavat samaa jakaumaa.

JATKUVAT JAKAUMAT Laplace-muunnos (Laplace-Stieltjes-muunnos)

Jatkuvat satunnaismuuttujat

Mat Sovellettu todennäköisyyslasku 5. harjoitukset/ratkaisut. Jatkuvat jakaumat

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

4. Todennäköisyyslaskennan kertausta

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

10 Moniulotteinen normaalijakauma

7. laskuharjoituskierros, vko 10, ratkaisut

Sovellettu todennäköisyyslaskenta B

Moniulotteiset satunnaismuuttujat ja jakaumat

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

031021P Tilastomatematiikka (5 op) viikko 7

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Mat Sovellettu todennäköisyyslasku A

5. laskuharjoituskierros, vko 8, ratkaisut

Transkriptio:

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Satunnaismuuttujien summa ja keskihajonta Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2017 2018 Periodi II

Sisältö Satunnaismuuttujien summa Summan keskihajonta Normaaliapproksimaatio

Kahden satunnaismuuttujan summa Kahden satunnaismuuttujan summa X + Y on satunnaismuuttuja, jonka jakauma voidaan määrittää X :n ja Y :n yhteisjakaumasta f X,Y (x, y): f X +Y (s) = x f X +Y (s) = f X,Y (x, s x) f X,Y (x, s x) dx. Jos summan termit ovat stokastisesti riippumattomat: f X +Y (s) = x f X (x)f Y (s x) f X +Y (s) = f X (x)f Y (s x) dx.

Kahden satunnaismuuttujan summa Satunnaismuuttujat X 1 ja X 2 ovat toisistaan riippumattomat noudattavat lukujoukon {0, 1, 2,... } geometrista jakaumaa parametrina a = 4/5 ja tiheysfunktiona 0.2 f (x) = (1 a)a x. 0.1 0.0 0 5 10 15 20 25 Määritä satunnaismuuttujan X 1 + X 2 jakauma.

Kahden satunnaismuuttujan summa Satunnaismuuttujan X 1 + X 2 arvojoukko on {0, 1, 2,... } ja tiheysfunktio saadaan määritettyä kaavasta f X1 +X 2 (s) = x f (x)f (s x) = s (1 a)a x (1 a)a s x x=0 Summan jakauman tiheysfunktio on 0.2 f X1 +X 2 (s) = (1 a) 2 (s +1)a s 0.1 0.0 0 5 10 15 20 25

Sisältö Satunnaismuuttujien summa Summan keskihajonta Normaaliapproksimaatio

Mitä suurten lukujen laki kertoo (ja mitä ei)? Keskiarvo suuresta määrästä riippumattomia X :n tavoin jakautuneita satunnaislukuja (odotusarvo µ, keskihajonta σ) on likimain 1 n n X i µ (tn:llä 1). i=1 Suurten lukujen laki ei kerro: Kuinka tarkka tämä approksimaatio on? Miten σ vaikuttaa approksimaation tarkkuuteen? Approksimaation tarkkuutta voidaan mitata laskemalla ( ) ( 1 n n ) SD X i = 1 n n SD X i. i=1 i=1 Tarvitaan laskukaava summan keskihajonnalle/varianssille.

Summan keskihajonta Laske σ X +Y = SD(X + Y ), kun tunnetaan odotusarvot µ X = 1 ja µ Y = 1 sekä keskihajonnat σ X = 2 ja σ Y = 3. Ratkaisu Kovarianssin lineaarisuudesta Var(X + Y ) = Cov(X + Y, X + Y ) = Cov(X, X ) + Cov(Y, X ) + Cov(X, Y ) + Cov(Y, Y ) = Var(X ) + 2 Cov(X, Y ) + Var(Y ), joten SD(X + Y ) = σ 2 X + 2 Cor(X, Y ) σ X σ Y + σ 2 Y. Summan keskihajontaa ei voi laskea tuntematta korrelaatiota. Koska 1 Cor(X, Y ) 1, saadaan yo. kaavasta estimaatit σ X σ Y SD(X + Y ) σ X + σ Y, eli 1 σ X +Y 5. Jos X ja Y ovat riippumattomat, pätee Cor(X, Y ) = 0 ja σ X +Y = σ 2 X + σ2 Y = 13 3.6.

Summan keskihajonta: Yleinen tapaus Fakta Satunnaislukujen X 1,..., X n summan keskihajonta saadaan kaavasta ( ) SD X i = σi 2 + σ i σ j ρ i,j, i i i missä σ i = SD(X i ) ja ρ i,j = Cor(X i, X j ). Jos X 1,..., X n ovat riippumattomia (ρ i,j = 0) ja samoin jakautuneita (µ i = µ ja σ i = σ), niin ( n ) SD X i = n σi 2 = nσ 2 = σ n. i=1 i=1 j i

Summan keskihajonta: Todistus Kovarianssin lineaarisuudesta ( ) ( Var X i = Cov X i, ) X j i i j = Cov(X i, X j ) i j ( = i Cov(X i, X i ) + j i Cov(X i, X j ) ) joten ( ) SD X i i = = i = i Var(X i ) + Cov(X i, X j ) i j i σi 2 + σ i σ j ρ i,j, i j i ( ) Var X i = σi 2 + i i i j i σ i σ j ρ i,j.

Summan keskihajonta: Riippumattomat termit Fakta Riippumattomien satunnaislukujen X 1,..., X n summan keskihajonta saadaan kaavasta ( n ) SD X i = n σi 2 = σ n, i=1 kun σ i = σ kaikilla i = 1,..., n. Todistus. Tulos seuraa suoraan summan keskihajonnan kaavasta, sillä ρ i,j = Cor(X i, Y j ) = 0 kaikilla i j, kun X 1,..., X n ovat toisistaan stokastisesti riippumattomat. i=1

Summan odotusarvo ja keskihajonta: Yhteenveto Satunnaislukujen X 1,..., X n summan odotusarvo ja keskihajonta, kun µ i = E(X i ), σ i = SD(X i ) ja ρ i,j = Cor(X i, X j ): Summan termit E( i X i) SD( i X i) Yleiset i µ i i σ2 i + i j i σ iσ j ρ i,j Riippumattomat i µ i i σ2 i Riippumattomat ja samoin jakautuneet µn σ n

Esim. Noppapeli Pelataan n kierrosta noppapeliä. Laske kertyneen tuoton S n = X 1 + + X n odotusarvo ja keskihajonta, n = 10, 100, 1000. Yhden kierroksen tuoton odotusarvo on µ = 3.5 ja keskihajonta σ = E ( X 2 i ) µ 2 = 1 6 (12 + + 6 2 ) (3.5) 2 1.7. Riippumattomat kierrokset = E(S n ) = µn ja SD(S n ) = σ n. 0 10 20 30 40 50 60 0 100 200 300 400 500 600 0 1000 3000 5000 E(S 10 ) = 35 E(S 100 ) = 350 E(S 1000 ) = 3500 SD(S 10 ) 5.4 SD(S 100 ) 17 SD(S 1000 ) 54

Esim. Noppapeli 100 kierroksen tuotto on odotusarvoltaan µ 100 = 350 ja keskihajonnaltaan σ 100 17 0 100 200 300 400 0 20 40 60 80 100 Chebyshevin epäyhtälö: P(S 100 = 350 ± 34) 75% Noppapelin 100 pelikierroksen tuotto on siis melko todennäköisesti (tn 75%) välillä 316 384 EUR.

Esimerkki: Lentoyhtiö 300 lentolippua myydään lennolle, jossa on 290 matkustajapaikkaa. Arviolta 5% lipun ostaneista jää saapumatta lennolle, toisistaan riippumattomasti. Millä tn kaikki saapujat mahtuvat lennolle? Lennolle saapuvien lukumäärä on N = X 1 + + X 300, missä { 1, jos lentolipun i ostaja saapuu lennolle, X i = 0, muuten. Koska µ X = E(X i ) = 0.95 ja σ X = SD(X i ) = µ X (1 µ X ) 0.22, saadaan µ N = µ X 300 = 285 ja σ N = σ X 300 3.8. Chebyshevin epäyhtälö P(N [280, 290]) P(N = µ N ± 1.32σ N ) 1 1 1.32 2 42.6%. takaa, että kaikki mahtuvat lennolle vähintään tn:llä 42.6%. (Tämä kuulostaa pessimistiseltä arviolta?)

Lentoyhtiö: Tarkka jakauma Millainen on lennolle saapuvien lukumäärän N tarkka jakauma? N = X 1 + + X 300 Satunnaismuuttujan N arvojoukko on {0, 1, 2,..., 300}. P(N = 0) = (1 0.95) 300 0.1 300 = 10 300 P(N = k) = ( 300 k ) (1 0.95) 300 k 0.95 k N noudattaa binomijakaumaa parametrein n = 300 ja p = 0.95. Pienet N:n arvot ovat (yli)tähtitieteellisen epätodennäköisiä R:llä saadaan tarkka arvo P(N 290) = pbinom(290,300,0.95) 93.5% ja P(N [280, 290]) = pbinom(290,300,0.95) - pbinom(279,300,0.95) 85.7%.

Lentoyhtiö: Simuloitu jakauma Simuloidaan N:n tavoin Bin(300, 0.95)-jakautuneita satunnaislukuja 10000 kappaletta ja piirretään histogrammi. 250 260 270 280 290 300

100 noppaa vs. 300 lentolippua Nopanheittojen summan ja saapuvien lentomatkustajien lukumäärän jakaumat ovat likimain samanmuotoiset: 280 300 320 340 360 380 400 420 270 275 280 285 290 295 300 100 riippumattoman nopanheiton summa 300 riippumattoman indikaattorimuuttujan summa Tämä ei ole sattumaa!

Sisältö Satunnaismuuttujien summa Summan keskihajonta Normaaliapproksimaatio

Normaaliapproksimaatio Fakta (Keskeinen raja-arvolause) Jos X 1,..., X n ovat riippumattomia ja samoin jakautuneita satunnaislukuja odotusarvona µ ja keskihajontana σ, niin n i=1 X i µn σ n d Z noudattaa suurilla n likimain normitettua normaalijakaumaa tiheysfunktiona f (t) = 1 e t2 /2 2π Huom Tämä on universaali luonnonlaki, sillä X i :n jakauman luonteesta (diskreetti/jatkuva, symmetrinen/vino) ei tarvitse olettaa mitään. de Moivre 1733, Laplace 1812, Lyapunov 1911, Lindeberg 1922, Turing 1934

Normaalijakauma Satunnaisluku Z noudattaa normaalijakaumaa odotusarvona µ ja keskihajontana σ, jos sillä on tiheysfunktio f (t) = 1 (t µ)2 e 2σ 2 2πσ 2 = dnorm(x, mu, sigma) f(x) Φ(x) -σ σ x -σ σ x Normitetun normaalijakauman (µ = 0 ja σ = 1) kertymäfunktio on Φ(z) = z 1 2π e t2 2 dt = pnorm(z)

Normaalijakauman normittaminen Fakta Jos X on normaalijakautunut odotusarvona µ X ja keskihajontana σ X, niin tällöin myös Y = a + bx on normaalijakautunut odotusarvona ja keskihajontana µ Y = E(a + bx ) = a + b E(X ) = a + bµ X σ Y = SD(a + bx ) = b SD(X ) = b σ X Seuraus Normitettu satunnaisluku Z = X µ X σ X noudattaa normitettua normaalijakaumaa (µ Z = 0 ja σ Z = 1).

Esimerkki: Älykkyysosamäärä Yhdeksäsluokkalaisten älykkyysosamäärä noudattaa likimain normaalijakaumaa (µ = 100, σ = 15). Millä tn satunnaisesti valitun yhdeksäsluokkalaisen älykkyysosamäärä on (a) yli 130? (b) välillä 85 115? P(X > 130) = ( X µ P > σ ) 130 100 15 = P(Z > 2) = P(Z 2) 2.3%. ( 85 100 P(85 X 115) = P X µ 15 σ R: pnorm(-2); 1-2*pnorm(-1) = P( 1 Z 1) = 1 P(Z > 1) P(Z < 1) = 1 2 P(Z 1) 68%. ) 115 100 15

Esimerkki: Älykkyysosamäärä Odotusarvo µ = 100, keskihajonta σ = 15 2% 14% 68% 14% 2% σ σ 40 55 70 85 100 115 130 145 160

Esimerkki: Noppapeli Millä tn 100 pelikierrokselta kertynyt tuotto on (a) välillä 316 384? (b) yli 500 EUR? 280 300 320 340 360 380 400 420 Yhden kierroksen tuoton odotusarvo µ X = 3.5 ja keskihajonta σ X 1.7. Normaaliapproksimaatio: S 100 350 17 P(316 S 100 384) = P = S 100 100µ X d Z. 100σX ( 2 S ) 100 350 2 17 P( 2 Z 2) = 1 2 P(Z 2) 95.4%. ( ) S100 350 P(S 100 > 500) = P > 8.82 17 P(Z > 8.82) = P(Z 8.82) 6 10 19.

Esimerkki: Lentoyhtiö Millä tn kaikki lipun ostaneet mahtuvat lennolle? (Myyty 300 lippua, lennolla 290 paikkaa.) 270 275 280 285 290 295 300 Lennolle saapuvien lukumäärä N = X 1 + + X 300. Indikaattorin X i odotusarvo µ X = 0.95 ja keskihajonta σ X = 0.22. Normaaliapproksimaatio: N 285 3.77 = N 300µ X d Z. 300σX ( ) N 285 P(N 290) = P(N 290.5) = P 1.46 3.77 P(Z 1.46) (Tarkka tn: pbinom(290,300,0.95) = 93.5%) = 1 P(Z 1.46) 92.8%.

Seuraavalla kerralla puhutaan empiiristä jakaumista...