MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Samankaltaiset tiedostot
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien summa ja keskiarvo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien summa ja keskiarvo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Keskihajonta ja korrelaatio

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

30A02000 Tilastotieteen perusteet

031021P Tilastomatematiikka (5 op) viikko 3

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastomatematiikka Kevät 2008

Ilkka Mellin (2008) 1/5

Sovellettu todennäköisyyslaskenta B

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

031021P Tilastomatematiikka (5 op) viikot 5 6

11 Raja-arvolauseita ja approksimaatioita

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

6. laskuharjoitusten vastaukset (viikot 10 11)

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Poisson-prosessien ominaisuuksia ja esimerkkilaskuja

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Mat Sovellettu todennäköisyyslasku A

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

Harjoitus 2: Matlab - Statistical Toolbox

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden ominaisuuksia

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Sovellettu todennäköisyyslaskenta B

Johdatus tn-laskentaan torstai

Satunnaismuuttujien muunnokset ja niiden jakaumat

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

4. Todennäköisyyslaskennan kertausta

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

riippumattomia ja noudattavat samaa jakaumaa.

3.6 Su-estimaattorien asymptotiikka

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

Tutkimustiedonhallinnan peruskurssi

Satunnaismuuttujan odotusarvo ja laskusäännöt

Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio

JATKUVAT JAKAUMAT Laplace-muunnos (Laplace-Stieltjes-muunnos)

Mat Sovellettu todennäköisyyslasku A

Jatkuvat satunnaismuuttujat

Moniulotteisia todennäköisyysjakaumia

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Tilastollinen aineisto Luottamusväli

7. laskuharjoituskierros, vko 10, ratkaisut

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

5. laskuharjoituskierros, vko 8, ratkaisut

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

V ar(m n ) = V ar(x i ).

Valintahetket ja pysäytetyt martingaalit

Sovellettu todennäköisyyslaskenta B

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

3.7 Todennäköisyysjakaumia

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

dx=5&uilang=fi&lang=fi&lvv=2014

Todennäköisyyslaskun kertaus. Heliövaara 1

Satunnaismuuttujan odotusarvo ja laskusäännöt

Transkriptio:

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Normaaliapproksimaatio Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016 2017 Periodi III

Sisältö Summan keskihajonta Normaaliapproksimaatio

Mitä suurten lukujen laki kertoo (ja mitä ei)? Keskiarvo suuresta määrästä riippumattomia X :n tavoin jakautuneita satunnaislukuja (odotusarvo µ, keskihajonta σ) on likimain 1 n n X i µ (tn:llä 1). i=1 Suurten lukujen laki ei kerro: Kuinka tarkka tämä approksimaatio on? Miten σ vaikuttaa approksimaation tarkkuuteen? Approksimaation tarkkuutta voidaan mitata laskemalla ( ) ( 1 n n ) SD X i = 1 n n SD X i. i=1 i=1 Tarvitaan laskukaava summan keskihajonnalle/varianssille.

Summan keskihajonta Laske σ X +Y = SD(X + Y ), kun tunnetaan odotusarvot µ X = 1 ja µ Y = 1 sekä keskihajonnat σ X = 2 ja σ Y = 3. Ratkaisu Kovarianssin lineaarisuudesta Var(X + Y ) = Cov(X + Y, X + Y ) = Cov(X, X ) + Cov(Y, X ) + Cov(X, Y ) + Cov(Y, Y ) = Var(X ) + 2 Cov(X, Y ) + Var(Y ), joten SD(X + Y ) = σ 2 X + 2 Cor(X, Y ) σ X σ Y + σ 2 Y. Summan keskihajontaa ei voi laskea tuntematta korrelaatiota. Koska 1 Cor(X, Y ) 1, saadaan yo. kaavasta estimaatit σ X σ Y SD(X + Y ) σ X + σ Y, eli 1 σ X +Y 5. Jos X ja Y ovat riippumattomat, pätee Cor(X, Y ) = 0 ja σ X +Y = σ 2 X + σ2 Y = 13 3.6.

Summan keskihajonta: Yleinen tapaus Fakta Satunnaislukujen X 1,..., X n summan keskihajonta saadaan kaavasta ( ) SD X i = σi 2 + σ i σ j ρ i,j, i i i missä σ i = SD(X i ) ja ρ i,j = Cor(X i, X j ). Jos X 1,..., X n ovat riippumattomia (ρ i,j = 0) ja samoin jakautuneita (µ i = µ ja σ i = σ), niin ( n ) SD X i = n σi 2 = nσ 2 = σ n. i=1 i=1 j i

Summan keskihajonta: Todistus Kovarianssin lineaarisuudesta ( ) ( Var X i = Cov X i, ) X j i i j = Cov(X i, X j ) i j ( = i Cov(X i, X i ) + j i Cov(X i, X j ) ) joten ( ) SD X i i = = i = i Var(X i ) + Cov(X i, X j ) i j i σi 2 + σ i σ j ρ i,j, i j i ( ) Var X i = σi 2 + i i i j i σ i σ j ρ i,j.

Summan keskihajonta: Riippumattomat termit Fakta Riippumattomien satunnaislukujen X 1,..., X n summan keskihajonta saadaan kaavasta ( n ) SD X i = n σi 2 = σ n, i=1 kun σ i = σ kaikilla i = 1,..., n. Todistus. Tulos seuraa suoraan summan keskihajonnan kaavasta, sillä ρ i,j = Cor(X i, Y j ) = 0 kaikilla i j, kun X 1,..., X n ovat toisistaan stokastisesti riippumattomat. i=1

Summan odotusarvo ja keskihajonta: Yhteenveto Satunnaislukujen X 1,..., X n summan odotusarvo ja keskihajonta, kun µ i = E(X i ), σ i = SD(X i ) ja ρ i,j = Cor(X i, X j ): Summan termit E( i X i) SD( i X i) Yleiset i µ i i σ2 i + i j i σ iσ j ρ i,j Riippumattomat i µ i i σ2 i Riippumattomat ja samoin jakautuneet µn σ n

Esim. Noppapeli Pelataan n kierrosta noppapeliä. Laske kertyneen tuoton S n = X 1 + + X n odotusarvo ja keskihajonta, n = 10, 100, 1000. Yhden kierroksen tuoton odotusarvo on µ = 3.5 ja keskihajonta σ = E ( X 2 i ) µ 2 = 1 6 (12 + + 6 2 ) (3.5) 2 1.7. Riippumattomat kierrokset = E(S n ) = µn ja SD(S n ) = σ n. 0 10 20 30 40 50 60 0 100 200 300 400 500 600 0 1000 3000 5000 E(S 10 ) = 35 E(S 100 ) = 350 E(S 1000 ) = 3500 SD(S 10 ) 5.4 SD(S 100 ) 17 SD(S 1000 ) 54

Esim. Noppapeli 100 kierroksen tuotto on odotusarvoltaan µ 100 = 350 ja keskihajonnaltaan σ 100 17 0 100 200 300 400 0 20 40 60 80 100 Chebyshevin epäyhtälö: P(S 100 = 350 ± 34) 75% Noppapelin 100 pelikierroksen tuotto on siis melko todennäköisesti (tn 75%) välillä 316 384 EUR.

Esimerkki: Lentoyhtiö 300 lentolippua myydään lennolle, jossa on 290 matkustajapaikkaa. Arviolta 5% lipun ostaneista jää saapumatta lennolle, toisistaan riippumattomasti. Millä tn kaikki saapujat mahtuvat lennolle? Lennolle saapuvien lukumäärä on N = X 1 + + X 300, missä { 1, jos lentolipun i ostaja saapuu lennolle, X i = 0, muuten. Koska µ X = E(X i ) = 0.95 ja σ X = SD(X i ) = µ(1 µ) 0.22, saadaan µ N = µ X 300 = 285 ja σ N = σ X 300 3.8. Chebyshevin epäyhtälö P(N [280, 290]) P(N = µ N ± 1.32σ N ) 1 1 1.32 2 42.6%. takaa, että kaikki mahtuvat lennolle vähintään tn:llä 42.6%. (Tämä kuulostaa pessimistiseltä arviolta?)

Lentoyhtiö: Tarkka jakauma Millainen on lennolle saapuvien lukumäärän N tarkka jakauma? N = X 1 + + X 300 Satunnaismuuttujan N arvojoukko on {0, 1, 2,..., 300}. P(N = 0) = (1 0.95) 300 0.1 300 = 10 300 P(N = k) = ( 300 k ) (1 0.95) 300 k 0.95 k N noudattaa binomijakaumaa parametrein n = 300 ja p = 0.95. Pienet N:n arvot ovat (yli)tähtitieteellisen epätodennäköisiä R:llä saadaan tarkka arvo P(X 290) = pbinom(290,300,0.95) 93.5% ja P(X [280, 290]) = pbinom(290,300,0.95) - pbinom(279,300,0.95) 85.7%.

Lentoyhtiö: Simuloitu jakauma Simuloidaan N:n tavoin Bin(300, 0.95)-jakautuneita satunnaislukuja 10000 kappaletta ja piirretään histogrammi. 250 260 270 280 290 300

100 noppaa vs. 300 lentolippua Nopanheittojen summan ja saapuvien lentomatkustajien lukumäärän jakaumat ovat likimain samanmuotoiset: 280 300 320 340 360 380 400 420 270 275 280 285 290 295 300 100 riippumattoman nopanheiton summa 300 riippumattoman indikaattorimuuttujan summa Tämä ei ole sattumaa!

Sisältö Summan keskihajonta Normaaliapproksimaatio

Normaaliapproksimaatio Fakta (Keskeinen raja-arvolause) Jos X 1,..., X n ovat riippumattomia ja samoin jakautuneita satunnaislukuja odotusarvona µ ja keskihajontana σ, niin n i=1 X i µn σ n d Z noudattaa suurilla n likimain normitettua normaalijakaumaa P(Z z) = z 1 2π e t2 /2 dt. Huom Tämä on universaali luonnonlaki, sillä X i :n jakauman luonteesta (diskreetti/jatkuva, symmetrinen/vino) ei tarvitse olettaa mitään. de Moivre 1733, Laplace 1812, Lyapunov 1911, Lindeberg 1922, Turing 1934

Normaalijakauma Satunnaisluku Z noudattaa normaalijakaumaa odotusarvona µ ja keskihajontana σ, jos sillä on tiheysfunktio f (x) = 1 (x µ)2 e 2σ 2 2πσ 2 = dnorm(x,mu,sigma) f(x) Φ(x) -σ σ x -σ σ x Normitetun normaalijakauman (µ = 0 ja σ = 1) kertymäfunktio on Φ(z) = z 1 2π e x2 2 dx = pnorm(z)

Normaalijakauman normittaminen Fakta Jos X on normaalijakautunut odotusarvona µ X ja keskihajontana σ X, niin tällöin myös Y = a + bx on normaalijakautunut odotusarvona ja keskihajontana µ Y = E(a + bx ) = a + b E(X ) = a + bµ X σ Y = SD(a + bx ) = b SD(X ) = b σ X Seuraus Normitettu satunnaisluku Z = X µ X σ X noudattaa normitettua normaalijakaumaa (µ Z = 0 ja σ Z = 1).

Esimerkki: Älykkyysosamäärä Yhdeksäsluokkalaisten älykkyysosamäärä noudattaa likimain normaalijakaumaa (µ = 100, σ = 15). Millä tn satunnaisesti valitun yhdeksäsluokkalaisen älykkyysosamäärä on (a) yli 130? (b) välillä 85 115? P(X > 130) = ( X µ P > σ ) 130 100 15 = P(Z > 2) = P(Z 2) 2.3%. ( 85 100 P(85 X 115) = P X µ 15 σ R: pnorm(-2); 1-2*pnorm(-1) = P( 1 Z 1) = 1 P(Z > 1) P(Z < 1) = 1 2 P(Z 1) 68%. ) 115 100 15

Esimerkki: Älykkyysosamäärä Odotusarvo µ = 100, keskihajonta σ = 15 2% 14% 68% 14% 2% σ σ 40 55 70 85 100 115 130 145 160

Esimerkki: Noppapeli Millä tn 100 pelikierrokselta kertynyt tuotto on (a) välillä 316 384? (b) yli 500 EUR? 280 300 320 340 360 380 400 420 Yhden kierroksen tuoton odotusarvo µ X = 3.5 ja keskihajonta σ X 1.7. Normaaliapproksimaatio: S 100 350 17 P(316 S 100 384) = P = S 100 100µ X d Z. 100σX ( 2 S ) 100 350 2 17 P( 2 Z 2) = 1 2 P(Z 2) 95.4%. ( ) S100 350 P(S 100 > 500) = P > 8.82 17 P(Z > 8.82) = P(Z 8.82) 6 10 19.

Esimerkki: Lentoyhtiö Millä tn kaikki lipun ostaneet mahtuvat lennolle? (Myyty 300 lippua, lennolla 290 paikkaa.) 270 275 280 285 290 295 300 Lennolle saapuvien lukumäärä N = X 1 + + X 300. Indikaattorin X i odotusarvo µ X = 0.95 ja keskihajonta σ X = 0.22. Normaaliapproksimaatio: N 285 3.77 = N 300µ X d Z. 300σX ( ) N 285 P(N 290) = P(N 290.5) = P 1.46 3.77 P(Z 1.46) (Tarkka tn: pbinom(290,300,0.95) = 93.5%) = 1 P(Z 1.46) 92.8%.

Seuraavalla kerralla puhutaan empiiristä jakaumista...