031021P Tilastomatematiikka (5 op) viikot 5 6



Samankaltaiset tiedostot
031021P Tilastomatematiikka (5 op) viikko 3

Tilastomatematiikka Kevät 2008

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) viikko 2

Todennäköisyysjakaumia

Johdatus tn-laskentaan torstai

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

11 Raja-arvolauseita ja approksimaatioita

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Jatkuvat satunnaismuuttujat

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

3.6 Su-estimaattorien asymptotiikka

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen aineisto Luottamusväli

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

riippumattomia ja noudattavat samaa jakaumaa.

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Mat Sovellettu todennäköisyyslasku A

Todennäköisyyslaskun kertaus. Heliövaara 1

4. laskuharjoituskierros, vko 7, ratkaisut

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

Harjoitus 2: Matlab - Statistical Toolbox

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

031021P Tilastomatematiikka (5 op) viikko 7

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

30A02000 Tilastotieteen perusteet

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Sovellettu todennäköisyyslaskenta B

Talousmatematiikan perusteet: Luento 17. Integraalin sovelluksia kassavirta-analyysissa Integraalin sovelluksia todennäköisyyslaskennassa

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

ABHELSINKI UNIVERSITY OF TECHNOLOGY

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,

D ( ) E( ) E( ) 2.917

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

dx=5&uilang=fi&lang=fi&lvv=2014

6. laskuharjoitusten vastaukset (viikot 10 11)

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

V ar(m n ) = V ar(x i ).

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

3. laskuharjoituskierros, vko 6, ratkaisut

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

k S P[ X µ kσ] 1 k 2.

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

Mat Sovellettu todennäköisyyslasku A

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

5. laskuharjoituskierros, vko 8, ratkaisut

Mat Sovellettu todennäköisyyslasku 5. harjoitukset/ratkaisut. Jatkuvat jakaumat

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tutkimustiedonhallinnan peruskurssi

Poisson-prosessien ominaisuuksia ja esimerkkilaskuja

Todennäköisyyslaskenta sivuaineopiskelijoille

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastomatematiikka. Jukka Kemppainen Oulun yliopisto Tekniikan matematiikka

Todennäköisyyden ominaisuuksia

Sovellettu todennäköisyyslaskenta B

Tilastomatematiikka. Keijo Ruotsalainen University of Oulu, Faculty of Technology Division of Mathematics

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

DISKREETIT JAKAUMAT Generoiva funktio (z-muunnos)

Ilkka Mellin (2008) 1/5

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Tilastomatematiikka Kevät 2008

Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio

Mat Sovellettu todennäköisyyslasku A

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Satunnaismuuttujien muunnokset ja niiden jakaumat

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

Sovellettu todennäköisyyslaskenta B

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

031021P Tilastomatematiikka (5 op) viikko 4

Tilastollisia peruskäsitteitä ja Monte Carlo

8.1 Ehdolliset jakaumat

4.0.2 Kuinka hyvä ennuste on?

Sovellettu todennäköisyyslaskenta B

Transkriptio:

031021P Tilastomatematiikka (5 op) viikot 5 6 Jukka Kemppainen Mathematics Division

Jakauman tunnusluvut Jakauman tärkeimmät tunnusluvut ovat odotusarvo ja varianssi. Odotusarvo ilmoittaa jakauman keskikohdan eli arvon, jonka satunnaismuuttuja keskimääräisesti saavuttaa. Varianssi ilmoittaa, kuinka paljon satunnaismuuttujan arvot keskimäärin poikkeavat odotusarvosta. Muita tunnuslukuja ovat mm. Jakauman momentit, eli satunnaismuuttujan sopivien potenssien odotusarvot; Jakauman vinous; Kvartiilit; Keskipoikkeama... Jukka Kemppainen Mathematics Division 2 / 53

Odotusarvo Tarkastellaan odotusarvon määrittelyä erikseen diskreetin ja jatkuvan sm:n tapauksessa. Aloitetaan diskreetistä sm:stä. Määr. 20 Jos X on diskreetti satunnaismuuttuja, jonka arvojoukko on S X = {x 1,x 2,...}, niin lukua E(X) = x k P(X = x k ) k=1 sanotaan X:n odotusarvoksi edellyttäen, että sarja suppenee. Jukka Kemppainen Mathematics Division 3 / 53

Odotusarvo Määr. 21 Jos X on jatkuva satunnaismuuttuja, jonka tiheysfunktio on f X, niin lukua E(X) = xf X (x)dx sanotaan X:n odotusarvoksi edellyttäen, että integraali suppenee. Odotusarvolle käytetään usein merkintää E(X) = µ X tai yksinkertaisesti µ = µ X, jos sekaannuksen vaaraa ei ole. Huomautus 4 Erityisesti, jos diskreetti sm. saa vain äärellisen määrän arvoja, odotusarvo on aina olemassa. Kaikilla satunnaismuuttujilla ei ole odotusarvoa. Jukka Kemppainen Mathematics Division 4 / 53

Esimerkki Esim. 39 Milloin satunnaismuuttujalla X, jonka pistetodennäköisyysfunktio on muotoa P(X = k) = c 1 k p, k = 1,2,...; tiheysfunktio on f(x) = c 1 (1+x 2 ) p, x R, on odotusarvo? Jukka Kemppainen Mathematics Division 5 / 53

Diskreettien jakaumien odotusarvoja (1/2) Binomijakauman, X Bin(n, p), odotusarvo on E(X) = np. Geometrisen jakauman, X Geo(p), odotusarvo on E(X) = 1 p. Poissonin jakauman, X Poi(a), odotusarvo on E(X) = a. Jukka Kemppainen Mathematics Division 6 / 53

Diskreettien jakaumien odotusarvoja (2/2) Laskentakaavojen intuitiivinen perustelu: Binomijakaumalle E(X) = np, sillä yksittäisessä toistossa onnistumisen tn. on p, joten pitkässä juoksussa onnistumisten lkm. on np. Geometriselle jakaumalle E(X) = 1 p, sillä pitkässä juoksussa keskimääräinen onnistumisten lkm. per yritysten lkm. on p, joten keskimääräinen yritysten lkm. per onnistuminen on 1/p. Poissonin jakaumalle E(X) = a on selvä, jos Poissonin jakauma ajatellaan binomijakauman raja-jakaumana. Jukka Kemppainen Mathematics Division 7 / 53

Kuvia Kuvissa on esitetty sm:ien X Bin(50, 0.2) ja X Poi(5) pistetodennäköisyysfunktiot ja merkitty odotusarvo. Kuva : X Bin(50, 0.2) ja E(X) = 10 Kuva : X Poi(5) ja E(X) = 5 Jukka Kemppainen Mathematics Division 8 / 53

Jatkuvien jakaumien odotusarvoja Tasajakauman, X Tas(a,b), odotusarvo on E(X) = a+b 2. Eksponenttijakauman, X Exp(λ), odotusarvo on E(X) = 1 λ. Normaalijakauman, X N(µ,σ 2 ), odotusarvo on E(X) = µ. Weibullin jakauman, X Wei(α, β), odotusarvo on missä E(X) = α 1/β Γ(1+1/β), α,β > 0, Γ(x) = on Eulerin Gamma-funktio. 0 t x 1 e t dt, x > 0, Jukka Kemppainen Mathematics Division 9 / 53

Kuvia Kuvissa on esitetty sm:ien X N(100,25) ja X Exp( 1 2 ) tiheysfunktiot ja merkitty odotusarvo. Kuva : X N(100, 25) ja E(X) = 100 Kuva : X Exp( 1 2 ) ja E(X) = 2 Jukka Kemppainen Mathematics Division 10 / 53

Esimerkkejä Esim. 40 Heitetään kolikkoa 3 kertaa. Olkoon X kruunujen lukumäärä. Laske odotusarvo E(X). Esim. 41 Jatkuvan satunnaismuuttujan X tiheysfunktio on x, 0 x < 1, f X (x) = 2 x, 1 x 2, 0, muulloin. Laske X:n odotusarvo. Jukka Kemppainen Mathematics Division 11 / 53

Esimerkkejä Esim. 42 Teräväpiirtotelevisiota (HDTV) on lyhyessä ajassa myyty 30000 kappaletta. Jokaisessa näistä on yksi kappale komponenttia A, jonka kestoikä on eksponenttijakautunut odotusarvona 4 vuotta. Millä todennäköisyydellä komponentti A kestää ainakin vuoden? HDTV:n takuu on vuoden. Kuinka monen HDTV:n komponentti A joudutaan keskimäärin vaihtamaan takuun puitteissa? Komponentti on halpa (3 euroa), mutta sen uusimiseen liittyvä asennuskulu on 55 euroa. Kuinka paljon kuluja on odotettavissa takuuna uusittavista komponenteista ja niiden asennuksista? Jukka Kemppainen Mathematics Division 12 / 53

Muunnoksen Y = h(x) odotusarvo Sovelluksissa joudutaan usein tarkastelemaan satunnaismuuttujien muunnoksia. Oletetaan, että X on satunnaismuuttuja ja h : R R sellainen funktio, että Y = h(x) on satunnaismuuttuja (vrt. Lause 7, s.17). Jos X on diskreetti sm., saadaan Lause 11 Muunnoksen Y = h(x) odotusarvo on E(Y) = E(h(X)) = i:x i S X h(x i )P(X = x i ) edellyttäen, että sarja suppenee itseisesti, eli i:x i S X h(x i ) P(X = x i ) <. Jukka Kemppainen Mathematics Division 13 / 53

Muunnoksen odotusarvo Jos taasen X on jatkuva satunnaismuuttuja, jonka tiheysfunktio on f X, saadaan Lause 12 Muunnoksen Y = h(x) odotusarvo on E(Y) = E(h(X)) = h(x)f X (x)dx edellyttäen, että integraali suppenee itseisesti, eli h(x) f X (x)dx <. Jukka Kemppainen Mathematics Division 14 / 53

Esimerkkejä Esim. 43 Olkoon Θ välille ] π 2, π 2 [ tasajakautunut kulma ja Y = tan(θ). Määrää (mikäli mahdollista) Y :n odotusarvo. Jukka Kemppainen Mathematics Division 15 / 53

Esimerkkejä Esim. 44 Oletetaan, että tuotteen laatutappio on ke((x m) 2 ), missä k on verrannollisuuskerroin ja m suureen X tavoitearvo tuotannossa. Olkoon laitteen kulutuskesto X (kk) Weibull-jakautunut parametrien arvoilla α = 0,40 ja β = 1 2. Laitteen tuottaja tavoitteli tuotteelleen 100 kk:n kulutuskestoa. Mikä oli tuotteen kulutuskeston laatutappio, kun verrannollisuuskerroin oli k = 0,1? Tuottaja pyrki säätämään tuotantoaan siten, että parametrin β arvo pysyi kiinteänä ja parametrin α arvo muuttui. Millä α:n arvolla kulutuskeston tavoitearvo ja odotusarvo ovat yhtä suuret? (E(X) = α β( 1 1 β )! ja E(X 2 ) = α β( 2 2 β )!, kun 1 β N.) Jukka Kemppainen Mathematics Division 16 / 53

Varianssi Tarkastellaan varianssin määrittelyä erikseen diskreetin ja jatkuvan sm:n tapauksessa. Aloitetaan diskreetistä sm:stä. Määr. 22 Jos X on diskreetti satunnaismuuttuja, jonka arvojoukko on S X = {1,2,...} ja odotusarvo µ X, niin lukua D 2 (X) = k:x k S X (x k µ X ) 2 P(X = x k ) sanotaan X:n varianssiksi ja merkitään D 2 (X) = Var(X) = σ 2 X edellyttäen, että sarja suppenee. Jukka Kemppainen Mathematics Division 17 / 53

Varianssi Vastaavasti jatkuvan sm:n tapauksessa määritellään Määr. 23 Jos X on jatkuva satunnaismuuttuja, jonka tiheysfunktio on f X ja odotusarvo µ X, niin lukua D 2 (X) = (x µ X ) 2 f X (x)dx sanotaan X:n varianssiksi ja merkitään D 2 (X) = Var(X) = σ 2 X edellyttäen, että integraali suppenee. Lukua σ X = Var(X) sanotaan satunnaismuuttujan X keskihajonnaksi. Jukka Kemppainen Mathematics Division 18 / 53

Varianssi Jos katsotaan varianssin määritelmää ja verrataan sitä muunnoksen h(x) = (X µ X ) 2 odotusarvoon, niin havaitaan, että itse asiassa varianssi on muunnoksen h(x) odotusarvo ja siten Var(X) = E((X E(X)) 2 ). Edellisestä yhtäsuuruudesta saadaan varianssille seuraava hyödyllinen laskentakaava Lause 13 Olkoon X satunnaismuuttuja, jolla on varianssi. Tällöin Var(X) = E(X 2 ) E(X) 2. Jukka Kemppainen Mathematics Division 19 / 53

Esimerkki Esim. 45 Oletetaan, että X N(0,1). Tällöin Y = e X noudattaa ns. log-normaalijakaumaa. Määrää Y :n odotusarvo ja varianssi. Jukka Kemppainen Mathematics Division 20 / 53

Diskreettien jakaumien variansseja Binomijakauman, X Bin(n, p), varianssi on Var(X) = np(1 p). Geometrisen jakauman, X Geo(p), varianssi on Var(X) = 1 p p 2. Poissonin jakauman, X Poi(a), varianssi on Var(X) = a. Jukka Kemppainen Mathematics Division 21 / 53

Jatkuvien jakaumien variansseja Tasajakauman, X Tas(a,b), varianssi on Var(X) = (b a)2 12. Eksponenttijakauman, X Exp(a), varianssi on Var(X) = 1 a 2. Normaalijakauman, X N(µ,σ 2 ), varianssi on Var(X) = σ 2. Weibullin jakauman, X Wei(α, β), varianssi on Var(X) = α 2/β (Γ(1+2/β) Γ(1+1/β) 2 ). Jukka Kemppainen Mathematics Division 22 / 53

Odotusarvon ja varianssin ominaisuuksia Lause 14 Jos sm. X on todennäköisyydellä yksi vakio a, ts. P(X = a) = 1, niin E(X) = a ja Var(X) = 0. Kääntäen, jos Var(X) = 0, niin P(X = a) = 1 jollekin a R. Lause 15 Jos X ja Y ovat satunnaismuuttujia ja a, b R, niin E(aX + by) =ae(x)+be(y), Var(aX + by) =a 2 Var(X)+b 2 Var(Y) + 2abE((X E(X))(Y E(Y))) edellyttäen, että em. suureet ovat äärellisiä. Jukka Kemppainen Mathematics Division 23 / 53

Ominaisuuksia Lause 16 Jos X ja Y ovat riippumattomia, niin E(XY) = E(X)E(Y), Var(aX + by) = a 2 Var(X)+b 2 Var(Y) edellyttäen, että em. suureet ovat äärellisiä. Edellinen tulos pätee myös n:n riippumattoman sm:n tapauksessa. Korollaari 2 Jos X 1,...,X n ovat riippumattomia satunnaismuuttujia, joilla on odotusarvo ja varianssi, ja a 1,...,a n R, niin E(X 1 X n ) = E(X 1 ) E(X n ), Var(a 1 X 1 + +a n X n ) = a 2 1 Var(X 1)+ +a 2 n Var(X n). Jukka Kemppainen Mathematics Division 24 / 53

Esimerkkejä Esim. 46 Olkoon X N(µ,σ 2 ). Laske standardisoidun satunnaismuuttujan Z = X µ σ odotusarvo ja varianssi. Esim. 47 Kytketään 100 sähkövastusta yhteen. Jokaisen vastuksen resistanssi on tasaisesti jakautunut 90 Ω ja 110 Ω välille. Oletetaan, että sähkövastukset ovat toisistaan riippumattomia. Määrää systeemin (a) kokonaisresistanssin odotusarvo ja varianssi, kun vastukset on kytketty sarjaan. (b) kokonaisresistanssin käänteisluvun odotusarvo ja varianssi, kun vastukset on kytketty rinnan. Jukka Kemppainen Mathematics Division 25 / 53

Todennäköisyyslaskennan raja-arvolauseita Tilastollisessa tutkimuksessa tehdään aineistojen pohjalta päätelmiä tutkittavasta ilmiöstä. Tehtäessä ilmiöstä riippumattomia havaintoja, on toivottavaa, että havaintojen lukumäärän kasvaessa saadaan yhä varmemmin oikea kuva todellisuudesta. Todennäköisyyslaskennan raja-arvolauseet luovat perustan todennäköisyyslaskennan tilastollisille sovelluksille. Jukka Kemppainen Mathematics Division 26 / 53

Esimerkki Esim. 48 Olkoot X 1,X 2,...,X n riippumattomia satunnaismuuttujia, joille E(X i ) = µ ja D 2 (X i ) = σ 2 kaikilla i = 1,...,n. Laske aritmeettisen keskiarvon n X = 1 n i=1 X i odotusarvo ja varianssi. Jukka Kemppainen Mathematics Division 27 / 53

Tn-laskennan raja-arvolauseita Edellisen esimerkin mukaan tehtäessä satunnaismuuttujasta X riippumattomia havaintoja x 1,...,x n keskittyy havaintojen aritmeettinen keskiarvo x = 1 n n i=1 x i yhä varmemmin satunnaismuuttujan X odotusarvon ympäristöön, sillä E(X) = µ ja D 2 (X) 0, kun n. Huomaa, että havaintojen aritmeettinen keskiarvo x on sm:n X saama arvo. Keskiarvot 1 n n i=1 X i muodostavat satunnaismuuttujajonon, joka tietyllä tavalla suppenee kohti odotusarvoa µ. Tarkastellaan seuraavaksi satunnaismuuttujajonon suppenemisen muotoja. Jukka Kemppainen Mathematics Division 28 / 53

Satunnaismuuttujajonon suppeneminen Satunnaismuuttujajonon X 1,X 2,... suppenemista on mahdollista luonnehtia eri tavoin. Tällä kurssilla tarkastellaan seuraavia suppenemisen muotoja: Jakaumasuppeneminen Jono X 1,X 2,... suppenee jakaumaltaan kohti satunnaismuuttujaa X, jos kertymäfunktioiden jono F n suppenee kohti rajajakauman kertymäfunktiota F X jokaisessa F:n jatkuvuuspisteessä. Stokastinen suppeneminen tarkoittaa sitä, että poikkeama rajamuuttujasta X on mielivaltaisen pieni suurella todennäköisyydellä, eli kaikilla ǫ > 0 lim P( X n X < ǫ) = 1. n Jukka Kemppainen Mathematics Division 29 / 53

Satunnaismuuttujajonon suppeneminen Melkein varma suppeneminen tarkoittaa sitä, että jono X 1,X 2,... suppenee todennäköisyydellä yksi kohti rajamuuttujaa X, eli P( lim n X n = X) = 1. Voidaan osoittaa, että melkein varma suppeneminen on vahvin suppenemisen muoto ja jakaumasuppeneminen taasen heikoin muoto, eli suppenemiselle pätee Melkein varmasti Stokastisesti Jakaumaltaan. Jukka Kemppainen Mathematics Division 30 / 53

Chebyshevin epäyhtälö Lause 17 (Chebyshevin epäyhtälö) Olkoon X satunnaismuuttuja, jolla on odotusarvo µ ja varianssi σ 2. Tällöin kaikilla ǫ > 0 pätee P( X µ ǫ) σ2 ǫ 2. Chebyshevin epäyhtälöllä voidaan aina arvioida kuinka paljon satunnaismuuttuja poikkeaa odotusarvostaan. Arvio on tosi karkea ja se riippuu varianssin suuruudesta. Jukka Kemppainen Mathematics Division 31 / 53

Esimerkki Esim. 49 Olkoon X N(0, 1). Laske todennäköisyyksille P( X 1), P( X 2) ja P( X 3) (a) arvio Chebychevin epäyhtälön avulla. (b) tarkka arvo. Jukka Kemppainen Mathematics Division 32 / 53

Heikko suurten lukujen laki Lause 18 (Chebyshev) Olkoon X 1,X 2,... jono parittain riippumattomia, samalla tavalla jakautuneita sm:ia, joilla on odotusarvo E(X i ) = µ ja varianssi D 2 (X i ) = σ 2. Olkoon X (n) = 1 n n i=1 X i satunnaismuuttujien X 1,X 2,...,X n aritmeettinen keskiarvo. Tällöin P( X (n) µ ǫ) 0, kun n kaikilla ǫ > 0. Jukka Kemppainen Mathematics Division 33 / 53

Tulkinta Heikko suurten lukujen laki tarkoittaa seuraavaa: Satunnaismuuttujien X 1,...,X n aritmeettinen keskiarvo suppenee stokastisesti kohti odotusarvoa µ. Jos X 1,...,X n ovat riippumattomia havaintoja samasta satunnaismuuttujasta X, jonka odotusarvo on µ ja varianssi σ 2, niin havaintojen lukumäärän kasvaessa havaintojen aritmeettinen keskiarvo (otoskeskiarvo) yhä varmemmin ilmoittaa todellisen odotusarvon. Otoskeskiarvolla voidaan siis estimoida odotusarvoa, kun havaintojen lukumäärä on riittävän suuri. Jukka Kemppainen Mathematics Division 34 / 53

Kuvia Kuvissa on esitetty riippumattomien normaalijakautuneiden sm:ien X i N(0,1) aritmeettisen keskiarvon X (n) tiheysfunktioita. Kun ǫ = 0.01, niin Lauseen 18 tn:ksi saadaan P( X (103 ) ǫ) 0.75 ja P( X (10 6 ) ǫ) 7.6 10 24. Jukka Kemppainen Mathematics Division 35 / 53

Vahva suurten lukujen laki Lause 19 (Kolmogorov) Olkoon X 1,X 2,... jono parittain riippumattomia, samalla tavalla jakautuneita satunnaismuuttujia, joilla on odotusarvo E(X i ) = µ. Tällöin P( lim n X(n) = µ) = 1. Vahva suurten lukujen laki siis sanoo, että parittain riippumattomien, samalla tavalla jakautuneiden satunnaismuuttujien X 1,...,X n aritmeettinen keskiarvo suppenee melkein varmasti kohti odotusarvoa µ. Jukka Kemppainen Mathematics Division 36 / 53

Esimerkki Esim. 50 Pelatessa ruletissa väriä (musta tai punainen) yhden euron panoksella on voittosumman odotusarvo 1 37 euroa. Mitä suurten lukujen laki sanoo voittosummasta, jos peliä pelataan erittäin monta kertaa yhden euron panoksella? Takaako laki, että sinun tappiot ovat pieniä? Entäpä takaako laki, että suurella pelien määrällä häviät? Jukka Kemppainen Mathematics Division 37 / 53

Keskeinen raja-arvolause Suurten lukujen laeilla on lähinnä kvalitatiivinen merkitys satunnaismuuttujien aritmeettisen keskiarvon käyttäytymisestä n:n kasvaessa. Todennäköisyyksien kvantitatiiviseen laskemiseen tarvitaan tarkempaa tietoa aritmeettisen keskiarvon jakauman käyttäytymisestä. Tämän ilmoittaa keskeinen raja-arvolause. Lause 20 (Keskeinen raja-arvolause) Olkoon X 1,X 2,... jono keskinäisesti riippumattomia, samalla tavalla jakautuneita sm:ia, joilla E(e tx i) on olemassa, kun t < δ jollakin δ > 0. Merkitään E(X i ) = µ, D 2 (X i ) = σ 2 ja S n = n i=1 X i. Tällöin ( lim P Sn E(S n ) ) x = Φ(x) = 1 x e u2 2 du. n σ Sn 2π Jukka Kemppainen Mathematics Division 38 / 53

Keskeinen raja-arvolause Keskeisessä raja-arvolauseessa esiintyvä suure voidaan kirjoittaa muodossa S S n E(S n ) n = n µ. σ Sn σ n Siis riittävän suurilla n:n arvoilla keskiarvo X = 1 n S n noudattaa likimain normaalijakaumaa, eli 1 n n i=1 X i N(µ, σ2 n ) likimain, kun n on riittävän suuri. Summan todennäköisyyden arvioimista normaalijakaumalla sanotaan normaalijakauma-approksimaatioksi. Jukka Kemppainen Mathematics Division 39 / 53

Huomioita Joskus n = 3 on riittävä otoksen koko; Joskus n = 100000 ei riitä; Pääsääntöisesti (ainakin tällä kurssilla) approksimaatio on pätevä, kun n 30. Huomautus 5 Keskeisen raja-arvolauseen todisti vuonna 1901 venäläinen A.N. Lyapunov hieman yleisemmillä oletuksilla. Satunnaismuuttujien ei esimerkiksi tarvitse olla samalla tavalla jakautuneita. Jukka Kemppainen Mathematics Division 40 / 53

Kuvia Kuvissa on esitetty jakaumien S n = n i=1 X i ja X N(E(S n ),σs 2 n ) pistetodennäköisyydet ja tiheysfunktio, kun n = 50 ja Kuva : S n Bin(n, 0.2) Kuva : X i Poi(1) Jukka Kemppainen Mathematics Division 41 / 53

Kuvia Kuvissa on esitetty jakauman S n = n i=1 X i kertymäfunktio kokonaislukupisteissä ja ja jakauman X N(E(S n ),σs 2 n ) kertymäfunktio, kun n = 50 ja Kuva : S n Bin(n, 0.2) Kuva : X i Poi(1) Jukka Kemppainen Mathematics Division 42 / 53

Kuvia Kuvissa on esitetty jakaumien S n = n i=1 X i ja X N(E(S n ),σs 2 n ) tiheysfunktiot (tf:t) ja kertymäfunktiot (kf:t), kun n = 3 ja X i Tas(0,1). Kuva : Tf:t f Sn ja f X Kuva : Kf:t F Sn ja F X Jukka Kemppainen Mathematics Division 43 / 53

Kuvia Kuvissa on esitetty jakaumien S n = n i=1 X i ja X N(E(S n ),σs 2 n ) tiheysfunktiot (tf:t) ja kertymäfunktiot (kf:t), kun n = 10 ja X i Exp(1). Kuva : Tf:t f Sn ja f X Kuva : Kf:t F Sn ja F X Jukka Kemppainen Mathematics Division 44 / 53

Esimerkkejä Esim. 51 Olkoon Y n erään osakkeen hinta vuoden n. päivänä. Oletetaan, että erotukset X n = Y n+1 Y n ovat riippumattomia, normaalijakautuneita satunnaismuuttujia, joilla on sama odotusarvo µ = 0 ja varianssi σ 2 = 1 4. Jos Y 1 = 100, niin laske todennäköisyys, että vuoden lopussa osakkeen hinta on (a) 100. (b) 110. (c) 120. Jukka Kemppainen Mathematics Division 45 / 53

Esimerkin 51 realisaatioita Kuvissa on esitetty 2 eri realisaatiota esimerkin 51 osakkeen hinnalle. Jukka Kemppainen Mathematics Division 46 / 53

Esimerkkejä Esim. 52 Keskeinen raja-arvolause ei päde kaikille riippumattomille jonoille X 1,X 2,... Osoita, että jos X k Poi( 1 ) kaikilla k = 1,2,..., 2 k niin muuttuja S n E(S n ) σ Sn ei lähesty N(0,1)-jakaumaa. Esim. 53 Oletetaan, että elektronisen komponentin elinikä on sm., jonka odotusarvo on µ = a ja keskihajonta σ = a. Kuinka monta komponenttia tarvitaan, jotta niiden yhteenlaskettu elinikä olisi korkeintaan 8a enintään tn:llä 0,05? Jukka Kemppainen Mathematics Division 47 / 53

Binomijakauman normaalijakauma-approksimaatio Tarkastellaan n-kertaista toistokoetta X 1,...,X n, jossa X i ilmoittaa tapahtuuko jokin suotuisa tapahtuma A vai ei Oletetaan, että tapahtuma A sattuu yksittäisissä toistoissa muista toistoista riippumattomasti ja että P(X i = 1) = P(A) = P( A sattuu ) = p ja P(X i = 0) = P(A) = 1 p kaikilla i = 1,...,n. Tällöin S n = X 1 + X 2 + +X n ilmoittaa A:n esiintymiskertojen lukumäärän ja S n Bin(n,p). Koska E(S n ) = np ja D 2 (S n ) = np(1 p), niin keskeisen raja-arvolauseen mukaan S n N(np,np(1 p)) likimain, kun n on riittävän suuri. Jukka Kemppainen Mathematics Division 48 / 53

Binomijakauman approksimaatio Siis binomijakaumaa Bin(n, p) voidaan approksimoida normaalijakaumalla N(np, np(1 p)), kun n on riittävän suuri. Approksimaation tarkkuutta on tutkittu ja todettu, että approksimaatio on erityisen hyvä silloin, kun p 1 2. Luvun n pitäisi olla niin suuri, että varianssi np(1 p) > 9, jolloin käytännössä saadaan riittävän hyviä approksimaatioita. Jukka Kemppainen Mathematics Division 49 / 53

Approksimaatio, p:n vaikutus Kuviin on piirretty binomijakauman X Bin(20, p) pistetodennäköisyyksiä ja normaalijakauman N(20p,( 20p(1 p)) 2 ) tiheysfunktio, kun Kuva : p = 0.1 Kuva : p = 0.5 Jukka Kemppainen Mathematics Division 50 / 53

Approksimaatio, n:n vaikutus Kuviin on piirretty binomijakauman X Bin(n, 0.05) pistetodennäköisyyksiä ja normaalijakauman N(0.05n,( 0.05 0.95n) 2 ) tiheysfunktio, kun Kuva : n = 20 Kuva : n = 1000 Jukka Kemppainen Mathematics Division 51 / 53

Jatkuvuuskorjaus Diskreettejä jakaumia approksimoitaessa voidaan tarkkuutta parantaa tekemällä jatkuvuuskorjaus. Jos a ja b ovat kokonaislukuja, joille 0 a b n, ja X on diskreetti sm., joka saa kokonaislukuarvot 0,1,...,n, niin tn:ää P(a X b) ei approksimoida integraalina a:sta b:hen, vaan integraalina a 1 2 :sta b+ 1 2 :een. Siis P(a X b) = P(a 1 2 X b+ 1 2 ) ( a 1 2 = P E(X) σ X X E(X) σ X ( b+ 1 2 Φ E(X) ) ( a 1 Φ σ X b+ 1 2 E(X) ) σ X 2 E(X) ). σ X Jukka Kemppainen Mathematics Division 52 / 53

Esimerkkejä Esim. 54 Eräästä tuotteesta 10 % on viallisia. Jos ostetaan 10 tuotetta, niin millä tn:llä saadaan korkeintaan yksi viallinen tuote, kun tn. lasketaan tarkasti? normaalijakauma-approksimaatiolla jatkuvuuskorjauksella ja ilman? Poisson-jakauman avulla? Esim. 55 Heitetään noppaa 20 kertaa. Millä todennäköisyydellä pistelukujen summa on vähintään 60 ja korkeintaan 80? Jukka Kemppainen Mathematics Division 53 / 53