8.9.26 Kimmo Vattulainen Todennäköisyysjakaumia Seuraavassa esitellään kurssilla MAT-25 Todennäköisyyslaskenta esille tulleita diskreettejä todennäköisyysjakaumia Diskreetti tasajakauma Bernoullijakauma Binomijakauma Geometrinen jakauma Poisson jakauma Hypergeometrinen jakauma ja jatkuvia jakaumia Tasainen jakauma Eksponenttijakauma Normaalijakauma χ 2 -jakauma t-jakauma Jakaumien kuvat on piirretty MAPLElla. Voit esimerkkejä muuntamalla piirtää jakaumia eri parametrien arvoilla. jakaumista ja niiden parametreista MAPLEssa?stats,distributions. Esimerkiksi normaalijakauma N(,1) saadaan: > with(stats[statevalf]): with(stats[random]): > plot(pdf[normald[,1]], -3..3); ja poisson jakauma Poi(3) (piirretään pylväitä pisteestä [n,] pisteeseen [n, pf[poisson[3]] ja muuttujan $n arvot määräävät ne x:n arvot, joilla pylväs piirretään) > l := [ [ [n,], [n, pf[poisson[3]](n) ] ] $n=..1 ]: > plot(l, x=..1, color=black, thickness=6);
Diskreetti tasajakauma Tasd(a,b), Unifd(a,b), discrete uniform distribution f(x) = 1, x = a, a + 1, a + 2,..., b b a + 1 E(x) = a + b 2, var(x) = (b a + 1)2 1 12 Klassisen todennäköisyyden peruslähtökohta: symmetristen alkeistapausten todennäköisyydet noudattavat diskreettiä tasajakaumaa. Nopanheiton tulos, rahanheitto. Tasd(,1)=Ber(.5). n kuvaaja.17 Tasd(2,7) 234567
Bernoullijakauma Ber(p), Bernoulli distribution f(x) = p x (1 p) 1 x, x =, 1 E(x) = p, var(x) = p(1 p) Satunnaismuuttujalla vain kaksi mahdollisuutta (koodattu ja 1). Tapauksen x = 1 todennäköisyys = p. Riippumatta satunnaismuuttujasta tapaus x = 1 on nimetty usein onnistumiseksi (success) ja tapaus x = on epäonnistuminen (failure). Esim. syntyvän lapsen sukupuoli (=tyttö, 1=poika), tentissä onnistuminen. Bernoullikokeella tarkoitetaan juuri bernoullijakaumaa noudattavan satunnaismuuttujan koetta. Kokeiden tulosten oletetaan olevan riippumattomia. Tasd(,1) = Ber(.5), Ber(p) = Bin(1,p). n kuvaaja.7.3 Ber(.3) 1
Binomijakauma Bin(n,p), binomial distribution f(x) = ( ) n p x (1 p) n x, x =, 1, 2,..., n x E(x) = np, var(x) = np(1 p) Onnistumisten (todennäköisyys = p) lukumäärä n:ssä bernoullikokeessa esim. kuinka monta klaavaa 5:ssä rahanheitossa. Jos x 1 Bin(n, p) ja x 2 Bin(m, p) ovat riippumattomia, niin x 1 + x 2 Bin(n + m, p). Ber(p) = Bin(1,p). Bin(n,p) Poi(np), kun n on suuri, p on pieni ja np<<n. Bin(n,p) N(np,np(1-p)), kun np 5 ja n(1-p) 5. n kuvaajia Bin(5,.3) Bin(7,.8).3.2.1.3.2.1 1 2 3 4 5 1 2 3 4 5 6 7
Geometrinen jakauma Geom(p), Geo(p), geometric distribution f(x) = p(1 p) x 1, x = 1, 2,... E(x) = 1 p, var(x) = 1 p p 2 Todennäköisyys, että 'onnistuminen' toistetussa bernoullikokeessa tapahtuu x.:llä kerralla. Parametri p on 'onnistumisen' todennäköisyys yksittäisessä kokeessa, esimerkiksi millä todennäköisyydellä rahanheitossa saadaan ensimmäinen klaava viidennellä heitolla. n kuvaaja.4 Geom(.4).2 4 8
Poisson jakauma Poi(λ), poisson distribution f(x) = λx x! e λ, x =, 1, 2,... E(x) = λ, var(x) = λ Harvinaisten tapahtumien todennäköisyysjakauma. Jos suoritetaan suuri määrä (n) bernoullikokeita, joissa onnistumisen todennäköisyys (p) on pieni, onnistumisten määrä noudattaa likimain Poisson jakaumaa ja parametri λ np. Poissonin prosessin oletukset (luentomoniste s.22) täyttävässä prosessissa onnistumisten lukumäärä noudattaa likimäärin Poissonin jakaumaa. Jos x 1 P oi(λ 1 ) ja x 2 P oi(λ 2 ) ovat riippumattomia, niin x 1 +x 2 P oi(λ 1 +λ 2 ). Bin(n,p) Poi(np), kun n on suuri, p on pieni ja np<<n. n kuvaaja.2.1 Poi(3) 4 8
Hypergeometrinen jakauma Hyperg(N,m,n), hypergeometric distribution ( m N m ) f(x) = x)( n x ( N, max{, n (N m)} x min{n, m}, x Z n) E(x) = nm N, var(x) = nm(n m)(n n) N 3 N Joukossa on N alkiota, joista m:llä on ominaisuus A ja lopuilla ei ole. Poimitaan palauttamatta n alkion otos. Kun x='niiden alkioiden lukumäärä otoksessa, joilla on ominaisuus A', niin x Hyperg(N,m,n). Kun otoskoko n on pieni verrattuna kaikkien alkioiden lukumäärään N, palauttamatta suoritettu otanta palauttaen suoritettu otanta. Siksi hypergeometrista jakaumaa voidaan approksimoida binomijakaumalla: Hyperg(N,m,n) Bin(n, m/n), kun n N/1 n kuvaajia Hyperg(1,4,4).4.2 1 2 3 4.4.2 Hyperg(12,9,6) 1 2 3 4 5 6
Jatkuva tasainen jakauma Tas(a,b), Unif(a,b), U(a,b), (continuous) uniform distribution f(x) = 1 b a, a x b E(x) = a + b (b a)2, var(x) = 2 12 Monissa tietokoneohjelmissa satunnaisluvun (random number) käsite on luku x T as(, 1). Muiden jatkuvien satunnaislukujen generoinnin perusta algoritmeissa. n kuvaaja.2 Tas(2,7) 1234567
Eksponenttijakauma Exp(λ), exponential distribution f(x) = λe λx, x, λ > E(x) = 1 λ, var(x) = 1 λ 2 Satunnaismuuttujalla 'unohtuvaisuusominaisuus' P (x > x 1 + x 2 x > x 1 ) = P (x > x 2 ) Elektronisen komponentin ikä n kuvaajia Exp(.5) Exp(1).4.8.2.4 3 6 9 12 3 6 9 12
Normaalijakauma N(µ, σ 2 ), Norm(µ, σ 2 ), normal distribution, Gaussian distribution f(x) = 1 σ 2π e 1 2( x µ σ ) 2, x R, µ R, σ > E(x) = µ, var(x) = σ 2 Jos x N(µ, σ 2 ), niin ax + b N(aµ + b, a 2 σ 2 ), a, b R Jos x 1 N(µ 1, σ 2 1) ja x 2 N(µ 2, σ 2 2), niin x 1 + x 2 N(µ 1 + µ 2, σ 2 1 + σ 2 2). Keskeisen raja-arvolauseen perusteella usean satunnaismuuttujan summa ja siis myös otoskeskiarvo on likimain normaalisti jakautunut riippumatta alkuperäisten satunnaismuuttujien jakaumista. Bin(n,p) N(np,np(1-p)), kun np 5 ja n(1-p) 5. Jos z i N(, 1) ja ovat riippumattomia, niin n i=1 z2 i χ2 (n) n kuvaajia Norm(,1).4.2 Norm(2,9).1 3 2 1 1 2 3 7 4 1 2 5 8 11
χ 2 -jakauma χ 2 (n), χ 2 (df), Khii toiseen-jakauma, chi-square distribution f(x) = 1 2 n/2 Γ(n/2) x(n/2) 1 e x/2, x >, n Z + missä Γ on Eulerin gammafunktio Γ(t) = e x x t 1 dx E(x) = n, var(x) = 2n Nimitys: muuttuja on χ 2 -jakautunut vapausastein n (degrees on freedom, df). Jos x 1, x 2,..., x n ovat riippumattomia ja x i N(µ, σ 2 ), niin (n 1)s 2 σ 2 χ 2 (n 1) Jos z i N(, 1) ja ovat riippumattomia, niin n i=1 z2 i χ2 (n) n kuvaajia Chi-square(3) Chi-square(6).2.1.1 3 6 9 12 3 6 9 12
t-jakauma t(n), t(df), Studentin t-jakauma, (Student's) t-distribution f(t) = 1 ( ) (n+1)/2 Γ((n + 1)/2) 1 + t2, t R, n Z + nπ Γ(n/2) n missä Γ on Eulerin gammafunktio Γ(t) = e x x t 1 dx E(t) =, n > 1, var(t) = n n 2, n > 2 Nimitys: muuttuja on t-jakautunut vapausastein n (degrees on freedom, df). Origon suhteen symmetrinen jakauma. t-jakauma lähestyy N(,1)-jakaumaa, kun n Jos x 1, x 2,..., x n on otos muuttujasta x N(µ, σ 2 ), niin n kuvaajia x µ s/ n t(n 1).35 t(2).4 t(3) 6 3 3 6 6 3 3 6