Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia TKK (c) Ilkka Mellin (2005) 1
Diskreettejä jakaumia Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen jakauma Negatiivinen binomijakauma Hypergeometrinen jakauma Poisson-jakauma TKK (c) Ilkka Mellin (2005) 2
Diskreettejä jakaumia Mitä opimme? 1/3 Tutustumme tässä luvussa seuraaviin diskreetteihin todennäköisyysjakaumiin: Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen jakauma Negatiivinen binomijakauma Hypergeometrinen jakauma Poisson-jakauma TKK (c) Ilkka Mellin (2005) 3
Diskreettejä jakaumia Mitä opimme? 2/3 Tarkastelun kohteena ovat seuraavat jakaumien ominaisuudet: (i) Jakauman määrittely (ii) Pistetodennäköisyysfunktio (iii) Odotusarvo, varianssi ja standardipoikkeama (iv) Kuvaaja Tarkastelemme myös jakaumien välisiä yhteyksiä. Tarkasteltavien jakaumien odotusarvot johdetaan suoraan odotusarvon määritelmään nojautuen. Todennäköisyysjakauman momentit saadaan kuitenkin yleensä kätevimmin johdetuksi käyttämällä hyväksi jakauman momentit generoivaa funktiota; ks. lukua Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 4
Diskreettejä jakaumia Mitä opimme? 3/3 Tarkastelemme Bernoulli-jakauman, binomijakauman ja Poisson-jakauman tapauksessa myös ko. jakaumaa noudattavien riippumattomien satunnaismuuttujien summan jakaumaa. Lisätietoja riippumattomien satunnaismuuttujien summan jakauman määräämisestä: ks. lukua Satunnaismuuttujien muunnokset ja niiden jakaumat. Huomautus: Tarkoitamme satunnaismuuttujien riippumattomuudella sitä, että yhdenkään satunnaismuuttujan saamat arvot eivät riipu siitä, mitä arvoja muut satunnaismuuttujat saavat; käsite täsmennetään luvussa Kaksiulotteiset todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 5
Diskreettejä jakaumia Esitiedot Esitiedot: ks. seuraavia lukuja: Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut TKK (c) Ilkka Mellin (2005) 6
Diskreettejä jakaumia Lisätiedot Todennäköisyysjakaumien momenttien määräämistä tarkastellaan luvussa Momenttiemäfunktio ja karakteristinen funktio Riippumattomien satunnaismuuttujien summan jakauman määräämistä tarkastellaan luvussa Satunnaismuuttujien muunnokset ja niiden jakaumat TKK (c) Ilkka Mellin (2005) 7
Diskreettejä jakaumia >> Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen jakauma Negatiivinen binomijakauma Hypergeometrinen jakauma Poisson-jakauma TKK (c) Ilkka Mellin (2005) 8
Diskreetti tasainen jakauma Avainsanat Diskreetti tasainen jakauma Odotusarvo Pistetodennäköisyysfunktio Standardipoikkeama Varianssi TKK (c) Ilkka Mellin (2005) 9
Diskreetti tasainen jakauma Diskreetti tasainen jakauma ja sen pistetodennäköisyysfunktio 1/2 Olkoon X diskreetti satunnaismuuttuja, jonka mahdolliset arvot ovat x 1, x 2,, x n Oletetaan, että satunnaismuuttujan X mahdollisiin arvoihin x 1, x 2,, x n liittyvät todennäköisyydet ovat yhtä suuria: 1 Pr( X = xk ) =, k = 1,2,, n n Huomautus: Diskreetti tasainen jakauma liittyy sellaisiin otosavaruuksiin, joissa alkeistapaukset ovat symmetrisiä. TKK (c) Ilkka Mellin (2005) 10
Diskreetti tasainen jakauma Diskreetti tasainen jakauma ja sen pistetodennäköisyysfunktio 2/2 Satunnaismuuttujan X pistetodennäköisyysfunktio on 1 f ( x) = Pr( X = x) =, x= x k n k = 1, 2,, n Sanomme, että satunnaismuuttuja X noudattaa diskreettiä tasaista jakaumaa. Huomautus: Funktio f(x) määrittelee todennäköisyysjakauman, koska n 1 f( xk ) = n = 1 n k= 1 TKK (c) Ilkka Mellin (2005) 11
Diskreetti tasainen jakauma Odotusarvo, varianssi ja standardipoikkeama Diskreetin tasaisen jakauman odotusarvo: n 1 E( X ) = µ X = x = xk n k= 1 Diskreetin tasaisen jakauman varianssi: n 2 2 1 2 Var( X ) = D ( X) = σ X = ( xk x) n k= 1 Diskreetin tasaisen jakauman standardipoikkeama: n 1 2 D( X ) = σ X = ( xk x) n k= 1 TKK (c) Ilkka Mellin (2005) 12
Diskreetti tasainen jakauma Odotusarvon ja varianssin johto Suoraan diskreetin satunnaismuuttujan odotusarvon ja varianssin määritelmistä saadaan: E( X ) = µ = n k k= 1 n x f( x ) 1 = x = x n Var( X) = D ( X) = σ k k k= 1 2 2 n 2 ( xk µ ) f( xk) k= 1 n 1 2 ( xk x) n k= 1 = = TKK (c) Ilkka Mellin (2005) 13
Diskreetti tasainen jakauma Odotusarvon ominaisuuksia Diskreetin tasaisen jakauman odotusarvo n 1 E( X ) = µ X = xk = x n k = 1 on satunnaismuuttujan X mahdollisten arvojen x 1, x 2,, x n aritmeettinen keskiarvo. TKK (c) Ilkka Mellin (2005) 14
Diskreetti tasainen jakauma Odotusarvon ja varianssin laskeminen: Esimerkki Olkoon satunnaismuuttujan X pistetodennäköisyysfunktio f(k) = Pr(X = k) = p k = 1/6, k = 1, 2, 3, 4, 5, 6 Odotusarvo: 6 6 1 E( X) = kf( k) = k k= 1 6 k= 1 1 = (1 + 2 + 3 + 4 + 5 + 6) = 3.5 6 Varianssi: 6 6 2 2 1 2 D( X) = ( k E()) x f() k = ( k E()) x k= 1 6 k= 1 1 2 2 2 35 = (1 3.5) (2 3.5) (6 3.5) 2.917 6 + + + = 12 Standardipoikkeama: D( X ) = 2.917 1.708 TKK (c) Ilkka Mellin (2005) 15
Diskreetti tasainen jakauma Pistetodennäköisyysfunktion kuvaaja Kuva oikealla esittää diskreetin tasaisen jakauman 1 f( x) =, x= 1,2,3,4,5,6 6 pistetodennäköisyysfunktiota. Jakauman odotusarvo: 6 1 E( X) = k = 3.5 6 k = 1 0.3 0.2 0.1 0 Diskreetti tasainen jakauma 1 2 3 4 5 6 E(X) = 3.5 TKK (c) Ilkka Mellin (2005) 16
Diskreettejä jakaumia Diskreetti tasainen jakauma >> Bernoulli-jakauma Binomijakauma Geometrinen jakauma Negatiivinen binomijakauma Hypergeometrinen jakauma Poisson-jakauma TKK (c) Ilkka Mellin (2005) 17
Bernoulli-jakauma Avainsanat Bernoulli-jakauma Bernoulli-koe Odotusarvo Pistetodennäköisyysfunktio Standardipoikkeama Varianssi TKK (c) Ilkka Mellin (2005) 18
Bernoulli-jakauma Bernoulli-jakauma ja sen pistetodennäköisyysfunktio 1/2 Olkoon A otosavaruuden S tapahtuma ja Pr(A) = p. Tällöin tapahtuman A komplementtitapahtuman A c todennäköisyys on Pr(A c ) = 1 Pr(A) = 1 p = q Määritellään diskreetti satunnaismuuttuja X: 1, jos tapahtuma A sattuu X = 0, jos tapahtuma A ei satu Tällöin satunnaismuuttujan Xjakaumaon Pr( X = 1) = p Pr( X = 0) = 1 p = q TKK (c) Ilkka Mellin (2005) 19
Bernoulli-jakauma Bernoulli-jakauma ja sen pistetodennäköisyysfunktio 2/2 Satunnaismuuttujan X pistetodennäköisyysfunktio on x 1 x f ( x) = Pr( X = x) = p q,0< p< 1, q= 1 p x = 0,1 Sanomme, että satunnaismuuttuja X noudattaa Bernoulli-jakaumaa parametrinaan p. Merkintä: X Bernoulli(p) Huomautus: Funktio f(x) määrittelee todennäköisyysjakauman, koska f (0) + f(1) = q+ p= 1 TKK (c) Ilkka Mellin (2005) 20
Bernoulli-jakauma Komplementtitapahtuman todennäköisyys Olkoon Pr(A) = p Tällöin Pr(A c ) = 1 P(A) = 1 p = q A A c S TKK (c) Ilkka Mellin (2005) 21
Bernoulli-jakauma Odotusarvo, varianssi ja standardipoikkeama Olkoon X Bernoulli(p) Odotusarvo: E(X) = p Varianssi ja standardipoikkeama: 2 Var( X ) = D ( X) = pq D( X) = pq TKK (c) Ilkka Mellin (2005) 22
Bernoulli-jakauma Odotusarvon ja varianssin johto Suoraan diskreetin satunnaismuuttujan odotusarvon ja varianssin määritelmistä saadaan: E( X ) = 1 Pr( X = 1) + 0 Pr( X = 0) = 1 p+ 0 q = p X = X = + X = = 1 p+ 0 q = p 2 2 2 E( ) 1 Pr( 1) 0 Pr( 0) Var( X) = E( X ) [E( X)] = p p 2 2 2 = p(1 p) = pq TKK (c) Ilkka Mellin (2005) 23
Bernoulli-jakauma Odotusarvon ja varianssin ominaisuuksia Olkoon X Bernoulli(p) Bernoulli-jakauman odotusarvo E(X) = p yhtyy tapahtuman A todennäköisyyteen Pr(A) = p. Bernoulli-jakauman varianssi Var(X) = pq = p(1 p) = p p 2 saavuttaa maksiminsa 1/4 kun p = q = 1/2. TKK (c) Ilkka Mellin (2005) 24
Bernoulli-jakauma Pistetodennäköisyysfunktion kuvaaja Kuva oikealla esittää Bernoullijakauman Bernoulli(0.8) pistetodennäköisyysfunktiota x 1 x f( x) = p q p= 0.8, q= 1 p pisteissä x = 0, 1 Jakauman odotusarvo: E( X ) = p = 0.8 1 0.8 0.6 0.4 0.2 0 Bernoulli(0.8) 0 1 E(X) = 0.8 TKK (c) Ilkka Mellin (2005) 25
Bernoulli-jakauma Bernoulli-jakaumaa noudattavien satunnaismuuttujien summan jakauma 1/2 Olkoot X 1, X 2,, X n riippumattomia satunnaismuuttujia, jotka noudattavat samaa Bernoulli-jakaumaa parametrilla p: X 1, X 2,, X n X i ~ Bernoulli(p), i = 1, 2,, n Tällöin satunnaismuuttujien X 1, X 2,, X n summa Y = X 1 + X 2 + + X n noudattaa binomijakaumaa parametrilla (n, p): Y ~ Bin(n, p) TKK (c) Ilkka Mellin (2005) 26
Bernoulli-jakauma Bernoulli-jakaumaa noudattavien satunnaismuuttujien summan jakauma 2/2 Tulos perustellaan luvussa Satunnaismuuttujien muunnokset ja niiden jakaumat. Huomautuksia: Kaikilla Bernoulli-jakaumilla on oltava sama tapahtuman A todennäköisyyttä kuvaava parametri p. Tarkoitamme satunnaismuuttujien riippumattomuudella sitä, että yhdenkään satunnaismuuttujan saamat arvot eivät riipu siitä, mitä arvoja muut satunnaismuuttujat saavat; käsite täsmennetään luvussa Kaksiulotteiset todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 27
Bernoulli-jakauma Bernoulli-kokeet ja diskreetit todennäköisyysjakaumat 1/2 Toistetaan toisistaan riippumatta samaa Bernoulli-koetta ja tarkastellaan tapahtuman A sattumista toistojen aikana: (i) Binomijakauma saadaan määräämällä todennäköisyys sille, että tapahtuma A sattuu x kertaa, kun koetta toistetaan n kertaa. (ii) Geometrinen jakauma saadaan määräämällä todennäköisyys sille, että tapahtuma A sattuu ensimmäisen kerran x. koetoistossa. (iii) Negatiivinen binomijakauma saadaan määräämällä todennäköisyys sille, että tapahtuma A sattuu r. kerran x. koetoistossa. TKK (c) Ilkka Mellin (2005) 28
Bernoulli-jakauma Bernoulli-kokeet ja diskreetit todennäköisyysjakaumat 2/2 Poisson-jakauma voidaan johtaa binomijakauman rajaarvona, kun koetoistojen lukumäärän annetaan tiettyjen ehtojen vallitessa kasvaa rajatta. Siten Poisson-jakauma kuvaa harvinaisten tapahtumien todennäköisyyksiä pitkissä toistokoesarjoissa. TKK (c) Ilkka Mellin (2005) 29
Diskreettejä jakaumia Diskreetti tasainen jakauma Bernoulli-jakauma >> Binomijakauma Geometrinen jakauma Negatiivinen binomijakauma Hypergeometrinen jakauma Poisson-jakauma TKK (c) Ilkka Mellin (2005) 30
Binomijakauma Avainsanat Binomijakauma Bernoulli-jakauma Bernoulli-koe Odotusarvo Otanta takaisinpanolla Pistetodennäköisyysfunktio Standardipoikkeama Varianssi TKK (c) Ilkka Mellin (2005) 31
Binomijakauma Binomijakauma ja sen pistetodennäköisyysfunktio 1/3 Toistetaan samaa Bernoulli-koetta n kertaa, jossa n on kiinteä, etukäteen päätetty luku. Oletetaan, että koetoistot ovat riippumattomia. Tarkastellaan otosavaruuden S tapahtuman A sattumista koetoistojen aikana. Oletetaan, että Pr(A) = p Pr(A c ) = 1 Pr(A) = 1 p = q Määritellään diskreetti satunnaismuuttuja X: X = Tapahtuman A esiintymisten lukumäärä n-kertaisessa Bernoulli-kokeessa TKK (c) Ilkka Mellin (2005) 32
Binomijakauma Binomijakauma ja sen pistetodennäköisyysfunktio 2/3 Satunnaismuuttujan X pistetodennäköisyysfunktio on n x n x f ( x) = Pr( X = x) = p q,0 p 1, q 1 p x < < = x= 0,1,2,, n Sanomme, että satunnaismuuttuja X noudattaa binomijakaumaa parametreinaan n ja p. Merkintä: X Bin(n, p) TKK (c) Ilkka Mellin (2005) 33
Binomijakauma Binomijakauma ja sen pistetodennäköisyysfunktio 3/3 Huomautus: Funktio f(x) määrittelee todennäköisyysjakauman, koska binomikaavan mukaan n n n x n x n n f( x) = p q ( p q) 1 1 x 0 x 0 x = + = = = = Siten binomijakauman pistetodennäköisyydet n x n x px = f( x) = p q, x= 0,1,2,, n x toteuttavat yhtälön n n x n x p0 + p1+ p2 + + pn = p q = 1 x= 0 x TKK (c) Ilkka Mellin (2005) 34
Binomijakauma Pistetodennäköisyysfunktion johto 1/2 Toistetaan samaa Bernoulli-koetta n kertaa. Oletetaan, että koetoistot ovat riippumattomia ja tarkastellaan tapahtuman A sattumista koetoistojen aikana. Oletetaan, että toistokoesarjan tuloksena saadaan tapahtumajono c c A AA AA A jossa on x kpl tapahtumia A ja (n x) kpl tapahtumia A c. Koska Pr(A) = p Pr(A c ) = 1 Pr(A) = 1 p = q tarkasteltavan tapahtumajonon todennäköisyydeksi saadaan riippumattomien tapahtumien tulosäännön nojalla x n x ppqpq p = p q TKK (c) Ilkka Mellin (2005) 35
Binomijakauma Pistetodennäköisyysfunktion johto 2/2 Erilaisia jonoja, joissa on x kpl tapahtumia A ja (n x) kpl tapahtumia A c, on n kpl x Erilaiset tapahtumajonot ovat toisensa poissulkevia. Toisensa poissulkevien tapahtumien yhteenlaskusäännön mukaan todennäköisyys saada sellainen jono, jossa on x kpl tapahtumia A ja (n x) kpl tapahtumia A c saadaan laskemalla erilaisten tällaisten jonojen todennäköisyydet yhteen. Siten kysytyksi todennäköisyydeksi saadaan n x n x f( x) = p q, q= 1 p x x= 0,1,2,, n TKK (c) Ilkka Mellin (2005) 36
Binomijakauma Odotusarvo, varianssi ja standardipoikkeama Olkoon X Bin(n, p) Odotusarvo: E( X ) = np Varianssi ja standardipoikkeama: 2 Var( X ) = D ( X ) = npq D( X ) = npq TKK (c) Ilkka Mellin (2005) 37
Binomijakauma Odotusarvon johto 1/2 Olkoon X Bin(n, p) Tällöin n n n! x n x E( X) = xf( x) = x p (1 p) x= 0 x= 0 x!( n x)! n n! x n x = x p (1 p) x= 1 x!( n x)! n n! x = p (1 p) ( x 1)!( n x)! n x x= 1 n ( n 1)! x 1 np p p x= 1 ( x 1)!( n x)! = (1 ) = np n x TKK (c) Ilkka Mellin (2005) 38
Binomijakauma Odotusarvon johto 2/2 Kalvon 1/2 yhtälöketjun viimeinen yhtälö perustuu siihen, että n ( n 1)! x 1 n x p (1 p) = 1 ( x 1)!( n x)! x= 1 Tämä seuraa siitä, että summassa lasketaan yhteen kaikki binomijakauman Bin(n 1, p) pistetodennäköisyydet ( n 1)! f x p p ( x 1)!( n x)! x 1 n x ( ) = (1 ) TKK (c) Ilkka Mellin (2005) 39
Binomijakauma Odotusarvon ja varianssin ominaisuuksia Olkoon X Bin(n, p) Binomijakauman odotusarvo E( X ) = np on suoraan verrannollinen sekä toistokeiden lukumäärään n että tapahtuman A todennäköisyyteen Pr(A) = p. Binomijakauman varianssi Var(X) = npq = np(1 p) saavuttaa maksiminsa n/4 kun p = q = 1/2. TKK (c) Ilkka Mellin (2005) 40
Binomijakauma Pistetodennäköisyysfunktion kuvaaja Kuva oikealla esittää Binomijakauman Bin(12, 1/3) pistetodennäköisyysfunktiota n x n x f( x) = p q x n= 12, p= 1/ 3, q= 1 p pisteissä x = 0, 1, 2,, 12 Jakauman odotusarvo: E( X ) = np = 4 E(X) = 4 0.4 0.3 0.2 0.1 0 Bin(12, 1/3) 0 1 2 3 4 5 6 7 8 9 10 11 12 TKK (c) Ilkka Mellin (2005) 41
Binomijakauma Pistetodennäköisyysfunktion kuvaaja: Tapaukset p < 1/2, p = 1/2, p > 1/2 0.3 Bin(12, 1/4) Bin(12, 1/2) Bin(12, 3/4) 0.3 0.3 0.25 0.25 0.25 0.2 0.2 0.2 0.15 0.15 0.15 0.1 0.1 0.1 0.05 0.05 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 0 0 1 2 3 4 5 6 7 8 9 10 11 12 0 0 1 2 3 4 5 6 7 8 9 10 11 12 p < 1/2: Binomijakauma on vino oikealle. p = 1/2: Binomijakauma on symmetrinen. p > 1/2: Binomijakauma on vino vasemmalle. TKK (c) Ilkka Mellin (2005) 42
Binomijakauma Binomijakauma ja Bernoulli-jakauma 1/3 Toistetaan samaa Bernoulli-koetta n kertaa, jossa n on kiinteä, etukäteen päätetty luku. Oletetaan, että koetoistot ovat riippumattomia ja tarkastellaan tapahtuman A sattumista koetoistojen aikana. Oletetaan, että Pr(A) = p Pr(A c ) = 1 p = q TKK (c) Ilkka Mellin (2005) 43
Binomijakauma Binomijakauma ja Bernoulli-jakauma 2/3 Määritellään diskreetit satunnaismuuttujat X i, i = 1, 2,, n : 1, jos A tapahtuu kokeessa i X i = 0, jos A ei tapahdu kokeessa i Tällöin X i Bernoulli(p), i = 1, 2,, n. Määritellään diskreetti satunnaismuuttuja X : X = Tapahtuman A esiintymisten lukumäärä n-kertaisessa Bernoulli-kokeessa Tällöin X Bin(n, p) TKK (c) Ilkka Mellin (2005) 44
Binomijakauma Binomijakauma ja Bernoulli-jakauma 3/3 Selvästi X n = X i= 1 i koska luku 1 esiintyy summassa X i täsmälleen yhtä monta kertaa kuin tapahtuma A sattuu n:n koetoiston aikana. Tämä merkitsee sitä, että binomijakautunut satunnaismuuttuja voidaan esittää riippumattomien Bernoullijakautuneiden satunnaismuuttujien summana. Huomautus: Binomi- ja Bernoulli-jakauman yhteyttä voidaan käyttää apuna binomijakauman odotusarvon ja varianssin määräämisessä; ks. >. TKK (c) Ilkka Mellin (2005) 45
Binomijakauma Binomijakauman odotusarvon ja varianssin johto sekä Bernoulli-jakauma 1/2 Olkoot X i, i = 1,2,, n riippumattomia satunnaismuuttujia, jotka noudattavat samaa Bernoulli-jakaumaa parametrilla p: X 1, X 2,, X n X i Bernoulli(p), i = 1,2,, n Olkoon n X = X i i= 1 Tällöin X Bin(n, p) Huomautus: Tarkoitamme satunnaismuuttujien riippumattomuudella sitä, että yhdenkään satunnaismuuttujan saamat arvot eivät riipu siitä, mitä arvoja muut satunnaismuuttujat saavat; käsite täsmennetään luvussa Kaksiulotteiset todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 46
Binomijakauma Binomijakauman odotusarvon ja varianssin johto sekä Bernoulli-jakauma 2/2 Satunnaismuuttujan X = X i odotusarvo on n n n E( X ) = EXi= E( Xi) = p = np i= 1 i= 1 i= 1 koska satunnaismuuttujien summan odotusarvo on satunnaismuuttujien odotusarvojen summa. Satunnaismuuttujan X = X i varianssi on n n n 2 2 2 D( X ) = DXi= D( Xi) = pq = npq i= 1 i= 1 i= 1 koska riippumattomien satunnaismuuttujien summan varianssi on satunnaismuuttujien varianssien summa. TKK (c) Ilkka Mellin (2005) 47
Binomijakauma Binomijakaumaa noudattavien satunnaismuuttujien summan jakauma 1/2 Olkoot X 1, X 2,, X k riippumattomia satunnaismuuttujia, jotka noudattavat binomijakaumia parametrein (n 1, p), (n 2, p),, (n k, p): X 1, X 2,, X k X i ~ Bin(n i, p), i = 1, 2,, k Tällöin satunnaismuuttujien X 1, X 2,, X k summa Y = X 1 + X 2 + + X k noudattaa binomijakaumaa parametrein (n 1 + n 2 + + n k, p): Y ~ Bin(n 1 + n 2 + + n k, p) TKK (c) Ilkka Mellin (2005) 48
Binomijakauma Binomijakaumaa noudattavien satunnaismuuttujien summan jakauma 2/2 Tulos perustellaan luvussa Satunnaismuuttujien muunnokset ja niiden jakaumat. Huomautuksia: Kaikilla binomijakaumilla on oltava sama tapahtuman A todennäköisyyttä kuvaava parametri p, mutta sen sijaan toistokokeiden lukumäärää kuvaava parametri saa vaihdella jakaumasta toiseen. Tarkoitamme satunnaismuuttujien riippumattomuudella sitä, että yhdenkään satunnaismuuttujan saamat arvot eivät riipu siitä, mitä arvoja muut satunnaismuuttujat saavat; käsite täsmennetään luvussa Kaksiulotteiset todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 49
Binomijakauma Binomijakauma ja otanta takaisinpanolla 1/5 Olkoon perusjoukon S alkioiden lukumäärä n(s) = N Poimitaan perusjoukosta S satunnaisesti osajoukko B, jonka alkioiden lukumäärä on n(b) = n käyttämällä poiminnassa otantaa takaisinpanolla. TKK (c) Ilkka Mellin (2005) 50
Binomijakauma Binomijakauma ja otanta takaisinpanolla 2/5 Otanta takaisinpanolla: (i) Perusjoukosta S poimitaan alkiot osajoukkoon B yksi kerrallaan arpomalla. (ii) Jokainen poimittu alkio palautetaan ennen seuraavan alkion arpomista takaisin perusjoukkoon S. (iii) Jokaisella perusjoukon S alkiolla on jokaisessa arvonnassa sama todennäköisyys 1/N tulla poimituksi osajoukkoon B. Osajoukko B muodostaa yksinkertaisen satunnaisotoksen perusjoukosta S. TKK (c) Ilkka Mellin (2005) 51
Binomijakauma Binomijakauma ja otanta takaisinpanolla 3/5 Otannassa takaisinpanolla arvonta voidaan toteuttaa seuraavalla tavalla: (1) Pannaan uurnaan jokaista perusjoukon S alkiota vastaava arpalippu. (2) Sekoitetaan arvat huolellisesti. (3) Nostetaan uurnasta arpalippu, jota vastaava alkio valitaan otokseen B. (4) Palautetaan nostettu arpalippu uurnaan. (5) Palataan vaiheeseen (2), kunnes haluttu otoskoko n on saavutettu. TKK (c) Ilkka Mellin (2005) 52
Binomijakauma Binomijakauma ja otanta takaisinpanolla 4/5 Huomautuksia otannasta takaisinpanolla: (i) Jokaisen perusjoukon S alkion todennäköisyys tulla valituksi otokseen säilyy samana koko poiminnan ajan. (ii) Jokaisella perusjoukon S samankokoisella osajoukolla on sama todennäköisyys tulla valituksi otokseksi. (iii) Sama perusjoukon S alkio voi tulla valituksi useita kertoja otokseen. TKK (c) Ilkka Mellin (2005) 53
Binomijakauma Binomijakauma ja otanta takaisinpanolla 5/5 Olkoon A perusjoukon osajoukko, jonka alkioiden lukumäärä on n(a) = r Tällöin todennäköisyys poimia alkio joukosta A on r Pr( A) = p = N Otannassa takaisinpanolla otokseen poimittujen A- tyyppisten alkioiden lukumäärä X on diskreetti satunnaismuuttuja, joka noudattaa binomijakaumaa parametreilla n ja p: X Bin(n, p) TKK (c) Ilkka Mellin (2005) 54
Diskreettejä jakaumia Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma >> Geometrinen jakauma Negatiivinen binomijakauma Hypergeometrinen jakauma Poisson-jakauma TKK (c) Ilkka Mellin (2005) 55
Geometrinen jakauma Avainsanat Geometrinen jakauma Bernoulli-koe Odotusarvo Pistetodennäköisyysfunktio Standardipoikkeama Varianssi TKK (c) Ilkka Mellin (2005) 56
Geometrinen jakauma Geometrinen jakauma ja sen pistetodennäköisyysfunktio 1/2 Toistetaan samaa Bernoulli-koetta. Oletetaan, että koetoistot ovat riippumattomia. Tarkastellaan otosavaruuden S tapahtuman A sattumista koetoistojen aikana. Oletetaan, että Pr(A) = p Pr(A c ) = 1 Pr(A) = 1 p = q Määritellään diskreetti satunnaismuuttuja X: X = Tehtyjen Bernoulli-kokeiden lukumäärä, kun A sattuu ensimmäisen kerran TKK (c) Ilkka Mellin (2005) 57
Geometrinen jakauma Geometrinen jakauma ja sen pistetodennäköisyysfunktio 2/2 Satunnaismuuttujan X pistetodennäköisyysfunktio on x 1 f ( x) = Pr( X = x) = q p,0< p< 1, q= 1 p x = 1, 2,3, Sanomme, että satunnaismuuttuja X noudattaa geometrista jakaumaa parametrinaan p. Merkintä: X Geom(p) Huomautus: Funktio f(x) määrittelee todennäköisyysjakauman, koska geometrisen sarjan summan kaavan mukaan x 1 x 1 1 f( x) = q p= pq = p = p = 1 1 q p x= 1 x= 1 x= 0 TKK (c) Ilkka Mellin (2005) 58
Geometrinen jakauma Pistetodennäköisyysfunktion johto 1/2 Toistetaan samaa Bernoulli-koetta. Oletetaan, että koetoistot ovat riippumattomia ja tarkastellaan tapahtuman A sattumista koetoistojen aikana. Tarkastellaan toistokoesarjaa, jossa tapahtuma A sattuu ensimmäisen kerran x:nnessä kokeessa. Toistokoesarjan tuloksena on tällöin ollut tapahtumajono c c c c A A A A A jossa on ensin sattunut (x 1) kpl tapahtumia A c ja sitten tapahtuma A. TKK (c) Ilkka Mellin (2005) 59
Geometrinen jakauma Pistetodennäköisyysfunktion johto 2/2 Koska Pr(A) = p Pr(A c ) = 1 Pr(A) = 1 p = q tarkasteltavan tapahtumajonon todennäköisyydeksi saadaan riippumattomien tapahtumien tulosäännön nojalla x 1 qqq qp = q p x = 1, 2,3, mikä on kysytty todennäköisyys. TKK (c) Ilkka Mellin (2005) 60
Geometrinen jakauma Odotusarvo, varianssi ja standardipoikkeama Olkoon X Geom(p) Odotusarvo: 1 E( X ) = p Varianssi ja standardipoikkeama: 2 q Var( X) = D ( X) = 2 p D( X ) = q p TKK (c) Ilkka Mellin (2005) 61
Geometrinen jakauma Odotusarvon johto 1/4 Olkoon X Geom(p) Satunnaismuuttujan X pistetodennäköisyysfunktio on x 1 f ( x) = q p, q= 1 p x = 1, 2,3, Pistetodennäköisyyksien f(x), x = 1, 2, 3, summa on x 1 ( ) = ( ) = (1 ) = 1 x= 1 x= 1 S p f x p p Satunnaismuuttujan X odotusarvo on 1 X = xf x = x p p x= 1 x= 1 E( ) ( ) (1 ) x TKK (c) Ilkka Mellin (2005) 62
Geometrinen jakauma Odotusarvon johto 2/4 Summan S(p) derivaatta muuttujan p suhteen on S( p) p = ( x 1)(1 p) p+ (1 p) x= 1 = x= 1 x 2 x(1 p) p x 2 x 1 x 2 x 1 + (1 p) p+ (1 p) x= 1 x= 1 x 1 1 = x(1 p) p 1 p x= 1 1 1 + (1 ) + (1 ) 1 p p x 1 x 1 p p p p x= 1 x= 1 TKK (c) Ilkka Mellin (2005) 63
Geometrinen jakauma Odotusarvon johto 3/4 Ottamalla huomioon yhtälöt x= 1 x= 1 x 1 (1 p) p= S( p) = 1 x p p X x 1 (1 ) = E( ) saadaan yhtälö S( p) 1 1 1 = E( X ) + + p 1 p 1 p p 1 1 = E( X ) + 1 p p(1 p) = 0 TKK (c) Ilkka Mellin (2005) 64
Geometrinen jakauma Odotusarvon johto 4/4 Geometrisen jakauman odotusarvo E(x) toteuttaa siis yhtälön 1 1 E( X ) 0 1 p + p(1 p) = Siten geometrisen jakauman odotusarvo on E( X ) = 1 p TKK (c) Ilkka Mellin (2005) 65
Geometrinen jakauma Odotusarvon ominaisuuksia Olkoon X Geom(p) Geometrisen jakauman odotusarvo 1 E( X ) = p on kääntäen verrannollinen tapahtuman A todennäköisyyteen Pr(A) = p. Siten tapahtumaa A saa odottaa keskimäärin sitä kauemmin mitä pienempi on tapahtuman A todennäköisyys. TKK (c) Ilkka Mellin (2005) 66
Geometrinen jakauma Pistetodennäköisyysfunktion kuvaaja Kuva oikealla esittää geometrisen jakauman Geom(1/3) pistetodennäköisyysfunktiota x 1 f( x) = q p p= 1/3, q= 1 p pisteissä x = 1, 2,, 12 Jakauman odotusarvo: 1 E( X ) = = 3 p 0.5 0.4 0.3 0.2 0.1 0 1 2 3 4 5 6 7 8 9 10 11 12 E(X) = 3 Geom(1/3) TKK (c) Ilkka Mellin (2005) 67
Geometrinen jakauma Geometrisen jakauman unohtamisominaisuus Olkoon X Geom(p) Tällöin Pr(X a + b X a) = Pr(X 1 + b) Siten geometrisella jakaumalla on seuraava unohtamisominaisuus: Se, että tapahtuman A sattumista on jouduttu odottamaan a koetoistoa, ei vaikuta todennäköisyyteen joutua odottamaan b koetoistoa lisää. TKK (c) Ilkka Mellin (2005) 68
Diskreettejä jakaumia Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen jakauma >> Negatiivinen binomijakauma Hypergeometrinen jakauma Poisson-jakauma TKK (c) Ilkka Mellin (2005) 69
Negatiivinen binomijakauma Avainsanat Bernoulli-koe Geometrinen jakauma Negatiivinen binomijakauma Odotusarvo Pistetodennäköisyysfunktio Standardipoikkeama Varianssi TKK (c) Ilkka Mellin (2005) 70
Negatiivinen binomijakauma Negatiivinen binomijakauma ja sen pistetodennäköisyysfunktio 1/2 Toistetaan samaa Bernoulli-koetta. Oletetaan, että koetoistot ovat riippumattomia. Tarkastellaan otosavaruuden S tapahtuman A sattumista koetoistojen aikana. Oletetaan, että Pr(A) = p Pr(A c ) = 1 Pr(A) = 1 p = q Määritellään diskreetti satunnaismuuttuja X: X = Tehtyjen Bernoulli-kokeiden lukumäärä, kun A sattuu r. kerran TKK (c) Ilkka Mellin (2005) 71
Negatiivinen binomijakauma Negatiivinen binomijakauma ja sen pistetodennäköisyysfunktio 2/2 Satunnaismuuttujan X pistetodennäköisyysfunktio on x 1 x r r f ( x) = Pr( X = x) = q p,0 p 1, q 1 p r 1 < < = r = 1, 2,3, ; x= r, r+ 1, r+ 2, Sanomme, että satunnaismuuttuja X noudattaa negatiivista binomijakaumaa parametreinaan r ja p. Merkintä: X NegBin(r, p) TKK (c) Ilkka Mellin (2005) 72
Negatiivinen binomijakauma Pistetodennäköisyysfunktion johto 1/3 Toistetaan samaa Bernoulli-koetta. Oletetaan, että koetoistot ovat riippumattomia ja tarkastellaan tapahtuman A sattumista koetoistojen aikana. Tarkastellaan toistokoesarjaa, jossa tapahtuma A sattuu r. kerran x. kokeessa. Olkoon toistokoesarjan tuloksena ollut tapahtumajono c c c A AAAA AA jossa on r kpl tapahtumia A ja (x r) kpl tapahtumia A c ja, jossa tapahtuma A on viimeisenä. TKK (c) Ilkka Mellin (2005) 73
Negatiivinen binomijakauma Pistetodennäköisyysfunktion johto 2/3 Koska Pr(A) = p Pr(A c ) = 1 Pr(A) = 1 p = q tarkasteltavan tapahtumajonon todennäköisyydeksi saadaan riippumattomien tapahtumien tulosäännön nojalla x r r ppqpq qp = q p Erilaisten sellaisten jonojen, joissa on r kpl tapahtumia A ja (x r) kpl tapahtumia A c ja joissa A on viimeisenä, lukumäärä on x 1 r 1 TKK (c) Ilkka Mellin (2005) 74
Negatiivinen binomijakauma Pistetodennäköisyysfunktion johto 3/3 Erilaiset tapahtumajonot ovat toisensa poissulkevia. Toisensa poissulkevien tapahtumien yhteenlaskusäännön mukaan todennäköisyys saada sellainen jono, jossa on r kpl tapahtumia A ja (x r) kpl tapahtumia A c ja jossa tapahtuma A on viimeisenä, saadaan laskemalla erilaisten tällaisten jonojen todennäköisyydet yhteen. Koska ko. jonojen lukumäärä on x 1 r 1 saadaan kysytyksi todennäköisyydeksi x 1 x r r f( x) = q p, q 1 p r 1 = r = 1, 2,3, ; x= r, r+ 1, r+ 2 TKK (c) Ilkka Mellin (2005) 75
Negatiivinen binomijakauma Odotusarvo, varianssi ja standardipoikkeama Olkoon X NegBin(r, p) Odotusarvo: r E( X ) = p Varianssi ja standardipoikkeama: 2 rq Var( X) = D ( X) = 2 p rq D( X ) = p TKK (c) Ilkka Mellin (2005) 76
Negatiivinen binomijakauma Odotusarvon johto 1/4 Olkoon X NegBin(r, p) Satunnaismuuttujan X pistetodennäköisyysfunktio on x 1 x r r f( x) = q p, q 1 p r 1 = x= r, r+ 1, r+ 2, Pistetodennäköisyyksien f(x), x = r, r + 1, r + 2, summa on x 1 x r r S( p) = f( x) = (1 p) p = 1 x= r x= r r 1 Satunnaismuuttujan X odotusarvo on x 1 x r r E( X ) = xf ( x) = x (1 p) p x= r x= r r 1 TKK (c) Ilkka Mellin (2005) 77
Negatiivinen binomijakauma Odotusarvon johto 2/4 Summan S(p) derivaatta muuttujan p suhteen on ( x ) ( ) ( ) S( p) = ( x r) x 1 (1 p) p r x 1 + (1 p) p p r 1 r 1 x= r = 1 (1 ) r 1 x= r x r 1 r x p p ( x 1) ( x 1 ) ( x ) x r 1 r x r r 1 x r 1 r x r r 1 + r (1 p) p + r (1 p) p r 1 r 1 x= r x= r 1 1 (1 ) x r = x p p 1 p r 1 x= r r 1 p ( x 1) r (1 p) p x 1 ( ) (1 p ) x 1 r + + x= r r 1 r p x= r r 1 x r p r TKK (c) Ilkka Mellin (2005) 78
Negatiivinen binomijakauma Odotusarvon johto 3/4 Ottamalla huomioon yhtälöt x= r x= r ( x ) ( x ) saadaan yhtälö 1 (1 ) x r r p p = S ( p ) = 1 r 1 1 (1 ) x r r x p p = E( X ) r 1 S( p) 1 r r = E( X ) + + p 1 p 1 p p 1 r = E( X ) + 1 p p(1 p) = 0 TKK (c) Ilkka Mellin (2005) 79
Negatiivinen binomijakauma Odotusarvon johto 4/4 Negatiivisen binomijakauman odotusarvo E(x) toteuttaa siis yhtälön 1 r E( X ) 0 1 p + p(1 p) = Siten negatiivisen binomijakauman odotusarvo on r E( X ) = p TKK (c) Ilkka Mellin (2005) 80
Negatiivinen binomijakauma Odotusarvon ominaisuuksia Olkoon X NegBin(r, p) Negatiivisen binomijakauman odotusarvo r E( X ) = p on suoraan verrannollinen lukuun r ja kääntäen verrannollinen tapahtuman A todennäköisyyteen Pr(A) = p. Siten r. tapahtumaa A saa odottaa keskimäärin sitä kauemmin mitä suurempi on r ja mitä pienempi on tapahtuman A todennäköisyys. TKK (c) Ilkka Mellin (2005) 81
Negatiivinen binomijakauma Pistetodennäköisyysfunktion kuvaaja Kuva oikealla esittää negatiivisen binomijakauman NegBin(3, 1/3) pistetodennäköisyysfunktiota x 1 x r r f( x) = q p r 1 r = 3, p= 1/3, q= 1 p pisteissä x = 3, 4,, 16 Jakauman odotusarvo: r E( X ) = = 9 p 0.2 0.15 0.1 0.05 0 NegBin(3, 1/3) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 E(X) = 9 TKK (c) Ilkka Mellin (2005) 82
Negatiivinen binomijakauma Negatiivinen binomijakauma ja geometrinen jakauma Olkoon X NegBin(r, p) Jos r =1, niin satunnaismuuttuja X noudattaa geometrista jakaumaa Geom(p): X Geom(p) Geometrinen jakauma on siten negatiivisen binomijakauman erikoistapaus. TKK (c) Ilkka Mellin (2005) 83
Diskreettejä jakaumia Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen jakauma Negatiivinen binomijakauma >> Hypergeometrinen jakauma Poisson-jakauma TKK (c) Ilkka Mellin (2005) 84
Hypergeometrinen jakauma Avainsanat Binomijakauma Hypergeometrinen jakauma Odotusarvo Otanta ilman takaisinpanoa Otantasuhde Pistetodennäköisyysfunktio Standardipoikkeama Varianssi TKK (c) Ilkka Mellin (2005) 85
Hypergeometrinen jakauma Hypergeometrinen jakauma ja sen pistetodennäköisyysfunktio 1/3 Olkoon perusjoukon S alkioiden lukumäärä n(s) = N Tarkastellaan perusjoukon S ositusta joukkoihin A ja A c. Oletetaan, että joukossa A S on n(a) = r alkiota. Tällöin joukon A komplementissa A c on n(a c ) = N r alkiota. TKK (c) Ilkka Mellin (2005) 86
Hypergeometrinen jakauma Hypergeometrinen jakauma ja sen pistetodennäköisyysfunktio 2/3 Poimitaan perusjoukosta S satunnaisesti osajoukko B, jonka alkioiden lukumäärä on n(b) = n käyttämällä poiminnassa otantaa ilman takaisinpanoa. Määritellään diskreetti satunnaismuuttuja X: X = Osajoukkoon B tulleiden A:n alkioiden lukumäärä TKK (c) Ilkka Mellin (2005) 87
Hypergeometrinen jakauma Hypergeometrinen jakauma ja sen pistetodennäköisyysfunktio 2/2 Satunnaismuuttujan X pistetodennäköisyysfunktio on rn r x n x f( x) = Pr( X = x) = N n max[0, n ( N r)] x min( n, r) Sanomme, että satunnaismuuttuja X noudattaa hypergeometrista jakaumaa parametreilla N, r ja n. Merkintä: X HyperGeom(N, r, n) TKK (c) Ilkka Mellin (2005) 88
Hypergeometrinen jakauma Pistetodennäköisyysfunktion johto 1/4 Olkoon S otosavaruus ja n(s) = N A Olkoon A S Tällöin {A, A c } on otosavaruuden Sositus. B A Olkoon n(a) = r ja n(a c ) = N r Olkoon B S ja n(b) = n Otosavaruuden S ositus {A, A c } indusoi osituksen joukkoon B: B = (B A) (B A c ) Olkoon B B A c A c n(b A) = x S n(b A c ) = n x TKK (c) Ilkka Mellin (2005) 89
Hypergeometrinen jakauma Pistetodennäköisyysfunktion johto 2/4 N:n alkion joukosta S voidaan poimia n:n alkion osajoukko B N n eri tavalla. r:n alkion joukosta A voidaan poimia x alkiota r x eri tavalla. (N r):n alkion joukosta A c voidaan poimia n x alkiota A B B A B A c A c N r n x eri tavalla. S TKK (c) Ilkka Mellin (2005) 90
Hypergeometrinen jakauma Pistetodennäköisyysfunktion johto 3/4 r:n alkion joukosta A voidaan poimia x alkiota riippumatta siitä, mitkä n x alkiota poimitaan (N r):n alkion joukosta A c. Kertolaskuperiaatteen nojalla n alkiota voidaan poimia joukosta S niin, että saadaan r alkiota joukosta A ja (N r) alkiota joukosta A c rn r x n x eri tavalla. A B B A B A c A c S TKK (c) Ilkka Mellin (2005) 91
Hypergeometrinen jakauma Pistetodennäköisyysfunktion johto 4/4 Soveltamalla klassisen todennäköisyyden määritelmää saadaan: rn r x n x Pr( X = x) = N n A B A B A c B A c S TKK (c) Ilkka Mellin (2005) 92
Hypergeometrinen jakauma Odotusarvo, varianssi ja standardipoikkeama Olkoon X HyperGeom(N, r, n) Odotusarvo: r E( X ) = n N Varianssi ja standardipoikkeama: r r N n X = X = n N N N 1 2 Var( ) D ( ) 1 r r N n D( X) = n 1 N N N 1 TKK (c) Ilkka Mellin (2005) 93
Hypergeometrinen jakauma Odotusarvon johto 1/3 Olkoon X HyperGeom(N, r, n) Koska r r! ( r 1)! r 1 x x r r x = = = x!( r x)! ( x 1)!( r x)! x 1 niin rn r r 1N r n n n x n x x 1 n x E( X) = xf( x) = x = r x= 0 x= 0 N x= 1 N n n TKK (c) Ilkka Mellin (2005) 94
Hypergeometrinen jakauma Odotusarvon johto 2/3 Koska N N! N ( N 1)! N N 1 n = = = n!( N n)! n ( n 1)!( N n)! n n 1 niin r 1N r r 1N r n n x 1 n x nr x 1 n x E( X) = r = = x= 1 N N 1 N x= 1 N 1 n n 1 n 1 nr N TKK (c) Ilkka Mellin (2005) 95
Hypergeometrinen jakauma Odotusarvon johto 3/3 Kalvon 2/3 yhtälöketjun viimeinen yhtälö perustuu siihen, että r 1N r n x 1 n x = 1 x= 1 N 1 n 1 Tämä seuraa siitä, että summassa lasketaan yhteen kaikki hypergeometrisen jakauman HyperGeom(N 1, r 1, n 1) pistetodennäköisyydet r 1N r x 1 n x f( x) = N 1 n 1 TKK (c) Ilkka Mellin (2005) 96
Hypergeometrinen jakauma Odotusarvon ja varianssin ominaisuuksia 1/3 Olkoon X HyperGeom(N, r, n). Hypergeometrisen jakauman odotusarvo on r E( X ) = n N Odotusarvo on suoraan verrannollinen sekä perusjoukon S osajoukon B (= otos) alkioiden lukumäärään (= n) että tyypin A alkioiden lukumäärään perusjoukossa S (= r). Odotusarvo on kääntäen verrannollinen perusjoukon S alkioiden lukumäärään (= N). TKK (c) Ilkka Mellin (2005) 97
Hypergeometrinen jakauma Odotusarvon ja varianssin ominaisuuksia 2/3 Olkoon perusjoukon S alkioiden lukumäärä n(s) = N Olkoon joukon A S alkioiden lukumäärä n(a) = r Poimitaan perusjoukosta S otannalla ilman takaisinpanoa osajoukko B, jonka alkioiden lukumäärä on n(b) = n Tällöin diskreetti satunnaismuuttuja X = Osajoukkoon B tulleiden A:n alkioiden lukumäärä noudattaa hypergeometrista jakaumaa parametreilla N, r, n: X HyperGeom(N, r, n) TKK (c) Ilkka Mellin (2005) 98
Hypergeometrinen jakauma Odotusarvon ja varianssin ominaisuuksia 3/3 Todennäköisyys poimia yksi alkio joukosta A on na ( ) r Pr( A) = p ns ( ) = N = Hypergeometrisen jakauman odotusarvo voidaan kirjoittaa todennäköisyyden p avulla muotoon E( X ) = np Hypergeometrisen jakauman varianssi voidaan kirjoittaa todennäköisyyden p avulla muotoon N n X = np( p) N 1 2 D( ) 1 TKK (c) Ilkka Mellin (2005) 99
Hypergeometrinen jakauma Pistetodennäköisyysfunktion kuvaaja Kuva oikealla esittää hypergeometrisen jakauman HyperGeom(100, 12, 20) pistetodennäköisyysfunktiota rn r x n x f( x) = N n N = 100, r = 12, n= 20 pisteissä x = 0, 1, 2,, 12 Jakauman odotusarvo: r E( X) = n = 2.4 N 0.4 0.3 0.2 0.1 0 HyperGeom(100, 12, 20) 0 1 2 3 4 5 6 7 8 9 10 11 12 E(X) = 2.4 TKK (c) Ilkka Mellin (2005) 100
Hypergeometrinen jakauma Hypergeometrinen jakauma ja otanta ilman takaisinpanoa 1/5 Olkoon perusjoukon S alkioiden lukumäärä n(s) = N Poimitaan perusjoukosta S satunnaisesti osajoukko B, jonka alkioiden lukumäärä on n(b) = n käyttämällä poiminnassa otantaa ilman takaisinpanoa. TKK (c) Ilkka Mellin (2005) 101
Hypergeometrinen jakauma Hypergeometrinen jakauma ja otanta ilman takaisinpanoa 2/5 Otanta ilman takaisinpanoa: (i) Perusjoukosta S poimitaan alkiot osajoukkoon B yksi kerrallaan arpomalla. (ii) Poimittuja alkioita ei palauteta takaisin perusjoukkoon S. (iii) Kun otokseen poimitaan alkiota k, k = 1, 2,, n jokaisella perusjoukossa S jäljellä olevalla alkiolla on sama todennäköisyys 1/(N k + 1) tulla poimituksi osajoukkoon B. Osajoukko B muodostaa yksinkertaisen satunnaisotoksen perusjoukosta S. TKK (c) Ilkka Mellin (2005) 102
Hypergeometrinen jakauma Hypergeometrinen jakauma ja otanta ilman takaisinpanoa 3/5 Otannassa ilman takaisinpanoa arvonta voidaan toteuttaa seuraavalla tavalla: (1) Pannaan uurnaan jokaista perusjoukon S alkiota vastaava arpalippu. (2) Sekoitetaan arvat huolellisesti. (3) Nostetaan uurnasta arpalippu, jota vastaava alkio valitaan otokseen B. (4) Ei palauteta nostettua arpalippua uurnaan. (5) Palataan vaiheeseen (3), kunnes haluttu otoskoko n on saavutettu. TKK (c) Ilkka Mellin (2005) 103
Hypergeometrinen jakauma Hypergeometrinen jakauma ja otanta ilman takaisinpanoa 4/5 Huomautuksia otannasta ilman takaisinpanoa: (i) Perusjoukon S alkion todennäköisyys tulla valituksi otokseen muuttuu poiminnan aikana. (ii) Jokaisella perusjoukon S samankokoisella osajoukolla on kuitenkin sama todennäköisyys tulla valituksi otokseksi. (iii) Sama perusjoukon S alkio voi tulla valituksi vain kerran otokseen. TKK (c) Ilkka Mellin (2005) 104
Hypergeometrinen jakauma Hypergeometrinen jakauma ja otanta ilman takaisinpanoa 5/5 Olkoon A perusjoukon S osajoukko, jonka alkioiden lukumäärä on n(a) = r Todennäköisyys poimia yksi alkio joukosta A on na ( ) r Pr( A) = p ns ( ) = N = Otannassa takaisinpanolla otokseen, jonka koko on n, poimittujen A-tyyppisten alkioiden lukumäärä X on diskreetti satunnaismuuttuja, joka noudattaa hypergeometristä jakaumaa parametreilla N, r, n: X HyperGeom(N, r, n) TKK (c) Ilkka Mellin (2005) 105
Hypergeometrinen jakauma Hypergeometrinen jakauma vs binomijakauma 1/3 Hypergeometrisen jakauman todennäköisyydet ovat lähellä binomitodennäköisyyksiä, jos otantasuhde n 0 N Otantasuhde 0, jos otoskoko n on pieni perusjoukon kokoon N nähden. TKK (c) Ilkka Mellin (2005) 106
Hypergeometrinen jakauma Hypergeometrinen jakauma vs binomijakauma 2/3 Olkoon X HyperGeom(N, r, n) Merkitään p = r/n, jolloin r = Np. Siten X HyperGeom(N, Np, n) Annetaan N +. Tällöin hypergeometrisen jakauman HyperGeom(N, Np, n) pistetodennäköisyydet lähestyvät binomijakauman Bin(n, p) pistetodennäköisyyksiä: lim f ( x) = f ( x), x= 0,1,2,, n N + HyperGeom( NNpn,, ) Bin ( np, ) TKK (c) Ilkka Mellin (2005) 107
Hypergeometrinen jakauma Hypergeometrinen jakauma vs binomijakauma 3/3 Hypergeometrisen jakauman ja binomijakauman yhteys näkyy myös siinä, että jakaumilla on sama odotusarvo ja varianssit eroavat vain multiplikatiivisella tekijällä N n N 1 jota sanotaan äärellisen perusjoukon korjaustekijäksi. Korjaustekijä vaikuttaa hypergeometrisen jakauman varianssiin sitä vähemmän mitä pienempi on otantasuhde n/n: N n n 1, jos 0 N 1 N TKK (c) Ilkka Mellin (2005) 108
Hypergeometrinen jakauma Otanta takaisinpanolla vs otanta ilman takaisinpanoa Binomijakauma muodostaa todennäköisyysmallin otannalle takaisinpanolla. Hypergeometrinen jakauma muodostaa todennäköisyysmallin otannalle ilman takaisinpanoa. Ero otannan takaisinpanolla ja otannan ilman takaisinpanoa välillä on merkityksetön, jos otantasuhde n/n on pieni tai perusjoukko on ääretön. Käytännössä otanta tehdään lähes aina ilman takaisinpanoa, mutta laskutoimituksissa käytetään silti usein kaavoja, jotka perustuvat otantaan takaisinpanolla. Edellä esitetyn mukaan tästä johtuva virhe on kuitenkin yleensä merkityksetön. TKK (c) Ilkka Mellin (2005) 109
Diskreettejä jakaumia Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen jakauma Negatiivinen binomijakauma Hypergeometrinen jakauma >> Poisson-jakauma TKK (c) Ilkka Mellin (2005) 110
Poisson-jakauma Avainsanat Binomijakauma Odotusarvo Pistetodennäköisyysfunktio Poisson-jakauma Standardipoikkeama Varianssi TKK (c) Ilkka Mellin (2005) 111
Poisson-jakauma Poisson-jakauma ja sen pistetodennäköisyysfunktio 1/3 Toistetaan samaa satunnaiskoetta. Oletetaan, että toistot ovat toisistaan riippumattomia. Tarkastellaan jonkin tapahtuman A sattumista toistojen aikana. Oletetaan, että A-tapahtumien keskimääräinen lukumäärä aika- tai tilavuusyksikköä kohden on λ. Määritellään diskreetti satunnaismuuttuja X: X = Tapahtuman A esiintymisten lukumäärä aika- tai tilavuusyksikköä kohden TKK (c) Ilkka Mellin (2005) 112
Poisson-jakauma Poisson-jakauma ja sen pistetodennäköisyysfunktio 2/3 Jos tietyt oletukset pätevät (ks. >), satunnaismuuttujan X pistetodennäköisyysfunktio on muotoa x e λ λ f( x) = Pr( X = x) =, λ > 0 x! x = 0,1, 2, Sanomme, että satunnaismuuttuja X noudattaa Poisson-jakaumaa parametrinaan λ. Merkintä: X Poisson(λ) TKK (c) Ilkka Mellin (2005) 113
Poisson-jakauma Poisson-jakauma ja sen pistetodennäköisyysfunktio 3/3 Huomautus: Funktio f(x) määrittelee todennäköisyysjakauman, koska eksponenttifunktion määritelmän mukaan λ x x e λ λ λ λ λ f( x) = = e = e e = 1 x! x! x= 0 x= 0 x= 0 TKK (c) Ilkka Mellin (2005) 114
Poisson-jakauma Pistetodennäköisyysfunktion johto 1/3 Tarkastellaan jonkin tapahtuman A sattumista saman satunnaiskokeen toistojen aikana. Oletukset: (1) Toistot ovat toisistaan riippumattomia. (2) Pr(Yksi tapahtuma A lyhyellä aikavälillä dt) = νdt (3) Aikaväli on dt on niin lyhyt, että todennäköisyys Pr(k kpl tapahtumia A aikavälillä dt, k > 1) on häviävän pieni eli kertaluokkaa o(t). Merkitään: f(x; t) = Pr(x kpl tapahtumia A aikavälillä [0, t]) TKK (c) Ilkka Mellin (2005) 115
Poisson-jakauma Pistetodennäköisyysfunktion johto 2/3 Oletusten (1)-(3) pätiessä aikavälillä [0, t + dt] voi sattua x kpl tapahtumia A kahdella toisensa poissulkevalla tavalla (tn = todennäköisyys): (1) x kpl tapahtumia A ajanhetkeen t mennessä; tn = f(x; t) Ei tapahtumia A aikavälillä dt; tn = 1 νdt Lisäksi nämä ovat tapahtumina toisistaan riippumattomia. (2) (x 1) kpl tapahtumia A ajanhetkeen t mennessä; tn = f(x 1; t) Yksi tapahtuma A aikavälillä dt; tn = νdt Lisäksi nämä ovat tapahtumina toisistaan riippumattomia. TKK (c) Ilkka Mellin (2005) 116
Poisson-jakauma Pistetodennäköisyysfunktion johto 3/3 Riippumattomien tapahtumien tulosäännön ja toisensa poissulkevien tapahtumien yhteenlaskusäännön mukaan f(x; t + dt) = f(x; t)(1 νdt) + f(x 1; t)νdt Saadaan erotusosamäärä f( x; t+ dt) f( x; t) = ν [ f( x 1; t) f( x; t) ] dt Antamalla dt 0, saadaan (x:n suhteen) differenssiyhtälö df ( x; t) = ν [ f( x 1; t) f( x; t) ] dt Voidaan osoittaa, että tämän differenssiyhtälön ratkaisu on muotoa t x e ν ( νt) f( x) =, x= 0,1,2, x! Merkitsemällä νt = λ saadaan Poisson-jakauman pistetodennäköisyysfunktio. TKK (c) Ilkka Mellin (2005) 117
Poisson-jakauma Odotusarvo, varianssi ja standardipoikkeama Olkoon X Poisson(λ) Odotusarvo: E( X ) = λ Varianssi ja standardipoikkeama: 2 Var( X) = D ( X) = λ D( X ) = λ TKK (c) Ilkka Mellin (2005) 118
Poisson-jakauma Odotusarvon johto Olkoon X Poisson(λ) Siten e E( X) = xf( x) = x x= 0 x= 0 = e = λe = λe = λ λ x= 1 λ x= 1 e λ λ x λ x! x λ x x! λ x 1 λ ( x 1)! TKK (c) Ilkka Mellin (2005) 119
Poisson-jakauma Pistetodennäköisyysfunktion kuvaaja Kuva oikealla esittää Poissonjakauman Poisson(5) pistetodennäköisyysfunktiota e f( x) = x! λ = 5 λ x λ pisteissä x = 0, 1, 2,, 12 Jakauman odotusarvo: E( x) = λ = 5 0.3 0.2 0.1 0 Poisson(5) 0 1 2 3 4 5 6 7 8 9 10 11 12 E(X) = 5 TKK (c) Ilkka Mellin (2005) 120
Poisson-jakauma Poisson-jakaumaa noudattavien satunnaismuuttujien summan jakauma 1/2 Olkoot X 1, X 2,, X k riippumattomia satunnaismuuttujia, jotka noudattavat Poisson-jakaumia parametrein λ 1, λ 2,, λ k : X 1, X 2,, X k X i ~ Poisson(λ i ), i = 1, 2,, k Tällöin satunnaismuuttujien X 1, X 2,, X k summa Y = X 1 + X 2 + + X k noudattaa Poisson-jakaumaa parametrilla λ 1 + λ 2 + + λ k : Y ~ Poisson(λ 1 + λ 2 + + λ k ) TKK (c) Ilkka Mellin (2005) 121
Poisson-jakauma Poisson-jakaumaa noudattavien satunnaismuuttujien summan jakauma 2/2 Tulos perustellaan luvussa Satunnaismuuttujien muunnokset ja niiden jakaumat. Huomautuksia: Jokaisella Poisson-jakaumalla saa olla eri parametri. Tarkoitamme satunnaismuuttujien riippumattomuudella sitä, että yhdenkään satunnaismuuttujan saamat arvot eivät riipu siitä, mitä arvoja muut satunnaismuuttujat saavat; käsite täsmennetään luvussa Kaksiulotteiset todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 122
Poisson-jakauma Binomijakauma ja Poisson-jakauma 1/3 Binomitodennäköisyydet ovat lähellä Poissontodennäköisyyksiä, jos n on suuri ja p on pieni. Siten Poisson-jakauma kuvaa harvinaisten tapahtumien todennäköisyyksiä pitkissä toistokoesarjoissa. TKK (c) Ilkka Mellin (2005) 123
Poisson-jakauma Binomijakauma ja Poisson-jakauma 2/3 Olkoon X Bin(n, p) Olkoon p = λ/n, jolloin λ = np. Annetaan n + ja p 0 niin, että np = λ. Tällöin binomijakauman Bin(n, p) pistetodennäköisyydet lähestyvät Poisson-jakauman Poisson(λ) pistetodennäköisyyksiä: lim fbin( np, )( x) = fpoisson( λ )( x), x= 0,1,2, n p 0 = np λ Huomautus: Ehto np = λ voidaan korvata lievemmällä ehdolla np λ. TKK (c) Ilkka Mellin (2005) 124
Poisson-jakauma Binomijakauma ja Poisson-jakauma 3/3 Poisson-jakauman ja binomijakauman välinen yhteys näkyy myös siinä, että jakaumien odotusarvot ovat lähellä toisiaan, jos n on suuri ja p on pieni: E( X ) = µ = λ np Tällöin myös jakaumien varianssit ovat lähellä toisiaan: 2 D( X ) = µ = λ = np npq koska p 0 q = 1 p 1 TKK (c) Ilkka Mellin (2005) 125
Poisson-jakauma Binomijakauma ja Poisson-jakauma: Todistus 1/3 Olkoon X Bin(n, p). Tällöin n x n x fx ( x) = p q, q 1 p, x 0,1,2,, n x = = Oletetaan, että n + ja samaan aikaan p 0 niin, että np = λ jossa λ > 0 on vakio. TKK (c) Ilkka Mellin (2005) 126
Poisson-jakauma Binomijakauma ja Poisson-jakauma: Todistus 2/3 Ottamalla huomioon, että np = λ ja q = 1 p, voimme kirjoittaa n x n x fx ( x) = p q x nn ( 1)( n 2) ( n x+ 1) ( ) x (1 ) n x = np p x nx! x n nn ( 1)( n 2) ( n x+ 1) λ (1 p) = x x n x! (1 p) x 1 2 x 1 λ (1 p) = 11 1 1 n n n x! (1 p) n x TKK (c) Ilkka Mellin (2005) 127
Poisson-jakauma Binomijakauma ja Poisson-jakauma: Todistus 3/3 Kirjoitetaan n 1/ p np 1/ p (1 p) = [(1 p) ] = [(1 p) ] Luvun e määritelmän mukaan 1/ p λ λ (1) lim[(1 p) ] = e p 0 λ Lisäksi pätee: (2) 1 2 x 1 lim1 1 1 = 1 n n n n (3) x lim(1 p) = 1 p 0 Yhdistämällä tulokset (1), (2) ja (3) saadaan haluttu lopputulos: e lim f ( x) = n p 0 np= λ X λ x λ x! TKK (c) Ilkka Mellin (2005) 128
Poisson-jakauma Poisson-prosessi Tarkastellaan jonkin tapahtuman A sattumista jatkuvalla aikavälillä, jonka pituus on t aikayksikköä. Määritellään diskreetti satunnaismuuttuja X: X = Niiden tapahtumien lukumäärä, jotka sattuvat aikavälillä [0, t] Sopivin oletuksin (ks. edellä) satunnaismuuttuja X noudattaa Poisson-jakaumaa parametrinaan νt: X Poisson(νt) Parametri νt kuvaa tapahtumaintensiteettiä eli tapahtumien keskimääräistä lukumäärää aikavälillä, jonka pituus on t aikayksikköä. TKK (c) Ilkka Mellin (2005) 129
Poisson-jakauma Poisson-prosessi ja eksponenttijakauma Olkoon X Poisson(νt) Määritellään jatkuva satunnaismuuttuja Y: Y = Ensimmäisen tapahtuman sattumisaika = Tapahtumien väliaika Satunnaismuuttuja Y noudattaa eksponenttijakaumaa parametrinaan ν. Ks. tarkemmin lukua Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 130
Poisson-jakauma Poisson-prosessi: Esimerkki Tarkastellaan radioaktiivista hajoamista. Olkoon satunnaismuuttuja X = aikavälillä [0, t] hajoavien atomien lukumäärä Tällöin X Poisson(νt) jossa ν on alkuainekohtainen parametri, joka kuvaa keskimäärin aikayksikköä kohden hajoavien atomien lukumäärää. TKK (c) Ilkka Mellin (2005) 131