Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat TKK (c) Ilkka Mellin (2005) 1
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat Kaksiulotteiset todennäköisyysjakaumat Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Kaksiulotteisten jakaumien odotusarvot ja varianssit Kovarianssi ja korrelaatio Ehdolliset jakaumat ja odotusarvot TKK (c) Ilkka Mellin (2005) 2
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat: Mitä opimme? 1/5 Yhden satunnaismuuttujan todennäköisyysjakaumat kuvaavat useimpia satunnaisilmiötä vain rajoitetusti. Satunnaisilmiöihin liittyy tavallisesti useita satunnaisia tekijöitä, joiden väliset riippuvuudet ovat varsinaisen mielenkiinnon kohteina. Useiden satunnaisten tekijöiden välisten riippuvuuksien mallintaminen vaatii tekijöihin liittyvien satunnaismuuttujien yhteisjakauman tarkastelua. Jos usean satunnaismuuttujan yhteisjakauma tunnetaan, hallitaan myös muuttujien erilaisten kombinaatioiden muodostamat reunajakaumat. Satunnaismuuttujat ovat riippumattomia, jos ja vain jos niiden yhteisjakauman pistetodennäköisyys- tai tiheysfunktio voidaan esittää reunajakaumien pistetodennäköisyys- tai tiheysfunktioiden tulona. TKK (c) Ilkka Mellin (2005) 3
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat: Mitä opimme? 2/5 Usean satunnaismuuttujan yhteisjakauman karakteristisia ominaisuuksia kuvataan erilaisilla tunnusluvuilla. Yhteisjakauman satunnaismuuttujien odotusarvot määräävät ko. satunnaismuuttujien reunajakaumien todennäköisyysmassojen painopisteet. Yhteisjakauman satunnaismuuttujien odotusarvot määräävät yhdessä ko. satunnaismuuttujien yhteisjakauman todennäköisyysmassan painopisteen. Yhteisjakaumien satunnaismuuttujien varianssit tai standardipoikkeamat kuvaavat ko. satunnaismuuttujien reunajakaumien todennäköisyysmassan vaihtelua omien odotusarvojensa ympärillä. TKK (c) Ilkka Mellin (2005) 4
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat: Mitä opimme? 3/5 Satunnaismuuttujien X ja Y kovarianssi kuvaa satunnaismuuttujien X ja Y yhteisjakauman todennäköisyysmassan yhteisvaihtelua niiden odotusarvojen muodostaman lukuparin määräämän pisteen ympärillä. Kahden satunnaismuuttujan X ja Y lineaarisen riippuvuuden voimakkuutta kuvataan muuttujien korrelaatiolla. Satunnaismuuttujien X ja Y korrelaatiokertoimella Cor(X,Y) on seuraavat ominaisuudet: (i) 1 Cor(X,Y) +1 (ii) Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin Cor(X,Y) = 0 (iii) Jos Cor(X,Y) = ±1 niin satunnaismuuttujien välillä on eksakti lineaarinen riippuvuus. TKK (c) Ilkka Mellin (2005) 5
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat: Mitä opimme? 4/5 Mitä suurempi on Cor(X,Y) sitä voimakkaammin muuttujat X ja Y riippuvat lineaarisesti toisistaan. Satunnaismuuttujien riippumattomuudesta seuraa aina niiden korreloimattomuus, mutta satunnaismuuttujien korreloimattomuudesta ei välttämättä seuraa niiden riippumattomuutta. TKK (c) Ilkka Mellin (2005) 6
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat: Mitä opimme? 5/5 Satunnaismuuttujien välisiä riippuvuuksia voidaan luonnehtia ns. ehdollisten jakaumien avulla. Ehdollisen jakauman odotusarvoa kutsutaan ehdolliseksi odotusarvoksi ja ehdollisen jakauman varianssia kutsutaan ehdolliseksi varianssiksi. Ehdollista odotusarvoa kutsutaan ehtomuuttujien arvojen funktiona regressiofunktioksi. Regressiofunktioita käytetään apuna, kun satunnaismuuttujan käyttäytymistä pyritään ennustamaan toisten satunnaismuuttujien saamien arvojen avulla. Regressiofunktiot muodostavat teoreettisen perustan tilastotieteen ehkä tärkeimmälle menetelmälle regressioanalyysille; ks. lukuja Johdatus regressioanalyysiin ja Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 7
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat: Esitiedot Esitiedot: ks. seuraavia lukuja: Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut TKK (c) Ilkka Mellin (2005) 8
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat: Lisätiedot Kahta tärkeätä moniulotteista jakaumaa (multinomi- ja kaksiulotteista normaalijakaumaa) esitellään luvussa Moniulotteisia jakaumia TKK (c) Ilkka Mellin (2005) 9
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat: Huomautus Vaikka tässä luvussa rajoitutaan pääasiassa kaksiulotteisiin todennäköisyysjakaumiin, esitetty teoria voidaan ilmeisellä tavalla laajentaa useampiulotteisiin todennäköisyysjakaumiin. TKK (c) Ilkka Mellin (2005) 10
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat >> Kaksiulotteiset todennäköisyysjakaumat Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Kaksiulotteisten jakaumien odotusarvot ja varianssit Kovarianssi ja korrelaatio Ehdolliset jakaumat ja odotusarvot TKK (c) Ilkka Mellin (2005) 11
Kaksiulotteiset todennäköisyysjakaumat Avainsanat Diskreetti kaksiulotteinen jakauma Diskreetti kaksiulotteinen satunnaismuuttuja Jatkuva kaksiulotteinen jakauma Jatkuva kaksiulotteinen satunnaismuuttuja Kaksiulotteinen satunnaismuuttuja Kaksiulotteinen todennäköisyysjakauma Kertymäfunktio Pistetodennäköisyysfunktio Symmetrinen todennäköisyyskenttä Tiheysfunktio Yhteisjakauma TKK (c) Ilkka Mellin (2005) 12
Kaksiulotteiset todennäköisyysjakaumat Satunnaistekijöiden väliset riippuvuudet Yhden satunnaismuuttujan todennäköisyysjakaumat kuvaavat useimpia satunnaisilmiötä vain rajoitetusti. Satunnaisilmiöihin liittyy tavallisesti useita satunnaisia tekijöitä, joiden väliset riippuvuudet ovat mielenkiinnon kohteina. Useiden satunnaisten tekijöiden välisten riippuvuuksien mallintaminen vaatii tekijöihin liittyvien satunnaismuuttujien yhteisjakauman tarkastelua. TKK (c) Ilkka Mellin (2005) 13
Kaksiulotteiset todennäköisyysjakaumat Esimerkkejä riippuvuustarkasteluista Miten työttömyysaste Suomessa (% työvoimasta) riippuu BKT:n kasvuvauhdista, viennin volyymista ja BKT:n kasvuvauhdista muissa EUmaissa ja USA:ssa? Miten alkoholin kokonaiskulutus (l per capita vuodessa) riippuu alkoholijuomien hintatasosta, käytettävissä olevista tuloista ja alkoholin saatavuudesta? Miten todennäköisyys sairastua keuhkosyöpään (p) riippuu tupakoinnin määrästä ja kestosta? Miten vehnän sato (t/ha) riippuu kesän keskilämpötilasta, sademäärästä, maan muokkaustavoista, lannoituksesta ja tuholaisten torjunnasta? TKK (c) Ilkka Mellin (2005) 14
Kaksiulotteiset todennäköisyysjakaumat Kaksiulotteiset satunnaismuuttujat Olkoot X ja Y satunnaismuuttujia, joiden otosavaruudet ovat R ja S. Tällöin X : S Y : R Olkoon R S otosavaruuksien R ja S karteesinen tulo: R S = {(,) r s r R, s S} Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan: ( XY, ): S R 2 TKK (c) Ilkka Mellin (2005) 15
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset satunnaismuuttujat ja niiden jakaumat Olkoot X ja Y diskreettejä satunnaismuuttujia. Tällöin järjestetty pari (X, Y) määrittelee diskreetin kaksiulotteisen satunnaismuuttujan. Diskreetti kaksiulotteinen satunnaismuuttuja (X, Y) määrittelee diskreetin kaksiulotteisen todennäköisyysjakauman, jota kutsutaan satunnaismuuttujien X ja Y yhteisjakaumaksi. TKK (c) Ilkka Mellin (2005) 16
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: Pistetodennäköisyysfunktio Reaaliarvoinen funktio f XY määrittelee diskreettien satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktion, jos seuraavat ehdot pätevät: (1) f ( xy, ) 0 kaikille xja y XY 2 : 4 4 (2) fxy ( x, y ) = 1 x y (3) Pr( X = x ja Y = y) = f ( x, y) XY TKK (c) Ilkka Mellin (2005) 17
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: Tapahtumien todennäköisyydet Olkoon f XY diskreettien satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio. Olkoon 2 A 4 jokin tapahtuma. Tällöin 2 : 4 4 = Pr(( X, Y) A) f ( x, y) ( xy, ) A XY TKK (c) Ilkka Mellin (2005) 18
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: Symmetriset todennäköisyyskentät Olkoon (x i, y i ), i = 1, 2,, n erillisten tason pisteiden muodostama diskreetti pistejoukko. Määritellään diskreetin kaksiulotteisen jakauman pistetodennäköisyysfunktio kaavalla 1 f XY ( xi, yi ) = Pr( X = xi ja Y = yi ) =, i= 1,2,..., n n Tällöin satunnaismuuttuja (X, Y) määrittelee symmetrisen todennäköisyyskentän, jossa kaikki alkeistapahtumat (x i, y i ), i = 1, 2,, n ovat yhtä todennäköisiä. TKK (c) Ilkka Mellin (2005) 19
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 1. esimerkki nopanheitosta 1/6 Heitetään virheetöntä noppaa kaksi kertaa. Määritellään satunnaismuuttujat X ja Y: X = tulos (silmäluku) 1. heitosta Y = tulos (silmäluku) 2. heitosta Voimme olettaa, että 2. heiton tulos on riippumaton 1. heiton tuloksesta (ja kääntäen). Satunnaismuuttujien X ja Y mahdolliset arvot: X: {1, 2, 3, 4, 5, 6} Y: {1, 2, 3, 4, 5, 6} Muodostetaan satunnaismuuttujien X ja Y yhteisjakauma. TKK (c) Ilkka Mellin (2005) 20
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 1. esimerkki nopanheitosta 2/6 Kahden nopanheiton tulosvaihtoehdot voidaan esittää seuraavana taulukkona: Tulos 1. nopanheitosta Mahdolliset tulokset 2. nopanheitosta 1 1 2 3 4 5 6 2 1 2 3 4 5 6 3 1 2 3 4 5 6 4 1 2 3 4 5 6 5 1 2 3 4 5 6 6 1 2 3 4 5 6 Siten satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee diskreetin kaksiulotteisen satunnaismuuttujan, jonka arvoina on 36 lukuparia (x, y) ; x = 1, 2, 3, 4, 5, 6 ; y = 1, 2, 3, 4, 5, 6 TKK (c) Ilkka Mellin (2005) 21
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 1. esimerkki nopanheitosta 3/6 Koska noppa oletettiin virheettömäksi ja heittojen tulokset oletettiin riippumattomiksi, on luontevaa ajatella, että kahden nopanheiton tulosten muodostamat 36 tulosvaihtoehtoa (x, y) ; x = 1, 2, 3, 4, 5, 6 ; y = 1, 2, 3, 4, 5, 6 ovat yhtä todennäköisiä. Tällöin satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio saa positiiviset arvot kun 1 fxy ( x, y) = Pr( X = x, Y = y) = 36 x = 1, 2, 3, 4, 5, 6 y = 1, 2, 3, 4, 5, 6 TKK (c) Ilkka Mellin (2005) 22
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 1. esimerkki nopanheitosta 4/6 Satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio voidaan esittää seuraavana taulukkona: 2. heiton silmäluku y 1 fxy ( x, y) = Pr( X = x ja Y = y) = 36 x= 1,2,3,4,5,6 ; y = 1,2,3,4,5,6 6 1/36 1/36 1/36 1/36 1/36 1/36 5 1/36 1/36 1/36 1/36 1/36 1/36 4 1/36 1/36 1/36 1/36 1/36 1/36 3 1/36 1/36 1/36 1/36 1/36 1/36 2 1/36 1/36 1/36 1/36 1/36 1/36 1 1/36 1/36 1/36 1/36 1/36 1/36 1 2 3 4 5 6 1. heiton silmäluku x TKK (c) Ilkka Mellin (2005) 23
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 1. esimerkki nopanheitosta 5/6 Heitetään virheetöntä noppaa kaksi kertaa: X = tulos 1. heitosta Y = tulos 2. heitosta Kuva oikealla esittää satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktiota. Kuvassa on 36 pylvästä, joista jokaisen korkeus 1/36. 0.04 0.03 0.02 0.01 0.00 1 2 3 4 x 5 6 1 2 3 6 5 4 y TKK (c) Ilkka Mellin (2005) 24
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 1. esimerkki nopanheitosta 6/6 Heitetään virheetöntä noppaa kaksi kertaa: X = tulos 1. heitosta Y = tulos 2. heitosta Kuva oikealla havainnollistaa satunnaismuuttujien X ja Y yhteisjakaumaa. Kuvassa on 36 pistettä, joista jokaisen todennäköisyys on 1/36. 2. heitto 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 1. heitto TKK (c) Ilkka Mellin (2005) 25
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 2. esimerkki nopanheitosta 1/9 Heitetään virheetöntä noppaa kaksi kertaa. Määritellään satunnaismuuttujat X, Y ja Z: X = tulos (silmäluku) 1. heitosta Y = tulos (silmäluku) 2. heitosta Z = X + Y = silmälukujen summa Voimme olettaa, että 2. heiton tulos on riippumaton 1. heiton tuloksesta (ja kääntäen). Satunnaismuuttujien X, Y ja Z mahdolliset arvot: X: {1, 2, 3, 4, 5, 6} Y: {1, 2, 3, 4, 5, 6} Z: {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} Määrätään satunnaismuuttujien X ja Z yhteisjakauma. TKK (c) Ilkka Mellin (2005) 26
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 2. esimerkki nopanheitosta 2/9 Muodostetaan ensin summamuuttujan Z = X + Y jakauma. Muodostetaan sitä varten aputaulukko, joka esittää kaikkia mahdollisia tapoja, joilla nopanheittojen silmälukujen summa Z = X + Y voi syntyä: 2. heiton silmäluku y Silmälukujen summat z = x + y 6 7 8 9 10 11 12 5 6 7 8 9 10 11 4 5 6 7 8 9 10 3 4 5 6 7 8 9 2 3 4 5 6 7 8 1 2 3 4 5 6 7 1 2 3 4 5 6 1. heiton silmäluku x TKK (c) Ilkka Mellin (2005) 27
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 2. esimerkki nopanheitosta 3/9 Aputaulukosta voidaan suoraan lukea 1. ja 2. nopanheiton silmälukujen summan Z = X + Y todennäköisyysjakauma: I Silmälukujen summat z = x + y ja niiden todennäköisyydet 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Esimerkki: Summa 5 voi syntyä kahden nopanheiton tuloksena 4:llä eri tavalla: 5 = 1 + 4 = 2 + 3 = 3 + 2 = 4 + 1 joten todennäköisyys saada summaksi 5 on 4/36. TKK (c) Ilkka Mellin (2005) 28
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 2. esimerkki nopanheitosta 4/9 1. nopanheiton tulos ja 1. ja 2. nopanheiton tulosten kaikki mahdolliset summat voidaan esittää seuraavana taulukkona: Tulos 1. nopanheitosta Mahdolliset summat 1. ja 2. nopanheiton tuloksista 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 Siten satunnaismuuttujien X ja Z = X + Y järjestetty pari (X, Z) määrittelee diskreetin kaksiulotteisen satunnaismuuttujan, jonka arvoina on 66 lukuparia (x, z) ; x = 1, 2, 3, 4, 5, 6 ; z = 2, 3, 4, 5, 6, 7, 8, 10, 11, 12 TKK (c) Ilkka Mellin (2005) 29
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 2. esimerkki nopanheitosta 5/9 Koska noppa oletettiin virheettömäksi ja heittojen tulokset oletettiin riippumattomiksi, on luontevaa ajatella, että 1. heiton tulos ja 1. ja 2. heiton tulosten mahdollisten summien muodostamat 36 tulosvaihtoehtoa (x, z) ; x = 1, 2, 3, 4, 5, 6 ; z = x + y ; y = 1, 2, 3, 4, 5, 6 ovat yhtä todennäköisiä. Tällöin satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktion saa positiiviset arvot kun 1 fxz ( x, z) = Pr( X = z ja Z = z) = 36 x = 1, 2, 3, 4, 5, 6 z = x + y y = 1, 2, 3, 4, 5, 6 TKK (c) Ilkka Mellin (2005) 30
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 2. esimerkki nopanheitosta 6/9 Satunnaismuuttujien X ja Z = X + Y yhteisjakauman pistetodennäköisyysfunktio voidaan esittää seuraavana taulukkona: Silmälukujen summa z 12 0 0 0 0 0 1/36 11 0 0 0 0 1/36 1/36 10 0 0 0 1/36 1/36 1/36 9 0 0 1/36 1/36 1/36 1/36 8 0 1/36 1/36 1/36 1/36 1/36 7 1/36 1/36 1/36 1/36 1/36 1/36 6 1/36 1/36 1/36 1/36 1/36 0 5 1/36 1/36 1/36 1/36 0 0 4 1/36 1/36 1/36 0 0 0 3 1/36 1/36 0 0 0 0 2 1/36 0 0 0 0 0 1 2 3 4 5 6 1. nopan silmäluku x TKK (c) Ilkka Mellin (2005) 31
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 2. esimerkki nopanheitosta 7/9 Esimerkkejä: (i) Oletetaan, että 1. nopalla on saatu 2. Tällöin silmälukujen summaksi ei voi tulla 10, joten Pr(X = 1 ja Z = 10) = 0 (ii) Oletetaan, että 1. nopalla on saatu 6. Tällöin silmälukujen summaksi ei voi tulla 3, joten Pr(X = 6 ja Z = 3) = 0 (iii) Oletetaan, että 1. nopalla on saatu 2. Tällöin silmälukujen summaksi voi tulla 3, 4, 5, 6, 7 tai 8, joten Pr(X = 1 ja Z = z) = 1/36 ; z = 3, 4, 5, 6, 7, 8 (iv) Oletetaan, että 1. nopalla on saatu 6. Tällöin silmälukujen summaksi voi tulla 7, 8, 9, 10, 11 tai 12, joten Pr(X = 6 ja Z = z) = 1/36 ; z = 7, 8, 9, 10, 11, 12 TKK (c) Ilkka Mellin (2005) 32
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 2. esimerkki nopanheitosta 8/9 Heitetään virheetöntä noppaa kaksi kertaa: X = tulos 1. heitosta Y = tulos 2. heitosta Z = X + Y Kuva oikealla esittää satunnaismuuttujien X ja Z yhteisjakauman pistetodennäköisyysfunktiota. Kuvassa on 36 pylvästä, joista jokaisen korkeus on 1/36. 1 2 3 4 5 6 x 2 3 4 5 6 7 8 z 12 11 10 9 0.01 0.00 0.03 0.02 0.04 TKK (c) Ilkka Mellin (2005) 33
Kaksiulotteiset todennäköisyysjakaumat Diskreetit kaksiulotteiset jakaumat: 2. esimerkki nopanheitosta 9/9 Heitetään virheetöntä noppaa kaksi kertaa: X = tulos 1. heitosta Y = tulos 2. heitosta Z = X + Y Kuva oikealla havainnollistaa satunnaismuuttujien X ja Z yhteisjakaumaa. Kuvassa on 36 pistettä, joista jokaisen todennäköisyys on 1/36. Heittotulosten summa 13 12 11 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 1. heitto TKK (c) Ilkka Mellin (2005) 34
Kaksiulotteiset todennäköisyysjakaumat Jatkuvat kaksiulotteiset satunnaismuuttujat ja niiden jakaumat Olkoot X ja Yjatkuviasatunnaismuuttujia. Tällöin järjestetty pari (X, Y) määrittelee jatkuvan kaksiulotteisen satunnaismuuttujan. Kaksiulotteinen jatkuva satunnaismuuttuja (X, Y) määrittelee jatkuvan kaksiulotteisen todennäköisyysjakauman, jota kutsutaan satunnaismuuttujien X ja Y yhteisjakaumaksi. TKK (c) Ilkka Mellin (2005) 35
Kaksiulotteiset todennäköisyysjakaumat Jatkuvat kaksiulotteiset jakaumat: Tiheysfunktio Reaaliarvoinen jatkuva funktio f XY määrittelee jatkuvien satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktion, jos seuraavat ehdot pätevät: (1) f ( xy, ) 0 kaikille xja y XY 2 : 4 4 + + (2) f ( x, y) dydx = 1 XY (3) Pr( a X b ja c Y d) = fxy ( x, y) dydx bd ac TKK (c) Ilkka Mellin (2005) 36
Kaksiulotteiset todennäköisyysjakaumat Kaksinkertaiset integraalit: Integrointijärjestys Huomautus: Käytämme kaksinkertaisten integraalien yhteydessä seuraavaa sopimusta integrointijärjestyksestä: bd b d fxy ( x, y) dydx= fxy ( x, y) dy dx a c a c TKK (c) Ilkka Mellin (2005) 37
Kaksiulotteiset todennäköisyysjakaumat Jatkuvat kaksiulotteiset jakaumat: Tapahtumien todennäköisyydet Olkoon f XY jatkuvien satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio. Olkoon 2 A 4 jokin tapahtuma. Tällöin 2 : 4 4 = Pr(( X, Y) A) f ( x, y) dydx A XY TKK (c) Ilkka Mellin (2005) 38
Kaksiulotteiset todennäköisyysjakaumat Kaksiulotteisten jakaumien kertymäfunktiot Olkoon (X, Y) satunnaismuuttujien X ja Y muodostama järjestetty pari. Satunnaismuuttujien X ja Y yhteisjakauman kertymäfunktio F XY määritellään kaavalla: F ( x, y) = Pr( X x ja Y y) XY TKK (c) Ilkka Mellin (2005) 39
Kaksiulotteiset todennäköisyysjakaumat Diskreettien kaksiulotteisten jakaumien kertymäfunktiot Olkoon (X, Y) diskreetti kaksiulotteinen satunnaismuuttuja. Olkoon {x 1, x 2, x 3, } satunnaismuuttujan X tulosvaihtoehtojen eli arvojen joukko. Olkoon {y 1, y 2, y 3, } satunnaismuuttujan Y tulosvaihtoehtojen eli arvojen joukko. Diskreetin kaksiulotteisen jakauman kertymäfunktio on F ( x, y) = Pr( X x ja Y y) XY = x x y y i i f ( x, y ) XY i i jossa f XY satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio. TKK (c) Ilkka Mellin (2005) 40
Kaksiulotteiset todennäköisyysjakaumat Jatkuvien kaksiulotteisten jakaumien kertymäfunktiot Olkoon (X, Y) jatkuva kaksiulotteinen satunnaismuuttuja. Jatkuvan kaksiulotteisen jakauman kertymäfunktio on F ( x, y) = Pr( X x ja Y y) XY x y = f XY ( u, v) dvdu jossa f XY satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio. TKK (c) Ilkka Mellin (2005) 41
Kaksiulotteiset todennäköisyysjakaumat Jatkuvan kaksiulotteisen jakauman tiheysfunktion ja kertymäfunktion yhteys Olkoon (X, Y) jatkuva kaksiulotteinen satunnaismuuttuja. Olkoon F XY (x, y) satunnaismuuttujien X ja Y yhteisjakauman kertymäfunktio. Jos derivaatta 2 FXY ( x, y) = f XY ( xy, ) xy on olemassa ja on jatkuva, funktio f XY (x, y) on satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio. TKK (c) Ilkka Mellin (2005) 42
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat Kaksiulotteiset todennäköisyysjakaumat >> Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Kaksiulotteisten jakaumien odotusarvot ja varianssit Kovarianssi ja korrelaatio Ehdolliset jakaumat ja odotusarvot TKK (c) Ilkka Mellin (2005) 43
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Avainsanat Diskreetin kaksiulotteisen jakauman reunajakaumat Jatkuvan kaksiulotteisen jakauman reunajakaumat Kertymäfunktio Pistetodennäköisyysfunktio Reunajakaumat Riippumattomuus Tiheysfunktio Yhteisjakauma TKK (c) Ilkka Mellin (2005) 44
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin kaksiulotteisen jakauman reunajakaumat Olkoon f XY (x, y) diskreetin kaksiulotteisen jakauman pistetodennäköisyysfunktio. Satunnaismuuttujan X reunajakauman pistetodennäköisyysfunktio on f X( x) = Pr( X = x) = fxy( x, y) Satunnaismuuttujan Y reunajakauman pistetodennäköisyysfunktio on fy( y) = Pr( Y = y) = fxy( x, y) Satunnaismuuttujien X ja Y reunajakaumat yhtyvät satunnaismuuttujien X ja Y todennäköisyysjakaumiin. x y TKK (c) Ilkka Mellin (2005) 45
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 1. esimerkki nopanheitosta 1/5 Heitetään virheetöntä noppaa kaksi kertaa. Määritellään satunnaismuuttujat X ja Y: X = tulos (silmäluku) 1. heitosta Y = tulos (silmäluku) 2. heitosta Satunnaismuuttujien X ja Y mahdolliset arvot: X: {1, 2, 3, 4, 5, 6} Y: {1, 2, 3, 4, 5, 6} Määrätään satunnaismuuttujien X ja Y reunajakaumat. TKK (c) Ilkka Mellin (2005) 46
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 1. esimerkki nopanheitosta 2/5 Satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio: Pr(X = x ja Y = y) = f XY (x, y) ; x = 1, 2,, 6 ; y = 1, 2,, 6 2. heiton silmäluku y 1. heiton silmäluku x 1 2 3 4 5 6 6 1/36 1/36 1/36 1/36 1/36 1/36 5 1/36 1/36 1/36 1/36 1/36 1/36 4 1/36 1/36 1/36 1/36 1/36 1/36 3 1/36 1/36 1/36 1/36 1/36 1/36 2 1/36 1/36 1/36 1/36 1/36 1/36 1 1/36 1/36 1/36 1/36 1/36 1/36 TKK (c) Ilkka Mellin (2005) 47
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 1. esimerkki nopanheitosta 3/5 Satunnaismuuttujien X ja Y reunajakaumien pistetodennäköisyysfunktiot saadaan määräämällä yhteisjakauman todennäköisyydet antavassa taulukossa rivi-ja sarakesummat. Satunnaismuuttujan X reunajakauman pistetodennäköisyysfunktio on 6 1 1 fx( x) = Pr( X = x) = fxy( x, y) = 6 = ; x= 1,2,3,4,5,6 y= 1 36 6 koska 1 fxy ( x, y) = ; x= 1, 2,3, 4,5,6 ; y = 1, 2,3, 4,5,6 36 Satunnaismuuttujan Y reunajakauman pistetodennäköisyysfunktio on 6 1 1 fy( y) = Pr( Y = y) = fxy( x, y) = 6 = ; y = 1,2,3,4,5,6 x= 1 36 6 koska 1 fxy ( x, y) = ; x= 1, 2,3, 4,5,6 ; y = 1, 2,3, 4,5,6 36 TKK (c) Ilkka Mellin (2005) 48
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 1. esimerkki nopanheitosta 4/5 Satunnaismuuttujien X ja Y yhteisjakauman ja reunajakaumien pistetodennäköisyysfunktiot: 2. heiton silmäluku y 1. heiton silmäluku x 1 2 3 4 5 6 Yht 6 1/36 1/36 1/36 1/36 1/36 1/36 1/6 5 1/36 1/36 1/36 1/36 1/36 1/36 1/6 4 1/36 1/36 1/36 1/36 1/36 1/36 1/6 3 1/36 1/36 1/36 1/36 1/36 1/36 1/6 2 1/36 1/36 1/36 1/36 1/36 1/36 1/6 1 1/36 1/36 1/36 1/36 1/36 1/36 1/6 Yht 1/6 1/6 1/6 1/6 1/6 1/6 1 TKK (c) Ilkka Mellin (2005) 49
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 1. esimerkki nopanheitosta 5/5 0.3 1. heiton tuloksen jakauma 2. heiton tuloksen jakauma 0.3 0.2 0.2 0.1 0.1 0 1 2 3 4 5 6 0 1 2 3 4 5 6 Kuvat yllä esittävät satunnaismuuttujien X ja Y reunajakaumien pistetodennäköisyysfunktioita: X = tulos 1. heitosta Y = tulos 2. heitosta TKK (c) Ilkka Mellin (2005) 50
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 2. esimerkki nopanheitosta 1/5 Heitetään virheetöntä noppaa kaksi kertaa. Määritellään satunnaismuuttujat X, Y ja Z seuraavasti: X = tulos (silmäluku) 1. heitosta Y = tulos (silmäluku) 2. heitosta Z = X + Y = silmälukujen summa Satunnaismuuttujien X, Y ja Z mahdolliset arvot: X: {1, 2, 3, 4, 5, 6} Y: {1, 2, 3, 4, 5, 6} Z: {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} Määrätään satunnaismuuttujien X ja Z reunajakaumat. TKK (c) Ilkka Mellin (2005) 51
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 2. esimerkki nopanheitosta 2/5 Satunnaismuuttujien X ja Z yhteisjakauman pistetodennäköisyysfunktio: Pr(X = x ja Z = z) = f XZ (x, z) ; x = 1, 2,, 6 ; z = 2, 3,, 12 Silmälukujen summa z 1. nopan silmäluku x 1 2 3 4 5 6 12 0 0 0 0 0 1/36 11 0 0 0 0 1/36 1/36 10 0 0 0 1/36 1/36 1/36 9 0 0 1/36 1/36 1/36 1/36 8 0 1/36 1/36 1/36 1/36 1/36 7 1/36 1/36 1/36 1/36 1/36 1/36 6 1/36 1/36 1/36 1/36 1/36 0 5 1/36 1/36 1/36 1/36 0 0 4 1/36 1/36 1/36 0 0 0 3 1/36 1/36 0 0 0 0 2 1/36 0 0 0 0 0 TKK (c) Ilkka Mellin (2005) 52
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 2. esimerkki nopanheitosta 3/5 Satunnaismuuttujien X ja Y reunajakaumien pistetodennäköisyysfunktiot saadaan määräämällä yhteisjakauman todennäköisyydet antavassa taulukossa rivi-ja sarakesummat. Esimerkkejä: (i) Satunnaismuuttujan X reunajakauman pistetodennäköisyys, kun X = 4: (ii) 12 f (4) = f (4, z) X z= 1 XZ 1 1 1 1 1 1 1 = 0+ 0+ + + + + + + 0+ 0+ 0= 36 36 36 36 36 36 6 Satunnaismuuttujan Z reunajakauman pistetodennäköisyys, kun Z = 10: 6 1 1 1 3 fz(10) = fxz( x,10) = 0 + 0 + 0 + + + = 36 36 36 36 x= 1 TKK (c) Ilkka Mellin (2005) 53
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 2. esimerkki nopanheitosta 4/5 Satunnaismuuttujien X ja Z = X + Y yhteisjakauma ja reunajakaumat: Silmälukujen summa z 1. nopan silmäluku x 1 2 3 4 5 6 Yht 12 0 0 0 0 0 1/36 1/36 11 0 0 0 0 1/36 1/36 2/36 10 0 0 0 1/36 1/36 1/36 3/36 9 0 0 1/36 1/36 1/36 1/36 4/36 8 0 1/36 1/36 1/36 1/36 1/36 5/36 7 1/36 1/36 1/36 1/36 1/36 1/36 6/36 6 1/36 1/36 1/36 1/36 1/36 0 5/36 5 1/36 1/36 1/36 1/36 0 0 4/36 4 1/36 1/36 1/36 0 0 0 3/36 3 1/36 1/36 0 0 0 0 2/36 2 1/36 0 0 0 0 0 1/36 Yht 1/6 1/6 1/6 1/6 1/6 1/6 1 TKK (c) Ilkka Mellin (2005) 54
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Diskreetin 2-ulotteisen jakauman reunajakaumat: 2. esimerkki nopanheitosta 5/5 0.3 1. heiton tuloksen jakauma Heittotuloksien summan jakauma 0.3 0.2 0.2 0.1 0.1 0.0 1 2 3 4 5 6 7 8 9 10 11 12 0.0 1 2 3 4 5 6 7 8 9 10 11 12 Kuvat yllä esittävät satunnaismuuttujien X ja Z reunajakaumien pistetodennäköisyysfunktioita: X = tulos 1. heitosta Y = tulos 2. heitosta Z = X + Y = heittotulosten summa TKK (c) Ilkka Mellin (2005) 55
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Jatkuvan kaksiulotteisen jakauman reunajakaumat Olkoon f XY (x, y) jatkuvan kaksiulotteisen jakauman tiheysfunktio. Satunnaismuuttujan X reunajakauman tiheysfunktio on + f X( x) = fxy( x, y) dy Satunnaismuuttujan Y reunajakauman tiheysfunktio on + fy( y) = fxy( x, y) dx Satunnaismuuttujien X ja Y reunajakaumat yhtyvät satunnaismuuttujien X ja Y todennäköisyysjakaumiin. TKK (c) Ilkka Mellin (2005) 56
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Satunnaismuuttujien riippumattomuus 1/2 Oletukset: (i) Olkoon satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyys- tai tiheysfunktio f XY (x, y). (ii) Olkoon satunnaismuuttujan X reunajakauman pistetodennäköisyys- tai tiheysfunktio f X (x). Olkoon satunnaismuuttujan Y reunajakauman pistetodennäköisyys- tai tiheysfunktio f Y (y). Määritelmä 1: Satunnaismuuttujat X ja Y ovat riippumattomia, jos ja vain, jos f XY (x, y) = f X (x)f Y (y) TKK (c) Ilkka Mellin (2005) 57
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Satunnaismuuttujien riippumattomuus 2/2 Oletukset: (i) Olkoon satunnaismuuttujien X ja Y yhteisjakauman kertymäfunktio F XY (x, y). (ii) Olkoon satunnaismuuttujan X reunajakauman kertymäfunktio F X (x). Olkoon satunnaismuuttujan Y reunajakauman kertymäfunktio F Y (y). Määritelmä 2: Satunnaismuuttujat X ja Y ovat riippumattomia, jos ja vain, jos F XY (x, y) = F X (x)f Y (y) TKK (c) Ilkka Mellin (2005) 58
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Satunnaismuuttujien riippumattomuus: Yleistys 1/2 Oletukset: (i) Olkoon satunnaismuuttujien X i, i = 1, 2,, p yhteisjakauman pistetodennäköisyys- tai tiheysfunktio f(x 1, x 2,, x p ) (ii) Olkoot satunnaismuuttujien X i, i = 1, 2,, p reunajakaumien pistetodennäköisyys- tai tiheysfunktiot f(x i ), i = 1, 2,, p. Määritelmä 1: Satunnaismuuttujat X i, i = 1, 2,, p ovat riippumattomia, jos ja vain, jos f(x 1, x 2,, x p ) = f(x 1 )f(x 2 ) f(x p ) TKK (c) Ilkka Mellin (2005) 59
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Satunnaismuuttujien riippumattomuus: Yleistys 2/2 Oletukset: (i) Olkoon satunnaismuuttujien X i, i = 1, 2,, p yhteisjakauman kertymäfunktio F(x 1, x 2,, x p ) (ii) Olkoot satunnaismuuttujien X i, i = 1, 2,, p reunajakaumien kertymäfunktiot F(x i ), i = 1, 2,, p. Määritelmä 2: Satunnaismuuttujat X i, i = 1, 2,, p ovat riippumattomia, jos ja vain, jos F(x 1, x 2,, x p ) = F(x 1 )F(x 2 ) F(x p ) TKK (c) Ilkka Mellin (2005) 60
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Satunnaismuuttujien riippumattomuus ja tapahtumien riippumattomuus Olkoot satunnaismuuttujat X ja Y riippumattomia. Tällöin Pr( a X b ja c Y d) = Pr( a X b)pr( c Y d) Huomautus: Vrt. riippumattomien tapahtumien tulosääntö: Pr(A B) = Pr(A)Pr(B) TKK (c) Ilkka Mellin (2005) 61
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Satunnaismuuttujien riippumattomuus ja tapahtumien riippumattomuus: Perustelu Olkoot satunnaismuuttujat X ja Y jatkuvia ja riippumattomia. Pr( a X b ja c Y d) = f ( x, y) dydx = = f ( x) f ( y) dydx f ( x) f ( y) dydx = f ( x)pr( c Y d) dx = Pr( c Y d) f ( x) dx = Pr( c Y d)pr( a X b) TKK (c) Ilkka Mellin (2005) 62 bd ac bd ac b a b a X X XY X d c Y Y b a X
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Satunnaismuuttujien riippumattomuus: 1. esimerkki nopanheitosta Heitetään virheetöntä noppaa kaksi kertaa: X = tulos (silmäluku) 1. heitosta Y = tulos (silmäluku) 2. heitosta Tarkastellaan satunnaismuuttujien X ja Y yhteisjakaumaa: 1 Pr( X = x ja Y = y) = 36 1 1 = 6 6 = Pr( X = x)pr( Y = y) x= 1,2,3,4,5,6 ; y = 1,2,3,4,5,6 Siten satunnaismuuttujat X ja Y ovat riippumattomia. TKK (c) Ilkka Mellin (2005) 63
Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Satunnaismuuttujien riippumattomuus: 2. esimerkki nopanheitosta Heitetään virheetöntä noppaa kaksi kertaa: X = tulos (silmäluku) 1. heitosta Y = tulos (silmäluku) 2. heitosta Z = X + Y = silmälukujen summa Tarkastellaan satunnaismuuttujien X ja Z yhteisjakaumaa. Esimerkiksi: 1 5 Pr( X = 1 ja Z = 8) = 0 = Pr( X = 1)Pr( Z = 8) 6 36 Siten satunnaismuuttujat X ja Z eivät ole riippumattomia. TKK (c) Ilkka Mellin (2005) 64
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat Kaksiulotteiset todennäköisyysjakaumat Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus >> Kaksiulotteisten jakaumien odotusarvot ja varianssit Kovarianssi ja korrelaatio Ehdolliset jakaumat ja odotusarvot TKK (c) Ilkka Mellin (2005) 65
Kaksiulotteisten jakaumien odotusarvot ja varianssit Avainsanat Odotusarvo Painopiste Riippumattomuus Standardipoikkeama Summan odotusarvo Varianssi TKK (c) Ilkka Mellin (2005) 66
Kaksiulotteisten jakaumien odotusarvot ja varianssit Diskreetin kaksiulotteisen satunnaismuuttujan funktion yleinen odotusarvo Olkoon satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio f XY (x, y). Olkoon 2 g : jatkuva funktio. Tällöin satunnaismuuttujan g(x, Y) odotusarvo on vakio E( g( X, Y)) g( x, y) f ( x, y) = x y XY TKK (c) Ilkka Mellin (2005) 67
Kaksiulotteisten jakaumien odotusarvot ja varianssit Jatkuvan kaksiulotteisen satunnaismuuttujan funktion yleinen odotusarvo Olkoon satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio f XY (x, y). Olkoon 2 g : jatkuva funktio. Tällöin satunnaismuuttujan g(x, Y) odotusarvo on vakio + + E( g( X, Y)) g( x, y) f ( x, y) dydx = XY TKK (c) Ilkka Mellin (2005) 68
Kaksiulotteisten jakaumien odotusarvot ja varianssit Reunajakaumien odotusarvot: Diskreetit jakaumat 1/2 Olkoon diskreettien satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio f XY (x, y). Satunnaismuuttujan X odotusarvo E(X) = µ X yhtyy satunnaismuuttujan X reunajakauman odotusarvoon: E( X ) = xf ( x, y) = x f ( x, y) = XY x y x y x xf X ( x) XY TKK (c) Ilkka Mellin (2005) 69
Kaksiulotteisten jakaumien odotusarvot ja varianssit Reunajakaumien odotusarvot: Diskreetit jakaumat 2/2 Olkoon diskreettien satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio f XY (x, y). Satunnaismuuttujan Y odotusarvo E(Y) = µ Y yhtyy satunnaismuuttujan Y reunajakauman odotusarvoon: E( Y) = yf ( x, y) = y f ( x, y) = XY x y y x y yf Y ( y) XY TKK (c) Ilkka Mellin (2005) 70
Kaksiulotteisten jakaumien odotusarvot ja varianssit Reunajakaumien odotusarvot: Jatkuvat jakaumat 1/2 Olkoon jatkuvien satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio f XY (x, y). Satunnaismuuttujan X odotusarvo E(X) = µ X yhtyy satunnaismuuttujan X reunajakauman odotusarvoon: E( X ) = xf ( x, y) dydx = x f ( x, y) dydx = + + + + XY + xf X ( x) dx XY TKK (c) Ilkka Mellin (2005) 71
Kaksiulotteisten jakaumien odotusarvot ja varianssit Reunajakaumien odotusarvot: Jatkuvat jakaumat 2/2 Olkoon jatkuvien satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio f XY (x, y). Satunnaismuuttujan Y odotusarvo E(Y) = µ Y yhtyy satunnaismuuttujan Y reunajakauman odotusarvoon: E( Y) = yf ( x, y) dydx= y f ( x, y) dxdy = + + + + XY + yf Y ( y) dy XY TKK (c) Ilkka Mellin (2005) 72
Kaksiulotteisten jakaumien odotusarvot ja varianssit Odotusarvot ja todennäköisyysmassan painopiste Olkoot satunnaismuuttujien X ja Y odotusarvot E( X ) = µ X E( Y ) = µ Y Tällöin kaksiulotteisen satunnaismuuttujan (X, Y) odotusarvo on järjestetty pari (E( X ),E( Y )) = ( µ X, µ Y) Satunnaismuuttujien X ja Y odotusarvojen muodostama järjestetty pari (µ X, µ Y ) määrää satunnaismuuttujien X ja Y yhteisjakauman todennäköisyysmassan painopisteen. TKK (c) Ilkka Mellin (2005) 73
Kaksiulotteisten jakaumien odotusarvot ja varianssit Summan ja erotuksen odotusarvot Satunnaismuuttujien X ja Y summan X + Y odotusarvo: E( X + Y) = E( X) + E( Y) Satunnaismuuttujien X ja Y erotuksen X Y odotusarvo: E( X Y) = E( X) E( Y) Huomautus: Satunnaismuuttujien summan ja erotuksen odotusarvojen kaavat on esitetty ilman perustelua luvussa Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 74
Kaksiulotteisten jakaumien odotusarvot ja varianssit Summan ja erotuksen odotusarvot: Perustelu 1/2 Esitetään satunnaismuuttujien summan odotusarvoa koskevan tuloksen perustelu kahden jatkuvan satunnaismuuttujan tapauksessa. Olkoot satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio f XY (x, y) ja X:n ja Y:n reunajakaumien tiheysfunktiot vastaavasti f X (x) ja f Y (y) TKK (c) Ilkka Mellin (2005) 75
Kaksiulotteisten jakaumien odotusarvot ja varianssit Summan ja erotuksen odotusarvot: Perustelu 2/2 + + Tällöin E( X ± Y) = ( x± y) f ( x, y) dydx + + [ (, ) (, )] XY = xf ( x, y) dydx± yf ( x, y) dydx XY = x f ( x, y) dydx± y f ( x, y) dxdy = xf ( x) dx ± yf ( y) dy = E( X ) ± E( Y ) XY = xf x y ± yf x y dydx XY + + + + XY X Y + + + + + + XY XY TKK (c) Ilkka Mellin (2005) 76
Kaksiulotteisten jakaumien odotusarvot ja varianssit Lineaarikombinaation odotusarvo Olkoot satunnaismuuttujien X i, i = 1, 2,, k odotusarvot E( X i) = µ i, i = 1,2,, k ja olkoot a i, i = 1, 2,, kvakioita. Tällöin satunnaismuuttujien X i, i = 1, 2,, k lineaarikombinaation Y = a1x1+ a2x2 + + akxk odotusarvo on E( Y) = E( a1x1+ a2x2 + + akxk) = a1e( X1) + a2e( X2) + + ak E( Xk) = aµ + a µ + + a µ 1 1 2 2 k k TKK (c) Ilkka Mellin (2005) 77
Kaksiulotteisten jakaumien odotusarvot ja varianssit Riippumattomuus ja tulon odotusarvo Olkoot satunnaismuuttujien X ja Y odotusarvot E( X ) = µ X E( Y ) = µ Y Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin tulon XY odotusarvo on odotusarvojen tulo: E( XY) = E( X)E( Y) = µ Xµ Y Huomautus: Käänteinen ei päde: Siitä, että E(XY) = E(X)E(Y) ei seuraa, että satunnaismuuttujat X ja Y ovat riippumattomia. TKK (c) Ilkka Mellin (2005) 78
Kaksiulotteisten jakaumien odotusarvot ja varianssit Riippumattomuus ja tulon odotusarvo: Perustelu 1/2 Esitetään riippumattomien satunnaismuuttujien tulon odotusarvoa koskevan tuloksen perustelu kahden jatkuvan satunnaismuuttujan tapauksessa. Olkoot satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio f XY (x, y) ja X:n ja Y:n reunajakaumien tiheysfunktiot vastaavasti f X (x) ja f Y (y) Olkoot satunnaismuuttujat X ja Y riippumattomia, jolloin f XY (x, y) = f X (x) f Y (y) TKK (c) Ilkka Mellin (2005) 79
Kaksiulotteisten jakaumien odotusarvot ja varianssit Riippumattomuus ja tulon odotusarvo: Perustelu 2/2 Tällöin E( XY) = xyf ( x, y) dydx = = = + + + + XY xyf ( x) f ( y) dydx X + + + xf ( x) yf ( y) dydx X Y Y xf ( x)e( Y ) dx X + = E( Y) xf ( x) dx X = E( Y)E( X) TKK (c) Ilkka Mellin (2005) 80
Kaksiulotteisten jakaumien odotusarvot ja varianssit Riippumattomuus ja tulon odotusarvo: Yleistys Olkoot satunnaismuuttujien X i, i = 1, 2,, k odotusarvot E( X i) = µ i, i = 1, 2,, k Jos satunnaismuuttujat X i, i = 1, 2,, k ovat riippumattomia, niin E( X1X2 Xk) = E( X1) E( X2) E( Xk) = µµ 1 2 µ k Huomautus: Käänteinen ei päde: Siitä, että E( X1X2 Xk) = E( X1) E( X2) E( Xk) ei seuraa, että satunnaismuuttujat X i, i = 1, 2,, k ovat riippumattomia. TKK (c) Ilkka Mellin (2005) 81
Kaksiulotteisten jakaumien odotusarvot ja varianssit Reunajakaumien varianssit Olkoot satunnaismuuttujien X ja Y odotusarvot E( X ) = µ X E( Y ) = µ Y Satunnaismuuttujien X ja Y varianssit yhtyvät vastaavien reunajakaumien variansseihin: 2 2 Var( X) = D ( X) = σ X 2 E[( X µ X ) ] 2 2 Y σ Y 2 E[( Y µ Y ) ] = Var( Y) = D ( ) = = TKK (c) Ilkka Mellin (2005) 82
Kaksiulotteisten jakaumien odotusarvot ja varianssit Varianssi vaihtelun mittana Satunnaismuuttujan X varianssi Var(X) kuvaa satunnaismuuttujan X todennäköisyysjakauman todennäköisyysmassan vaihtelua satunnaismuuttujan X oman odotusarvon E(X) ympärillä. Satunnaismuuttujan Y varianssi Var(Y) kuvaa satunnaismuuttujan Y todennäköisyysjakauman todennäköisyysmassan vaihtelua satunnaismuuttujan Y oman odotusarvon E(Y) ympärillä. TKK (c) Ilkka Mellin (2005) 83
Kaksiulotteisten jakaumien odotusarvot ja varianssit Reunajakaumien varianssit: Diskreetit jakaumat Olkoon diskreettien satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio f XY (x, y) ja vastaavien reunajakaumien pistetodennäköisyyfunktiot f X (x) ja f Y (y). Tällöin satunnaismuuttujien X ja Y varianssit ovat vakioita 2 2 D( X ) = ( x µ ) f () x x 2 2 D( Y) = ( y µ Y) fy( y) jossa y µ X = E( X ) µ = E( Y ) Y X X TKK (c) Ilkka Mellin (2005) 84
Kaksiulotteisten jakaumien odotusarvot ja varianssit Reunajakaumien varianssit: Jatkuvat jakaumat Olkoon jatkuvien satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio f XY (x, y) ja vastaavien reunajakaumien tiheysfunktiot f X (x) ja f Y (y). Tällöin satunnaismuuttujien X ja Y varianssit ovat vakioita jossa µ X µ + 2 2 D( ) = ( µ X) X() + 2 2 D( ) = ( µ Y) Y( ) Y X x f x dx Y y f y dy = E( X ) = E( Y ) TKK (c) Ilkka Mellin (2005) 85
Kaksiulotteisten jakaumien odotusarvot ja varianssit Varianssien vaihtoehtoiset laskukaavat Satunnaismuuttujien X ja Y varianssien kaavat voidaan kirjoittaa seuraaviin yhtäpitäviin muotoihin: 2 2 D( X) = E[( X µ )] = E( X ) X 2 2 µ X 2 2 = E( X ) [E( X )] 2 2 D( Y) = E[( Y µ Y )] 2 2 = E( Y ) µ Y 2 2 = E( Y ) [E( Y)] TKK (c) Ilkka Mellin (2005) 86
Kaksiulotteisten jakaumien odotusarvot ja varianssit Varianssien vaihtoehtoiset laskukaavat: Perustelu Esitetään varianssin vaihtoehtoisen laskukaavan perustelu satunnaismuuttujalle X: 2 2 D( X) = E[( X µ )] X 2 2 E[ X 2 µ XX µ X] 2 2 X µ X X µ X 2 2 E( X ) 2µ X E( X) µ X 2 2 E( X ) 2µ Xµ X µ X 2 2 E( X ) µ X = + = E( ) E(2 ) + E( ) = + = + = TKK (c) Ilkka Mellin (2005) 87
Kaksiulotteisten jakaumien odotusarvot ja varianssit Reunajakaumien standardipoikkeamat Olkoot satunnaismuuttujien X ja Y odotusarvot E( X ) = µ X E( Y ) = µ Y Satunnaismuuttujien X ja Y standardipoikkeamat yhtyvät vastaavien reunajakaumien standardipoikkeamiin: D( X ) = σ D ( Y ) X = X = σ 2 E[( µ X ) ] Y = Y 2 E[( µ Y ) ] TKK (c) Ilkka Mellin (2005) 88
Kaksiulotteisten jakaumien odotusarvot ja varianssit Standardipoikkeama vaihtelun mittana Satunnaismuuttujan X standardipoikkeama D(X) kuvaa satunnaismuuttujan X todennäköisyysjakauman todennäköisyysmassan vaihtelua satunnaismuuttujan X oman odotusarvon E(X) ympärillä. Satunnaismuuttujan Y standardipoikkeama D(Y) kuvaa satunnaismuuttujan Y todennäköisyysjakauman todennäköisyysmassan vaihtelua satunnaismuuttujan Y oman odotusarvon E(Y) ympärillä. TKK (c) Ilkka Mellin (2005) 89
Kaksiulotteisten jakaumien odotusarvot ja varianssit Odotusarvo, varianssi ja standardipoikkeama: Suureiden dimensio eli laatu Satunnaismuuttujalla sekä sen odotusarvolla ja standardipoikkeamalla on aina sama dimensio eli laatu. Esimerkki: Jos satunnaismuuttujan laatuna on m (metri), niin myös niiden odotusarvon ja standardipoikkeaman laatuna on m. Satunnaismuuttujan ja sen varianssilla ei ole sama dimensio eli laatu. Esimerkki: Jos satunnaismuuttujan laatuna on m (metri), niin sen varianssin laatuna on m 2. TKK (c) Ilkka Mellin (2005) 90
Kaksiulotteisten jakaumien odotusarvot ja varianssit Odotusarvot ja standardipoikkeamat: 1. esimerkki nopanheitosta Heitetään virheetöntä noppaa kaksi kertaa: X = tulos (silmäluku) 1. heitosta Y = tulos (silmäluku) 2. heitosta Tarkastellaan satunnaismuuttujien X ja Y yhteisjakaumaa. Odotusarvot, varianssit ja standardipoikkeamat: 6 6 1 21 E( X) = xpr( X = x) = x= = 3.5 = E( Y) x= 1 6 x= 1 6 6 6 2 2 1 2 91 2 E( X ) = x Pr( X = x) = x = = E( Y ) x= 1 6 x= 1 6 2 2 2 2 91 21 35 2 D( X ) = E( X ) [E( X)] = = = 2.917= D( Y) 6 6 12 D( X) = 2.917 = 1.708 = D( Y) TKK (c) Ilkka Mellin (2005) 91
Kaksiulotteisten jakaumien odotusarvot ja varianssit Odotusarvot ja standardipoikkeamat: 2. esimerkki nopanheitosta 1/2 Heitetään virheetöntä noppaa kaksi kertaa: X = tulos (silmäluku) 1. heitosta Y = tulos (silmäluku) 2. heitosta Z = X + Y = silmälukujen summa Tarkastellaan satunnaismuuttujien X ja Z yhteisjakaumaa. Odotusarvot ja 2. momentit: 6 21 E( X ) = xpr( X = x) = = 3.5 = E( Y) x= 1 6 12 252 E( Z) = zpr( Z = z) = = 7 z= 1 36 6 2 2 91 2 E( X ) = x Pr( X = x) = = E( X ) x= 1 6 12 2 2 1974 E( Z ) = z Pr( Z = z) = 36 z= 1 TKK (c) Ilkka Mellin (2005) 92
Kaksiulotteisten jakaumien odotusarvot ja varianssit Odotusarvot ja standardipoikkeamat: 2. esimerkki nopanheitosta 2/2 Varianssit ja standardipoikkeamat : 2 2 2 35 2 D( X ) = E( X ) [E( X)] = = 2.917= D( Y) 12 D( X) = 2.917 = 1.708 = D( Y) 2 2 2 210 D( Z) = E( Z ) [E( Z)] = = 5.833 36 D( Z) = 5.833 = 2.415 TKK (c) Ilkka Mellin (2005) 93
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat Kaksiulotteiset todennäköisyysjakaumat Kaksiulotteisten jakaumien reunajakaumat ja riippumattomuus Kaksiulotteisten jakaumien odotusarvot ja varianssit >> Kovarianssi ja korrelaatio Ehdolliset jakaumat ja odotusarvot TKK (c) Ilkka Mellin (2005) 94
Kovarianssi ja korrelaatio Avainsanat Korrelaatiokerroin Kovarianssi Riippumattomuus Summan varianssi Varianssi TKK (c) Ilkka Mellin (2005) 95
Kovarianssi ja korrelaatio Kovarianssi Olkoot satunnaismuuttujien X ja Y odotusarvot E( X ) = µ X E( Y ) = µ Y Satunnaismuuttujien X ja Y kovarianssi on vakio Cov( X, Y ) = σ XY = E[( X µ X)( Y µ Y)] Satunnaismuuttujien X ja Y kovarianssi Cov(X, Y) kuvaa satunnaismuuttujien X ja Y yhteisjakauman todennäköisyysmassan yhteisvaihtelua satunnaismuuttujien X ja Y odotusarvojen E(X) ja E(Y) määräämän pisteen (E(X), E(Y)) ympärillä. TKK (c) Ilkka Mellin (2005) 96
Kovarianssi ja korrelaatio Kovarianssi: Diskreetit jakaumat Olkoon diskreettien satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktio f XY (x, y). Tällöin satunnaismuuttujien X ja Y kovarianssi on vakio jossa µ X µ Cov( X, Y) = ( x µ )( y µ ) f ( x, y) Y = E( X ) = E( Y ) x y X Y XY TKK (c) Ilkka Mellin (2005) 97
Kovarianssi ja korrelaatio Kovarianssi: Jatkuvat jakaumat Olkoon jatkuvien satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio f XY (x, y). Tällöin satunnaismuuttujien X ja Y kovarianssi on vakio jossa µ X µ + + Cov( X, Y ) = ( x µ )( y µ ) f ( x, y) dxdy Y = E( X ) = E( Y ) X Y XY TKK (c) Ilkka Mellin (2005) 98
Kovarianssi ja korrelaatio Kovarianssi: Vaihtoehtoinen laskukaava Satunnaismuuttujien X ja Y kovarianssin kaava voidaan kirjoittaa seuraaviin yhtäpitäviin muotoihin: Cov( X, Y) = E[( X µ X)( Y µ Y)] = E( XY ) µ Xµ Y = E( XY) E( X)E( Y) Huomautus: Vrt. kovarianssin vaihtoehtoista laskukaavaa varianssin vaihtoehtoisiin laskukaavoihin. TKK (c) Ilkka Mellin (2005) 99
Kovarianssi ja korrelaatio Kovarianssin vaihtoehtoinen laskukaava: Perustelu Esitetään satunnaismuuttujien kovarianssin vaihtoehtoisen laskukaavan perustelu: Cov( X, Y) = E[( X µ X)( Y µ Y)] = E[ XY µ XY µ YX + µ Xµ Y] = E( XY ) E( µ XY ) E( µ YX ) + E( µ Xµ Y) = E( XY ) µ X E( Y ) µ Y E( X ) + µ Xµ Y = E( XY ) µ Xµ Y µ Yµ X + µ Xµ Y = E( XY ) µ µ X Y TKK (c) Ilkka Mellin (2005) 100
Kovarianssi ja korrelaatio Kovarianssi ja varianssit Satunnaismuuttujien kovarianssit itsensä kanssa yhtyvät satunnaismuuttujien variansseihin: Cov( X, X) = E[( X µ X)( X µ X)] = Var( X ) = σ 2 X Cov( YY, ) = E[( Y µ Y)( Y µ Y)] = Var( Y ) = σ 2 Y TKK (c) Ilkka Mellin (2005) 101
Kovarianssi ja korrelaatio Odotusarvot, varianssit ja kovarianssi sekä lineaarimuunnokset 1/2 Olkoot satunnaismuuttujien X ja Y odotusarvot, varianssit ja kovarianssi: 2 E( X) = µ Var( X) = σ Olkoot X E( Y) = µ Y Var( Y) = σ Cov( XY, ) = E[( X µ )( Y µ )] = σ W = a+ bx Z = c+ dy jossa a, b, c, d 4 ovat reaalisia vakioita. X 2 Y X Y XY TKK (c) Ilkka Mellin (2005) 102
Kovarianssi ja korrelaatio Odotusarvot, varianssit ja kovarianssi sekä lineaarimuunnokset 2/2 Tällöin pätevät seuraavat kaavat: E( W) = a+ be( X) = a+ bµ Var( W) = b Var( X) = b σ 2 2 2 X X E( Z) = c+ de( Y) = c+ dµ Var( Z) = d Var( Y) = d σ 2 2 2 Y Y Cov( W, Z) = bd Cov( X, Y ) = bdσ XY TKK (c) Ilkka Mellin (2005) 103
Kovarianssi ja korrelaatio Kovarianssi ja lineaarimuunnokset: Perustelu Jos satunnaismuuttujien X ja Y kovarianssi on Cov(X, Y), niin Cov( W, Z) = E[( W E( W))( Z E( Z))] = E[( a + bx E( a + bx ))( c + dy E( c + dy ))] = E[( bx E( bx ))( dy E( dy ))] = bd E[( X E( X ))( Y E( Y ))] = bd Cov( X, Y ) TKK (c) Ilkka Mellin (2005) 104
Kovarianssi ja korrelaatio Summan ja erotuksen varianssit Olkoot satunnaismuuttujien X ja Y varianssit 2 2 Var( X) = σ Var( Y) = σ ja kovarianssi Cov( X, Y ) = σ XY Tällöin X Var( X ± Y) = Var( X) + Var( Y) ± 2Cov( X, Y) = σ + σ ± 2σ 2 2 X Y XY Y TKK (c) Ilkka Mellin (2005) 105
Kovarianssi ja korrelaatio Summan ja erotuksen varianssit: Perustelu Summan ja erotuksen varianssia koskevat kaavat nähdään oikeaksi seuraavalla tavalla: Var( X ± Y) = E[ X ± Y E( X ± Y)] = E[ X ± Y E( X) E( Y)] = E[( X E( X)) ± ( Y E( Y))] 2 2 = E[( X E( X)) + ( Y E( Y)) ± 2( X E( X))( Y E( Y))] 2 2 E[( E( ))] E[( E( ))] = X X + Y Y ± 2E[( X E( X))( Y E( Y))] = Var( X ) + Var( Y) ± 2Cov( X, Y) 2 2 2 TKK (c) Ilkka Mellin (2005) 106
Kovarianssi ja korrelaatio Riippumattomuus ja kovarianssi Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin Cov( X, Y ) = 0 Huomautus: Käänteinen ei päde: Siitä, että Cov( X, Y ) = 0 ei välttämättä seuraa, että satunnaismuuttujat X ja Y olisivat riippumattomia. TKK (c) Ilkka Mellin (2005) 107
Kovarianssi ja korrelaatio Riippumattomuus ja kovarianssi: Perustelu Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin E(XY) = E(X)E(Y) Siten Cov( X, Y) = E( XY) E( X)E( Y) = E( X )E( Y) E( X)E( Y) = 0 TKK (c) Ilkka Mellin (2005) 108
Kovarianssi ja korrelaatio Riippumattomuus sekä summan ja erotuksen varianssit Olkoot satunnaismuuttujien X ja Y varianssit 2 2 Var( X) = σ X Var( Y) = σy Olkoot X ja Y ovat riippumattomia, jolloin Cov( X, Y ) = 0 Tällöin Var( X ± Y) = Var( X) + Var( Y) Huomautus: Riippumattomien satunnaismuuttujien summan ja erotuksen varianssien kaavat on esitetty ilman perustelua luvussa Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 109
Kovarianssi ja korrelaatio Korrelaatiokerroin 1/2 Oletetaan, että satunnaismuuttujilla X ja Y on seuraavat odotusarvot, varianssit ja kovarianssi: 2 2 E( X) = µ Var( X) = D ( X) = σ X X 2 2 Y E( Y) = µ Y Var( Y) = D ( Y) = σ Cov( XY, ) = E[( X µ )( Y µ )] = σ X Y XY TKK (c) Ilkka Mellin (2005) 110
Kovarianssi ja korrelaatio Korrelaatiokerroin 2/2 Satunnaismuuttujien X ja Y korrelaatiokerroin on vakio Cor( X, Y ) = ρ XY Cov( XY, ) = Var( X )Var( Y ) Cov( XY, ) = D( X)D( Y) σ XY = σ σ X Y TKK (c) Ilkka Mellin (2005) 111
Kovarianssi ja korrelaatio Korrelaatiokerroin lineaarisen riippuvuuden mittana Satunnaismuuttujien X ja Y korrelaatiokerroin Cor(X, Y) kuvaa satunnaismuuttujien X ja Y lineaarisen riippuvuuden voimakkuutta: (i) Mitä suurempi on Cor(X, Y) sitä voimakkaampaa on satunnaismuuttujien X ja Y välinen lineaarinen riippuvuus. (ii) Mitä pienempi on Cor(X, Y) sitä heikompaa on satunnaismuuttujien X ja Y välinen lineaarinen riippuvuus. TKK (c) Ilkka Mellin (2005) 112
Kovarianssi ja korrelaatio Kovarianssi ja korrelaatio: Suureiden dimensio eli laatu Huomaa, että satunnaismuuttujien korrelaatio on dimensioton eli laaduton suure toisin kuin niiden kovarianssi. TKK (c) Ilkka Mellin (2005) 113
Kovarianssi ja korrelaatio Korrelaatiokerroin ja lineaarimuunnokset Olkoon satunnaismuuttujien X ja Y korrelaatiokerroin Cor(X, Y). Olkoot W= a + bx Z = c + dy Tällöin Cor( W, Z) = sgn( bd)cor( X, Y) jossa sgn on ns. merkkifunktio: + 1, jos x > 0 sgn( x) = 0, jos x = 0 1, jos x < 0 TKK (c) Ilkka Mellin (2005) 114
Kovarianssi ja korrelaatio Lineaarimuunnosten korrelaatiokerroin: Perustelu Olkoon satunnaismuuttujien X ja Y korrelaatiokerroin Cor(X, Y). Olkoot W = a + bx Z = c + dy Tällöin Cov( W, Z) Cor( W, Z) = Var( W) Var( Z) bd Cov( X, Y ) = 2 2 b Var( X) d Var( Y) Cov( XY, ) = sgn( bd) Var( X ) Var( Y ) = sgn( bd)cor( X, Y ) TKK (c) Ilkka Mellin (2005) 115
Kovarianssi ja korrelaatio Korrelaatiokerroin: Ominaisuudet Olkoon satunnaismuuttujien X ja Y korrelaatiokerroin Cor(X, Y). Tällöin (i) 1 Cor( X, Y ) + 1 (ii) Jos X ja Y ovat riippumattomia, niin Cor( X, Y ) = 0 (iii) Cor( XY, ) =± 1, jos ja vain, jos Y = α + βx, jossa α ja β ovat reaalisia vakiota, β 0 TKK (c) Ilkka Mellin (2005) 116