.9. Kaksiulotteiset satunnaismuuttujat MS-A Todennäköisslaskennan ja tilastotieteen peruskurssi Viikko Moniulotteiset satunnaismuuttujat sekä niiden jakaumat ja tunnusluvut; Moniulotteisia jakaumia Usein tarvitaan useita satunnaismuuttujia kuvaamaan mallinnettavaa satunnaisilmiötä Eritisesti muuttujien väliset riippuvuudet usein kiinnostavia Miten töttömsaste Suomessa riippuu BKT:n kasvuvauhdista, viennin volmista ja BKT:n kasvuvauhdista muissa EU-maissa ja USA:ssa? Miten vehnän sato (t/ha) riippuu kesän keskilämpö-tilasta, sademäärästä, maan muokkaustavoista, lannoituksesta ja tuholaisten torjunnasta? Miten osakkeen A hinta riippuu muiden saman alan ritsten osakkeiden hinnoita?.9. Kaksiulotteiset satunnaismuuttujat: Määritelmä Mallista riippuen kaksiulotteinen satunnaismuuttuja voidaan määritellä eri tavoilla:. Olkoot ja satunnaismuuttujia, joilla otosavaruudet ovat S ja T, eli,. Kaksiulotteinen satunnaismuuttuja ):, jonka otosavaruus on karteesinen tulo =.. Olkoot ja satunnaismuuttujia, joilla sama otosavaruus S, eli,. Kaksiulotteinen satunnaismuuttuja ):. Kumpikin lähestmistapa määrittelee satunnaismuuttujille hteisjakauman :een: Olkoon. Pr =Pr({ ). Pr =Pr({ Diskreetit kaksiulotteiset jakaumat: Pistetodennäköissfunktio Olkoon ja diskreettejä satunnaismuuttujia, joilla tulosvaihtoehdot,,, ja,,, Funktio määrittelee :n ja :n hteisjakauman pistetodennäköissfunktion, jos. kaikilla. ) =. Pr Olkoon pätee Pr, = ).. ) ={ >,Pr =/.9..9. Jatkuvat kaksiulotteiset jakaumat: Tihesfunktio Olkoon ja jatkuvia satunnaismuuttujia Funktio määrittelee :n ja :n hteisjakauman tihesfunktion, jos. kaikilla. = ). Pr = Olkoon pätee Pr = "Multivariate Gaussian". Licensed under Creative Commons Attribution-Share Alike. via Wikimedia Commons - http://commons.w ikimedia.org/w iki/file:multivariate_gaussian.png#me diaview er/file:multivariate_gaussian.png Kaksiulotteiset jakaumat: Esimerkki kahden nopanheitosta Satunnaismuuttujat, ja Z: :. heiton silmäluku :. heiton silmäluku Z= + : silmälukujen summa Heitot riippumattomia: Pr(= ja =)=/ Määritetään :n ja Z:n hteisjakauma eli todennäköisdet Pr(= ja Z=z): Jos. nopalla on saatu ei summaksi voi tulla, joten Pr( = ja Z = ) = Jos. nopalla on saatu voi summaksi tulla,,,, 7 tai, joten Pr( = ja Z = z) = /; z=,, Jos Silmälukujen summa z Silmälukujen summat z = + 7 9 7 9 7 9 7 9 7 7. silmäluku Pr( = ja Z = z) / / / / / / 9 / / / / / / / / / 7 / / / / / / / / / / / / / / / / / / / / /. silmäluku.9..9.
.9. Kaksiulotteiset jakaumat: Esimerkki kahden nopanheitosta :n ja Z:n hteisjakauman pistotodennäköissfunktion graaffinen esittäminen Kaksiulotteisten jakaumien kertmäfunktiot Määritelmä: Satunnaismuuttujan (,) kertmäfunktio on ) f (,).. Heittotulosten summa 9 7 7. heitto 7 z 9..... Jos (,) diskreetti satunnaismuuttuja, niin =, ) Jos (,) jatkuva satunnaismuuttuja, niin = Lisäksi pätee F (, ) f (, ) (jos derivaatat on olemassa) F (,). - - - -.9. 7.9. Reunajakaumat (Marginaalijakaumat) Diskreetin reunajakauman pistetodennäköissfunktio: f( ) Pr( ) f(, ) Kseessä jakauma, sillä ) =johtuen :n määritelmän. kohdasta..... ) ) Jatkuvan reunajakauman tihesfunktio on f( ) f(, ) d Kseessä on jakauma, sillä ) =, johtuen :n määritelmän. kohdasta.. ) Silmälukujen summa z. nopan silmäluku ht / / / / / / / / / 9 / / / / / / / / / / / 7 / / / / / / / / / / / / / / / / / / / / / / / / / / / ht / / / / / /. heiton tuloksen jakauma... f () f (, z) z Z Reunajakaumat: Esimerkki kahden nopan heitosta fz () fz (,) Heittotuloksien summan jakauma.... 7 9 = {, > : Pr = = /..9. 9. 7 9.9. Ehdolliset jakaumat Satunnaismuuttujan ehdollinen jakauma satunnaismuuttujan suhteen on Määrittelee:n jakauman, kun tiedetään että on saanut arvon Diskreeteillä satunnaismuuttujilla suoraviivainen tulkinta: Pr(= =)=Pr(= ja =)/Pr(=) Kseessä jakauma, sillä kaikilla pätee = f (, ) f ( ), jos f ( ) f ( ) = ) ) ) = ) =(jatkuva) = ) =(diskreetti).... (, ). 7) 7) Satunnaismuuttujien riippumattomuus Määritelmä: Satunnaismuuttujat ja ovat riippumattomia, jos kaikilla, f (, ) = f ()f () hteisjakauman tihesfunktio on reunajakaumien tihesfunktioiden tulo htäpitävä ehto: F (, ) = F ()F () hteisjakauman kertmäfunktio on reunajakaumien kertmäfunktioiden tulo ja riippumattomia jos ja vain jos = ) ) = ) ) Tieto :n arvosta ei vaikuta :n jakaumaan........ (, ), = =.. ja riippuvia ) ).9..9.
.9. Satunnaismuuttujien riippumattomuus: esimerkki kahden nopan heitosta Esimerkiksi: Pr( ja Z ) Pr( )Pr( Z ) Siten satunnaismuuttujat ja Z eivät ole riippumattomia. Silmälukujen summa z. nopan silmäluku ht / / / / / / / / / 9 / / / / / / / / / / / 7 / / / / / / / / / / / / / / / / / / / / / / / / / / / ht / / / / / / N-ulotteiset satunnaismuuttujat Edellä esitellt jakaumakäsitteet leistvät suora-viivaisesti satunnaismuuttujalle,, ):. Esim. Tihesfunktio:,, ): Riippumattomuus:,, )= ) Kertmäfunktio:,, )=,, ) Reunajakaumia ja hteisjakaumia: )=, ),, )=,, ) Ehdollinenjakauma:,, ),, )=,, ) (Diskreeteillä satunnaismuuttujilla integraalit korvautuu summilla).9..9. -ulotteisen satunnaismuuttujan funktion odotusarvo Olkoon jokin funktio: ) on satunnaismuuttuja Diskreetin satunnaismuuttujan g(,) odotusarvo on E( g(, )) g(, ) f (, ) Jatkuvan satunnaismuuttujan g(,) odotusarvo on E( g(, )) g(, ) f (, ) dd Esim. Jos niin saadaan :n odotusarvo = = = Aiemminkin määritellt hden muuttujan odotusarvot ja varianssit valideja, kunhan kätetään reunajakaumaa Satunnaismuuttujien summan ja tulon odotusarvo Satunnaismuuttujien summan odotusarvo on odotusarvojen summa: E ) Tod. = = + leists: E = ) Riippumattomien satunnaismuuttujien tulon odotusarvo on odotusarvojen tulo: E ) Tod. = = = = leists: E = ), jos :t riippumattomia Huom! Käänteinen ei päde, eli htälöstä E ) ei seuraa satunnaismuuttujien ja riippumattomuus.9..9. Kovarianssi: Määritelmä Satunnaismuuttujien riippuvuus voi voimakkuudeltaan vaihdella riippumattomuudesta (f (, ) = f ()f ()) aina tädelliseen funktionaaliseen riippuvuuteen (=g()) Mittoja voimakkuudelle: kovarianssi ja korrelaatio Määritelmä: Satunnaismuuttujien ja kovarianssi on reaaliluku Cov ( ) Kuvaa :n ja :n hteisvaihtelua pisteen (E(), E()) mpärillä Kätetään mös merkintää Merkitsemällä =( )( ) saadaan Cov(, ) ( )( ) f( dd, ) Cov(, ) ( )( ) f (, ) Kovarianssi: Vaihtoehtoinen laskukaava Kovarianssi on tulon odotusarvon ja odotusarvojen tulon erotus: Cov ) Tod. Cov = Jos satunnaismuuttujat ja ovat riippumattomia, niin E()=E()E(), jolloin Cov(,)= Siitä, että Cov(,)=, EI seuraa että ja ovat riippumattomia.9. 7.9.
.9. Kovarianssiin liittviä laskukaavoja Satunnaismuuttujan kovarianssi itsensä kanssa on varianssi: =Cov =Var Olkoon satunnaismuuttujat ja, missä. Pätee Cov Cov. Todistuksen idea: Cov ) Satunnaismuuttujien summan ja erotuksen varianssi: Var =Var +Var +Cov. Var =Var +Var Cov. Todistuksen idea: Var Korrelaatiokerroin: Määritelmä Kovarianssi sisältää informaatiota sekä satunnaismuuttujien riippuvuudesta että niiden hajonnoista Korrelaatiokertoimessa hajontojen vaikutus on eliminoitu Määritelmä: Satunnaismuuttujien ja (Pearsonin tulomomentti-) korrelaatiokerroin on reaaliluku =Cor Cov Var Var = Mittaa satunnaismuuttujien ja lineaarisen riippuvuuden voimakkuutta.9. 9.9. Korrelaatiokerroin: Ominaisuudet Cor Cov Var Var,] Mitä suurempi (pienempi) on korrelaatiokertoimen itseisarvo Cor(,) sen voimakkaampi (heikompi) on satunnaismuuttujien ja välinen lineaarinen riippuvuus. Jos ja ovat riippumattomia, niin Cor(,)= Perustelu: Riippumattomille ja pätee Cov(,)= Huom! Käänteinen ei päde. Cor(,)=+ jos ja vain jos on olemassa > siten että Cor(,)=- jos ja vain jos on olemassa > siten että Korrelaatiokerroin: esimerkki nopanheitosta Heitetään virheetöntä noppaa kaksi kertaa: = tulos (silmäluku). heitosta = tulos (silmäluku). heitosta Z = + = silmälukujen summa Odotusarvot, varianssit ja standardipoikkeamat: E() = / =. E(Z) = / = 7 D () = / =.97 D (Z) = / =. D() =.7 D(Z) =. Lasketaan korrelaatiokerroin Cor(,Z): 97 E( Z) z Pr(, Z z) z 97 Cov(, Z) E( Z) E( )E( Z).97 Cov(, Z) Cor(, Z).77 D( )D( Z).9..9. Ehdollinen odotusarvo: Määritelmä ehdollinen odotusarvo satunnaismuuttujan suhteen on E( ) f ( ) eli ehdollisen jakauman odotusarvo. Tulkinta Mikä on :n odotusarvo, jos tiedetään että on saanut arvon? Jos ja ovat riippumattomia, niin = = ) Tieto :n arvosta ei vaikuta :n odotusarvoon E( ) f ( d )..... (, ) 7) E =7 = 7) E =7 =. Regressiofunktiot ja -kärät Mikä olisi hvä ennuste :n arvoksi, kun tiedetään että =? Pitäisi siis valita jonkin funktio joka kuvaa havainnot ennusteiksi Voidaan osoittaa että valitsemalla funktioksi ennusteen keskineliövirhe ([ ] ) minimoituu Kuvausta E( =) kutsutaankin usein satunnaismuuttujan regressiofunktioksi satunnaismuuttujan suhteen Regressiofunktio puolestaan määrittelee :een regressiokärän.. ) ).9..9.
.9. Kaksiulotteinen normaalijakauma: Määritelmä Satunnaismuuttuja (,) noudattaa kaksiulotteista normaalijakaumaa, jos tihesfunktio on muotoa f (, ) ep Q(, ) ( ) missä Q (, ) Merkintä: (,) N (,,,, ) Odotusarvot:, Varianssit: =Var >, =Var > Korrelaatio: =Cor,] Kovarianssi:.. - (, ) N (,,,,.7) tihesfunktio -ulotteinen normaalijaukauma: Tihesfunktion muoto Tihesfunktio saavuttaa maksiminsa pisteessä (, ) Tihesfunktion tasa-arvo kärät ovat ellipsejä: Q (, ) c (vakio) Tasa-arvoellipsien pääakselit ovat kovarianssimatriisin ominaisvektoreiden suuntaiset ja niiden pituudet suhtautuvat toisiinsa kuten matriisin ominaisarvojen neliöjuuret.. - (, ) N (,,,,.7) tihesfunktio - -.9..9. -ulotteinen normaalijaukauma: Tihesfunktion muoto Jos = ellipsien pääakselit ovat koordinaatti-akseleiden suuntaiset. Jos = ja lisäksi = niin ellipsit ovat mpröitä. Jos = niin ellipsit surkastuvat janoiksi. (, ) N (,,,,-.9) (, ) N (,,,,.9) (, ) N (,,,,) (, ) N (,,,,) Kaksiulotteisen normaalijakauman reunajakaumat Kaksiulotteisen normaalijakauman reunajakaumat ovat normaalisia: = = ep ( ) = = ep ( ) N(, ), N(, ) Käänteinen ei päde: Vaikka reunajakaumat ovat normaalijakaumia, ei hteisjakauma välttämättä ole kaksiulotteinen normaalijakauma N(, )..... -..... N(, ) - (, )N (,,,,.7) - -.9. 7.9. Kaksiulotteisen normaalijakauman ehdolliset jakaumat Kaksiulotteisen normaalijakauman ehdolliset jakaumat ovat normaalisia: = = ) ep ( ) missä ) =Var =( Tulkinta: Kun :n arvo tiedetään niin noudattaa normaalijakaumaa parametreilla ja Merkitään: )~ ).... (, )N (,,,,.7) ) - - ) Kaksiulotteinen normaalijakauma: Korreloimattomuus vs riippumattomuus Kaksiulotteisen normaalijakauman tapauksessa satunnaismuuttujien ja korreloimattomuus on htäpitävää niiden riippumattomuuden kanssa. Perustelu: ja riippumattomia ) ep ( ) = ep ( ) = Huomautuksia: Riippumattomuudesta seuraa aina korreloimattomuus. Korreloimattomuudesta ei leisesti seuraa riippumattomuus..9. 9.9.
.9. Kaksiulotteisen normaalijakauman ehdolliset odotusarvot Satunnaismuuttujan ehdollinen odotusarvo (eli regressiofunktio) satunnaismuuttujan suhteen E( ) ( ) on lineaarinen arvojen :n suhteen. Regressiokärän on suora (,) tasossa Esim. (, ) N (,,,,.7): ( ).7 ( )..9 (, ) N (,,,,.7) - - Kaksiulotteisen normaalijakauman regressiosuorat E( ) ( ) (, ) N (,,,, ) Kulkee pisteen (, ) kautta > : Suora on nouseva = : Suora on vaakatasossa < : Suora on laskevia Suora jrkkenee kun kasvaa Suora loivenee kun kasvaa (, ) N (,,.,, -.7) (, ) N (,,,, -.7).9..9. Kaksiulotteisen normaalijakauman regressiosuorat Tarkastellaan :n regressiosuoraa :n suhteen: + ( ) ( )...7 Tämä ht :n regressiosuoraan :n suhteen ) ainoastaan silloin kun = - - ( ).7 ( )..9.9.