Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Samankaltaiset tiedostot
Moniulotteisia todennäköisyysjakaumia

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Olkoon R S otosavaruuksien R ja S karteesinen tulo: Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan:

Moniulotteiset satunnaismuuttujat ja jakaumat

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Ilkka Mellin (2008) 1/5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 3. Kaksiulotteiset satunnaismuuttujat

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Johdatus regressioanalyysiin

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

10 Moniulotteinen normaalijakauma

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Normaalijakaumasta johdettuja jakaumia

Satunnaismuuttujien muunnokset ja niiden jakaumat

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

2. Multinormaalijakauma

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

031021P Tilastomatematiikka (5 op) viikko 7

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastomatematiikka Kevät 2008

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

Osa 2: Otokset, otosjakaumat ja estimointi

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Sovellettu todennäköisyyslaskenta B

Todennäköisyyslaskun kertaus. Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Todennäköisyyslaskenta. β versio. Todennäköisyyslaskenta. Ilkka Mellin. Teknillinen korkeakoulu, Matematiikan laboratorio. Ilkka Mellin (2006) I

7. laskuharjoituskierros, vko 10, ratkaisut

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Sovellettu todennäköisyyslaskenta B

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Sovellettu todennäköisyyslaskenta B

D ( ) Var( ) ( ) E( ) [E( )]

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Sovellettu todennäköisyyslasku A

Yleistä tietoa kokeesta

30A02000 Tilastotieteen perusteet

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

4.0.2 Kuinka hyvä ennuste on?

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Todennäköisyyslaskenta ja puudiagrammit. TKK (c) Ilkka Mellin (2005) 1

Verkot ja todennäköisyyslaskenta Verkko Verkko eli graafi muodostuu pisteiden joukosta V, särmien joukosta A ja insidenssikuvauksesta : A V V jossa

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio

6 MATRIISIN DIAGONALISOINTI

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Sallitut apuvälineet: kirjoitusvälineet, laskin sekä käsinkirjoitettu, A4-kokoinen lunttilappu ja MAOL taulukkokirjaa

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Ominaisarvo ja ominaisvektori

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskenta

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

Tehtäväsarja I Seuraavat tehtävät liittyvät kurssimateriaalin lukuun 7 eli vapauden käsitteeseen ja homogeenisiin

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

Tehtäväsarja I Seuraavat tehtävät liittyvät kurssimateriaalin lukuun 7 eli vapauden käsitteeseen ja homogeenisiin

Matemaattisten tieteiden kandiohjelma / MTL Todennäköisyyslaskenta IIb Kurssikoe (kesto 2h 30 min)

Ominaisvektoreiden lineaarinen riippumattomuus

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

Todennäköisyyden ominaisuuksia

Testit laatueroasteikollisille muuttujille

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja

Sovellettu todennäköisyyslaskenta B

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Testejä suhdeasteikollisille muuttujille

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42

Liite 2: Verkot ja todennäköisyyslaskenta. Todennäköisyyslaskenta ja puudiagrammit

10 Moniulotteinen normaalijakauma

Lineaarikuvauksen R n R m matriisi

Ominaisarvo-hajoitelma ja diagonalisointi

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Transkriptio:

TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä opimme? / Tässä luvussa tarkastellaan kahta moniulotteista todennäköisyysjakaumaa: (i) on binomijakauman (ks. lukua Diskreettejä jakaumia) moniulotteinen yleistys. (ii) on normaalijakauman (ks. lukua Jatkuvia jakaumia) moniulotteinen yleistys. Moniulotteisia todennäköisyysjakaumia: Mitä opimme? / Multinormaalijakaumalla on seuraavat ominaisuudet: (i) Multinormaalijakauman reunajakaumat ovat normaalisia. (ii) Multinormaalijakauman ehdolliset jakaumat ovat normaalisia. (iii) Multinormaalijakauman ehdolliset odotusarvot ovat lineaarisia. (iv) Multinormaalijakauman tapauksessa korreloimattomuudesta seuraa riippumattomuus, mikä ei ole yleisesti totta. Huomautus: Satunnaismuuttujien riippumattomuudesta seuraa aina niiden korreloimattomuus. ja sen useampiulotteinen yleistys multinormaalijakauma muodostavat teoreettisen perustan lineaaristen regressiomallien teorialle satunnaisten selittäjien tapauksessa. TKK (c) Ilkka Mellin (4) 3 TKK (c) Ilkka Mellin (4) 4 Moniulotteisia todennäköisyysjakaumia: Esitiedot Esitiedot: ks. seuraavia lukuja: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteisia todennäköisyysjakaumia >> Jakaumien tunnusluvut Diskreettejä jakaumia Jatkuvia jakaumia Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat TKK (c) Ilkka Mellin (4) 5 TKK (c) Ilkka Mellin (4) 6

TKK (c) Ilkka Mellin (4) 7 n tausta /3 Avainsanat Binomijakauma Multinomi Multinomikerroin Ositus Pistetodennäköisyysfunktio Reunajakauma hteisjakauma on binomijakauman (ks. lukua Diskreettejä jakaumia) yleistys useamman toisensa poissulkevan tapahtuman tilanteeseen. A, A,, A k otosavaruuden S ositus. Tällöin: A i A j =, i j S = A A A k Olkoot tapahtumien A, A,, A k todennäköisyydet: Pr(A i ) = p i, i =,,, k p + p + + p k = TKK (c) Ilkka Mellin (4) 8 n tausta /3 n tausta 3/3 Määritellään satunnaismuuttujat i, i =,,, k: i = Tapahtuman A i esiintymisten lukumäärä n-kertaisessa toistokokeessa Tällöin i ~Bin( n, pi), i=,,, k p i = Pr(A i ), i =,,, k Lisäksi + + + = n k lla tarkoitetaan satunnaismuuttujien,,, k yhteisjakaumaa. Huomautus: Satunnaismuuttuja i eivät ole riippumattomia, koska niitä sitoo toisiinsa ehto + + + = n k toistokokeiden lukumäärä n on kiinteä luku. TKK (c) Ilkka Mellin (4) 9 TKK (c) Ilkka Mellin (4) ja sen pistetodennäköisyysfunktio Satunnaismuuttujat,,, k noudattavat (k )- ulotteista multinomijakaumaa, jos niiden yhteisjakauman pistetodennäköisyysfunktio on muotoa Pr( = n ja = n ja ja k = nk) n! n n nk = p p pk n! n! nk! p+ p + + pk = n+ n + + nk = n Merkintä: (,,, k ) Multinom(p, p,, p k ; n) n ominaisuuksia Jos k =, niin multinomijakauma yhtyy binomijakaumaan: Pr Multinom( = n ja = n n) = Pr Bin( = n) n yksiulotteiset reunajakaumat ovat binomijakaumia. Multinomitodennäköisyydet saadaan korottamalla multinomi (p + p + + p k ) potenssiin n: n n! n n n ( p+ p + + p ) k k = p p pk n! n! nk! summa lasketaan yli kaikkien lukujen n, n,, n k, joille pätee ehto n + n + + n k = n TKK (c) Ilkka Mellin (4) TKK (c) Ilkka Mellin (4)

TKK (c) Ilkka Mellin (4) 3 Moniulotteisia todennäköisyysjakaumia >> Avainsanat Ehdollinen jakauma Ehdollinen odotusarvo Ehdollinen varianssi Ellipsi Ellipsin eksentrisyys Ellipsin pääakselit Kovarianssimatriisi Normaalijakauma Ominaisarvot Ominaisvektorit Pääakselihajotelma Regressiofunktio Regressiosuora Reunajakauma Tasa-arvoellipsit Tiheysfunktio hteisjakauma TKK (c) Ilkka Mellin (4) 4 on normaalijakauman (ks. lukua Jatkuvia jakaumia) kaksiulotteinen yleistys. Huomautus: Normaalijakauman yleistystä p-ulotteiseen avaruuteen (p > ) kutsutaan multinormaalijakaumaksi. ja sen tiheysfunktio / Satunnaismuuttujat ja noudattavat kaksiulotteista normaalijakaumaa, jos niiden yhteisjakauman tiheysfunktio on muotoa f (, y) = ep Q(, y) π ( ) ρ ρ y y Qy (, ) ρ = + Merkintä: (, ) N (,,,, ρ ) TKK (c) Ilkka Mellin (4) 5 TKK (c) Ilkka Mellin (4) 6 ja sen tiheysfunktio / Kaksiulotteisen normaalijakauman N (,,,, ρ ) parametrien on toteuttava seuraavat ehdot: < < + > < < + > < ρ <+ n parametrit (, ) N (,,,, ρ ) Kaksiulotteisen normaalijakauman parametreina, jotka täysin määräävät jakauman, ovat satunnaismuuttujien ja odotusarvot ja varianssit sekä niiden korrelaatio: E( ) = Var( ) = E( ) = Var( ) = Cor(, ) = ρ Lisäksi Cov(, ) = = ρ TKK (c) Ilkka Mellin (4) 7 TKK (c) Ilkka Mellin (4) 8

TKK (c) Ilkka Mellin (4) 9 Tiheysfunktion ominaisuudet Tasa-arvoellipsien ominaisuudet /3 Kaksiulotteisen normaalijakauman tiheysfunktio muodostaa pinnan z = f (, y) kolmiulotteisessa avaruudessa. Pinnalla on maksimi satunnaismuuttujien ja odotusarvojen ja määräämässä jakauman todennäköisyysmassan painopisteessä (, ). Pinnan muodon määräävät tasa-arvoellipsit y y Qy (, ) ρ = + = c (vakio) Kaksiulotteisen normaalijakauman tiheysfunktion muodostaman pinnan muodon määräävillä tasaarvoellipseillä on seuraavat ominaisuudet: (i) Ellipsien keskipisteenä on jakauman todennäköisyysmassan painopiste (, ) (ii) Ellipsien eksentrisyys on sekä korrelaatiokertoimen ρ että standardipoikkeamien ja funktio. (iii) Ellipsi on sitä eksentrisempi mitä voimakkaammin satunnaismuuttujat ja ovat korreloituneita eli mitä suurempi on ρ TKK (c) Ilkka Mellin (4) Tasa-arvoellipsien ominaisuudet /3 Tasa-arvoellipsien ominaisuudet 3/3 (iv) Jos ρ = ellipsien pääakselit ovat koordinaattiakseleiden suuntaiset. (v) Jos ρ = ja lisäksi = niin ellipsit ovat ympyröitä. (vi) Jos ρ = ± niin ellipsit surkastuvat janoiksi. Tasa-arvoellipsien pääakselit ovat satunnaismuuttujien ja kovarianssimatriisin Σ = ominaisvektoreiden suuntaiset ja niiden pituudet suhtautuvat toisiinsa kuten matriisin Σ ominaisarvojen neliöjuuret. TKK (c) Ilkka Mellin (4) TKK (c) Ilkka Mellin (4) Jakauman määrittely Tiheysfunktion kuvaaja (, ) N (4, 3,,,.7) Jakauman parametrit ovat E( ) = = 4 Var( ) = = E( ) = = 3 Var( ) = = Cor(, ) = ρ =.7 Siten Cov(, ) = ρ =.7 =.9899 (, ) N (4, 3,,,.7) jolloin = 4 = = 3 = ρ =.7 Kuva oikealla esittää jakauman tiheysfunktiota f (, y).. - 4 6 8 8 6 4 y - TKK (c) Ilkka Mellin (4) 3 TKK (c) Ilkka Mellin (4) 4

TKK (c) Ilkka Mellin (4) 5 Tasa-arvoellipsien yhtälöt (, ) N (4, 3,,,.7) Jakauman todennäköisyysmassan painopisteenä on piste (, ) = (4, 3) Jakauman tiheysfunktion muodostaman pinnan muodon määräävät tasa-arvoellipsit 4 y 3 4 y 3 Qy (, ) = +.7 = c (vakio) Ellipsien keskipisteenä on jakauman todennäköisyysmassan painopiste (, ) = (4, 3) Kovarianssimatriisi (, ) N (4, 3,,,.7) Tällöin satunnaismuuttujien ja kovarianssimatriisi on Σ = ρ = ρ.7 =.7.9899 =.9899 TKK (c) Ilkka Mellin (4) 6 Kovarianssimatriisin pääakselihajotelma /6 Σ = ULU kovarianssimatriisin Σ pääakselihajotelma, L on matriisin Σ ominaisarvojen muodostama diagonaalimatriisi ja U on vastaavien ominaisvektoreiden muodostama ortogonaalinen matriisi, ominaisvektorit ovat sarakkeina. Kovarianssimatriisin pääakselihajotelma /6 Olkoot λ λ matriisin Σ ominaisarvot ja u = (u, u ) u = (u, u ) niitä vastaavat ominaisvektorit. Tällöin λ u u L=, λ U= u u ja U ΣU = L U U = UU = I TKK (c) Ilkka Mellin (4) 7 TKK (c) Ilkka Mellin (4) 8 Kovarianssimatriisin pääakselihajotelma 3/6 λ kovarianssimatriisin Σ ominaisarvo. Tällöin λ toteuttaa yhtälön λ det( Σ λi) = det λ = λ ( + ) λ+ = Tämän. asteen yhtälön ratkaisut saadaan kaavasta + ± ( ) + 4 λ = Ratkaisuiksi saadaan λ =.69 λ =.399 Kovarianssimatriisin pääakselihajotelma 4/6 u = (u, u ) kovarianssimatriisin Σ ominaisarvoa λ vastaava ominaisvektori. Tällöin u toteuttaa matriisiyhtälön Σu= λu Koska vaadimme, että uu = u + u = niin vektori u = (u, u ) saadaan ratkaistuksi yhtälöryhmästä ( λ) u+ u = u+ ( λ) u = u + u = TKK (c) Ilkka Mellin (4) 9 TKK (c) Ilkka Mellin (4) 3

TKK (c) Ilkka Mellin (4) 3 Kovarianssimatriisin pääakselihajotelma 5/6 Ominaisarvoa λ =.69 vastaavaksi ominaisvektoriksi saadaan u = (u, u ) = (.857,.54) Ominaisarvoa λ =.399 vastaavaksi ominaisvektoriksi saadaan u = (u, u ) = (.54,.857) Kovarianssimatriisin pääakselihajotelma 6/6 Kovarianssimatriisin.7.9899 Σ = = =.9899.7 pääakselihajotelmaksi Σ = ULU saadaan siis λ.69 L = = λ.399 u u.857.54 U = = u u.54.857 L on matriisin Σ ominaisarvojen muodostama diagonaalimatriisi ja U on vastaavien ominaisvektoreiden muodostama ortogonaalinen matriisi, ominaisvektorit ovat sarakkeina. TKK (c) Ilkka Mellin (4) 3 Tasa-arvoellipsit ja niiden pääakselit /4 (, ) N (4, 3,,,.7) Jakauman tiheysfunktion muodostaman pinnan muodon määräävien tasa-arvoellipsien pääakselit leikkaavat jakauman todennäköisyysmassan painopisteessä (, ) = (4,3) Tasa-arvoellipsien pääakseleiden pituudet suhtautuvat toisiinsa kuten kovarianssimatriisin Σ ominaisarvojen λ =.69 λ =.399 neliöjuuret ja vastaavat ominaisvektorit määräävät pääakseleiden suunnat. TKK (c) Ilkka Mellin (4) 33 Tasa-arvoellipsit ja niiden pääakselit /4 Tasa-arvoellipsien pääakseleiden suuntaisten suorien yhtälöt ovat y = a+ b y = a + b u.54 b = = =.65 u.857 a = b = 3 b 4 =.539 ovat suurempaa ominaisarvoa.69 vastaavan, pitempään pääakseliin liittyvän suoran kertoimet ja u.857 b = = =.654 u.54 a = b = 3 b 4 = 9.55 ovat pienempää ominaisarvoa.399 vastaavan, lyhyempään pääakseliin liittyvän suoran kertoimet. TKK (c) Ilkka Mellin (4) 34 Tasa-arvoellipsit ja niiden pääakselit 3/4 Tasa-arvoellipsit ja niiden pääakselit 4/4 (, ) N (4, 3,,,.7) jolloin = 4 = = 3 = ρ =.7 Kuva oikealla esittää jakauman tiheysfunktion kuvaajan tasaarvoellipsejä, jotka vastaavat (likimäärin) todennäköisyyksiä 68 %, 95 % ja 99.7 %. Esimerkiksi uloimman ellipsin sisään jää n. 99.7 % jakauman todennäköisyysmassasta. 8 6 4 - N (4, 3,,,.7) (, ) - 4 6 8 (, ) N (4, 3,,,.7) Kuva oikealla esittää jakauman tiheysfunktion kuvaajan tasaarvoellipsejä, jotka vastaavat (likimäärin) todennäköisyyksiä 68 %, 95 % ja 99.7 %. Kuvaan on lisäksi piirretty tasaarvoellipsien pääakselien suuntaiset suorat y =.539 +.65 y = 9.55.654 N (4, 3,,,.7) 8 6 4 - - 4 6 8 TKK (c) Ilkka Mellin (4) 35 TKK (c) Ilkka Mellin (4) 36

TKK (c) Ilkka Mellin (4) 37 Reunajakaumat Voidaan osoittaa, että kaksiulotteisen normaalijakauman reunajakaumat ovat normaalisia: N(, ) N(, ) ja niiden tiheysfunktiot ovat f ( ) = ep π y f ( y) = ep π Reunajakaumat.5.4.3.. N(4, ) - 4 6 8 (, ) N (4, 3,,,.7) Kuvat yllä esittävät satunnaismuuttujien ja reunajakaumia: N(4, ) N(3, ).5.4.3.. N(3, ) - 4 6 8 TKK (c) Ilkka Mellin (4) 38 Korreloimattomuus vs riippumattomuus Kaksiulotteisen normaalijakauman tapauksessa satunnaismuuttujien ja korreloimattomuus on yhtäpitävää niiden riippumattomuuden kanssa. Huomautuksia: Satunnaismuuttujien riippumattomuudesta seuraa aina niiden korreloimattomuus. Satunnaismuuttujien korreloimattomuudesta ei yleisesti seuraa niiden riippumattomuus. Korreloimattomuus vs riippumattomuus: Perustelu /3 Oletetaan, että satunnaismuuttujat ja noudattavat kaksiulotteista normaalijakaumaa: (, ) N (,,,, ρ ) Jos satunnaismuuttujat ja ovat riippumattomia, niin ne ovat myös korreloimattomia, koska satunnaismuuttujien riippumattomuudesta seuraa aina niiden korreloimattomuus; ks. lukua Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. Oletetaan nyt, että satunnaismuuttujat ja korreloimattomia eli ρ = TKK (c) Ilkka Mellin (4) 39 TKK (c) Ilkka Mellin (4) 4 Korreloimattomuus vs riippumattomuus: Perustelu /3 Kaksiulotteisen normaalijakauman tiheysfunktio on f (, y) = ep Q(, y) π ( ) ρ ρ y y Qy (, ) = ρ + Jos ρ =, niin y f (, y) = ep π + y = ep ep π π = f ( ) f ( y) TKK (c) Ilkka Mellin (4) 4 Korreloimattomuus vs riippumattomuus: Perustelu 3/3 Jos siis ρ =, niin f ( y, ) = f ( f ) ( y) f () ja f (y) ovat satunnaismuuttujien ja reunajakaumien tiheysfunktiot. Koska oletuksesta ρ = seuraa, että kaksiulotteisen normaalijakauman tiheysfunktio voidaan esittää reunajakaumiensa tiheysfunktioiden tulona, niin satunnaismuuttujat ja ovat tällöin rippumattomia; ks. lukua Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (4) 4

TKK (c) Ilkka Mellin (4) 43 Ehdolliset jakaumat / Ehdolliset jakaumat / Kaksiulotteisen normaalijakauman ehdolliset jakaumat ovat normaalisia: ( = y )~ N (, ) = E( = y) = ( y ) = Var( = y) = ( ρ ) Kaksiulotteisen normaalijakauman ehdolliset jakaumat ovat normaalisia: ( = )~ N (, ) = E( = ) = ( ) = Var( = ) = ( ρ ) TKK (c) Ilkka Mellin (4) 44 Ehdolliset jakaumat: Perustelu /4 Esitetään perustelu kaksiulotteisen normaalijakauman ehdollisten jakaumien normaalisuudelle tarkastelemalla satunnaismuuttujan ehdollista jakaumaa satunnaismuuttujan suhteen (ehdolla = ). f ( y, ) f y ( ) = satunnaismuuttujien ja yhteisjakauman tiheysfunktio = satunnaismuuttujan ehdollisen jakauman tiheysfunktio satunnaismuuttujan suhteen = satunnaismuuttujan reunajakauman tiheysfunktio f ( ) Ehdollisen jakauman tiheysfunktion määritelmän mukaan f ( y, ) f ( y ) = f ( ) Ehdolliset jakaumat: Perustelu /4 Kaksiulotteisen normaalijakauman tiheysfunktio f ( y, ): f (, y) = ep Q(, y) π ( ) ρ ρ y y Qy (, ) = + ρ Satunnaismuuttujan reunajakauman tiheysfunktio f ( ) : f ( ) = ep π TKK (c) Ilkka Mellin (4) 45 TKK (c) Ilkka Mellin (4) 46 Ehdolliset jakaumat: Perustelu 3/4 Nähdään (melko) helposti, että f (, y) f ( y ) = f ( ) = ep Qy ( ) π ( ) ( ) ρ ρ Qy ( ) = y y ρ ( ) Ehdolliset jakaumat: Perustelu 4/4 Siten satunnaismuuttujan ehdollinen jakauma satunnaismuuttujan suhteen (ehdolla = ) on normaalinen: ( = )~ N(, ) = E( = ) = ( ) = Var( = ) = ( ρ ) TKK (c) Ilkka Mellin (4) 47 TKK (c) Ilkka Mellin (4) 48

TKK (c) Ilkka Mellin (4) 49 Ehdolliset odotusarvot Regressiosuorat Satunnaismuuttujan ehdollinen odotusarvo eli regressiofunktio satunnaismuuttujan suhteen E( = y) = ( y ) on lineaarinen satunnaismuuttujan arvojen y suhteen. Satunnaismuuttujan ehdollinen odotusarvo eli regressiofunktio satunnaismuuttujan suhteen E( = ) = ( ) on lineaarinen satunnaismuuttujan arvojen suhteen. Kaksiulotteisen multinormaalijakauman regressiokäyrät ovat suoria, joiden yhtälöt voidaan kirjoittaa satunnaismuuttujan saamien arvojen funktioina seuraaviin muotoihin: (i) y:n regressiosuora :n suhteen: y = ( ) (ii) :n regressiosuora y:n suhteen: y = + ( ) ρ TKK (c) Ilkka Mellin (4) 5 Regressiosuorien ominaisuudet /5 Regressiosuorien ominaisuudet /5 y = ( ) y:n regressiosuora :n suhteen ja y = + ( ) ρ :n regressiosuora y:n suhteen. Regressiosuorilla on seuraavat ominaisuudet: (i) Molemmat regressiosuorat kulkevat jakauman todennäköisyysmassan painopisteen (, ) kautta. (ii) Molempien regressiosuorien kulmakertoimilla ja satunnaismuuttujien ja korrelaatiokertoimella ρ on aina sama merkki: Suorat ovat nousevia, jos ρ >. Suorat ovat laskevia, jos ρ <. (iii) y:n regressiosuora :n suhteen on aina loivempi kuin :n regressiosuora y:n suhteen, koska ρ TKK (c) Ilkka Mellin (4) 5 TKK (c) Ilkka Mellin (4) 5 Regressiosuorien ominaisuudet 3/5 Regressiosuorien ominaisuudet 4/5 (iv) (v) y:n regressiosuora :n suhteen on sitä jyrkempi mitä voimakkaammin satunnaismuuttujat ja ovat korreloituneita eli mitä suurempi on ρ :n regressiosuora y:n suhteen on sitä loivempi mitä voimakkaammin satunnaismuuttujat ja ovat korreloituneita eli mitä suurempi on ρ (vi) Molemmat regressiosuorat ovat sitä jyrkempiä mitä suurempi on satunnaismuuttujan varianssi (vii) Molemmat regressiosuorat ovat sitä jyrkempiä mitä pienempi on satunnaismuuttujan varianssi (viii) Regressiosuorat yhtyvät täsmälleen silloin, kun ρ = ± TKK (c) Ilkka Mellin (4) 53 TKK (c) Ilkka Mellin (4) 54

TKK (c) Ilkka Mellin (4) 55 Regressiosuorien ominaisuudet 5/5 Regressiosuorat / (i) Jos ρ =, niin regressiosuorat ovat kohtisuorassa toisiaan vastaan ja y:n regressiosuora :n suhteen on y = ja :n regressiosuora y:n suhteen on = jolloin y:n saamat arvot eivät riipu :n saamista arvoista ja :n saamat arvot eivät riipu y:n saamista arvoista. (, ) N (4, 3,,,.7) y:n regressiosuora muuttujan suhteen on y = ( ) = 3 +.7 ( 4) =.+.495 :n regressiosuora muuttujan y suhteen on y = + ( ) ρ = 3 + ( 4) =.46 +..7 TKK (c) Ilkka Mellin (4) 56 Regressiosuorat / Regressiosuorat ja standardointi (, ) N (4, 3,,,.7) Kuva oikealla esittää jakauman tiheysfunktion kuvaajan tasaarvoellipsejä, jotka vastaavat (likimäärin) todennäköisyyksiä 68 %, 95 % ja 99.7 %. Kuvan suorista loivempi y =.+.495 on y:n regressiosuora :n suhteen ja suorista jyrkempi y =.46 +. on :n regressiosuora y:n suhteen. N (4, 3,,,.7) 8 6 4 - - 4 6 8 Regressiosuorat voidaan kirjoittaa standardoitujen muuttujien y y = = funktioina seuraaviin muotoihin: y = ρ y:n regressiosuora :n suhteen y = :n regressiosuora y:n suhteen ρ Standardoitujen muuttujien välisten regressiosuorien kulmakertoimet ovat siis toistensa käänteislukuja. TKK (c) Ilkka Mellin (4) 57 TKK (c) Ilkka Mellin (4) 58 Ehdolliset varianssit / Ehdolliset varianssit / Satunnaismuuttujan ehdollinen varianssi satunnaismuuttujan suhteen on korkeintaan yhtä suuri kuin satunnaismuuttujan varianssi: = ( ρ ) Jos siis ρ, niin satunnaismuuttujan ehdollinen jakauma satunnaismuuttujan suhteen vaihtelee :n regressiosuoran ympärillä vähemmän kuin satunnaismuuttuja oman painopisteensä ympärillä. Lisäksi pätee, että = ρ =± = ρ = Satunnaismuuttujan ehdollinen varianssi satunnaismuuttujan suhteen on korkeintaan yhtä suuri kuin satunnaismuuttujan varianssi: = ( ρ) Jos siis ρ, niin satunnaismuuttujan ehdollinen jakauma satunnaismuuttujan suhteen vaihtelee y:n regressiosuoran ympärillä vähemmän kuin satunnaismuuttuja oman painopisteensä ympärillä. Lisäksi pätee, että = ρ =± = ρ = TKK (c) Ilkka Mellin (4) 59 TKK (c) Ilkka Mellin (4) 6

TKK (c) Ilkka Mellin (4) 6 Ehdolliset varianssit: Kommentti Satunnaismuuttujan ehdollisen varianssin kaavasta = ( ρ) ja satunnaismuuttujan ehdollisen varianssin kaavasta = ( ρ) nähdään välittömästi, että kumpikaan ehdollisista variansseista ei riipu ehtomuuttujan arvoista. Siten kaksiulotteisen normaalijakauman kummankaan ehdollisen jakauman todennäköisyysmassan vaihtelu vastaavan regressiosuoran ympärillä ei riipu ehtomuuttujan arvoista. Ehdolliset varianssit (, ) ~ N (4, 3,,,.7) Satunnaismuuttujan ehdollinen varianssi satunnaismuuttujan suhteen on = ( ρ) = (.7 ) =.5 = Satunnaismuuttujan ehdollinen varianssi satunnaismuuttujan suhteen on = ( ρ ) = (.7 ) =. = TKK (c) Ilkka Mellin (4) 6