Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1
Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2
Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen ajatellaan olevan peräisin jostakin jakaumasta Tällä kurssilla käsitellään ilmiöitä, jotka ovat peräisin Bernoulli-, binomi- tai normaalijakaumasta Kokeellisessa tutkimuksessa testataan, miten erilaiset käsittelyt vaikuttavat tutkimuksen kohteisiin Testit perustuvat testisuureisiin, jotka noudattavat - Normaalijakaumaa - t-jakaumaa - χ 2 -jakaumaa - F -jakaumaa Vilkkumaa / Kuusinen 3
Satunnaismuuttujat, todennäköisyysjakaumat ja tilastolliset mallit Satunnaismuuttuja ξ kuvaa satunnaisilmiön tulosvaihtoehtoja numeerisessa muodossa. - Esim. Huomenna sataa ξ = 1, Huomenna ei sada ξ = 0 Satunnaismuuttujan kaikkiin mahdollisiin arvoihin liitetään todennäköisyydet määrittelemällä satunnaismuuttujan todennäköisyysjakauma. - Esim. P r(ξ = 1) = 0.4, P r(ξ = 0) = 0.6 Tilastollinen malli on satunnaismuuttujan ja sen jakauman yhdistelmä. Vilkkumaa / Kuusinen 4
Satunnaismuuttujien tyyppejä Satunnaismuuttujat voidaan jakaa kahteen ryhmään: Diskreetit satunnaismuuttujat - Satunnaismuuttuja on diskreetti, jos sen mahdollisten arvojen joukko koostuu diskreeteistä reaaliakselin pisteistä Jatkuvat satunnaismuuttujat - Satunnaismuuttuja on jatkuva, jos sen arvoalue on jokin reaaliakselin osaväli. Vilkkumaa / Kuusinen 5
Diskreetti satunnaismuuttuja - pistetodennäköisyysfunktio Merkitään satunnaismuuttujan ξ arvojen joukkoa T :llä ja otosavaruutta (tulosvaihtoehtojen joukkoa) S:llä: T = {x 1, x 2,..., x n }, jos S on äärellinen T = {x 1, x 2,... }, jos S on numeroituvasti ääretön Reaaliarvoinen funktio f määrittelee pistetodennäköisyysfunktion ξ:lle, jos 1. f(x i ) = P r(ξ = x i ) x i T 2. f(x i ) 0 x i T 3. T f(x i) = 1 Todennäköisyyttä P r(ξ = x i ) = p i sanotaan pistetodennäköisyydeksi. Vilkkumaa / Kuusinen 6
Jatkuva satunnaismuutuja - tiheysfunktio Reaaliarvoinen funktio f määrittelee (todennäköisyys-) tiheysfunktion jatkuvalle satunnaismuuttujalle ξ, jos 1. f(x) on x:n jatkuva funktio 2. f(x i ) 0 x 3. + f(x)dx = 1 4. P r(a ξ b) = b a f(x)dx Vilkkumaa / Kuusinen 7
Kertymäfunktio Satunnaismuuttujan ξ kertymäfunktio F (x) = P r(ξ x) kuvaa todennäköisyysmassan kertymistä argumentin x kasvaessa. Kertymäfunktiolle pätee: P r(ξ > x) = 1 F (x) P r(a ξ b) = F (b) F (a) Diskreetissä tapauksessa kertymäfunktio saadaan kaavalla F (x) = P r(ξ x) = i x i x Jatkuvassa tapauksessa kertymäfunktio saadaan kaavalla F (x) = P r(ξ x) = x p i f(x)dx Vilkkumaa / Kuusinen 8
Jakaumien tunnusluvut Vilkkumaa / Kuusinen 9
Odotusarvo Satunnaismuuttujan X odotusarvo on jakauman painopiste, jonka ympärillä satunnaismuuttujan arvot vaihtelevat koetoistosta toiseen. Diskreetin jakauman odotusarvo: E(X) = μ X = i x i p i = i x i f(x i ) Jatkuvan jakauman odotusarvo: E(X) = μ X = + xf(x)dx Vilkkumaa / Kuusinen 10
Odotusarvon ominaisuuksia Vakion odotusarvo on vakio itse, koska se ei vaihtele koetoistosta toiseen: E(a) = a Lineaarimuunnokselle Y = a + bx pätee: E(Y ) = a + be(x) Kahden satunnaismuuttujan summalle ja erotukselle pätee: E(X + Y ) = E(X) + E(Y ) E(X Y ) = E(X) E(Y ) Yleisesti satunnaismuuttujien X i, i = 1, 2,..., n painotetulle summalle pätee: ( n ) n E a i X i = a i E(X i ) i=1 i=1 Vilkkumaa / Kuusinen 11
Satunnaismuuttujan funktion odotusarvo Odotusarvo diskreetin satunnaismuuttujan X funktiolle g(x) saadaan seuraavasti: E(g(X)) = i g(x i )p i = i g(x i )f(x i ) Vastaavasti jatkuvan satunnaismuuttujan X funktiolle g(x): E(g(X)) = + g(x)f(x)dx Vilkkumaa / Kuusinen 12
Varianssi ja standardipoikkeama eli keskihajonta Satunnaismuuttujan X varianssi on satunnaismuuttujan odotusarvosta lasketun poikkeaman neliön odotusarvo. Ts. varianssi kuvaa vaihtelun neliötä. Diskreetin satunnaismuuttujan varianssi: D 2 (X) = Var(X) = σ 2 X = i (x i μ x ) 2 p i = i (x i μ x ) 2 f(x i ) Jatkuvan satunnaismuuttujan varianssi: D 2 (X) = Var(X) = σ 2 X = + (x μ x ) 2 f(x)dx Standardipoikkeama eli keskihajonta saadaan varianssin neliöjuurena: D(X) = D 2 (X) = Var(X) Vilkkumaa / Kuusinen 13
Varianssin ominaisuuksia Vakion varianssi on nolla, koska vakio ei vaihtele: D 2 (a) = 0 Lineaarimuunnokselle Y = a + bx pätee: D 2 (Y ) = b 2 D 2 (X) Kahden riippumattoman satunnaismuuttujan summalle ja erotukselle pätee: D 2 (X + Y ) = D 2 (X) + D 2 (Y ) D 2 (X Y ) = D 2 (X) + D 2 (Y ) Satunnaismuuttujan X varianssi voidaan esittää myös seuraavassa muodossa: Var(X) = E(X 2 ) [E(X)] 2 Vilkkumaa / Kuusinen 14
Diskreetit jakaumat Vilkkumaa / Kuusinen 15
Diskreetti tasainen jakauma Jakauma kuvaa tilannetta, jossa kullakin tulosvaihtoehdolla on sama todennäköisyys (esim. nopan- tai kolikonheitto) Pistetodennäköisyysfunktio: f(x) = P r(x = x) = 1 n, x = x k, k = 1, 2,..., n Odotusarvo: n E(X) = ˉx = 1 n k=1 x k Varianssi: D 2 (X) = 1 n n (x k ˉx) 2 k=1 Vilkkumaa / Kuusinen 16
Bernoulli -jakauma 1/2 Bernoulli-koe on koe, jolla on vain kaksi mahdollista tulosvaihtoehtoa. Esimerkiksi kolikon heitto. Olkoon A otosavaruuden S tapahtuma ja P r(a) = p. Määritellään diskreetti satunnaismuuttuja X, joka kuvaa tapahtumaan A liittyvää Bernoulli-koetta: X = Satunnaismuuttujan X jakauma on 1, jos A tapahtuu 0, jos A ei tapahdu P r(x = 1) = p P r(x = 0) = 1 p = q Vilkkumaa / Kuusinen 17
Bernoulli-jakauma 2/2 X Bernoulli(p) Satunnaismuuttujan X pistetodennäköisyysfunktio: f(x) = P r(x = x) = p x q 1 x, q = 1 p, x = 0, 1 Odotusarvo: Varianssi: E(X) = p D 2 (X) = pq Vilkkumaa / Kuusinen 18
Binomijakauma Kun Bernoulli-koetta toistetaan n kertaa, missä n on etukäteen päätetty, tapahtuman A esiintymiskertojen lukumäärä X noudattaa binomijakaumaa parametreinaan n ja p. Esimerkiksi klaavan esiintymiskertojen lukumäärä. X Bin(n, p) Satunnaismuuttujan X pistetodennäköisyysfunktio: ( ) n f(x) = P r(x = x) = p x q n x, q = 1 p, x = 0, 1, 2,..., n x Odotusarvo: Varianssi: E(X) = np D 2 (X) = npq Vilkkumaa / Kuusinen 19
Jatkuvia jakaumia Vilkkumaa / Kuusinen 20
Normaalijakauma Normaalijakauma esiintyy monien ilmiöiden yhteydessä luonnossa ja tekniikassa. Esimerkiksi suomalaisten jalan kokoa, ihmisten pituutta ja fysikaalisen mittauksen mittausvirhettä voidaan pitää normaalijakautuneina. X N(μ, σ 2 ) Satunnaismuuttujan X tiheysfunktio: f(x) = 1 1 ( x μ σ 2π e 2 σ Odotusarvo ja varianssi: ) 2 E(X) = μ D 2 (X) = σ 2 Vilkkumaa / Kuusinen 21
Normaalijakauman standardointi ja todennäköisyydet Olkoon X N(μ, σ 2 ). Tällöin Z = X μ σ N(0, 1) Operaatiota kutsutaan standardoinniksi ja jakaumaa N(0, 1) standardoiduksi normaalijakaumaksi. Kaikki normaalijakauman todennäköisyydet saadaan määrättyä standardoinnin avulla: ( a μ P r(a X b) = P r σ Z b μ σ ) Vilkkumaa / Kuusinen 22
Klikkeri-kysely Olkoon X N(3, 2 2 ). Mikä seuraavista vastaa todennäköisyyttä P r(1 X 5), kun Z N(0, 1)? 1. P r( 0.5 Z 0.5), 2. P r( 1 Z 1), 3. P r(1 Z 5). P r(1 X 5) =? 1. 0.68 2. 0.84 3. 0.50 Vilkkumaa / Kuusinen 23
Normaalijakaumasta johdettuja jakaumia Vilkkumaa / Kuusinen 24
χ 2 -jakauma Olkoot Z i N(0, 1), i = 1, 2,..., n riippumattomia satunnaismuuttujia. X = n i=1 Z2 i χ 2 (n) eli X noudattaa khin neliön jakaumaa vapausasteilla n. Jakauma kuvaa siis normaalijakautuneiden satunnaismuuttujien neliöden summan jakaumaa. Odotusarvo: E(X) = n Vilkkumaa / Kuusinen 25
F -jakauma Olkoot X i N(0, 1), i = 1, 2,..., n ja Y i N(0, 1), i = 1, 2,..., m riippumattomia satunnaismuuttujia. Olkoot X = n i=1 X2 i χ 2 (n) ja Y = m i=1 Y i 2 χ 2 (m) sekä F = 1 Y m 1 X n Tällöin F F (m, n) eli F noudattaa Fisherin F -jakaumaa vapausasteilla m ja n. Jos F F (m, n), niin silloin 1 F F (n, m) Vilkkumaa / Kuusinen 26
t -jakauma Olkoot X i N(0, 1), i = 1, 2,..., n ja Y N(0, 1) riippumattomia satunnaismuuttujia. Olkoon X = n i=1 X2 i χ 2 (n) sekä Tällöin T t(n) T = Y 1 n X Odotusarvo: E(T ) = 0, n > 1 t-jakauma lähestyy N(0, 1)-jakaumaa vapausasteiden kasvaessa. Vilkkumaa / Kuusinen 27
Moniulotteiset todennäköisyysjakaumat Vilkkumaa / Kuusinen 28
Johdanto Yksi ainut satunnaismuuttuja ei riitä kuvaamaan useimpia satunnaisilmiöitä. Jos ilmiöön liittyy useita satunnaisia tekijöitä, ovat näiden tekijöiden väliset riippuvuudet tilastollisen mallintamisen kannalta erityisen mielenkiintoisia. Näiden riippuvuuksien mallintaminen tapahtuu yhteisjakauman avulla. Vilkkumaa / Kuusinen 29
2D diskreetin jakauman pistetodennäköisyysfunktio Reaaliarvoinen funktio f XY : R 2 R määrittelee diskreettien satunnaismuuttujien X ja Y yhteisjakauman pistetodennäköisyysfunktion, jos 1. f XY (x, y) 0 x, y 2. x y f XY (x, y) = 1 3. Pr(X = x Y = y) = f XY (x, y) Olkoon A R 2 jokin tapahtuma. Tällöin Pr((X, Y ) A) = (x,y) A f XY (x, y) Vilkkumaa / Kuusinen 30
2D jatkuvan jakauman tiheysfunktio Reaaliarvoinen jatkuva funktio f XY : R 2 R määrittelee jatkuvien satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktion, jos 1. f XY (x, y) 0 x, y 2. + + f XY (x, y)dydx = 1 3. Pr(a X b c Y d) = b a Olkoon A R 2 jokin tapahtuma. Tällöin Pr((X, Y ) A) = A d c f XY (x, y)dydx f XY (x, y)dydx Vilkkumaa / Kuusinen 31
Kaksiulotteisten jakaumien kertymäfunktiot Satunnaismuuttujien X ja Y yhteisjakauman kertymäfunktio F XY määritellään seuraavasti: F XY (x, y) = Pr(X x Y y) Diskreetille jakaumalle: F XY (x, y) = Pr(X x Y y) = x i x Jatkuvalle jakaumalle: y i y f XY (x i, y i ) F XY (x, y) = Pr(X x Y y) = x y f XY (u, v)dvdu Vilkkumaa / Kuusinen 32
Kaksiulotteisten jakaumien reunajakaumat Diskreetissä tapauksessa satunnaismuuttujien X ja Y reunajakaumien pistetodennäköisyysfunktiot saadaan seuraavasti: f X (x) = Pr(X = x) = y f XY (x, y) f Y (y) = Pr(Y = y) = x f XY (x, y) Vastaavasti jatkuvassa tapauksessa satunnaismuuttujien X ja Y reunajakaumien tiheysfunktiot saadaan seuraavasti: f X (x) = f Y (y) = + + f XY (x, y)dy f XY (x, y)dx Vilkkumaa / Kuusinen 33
Satunnaismuuttujien riippumattomuus Kaksi satunnaismuuttujaa ovat riippumattomia jos ja vain jos seuraavat yhtäpitävät ehdot toteutuvat (tässä F X (x) ja F Y (y) ovat reunajakaumien kertymäfunktiot): 1. f XY (x, y) = f X (x)f Y (y) 2. F XY (x, y) = F X (x)f Y (y) Yleisesti satunnaismuuttujille X 1, X 2,..., X n, joiden yhteisjakauman pistetn- tai tiheysfunktio on f(x 1, x 2,..., x n ) ja reunajakaumien pistetn- tai tiheysfunktiot ovat f(x i ), i = 1, 2,..., n (sekä vastaavat kertymäfunktiot merkittynä F :llä): 1. f(x 1, x 2,..., x n ) = f(x 1 )f(x 2 ) f(x n ) 2. F (x 1, x 2,..., x n ) = F (x 1 )F (x 2 ) F (x n ) Vilkkumaa / Kuusinen 34
Kaksiulotteisen jakauman yleinen odotusarvo Olkoon g : R 2 R jatkuva funktio. Tällöin diskreetissä tapauksessa: E(g(X, Y )) = x y g(x, y)f XY (x, y) Ja vastaavasti jatkuvassa tapauksessa: E(g(X, Y )) = + + g(x, y)f XY (x, y)dydx Vilkkumaa / Kuusinen 35
Reunajakaumien odotusarvot Diskreetissä tapauksessa: E(X) = x xf XY (x, y) = x x y f XY (x, y) = x xf X (x) E(Y ) = x y yf XY (x, y) = y y x f XY (x, y) = y yf Y (y) y Ja vastaavasti jatkuvassa tapauksessa: E(X) = = + + + x + xf XY (x, y)dydx f XY (x, y)dydx = + xf X (x)dx Vilkkumaa / Kuusinen 36
Kovarianssi Kovarianssi kuvaa kahden satunnaismuuttujan yhteisvaihtelua niiden yhteisjakauman painopisteen (μ X, μ Y ) ympärillä. Cov(X, Y ) = σ XY = E ( (X μ X )(Y μ Y ) ) = E(XY ) E(X)E(Y ) Laskukaavat diskreeteille ja jatkuville jakaumille: Cov(X, Y ) = x Cov(X, Y ) = (x μ X )(y μ Y )f XY (x, y) y + + Cov(X, X) = Var(X) ja Cov(Y, Y ) = Var(Y ). (x μ X )(y μ Y )f XY (x, y) dy dx Vilkkumaa / Kuusinen 37
Korrelaatiokerroin Korrelaatiokerroin kuvaa kahden satunnaismuuttujan lineaarisen riippuvuuden voimakkuutta. Cor(X, Y ) = ρ XY = Cov(X, Y ) = Cov(X, Y ) Var(X)Var(Y ) D(X)D(Y ) = σ XY σ X σ Y Vilkkumaa / Kuusinen 38
Klikkeri-kysely Mikä seuraavista väittämistä EI pidä paikkaansa? 1. 1 Cor(X, Y ) 1 2. Cor(X, Y ) = 0 X Y 3. Cor(X, Y ) = ±1 jos ja vain jos Y = α + βx, missä β 0. Vilkkumaa / Kuusinen 39
Yhteenveto Kokeellisessa tutkimuksessa on tavoitteena selvittää, miten erilaiset käsittelyt vaikuttavat tutkimuksen kohteisiin Kokeesta ei voida tehdä luotettavia johtopäätöksiä, ellei koe ole kontrolloitu: - Kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia. - Käsittelyjen kohdistamisessa on käytettävä satunnaistusta. - Kokeessa on tehtävä riittävästi koetoistoja. Vilkkumaa / Kuusinen 40
Yhteenveto Kokeita varten on oletettava ilmiötä kuvaavien havaintojen noudattavan jotakin tilastollista mallia, ts. olevan peräisin jostakin jakaumasta Tällä kurssilla havainnot ovat peräisin - Normaalijakaumasta - Binomijakaumasta Tällöin ne testisuureet, joihin kokeet perustuvat, noudattavat - Normaalijakaumaa - t-jakaumaa - χ 2 -jakaumaa - F -jakaumaa Vilkkumaa / Kuusinen 41