Tilastotieteen jatkokurssi Sosiaalitieteiden laitos Harjoitus 5 (viikko 9) Ratkaisuehdotuksia (Laura Tuohilampi). Jatkoa HT 4.5:teen. Määrää E(X) ja D (X). E(X) = 5X p i x i =0.8 0+0.39 +0.4 +0.4 3+0.04 4+0.0 5 i=0 =.5 5X D (X) = p i (x i E(X)) i=0 =0.8 (0.5) +0.39 (.5) +0.4 (.5) +0.4 (.5 3) +0.04 (.5 4) +0.0 (5.5) =.5. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet a) P (X 4) b) P (X >3) c) P ( <X<5) ja d) P (X =). X:n todennäköisyysjakauma ja kertymäfunktio x i 0 3 4 5 p i 0.8 0.39 0.4 0.4 0.04 0.0 F(i) 54/300 7/300 43/300 85/300 97/300 300/300 =0.8 =0.57 =0.8 =0.95 =0.99 = a) P (X 4) = F (4) = 0.99 b) P (X >3) = F (5) F (3) = 0.95 = 0.05
c) P ( <X<5) = F (4) F () = 0.99 0.57 = 0.4 d) P (X =)=F () F () = 0.8 0.57 = 0.4 = p 3. Oletetaan, että tytöt ja pojat syntyvät toisistaan riippumatta samalla todennäköisyydellä / (empiirisesti tämä ei pidä paikkaansa). Olkoon perheessä neljä lasta. Laske todennäköisyys, etta perheessä a) on ainakin yksi poika. b) on ainakin yksi poika ja yksi tyttö. (Vihje: Binomijakauma.) Tässä X Bin(4, ) (Satunnaismuuttuja voi kuvata sekä tyttöjen että poikien lukumäärää). a) P (perheessä ainakin yksi poika)= P (perheessä ei yhtään poikaa) = P (X =0). Sijoittamalla binomikaavaan saadaan µ 4 P (X ) = P (X =0)= 0 0 4 0 4 = = 6 = 5 6. b) P (ainakin yksi tyttö ja yksi poika)=p (yksi, kaksi tai kolme poikaa(tai tyttöä)) =P (X =)+P (X =)+P (X =3). Sijoittamalla taas binomikaavaan saadaan P (X =)+P (X =)+P (X =3)= µ 4 =4 µ µ 4 4 4 4 + + 3 3 3 +6 +4 = 8 +6 4 4 +4 8 = 4 + 3 8 + 4 = 7 8. 3 4 3 4. Oletetaan edelleen, että tytöt ja pojat syntyvät toisistaan riippumatta samalla todennäköisyydellä /. Tutkitaan kahtatuhatta nelilapsista perhettä. Mikä on odotusarvo perheiden lukumäärälle, joissa on a) ainakin yksi poika?
b) kaksi poikaa? c) yksi tai kaksi tyttöä? d) ei yhtään tyttöä? a) E(ainakin yksi poika)= 000 5 6 = 875 b) P (X =)= 3 3 8,jotenE(kaksi poikaa)= 000 8 = 750 c) P (X =)+P (X =)= 4 + 3 8 = 5 8,joten E(yksi tai kaksi tyttöä)= 000 5 8 = 50 d) P (X =0)= 6,jotenE(ei yhtään tyttöä)= 000 6 =5. 5. Satunnaismuuttuja X noudattaa binomijakaumaa Bin(n, p). Muodostetaan standardoitu muuttuja Z =(X np)/ npq. Osoita,että a) E(Z) =0ja b) D (Z) =. Koska X Bin(n, p), niin E(X) = np ja D (X) = npq (esim. MAOL). a) Kirjoitetaan Z muotoon X np =(X np), npq npq jossa kerroin / npq on vakio. Nyt odotusarvon ominaisuuksien nojalla (Mellinin kirjan sivu 84) E(Z) =E (X np) npq = npq E(X np) = npq [E(X) np] = npq [np np] = npq 0 =0. b) Käytetään hyväksi a-kohdan huomioita. Varianssin ominaisuuksien nojalla (Mellinin kirjan sivu 94) 3
D (Z) =D (X np) = D (X np) npq npq = npq D (X) = npq npq =. 6. Satunnaismuuttuja X on jakautunut tasaisesti välille [0, ] (tiheysfunktio f(x) = /, jos 0 < x < ; muulloin f(x) = 0). Määrää todennäköisyydet: a) P (0, 5 <X<, 7). b) P ( 0, <X). c) P (X 0, 7). d) P (0, 9 <X<, ). e) P (X =0, 5). (Vihjeitä: Todennäköisyyden pinta-alatulkinta. Määrätyn integraalin eksplisiittinen laskeminen ei ole välttämätontä.) Tasajakauman kertymäfunktio on muotoa F (x) = x a b a, tässä F (x) = x. Toisaalta funktio saa koko välillä [0, ] arvon f(x) =/, jolloin todennäköisyydet voidaan laskea sen suorakulmion pinta-alana, jonka kanta on haluttu väli (esimerkiksi a-kohdassa väli.7 0.5 =.) ja korkeus /. Käytettiinpä kumpaa ajattelua tahansa, saadaan samat laskutoimitukset: a) P (0.5 <X<.7) =.7/ 0.5/ =./ =0.6 (yhtä hyvin siis.7 0.5 = 0.6) b) P ( 0. <X)=/ 0/ =(koko alue kelpaa) c) P (X 0.7) = / 0.7/ =0.65 d) P (0.9 <X<.) = / 0.9/ =0.55 e) P (X =0.5) = 0. 7. Satunnaismuuttuja X noudattaa normaalijakaumaa N(, ). Määrää seuraavat todennäköisyydet: a) P (0, 5 <X<0, 8). b) P ( 0, <X). c) P (X >0, 6). d) P (0, 9 <X<, 6). e) P (X =0, 5). 4
Käytä apuna kirjan lopussa olevaa taulukkoa. Jos X N(, ), niinz =(X )/ N(0, ) (esim. MAOL). a) P (0.5 <X<0.8) = P ((0.5 )/ ) <Z<(0.8 )/ ) = Φ((0.8 )/ ) Φ((0.5 )/ ) = 0.4443 0.363 = 0.08 b) P (X > 0.) = P (X < 0.) = Φ(( 0. )/ ) = 0.997 = 0.8003 c) P (X >0.6) = P (X <0.6) = Φ((0.6 )/ ) = 0.3897 = 0.603 d) P (0.9 <X<.6) = Φ((.6 )/ ) Φ((0.9 )/ ) = 0.668 0.47 = 0.908 e) P (X =0.5) = 0 Kahden viimeisen tehtävän e-kohdissa kysytään jatkuvan jakauman saamaa arvoa yksittäisessä pisteessä, joka on nolla. Toisin kuin diskreetissä jakaumassa, ei jatkuvan jakauman todennäköisyyttä yksittäisessä pisteessä voi määritellä todennäköisyysjakauman arvona ko. pisteessä. Muutoin joutuisimme tilanteeseen, jossa yksittäisten pisteiden arvoja yhteen laskemalla tultaisiin kokonaistodennäköisyyteen, joka on ykköstä suurempi - ja itse asiassa voisimme kasvattaa summaa rajattoman suureksi. Koska jatkuvan jakauman todennäköisyys määritellään integraalina, eli pintaalana R jollakin tietyllä välillä, on integraalin arvo yli yksittäisen pisteen nolla: a f(x) =F (a) F (a) =0. a Vaikka määritelmä näin on loogisesti kunnossa, voidaan silti kysyä: Mitä ovat nämä nollat, jotka yhtenäisinä tuottavat todennäköisyyttä? Asiaa havainnollistaa vanha keppiparadoksi, joka kulkee Benardeten paradoksin nimellä: Oletetaan, että äärettömästi osittuva tikku jaetaan kahteen osaan johonkin tiettyyn aikaan, ja kumpikin puolikas jaetaan puoliksi puoli minuuttia myöhemmin, jokainen neljännes jaetaan puoliksi neljännesminuuttia myöhemmin ja niin edelleen ad infinitum. Mitä tikusta on jäljellä minuutin kuluttua? Jos jäljelle jää äärettömän monta äärettömän pientä palaa, mitä se mahtaa tarkoittaa? Jos äärettömän pienellä palalla on jokin pituus, olkoon se miten vähäinen tahansa, pitäisi äärettömän monen sellaisen saada aikaan äärettömän pitkän tikun. Jos palalla ei ole lainkaan pituutta, miten edes äärettömän monta sellaista saa aikaan minkään pituista tikkua? (Moore, A, W: The Infinite, 990) 5