Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin, I. Mellinin tilastolliset taulukot, Matlab/Octave-funktiolista ja muistiinpanolappu ovat sallittuja apuvälineitä! Kirjoita välivaiheet näkyviin! Käytä joko taulukoita tai kirjoita millä Matlab/Octave-komennoilla voisit laskea tarvittavat kertymäfunktioiden tai niiden käänteisfunktioiden arvot ja minkälaisia päätelmiä, esimerkiksi merkitsevyystasojen suhteen, näiden arvojen perusteella voisit tehdä. Tentti: Tehtävät,, 6, 7 ja 8.. välikoe: Tehtävät,, ja.. välikoe: Tehtävät, 6, 7 ja 8.. (a) Heitetään virheetöntä noppaa kaksi kertaa. Mikä on todennäköisyys, että silmälukujen summa on 9? (b) Heitetään virheetöntä noppaa 900 kertaa. Mikä on todennäköisyys, että saadaan 6 korkeintaan 0 kertaa. Käytä normaaliapproksimaatiota. Ratkaisu: (a) Koska jokaisella heitolla saadaan,,,, tai 6 todennäköisyydellä ja koska 6 9 = + 6 = + = + = 6 + niin todennäköisyys saada 9 on =. 6 6 9 (b) Todennäköisyys saada on 6 on joten jos X on kuutosten luukumäärä 900:ssa heitossa niin 6 X Bin(900, ). Näin ollen E(X) = 900 = 0 ja Var(X) = 900 =. Koska 6 6 6 6 tämä luku on > 0 voimme käyttää normaaliapproksimaatiota ja saamme ( ) X E(X) 0 E(X) Pr(X 0) = Pr Var(X) Var(X) = Pr ( ) X E(X).7889 0.0689. Var(X). Uurnassa on valkoista ja mustaa palloa. Poimitaan uurnasta satunnaisesti pallo. Jos se on valkoinen niin uurnaan laitetaan takaisin valkoista palloa ja musta pallo ja jos se on musta niin uurnaan laitetaan takaisin mustaa palloa ja valkoinen. Tämän jälkeen poimitaan uurnasta taas satunnaisesti uusi pallo ja menetellään samalla tavalla kuin ensimmäisellä kerralla. Määritä tämän jälkeen uurnassa olevien valkoisten pallojen lukumäärän pistetodennäköisyysfunktio. Käytä puuverkkoa. Ratkaisu: Puuverkko näyttää seuraavanlaiselta missä solmuissa olevat numerot m, n tarkoittavat, että uurnassa on m valkoista ja n mustaa palloa ja vasemmanpuolinen kaari valitaan jos

poimitaan valkioinen pallo ja oikeanpuolinen jos poimitaan musta pallo: 8,,, 8 7 7 7, 6, 6,, Uurnassa on poimintojen ja takaisinpanojen jälkeen, 6 tai 7 valkoista palloa ja jos X on valkoisten pallojen lukumäärä niin Pr(X = ) = 7 = 6, Pr(X = 6) = 8 + 7 = 7 80, Pr(X = 7) = 8 = 8.. Pistetodennäköisyysfunktion f XY arvot on annettu seuraavassa taulukossa: f XY (x, y) X 0 Y 0 0 (a) Mistä nähdään, että kyseessä todella on pistetodennäköisyysfunktio. (b) Määritä satunnaismuuttujan X pistetodennäköisyysfunktio (eli määritä sen reunajakauma). (c) Määritä satunnaismuuttujan (X Y = ) pistetodennäköisyysfunktio eli X:n jakauma ehdolla Y =. Ratkaisu: (a) f XY on pistetodennäköisyysfunktio koska f XY (x, y) 0 kaikilla x ja y ja x=0 y= f XY (x, y) =. (b) Satunnaismuuttujan X pistetodennäköisyysfunktio on f X (x) = y= f XY (x, y) jonka arvot ovat x 0 f X (x) 0

(c) Koska satunnaismuuttujan (X Y = ) pistetodennäköisyysfunktio on f X Y (x ) = f XY (x, ) f Y () ja f Y () = Pr(Y = ) = + + + = niin tämän funktion arvot ovat x 0 f X Y (x ) 0 0. Alueen sorasta on 70% hyvää ja 0% huonoa tiettyyn rakennustarkoitukseen. Yhdestä alueen sorakuopasta otettu näyte testattiin testillä, joka todennäköisyydellä 0.8 osoittaa soran hyväksi (ja todennäkösyydellä 0. huonoksi), jos sora on hyvää ja todennäköisyydellä 0.9 huonoksi (ja todennäköisyydellä 0. hyväksi), jos sora on huonoa. Jos testi näytti että sora oli hyvää, mikä on todennäköisyys että kuopan sora todella on hyvää? Ratkaisu: Olkoon A tapahtuma, että kuopan sora on hyvää jolloin siis Pr(A) = 0.7 ja Pr(A c ) = 0.. Olkoon T tapahtuma, että testi osoittaa, että sora on hyvää jolloin Pr(T A) = 0.8 ja Pr(T A c ) = 0.. Bayesin kaavan mukaa saadaan nyt Pr(A T ) = Pr(T A) Pr(A) Pr(T A) Pr(A) + Pr(T A c ) Pr(A c ) = 0.8 0.7 0.8 0.7 + 0. 0. = 0.6 0.9 0.9. Toisella tavalla: Jos alueella olisi 000 sorakuoppaa niin 700 olisivat sellaisia missä sora on hyvää ja 00 sellaisia missä sora on huonoa. Sorakuoppien lukumäärät, joissä testi osoittaisi, että sora on hyvää olisivat 700 0.8 = 60 ja 00 0, = 0 eli yhteensä 90. Näin ollen todennäköisyys, että kuopan sora on hyvää jos testi osoittaa, että näin on asian laita on 60 90 0.9.. (a) Satunnaismuuttujasta X, joka on Poisson(λ)-jakautunut on saatu havainnot, 6,, 7 ja 6. Laske momenttimenetelmällä λ:n estimaatti. (b) Diskreetin satunnaismuuttujan Y jakauma riippuu parametristä θ [0, ] siten, että θ, j = 0, Pr(Y = j) = θ, j {, }, 0, muuten. Satunnaismuuttujasta Y on saatu seuraavat havaintoarvot: 0,,, 0,, 0,,, ja 0. Määritä θ:n estimaatti suurimman uskottavuuden menetelmällä. Ratkaisu: (a) Koska E(X) = λ niin momenttimenetelmän mukaisesti λ:n estimaatiksi otetaan havaintoarvojen kesiarvo, eli tässä tapauksessa ˆλ = ( + 6 + + 7 + 6) = 8 =.6.

(b) Koska satunnaismuuttuja on diskreetti niin uskottavuusfunktio on L(θ) on todennäköisyys, että saadaan havaitut arvot eli L(θ) = Pr(Y = 0) Pr(Y = ) Pr(Y = ) Pr(Y = 0) Pr(Y = ) Pr(Y = 0) Pr(Y = ) Pr(Y = 0) Pr(Y = 0) = ( θ) θ 6. Maksimiarvokohdan löytämiseksi määritämme derivaatan nollakohdan: L (θ) = ( θ) ( ) θ 6 + ( θ) 6 θ = ( θ) θ 6 josta saamme (tapausten θ = 0 tai θ = ) lisäksi josta saamme ratkaisuksi θ = 0. 8 θ + 6 θ = 0, ( 8 θ + 6 ) = 0, θ 6. Sairaalan poliklinikalle tulee kokemuksen perusteella keskimäärin 9 potilasta tunnissa. Eräänä päivänä, kun keli on ollut erityisen liukas tulee tunnin aikana 0 potilasta. Oletetaan, että potilaiden lukumäärä aikayksikössä noudattaa Poisson-jakaumaa. Testaa merkitsevyystasolla 0.0 nollahypoteesia, jonka mukaan potilaiden lukumäärän odotusarvo kyseisenä päivänä ei ole ainakaan tavanomaista suurempi. Käytä normaaliapproksimaatiota. Ratkaisu: Olkoon X kyseisenä päivänä tunnin aikana tulevien potilaiden lukumäärä. Koska normaalipäivänä tulee tunnissa keskimäärin 9 potilasta niin nollahypoteesi tarkoittaa, että E(X) 9 = 08. Koska Poisson(λ) jakautuneen satunnaissuureen odotusarvo on λ niin voimme nollahypoteesin mukaisesti olettaa, että X Poisson(λ) missä λ 08. Koska Poisson jakauma lähestyy normaalijakumaa kun parametri kasvaa äärettömyyteen ja koska Poisson(λ) jakautuneen satunnaissuureen varianssi on λ niin voimme käyttää testimuuttujana X 08 08 a N(0, ). Tässä tapauksessa testisuureen arvo on 08 =.7 ja koska vaihtoehto on yksisuuntainen niin p-arvoksi tulee p = F N(0,) (.7) = 0.07, ja koska p < 0.0 niin nollahypoteesi hylätään. 7. Havainnot X i, i =,..., ja Y i, i =,..., ovat satunnaisotoksia jakaumista N(µ X, σ ) ja N(µ Y, σ ). Havaintoarvoista on laskettu x =.8, i= x i x = 6, i= (x i x) = 6, y =.0, i= y i y = ja i= (y i y) = 8. Testaa merkitsevyystasolla 0.0 hypoteeseja (a) H 0 : µ X =., (jolloin sinun ei pidä ottaa huomioon y i -havaintoarvoja), (b) H 0 : µ X = µ Y. Ratkaisu: (a) Ensin lasketaan X-satunnaismuuttujan ostosvarianssi ja se on s x = i= (x x) =..

Koska nollahypoteesi on µ X =. niin testisuure on w = x..8. = s x. =.. Koska nollahypoteesin vaihtoehto on kaksisuuntainen niin p-arvoksi tulee p = F t() (.) = 0.06 = 0.07. Koska p < 0.0 niin nollahypoteesi hylätään. (b) Ensin lasketaan Y -satunnaismuuttujan otosvarianssi ja saadaan s y = 0 i= (y y) =.7. Seuraavaksi lasketaan varianssin yhdistetty estimaatti ja saadaan s p = ( )s x + ( )s y =.. + Testisuure on x y 0.8 = s p n x + n y. ( + ) =.776. Tässäkin tapauksessa vaihtoehto on kaksisuuntainen ja p-arvoksi tulee Koska p > 0.0 niin nollahypoteesia ei hylätä. p = ( F t(0) (.776)) = 0.08. 8. Lukiokoulutusta antavien oppilaitosten lukumäärät olivat vuosina 0 seuraavat: Vuosi 0 0 0 0 06 07 08 09 0 Lkm. 8 8 79 7 6 9 9 9 8 Oletetaan, että (ainakin approksimatiivisesti) Y j = β 0 + β x j + ε j, missä Y j on lukiokoulutusta antavien oppilaitosten lukumäärä vuonna x j ja satunnaismuuttujat ε j ovat N(0, σ )-jakautuneita ja riippumattomia. Määritä parametrin β pienimmän neliösumman estimaatti ja testaa merkitsevyystasolla 0.0 nollahypoteesia, että lukiokoulutusta antavien oppilaitosten lukumäärän odotusarvo vuonna 6 on korkeintaan 90. Alla olevassa taulukossa on annettu joitakin tunnuslukuja: Ratkaisu: Parametrin β estimaatiksi tulee y s x s y s xy.7 8.97-78.66 b = s xy s x = 6.09. Jos merkitään z j = x j 6 niin z = 8., s z = s x ja s zy = s xy ja Y j = β 0 + β z j + ε j missä β 0 on lukiokoulutusta antavien oppilaitosten lukumäärän odotusarvo vuonna 6. Parametrin β 0 pienimmän neliösumman estimaatiksi tulee b0 = y b z = 0.7.

Koska r zy = r xy = szy s z s y = 0.989 niin jäännösvarianssin estimaatiksi tulee s = /0 ( r s zy) =.. y Testimuuttujan arvo on tässä tapauksessa b0 90 0.7 90 w 0 = = =.8. s ( + z ) s.( + ( 8.) ) z Koska nollahypoteesi on β 0 90 jolloin siis vaihtoehto on yksisuuntainen niin p-arvoksi tulee Koska p < 0.0 niin nollahypoteesi hylätään. p = ( F t(0) (.8)) = 0.000.