Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Samankaltaiset tiedostot
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Väliestimointi (jatkoa) Heliövaara 1

Todennäköisyyden ominaisuuksia

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

Sovellettu todennäköisyyslaskenta B

D ( ) E( ) E( ) 2.917

Mat Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Sovellettu todennäköisyyslaskenta B

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Ilkka Mellin (2008) 1/5

Sovellettu todennäköisyyslaskenta B

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

3. laskuharjoituskierros, vko 6, ratkaisut

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

4. laskuharjoituskierros, vko 7, ratkaisut

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslasku A

11. laskuharjoituskierros, vko 15, ratkaisut

Testejä suhdeasteikollisille muuttujille

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mat Tilastollisen analyysin perusteet, kevät 2007

D ( ) Var( ) ( ) E( ) [E( )]

Harjoitus 2: Matlab - Statistical Toolbox

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

,ܾ jaü on annettu niin voidaan hakea funktion

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

Kaksisuuntainen varianssianalyysi. Heliövaara 1

tilastotieteen kertaus

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Sovellettu todennäköisyyslaskenta B

5. laskuharjoituskierros, vko 8, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Harjoitus 7: NCSS - Tilastollinen analyysi

Estimointi. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskun kertaus. Heliövaara 1

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastollisia peruskäsitteitä ja Monte Carlo

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

1. laskuharjoituskierros, vko 4, ratkaisut

Moniulotteiset satunnaismuuttujat ja jakaumat

(x, y) 2. heiton tulos y

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

5.7 Uskottavuusfunktioon perustuvia testejä II

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

dx=5&uilang=fi&lang=fi&lvv=2014

Transkriptio:

MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin, I. Mellinin tilastolliset taulukot, Matlab/Octave-funktiolista ja muistiinpanolappu ovat sallittuja apuvälineitä! Kirjoita välivaiheet näkyviin! Käytä joko taulukoita tai kirjoita millä Matlab/Octave-komennoilla voisit laskea tarvittavat kertymäfunktioiden tai niiden käänteisfunktioiden arvot ja minkälaisia päätelmiä, esimerkiksi merkitsevyystasojen suhteen, näiden arvojen perusteella voisit tehdä. Tentti: Tehtävät,, 6, 7 ja 8.. välikoe: Tehtävät,, ja.. välikoe: Tehtävät, 6, 7 ja 8.. (a) Heitetään virheetöntä noppaa kaksi kertaa. Mikä on todennäköisyys, että silmälukujen summa on 9? (b) Heitetään virheetöntä noppaa 900 kertaa. Mikä on todennäköisyys, että saadaan 6 korkeintaan 0 kertaa. Käytä normaaliapproksimaatiota. Ratkaisu: (a) Koska jokaisella heitolla saadaan,,,, tai 6 todennäköisyydellä ja koska 6 9 = + 6 = + = + = 6 + niin todennäköisyys saada 9 on =. 6 6 9 (b) Todennäköisyys saada on 6 on joten jos X on kuutosten luukumäärä 900:ssa heitossa niin 6 X Bin(900, ). Näin ollen E(X) = 900 = 0 ja Var(X) = 900 =. Koska 6 6 6 6 tämä luku on > 0 voimme käyttää normaaliapproksimaatiota ja saamme ( ) X E(X) 0 E(X) Pr(X 0) = Pr Var(X) Var(X) = Pr ( ) X E(X).7889 0.0689. Var(X). Uurnassa on valkoista ja mustaa palloa. Poimitaan uurnasta satunnaisesti pallo. Jos se on valkoinen niin uurnaan laitetaan takaisin valkoista palloa ja musta pallo ja jos se on musta niin uurnaan laitetaan takaisin mustaa palloa ja valkoinen. Tämän jälkeen poimitaan uurnasta taas satunnaisesti uusi pallo ja menetellään samalla tavalla kuin ensimmäisellä kerralla. Määritä tämän jälkeen uurnassa olevien valkoisten pallojen lukumäärän pistetodennäköisyysfunktio. Käytä puuverkkoa. Ratkaisu: Puuverkko näyttää seuraavanlaiselta missä solmuissa olevat numerot m, n tarkoittavat, että uurnassa on m valkoista ja n mustaa palloa ja vasemmanpuolinen kaari valitaan jos

poimitaan valkioinen pallo ja oikeanpuolinen jos poimitaan musta pallo: 8,,, 8 7 7 7, 6, 6,, Uurnassa on poimintojen ja takaisinpanojen jälkeen, 6 tai 7 valkoista palloa ja jos X on valkoisten pallojen lukumäärä niin Pr(X = ) = 7 = 6, Pr(X = 6) = 8 + 7 = 7 80, Pr(X = 7) = 8 = 8.. Pistetodennäköisyysfunktion f XY arvot on annettu seuraavassa taulukossa: f XY (x, y) X 0 Y 0 0 (a) Mistä nähdään, että kyseessä todella on pistetodennäköisyysfunktio. (b) Määritä satunnaismuuttujan X pistetodennäköisyysfunktio (eli määritä sen reunajakauma). (c) Määritä satunnaismuuttujan (X Y = ) pistetodennäköisyysfunktio eli X:n jakauma ehdolla Y =. Ratkaisu: (a) f XY on pistetodennäköisyysfunktio koska f XY (x, y) 0 kaikilla x ja y ja x=0 y= f XY (x, y) =. (b) Satunnaismuuttujan X pistetodennäköisyysfunktio on f X (x) = y= f XY (x, y) jonka arvot ovat x 0 f X (x) 0

(c) Koska satunnaismuuttujan (X Y = ) pistetodennäköisyysfunktio on f X Y (x ) = f XY (x, ) f Y () ja f Y () = Pr(Y = ) = + + + = niin tämän funktion arvot ovat x 0 f X Y (x ) 0 0. Alueen sorasta on 70% hyvää ja 0% huonoa tiettyyn rakennustarkoitukseen. Yhdestä alueen sorakuopasta otettu näyte testattiin testillä, joka todennäköisyydellä 0.8 osoittaa soran hyväksi (ja todennäkösyydellä 0. huonoksi), jos sora on hyvää ja todennäköisyydellä 0.9 huonoksi (ja todennäköisyydellä 0. hyväksi), jos sora on huonoa. Jos testi näytti että sora oli hyvää, mikä on todennäköisyys että kuopan sora todella on hyvää? Ratkaisu: Olkoon A tapahtuma, että kuopan sora on hyvää jolloin siis Pr(A) = 0.7 ja Pr(A c ) = 0.. Olkoon T tapahtuma, että testi osoittaa, että sora on hyvää jolloin Pr(T A) = 0.8 ja Pr(T A c ) = 0.. Bayesin kaavan mukaa saadaan nyt Pr(A T ) = Pr(T A) Pr(A) Pr(T A) Pr(A) + Pr(T A c ) Pr(A c ) = 0.8 0.7 0.8 0.7 + 0. 0. = 0.6 0.9 0.9. Toisella tavalla: Jos alueella olisi 000 sorakuoppaa niin 700 olisivat sellaisia missä sora on hyvää ja 00 sellaisia missä sora on huonoa. Sorakuoppien lukumäärät, joissä testi osoittaisi, että sora on hyvää olisivat 700 0.8 = 60 ja 00 0, = 0 eli yhteensä 90. Näin ollen todennäköisyys, että kuopan sora on hyvää jos testi osoittaa, että näin on asian laita on 60 90 0.9.. (a) Satunnaismuuttujasta X, joka on Poisson(λ)-jakautunut on saatu havainnot, 6,, 7 ja 6. Laske momenttimenetelmällä λ:n estimaatti. (b) Diskreetin satunnaismuuttujan Y jakauma riippuu parametristä θ [0, ] siten, että θ, j = 0, Pr(Y = j) = θ, j {, }, 0, muuten. Satunnaismuuttujasta Y on saatu seuraavat havaintoarvot: 0,,, 0,, 0,,, ja 0. Määritä θ:n estimaatti suurimman uskottavuuden menetelmällä. Ratkaisu: (a) Koska E(X) = λ niin momenttimenetelmän mukaisesti λ:n estimaatiksi otetaan havaintoarvojen kesiarvo, eli tässä tapauksessa ˆλ = ( + 6 + + 7 + 6) = 8 =.6.

(b) Koska satunnaismuuttuja on diskreetti niin uskottavuusfunktio on L(θ) on todennäköisyys, että saadaan havaitut arvot eli L(θ) = Pr(Y = 0) Pr(Y = ) Pr(Y = ) Pr(Y = 0) Pr(Y = ) Pr(Y = 0) Pr(Y = ) Pr(Y = 0) Pr(Y = 0) = ( θ) θ 6. Maksimiarvokohdan löytämiseksi määritämme derivaatan nollakohdan: L (θ) = ( θ) ( ) θ 6 + ( θ) 6 θ = ( θ) θ 6 josta saamme (tapausten θ = 0 tai θ = ) lisäksi josta saamme ratkaisuksi θ = 0. 8 θ + 6 θ = 0, ( 8 θ + 6 ) = 0, θ 6. Sairaalan poliklinikalle tulee kokemuksen perusteella keskimäärin 9 potilasta tunnissa. Eräänä päivänä, kun keli on ollut erityisen liukas tulee tunnin aikana 0 potilasta. Oletetaan, että potilaiden lukumäärä aikayksikössä noudattaa Poisson-jakaumaa. Testaa merkitsevyystasolla 0.0 nollahypoteesia, jonka mukaan potilaiden lukumäärän odotusarvo kyseisenä päivänä ei ole ainakaan tavanomaista suurempi. Käytä normaaliapproksimaatiota. Ratkaisu: Olkoon X kyseisenä päivänä tunnin aikana tulevien potilaiden lukumäärä. Koska normaalipäivänä tulee tunnissa keskimäärin 9 potilasta niin nollahypoteesi tarkoittaa, että E(X) 9 = 08. Koska Poisson(λ) jakautuneen satunnaissuureen odotusarvo on λ niin voimme nollahypoteesin mukaisesti olettaa, että X Poisson(λ) missä λ 08. Koska Poisson jakauma lähestyy normaalijakumaa kun parametri kasvaa äärettömyyteen ja koska Poisson(λ) jakautuneen satunnaissuureen varianssi on λ niin voimme käyttää testimuuttujana X 08 08 a N(0, ). Tässä tapauksessa testisuureen arvo on 08 =.7 ja koska vaihtoehto on yksisuuntainen niin p-arvoksi tulee p = F N(0,) (.7) = 0.07, ja koska p < 0.0 niin nollahypoteesi hylätään. 7. Havainnot X i, i =,..., ja Y i, i =,..., ovat satunnaisotoksia jakaumista N(µ X, σ ) ja N(µ Y, σ ). Havaintoarvoista on laskettu x =.8, i= x i x = 6, i= (x i x) = 6, y =.0, i= y i y = ja i= (y i y) = 8. Testaa merkitsevyystasolla 0.0 hypoteeseja (a) H 0 : µ X =., (jolloin sinun ei pidä ottaa huomioon y i -havaintoarvoja), (b) H 0 : µ X = µ Y. Ratkaisu: (a) Ensin lasketaan X-satunnaismuuttujan ostosvarianssi ja se on s x = i= (x x) =..

Koska nollahypoteesi on µ X =. niin testisuure on w = x..8. = s x. =.. Koska nollahypoteesin vaihtoehto on kaksisuuntainen niin p-arvoksi tulee p = F t() (.) = 0.06 = 0.07. Koska p < 0.0 niin nollahypoteesi hylätään. (b) Ensin lasketaan Y -satunnaismuuttujan otosvarianssi ja saadaan s y = 0 i= (y y) =.7. Seuraavaksi lasketaan varianssin yhdistetty estimaatti ja saadaan s p = ( )s x + ( )s y =.. + Testisuure on x y 0.8 = s p n x + n y. ( + ) =.776. Tässäkin tapauksessa vaihtoehto on kaksisuuntainen ja p-arvoksi tulee Koska p > 0.0 niin nollahypoteesia ei hylätä. p = ( F t(0) (.776)) = 0.08. 8. Lukiokoulutusta antavien oppilaitosten lukumäärät olivat vuosina 0 seuraavat: Vuosi 0 0 0 0 06 07 08 09 0 Lkm. 8 8 79 7 6 9 9 9 8 Oletetaan, että (ainakin approksimatiivisesti) Y j = β 0 + β x j + ε j, missä Y j on lukiokoulutusta antavien oppilaitosten lukumäärä vuonna x j ja satunnaismuuttujat ε j ovat N(0, σ )-jakautuneita ja riippumattomia. Määritä parametrin β pienimmän neliösumman estimaatti ja testaa merkitsevyystasolla 0.0 nollahypoteesia, että lukiokoulutusta antavien oppilaitosten lukumäärän odotusarvo vuonna 6 on korkeintaan 90. Alla olevassa taulukossa on annettu joitakin tunnuslukuja: Ratkaisu: Parametrin β estimaatiksi tulee y s x s y s xy.7 8.97-78.66 b = s xy s x = 6.09. Jos merkitään z j = x j 6 niin z = 8., s z = s x ja s zy = s xy ja Y j = β 0 + β z j + ε j missä β 0 on lukiokoulutusta antavien oppilaitosten lukumäärän odotusarvo vuonna 6. Parametrin β 0 pienimmän neliösumman estimaatiksi tulee b0 = y b z = 0.7.

Koska r zy = r xy = szy s z s y = 0.989 niin jäännösvarianssin estimaatiksi tulee s = /0 ( r s zy) =.. y Testimuuttujan arvo on tässä tapauksessa b0 90 0.7 90 w 0 = = =.8. s ( + z ) s.( + ( 8.) ) z Koska nollahypoteesi on β 0 90 jolloin siis vaihtoehto on yksisuuntainen niin p-arvoksi tulee Koska p < 0.0 niin nollahypoteesi hylätään. p = ( F t(0) (.8)) = 0.000.