Tilastollinen päättely II, kevät 2017 Harjoitus 1A

Samankaltaiset tiedostot
Tilastollinen päättely II, kevät 2017 Harjoitus 2A

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

1. Tilastollinen malli??

30A02000 Tilastotieteen perusteet

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

Normaalijakaumasta johdettuja jakaumia

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Mat Sovellettu todennäköisyyslasku A

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

3.6 Su-estimaattorien asymptotiikka

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

2. Uskottavuus ja informaatio

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Sovellettu todennäköisyyslaskenta B

Satunnaismuuttujien muunnokset ja niiden jakaumat

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

4. laskuharjoituskierros, vko 7, ratkaisut

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

Tilastollinen aineisto Luottamusväli

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

Todennäköisyysjakaumia

Todennäköisyyden ominaisuuksia

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

5 Tärkeitä yksiulotteisia jakaumia

2. Uskottavuus ja informaatio

Sovellettu todennäköisyyslaskenta B

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

D ( ) E( ) E( ) 2.917

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

D ( ) Var( ) ( ) E( ) [E( )]

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Moniulotteisia todennäköisyysjakaumia

Estimointi. Vilkkumaa / Kuusinen 1

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Sovellettu todennäköisyyslaskenta B

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Sovellettu todennäköisyyslaskenta B

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

5. laskuharjoituskierros, vko 8, ratkaisut

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

Johdatus tn-laskentaan torstai

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testit laatueroasteikollisille muuttujille

k S P[ X µ kσ] 1 k 2.

tilastotieteen kertaus

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Osa 2: Otokset, otosjakaumat ja estimointi

Todennäköisyyslaskun kertaus. Heliövaara 1

Yleistä tietoa kokeesta

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Kertausluento. Tilastollinen päättely II - 1. kurssikoe

Väliestimointi (jatkoa) Heliövaara 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Kertausluento. Tilastollinen päättely II - 2. kurssikoe

Sovellettu todennäköisyyslaskenta B

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

Harjoitus 2: Matlab - Statistical Toolbox

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät Ratkaisuehdotuksia

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) viikko 3

6. laskuharjoitusten vastaukset (viikot 10 11)

3.1 Kaksiulotteinen satunnaisvektori ja sen jakauma

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

8.1 Ehdolliset jakaumat

4. Todennäköisyyslaskennan kertausta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Ilkka Mellin (2008) 1/5

Transkriptio:

Tilastollinen päättely II, kevät 207 Harjoitus A Heikki Korpela 23. tammikuuta 207 Tehtävä. Kertausta todennäköisyyslaskennasta. Ilmoita satunnaismuuttujan Y jakauman nimi ja pistetodennäköisyys- tai tiheysfunktio seuraavissa tapauksissa. Ilmoita myös satunnaismuuttujan Y odotusarvo sekä varianssi. Huom. Jakaumat on tällä kurssilla nimetty hieman eri tavoin kuin TN 2 -kurssilla, joten seuraavassa on merkitty ne molemmilla tavoin.) a) Y X + + X n, kun X,..., X n, ja X i Bθ) Bernoulliθ) otos Bernoullijakaumasta) b) Y U + V, kun U N, σ 2 ), V N 2, σ 2 2) ja U V. c) Y U 2, kun U N0, ). d) Y ax + b, kun X Tas0, ) U0, ) ja a > 0, b R. e) Y X + + X n, kun X,..., X n Expλ). f) Y X + X 2, kun X Poi ) Poisson ), X2 Poi 2 ) ja X X 2. Vastaus:. a) Bernoulli-jakauman momenttiemäfunktio on M Xi t) q + θe t, missä q θ. Riippumattomuuden ja momenttiemäfunktion ominaisuuksien nojalla sm:n Y mef on q + θe t ) n, joka on binomijakauman mef. Koska mef määrää jakauman, Y Binn, θ). Binomijakauman odotusarvo on nθ ja varianssi nθ θ). b) Normaalijakauman mef on M U t) exp t + 2 σ2 t 2 ), josta riippumattomuuden nojalla M Y exp + 2 )t + 2 σ2 σ 2 2)t 2 ), joten Y N + 2, σ 2 + σ 2 2). Odotusarvo on + 2 ja varianssi σ 2 + σ 2 2. c) Kyseessä on jakauma Gamma 2, 2 ) johto TN 2 -kurssin materiaalissa osiossa 5.3.7), joka voidaan tunnistaa myös khiin neliön jakaumaksi yhdellä vapausasteella χ 2. Odotusarvo on ja varianssi 2 / 2 2) 2. d) Skaalausta ja siirtoa koskevien laskusääntöjen mukaan f Y y) ) y b a f X a { a 0 < y b } < {b < y < a + b} a a + b) b Vastaavasti momenttiemäfunktiosta M X t) et e t0 t 0) e bt M X at) e bt eat at et t t 0) saadaan M Y t) eb+a)t e bt b+a b)t t 0), jonka perusteella Y Tasb, b + a). Odotusarvo on b+a+b 2 a b+a b)2 2 + b ja varianssi 2 a2 2. e) Eksponenttijakauman mef:stä M Xi t) λ λ t ) ja riippumattomuudesta saadaan, että M Y t) λ λ t )n, joka on Gamman, λ)-jakauman mef. Odotusarvo on n/λ ja varianssi n/λ 2. f) Poisson-jakauman mef:stä M Xi t) exp i e t )) ja riippumattomuudesta saadaan, että M Y t) exp + 2 )e t )), joka on Poi + 2 )-jakauman mef. Odotusarvo ja varianssi ovat + 2.

Tehtävä 2. Tilanne on sama kuin monisteen Esimerkissä.2.2. Nyt ei kuitenkaan ole mahdollista mitata kunkin laitteen elinikää erikseen, vaan käytetään halvempaa koejärjestelyä, jossa n laitetta pannaan yhtä aikaa käyntiin ja kuukauden 30 päivää) kuluttua tullaan tarkastamaan, mitkä niistä ovat ehjiä ja mitkä rikki. Muodosta tätä asetelmaa kuvaava tilastollinen malli parametrille /λ EY i. Vihje. Ajattele koeasetelmaa n-kertaisena toistokokeena, jossa onnistuminen merkitsee, että laite on ehjä, ja epäonnistuminen, että se on rikki. Mikä on onnistumistodennäköisyys :n avulla lausuttuna?) 2. Vastaus: Oletetaan, että kunkin laitteen kestoikä päivissä edelleen noudattaa Expλ) Exp/) -jakaumaa. Todennäköisyys sille, että yksittäinen laite on ehjä vielä 30 päivän päästä, saadaan eksponenttifunktion tiheyttä integroimalla tai kertymäfunktiosta): PY i 30) PY i 30) F Yi 30) exp λ30)) exp 30λ) exp 30 ) Merkitään Z:lla ehjänä säilyneiden laitteiden lukumäärää arvojoukko 0,..., n). Jos oletetaan lisäksi edelleen, että laitteiden rikkoutumistodennäköisyydet ovat samoja ja toisistaan riippumattomia, saadaan yhteisjakaumaltaan periaatteessa hierarkkinen) malli, jossa todennäköisyyden sille, että k laitetta on ehjiä kuukauden kuluttua, määrittelee binomijakauma: Z Bin n, exp 30 )) ) n f Z k) exp 30 )) k exp 30 )) n k k Tehtävä 3. a) a) Satunnaismuuttuja Y on diskreetti, arvojoukkonaan {, 2, 3, 4, 5}. Sille on kaksi vaihtoehtoista pistetodennäköisyysfunktiota, jotka on taulukoitu alla. y 2 3 4 5 f Y y; ) 0,2 0,5 0,2 0, 0 f Y y; 2) 0 0, 0,2 0,6 0, Emme tiedä, kumpaa näistä sattuma käyttää arpoessaan Y :n arvon. Tulkitse tämä parametrisena tilastollisena mallina, jonka parametria merkitään θ:lla. Mikä on parametriavaruus? Jos havaitaan Y 4, mitä voit päätellä θ:sta? Kuinka varmasti? b) Kyseisestä jakaumasta tehdään myös toinen havainto Y 2, jonka arvoksi saadaan Y 2. Mitä nyt voit päätellä θ:sta? 3. Vastaus: a) Tilastollinen malli voidaan esittää toteamalla, että taulukko määrittelee tiheyden täydellisesti 2

lähtö- ja maalijoukon karteesisena tulona), tai esimerkiksi seuraavasti 0,2, y, θ, 0, y, θ 2, 0,5, y 2, θ, 0,, y 2, θ 2, 0,2, y 3, θ, f Y y; θ) 0,2, y 3, θ 2, 0,, y 4, θ, 0,6, y 4, θ 2, 0, y 5, θ, 0,, y 5, θ 2, Parametriavaruus on siis joukko {, 2}. Jos havaitaan Y 4, parametrin arvo 2 on uskottavampi kuin parametrin arvo. Parametrin arvoon liittyy kuitenkin huomattavan suurta epävarmuutta, koska otoskoko on niin pieni, ja epävarmuuden kvantifiointikin on samasta syystä vaikeaa. b) Mallin mukaan tapahtuma Y i on mahdoton tapahtuma, jos parametrin arvo on 2. Tällöin voitaisiin siis sanoa, että parametrin arvo on varmasti, jos malli on määritelty oikein ja tapahtuman havainnointi tehty oikein. Tehtävä 4. Luennolla ja monisteessa Esimerkissä.2.. käytettiin ajatusta pienestä otoksesta suuresta perusjoukosta, jonka avulla voitiin tehdä mukava jakaumaoletus satunnaismuuttujista Y,..., Y n, ja päädyttiin mukavan selkeään tilastolliseen malliin. Entä jos tehdas onkin valmistanut vain 20 lamppua? Testaaja poimii viisi lamppua ilman takaisinpanoa) ja saa vastaavan aineiston y,..., y 5 ). Millainen yptnf f Y y; θ) olisi ilman ajatusta riippumattomuudesta? Vihje: jos testaaja poimisi yhden lampun, muuttuisiko Y :n jakauma esimerkkiin verrattuna? Jos tiedetään että Y y, millaista ehdollista jakaumaa Y 2 noudattaisi? Jos tiedetään Y y, Y 2 y 2, niin millaista ehdollista jakaumaa Y 3 noudattaisi? Päättele yptnf jatkamalla samoin ja soveltamalla kertolaskusääntöä tästä lisää TN 2:n luvuissa 8.2 ja 9.3.)) Vastaus: Sovitaan, että θ kuvaa edelleen rikkinäisten lamppujen osuutta, eli rikkinäisiä lamppuja on otoksessa Nθ kappaletta, missä N 20 ja K Nθ 0,,..., 20). Nostoja tehdään n 5 4. 3

kappaletta. Tällöin f Y y ) {y }Nθ/N) + {y 0} θ) θ y θ) y f Y2 Y y 2 y ) PY y, Y 2 y 2 ) PY y ) θnθ )/N θ Nθ )/N ), y, y 2, θn ) Nθ ))/N ) θ N ) Nθ + )/N ), y, y 2 0, Nθ 0)/N ), y 0, y 2, N ) Nθ 0)/N ), y 0, y 2 0 2) {y 2 }Nθ y )/N ) + {y 2 0} Nθ y )/N )), eli Y 2 Y BNθ Y )/N )), f Y3 Y,Y 2 y 3 y, y 2 ) PY y, Y 2 y 2, Y 3 y 3 ) PY y, Y 2 y ) {y 3 }Nθ y y 2 )/N 2) + {y 3 0} Nθ y y 2 )/N 2)), Y 3 Y, Y 2 ) BNθ Y Y 2 )/N 2)),. Y n Y n BNθ Y... Y n )/N n + )) 3) ) missä kohdassa ) viitataan ehdollisen todennäköisyyden määritelmään. Kohdassa 2) perusteluna on klassinen todennäköisyystulkinta jäljellä olevien suotuisten tapausten määrä jaettuna kaikkien tapausten määrällä). Kohdassa 3) merkintä Y n viittaa vektoriin Y,..., Y n ). Kertolaskukaavaa soveltamalla saadaan f Y y) f Y y )f Y2 Y y 2 y ) f Yn Y n y n y n ) θ) y θ) y ) y2 Nθ y Nθ y ) y2 N N ) yn Nθ y... y n Nθ y ) yn... y n N n + N n + ) y ) y Nθ N Nθ N N ) y2 ) y2 Nθ y N Nθ + y N N ) yn Nθ y... y n N n + Nθ + y +... + y n N n + N n + y i n i i Nθ N i ) Nθ + N N n + ) i n i Nθ i j j y i i N i ) Nθ + j ) yn j y i y i 4

Vaihtoehtoinen, ehkä havainnollisempi muotoilu olisi 5 {y i } 20 i + i:s lamppu rikki? i:llä nostolla lamppuja i {y i 0} i:s lamppu ehjä? i 20θ j i:llä nostolla rikkin. lamppuja + i 20 i ) 20θ + j } {{ } i:llä nostolla ehjiä lamppuja )) Tarkastellaan vielä vektorien sijaan pelkkää onnistumisten lukumäärää k. Tarkastellaan ensin yksinkertaista tapausta, jossa onnistumiset sattuvat olemaan ensimmäisinä ja epäonnistumiset viimeisinä. Tarkastellaan tapahtuman W todennäköisyyttä aiemman yhteispistetodennäköisyysfunktion avulla siirrymme merkitsemään N θ K) PW ) n i K i j y i i N i ) K + j y i Oletusten mukaan ensimmäiset k alkiota ovat ykkösiä ja loput k + :stä n:ään nollia, eli tulo voidaan jakaa PW ) n lk+ 0 k i i K N i ) K + j j i 0 l K N l ) K + j k i K j i k n K i + ) i i lk+ n lk+ k + j l jk+ 0 N l ) K + N l + K + k) 0 k j k K +) K k + ) N k + K +k) N n + K + k) K) K k + ) N K) N K n + k + ) K) K k) N K) N K n + k) K)! K k)! N K)! N K n + k)! Tämän jälkeen olennaisesti tapahtumien symmetriatulkinnan esimerkiksi jono,,, 0, 0) on yhtä todennäköinen kuin esimerkiksi 0, 0,,, )) nojalla voidaan todeta, että samaan onnistumisten lukumäärään voidaan päätyä kaikilla jonoilla, joissa on samat alkiot, mutta eri järjestyksessä. k onnistumista ja n k epäonnistumista voidaan järjestää jonoksi n k) eri tavalla. Toisin sanoen todennäköisyys pitää vielä kertoa tekijällä ) n k n! 5 n k)!k!.

f K k) n! n k)!k! K)! K k)! n! K! K k)!k! ) K! n! K k)!k! )) ) ) N K N K n k n k K ) N K ) k n k N n), N K)! N K n + k)! N K)! N K n + k)!n k)! N K)! N K n + k)!n k)! eli hypergeometrisen jakauman ptnf kuten pitikin). 6