HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 8B Ratkaisuehdotuksia.

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 8B Ratkaisuehdotuksia Tehtäväsarja I 1. Jatkoa Harjoitus 8A tehtävään 3. Muodosta odotusarvolle µ approksimatiivinen 99 %:n luottasväli uskottavuusosamäärän testisuureeseen perustuen. Ratkaisu: Aiemmissa harjoituksissa ja monisteen nojalla log-uskottavuusfunktio on l(µ; y) = l(µ) = nµ + ny log µ ja µ = y joten normalisoitu log-uskottavuusfunktio on l 0 (µ) = l(µ) l( µ) = l(µ) l(y) = n(µ y) + ny log(µ/y) Siispä approksimatiivinen 99%:n luottasväli on A(y) = { µ ; n(µ y) + ny log(µ/y) > 1 2 χ2 1(0.01) 3.32 } Preussin armeijan aineistossa y = 0.7 ja n = 280, joten A(y) = { µ ; 280 ( (µ 0.7) + 0.7 log(µ/0.7) ) > 3.32 } Jos g(µ) = 280 ( (µ 0.7)+0.7 log(µ/0.7) ), niin aiemmista harjoituksista tiedetään, että g on aidosti kasvava kun µ < 0.7 ja aidosti vähenevä, kun µ > 0.7, sillä tätä sovellettiin suurimman uskottavuuden estimaattia haettaessa. Tästä seuraa, että A(y) = (c, d), missä c < 0.7 ja d > 0.7 ja g(c) = g(d) = 3.32. Laskemalla nähdään, että g(0.578) 3.375 < 3.32 ja g(0.579) 3.316 > 3.32 joten 0.578 < c < 0.579 eli c 0.58. Vastaavasti g(0.837) 3.326 < 3.32 ja g(0.836) 3.281 > 3.32, joten 0.836 < d < 0.837 eli d 0.84. Jos luvut olisi laskenut hieman useammilla desimaaleilla 1 2 χ2 1(0.01) 3.317448, ja 0.578983 < c < 0.578984 ja 0.836808 < d < 0.836809 eli A(y) (0.57898, 0.83681). Edellissessä harjoituksessa Waldin testisuureeseen perustuva vastaava 99 %:n luottasväli oli A Wald (y) (0.5715, 0.8285). normalisoitu log uskottavuus 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 0.60 0.65 0.70 0.75 0.80 0.85

2. Jatkoa Harjoitus 8A tehtävään 4. Muodosta odotusarvolle λ approksimatiivinen 95 %:n luottasväli uskottavuusosamäärän testisuureeseen perustuen. Oletetaan, että aineistosta tiedetään tunnusluku t(y) = (1/n) y 2 i = 0.5 ja n = 20. Määrää numeerisesti Waldin testiin perustuva luottasväli sekä uskottavuusosamäärän perustuva testisuure. Ratkaisu: Harjoitus 8A tehtävässä 4 selvitettiin, että λ = 1/t(y) ja että Waldin testisuureeseen perustuva 95 %:n luottasväli on A Wald (y) = ( 1/t(y) 1.96/ nt(y), 1/t(y) + 1.96/ nt(y) ) Lisäksi tehtävässä määrättiin, että log-uskottavuusfunktio on l(λ; y) = n log λ nλt(y), joten normalisoitu log-uskottavuusfunktio on l 0 (λ) = l(λ) l( λ) = l(λ) l(1/t(y)) = n log(λt(y)) n(λt(y) 1) ja kysytty 95 %:n luottasväli uskottavuusosamäärän testisuureeseen perustuen on siis A(y) = { λ ; l 0 (λ) > 0.5χ 2 1(0.01) 1.92 }. Kun n = 20 ja t(y) = 0.5, niin 1/t(y) = 2 ja 1.96/ 20 0.5 0.6198, joten Waldin testisuureeseen perustuva 95 %:n luottasväli on A Wald (y) = (1.380, 2.620). Uskottavuusosamäärän testisuureeseen perustuva luottasjoukko on myös väli, sillä edellisen harjoituksen perusteella l 0 on aidosti kasvava, kun λ < 0.5 ja aidosti vähenevä, kun λ > 0.5 eli A(y) = (c, d), missä c < 0.5 < d ja l 0 (c) = l 0 (d) = 1.92. Kuten edellisessä harjoituksessa, nämä löydetään numeerisesti: c 1.25 ja d 3.01, eli A(y) = (1.25, 3.01). Tämä on selkeästi leveämpi kuin Waldin tarjoama. Jos n = 1000, niin tällöin Waldin luottasväli olisi (1.912, 2.087) ja uskottavuusosamäärän testisuureeseen perustuva puolestaan (1.879, 2.123). Alla kuvassa on normalisoitu loguskottavuusfunktio ja siihen merkitty 1.92 leikkauskohdat, joka siis määrää uskottavuusosamäärän testisuureeseen perustuvan 95 %:n luottasvälin. normalisoitu log uskottavuus 12 10 8 6 4 2 0 1 2 3 4 lambda

3. Oletetaan, että Y 1,..., Y n N(µ, σ 2 ) ovat riippumattomia. Muodosta Waldin testiin perustuva luottastason 1 α luottasjoukko parametrille θ = (µ, σ 2 ). Oletetaan, että aineistona on y = 3, s 2 = 4 ja n = 20. Hahmottele 95 %:n luottasjoukon kuvaaja. Ratkaisu: Luentojen perusteella w(y) = ( θ θ 0 ) ι( θ)( θ θ 0 ) Aiemmin kurssilla ollaan osoitettu, että µ = y ja n σ 2 = (n 1)s 2 ja joten ( ) n/ σ 2 0 ι( θ) = 0 n/2 σ 4 = n2 / ( (n 1)s 2) 0 0 n 3 / ( 2(n 1) 2 s 4) w(y; µ, σ 2 ) = n2 (y µ) 2 (n 1)s + n3 ((n 1)/ns 2 σ 2 ) 2 2 (n 1) 2 s 4 Sijoittamalla tähän lukuarvot paikoilleen saadaan w(y) = 19 4 + 8000(19/5 σ2 ) 2 19 2 4 2 Koska tällä kertaa kiinnostavia parametreja oli 2, niin A(y) = { (µ, σ 2 ) ; w(y; µ, σ 2 ) < χ 2 2(α) } = { (µ, σ 2 ) ; n2 (y µ) 2 (n 1)s 2 + n3 ((n 1)/ns 2 σ 2 ) 2 (n 1) 2 s 4 < χ 2 2(α) }. Kun tähän sijoitetaan lukuarvot sekä α = 0.05 saadaan A(y) = { (µ, σ 2 ) ; w(y; µ, σ 2 ) < χ 2 2(α) } = { (µ, σ 2 ) ; = { (µ, σ 2 ) ; + 8000(19/5 σ2 ) 2 < 5.991465 } 19 4 19 2 4 2 (3 µ) 2 1.138378 + (3.8 σ2 ) 2 4.325838 < 1 } Tämä on (3, 3.8)-keskinen ellipsi, jonka akselit ovat koordinaattien suuntaiset ja sen puoliakseleiden pituudet ovat 1.138378 1.066948 ja 4.325838 2.079865 sigma^2 2 3 4 5 6 1 2 3 4 5

4. Jatkoa tehtävään 3. Pidetään varianssia σ 2 kiusaparametrina. Muodosta Waldin testiin sekä uskottavuusosamäärän testisuureeseen perustuvat luottastason 1 α luottasvälit parametrille µ. Ratkaisu: Kun tarkastellaan Waldin testisuureeseen perustuvaa luottasväliä, niin Edellisen tehtävän perusteella w(y) = ( µ µ) ι 1,1 ( θ)( µ µ) w(y; µ, σ 2 ) = n2 (y µ) 2 (n 1)s 2 koska µ ja σ 2 ovat ortogonaalisia. Koska tällä kertaa kiinnostavia parametreja oli 1, niin A(y) = { µ ; n2 (y µ) 2 (n 1)s 2 < χ2 1(α) }. Koska χ 2 1(α) = zα/2 2, niin saatu väli on siis (y dz α/2, y + dz α/2 ) kun d = (n 1)s/n < s/ n. Saatu väli on siis kapeampi kuin mitä tässä tehtävässä saranasuureeseen perustuva vallan mainio t-testi antaisi ja vasta kun n on noin 500 ero ei olisi kovin suuri. Uskottavuusosamäärän testisuureeseen perustuvaa luottasväliä varten tarvitsemme uskottavuusosamäärän testisuureen kun H 0 : µ = µ 0. Harjoituksissa 7A tehtävässä 3 tämä laskettiin ja saatiin, että r(y) = n log ( 1 + (n 1) 1 t(y) 2) kun t(y) = n(y µ)/s on tuttu t-testisuure. Siispä A(y) = { µ ; r(y) = n log ( 1 + (n 1) 1 t(y) 2) < χ 2 1(α) } = { µ ; r(y) = ( 1 + (n 1) 1 t(y) 2) < e χ2 1 (α)/n } = { µ ; t(y) 2 < (n 1)(e χ2 1 (α)/n 1) } = { µ ; n µ y /s < (n 1) ( e χ2 1 (α)/n 1 ) } = { µ ; µ y < s (1 1/n) ( e χ2 1 (α)/n 1 ) } = { µ ; µ y < sd 2 }. Tämä on myös y keskinen väli, joka on otoa (y d 2, y + d 2 ) Suurilla n on (1 1/n) ( exp(χ 2 1(α)/n) 1 ) χ 2 1(α)/n = zα/2 2 /n joten suurilla n d 2 sz α/2 / n

Vaikka tehtävässä ei pyydettykään lukuarvoja, niin jos tähän sijoitetaan tehtävän 3 lukuarvot sekä α = 0.05 niin A Wald (y) = { µ ; < 3.841459 } 19 4 (3 µ) 2 = { µ ; 0.7298772 < 1 } Tämä on 3-keskinen väli, jonka keskivirheenä on 0.7298772 0.8543285. Jos tätä vertaa edelliseen tehtävään, missä puoliakselin pituus oli 1.066948, huomataan, että väli on kapeampi, tätä syytä kannattaa hieman pohtia :). Seuraava kuva esittää samanaikaisesti Waldin luottasvälin µ:lle sekä Waldin luottasjoukon (µ, σ 2 ):lle. sigma^2 0 1 2 3 4 5 6 0 1 2 3 4 5 6 Koska määritelmän kaan P θ (µ A Wald (Y)) = P θ (θ A Wald (Y) (0, )) 1 α niin kuvan molemmat joukot ovat approksimatiivisioa 1 α -luottastason luottasjoukkoja parametrille θ, joten on helppo osoittaa, että välin A Wald (y) tulee olla hieman tehtävän 3 ellipsiä kapeampi. Edelleen kun käytetään tehtävän 3 lukuarvoja, niin 95 %:n luottastason luottasväli Waldin testisuureen perustuen on (2.145671, 3.854329) ja uskottavuusosamäärän testisuureen perustuen on (2.102958, 3.897042) mikä on hieman leveämpi. Kuitenkin jos käytettäisiin t-testiä, niin luottasväliksi tulisi (2.063971, 3.936029), mikä on kaikkein levein väleistä. Koska t-testi perustuu suoraan saranasuureena satunnaisvektorin Y jakaumaan, on sen antama luottasväli tarkin. Waldin testisuureeseen perustuva luottasväli on pienillä n liian kapea, uskottavuusosamäärän testisuureeseen perustuvan välin ollessa näiden kahden välissä.