HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 8B Ratkaisuehdotuksia.

Samankaltaiset tiedostot
Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

5.7 Uskottavuusfunktioon perustuvia testejä II

6.1.2 Luottamusjoukon määritelmä

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät Ratkaisuehdotuksia

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

Estimointi. Vilkkumaa / Kuusinen 1

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

5 Hypoteesien testaaminen

2. Uskottavuus ja informaatio

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

Kertausluento. Tilastollinen päättely II - 2. kurssikoe

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

2. Uskottavuus ja informaatio

k S P[ X µ kσ] 1 k 2.

Väliestimointi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

5 Hypoteesien testaaminen

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

3.6 Su-estimaattorien asymptotiikka

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia.

Harjoitus 7: NCSS - Tilastollinen analyysi

1. Tilastollinen malli??

Sovellettu todennäköisyyslaskenta B

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

9. laskuharjoituskierros, vko 12-13, ratkaisut

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

T Luonnollisten kielten tilastollinen käsittely

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Todennäköisyyden ominaisuuksia

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Yleistä tietoa kokeesta

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Tilastollinen aineisto Luottamusväli

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Uskottavuuden ominaisuuksia

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

Sovellettu todennäköisyyslaskenta B

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Uskottavuusperusteisten luottamusvälien korjaaminen bootstrap-menetelmällä Pro gradu -esitelmä

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

805306A Johdatus monimuuttujamenetelmiin, 5 op

,ܾ jaü on annettu niin voidaan hakea funktion

η i (θ)t i (x) A(θ) + c(x),

Sovellettu todennäköisyyslaskenta B

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Mat Tilastollisen analyysin perusteet, kevät 2007

Pelaisitko seuraavaa peliä?

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

ABHELSINKI UNIVERSITY OF TECHNOLOGY

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 7B Ratkaisuehdotuksia.

Yleistetyn lineaarisen mallin perusteita

11. laskuharjoituskierros, vko 15, ratkaisut

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Moniulotteisia todennäköisyysjakaumia

Kaksisuuntainen varianssianalyysi. Heliövaara 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

pisteet Frekvenssi frekvenssi Yhteensä

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Transkriptio:

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 8B Ratkaisuehdotuksia Tehtäväsarja I 1. Jatkoa Harjoitus 8A tehtävään 3. Muodosta odotusarvolle µ approksimatiivinen 99 %:n luottasväli uskottavuusosamäärän testisuureeseen perustuen. Ratkaisu: Aiemmissa harjoituksissa ja monisteen nojalla log-uskottavuusfunktio on l(µ; y) = l(µ) = nµ + ny log µ ja µ = y joten normalisoitu log-uskottavuusfunktio on l 0 (µ) = l(µ) l( µ) = l(µ) l(y) = n(µ y) + ny log(µ/y) Siispä approksimatiivinen 99%:n luottasväli on A(y) = { µ ; n(µ y) + ny log(µ/y) > 1 2 χ2 1(0.01) 3.32 } Preussin armeijan aineistossa y = 0.7 ja n = 280, joten A(y) = { µ ; 280 ( (µ 0.7) + 0.7 log(µ/0.7) ) > 3.32 } Jos g(µ) = 280 ( (µ 0.7)+0.7 log(µ/0.7) ), niin aiemmista harjoituksista tiedetään, että g on aidosti kasvava kun µ < 0.7 ja aidosti vähenevä, kun µ > 0.7, sillä tätä sovellettiin suurimman uskottavuuden estimaattia haettaessa. Tästä seuraa, että A(y) = (c, d), missä c < 0.7 ja d > 0.7 ja g(c) = g(d) = 3.32. Laskemalla nähdään, että g(0.578) 3.375 < 3.32 ja g(0.579) 3.316 > 3.32 joten 0.578 < c < 0.579 eli c 0.58. Vastaavasti g(0.837) 3.326 < 3.32 ja g(0.836) 3.281 > 3.32, joten 0.836 < d < 0.837 eli d 0.84. Jos luvut olisi laskenut hieman useammilla desimaaleilla 1 2 χ2 1(0.01) 3.317448, ja 0.578983 < c < 0.578984 ja 0.836808 < d < 0.836809 eli A(y) (0.57898, 0.83681). Edellissessä harjoituksessa Waldin testisuureeseen perustuva vastaava 99 %:n luottasväli oli A Wald (y) (0.5715, 0.8285). normalisoitu log uskottavuus 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 0.60 0.65 0.70 0.75 0.80 0.85

2. Jatkoa Harjoitus 8A tehtävään 4. Muodosta odotusarvolle λ approksimatiivinen 95 %:n luottasväli uskottavuusosamäärän testisuureeseen perustuen. Oletetaan, että aineistosta tiedetään tunnusluku t(y) = (1/n) y 2 i = 0.5 ja n = 20. Määrää numeerisesti Waldin testiin perustuva luottasväli sekä uskottavuusosamäärän perustuva testisuure. Ratkaisu: Harjoitus 8A tehtävässä 4 selvitettiin, että λ = 1/t(y) ja että Waldin testisuureeseen perustuva 95 %:n luottasväli on A Wald (y) = ( 1/t(y) 1.96/ nt(y), 1/t(y) + 1.96/ nt(y) ) Lisäksi tehtävässä määrättiin, että log-uskottavuusfunktio on l(λ; y) = n log λ nλt(y), joten normalisoitu log-uskottavuusfunktio on l 0 (λ) = l(λ) l( λ) = l(λ) l(1/t(y)) = n log(λt(y)) n(λt(y) 1) ja kysytty 95 %:n luottasväli uskottavuusosamäärän testisuureeseen perustuen on siis A(y) = { λ ; l 0 (λ) > 0.5χ 2 1(0.01) 1.92 }. Kun n = 20 ja t(y) = 0.5, niin 1/t(y) = 2 ja 1.96/ 20 0.5 0.6198, joten Waldin testisuureeseen perustuva 95 %:n luottasväli on A Wald (y) = (1.380, 2.620). Uskottavuusosamäärän testisuureeseen perustuva luottasjoukko on myös väli, sillä edellisen harjoituksen perusteella l 0 on aidosti kasvava, kun λ < 0.5 ja aidosti vähenevä, kun λ > 0.5 eli A(y) = (c, d), missä c < 0.5 < d ja l 0 (c) = l 0 (d) = 1.92. Kuten edellisessä harjoituksessa, nämä löydetään numeerisesti: c 1.25 ja d 3.01, eli A(y) = (1.25, 3.01). Tämä on selkeästi leveämpi kuin Waldin tarjoama. Jos n = 1000, niin tällöin Waldin luottasväli olisi (1.912, 2.087) ja uskottavuusosamäärän testisuureeseen perustuva puolestaan (1.879, 2.123). Alla kuvassa on normalisoitu loguskottavuusfunktio ja siihen merkitty 1.92 leikkauskohdat, joka siis määrää uskottavuusosamäärän testisuureeseen perustuvan 95 %:n luottasvälin. normalisoitu log uskottavuus 12 10 8 6 4 2 0 1 2 3 4 lambda

3. Oletetaan, että Y 1,..., Y n N(µ, σ 2 ) ovat riippumattomia. Muodosta Waldin testiin perustuva luottastason 1 α luottasjoukko parametrille θ = (µ, σ 2 ). Oletetaan, että aineistona on y = 3, s 2 = 4 ja n = 20. Hahmottele 95 %:n luottasjoukon kuvaaja. Ratkaisu: Luentojen perusteella w(y) = ( θ θ 0 ) ι( θ)( θ θ 0 ) Aiemmin kurssilla ollaan osoitettu, että µ = y ja n σ 2 = (n 1)s 2 ja joten ( ) n/ σ 2 0 ι( θ) = 0 n/2 σ 4 = n2 / ( (n 1)s 2) 0 0 n 3 / ( 2(n 1) 2 s 4) w(y; µ, σ 2 ) = n2 (y µ) 2 (n 1)s + n3 ((n 1)/ns 2 σ 2 ) 2 2 (n 1) 2 s 4 Sijoittamalla tähän lukuarvot paikoilleen saadaan w(y) = 19 4 + 8000(19/5 σ2 ) 2 19 2 4 2 Koska tällä kertaa kiinnostavia parametreja oli 2, niin A(y) = { (µ, σ 2 ) ; w(y; µ, σ 2 ) < χ 2 2(α) } = { (µ, σ 2 ) ; n2 (y µ) 2 (n 1)s 2 + n3 ((n 1)/ns 2 σ 2 ) 2 (n 1) 2 s 4 < χ 2 2(α) }. Kun tähän sijoitetaan lukuarvot sekä α = 0.05 saadaan A(y) = { (µ, σ 2 ) ; w(y; µ, σ 2 ) < χ 2 2(α) } = { (µ, σ 2 ) ; = { (µ, σ 2 ) ; + 8000(19/5 σ2 ) 2 < 5.991465 } 19 4 19 2 4 2 (3 µ) 2 1.138378 + (3.8 σ2 ) 2 4.325838 < 1 } Tämä on (3, 3.8)-keskinen ellipsi, jonka akselit ovat koordinaattien suuntaiset ja sen puoliakseleiden pituudet ovat 1.138378 1.066948 ja 4.325838 2.079865 sigma^2 2 3 4 5 6 1 2 3 4 5

4. Jatkoa tehtävään 3. Pidetään varianssia σ 2 kiusaparametrina. Muodosta Waldin testiin sekä uskottavuusosamäärän testisuureeseen perustuvat luottastason 1 α luottasvälit parametrille µ. Ratkaisu: Kun tarkastellaan Waldin testisuureeseen perustuvaa luottasväliä, niin Edellisen tehtävän perusteella w(y) = ( µ µ) ι 1,1 ( θ)( µ µ) w(y; µ, σ 2 ) = n2 (y µ) 2 (n 1)s 2 koska µ ja σ 2 ovat ortogonaalisia. Koska tällä kertaa kiinnostavia parametreja oli 1, niin A(y) = { µ ; n2 (y µ) 2 (n 1)s 2 < χ2 1(α) }. Koska χ 2 1(α) = zα/2 2, niin saatu väli on siis (y dz α/2, y + dz α/2 ) kun d = (n 1)s/n < s/ n. Saatu väli on siis kapeampi kuin mitä tässä tehtävässä saranasuureeseen perustuva vallan mainio t-testi antaisi ja vasta kun n on noin 500 ero ei olisi kovin suuri. Uskottavuusosamäärän testisuureeseen perustuvaa luottasväliä varten tarvitsemme uskottavuusosamäärän testisuureen kun H 0 : µ = µ 0. Harjoituksissa 7A tehtävässä 3 tämä laskettiin ja saatiin, että r(y) = n log ( 1 + (n 1) 1 t(y) 2) kun t(y) = n(y µ)/s on tuttu t-testisuure. Siispä A(y) = { µ ; r(y) = n log ( 1 + (n 1) 1 t(y) 2) < χ 2 1(α) } = { µ ; r(y) = ( 1 + (n 1) 1 t(y) 2) < e χ2 1 (α)/n } = { µ ; t(y) 2 < (n 1)(e χ2 1 (α)/n 1) } = { µ ; n µ y /s < (n 1) ( e χ2 1 (α)/n 1 ) } = { µ ; µ y < s (1 1/n) ( e χ2 1 (α)/n 1 ) } = { µ ; µ y < sd 2 }. Tämä on myös y keskinen väli, joka on otoa (y d 2, y + d 2 ) Suurilla n on (1 1/n) ( exp(χ 2 1(α)/n) 1 ) χ 2 1(α)/n = zα/2 2 /n joten suurilla n d 2 sz α/2 / n

Vaikka tehtävässä ei pyydettykään lukuarvoja, niin jos tähän sijoitetaan tehtävän 3 lukuarvot sekä α = 0.05 niin A Wald (y) = { µ ; < 3.841459 } 19 4 (3 µ) 2 = { µ ; 0.7298772 < 1 } Tämä on 3-keskinen väli, jonka keskivirheenä on 0.7298772 0.8543285. Jos tätä vertaa edelliseen tehtävään, missä puoliakselin pituus oli 1.066948, huomataan, että väli on kapeampi, tätä syytä kannattaa hieman pohtia :). Seuraava kuva esittää samanaikaisesti Waldin luottasvälin µ:lle sekä Waldin luottasjoukon (µ, σ 2 ):lle. sigma^2 0 1 2 3 4 5 6 0 1 2 3 4 5 6 Koska määritelmän kaan P θ (µ A Wald (Y)) = P θ (θ A Wald (Y) (0, )) 1 α niin kuvan molemmat joukot ovat approksimatiivisioa 1 α -luottastason luottasjoukkoja parametrille θ, joten on helppo osoittaa, että välin A Wald (y) tulee olla hieman tehtävän 3 ellipsiä kapeampi. Edelleen kun käytetään tehtävän 3 lukuarvoja, niin 95 %:n luottastason luottasväli Waldin testisuureen perustuen on (2.145671, 3.854329) ja uskottavuusosamäärän testisuureen perustuen on (2.102958, 3.897042) mikä on hieman leveämpi. Kuitenkin jos käytettäisiin t-testiä, niin luottasväliksi tulisi (2.063971, 3.936029), mikä on kaikkein levein väleistä. Koska t-testi perustuu suoraan saranasuureena satunnaisvektorin Y jakaumaan, on sen antama luottasväli tarkin. Waldin testisuureeseen perustuva luottasväli on pienillä n liian kapea, uskottavuusosamäärän testisuureeseen perustuvan välin ollessa näiden kahden välissä.