9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t muodostavat yksinkertaisen satunnaisotoksen eksponenttijakaumasta, jonka parametri on 1/β. Määrää parametrin β estimaattori momentti- sekä suurimman uskottavuuden menetelmän avulla. E(X = β joten momenttimenetelmällä estimaattori saadaan asettamalla E(X = x ˆβ = x = 1 n Suurimman uskottavuuden estimaattoria varten tarvitaan vähän enemmän työtä. Merkitään: Satunnaismuuttujan X i tiheysfunktio: f(x i ; β, uskottavuusfunktio: L(x 1, x 2,..., x n ; β, logaritminen uskottavuusfunktio: l(x 1, x 2,..., x n ; β = log L(x 1, x 2,..., x n ; β Suurimman uskottavuuden estimaattori parametrille β saadaan uskottavuusfunktion maksimin antavana β:n arvona. Koska logaritmi on monotoninen funktio, voidaan maksimin antava β:n arvo etsiä yhtäpitävästi logaritmoidusta uskottavuusfunktiosta. Etsimme siis logaritmisen uskottavuusfunktion derivaatan nollakohdat: f(x i ; β = 1 β e 1 β xi, x i i = 1, 2,..., n L(x 1, x 2,..., x n ; β = f(x 1 ; β f(x 2 ; β f(x n ; β = 1 1 P β n e β xi l(x 1, x 2,..., x n ; β = log L(x 1, x 2,...,x n ; β = 1 β l(x 1, x 2,..., x n ; β β = 1 β 2 ˆβ = 1 n x i n 1 β = 0 x i = x x i n log(β Se, että kyseessä on todella maksimi, nähdään esimerkiksi derivoimalla toiseen kertaan. D2. Tehdas valmistaa nauloja. Naulojen pituus vaihtelee satunnaisesti noudattaen normaalijakaumaa. Naulojen joukosta poimittiin yksinkertainen satunnaisotos, jonka koko oli 30. Otoskeskiarvoksi saatiin 9.99 cm ja otosvarianssiksi 0.01 cm 2. Määrää 95%:n luottamusväli naulojen pituuden odotusarvolle. Jos X i N(µ, σ 2, i = 1, 2,..., n ja X i :t ovat riippumattomia niin otoskeskiarvo X N (µ, σ2 n Koska varianssi σ 2 on tuntematon ja se pitää estimoida, odotusarvon µ luottamusväli on muotoa X ± t α/2 s n
Luottamuskerroin t α/2 saadaan ehdosta Pr(T > t α/2 = α/2, jossa T T(n 1 ja 1 α on luottamustaso. Tässä tehtävässä X = 9.99, s = 0.1, α = 0.05 ja T-jakauman taulukosta saadaan: t α/2 = 2.045. Siten luottamusväliksi saadaan: X ± t α/2 s n = 9.99 ± 0.037 = (9.953, 10.027 D3. Kuntaan suunnitellaan ydinvoimalan rakentamista. Kunnan asukkaiden mielipiteet halutaan selvittää yksinkertaiseen satunnaisotantaan perustuvalla kyselytutkimuksella. Kuinka suuri otos kuntalaisten joukosta on poimittava, jotta saataisiin 99% varmuus siitä, että otoksesta laskettu kannattajien suhteellinen osuus ei poikkea enempää kuin 0.5%-yksikköä todellisesta kannattajien osuudesta? Suhteellisen osuuden p luottamusväli on tyyppiä ˆp ± a, jossa ˆp on otoksesta laskettu suhteellinen osuus. Luottamusvälin lausekkeesta (kts. Kaavat ja taulukot saadaan yhtälö: josta n voidaan ratkaista: z α/2 ˆpˆq n = a ( zα/2 ˆpˆq n = a Haluttu varmuus saavutetaan (edellyttäen, että varianssi on arvioitu oikein, jos n:ksi valitaan pienin kaavan antamaa arvoa suuremmista kokonaisluvuista. Koska ˆp on tuntematon (sen arvo saadaan selville vasta, kun otos on poimittu, korvataan ˆp sillä arvolla, joka antaa maksimaalisen n:n arvon. Eli ˆp = 1/2. Otoskoon lauseke saa siis muodon: n = ( 2 zα/2 Tässä tehtävässä a = 0.005, 1 α = 0.99 ja z α/2 = 2.58 joten n = 66564. Voi siis olla tarpeen kysyä kaikilta kunnan asukkailta (jos kunnan koko on alle 66564, jotta saadaan tarkka tulos. 2a 2 P4. (Jatkoa tehtävälle D1. Estimoi β momenttimenetelmällä otoksesta 0.5, 0.3, 0.1, 0.1 ja 0.2. Mikä on estimoidun jakauman tiheysfunktio? Niille, jotka eivät käy laskuharjoituksissa, kerrottakoon, että tarvittava estimaattori on: 1 p. ˆβ M = x = 1 n x i (= ˆβ SU Ja se on muodostettu asettamalla jakauman 1. origomomentti (odotusarvo ja otoksen 1. origomomentti (aritmeettinen keskiarvo keskenään yhtä suuriksi ja ratkaisemalla yhtälö estimoitavan parametrin suhteen. Estimaattorin arvoksi saadaan: ˆβ M = x = 1 n x i = 0.24
Estimoidun jakauman tiheysfunktio on siten: x f(x = 1ˆβ x e ˆβ 1 = 0.24 e 0.24 P5. Tehdas valmistaa ruuveja. Ruuvien paino vaihtelee satunnaisesti noudattaen normaalijakaumaa. Ruuvien joukosta poimittiin yksinkertainen satunnaisotos. Otoskeskiarvoksi saatiin tällöin 25 g. Oletetaan (epärealistisesti, että normaalijakauman varianssi 0.25 g 2 on tunnettu. Määrää 95% luottamusvälit painon odotusarvolle, jos otoskokona oli a 4 b 400 c 40000 d Vertaa saatujen luottamusvälien pituuksia toisiinsa. Miten luottamusvälin pituus käyttäytyy otoskoon funktiona? 2 p. Jos X i N(µ, σ 2, i = 1, 2,..., n ja X i :t ovat riippumattomia niin otoskeskiarvo X N (µ, σ2 n Jos varianssi σ 2 oletetaan tunnetuksi, odotusarvon µ luottamusväli on muotoa X ± z α/2 s n Luottamuskerroin z α/2 saadaan ehdosta Pr(Z > z α/2 = α/2, jossa Z N(0, 1 ja 1 α on luottamustaso. Tässä tehtävässä X = 25, s = 0.5, α = 0.05 ja normaalijakauman taulukosta saadaan: z α/2 = z 0.025 = 1.96. a n = 4, Luottamusväli: 25 ± 0.49 = (24.51, 25.49 b n = 400, Luottamusväli: 25 ± 0.049 = (24.051, 25.049 c n = 40000, Luottamusväli: 25 ± 0.0049 = (24.0051, 25.0049 d Luottamusvälin pituus on käänteisesti verrrannollinen otoskoon neliöjuureen. P6. Tuoremehun C-vitamiinipitoisuus (mg/dl vaihtelee jonkin verran valmistuserästä toiseen. Laboratorio haluaa selvittää erään tuoremehumerkin keskimääräisen C-vitamiinipitoisuuden mittaamalla pitoisuuden myynnissä olevista tuoremehupakkauksista poimitusta yksinkertaisesta satunnaisotoksesta. Arvion pitäisi olla niin tarkka, että 99% varmuudella voidaan päätellä, että otoksesta laskettu keskimääräinen C-vitamiinipitoisuus ei poikkea todellisesta C-vitamiinipitoisuudesta enempää kuin 0.5 mg. Määrää tarvittava otoskoko, kun aikaisempien tutkimusten perusteella tiedetään että C-vitamiinipitoisuuden otoshajonta on tavallisesti 3 mg. 1 p.
Odotusarvon µ luottamusväli on tyyppiä x ± a, jossa x on otoksesta laskettu aritmeettinen keskiarvo. Luottamusvälin lausekkeesta (kts. Kaavat ja taulukot saadaan yhtälö: z α/2 σ 2 n = a josta n voidaan ratkaista: ( zα/2 σ n = a 2 Haluttu varmuus saavutetaan (edellyttäen, että varianssi on arvioitu oikein, jos n:ksi valitaan pienin kaavan antamaa arvoa suuremmista kokonaisluvuista. Tässä tehtävässä a = 0.5, 1 α = 0.99, σ = 3 ja z α/2 = 2.58 joten n 239.63 eli otoskoon on oltava vähintään 240. L7. Kolme tutkijaa A, B ja C ovat määrittäneet erään teollisuuslaitoksen jätevesistä ph-arvoja tavoitteenaan estimoida jätevesien keskimääräinen ph-arvo µ havaintojen perusteella. Määritykset tehtiin ottamalla vesinäytteitä ja määräämällä näytekohtaisten ph-arvojen keskiarvot. Tutkijoiden saamat tulokset: Tutkija Näytteiden lkm ph-lukujen ka A 10 7.4 B 15 7.7 C 200 6.2 a Näytä että estimaattorit x A, x B, x C ja ( x A + x B + x C /3 ovat harhattomia keskimääräisen pharvon µ estimaattoreita. b Mikä estimaattoreista on luotettavin siinä mielessä, että sen varianssi on pienin? c Näytä, että vielä pienempi kuin yhdenkään yllä mainitun estimaattorin varianssi on estimaattorilla, joka saadaan laskemalla näytteiden lukumäärillä painotettu aritmeettinen keskiarvo eli a Kaikki estimaattorit ovat harhattomia, koska x = n A x A + n B x B + n C x C E( X A = E( X B = E( X C = µ ja ( 1 E 3 ( X A XB XC = 1 (µ + µ + µ = µ. 3
b Estimaattoreiden varianssit ovat ( 1 Var 3 ( X A XB XC Var( X A = σ2 10 = 0.1σ2 Var( X B = σ2 15 0.067σ2 Var( X C = σ2 200 = 0.005σ2 pienin = 1 ( 1 9 10 + 1 1 15 200 + σ 2 0.019σ 2 Luotettavin estimaattoreista on siis X C, koska siinä havaintojen lukumäärä on suurin. c Painotettu aritmeettisen keskiarvon odotusarvo on ( E( X na XA + n B XB + n C XC = E = n AE( X A + n B E( X B + n C E( X C = n Aµ + n B µ + n C µ = µ eli painotettu aritemeettinen keskiarvo on harhaton estimaattori parametrille µ ja sen varianssi on ( Var( X na XA + n B XB + n C XC = Var = n2 A Var( X A + n 2 B Var( X B + n 2 C Var( X C ( 2 = 1 ( 10 2 σ 225 2 10 + 152 15 + 2002 2 = σ2 200 225 0.0044σ2 joka on pienempi kuin mikään em. variansseista. (Hyvä huomata x = 6.35. L8. Satunnaismuuttujan X tiheysfunktio on f(x = (1 + θx θ, 0 < x < 1 Miksi parametrin θ pitää toteuttaa ehto θ > 1? Satunnaismuuttujasta X on saatu havainnot 0.5, 0.3, 0.1, 0.1 ja 0.2. a Hahmottele tiheysfunktion kuvaaja parametrin θ arvoilla -0.5, 0, 1 sekä 2 ja arvioi mikä arvoista sopisi parhaiten havaintoihin. b Estimoi θ momenttimenetelmällä. c Estimoi θ suurimman uskottavuuden menetelmällä. Vertaa tulosta b -kohdan tulokseen. Koska f(x on tiheysfunktio, sen on toteutettava ehto: + f(x dx = 1 0 (1 + θx θ dx = 1, mikä on mahdollista vain, jos (1 + θ > 0 eli θ > 1. a Havainnot sopivat parhaiten jakaumaan, jossa θ < 0, koska tällöin suurin osa jakauman todennäköisyysmassasta on välin (0,1 vasemmassa päässä kuten tehdy havainnotkin.
b Estimointi momenttimenetelmällä: E(X = 1 Momenttiestimaattori saadaan yhtälöstä 0 x(1 + θx θ dx = 1 + θ 2 + θ Otoksessa x = 0.24, joten josta siis saamme ˆθ MM = 0.684. E(X = x eli 1 + θ 2 + θ = x 1 + ˆθ = 0.24 2 + ˆθ c Estimointi suurimman uskottavuuden menetelmällä: Riippumattoman otoksen X i, i = 1, 2,...,n uskottavuusfunktio on L(θ = f(x 1, X 2,...,X n ; θ = f(x 1, θ f(x 2, θ f(x n, θ = (1 + θx θ 1 (1 + θxθ 2 (1 + θxθ n = (1 + θ n U θ missä U = X 1 X 2 X n. Uskottavuusfunktion maksimi saadaan derivaatan nollakohtana: Josta L (θ = 0 θ (1 + θn U θ = (1 + θ n 1 u θ (n + (1 + θlnu = 0 n + (1 + θln u = 0 ˆθ SU = 1 n lnu Näin ollen ˆθ SU = 0.384, koska n = 5 ja u = 0.0003. L9. Tehdas väittää, että sen valmistamista tuotteista korkeintaan 5% on viallisia. Asiakas poimii tuotteiden joukosta yksinkertaisen satunnaisotoksen, jonka koko on 150 ja löytää 15 viallista tuotetta. Voidaanko tehtaan väitettä viallisten suhteellisesta osuudesta pitää oikeutettuna? Ohje: Määrää otoksesta 95%:n ja 99%:n luottamusvälit ja tarkastele peittävätkö välit tuotteiden oletetun suhteellisen osuuden. Tarkoituksena on siis tarkastella Bernoulli-jakauman parametrin p luottamusväliä eli suhteellisen osuuden luottamusväliä. Kaavakokoelman mukaan kyseinen luottamusväli on muotoa: ˆp ± z α/2 ˆpˆp n, missä ˆp = 15/150 = 0.1 on estimoitu suhteellinen osuus, ˆq = 1 ˆp = 0.9, z α/2 on normaalijakaumasta määrätty luottamuskerroin ja n = 150 on otoskoko.
95%:n ja 99%:n luottamusvälejä vastaavat luottamuskertoimet saadaan seuraavasti: Luottamusvälit ovat siis: 1 α = 0.95 z α/2 = z 0.025 = 1.96 1 α = 0.99 z α/2 = z 0.005 = 2.58 95% : 0.1 ± 0.048 = (0.052, 0.148 99% : 0.1 ± 0.063 = (0.037, 0.163 Näistä siis 99% luottamusväli peittää valmistajan ilmoittaman p:n arvon, mutta 95% luottamusväli puolestaan ei. Tämä antaa jonkin verran syytä epäillä valmistajan väitteen oikeellisuutta. Asiaa tarkastellaan enemmän tilastollisen testauksen yhteydessä.