Mat-.60 Sovellettu todeäköisyyslasketa B Mat-.60 Sovellettu todeäköisyyslasketa B / Ratkaisut Aiheet: Estimoiti Estimoitimeetelmät Väliestimoiti Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Beroulli-koe, Estimaatti, Estimaattori, Frekvessi, Frekvessitulkita, Harhato estimaattori, Keskeie raja-arvolause, Keskihajota, χ -jakauma, Logaritmie uskottavuusfuktio, Luottamuskerroi, Luottamustaso, Luottamusväli, Maksimoiti, Mometti, Momettiestimaattori, Momettimeetelmä, Normaalijakauma, Odotusarvo, Otos, Otosjakauma, Otoskoko, Otosvariassi, Riippumattomuus, Stadardoitu ormaalijakauma, Suhteellie frekvessi, Suhteellie osuus, Suurimma uskottavuude estimaattori, Suurimma uskottavuude meetelmä, t-jakauma, Todeäköisyys, Uskottavuusfuktio, Variassi, Yksikertaie satuaisotos Estimoiti Yksikertaie satuaisotos Olkoo i, i =,,, yksikertaie satuaisotos jakaumasta, joka pistetodeäköisyys- tai tiheysfuktio f(x;θ) riippuu parametrista θ. Tällöi havaiot i, i =,,, ovat riippumattomia, idettisesti jakautueita satuaismuuttujia, joilla o sama pistetodeäköisyys- tai tiheysfuktio f(x;θ):,,, f( x; θ ), i =,,, i Estimaattori ja estimaatti Oletetaa, että todeäköisyysjakauma f(x;θ) parametri θ o tutemato ja se estimoimisee käytetää havaitoje i, i =,,, fuktiota eli (otos-) tuuslukua T = g(,,, ) Tällöi fuktiota T = g(,,, ) kutsutaa parametri θ estimaattoriksi ja fuktio g havaitoarvoista laskettua arvoa x, x,, x t = g( x, x,, x ) kutsutaa parametri θ estimaatiksi. TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B Otosjakauma Oletetaa, että havaiot i, i =,,, muodostavat yksikertaise satuaisotokse jakaumasta f(x;θ) ja olkoo T = g(,,, ) joki parametri θ estimaattori. Koska estimaattori T o satuaismuuttuja, sillä o todeäköisyysjakauma, jota kutsutaa estimaattori T otosjakaumaksi. Estimaattori T otosjakauma muodostaa tilastollise malli eli todeäköisyysmalli estimaattori T arvoje satuaisvaihtelulle otoksesta toisee. Harhattomuus Estimaattoria T saotaa parametri θ harhattomaksi estimaattoriksi, jos E(T) = θ Tehokkuus Estimaattori T o tehokkaampi kui estimaattori T, jos Var(T ) < Var(T ) Täystehokkuus (miimivariassisuus) Estimaattori T saotaa täystehokkaaksi, jos se variassi Var(T) o pieempi kui mikä tahasa muu estimaattori. TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B Estimoitimeetelmät Suurimma uskottavuude meetelmä Yksikertaie satuaisotos Olkoo i, i =,,, yksikertaie satuaisotos jakaumasta, joka pistetodeäköisyys- tai tiheysfuktio f(x;θ) riippuu parametrista θ. Tällöi havaiot i, i =,,, ovat riippumattomia, idettisesti jakautueita satuaismuuttujia, joilla o sama pistetodeäköisyys- tai tiheysfuktio f(x;θ):,,, f( x; θ ), i =,,, i Uskottavuusfuktio Koska havaiot i, i =,,, muodostavat yksikertaise satuaisotokse jakaumasta f(x;θ), otokse yhteisjakauma tiheysfuktio o jossa f( x, x,, x ; θ) = f( x ; θ) f( x ; θ) f( x ; θ) f ( x; θ ), i =,,, i o yksittäisee havaitoo i liittyvä pistetodeäköisyys- tai tiheysfuktio. Otokse i, i =,,, uskottavuusfuktio L( θ; x, x,, x ) = f( x, x,, x ; θ) o havaitoje i, i =,,, yhteisjakauma pistetodeäköisyys- tai tiheysfuktio f arvo pisteessä x, x,, x tulkittua parametri θ arvoje fuktioksi. Uskottavuusfuktio L sisältää kaike iformaatio otoksesta. Suurimma uskottavuude estimaattori Olkoo t = g x x x (,,, ) parametri θ arvo, joka maksimoi otokse i, i =,,, uskottavuusfuktio L θ x x x ( ;,,, ) parametri θ suhtee. Huomaa, että uskottavuusfuktio L maksimi atava parametri θ arvo t o muuttujie (havaitoarvoje) x, x,, x fuktio. TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B Sijoittamalla uskottavuusfuktio L maksimi parametri θ suhtee atavassa lausekkeessa t = t x x x (,,, ) muuttujie x, x,, x paikalle satuaismuuttujat (havaiot),,, saadaa parametri θ suurimma uskottavuude estimaattori eli SU-estimaattori θ ˆ = g(,,, ) Parametri θ suurimma uskottavuude estimaattori θ ˆ tuottaa parametrille θ arvo, joka maksimoi poimitu otokse eli saatuje havaitoarvoje uskottavuude (todeäköisyyde). Site parametri θ suurimma uskottavuude estimaattori θ ˆ otoskohtaie arvo maksimoi todeäköisyyde saada juuri se otos, joka o saatu. Suurimma uskottavuude estimaattori määräämie Parametri θ suurimma uskottavuude estimaattori määrätää maksimoimalla uskottavuusfuktio ( θ;,,, ) L x x x parametri θ suhtee. Kaikissa sääöllisissä tapauksissa maksimi löydetää merkitsemällä uskottavuusfuktio L(θ) derivaatta L (θ) ollaksi ja ratkaisemalla θ saadusta ormaaliyhtälöstä L (θ) = 0 Logaritmie uskottavuusfuktio Uskottavuusfuktio maksimi kaattaa tavallisesti etsiä maksimoimalla uskottavuusfuktio sijasta logaritmista uskottavuusfuktiota (uskottavuusfuktio logaritmia) l( θ; x, x,, x ) = log L( θ; x, x,, x ) Koska havaiot,,, o oletettu tässä riippumattomiksi, logaritmie uskottavuusfuktio voidaa kirjoittaa seuraavaa muotoo: l( θ) = log L( θ) = log ( f( x; θ) f( x ; θ) f( x ; θ) ) = log f( x; θ) + log f( x ; θ) + + log f( x ; θ) = l( θ ; x) + l( θ ; x) + + l( θ ; x ) jossa l(θ ; x i ) = log f(x i ; θ), i =,,, o havaitoarvoo x i liittyvä logaritmie uskottavuusfuktio. TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B Jos parametri θ SU-estimaattori θ ˆ ei täytä mitää hyvä estimaattori kriteeriä äärellisillä havaitoje lukumäärillä, SU-estimaattori θ ˆ käyttöä parametri θ estimaattoria voidaa kuiteki usei perustella SU-estimaattori yleisillä asymptoottisilla omiaisuuksilla: Hyvi yleisi ehdoi pätee: (i) SU-estimaattori θ ˆ o tarketuva eli Pr( θˆ θ) =, ku + (ii) SU-estimaattori ˆ θ o asymptoottisesti ormaalie. Normaalijakauma parametrie suurimma uskottavuude estimaattorit Satuaismuuttuja oudattaa ormaalijakaumaa, jos se tiheysfuktio o muotoa x µ f( x; µσ, ) = exp, < µ <+, σ> 0 σ π σ Normaalijakauma parametreia ovat jakauma odotusarvo E( ) = µ ja variassi Var( ) = D ( ) = σ Normaalijakauma N(µ,σ ) odotusarvo µ ja variassi σ SU-estimaattorit ovat havaitoje,,, aritmeettie keskiarvo ja otosvariassi i i = = σˆ ( ) = i i= Normaalijakauma N(µ,σ ) odotusarvo µ SU-estimaattorilla o seuraavat omiaisuudet: (i) (ii) (iii) (iv) (v) o harhato. ja σ ˆ ovat yhdessä tyhjetäviä parametreille µ ja σ. o tehokas eli miimivariassie estimaattori. o tarketuva. oudattaa ormaalijakaumaa: σ N µ, TKK @ Ilkka Melli (006) 5/5
Mat-.60 Sovellettu todeäköisyyslasketa B Normaalijakauma N(µ,σ ) variassi σ SU-estimaattorilla (i) σ ˆ o harhaie, mutta estimaattori s = ( ) ˆ i = σ i= o harhato. σ ˆ o seuraavat omiaisuudet: (ii) (iii) (iv) (v) ja σ ˆ ovat yhdessä tyhjetäviä parametreille µ ja σ. σ ˆ ei ole tehokas eli miimivariassie estimaattori. σ ˆ o tarketuva. ( ) s /σ oudattaa χ -jakaumaa: ( ) s σ χ ( ) Ekspoettijakauma parametri suurimma uskottavuude estimaattori Satuaismuuttuja oudattaa ekspoettijakaumaa Exp(λ), jos se tiheysfuktio o λx f( x) = λe, x 0, λ > 0 Ekspoettijakauma aioaa parametria o λ = E( ) Ekspoettijakauma Exp(λ) parametri λ SU-estimaattori o ˆ λ = jossa i i = = o havaitoje,,, aritmeettie keskiarvo. Beroulli-jakauma odotusarvoparametri suurimma uskottavuude estimaattori Olkoo A tapahtuma, joka todeäköisyys o p: Pr(A) = p Määritellää satuaismuuttuja seuraavasti:, jos A tapahtuu = 0, jos A ei tapahdu TKK @ Ilkka Melli (006) 6/6
Mat-.60 Sovellettu todeäköisyyslasketa B Satuaismuuttuja oudattaa Beroulli-jakaumaa parametrilla p: Ber( p) jossa Pr(A) = p = E() Beroulli-jakauma Ber(p) odotusarvoparametri p SU-estimaattori o havaitoje,,, aritmeettie keskiarvo i i = = Huomaa, että f = jossa f o kiiostukse kohteea oleva tapahtuma A suhteellie frekvessi otoksessa. Beroulli-jakauma Ber(p) odotusarvoparametri p SU-estimaattorilla ˆp o seuraavat omiaisuudet: (i) ˆp o harhato. (ii) (iii) (iv) (v) ˆp o tyhjetävä. ˆp o tehokas eli miimivariassie estimaattori. ˆp o tarketuva. ˆp oudattaa asymptoottisesti ormaalijakaumaa: p pq ˆ a N p, Momettimeetelmä Olkoo i, i =,,, yksikertaie satuaisotos jakaumasta, joka pistetodeäköisyys- tai tiheysfuktio f(x;θ), joka parametria o p-vektori θ = (θ, θ,, θ p ) Tällöi havaiot i, i =,,, ovat riippumattomia, idettisesti jakautueita satuaismuuttujia, joilla o sama pistetodeäköisyys- tai tiheysfuktio f(x;θ):,,, f( x; θ ), i =,,, i Oletetaa, että jakaumalla f(x;θ) o kaikki (origo-) mometit kertalukuu p saakka: k E( ) = α, k =,,, p, i =,,, i k TKK @ Ilkka Melli (006) 7/7
Mat-.60 Sovellettu todeäköisyyslasketa B Oletetaa, että momettie ja parametrie α, α,, α p θ, θ,, θ p välillä o jatkuva bijektio eli käätäe yksikäsitteie kuvaus: () α = g( θ, θ,, θp ) α = g( θ, θ,, θp ) αp = g p( θ, θ,, θp) Tällöi parametrit θ, θ,, θ p voidaa esittää momettie α, α,, α p fuktioia: () θ = h( α, α,, αp ) θ = h( α, α,, αp ) θp = hp( α, α,, αp) Estimoidaa mometit α, α,, α p vastaavilla otosmometeilla: k ak = i, k =,,, p i = Sijoittamalla estimaattorit a, a,, a p momettie α, α,, α p paikalle yhtälöihi (), saadaa parametrie θ, θ,, θ p momettiestimaattorit eli MM-estimaattorit θˆ = h( a, a,, ap ) θˆ = h( a, a,, ap ) ˆ θ p = hp( a, a,, ap) TKK @ Ilkka Melli (006) 8/8
Mat-.60 Sovellettu todeäköisyyslasketa B Normaalijakauma parametrie momettiestimaattorit Normaalijakauma N(µ,σ ) odotusarvo µ ja variassi σ MM-estimaattorit ovat havaitoje,,, aritmeettie keskiarvo ja otosvariassi i i = = σˆ ( ) = i i= Ekspoettijakauma parametri momettiestimaattori Ekspoettijakauma Exp(λ) parametri λ MM-estimaattori o ˆ λ = jossa i i = = o havaitoje,,, aritmeettie keskiarvo. Beroulli-jakauma odotusarvoparametri momettiestimaattori Beroulli-jakauma Ber(p) odotusarvoparametri p MM-estimaattori o havaitoje,,, aritmeettie keskiarvo i i = = Huomaa, että f = jossa f o kiiostukse kohteea oleva tapahtuma A suhteellie frekvessi otoksessa. TKK @ Ilkka Melli (006) 9/9
Mat-.60 Sovellettu todeäköisyyslasketa B Väliestimoiti Normaalijakauma odotusarvo luottamusväli, ku jakauma variassi o tuettu Otos ormaalijakaumasta Olkoo i, i =,,, yksikertaie satuaisotos ormaalijakaumasta N(µ, σ ). Tällöi satuaismuuttujat i, i =,,, ovat riippumattomia ja oudattavat samaa ormaalijakaumaa N(µ, σ ):,,, N( µσ, ), i =,,, i Normaalijakauma parametrie estimoiti Oletetaa, että ormaalijakauma N(µ, σ ) variassi σ o tuettu ja estimoidaa odotusarvoparametri E() = µ se harhattomalla estimaattorilla: Havaitoje aritmeettie keskiarvo i i = = o odotusarvoparametri E() = µ harhato estimaattori. Normaalijakauma odotusarvo luottamusväli, ku jakauma variassi o tuettu Valitaa luottamustasoksi α Luottamustaso kiiittää todeäköisyyde, jolla kostruoitava luottamusväli peittää ormaalijakauma odotusarvo µ todellise arvo. Määrätää luottamuskertoimet z α/ ja +z α/ site, että α Pr( z zα /) = α Pr( z + zα /) = jossa satuaismuuttuja z oudattaa stadardoitua ormaalijakaumaa: z N(0,) Site luottamuskertoimet z α/ ja +z α/ toteuttavat ehdo Pr( z z + z ) = α/ α/ α 0.5 0.4 0.3 0. 0. 0 N(0,)-jakauma tiheysfuktio α/ α α/ z α/ 0 +z α/ TKK @ Ilkka Melli (006) 0/0
Mat-.60 Sovellettu todeäköisyyslasketa B Normaalijakauma odotusarvoparametri µ luottamusväli luottamustasolla ( α) o tuetu variassi σ tapauksessa muotoa σ σ zα/, + zα/ jossa = havaitoje aritmeettie keskiarvo otoksessa σ = jakauma variassi = havaitoje lukumäärä z α/ ja +z α/ = luottamustasoo ( α) liittyvät luottamuskertoimet ormaalijakaumasta N(0,) Luottamusväli kostruktio perustuu siihe, että µ N(0,) σ / Koska luottamusväli o symmetrie keskipisteesä suhtee, luottamusväli esitetää usei muodossa ± z α / Luottamusväli pituus o σ zα / Luottamusväli kostruktiosta seuraa, että σ σ σ Pr zα/ µ + zα/ = α Site luottamusväli peittää parametri µ todellise arvo todeäköisyydellä ( α) ja se ei peitä parametri µ todellista arvoa todeäköisyydellä α. Luottamusväli omiaisuudet (i) Normaalijakauma odotusarvo µ luottamusväli keskipiste vaihtelee otoksesta toisee. (ii) Luottamusväli pituus ei vaihtele otoksesta toisee. (iii) Luottamusväli pituus riippuu valitusta luottamustasosta ( α), havaitoje lukumäärästä ja jakauma variassista σ. (iv) Luottamusväli lyheee (piteee), jos luottamustasoa ( α) pieeetää (kasvatetaa). (v) Luottamusväli lyheee (piteee), jos havaitoje lukumäärää kasvatetaa (pieeetää). (vi) Luottamusväli lyheee (piteee), jos jakauma variassi σ pieeee (kasvaa). TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B Luottamusväli frekvessitulkita Normaalijakauma odotusarvo µ luottamusvälillä o seuraava frekvessitulkita: (i) Jos otataa jakaumasta N(µ, σ ) toistetaa, keskimääri 00 ( α) % otoksista kostruoiduista luottamusväleistä peittää parametri µ todellise arvo. (ii) Jos otataa jakaumasta N(µ, σ ) toistetaa, keskimääri 00 α % otoksista kostruoiduista luottamusväleistä ei peitä parametri µ todellista arvoa. Johtopäätökset luottamusvälistä Oletetaa, että olemme teheet johtopäätökse, että kostruoitu luottamusväli peittää odotusarvoparametri µ todellise arvo: (i) Luottamusväli kostruktiosta seuraa, että tehty johtopäätös o oikea 00 ( α) %:ssa tapauksia. (ii) Luottamusväli kostruktiosta seuraa, että tehty johtopäätös o väärä 00 α %:ssa tapauksia. Virheellise johtopäätökse mahdollisuutta ei saada häviämää, ellei luottamusväliä tehdä äärettömä leveäksi, jolloi väli ei eää sisällä iformaatiota odotusarvoparametri µ todellisesta arvosta. Vaatimukset luottamusvälille Olisi toivottavaa pystyä kostruoimaa parametrille µ mahdollisimma lyhyt luottamusväli, joho liittyvä luottamustaso olisi samaaikaisesti mahdollisimma korkea. Molempie vaatimuste samaaikaie täyttämie ei ole kuitekaa mahdollista, jos otoskoko pidetää kiiteää: (i) Luottamustaso kasvattamie pidetää luottamusväliä, jolloi tieto parametri µ todellise arvo sijaiista tulee epätarkemmaksi. (ii) Luottamusväli lyhetämie pieetää luottamustasoa, jolloi tieto parametri µ todellise arvo sijaiista tulee epävarmemmaksi. Otoskoo määräämie Oletetaa, että ormaalijakauma odotusarvoparametrille µ halutaa kostruoida luottamusväli, joka toivottu pituus o A. Tarvittava otoskoko saadaa kaavasta zα /σ = A TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B Normaalijakauma odotusarvo ja variassi luottamusvälit, ku jakauma variassi ei ole tuettu Otos ormaalijakaumasta Olkoo i, i =,,, yksikertaie satuaisotos ormaalijakaumasta N(µ, σ ). Tällöi satuaismuuttujat i, i =,,, ovat riippumattomia ja oudattavat samaa ormaalijakaumaa N(µ, σ ):,,, N( µσ, ), i =,,, i Normaalijakauma parametrie estimoiti Estimoidaa ormaalijakauma N(µ, σ ) parametrit µ ja σ iide harhattomilla estimaattoreilla: Havaitoje aritmeettie keskiarvo i i = = o odotusarvoparametri E() = µ harhato estimaattori. Havaitoje otosvariassi s = ( i ) i= o variassiparametri Var() = σ harhato estimaattori. Normaalijakauma odotusarvo luottamusväli, ku jakauma variassi ei ole tuettu Valitaa luottamustasoksi α Luottamustaso kiiittää todeäköisyyde, jolla kostruoitava luottamusväli peittää ormaalijakauma odotusarvo µ todellise arvo. Määrätää luottamuskertoimet t α/ ja +t α/ site, että α Pr( t tα /) = α Pr( t + tα /) = jossa satuaismuuttuja t oudattaa t-jakaumaa vapausastei ( ): t t( ) t-jakauma tiheysfuktio α/ α α/ t α/ 0 +t α/ TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B Site luottamuskertoimet t α/ ja +t α/ toteuttavat ehdo Pr( t t + t ) = α/ α/ α Normaalijakauma odotusarvoparametri µ luottamusväli luottamustasolla ( α) o tutemattoma variassi σ tapauksessa muotoa s s tα/, + tα/ jossa = havaitoje aritmeettie keskiarvo otoksessa s = otosvariassi = havaitoje lukumäärä t α/ ja +t α/ = luottamustasoo ( α) liittyvät luottamuskertoimet t-jakaumasta t( ) Luottamusväli kostruktio perustuu siihe, että µ t ( ) s/ Koska luottamusväli o symmetrie keskipisteesä suhtee, luottamusväli esitetää usei muodossa s ± tα / Luottamusväli pituus o s tα / Luottamusväli kostruktiosta seuraa, että s s Pr tα/ µ + tα/ = α Site luottamusväli peittää parametri µ todellise arvo todeäköisyydellä ( α) ja se ei peitä parametri µ todellista arvoa todeäköisyydellä α. TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B Odotusarvo luottamusväli omiaisuudet (i) Normaalijakauma odotusarvo µ luottamusväli keskipiste vaihtelee otoksesta toisee. (ii) Luottamusväli pituus vaihtelee otoksesta toisee. (iii) Luottamusväli pituus riippuu valitusta luottamustasosta ( α), havaitoje lukumäärästä ja otosvariassista s. (iv) Luottamusväli lyheee (piteee), jos luottamustasoa ( α) pieeetää (kasvatetaa). (v) Luottamusväli lyheee (piteee), jos havaitoje lukumäärää kasvatetaa (pieeetää). (vi) Luottamusväli lyheee (piteee), jos otosvariassi s pieeee (kasvaa). Odotusarvo luottamusväli frekvessitulkita Normaalijakauma odotusarvo µ luottamusvälillä o seuraava frekvessitulkita: (i) Jos otataa jakaumasta N(µ, σ ) toistetaa, keskimääri 00 ( α) % otoksista kostruoiduista luottamusväleistä peittää parametri µ todellise arvo. (ii) Jos otataa jakaumasta N(µ, σ ) toistetaa, keskimääri 00 α % otoksista kostruoiduista luottamusväleistä ei peitä parametri µ todellista arvoa. Johtopäätökset odotusarvo luottamusvälistä Oletetaa, että olemme teheet johtopäätökse, että kostruoitu luottamusväli peittää odotusarvoparametri µ todellise arvo: (i) Luottamusväli kostruktiosta seuraa, että tehty johtopäätös o oikea 00 ( α) %:ssa tapauksia. (ii) Luottamusväli kostruktiosta seuraa, että tehty johtopäätös o väärä 00 α %:ssa tapauksia. Virheellise johtopäätökse mahdollisuutta ei saada häviämää, ellei luottamusväliä tehdä äärettömä leveäksi, jolloi väli ei eää sisällä iformaatiota odotusarvoparametri µ todellisesta arvosta. TKK @ Ilkka Melli (006) 5/5
Mat-.60 Sovellettu todeäköisyyslasketa B Vaatimukset odotusarvo luottamusvälille Olisi toivottavaa pystyä kostruoimaa odotusarvoparametrille µ mahdollisimma lyhyt luottamusväli, joho liittyvä luottamustaso olisi samaaikaisesti mahdollisimma korkea. Molempie vaatimuste samaaikaie täyttämie ei ole kuitekaa mahdollista, jos otoskoko pidetää kiiteää: (i) Luottamustaso kasvattamie pidetää luottamusväliä, jolloi tieto parametri µ todellise arvo sijaiista tulee epätarkemmaksi. (ii) Luottamusväli lyhetämie pieetää luottamustasoa, jolloi tieto parametri µ todellise arvo sijaiista tulee epävarmemmaksi. Otoskoo määräämie Oletetaa, että ormaalijakauma odotusarvoparametrille µ halutaa kostruoida luottamusväli, joka toivottu pituus o A. Tarvittava otoskoko saadaa kaavasta jossa zα /σ = A z α/ = luottamustasoo ( α) liittyvä luottamuskerroi ormaalijakaumasta Normaalijakauma variassi luottamusväli Valitaa luottamustasoksi α Luottamustaso kiiittää todeäköisyyde, jolla kostruoitava luottamusväli peittää ormaalijakauma variassi σ todellise arvo. Määrätää luottamuskertoimet χ α / ja site, että α Pr( χ χ α /) = α Pr( χ χα /) = χ α / jossa satuaismuuttuja χ oudattaa χ -jakaumaa vapausastei ( ): χ χ ( ) α/ χ -jakauma tiheysfuktio α α/ Site luottamuskertoimet χ α / ja ehdo χ α / toteuttavat Pr( χ α/ χ χα/) = α χ α / χ α / TKK @ Ilkka Melli (006) 6/6
Mat-.60 Sovellettu todeäköisyyslasketa B Normaalijakauma variassiparametri σ luottamusväli luottamustasolla ( α) o muotoa jossa ( ) s ( ) s, χα/ χ α/ s = otosvariassi = havaitoje lukumäärä χ ja α / Luottamusväli kostruktio perustuu siihe, että ( ) s σ Luottamusväli pituus o χ α / = luottamustasoo ( α) liittyvät luottamuskertoimet χ -jakaumasta vapausastei ( ) χ ( ) ( ) s χ α/ χα/ Luottamusväli kostruktiosta seuraa, että ( ) s ( ) s Pr σ α = χα/ χ α/ Site kostruoitu luottamusväli peittää parametri σ todellise arvo todeäköisyydellä ( α) ja se ei peitä parametri σ todellista arvoa todeäköisyydellä α. Variassi luottamusväli omiaisuudet (i) Normaalijakauma variassi σ luottamusväli pituus vaihtelee otoksesta toisee. (ii) Luottamusväli pituus riippuu valitusta luottamustasosta ( α), havaitoje lukumäärästä ja otosvariassista s. (iii) Luottamusväli lyheee (piteee), jos luottamustasoa ( α) pieeetää (kasvatetaa). (iv) Luottamusväli lyheee (piteee), jos havaitoje lukumäärää pieeetää (kasvatetaa). (v) Luottamusväli lyheee (piteee), jos otosvariassi s pieeee (kasvaa). Variassi luottamusväli frekvessitulkita Normaalijakauma odotusarvo σ luottamusvälillä o seuraava frekvessitulkita: (i) Jos otataa jakaumasta N(µ,σ ) toistetaa, keskimääri 00 ( α) % otoksista kostruoiduista luottamusväleistä peittää parametri σ todellise arvo. TKK @ Ilkka Melli (006) 7/7
Mat-.60 Sovellettu todeäköisyyslasketa B (ii) Jos otataa jakaumasta N(µ,σ ) toistetaa, keskimääri 00 α % otoksista kostruoiduista luottamusväleistä ei peitä parametri σ todellista arvoa. Johtopäätökset variassi luottamusvälistä Oletetaa, että olemme teheet johtopäätökse, että kostruoitu luottamusväli peittää variassiparametri σ todellise arvo: (i) Luottamusväli kostruktiosta seuraa, että tehty johtopäätös o oikea 00 ( α) %:ssa tapauksia. (ii) Luottamusväli kostruktiosta seuraa, että tehty johtopäätös o väärä 00 α %:ssa tapauksia. Vaatimukset variassi luottamusvälille Olisi toivottavaa pystyä kostruoimaa variassiparametrille σ mahdollisimma lyhyt luottamusväli, joho liittyvä luottamustaso olisi samaaikaisesti mahdollisimma korkea. Vaatimuste samaaikaie täyttämie ei ole kuitekaa mahdollista: (i) Luottamustaso kasvattamie pidetää luottamusväliä, jolloi tieto parametri σ todellise arvo sijaiista tulee epätarkemmaksi. (ii) Luottamusväli lyhetämie pieetää luottamustasoa, jolloi tieto parametri σ todellise arvo sijaiista tulee epävarmemmaksi. Beroulli-jakauma odotusarvo luottamusväli Beroulli-jakauma Olkoo A o joki tapahtuma ja olkoo Pr( A) = p c Pr( A ) = p= q Määritellää satuaismuuttuja, jos A tapahtuu = 0, jos A ei tapahdu Tällöi satuaismuuttuja oudattaa Beroulli-jakaumaa parametriaa p = Pr(A) = E() Merkitää: Ber( p) TKK @ Ilkka Melli (006) 8/8
Mat-.60 Sovellettu todeäköisyyslasketa B Beroulli-jakauma pistetodeäköisyysfuktio o Otos Beroulli-jakaumasta Olkoo f x p p p x p x x ( ; ) = ( ), = 0,;0< < i, i =,,, yksikertaie satuaisotos Beroulli-jakaumasta Ber(p). Tällöi satuaismuuttujat i, i =,,, ovat riippumattomia ja oudattavat samaa Beroulli-jakaumaa Ber(p):,,, Ber( p), i =,,, i Beroulli-jakauma odotusarvoparametri estimoiti Estimoidaa Beroulli-jakauma Ber(p) odotusarvoparametri p se harhattomalla estimaattorilla: pˆ = i Koska ii i =, jos A tapahtuu i =, i =,,, 0, jos A ei tapahdu f pˆ = i = i= jossa f o tapahtuma A frekvessi otoksessa. Site Beroulli-jakauma odotusarvoparametri p estimaattori ˆp o tapahtuma A suhteellie frekvessi otoksessa. Huomaa, että f Bi(, p) Beroulli-jakauma odotusarvoparametri luottamusväli Valitaa luottamustasoksi α Luottamustaso kiiittää todeäköisyyde, jolla kostruoitava luottamusväli peittää Beroullijakauma odotusarvoparametri p todellise arvo. TKK @ Ilkka Melli (006) 9/9
Mat-.60 Sovellettu todeäköisyyslasketa B Määrätää luottamuskertoimet z α/ ja +z α/ site, että α Pr( z zα /) = α Pr( z + zα /) = jossa satuaismuuttuja z oudattaa stadardoitua ormaalijakaumaa: z N(0,) Site luottamuskertoimet z α/ ja +z α/ toteuttavat ehdo Pr( z z + z ) = α/ α/ α Beroulli-jakauma odotusarvoparametri p approksimatiivie luottamusväli luottamustasolla ( α) o muotoa jossa p ˆ( p ˆ ˆ) p ˆ( p ˆ) p zα/, pˆ + zα/ ˆp = odotusarvoparametri p harhato estimaattori = havaitoje lukumäärä z α/ ja +z α/ = luottamustasoo ( α) liittyvät luottamuskertoimet ormaalijakaumasta N(0,) Luottamusväli kostruktio perustuu siihe, että keskeise raja-arvolausee mukaa pˆ p a N(0,) pˆ( pˆ) / Koska luottamusväli o symmetrie keskipisteesä ˆp suhtee, luottamusväli esitetää usei muodossa 0.5 0.4 0.3 0. 0. 0 N(0,)-jakauma tiheysfuktio α/ α α/ z α/ 0 +z α/ pˆ ± z α / Luottamusväli pituus o pˆ( pˆ) z α / pˆ( pˆ) Luottamusväli kostruktiosta seuraa, että pˆ( pˆ) pˆ( pˆ) Pr pˆ z p pˆ + z = α / α / α a TKK @ Ilkka Melli (006) 0/0
Mat-.60 Sovellettu todeäköisyyslasketa B Site luottamusväli peittää parametri p todellise arvo approksimatiivisesti todeäköisyydellä ( α) ja se ei peitä parametri p todellista arvoa approksimatiivisesti todeäköisyydellä α. Luottamusväli omiaisuudet (i) (ii) Beroulli-jakauma odotusarvoparametri p luottamusväli keskipiste ˆp vaihtelee otoksesta toisee. Luottamusväli pituus vaihtelee otoksesta toisee. (iii) Luottamusväli pituus riippuu valitusta luottamustasosta ( α), havaitoje lukumäärästä ja estimaattorista ˆp. (iv) Luottamusväli lyheee (piteee), jos luottamustasoa ( α) pieeetää (kasvatetaa). (v) Luottamusväli lyheee (piteee), jos havaitoje lukumäärää kasvatetaa (pieeetää). (vi) Luottamusväli o lyhimmillää, ku pˆ 0 tai (vii) Luottamusväli o pisimmillää, ku p ˆ = Luottamusväli frekvessitulkita Beroulli-jakauma odotusarvoparametri p approksimatiivisella luottamusvälillä o seuraava frekvessitulkita: (i) Jos otataa jakaumasta Ber(p) toistetaa, keskimääri 00 ( α) % otoksista kostruoiduista luottamusväleistä peittää parametri p todellise arvo. (ii) Jos otataa jakaumasta Ber(p) toistetaa, keskimääri 00 α % otoksista kostruoiduista luottamusväleistä ei peitä parametri p todellista arvoa. Johtopäätökset luottamusvälistä Oletetaa, että olemme teheet johtopäätökse, että luottamusväli peittää odotusarvoparametri p todellise arvo: (i) Luottamusväli kostruktiosta seuraa, että tehty johtopäätös o oikea 00 ( α) %:ssa tapauksia. (ii) Luottamusväli kostruktiosta seuraa, että tehty johtopäätös o väärä 00 α %:ssa tapauksia. TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B Virheellise johtopäätökse mahdollisuutta ei saada häviämää, ellei luottamusväliä tehdä äärettömä leveäksi, jolloi väli ei eää sisällä iformaatiota odotusarvoparametri p todellisesta arvosta. Vaatimukset luottamusvälille Olisi toivottavaa pystyä kostruoimaa parametrille p mahdollisimma lyhyt luottamusväli, joho liittyvä luottamustaso olisi samaaikaisesti mahdollisimma korkea. Molempie vaatimuste samaaikaie täyttämie ei ole kuitekaa mahdollista, jos otoskoko pidetää kiiteää: (i) Luottamustaso kasvattamie pidetää luottamusväliä, jolloi tieto parametri p todellise arvo sijaiista tulee epätarkemmaksi. (ii) Luottamusväli lyhetämie pieetää luottamustasoa, jolloi tieto parametri p todellise arvo sijaiista tulee epävarmemmaksi. Otoskoo määräämie Oletetaa, että Beroulli-jakauma odotusarvoparametrille p halutaa kostruoida luottamusväli, joka toivottu pituus o A Tarvittava otoskoko saadaa kaavasta zα / p( p) = A Tarvittava otoskoko saavuttaa maksimisa ku zα / = p = A TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B Tehtävä 9.. Kolme tutkijaa A, B ja C ovat määrittäeet erää teollisuuslaitokse jätevesistä ph-arvoja tavoitteeaa estimoida jätevesie keskimääräie ph-arvo µ havaitoje perusteella. Määritykset tehtii keräämällä useita toisistaa riippumattomia vesiäytteitä ja määräämällä äytekohtaiste ph-arvoje keskiarvot. Tutkijoide saamat tulokset: Tutkija Näytteide lukumäärä ph-lukuje aritmeettie keskiarvo A 0 7.4 B 5 7.7 C 00 6. (a) (b) (c) Näytä, että estimaattorit A + B + C A, B, C ja ABC = 3 ovat harhattomia keskimääräiselle ph-arvolle µ. Mikä estimaattoreista o luotettavi siiä mielessä, että se variassi o piei? Näytä, että vielä pieempi variassi kui yhdelläkää ym. estimaattorilla o sellaisella estimaattorilla, joka saadaa laskemalla äytteide lukumäärillä paiotettu aritmeettie keskiarvo (ts. aritmeettie keskiarvo, joka saadaa yhdistämällä tutkijoide aieistot ja laskemalla yhdistety aieisto ph-lukuje aritmeettie keskiarvo). Tehtävä 9.. Mitä opimme? Tehtävässä vertaillaa todeäköisyysjakauma parametri erilaisia harhattomia estimaattoreita, estimaattoreide odotusarvoja ja variasseja. Tehtävä 9.. Ratkaisu: Jos i, i =,,, o yksikertaie satuaisotos jakaumasta, joka odotusarvo o µ ja variassi o σ, ii havaiot i, i =,,, ovat riippumattomia satuaismuuttujia, joilla o sama odotusarvo ja variassi:,,, E( i ) = µ, i =,,, Var( i ) = σ, i =,,, TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B Olkoo = i i = havaitoje i, i =,,, aritmeettie keskiarvo. Tällöi E( ) = µ σ Var( ) = (a)&(b) Estimaattorit A, B, C ja ABC ovat harhattomia, koska ja E( ) = E( ) = E( ) = µ A B C E( ABC ) = E ( A + B + C ) 3 = E( A ) E( B ) E( C ) 3 + + = ( µ + µ + µ ) = µ 3 Estimaattoreide A, B, C variassit ovat σ Var( A) = = 0.σ 0 σ Var( B) = = 0.067σ 5 σ Var( C ) = = 0.005σ 00 Estimaattoreista A, B, C luotettavi o estimaattori C, koska se variassi o piei, mikä johtuu siitä, että se perustuu suurimpaa äytteide lukumäärää. Koska estimaattorit A, B, C ovat riippumattomia, ii Var( ABC ) = Var ( A + B + C ) 3 = Var( A ) Var( B ) Var( C ) 9 + + σ σ σ = + + = 0.09σ 9 0 5 00 TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B Site estimaattori että luotettavita estimaattoria estimaattorissa ABC variassi o suurempi kui estimaattori C, mikä johtuu siitä, C epäluotettavammat estimaattorit. ABC yhtä suure paio kui estimaattori C A ja B saavat (c) Määritellää äytteide lukumäärillä paiotettu aritmeettie keskiarvo kaavalla 0 + 5 + 00 = 0 + 5 + 00 A B C Estimaattori o harhato parametrille µ, koska 0 5 00 E( ) = E( A) + E( B) + E( C) 5 5 5 0 5 00 = µ + µ + µ 5 5 5 = µ Estimaattori variassiksi saadaa aritmeettiste keskiarvoje A, B, C riippumattomuude takia: 5 = 0 5 + 00 + Var( ) = 0 Var( ) 5 Var( ) 00 Var( ) A + B + C 5 0 5 00 σ = = 0.0044σ 5 σ Site estimaattori variassi o pieempi kui estimaattoreide A, B, C ja ABC, mikä johtuu siitä, että estimaattorissa estimaattorit A, B, C ovat saaeet paioiksee iihi liittyvie havaitoje lukumäärät. Huomautuksia: (i) Todeäköisyysjakauma parametreilla o aia useita erilaisia harhattomia estimaattoreita; kaikilla iillä o siis yhtä suuret odotusarvot, mutta iide variassit eivät välttämättä ole yhtä suuria. (ii) Harhattomista estimaattoreita parhaimpaa voidaa pitää sitä, joka variassi o piei. Tätä vaatimusta o tapaa kutsua (täys-) tehokkuus- tai miimivariassisuuskriteeriksi. TKK @ Ilkka Melli (006) 5/5
Mat-.60 Sovellettu todeäköisyyslasketa B Tehtävä 9.. Satuaismuuttuja tiheysfuktio o f(x) = ( + θ)x θ, 0 < x < Kysymys: Miksi parametri θ pitää toteuttaa ehto θ >? Oletetaa, että satuaismuuttujasta o saatu havaiot 0.5, 0.3, 0., 0., 0. (a) Hahmottele tiheysfuktio kuvaaja parametri θ arvoilla 0.5, 0,, ja arvioi mikä arvoista sopisi parhaite havaitoihi. (b) Estimoi parametri θ momettimeetelmällä. (c) Estimoi parametri θ suurimma uskottavuude meetelmällä. (d) Vertaa parametri θ momettiestimaatoria ja suurimma uskottavuude estimaattoria toisiisa. Tehtävä 9.. Mitä opimme? Tehtävässä äytetää, että suurimma uskottavuude meetelmä ja momettimeeetelmä eivät välttämättä tuota samaa estimaattoria todeäköisyysjakauma parametreille. Tehtävä 9.. Ratkaisu: Koska f(x) o tiheysfuktio, se pitää toteuttaa ehto f ( x) 0,0< x< mikä toteutuu, jos + θ 0 Parametri arvo θ = ei kuitekaa käy, koska tällöi f ( x) 0,0< x< Site parametri θ o toteuttava ehto θ > Tämä ehto myös riittävä, koska tällöi + θ f( x) dx= ( + θ ) x dx= [ x ] 0 + θ 0 (a) Kuvio alla esittää tiheysfuktiota f(x) = ( + θ)x θ, 0 < x < ku θ = 0.5, 0,, TKK @ Ilkka Melli (006) 6/6
Mat-.60 Sovellettu todeäköisyyslasketa B Kuviosta ähdää, että havaiot sopivat parhaite jakaumaa, jossa θ < 0, koska tällöi suuri osa jakauma todeäköisyysmassasta keskittyy väli (0,) vasemmapuoleisee päähä kute havaiot. 5 4 θ = f(x) 3 θ = 0.5 θ = 0 0 0. 0.4 0.6 0.8 x θ = 0 (b) Estimoidaa parametri θ momettimeetelmällä. Määrätää esi satuaismuuttuja odotusarvo: + θ θ + θ = = + θ = = θ 0 0 + + θ E( ) xf ( x) dx x( ) x dx x + + θ Parametri θ momettiestimaattori θ ˆMM toteuttaa yhtälö jossa E( ) = i i = = o havaitoje aritmeettie keskiarvo. Site + θˆ = + θˆ MM MM TKK @ Ilkka Melli (006) 7/7
Mat-.60 Sovellettu todeäköisyyslasketa B Koska tarkastellussa otoksessa = xi = (0.5 + 0.3 + 0. + 0. + 0.) = 0.4 i = 5 ii saadaa yhtälö + θˆ MM 0.4 = + θˆ MM josta edellee θ ˆ MM = 0.684 (c) Estimoidaa parametri θ suurimma uskottavuude meetelmällä. Riippumattoma otokse i, i =,,, uskottavuusfuktio o L( θ; x, x,, x) = f( x, x,, x; θ) θ θ θ = ( + θ) x ( + θ) x ( + θ) x θ = ( + θ ) u missä u = xx x Parametri θ suurimma uskottavuude estimaattori θˆml saadaa maksimoimalla uskottavuusfuktio L(θ) parametri θ suhtee. Tämä tapahtuu etsimällä fuktio L derivaata ollakohdat: L = + u + + u = + + u = Site ˆ θ ML = log u josta saadaa θ ( θ) 0 ( θ) ( ( θ)log ) 0 ( θ)log 0 θ ˆ ML = 0.384 koska = 5 ja u = 0.0003. (d) Momettimeetelmä ja suurimma uskottavuude meetelmä tuottavat tässä eri tulokse. TKK @ Ilkka Melli (006) 8/8
Mat-.60 Sovellettu todeäköisyyslasketa B Huomautuksia: (i) (ii) Momettimeetelmä ja suurimma uskottavuude meetelmä saattavat tuottaa todeäköisyysjakauma parametreille eri estimaattorit. Hyvä estimaattori valita o vaikea ogelma; juuri se takia estimaattoreide vertailuu käytetää sellaisia hyvyysomiaisuuksia kute harhattomuus, tehokkuus, tyhjetävyys ja tarketuvuus. (iii) Suurimma uskottavuude estimaattorille voidaa hyvi yleisi ehdoi todistaa tyhjetävyys ja tarketuvuus sekä asymptoottie ormaalisuus. TKK @ Ilkka Melli (006) 9/9
Mat-.60 Sovellettu todeäköisyyslasketa B Tehtävä 9.3. Olkoot i, i =,,, riippumattomia, samaa ekspoettijakaumaa oudattavia satuaismuuttujia, joide odotusarvo E( i ) = β, ts. satuaismuuttujat i muodostavat yksikertaise satuaisotokse ekspoettijakaumasta, joka parametri o /β. Määrää parametri β suurimma uskottavuude estimaattori. Tehtävä 9.3. Mitä opimme? Tehtävässä tarkastellaa ekspoettijakauma parametri suurimma uskottavuude estimoitia. Tehtävä 9.3. Ratkaisu: Oletetaa, että i, i =,,, o yksikertaie satuaisotos ekspoettijakaumasta, joka parametria o /β. Site,,, i Exp(/β), i =,,, Otokse,,, uskottavuusfuktio o L( x, x,, x; β) = f( x; β) f( x; β) f( x; β) = exp x i β β i = jossa f ( xi; β ) = exp xi, i =,,, β β o havaitoo i liittyvä tiheysfuktio. Vastaava logaritmie uskottavuusfuktio o l( x, x,, x ; β) = log L( x, x,, x ; β) = x log( β) i β i = Suurimma uskottavuude estimaattori parametrille θ löydetää maksimoimalla logaritmise uskottavuusfuktio l parametri θ suhtee. Tämä tapahtuu derivoimalla logaritmie uskottavuusfuktio l parametri θ suhtee, merkitsemällä derivaatta ollaksi ja ratkaisemalla saatu ormaaliyhtälö parametri θ suhtee: lx (, x,, x; β ) = x 0 i = β β i= β Ratkaisuksi saadaa ˆ β = xi = x i= Saatu ratkaisu ataa logaritmise uskottavuusfuktio maksimi, mikä ähdää esim. sijoittamalla saatu ratkaisu logaritmise uskottavuusfuktio. derivaata lausekkeesee. TKK @ Ilkka Melli (006) 30/30
Mat-.60 Sovellettu todeäköisyyslasketa B Tehtävä 9.4. Tehdas väittää, että se valmistamista tuotteista korkeitaa 5 % o viallisia. Asiakas poimii tuotteide joukosta yksikertaise satuaisotokse, joka koko o 50 ja löytää 5 viallista tuotetta. Voidaako tehtaa väitettä vialliste suhteellisesta osuudesta pitää oikeutettua? Ohje: Määrää otoksesta 95 %: ja 99 %: luottamusvälit tehtaa väittämälle vialliste suhteelliselle osuudelle ja tee johtopäätös iide perusteella. Lisäkysymys: Mite valittu luottamustaso vaikuttaa luottamusväli pituutee? Tehtävä 9.4. Mitä opimme? Tehtävässä tarkastellaa Beroulli-jakauma odotusarvo luottamusväli määräämistä. Tehtävä 9.4. Ratkaisu: Tarkastellaa tapahtumaa A = {Satuaisesti valittu tuote o viallie} ja olkoo tapahtuma A todeäköisyys Pr( A) = p c Pr( A ) = p= q Määritellää satuaismuuttuja, jos satuaisesti valittu tuote o viallie = 0, jos satuaisesti valittu tuote ei ole viallie Tällöi satuaismuuttuja oudattaa Beroulli-jakaumaa parametriaa p = Pr(A) = E() Valmistettuje tuotteide joukosta poimittii yksikertaie satuaisotos, joka koko oli = 50 ja otoksessa havaittii 5 viallista tuotetta. Kostruoidaa otoksesta saatuje tietoje perusteella ( α) %: luottamusväli odotusarvoparametrille p. Luottamusväli o muotoa jossa pˆ ± z α / pˆ( pˆ) ˆp = odotusarvoparametri p harhato estimaattori = havaitoje lukumäärä z α/ ja +z α/ = luottamustasoo ( α) liittyvät luottamuskertoimet ormaalijakaumasta N(0,) Parametri p estimaatiksi saadaa f 5 pˆ = = = 0. 50 TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B Valitaa luottamustasoksi α = 0.95 Koska α = 0.05 luottamustasoa 0.95 vastaavat luottamuskertoimet ovat z = z α / 0.05 + z =+ z α / 0.05 Luottamuskertoimet zα/ = z0.05 ja + zα/ =+ z0.05 toteuttavat yhtälöt α Pr( z zα / ) = Pr( z z0.05) = = 0.05 α Pr( z + zα / ) = Pr( z z0.05) = = 0.05 jossa satuaismuuttuja z oudattaa stadardoitua ormaalijakaumaa: z N(0,) Site Pr( z z + z ) = Pr( z z + z ) = = 0.95 α/ α/ 0.05 0.05 α Stadardoidu ormaalijakauma N(0,) taulukoide mukaa z =.96 0.05 + z =+.96 0.05 Site 95 %: luottamusväli Beroulli-jakauma parametrille p o muotoa pˆ( pˆ) 0. ( 0.) pˆ ± zα / = 0.±.96 50 = 0.±.96 0.04 = 0.± 0.048 = (0.05,0.48) Väli ei peitä parametri p oletettua arvoa 0.05. Valitaa luottamustasoksi α = 0.99 Koska α = 0.0 luottamustasoa α = 0.99 vastaavat luottamuskertoimet ovat z = z α / 0.005 + z =+ z α / 0.005 TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B Luottamuskertoimet zα/ = z0.005 ja + zα/ =+ z0.005 toteuttavat yhtälöt α Pr( z zα / ) = Pr( z z0.005) = = 0.005 α Pr( z + zα / ) = Pr( z + z0.005) = = 0.005 jossa satuaismuuttuja z oudattaa stadardoitua ormaalijakaumaa: z N(0,) Site Pr( z z + z ) = Pr( z z + z ) = = 0.99 α/ α/ 0.005 0.005 α Stadardoidu ormaalijakauma N(0,) taulukoide mukaa z0.005 =+.58 + z0.005 =.58 Site 99 %: luottamusväli Beroulli-jakauma parametrille p o muotoa pˆ( pˆ) 0. ( 0.) pˆ ± zα / = 0.±.58 50 = 0.±.58 0.04 = 0.± 0.063 = (0.037,0.63) Väli peittää parametri p oletetu arvo 0.05. Site otoksesta saatu evidessi viittaa siihe suutaa, että valmistaja väitteesee voidaa kohdistaa joki verra epäilyjä. Asiaa tarkastellaa lisää tilastollise testaukse yhteydessä. Huomautuksia: (i) (ii) Luottamusväli leveee, jos luottamustasoa kasvatetaa, jolloi siitä tulee epäiformatiivisempi. Luottamusväli kapeee, jos otoskokoa kasvatetaa. (iii) Jos luottamusväli pituus halutaa puolittaa, pitää havaitoje lukumäärä elikertaistaa. TKK @ Ilkka Melli (006) 33/33
Mat-.60 Sovellettu todeäköisyyslasketa B Tehtävä 9.5. Tehdas valmistaa ruuveja. Ruuvie paio vaihtelee satuaisesti oudattae ormaalijakaumaa. Ruuvie joukosta poimittii yksikertaie satuaisotos. Otoskeskiarvoksi saatii tällöi 5 g. Tehdää (epärealistie) oletus, että ormaalijakauma variassi 0.5 g o tuettu. Määrää 99 %: luottamusvälit ruuvie paio odotusarvolle, jos otoskokoa oli (a) (b) 00 (c) 0000 Vertaa saatuje luottamusvälie pituuksia toisiisa. Mite luottamusväli pituus käyttäytyy otoskoo fuktioa? Tehtävä 9.5. Mitä opimme? Tehtävässä tarkastellaa ormaalijakauma odotusarvo luottamusväli määräämistä (epärealistisessa) tilateessa, jossa jakauma variassi oletetaa tuetuksi. Normaalijakauma odotusarvo luottamusväli määräämistä esimerkkitapauksessa, jossa jakauma variassia ei oleteta tuetuksi käsitellää tehtävässä 9.6. Tehtävä 9.5. Ratkaisu: Tehdas valmistaa ruuveja. Ruuvie paio vaihtelee satuaisesti oudattae ormaalijakaumaa. Ruuvie joukosta poimittii yksikertaie satuaisotos, joka koko oli. Määritellää satuaismuuttujat i = Ruuvi i paio otoksessa, i =,,, Oletuksie mukaa,,, N( µσ, ), i =,,, jossa variassi i σ = 0.5 g o tuettu. Otoksee poimittuje ruuvie paioje aritmeettie keskiarvo oli = = 5 g i = i TKK @ Ilkka Melli (006) 34/34
Mat-.60 Sovellettu todeäköisyyslasketa B Kostruoidaa otoksesta saatuje tietoje perusteella ( α) %: luottamusväli odotusarvoparametrille µ. Koska variassi σ oletettii tuetuksi, luottamusväli o muotoa jossa ± z α / σ = havaitoje aritmeettie keskiarvo otoksessa σ = jakauma variassi = havaitoje lukumäärä z α/ ja +z α/ = luottamustasoo ( α) liittyvät luottamuskertoimet ormaalijakaumasta N(0,) Valitaa luottamustasoksi α = 0.99 Koska α = 0.0 luottamustasoa α = 0.99vastaavat luottamuskertoimet ovat zα / = z0.005 + z =+ z α / 0.005 Luottamuskertoimet zα/ = z0.005 ja + zα/ =+ z0.005 toteuttavat yhtälöt α Pr( z zα / ) = Pr( z z0.005) = = 0.005 α Pr( z + zα / ) = Pr( z + z0.005) = = 0.005 jossa satuaismuuttuja z oudattaa stadardoitua ormaalijakaumaa: z N(0,) Site Pr( z z + z ) = Pr( z z + z ) = = 0.99 α/ α/ 0.005 0.005 α Stadardoidu ormaalijakauma N(0,) taulukoide mukaa z0.005 =.58 + z =+.58 0.005 Site 99 %: luottamusväli ormaalijakauma odotusarvoparametrille µ o muotoa σ 0.5 ± zα / = 5 ±.58 TKK @ Ilkka Melli (006) 35/35
Mat-.60 Sovellettu todeäköisyyslasketa B (a) = : Luottamusväliksi saadaa σ 0.5 ± zα / = 5 ±.58 = 5 ±.9 = (3.7, 6.9) (b) = 00: Luottamusväliksi saadaa σ 0.5 ± zα / = 5 ±.58 = 5 ± 0.9 = (4.87, 5.9) 00 (c) = 0000: Luottamusväliksi saadaa σ 0.5 ± z α / = 5 ±.58 = 5 ± 0.09 = (4.987, 5.09) 0000 0000 Jos otataa toistetaa, ii luottamustaso frekvessitulkia mukaa otoksista kostruoidut luottamusvälit peittävät (keskimääri) 99 %:ssa otoksia parametri µ tutemattoma arvo ja (keskimääri) %:ssa otoksia ei sitä tee. Huomautuksia: (i) Luottamusväli leveee, jos luottamustasoa kasvatetaa, jolloi siitä tulee epäiformatiivisempi. (ii) Luottamusväli kapeee, jos otoskokoa kasvatetaa. (iii) Jos luottamusväli pituus halutaa puolittaa, pitää havaitoje lukumäärä elikertaistaa. (iv) Luottamuskertoimet pitää valita ormaalijakauma sijasta t-jakaumasta, jos variassi σ ei ole tuettu ja se joudutaa estimoimaa otoksesta. Näi saatava estimoituu variassii σ perustuva luottamusväli o leveämpi kui tässä kostruoitu tuettuu variassii σ perustuva luottamusväli; ks. tehtävää 9.6. Jos havaitoje lukumäärä aetaa kasvaa rajatta, estimoituu variassii σ perustuva luottamisväli lähestyy tuettuu variassii σ perustuvaa luottamusväliä. TKK @ Ilkka Melli (006) 36/36
Mat-.60 Sovellettu todeäköisyyslasketa B Tehtävä 9.6. Tehdas valmistaa auloja. Nauloje pituus vaihtelee satuaisesti oudattae ormaalijakaumaa. Nauloje joukosta poimittii yksikertaie satuaisotos, joka koko oli 30. Otoskeskiarvoksi saatii 9.99 cm ja otosvariassiksi 0.0 cm. (a) Määrää 95 %: luottamusväli auloje pituude odotusarvolle. (b) Määrää 90 %: luottamusväli auloje pituude variassille. Tehtävä 9.6. Mitä opimme? Tehtävässä tarkastellaa ormaalijakauma odotusarvo ja variassi luottamusväli määräämistä tilateessa, jossa jakauma variassi ei ole tuettu. Normaalijakauma odotusarvo luottamusväli määräämistä esimerkkitapauksessa, jossa jakauma variassi o tuettu käsitellää tehtävässä 9.5. Tehtävä 9.6. Ratkaisu: (a) Tehdas valmistaa auloja. Nauloje pituus vaihtelee satuaisesti oudattae ormaalijakaumaa. Nauloje joukosta poimittii yksikertaie satuaisotos, joka koko oli 30. Määritellää satuaismuuttujat i = Naula i pituus otoksessa, i =,,, = 30 Oletuksie mukaa,,, N(, ), i =,,,30 30 i µσ Otoksee poimittuje ruuvie paioje aritmeettie keskiarvo oli 30 = i = 9.99 cm 30 i= ja otosvariassi oli 30 s = ( i ) = 0.0 cm 30 i= TKK @ Ilkka Melli (006) 37/37
Mat-.60 Sovellettu todeäköisyyslasketa B Kostruoidaa otoksesta saatuje tietoje perusteella ( α) %: luottamusväli odotusarvoparametrille µ. Koska variassi σ oletettii tutemattomaksi, luottamusväli o muotoa s ± tα / jossa = havaitoje aritmeettie keskiarvo otoksessa s = otosvariassi = havaitoje lukumäärä t α/ ja +t α/ = luottamustasoo ( α) liittyvät luottamuskertoimet t-jakaumasta t( ) Valitaa luottamustasoksi α = 0.95 Koska α = 0.05 luottamustasoa α = 0.95vastaavat luottamuskertoimet ovat tα / = t0.05 + t =+ t α / 0.05 Luottamuskertoimet tα/ = t0.05 ja + tα/ =+ t0.05 toteuttavat yhtälöt α Pr( t tα / ) = Pr( t t0.05) = = 0.05 α Pr( t + tα / ) = Pr( t + t0.05) = = 0.05 jossa satuaismuuttuja t oudattaa t-jakaumaa vapausastei ( ) = 9: t t( ) = t(9) Site Pr( t t + t ) = Pr( t t + t ) = = 0.95 α/ α/ 0.05 0.05 α t-jakauma t(9) taulukoide mukaa t0.05 =.045 + t =+.045 0.05 Site 95 %: luottamusväli ormaalijakauma odotusarvoparametrille µ o muotoa s 0. ± tα / = 9.99 ±.045 30 = 9.99 ± 0.037 = (9.953,0.07) TKK @ Ilkka Melli (006) 38/38
Mat-.60 Sovellettu todeäköisyyslasketa B Jos otataa toistetaa, ii luottamustaso frekvessitulkia mukaa otoksista kostruoidut luottamusvälit peittävät (keskimääri) 95 %:ssa otoksia parametri µ tutemattoma arvo ja (keskimääri) 5 %:ssa otoksia ei sitä tee. Huomautuksia: (i) Luottamusväli leveee, jos luottamustasoa kasvatetaa, jolloi siitä tulee epäiformatiivisempi. (ii) Luottamusväli kapeee, jos otoskokoa kasvatetaa. (iii) Jos luottamusväli pituus halutaa puolittaa, pitää havaitoje lukumäärä elikertaistaa. (iv) Luottamuskertoimet voidaa valita t-jakauma sijasta ormaalijakaumasta, jos variassi σ o tuettu. Näi saatava tuettuu variassii σ perustuva luottamusväli o kapeampi kui tässä kostruoitu estimoituu variassii σ perustuva luottamusväli; ks. tehtävää 9.5. Jos havaitoje lukumäärä aetaa kasvaa rajatta, estimoituu variassii σ perustuva luottamisväli lähestyy tuettuu variassii σ perustuvaa luottamusväliä. (b) Tehdas valmistaa auloja. Nauloje pituus vaihtelee satuaisesti oudattae ormaalijakaumaa. Nauloje joukosta poimittii yksikertaie satuaisotos, joka koko oli 30. Määritellää satuaismuuttujat i = Naula i pituus otoksessa, i =,,, = 30 Oletuksie mukaa,,, N(, ), i =,,,30 30 i µσ Otoksee poimittuje ruuvie paioje aritmeettie keskiarvo oli 30 = i = 9.99 cm 30 i= ja otosvariassi oli 30 s = ( i ) = 0.0 cm 30 i= TKK @ Ilkka Melli (006) 39/39
Mat-.60 Sovellettu todeäköisyyslasketa B Kostruoidaa otoksesta saatuje tietoje perusteella ( α) %: luottamusväli variassiparametrille σ. Luottamusväli o muotoa ( ) s ( ) s, χα/ χ α/ jossa s = otosvariassi = havaitoje lukumäärä χ ja α / χ α / = luottamustasoo ( α) liittyvät luottamuskertoimet χ -jakaumasta vapausastei ( ) Valitaa luottamustasoksi α = 0.90 Koska α = 0.0 luottamustasoa α = 0.90vastaavat luottamuskertoimet ovat χ α / = χ0.95 χ = χ α / 0.05 Luottamuskertoimet χ = χ ja χ = χ toteuttavat yhtälöt α/ 0.95 α/ 0.05 α Pr( χ χ α /) = Pr( χ χ0.95) = = 0.05 α Pr( χ χα / ) = Pr( χ χ0.05) = = 0.05 jossa satuaismuuttuja χ oudattaa χ -jakaumaa vapausastei ( ) = 9: Site χ χ ( ) = χ (9) Pr( χ χ χ ) = Pr( χ χ χ ) = α = 0.90 α/ α/ 0.95 0.05 χ -jakauma χ (9) taulukoide mukaa χ α / = 7.708 χ = 4.557 α / Site 90 %: luottamusväli ormaalijakauma variassiparametrille σ o muotoa ( ) s ( ) s (30 ) 0.0 (30 ) 0.0,, (0.0068, 0.064) = = χα/ χ α/ 4.557 7.708 TKK @ Ilkka Melli (006) 40/40
Mat-.60 Sovellettu todeäköisyyslasketa B Jos otataa toistetaa, ii luottamustaso frekvessitulkia mukaa otoksista kostruoidut luottamusvälit peittävät (keskimääri) 90 %:ssa otoksia parametri σ tutemattoma arvo ja (keskimääri) 0 %:ssa otoksia ei sitä tee. Huomautuksia: (i) (ii) Luottamusväli leveee, jos luottamustasoa kasvatetaa, jolloi siitä tulee epäiformatiivisempi. Luottamusväli pituus pysyy suuillee samamittaisea, jos otoskokoa kasvatetaa. TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B Tehtävä 9.7. Kutaa suuitellaa ydivoimalaa. Kua asukkaide mielipiteet halutaa selvittää yksikertaisee satuaisotataa perustuvalla kyselytutkimuksella. Kuika suuri otos kutalaiste joukosta o poimittava, jotta saataisii 99 %: varmuus siitä, että otoksesta laskettu voimala raketamise kaattajie suhteellie osuus ei poikkea eempää kui 0.5 %-yksikköä voimala raketamise kaattajie todellisesta suhteellisesta osuudesta? Tehtävä 9.7. Mitä opimme? Tehtävässä tarkastellaa tarvittava otoskoo määräämistä, ku Beroulli-jakauma odotusarvoparametrille halutaa saada tiety mittaie luottamusväli. Tehtävä 9.7. Ratkaisu: Tarkastellaa tapahtumaa A = {Satuaisesti valittu kua asukas kaattaa voimala raketamista} ja olkoo tapahtuma A todeäköisyys Pr( A) = p c Pr( A ) = p= q Määritellää satuaismuuttuja, jos satuaisesti valittu kua asukas kaattaa voimala raketamista = 0, jos satuaisesti valittu kua asukas ei kaata voimala raketamista Oletetaa, että satuaismuuttuja oudattaa Beroulli-jakaumaa parametriaa p = Pr(A) = E() Jos kuassa o N asukasta, pn = F o voimala raketajie lukumäärä kaikkie kua asukkaide joukossa. Site odotusarvoparametri F p = N voidaa tulkita voimala raketamise kaattajie suhteelliseksi osuudeksi kaikkie kua asukkaide joukossa. Oletetaa, että kua asukkaide joukosta poimitaa yksikertaie satuaisotos, joka koko. Jos voimala raketamise kaattajie lukumäärä otoksessa o f, ii kaattajie suhteellie osuus otoksessa f pˆ = o odotusarvoparametri p harhato estimaattori. TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B Beroulli-jakauma odotusarvoparametri p luottamusväli o muotoa jossa pˆ ± z α / pˆ( pˆ) ˆp = odotusarvoparametri p harhato estimaattori = havaitoje lukumäärä z α/ ja +z α/ = luottamustasoo ( α) liittyvät luottamuskertoimet ormaalijakaumasta N(0,) Site Beroulli-jakauma parametri p luottamusväli o muotoa ˆp ± a jossa ˆp o otoksesta laskettu suhteellie osuus. Jos haluamme parametrille p luottamusväli, joka pituus o a, voimme muodostaa otoskoo ratkaisemiseksi yhtälö pˆ( pˆ) zα / Ratkaisuksi saadaa = a zα / pˆ( pˆ) = a Jos otoskooksi valitaa piei kaava atamaa lukuarvoa suuremmista kokoaisluvuista, saadaa haluttu varmuus siitä, että voimala raketamise kaattajie suhteellie osuus kaikkie kutalaiste joukossa o otoksesta kostruoidu luottamusväli sisällä. Koska ˆp : arvoa ei tueta ( ˆp : arvo saadaa tietysti selville vasta otokse poimimise jälkee), o järkevää korvata ˆp luvulla, joka maksimoi tarvittava otoskoo. Fuktio f (ˆ) p = pˆ( pˆ) o alaspäi aukeava paraabeli, joka saavuttaa maksimisa pisteessä p ˆ = Site (maksimaalie) tarvittava otoskoko saadaa kaavasta zα / = a Tehtävässä a = 0.005 α = 0.99 z α/ =.58 TKK @ Ilkka Melli (006) 43/43
Mat-.60 Sovellettu todeäköisyyslasketa B Site tarvittava otoskoko o Kommetteja: (i) (ii) zα /.58 = = = 66564 a 0.005 Jos haluamme äi kapea luottamisväli (±0.5 %) äi korkealla luottamustasolla (99 %) voimala raketajie suhteelliselle osuudelle kaikkie kua asukkaide joukossa, tarvitsemme otokse, joka o paljo suurempi ( > 60000 asukasta) kui kyselytutkimuksissa tavallisesti käytetyt otokset (. 500-000). Olemme siis saaeet paradoksaalise tulokse, että tarvittava otoskoko ylittäisi useimmissa Suome kuissa kua asukasluvu! Tämä o se hita, joka joudumme maksamaa otokse poimitaa liittyvästä sattumasta ja asetusta tarkkuusvaatimuksesta. Tavallisesti kyselytutkimuksissa käytetää otoskokoja 500-000 ja 95 %: luottamustasoa. Suhteellise osuude luottamusväli pituus o a= z α / pˆ( pˆ) Jos tässäki korvaamme (ee otokse poimitaa tutemattoma) suhteellise osuude ˆp lukuarvolla, joka maksimoi fuktio f (ˆ) p = pˆ( pˆ) saamme luottamusväli maksimipituudeksi a= zα / 4 Jos luottamustasoa o α = 0.95 ii α/ = 0.05 ja ormaalijakauma taulukoide mukaa z α/ =.96 Jos siis otoskoko vaihtelee välillä [500,000], ii 95 %: luottamusväli pituus vaihtelee välillä ( 0.0, 0.044) Tästä ähdää se, että tyypillisissä vaalikyselyissä puolueide todellisii kaatusosuuksii liittyvä epävarmuus o huomattava suurta. TKK @ Ilkka Melli (006) 44/44
Mat-.60 Sovellettu todeäköisyyslasketa B Tehtävä 9.8. Tölkitety tuoremehu C-vitamiiipitoisuus (mg/dl) vaihtelee joki verra valmistuserästä toisee oudattae ormaalijakaumaa. Laboratorio haluaa selvittää erää tuoremehumerki keskimääräise C-vitamiiipitoisuude mittaamalla pitoisuudet myyissä olevie tuoremehutölkkie joukosta poimitusta yksikertaisesta satuaisotoksesta. Laboratorio haluaa ii tarka arvio C-vitamiiipitoisuudesta, että voidaa 95 %: varmuudella tehdä johtopäätös, että otoksesta laskettu keskimääräie C-vitamiiipitoisuus ei poikkea todellisesta keskimääräisestä C-vitamiiipitoisuudesta eempää kui 0.5 mg. Määrää tarvittava otoskoko, ku aikaisempie tutkimuste perusteella tiedetää, että C- vitamiiipitoisuude otoskeskihajota o tavallisesti. mg. Tehtävä 9.8. Mitä opimme? Tehtävässä tarkastellaa tarvittava otoskoo määräämistä, ku ormaalijakauma odotusarvoparametrille halutaa saada tiety mittaie luottamusväli. Tehtävä 9.8. Ratkaisu: Oletetaa, että tölkitety tuoremehu C-vitamiiipituus vaihtelee satuaisesti valmistuserästä toisee oudattae ormaalijakaumaa. Määritellää satuaismuuttujat = Tuoremehu C-vitamiiipitoisuus (mg/dl) Oletamme, että N( µ, σ ) Oletetaa, että tölkkie joukosta poimitaa yksikertaie satuaisotos, joa koko o. Kostruoidaa otoksesta saatuje tietoje perusteella ( α) %: luottamusväli odotusarvoparametrille µ. Koska variassi σ o oletettu tuetuksi, luottamusväli o muotoa jossa ± z α / σ = havaitoje aritmeettie keskiarvo otoksessa σ = variassi = havaitoje lukumäärä z α/ ja +z α/ = luottamustasoo ( α) liittyvät luottamuskertoimet stadardoidusta ormaalijakaumasta N(0,) Site odotusarvo µ luottamusväli o muotoa M ± a jossa M o havaitoje aritmeettie keskiarvo otoksessa. Jos haluamme parametrille µ luottamusväli, joka pituus o a, voimme muodostaa otoskoo ratkaisemiseksi yhtälö a= z α / σ TKK @ Ilkka Melli (006) 45/45