Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Mat-.09 Sovellettu todeäköisyyslasku Mat-.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Estimoiti Luottamusvälit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Estimaattori, Estimoiti, Frekvessi, Harhato estimaattori, χ -jakauma, Luottamustaso, Luottamuskerroi, Momettimeetelmä, Normaalijakauma, Odotusarvo, Otatajakauma, Otos, Otoskoko, Otosvariassi, Riippumattomuus, Stadardoitu ormaalijakauma, Suhteellie frekvessi, Suhteellie osuus, Suurimma uskottavuude meetelmä, Todeäköisyys, Uskottavuusfuktio, Variassi, Yksikertaie satuaisotos. Kolme tutkijaa A, B ja ovat määrittäeet erää teollisuuslaitokse jätevesistä ph-arvoja tavoitteeaa estimoida jätevesie keskimääräie ph-arvo µ havaitoje perusteella. Määritykset tehtii ottamalla useita toisistaa riippumattomia vesiäytteitä ja määräämällä äytekohtaiste ph-arvoje keskiarvot. Tutkijoide saamat tulokset: Tutkija Näytteide lukumäärä ph-lukuje aritmeettie keskiarvo A 0 7.4 B 5 7.7 00 6. (a) Näytä, että estimaattorit X A + XB + X X A, XB, X ja X AB = 3 ovat harhattomia keskimääräiselle ph-arvolle µ. (b) Mikä estimaattoreista o luotettavi siiä mielessä, että se variassi o piei? (c) Näytä, että vielä pieempi kui yhdelläkää ym. estimaattori variassi o estimaattorilla, joka saadaa laskemalla äytteide lukumäärillä paiotettu aritmeettie keskiarvo (ts. aritmeettie keskiarvo, joka saadaa yhdistämällä tutkijoide aieistot ja laskemalla yhdistety aieisto ph-lukuje aritmeettie keskiarvo). Olkoo X, X,, X yksikertaie satuaisotos jakaumasta, joka odotusarvo o µ ja variassi o. TKK/SAL @ Ilkka Melli (004) /3

Mat-.09 Sovellettu todeäköisyyslasku Olkoo X = X i i = havaitoje X, X,, X aritmeettie keskiarvo. Tällöi E( X ) = µ Var( X ) = (a)&(b) Kaikki estimaattorit ovat harhattomia, koska E( X ) = E( X ) = E( X ) = µ ja A B E( X AB ) = E ( X A + XB + X ) 3 = E( X A ) E( XB ) E( X ) 3 + + = ( µ + µ + µ ) = µ 3 Estimaattoreide variassit ovat Var( X A) = = 0. 0 Var( X B) = = 0.067 5 Var( X ) = = 0.005 00 Näistä estimaattoreista luotettavi o X, mikä johtuu siitä, että se perustuu suurimpaa äytteide lukumäärää. Estimaattori X AB variassi o suurempi kui estimaattori X : Var( X AB ) = Var ( X A + XB + X ) 3 = Var( X A ) Var( XB ) Var( X ) 9 + + = + + = 0.09 9 0 5 00 TKK/SAL @ Ilkka Melli (004) /3

Mat-.09 Sovellettu todeäköisyyslasku Tämä johtuu siitä, että luotettavita estimaattoria X epäluotettavammat estimaattorit X A ja X B saavat estimaattorissa X AB yhtä suure paio kui estimaattori X. Huomautus: Estimaattori X AB variassia määrättäessä o käytetty hyväksi sitä, että satuaismuuttujie summa variassi o variassie summa, jos satuaismuuttujat ovat riippumattomia, mikä o tässä totta, koska äytteet oletettii riippumattomiksi. (c) Määritellää äytteide lukumäärillä paiotettu aritmeettie keskiarvo X kaavalla 0X + 5X + 00X X = 0 + 5 + 00 A B Estimaattori X o harhato parametrille µ, koska 0 5 00 E( X ) = E( X A) + E( XB) + E( X) 5 5 5 0 5 00 = µ + µ + µ 5 5 5 = µ Estimaattori X variassiksi saadaa aritmeettiste keskiarvoje X A, XB, X riippumattomuude takia: X 5 X X X 0 5 00 = + + Var( ) = 0 Var( ) 5 Var( ) 00 Var( ) A + B + 5 0 5 00 = = 0.0044 5 Estimaattori X variassi o pieempi kui estimaattoreide X A, XB, X ja X AB. Tämä johtuu siitä, että estimaattorissa X estimaattorit X A, XB, X o paiotettu sopivasti iihi liittyvie havaitoje lukumäärillä. Opetus: Parametrilla saattaa olla useita erilaisia harhattomia estimaattoreita, joide odotusarvot ovat siis yhtä suuria, mutta variassit eivät ole. Jos parametrilla o useita erilaisista harhattomista estimaattoreita, iistä parhaimpaa voidaa pitää sitä, joka variassi o piei. Tätä vaatimusta kutsutaa miimivariassisuus-kriteeriksi. TKK/SAL @ Ilkka Melli (004) 3/3

Mat-.09 Sovellettu todeäköisyyslasku. Olkoot X i, i =,,, riippumattomia, samaa ekspoettijakaumaa oudattavia satuaismuuttujia, joide odotusarvo E(X i ) = β, ts. satuaismuuttujat X i muodostavat yksikertaise satuaisotokse ekspoettijakaumasta parametrilla /β. Määrää parametri β suurimma uskottavuude estimaattori. Merkitöjä: Satuaismuuttuja X i tiheysfuktio: f(x i ; β) Otokse X, X,, X yhteisjakauma tiheysfuktio: f(x, x,, x ; β) Uskottavuusfuktio: L(β ; x, x,, x ) = f(x, x,, x ; β) Logaritmie uskottavuusfuktio: l(β ; x, x,, x ) = log L(β ; x, x,, x ) Parametri β suurimma uskottavuude estimaattori saadaa maksimoimalla uskottavuusfuktio β: suhtee. Koska logaritmifuktio o mootoie fuktio, voidaa maksimi atava β: arvo etsiä yhtäpitävästi logaritmoidusta uskottavuusfuktiosta. Maksimi löydetää etsimällä logaritmise uskottavuusfuktio derivaata ollakohdat: f( xi; β ) = exp xi, i=,,, β β L( x, x,, x; β) = f( x; β) f( x; β) f( x; β) = exp x i β β i= l( x, x,, x ; β) = log L( x, x,, x ; β) = x log( β) i β i= (,,, ; β) = x 0 i = β β i= β lx x x ˆ β = xi = x i= Kyseessä o todellaki uskottavuusfuktio maksimi atava β: arvo, mikä ähdää esim. sijoittamalla saatu ratkaisu logaritmise uskottavuusfuktio. derivaata lausekkeesee. TKK/SAL @ Ilkka Melli (004) 4/3

Mat-.09 Sovellettu todeäköisyyslasku 3. Satuaismuuttuja X tiheysfuktio o f(x) = ( + θ)x θ, 0 < x < Kysymys: Miksi parametri θ pitää toteuttaa ehto θ >? Oletetaa, että satuaismuuttujasta X o saatu havaiot 0.5, 0.3, 0., 0., 0.. (a) Hahmottele tiheysfuktio kuvaaja parametri θ arvoilla 0.5, 0,, ja arvioi mikä arvoista sopisi parhaite havaitoihi. (b) Estimoi θ momettimeetelmällä. (c) Estimoi θ suurimma uskottavuude meetelmällä. (d) Vertaa estimoii tuloksia (b)- ja (c)-kohdissa. Koska f(x) o tiheysfuktio, se o toteutettava ehto: 0 0 + θ 0 θ f( x) dx= ( + θ ) x dx= x = mikä o mahdollista vai, jos + θ > 0 Site parametri θ o toteutettava ehto θ > (a) Kuvio alla esittää tiheysfuktiota f(x) = ( + θ)x θ, 0 < x < parametri θ arvoilla 0.5, 0,,. 5 4 θ = f(x) 3 θ = 0.5 θ = 0 0 0. 0.4 0.6 0.8 x θ = 0 TKK/SAL @ Ilkka Melli (004) 5/3

Mat-.09 Sovellettu todeäköisyyslasku Havaiot sopivat selvästi parhaite jakaumaa, jossa θ < 0, koska tällöi suuri osa jakauma todeäköisyysmassasta keskittyy väli (0,) vasemmapuoleisee päähä kute havaiot. (b) Parametri θ estimoiti momettimeetelmällä. Määrätää esi satuaismuuttuja X odotusarvo: 0 + θ θ + θ + θ E( X) = x( + θ ) x dx = x = + θ + θ Parametri θ momettiestimaattori ˆMM θ toteuttaa yhtälö 0 jossa E( X ) = X X X i i = = o havaitoje aritmeettie keskiarvo. Site + ˆ θ MM X = + ˆ θ MM Koska tarkastellussa otoksessa X = 0.4 ii saadaa yhtälö + ˆ θ MM 0.4 = + ˆ θ MM josta edellee ˆ θ MM = 0.684 (c) Parametri θ estimoiti suurimma uskottavuude meetelmällä. Riippumattoma otokse X, X,, X uskottavuusfuktio o L( θ; x, x,, x) = f( x, x,, x; θ) θ θ θ = ( + θ) x ( + θ) x ( + θ) x θ = ( + θ ) u missä u = xx x TKK/SAL @ Ilkka Melli (004) 6/3

Mat-.09 Sovellettu todeäköisyyslasku Parametri θ suurimma uskottavuude estimaattori ˆML θ saadaa maksimoimalla uskottavuusfuktio L(θ) parametri θ suhtee. Tämä tapahtuu etsimällä fuktio L derivaata ollakohdat: L = + u + + u = + + u = θ ( θ) 0 ( θ) ( ( θ)log ) 0 ( θ)log 0 Site ˆ θ ML = log u josta saadaa ˆ θ ML = 0.384 koska = 5 ja u = 0.0003. (d) Momettimeetelmä ja suurimma uskottavuude meetelmä tuottavat eri tulokse. Opetus: Momettimeetelmä ja suurimma uskottavuude meetelmä saattavat tuottaa eri estimaattori parametrille. Hyvä estimaattori valita o vaikea ogelma; juuri se takia estimaattoreide vertailuu käytetää iide hyvyysomiaisuuksia kute harhattomuus, miímivariassisuus, tyhjetävyys, tarketuvuus. Suurimma uskottavuude estimaattorille voidaa hyvi yleisi ehdoi todistaa tyhjetävyys ja tarketuvuus sekä asymptoottie ormaalisuus. 4. Tehdas väittää, että se valmistamista tuotteista korkeitaa 5 % o viallisia. Asiakas poimii tuotteide joukosta yksikertaise satuaisotokse, joka koko o 50 ja löytää 5 viallista tuotetta. Voidaako tehtaa väitettä vialliste suhteellisesta osuudesta pitää oikeutettua? Ohje: Määrää otoksesta 95 %: ja 99 %: luottamusvälit tehtaa väittämälle vialliste suhteelliselle osuudelle. Kysymys: Mite valittu luottamustaso vaikuttaa luottamusväli pituutee? Olkoo tapahtuma A = {Satuaisesti valittu tuote o viallie} ja olkoo tapahtuma A todeäköisyys Pr(A) = p Määritellää satuaismuuttuja X = Tapahtuma A havaittu frekvessi otoksessa, joka koko o TKK/SAL @ Ilkka Melli (004) 7/3

Mat-.09 Sovellettu todeäköisyyslasku Tiedämme, että (aiaki approksimatiivisesti) X ~ Bi(, p) Määritellää tapahtuma A havaittu suhteellie frekvessi (osuus): P = X/ Parametri p (= tapahtuma A todeäköisyys) luottamusväli saadaa käyttämällä hyväksi sitä, että keskeise raja-arvolausee mukaa P o suurissa otoksissa approksimatiivisesti ormaalijakautuut: P a N(p, pq/) jossa q = p. Approksimatiivie luottamusväli todeäköisyydelle p o muotoa P± z α / PQ Luottamuskerroi z α/ saadaa ehdosta Pr(Z > z α/ ) = α/ jossa Z ~ N(0, ) ja α o valittu luottamustaso. Tehtävässä = 50 P = 5/50 = 0. sqrt(pq/) = 0.04 Normaalijakauma taulukosta saadaa: α = 0.95 z α/ =.96 α = 0.99 z α/ =.58 95 %: luottamusväli parametrille p o muotoa 0. ±.96 0.04 = 0. ± 0.048 = (0.05, 0.48) Väli ei peitä parametri p oletettua arvoa 0.05. 99 %: luottamusväli parametrille p o muotoa 0. ±.58 0.04 = 0. ± 0.063 = (0.037, 0.63) Väli peittää parametri p oletetu arvo 0.05. Evidessi viittaa siihe suutaa, että valmistaja väitteesee voidaa kohdistaa joki verra epäilyjä. Asiaa tarkastellaa lisää tilastollise testaukse yhteydessä. Opetus: Luottamusväli leveee, ku luottamustasoa kasvatetaa. TKK/SAL @ Ilkka Melli (004) 8/3

Mat-.09 Sovellettu todeäköisyyslasku 5. Tehdas valmistaa ruuveja. Ruuvie paio vaihtelee satuaisesti oudattae ormaalijakaumaa. Ruuvie joukosta poimittii yksikertaie satuaisotos. Otoskeskiarvoksi saatii tällöi 5 g. Oletetaa (epärealistisesti), että ormaalijakauma variassi 0.5 g o tuettu. Määrää 99 %: luottamusvälit paio odotusarvolle, jos otoskokoa oli (a) (b) 00 (c) 0000 Vertaa saatuje luottamusvälie pituuksia toisiisa. Mite luottamusväli pituus käyttäytyy otoskoo fuktioa? Normaalijakauma odotusarvo luottamusväli, ku variassi o oletettu (epärealistiseksi) tuetuksi perustuu siihe, että ormaalijakautueesta perusjoukosta poimitusta riippumattomasta satuaisotoksesta lasketu otoskeskiarvo otosjakauma o ormaalie. Jos X i ~ N(µ, ), i =,,, ja havaiot X i ovat riippumattomia, ii otoskeskiarvo X N µ, Jos variassi oletetaa tuetuksi, odotusarvo µ luottamusväli o muotoa X ± zα / Luottamuskerroi z α/ saadaa ehdosta Pr(Z > z α/ ) = α/ jossa Z ~ N(0, ) ja α o valittu luottamustaso. Tehtävässä X = 5 = 0.5 α = 0.0 Normaalijakauma taulukosta saadaa: z α / =.58 (a) = : Luottamusväli: 5 ±.9 = (3.7, 6.9) (b) = 00: Luottamusväli: 5 ± 0.9 = (4.87, 5.9) (c) = 0000: Luottamusväli: 5 ± 0.09 = (4.987, 5.09) TKK/SAL @ Ilkka Melli (004) 9/3

Mat-.09 Sovellettu todeäköisyyslasku Opetus: Luottamusväli kapeee, ku otoskokoa kasvatetaa. Luottamusväki kapeee vai /0-osaa, ku otoskoko kasvaa 00-kertaiseksi. Jos siis luottamusväli pituus halutaa puolittaa, pitää kerättävie havaitoje lukumäärä elikertaistaa. Ym. jakaumatulos ei ole voimassa, jos joudutaa estimoimaa otoksesta. Suurissa otoksissa luottamusväliä voidaa käyttää ym. ormaalijakaumaa perustuvaa väliä myös tilateessa, jossa korvataa vastaavalla otossuureella. Tämä perustuu keskeisee rajaarvo-lauseesee, joka mukaa otoskeskiarvo o hyvi yleisi ehdoi ormaalijakautuut myös tilateissa, joissa perusjoukko ei ole ormaalijakautuut. 6. Tehdas valmistaa auloja. Nauloje pituus vaihtelee satuaisesti oudattae ormaalijakaumaa. Nauloje joukosta poimittii yksikertaie satuaisotos, joka koko oli 30. Otoskeskiarvoksi saatii 9.99 cm ja otosvariassiksi 0.0 cm. (a) Määrää 95 %: luottamusväli auloje pituude odotusarvolle. (b) Määrää 90 %: luottamusväli auloje pituude variassille. (a) Jos X i ~ N(µ, ), i =,,, ja havaiot X i ovat riippumattomia, ii otoskeskiarvo X N µ, Koska variassi o tutemato ja se pitää estimoida, odotusarvo µ luottamusväli o muotoa s X ± tα / Luottamuskerroi t α/ saadaa ehdosta Pr(t > t α/ ) = α/ jossa t ~ t( ) ja α o valittu luottamustaso. Tehtävässä X = 9.99 s = 0. α = 0.05 = 30 TKK/SAL @ Ilkka Melli (004) 0/3

Mat-.09 Sovellettu todeäköisyyslasku t-jakauma taulukosta saadaa: t α / =.045 Site luottamusväliksi saadaa: 9.99 ±.045 0./sqrt(30) = 9.99 ± 0.037 = (9.953,0.07) (b) Jos X i ~ N(µ, ), i =,,, ja havaiot X i ovat riippumattomia, ii otosvariassille pätee: ( ) s χ ( ) Variassi luottamusväli o muotoa ( ) s ( ) s, χα/ χ α/ Luottamuskertoimet χ ja χ saadaa ehdoista α Pr( χα / χ ) = α Pr( χ α / χ ) = jossa χ χ ( ) α/ α/ ja α o valittu luottamustaso. Tehtävässä s = 0.0 α = 0.0 = 30 χ -jakauma taulukosta saadaa: χ α / α / 4.557 χ == 7.708 Site luottamusväliksi saadaa: (9 0.0/4.557, 9 0.0/7.708) = (0.0068, 0.064) TKK/SAL @ Ilkka Melli (004) /3

Mat-.09 Sovellettu todeäköisyyslasku 7. Kutaa suuitellaa ydivoimala raketamista. Kua asukkaide mielipiteet halutaa selvittää yksikertaisee satuaisotataa perustuvalla kyselytutkimuksella. Kuika suuri otos kutalaiste joukosta o poimittava, jotta saataisii 99 %: varmuus siitä, että otoksesta laskettu kaattajie suhteellie osuus ei poikkea eempää kui 0.5 %- yksikköä todellisesta kaattajie osuudesta. Suhteellise osuude p luottamusväli o tyyppiä P ± a jossa P o otoksesta laskettu suhteellie osuus. Luottamusväli lausekkeesta (ks. tehtävä 4) saadaa yhtälö PQ zα / = a josta voidaa ratkaista: zα / PQ = a Haluttu varmuus saavutetaa (edellyttäe, että variassi o arvioitu oikei), jos :ksi valitaa piei kaava atamaa arvoa suuremmista kokoaisluvuista. Koska P o tutemato (se arvo saadaa selville vasta, ku otos o poimittu), korvataa P sillä arvolla, joka ataa maksimaalise : arvo. Tämä P: arvo o /. Tällöi tarvittava otoskoko saadaa lausekkeesta Tehtävässä zα / = a a = 0.005 α = 0.99 z α/ =.58 Kaava ataa = 66564 jote :ksi pitää valita vähitää 66564. Huomaa kuika iso tarvittava otoskoko o! TKK/SAL @ Ilkka Melli (004) /3

Mat-.09 Sovellettu todeäköisyyslasku 8. Tölkitety tuoremehu -vitamiiipitoisuus (mg/dl) vaihtelee joki verra valmistuserästä toisee. Laboratorio haluaa selvittää erää tuoremehumerki keskimääräise -vitamiiipitoisuude mittaamalla pitoisuudet myyissä olevista tuoremehupakkauksista poimitusta yksikertaisesta satuaisotoksesta. Arvio pitäisi olla ii tarkka, että 95 %: varmuudella voidaa päätellä, että otoksesta laskettu keskimääräie -vitamiiipitoisuus ei poikkea todellisesta -vitamiiipitoisuudesta eempää kui 0.5 mg. Määrää tarvittava otoskoko, ku aikaisempie tutkimuste perusteella tiedetää, että - vitamiiipitoisuude otoshajota o tavallisesti mg. Odotusarvo µ luottamusväli o tyyppiä Ka ± a jossa Ka o otoksesta laskettu aritmeettie keskiarvo. Luottamusväli lausekkeesta (ks. tehtävä 5) saadaa yhtälö a= zα / josta voidaa ratkaista: zα / = a Haluttu varmuus saavutetaa (edellyttäe, että variassi o arvioitu oikei), jos :ksi valitaa piei kaava atamaa arvoa suuremmista kokoaisluvuista. Tehtävässä a = 0.5 α = 0.95 z α/ =.96 = Kaava ataa = 6.47 jote :ksi pitää valita vähitää 6. TKK/SAL @ Ilkka Melli (004) 3/3