TKK / Systeemaalyys laboratoro Mat-.090 Sovellettu todeäkösyyslasku A Nordlud Harotus (vko 49/003) (Ahe: Tlastollsa testeä, regressoaalyysä Lae luvut 5.5, 6) HUOM! Laskarede palautukse takaraa o pokkeuksellsest torstaa 4.. klo 0.00, koska Edta akaa laskarede mallratkasut perata 5. akaa.. Peruavlelä tutk tety laottee vakutusta perua sado määrää (satoa mtataa ykskössä toa/hehtaar). Vlelä valtsee arpomalla kahdeksa peltoruutua, oh okasee paaa er määrä laotetta: esmmäsee arvottuu ruutuu ykskkö, tosee arvottuu ruutuu ykskköä e. Merktää laottee määrää muuttualla x a sado määrää muuttualla Y. Koetulokset ovat seuraavat: x Y 3 4 5 6 7 8 5 7 9 4 5 4 a) Prrä koetulokssta pstedagramm a hahmottele kuvaa pemmä elösumma (el PNS) suora. b) Määrää regressomall Y = β0 + βx + ε regressokertome PNS-estmaatt. c) Määrää estmodu regressomall ääösvarass estmaatt. d) Määrää estmodu regressomall seltysaste. e) Määrää regressokertomelle β symmetre 95 %: luottamusväl. f) Testaa hypoteesa H 0 : β = 0. Käytä kakssuutasta vahtoehtosta hypoteesa a 5 %: merktsevyystasoa. g) Testaa hypoteesa H 0 : β 0 = 0. Käytä kakssuutasta vahtoehtosta hypoteesa a 5 %: merktsevyystasoa. a) 30 Laottee määrä a peruasato sato (t/ha) 5 0 5 0 5 0 0 4 6 8 0 laottee määrä
b) Muodostetaa avuks taulukko: x y x y (x ) (y ) 5 5 5 4 4 44 3 3 7 5 9 89 4 4 9 76 6 36 5 5 4 0 5 576 6 6 5 50 36 65 7 7 54 49 484 8 8 4 9 64 576 SUM 36 67 800 04 3577 Lasketaa tauluko avulla elösummat a artmeettset keskarvot: 36 67 SSxy = xy x y / = 800 = 48.5 = = = 8 36 SSxx = x x / = 04 = 4 = = 8 67 SSyy = y y / = 3577 = 90.875 8 = = Termstä SS yy käytetää meä seltettävä elösumma ta kokoaselösumma. x = 36/ 8 = 4.5 y = 67 / 8 = 0.875 Edellsstä saadaa regressokertome estmaatt: ˆ SSxy 48.5 β = =.55 SSxx 4 βˆ ˆ 0 = y βx 5.679 Estmotu regressosuora o ss y = 5.679 +.55x. Huomaa suora kulmakertome tulkta: yhde laoteykskö lsäys kasvattaa satoa keskmäär.55 toa hehtaara kohde. c) Lasketaa seltetty elösumma SSR (Regresso Sum of Squares). Tästä käytetää myös use meä mallelösumma: SSR = SS SSE = βˆ SS =.55 48.5 = 56.006 yy xy Edellsestä saadaa ääöselösumma SSE (Error Sum of Squares): SSE = SSyy SSR = 90.875 56.006 = 34.869 Toe tapa laskea ääöselösumma SSE o k. resduaale elöde summa laskeme: ( ˆ ˆ ) β0 β SSE = y x = Jääösvarass harhato estmaatt: SSE 36.689 σ ˆ = = 5.8 6
d) Mall seltysaste o seltety elösumma suhde seltettävä elösummaa: SSR 56.006 R = = 0.66 SS 90.875 yy Seltysaste mttaa havatoe a mall yhteesopvuutta. Koska seltysaste o välltä [0, ], se lmastaa use prosettea. Tässä tehtävässä vodaa saoa "mall selttää 6.6 % seltettävä elösummasta". e) Estmodaa es regressokertome β varass: σˆ 5.8 s ˆ = = 0.38 β SSxx 4 Luottamusväl o muotoa β ˆ ± t s α / βˆ, df =. 95 %: luottamusväl luottamuskertomeks saadaa t-akauma taulukosta.447, ku vapausasteta o 6. Luottamusvälks saadaa ste (0.45,.065). f) H 0 : β = 0, H : β 0 Testsuure: βˆ 0.55 t = = 3.04 0.37 s β ˆ 5 %: merktsevyystasoa vastaavks hylkäysraoks saadaa t-akauma taulukosta ±.447, ku vapausasteta o 6. Koska testsuuree laskettu arvo 3.04 o suuremp ku hylkäysraa.447, testsuuree laskettu arvo o hylkäysalueella a H 0 vodaa hylätä 5 %: merktsevyystasolla. Regressokerro β pokkeaa ss tlastollsest merktseväst ollasta. (sama äkee myös e-kohda luottamusvälstä, koska arvo 0 e ole estmodu väl ssällä). g) Estmodaa es regressokertome β 0 varass: s x 4.5 = + ˆ = + 5.8 3.58 ˆ σ β0 SS xx 8 4 H 0 : β 0 = 0, H : β 0 0 Testsuure: βˆ 0 0 5.679 t = = 8.347.878 s β ˆ 0 5 %: merktsevyystasoa vastaavks hylkäysraoks saadaa t-akauma taulukosta ±.447, ku vapausasteta o 6. Koska testsuuree laskettu arvo 8.347 o suuremp ku hylkäysraa.447, testsuuree laskettu arvo o hylkäysalueella a H 0 vodaa hylätä 5 %: merktsevyystasolla. Regressokerro β 0 pokkeaa ss tlastollsest merktseväst ollasta.
. (Yhteesopvuustest) Kompoet käyttöä vätetää oleva ekspoettakautuut odotusarvoa 500 tuta. Pomtaa kompoetesta ykskertae satuasotos kokoa 00 a merktää käyttöät ylös: tomta-aka kpl alle 50 h 63 50-500 h 59 500-750 h 39 750-000 h 30 yl 000 h 9 Sopvatko havaot yhtee se kassa, mtä akaumasta o vätetty? Testaa 5 %: merktsevyystasolla. H 0 : Kompoette käyttökä oudattaa ekspoettakaumaa odotusarvoa 500 h H : Kompoette käyttökä e oudata ekspoettakaumaa odotusarvoa 500 h Lasketaa luokke todeäkösyydet (olettae, että H 0 pätee) a de avulla odotetut frekvesst. Esmerkks P(50 < X < 500) = e 50/500 e 500/500 0.387 a vastaava luoka odotettu frekvess o ste 00 0.387 47.73. Huomaa, että odotettua frekvesseä e pyörstetä kokoasluvuks. Testsuure perustuu havattue frekvesse a odotettue frekvesse vertaluu, ote odotettue frekvesse summa täytyy täsmätä havattue frekvesse summa 00 kassa. Havatut frekvesst a odotetut frekvesst taulukossa: Lasketaa testsuuree arvo: χ Luokka O luoka t. E alle 50 h 63 0.393 78.694 50-500 h 59 0.39 47.730 500-750 h 3 39 0.45 8.950 750-000 h 4 30 0.088 7.559 yl 000 h 5 9 0.35 7.067 Summa: 00 00 k ( O E) ( 63 78.694) ( 9 7.067) = = + + 30.54 E 78.694 7.067 = df = k = 4 (yhtää parametra e estmotu). 5 %: merktsevyystasolla vapausastella 4 saadaa χ -akauma taulukosta krttseks arvoks 9.49, ote ollahypotees vodaa hylätä 5 %: merktsevyystasolla. Havatoe perusteella kompoette elkä e oudata ekspoettakaumaa odotusarvoa 500 tuta.
3. (Homogeesuustest) Kahdelle heklölle A a B o kummallek aettu oppa a kumpaak o pyydetty hettämää stä 0 kertaa. A a B kertovat saatue slmälukue frekvesse akautuee kute alla taulukossa o estetty. Oko mahdollsta, että heklöt ovat käyttäeet samaa oppaa? Testaa 5 %: merktsevyystasolla. Slmäluku 3 4 5 6 A: tulokset 6 8 9 9 6 B: tulokset 6 0 7 33 Huomaa, että tässä testausasetelmassa o kerätty kaks tosstaa rppumatota otosta a tehtävää o tutka, ovatko otokset peräs samasta akaumasta (akauma muodosta e tehdä mtää oletusta). Huomaa, että tutka o päättäyt kummak otokse koo etukätee. Muotollaa hypoteest: H 0 : A- a B-frekvesst ovat peräs samasta akaumasta H : A- a B-frekvesst evät ole peräs samasta akaumasta Merktää deksllä rveä, =,,, r (egl. row), deksllä sarakketa, =,,, c (egl. colum). Odotetut frekvesst määrätää kertomalla vastaava havattue frekvesse sarakesumma vastaavalla rvsummalla a akamalla frekvesse kokoassummalla. O 3 4 5 6 Sum 6 8 9 9 6 0 6 0 7 33 0 Sum 8 34 39 39 4 59 40 E 3 4 5 6 Sum 4 7 9.5 9.5 0.5 9.5 0 4 7 9.5 9.5 0.5 9.5 0 Sum 8 34 39 39 4 59 40 Esm. odotettu frekvess E 6 = 59 0/40 = 9.5. Lasketaa testsuuree arvo kaavalla χ r c ( O ) E = E = = Järestetää laskutomtukset selkeyde vuoks taulukkoo kute edellä: χ 3 4 5 6 0.86 0.059 0.03 0.3 0. 0.45 0.86 0.059 0.03 0.3 0. 0.45 Sum.406
Vapausastede lukumäärä df = (r )(c ) = 5 a krttseks arvoks saadaa.07. Nollahypotees ää vomaa, koska laskettu testsuuree arvo.406 o peemp ku.07. O ss mahdollsta, että heklöt A a B ovat hettäeet sama oppaa. 4. (Rppumattomuustest) Eräässä taloudellsessa tutkmuksessa kartotett yrtyste tulevasuudeodotuksa. Tutkmuksessa haastatelt ykskertasella satuasotaalla valtut 85 er yrtykse edustaaa a saat seuraavalaset tulokset: Näkymät: Yrtykse tyypp: hyvät eutraalt huoot vetyrtykset 7 33 kotmarkkayrtykset 38 47 8 Testaa 5 %: merktsevyystasolla pokkeavatko vetyrtyste a kotmarkkayrtyste tulevasuudeodotukset tosstaa. Rppumattomuustestssä tutka o päättäyt aoastaa otoskoo etukätee a kerää yhde aoa otokse, mutta havatut frekvesst akautuvat satuasest sekä yrtykse tyyp mukaa että tulevasuudeäkyme mukaa. Itse test suortetaa kute homogeesuustestk. Muotollaa hypoteest: H 0 : Vetyrtyste a kotmarkkayrtyste suhtautumsessa tulevasuutee e ole eroa H : Vetyrtyste a kotmarkkayrtyste suhtautumsessa tulevasuutee o eroa Merktää deksllä rveä, =,,, r (egl. row), deksllä sarakketa, =,,, c (egl. colum). Odotetut frekvesst määrätää kertomalla vastaava havattue frekvesse sarakesumma vastaavalla rvsummalla a akamalla frekvesse kokoassummalla. O 3 Sum 7 33 7 38 47 8 3 Sum 65 80 40 85 E 3 Sum 5.97 3.35 5.568 7 39.703 48.865 4.43 3 Sum 65 80 40 85 Esm. odotettu frekvess E 3 = 40 7/85 5.568. Lasketaa testsuuree arvo kaavalla χ r c ( O ) E = E = =
Järestetää laskutomtukset selkeyde vuoks taulukkoo kute edellä: χ 3 0.46 0.7 0.876 0.0730 0.07 0.509 Sum.709 Vapausastede lukumäärä df = (r )(c ) = a krttseks arvoks saadaa 5.99. Nollahypotees ää vomaa, koska laskettu testsuuree arvo.709 o peemp ku 5.99. Vetmarkkode a kotmarkkode yrtyste tulevasuudeodotukset evät pokkea tlastollsest merktseväst tosstaa. Pstetehtävä. Eräässä tehtaassa o kolme er työvuoroa: A, B a C. Ptkällä aaaksolla vuorossa A tapahtuu 0 työtapaturmaa a vuorossa B a C kummassak 0 työtapaturmaa. Vakuttaako työvuoro työtapaturme lukumäärää? Testaa 5 %: merktsevyystasolla. Kakk työvuorot oletetaa yhtä ptkks a kakssa vuorossa o yhtä palo työtekötä. Muotollaa testattavat hypoteest: H 0 : Työvuoro e vakuta työtapaturme lukumäärää H : Työvuoro vakuttaa työtapaturme lukumäärää Jos työvuoro e vakuta työtapaturme lukumäärää, tapaturme lukumäärä ptäs oudattaa dskreettä tasasta akaumaa. El hypoteest vodaa muotolla: H 0 : Työtapaturme lukumäärä er vuorossa oudattaa dskreettä tasasta akaumaa H : Työtapaturme lukumäärä er vuorossa e oudata dskreettä tasasta akaumaa Tässä tehdää tos saoe yhteesopvuustest. Merktää havattua frekvesseä O (egl. observed) a odotettua frekvesseä E (egl. expected): O Luokka 3 Summa Havattu frekvess 0 0 0 50 E Luokka 3 Summa Odotettu frekvess 6.6667 6.6667 6.6667 50
Lasketaa testsuuree arvo: χ k ( O ) ( 0 6.6667) ( 0 6.6667) ( 0 6.6667) E = = + + = 4 E 6.6667 6.6667 6.6667 = Nollahypotees pätessä testsuure oudattaa (asymptoottsest) χ -akaumaa vapausastella df = k = a testsuuree suuret arvot vttaavat she, että ollahypotees e päde. Krttseks arvoks saadaa χ -akauma taulukosta 5.99, ote H 0 ää vomaa 5 %: merktsevyystasolla. Työtapaturme lukumäärät er työvuorossa evät pokkea tosstaa tlastollsest merktseväst el havatut erot työtapaturme lukumäärssä vovat olla satuasvahtelu aheuttama. Pstetehtävä. Eräässä 4 kua otoksessa suhteellse rkollsuude (rkoksa per 000 asukasta) a asukastheyde (asukasta per km ) välse otoskorrelaatokertome arvoks saat r = 0.57. Testaa ollahypoteesa, että ko. muuttuat ovat korrelomattoma. Käytä kakssuutasta vahtoehtosta hypoteesa a 5 %: merktsevyystasoa. H 0 : ρ = 0, H : ρ 0 r 0.57 t = = 40.005 r 0.57 Jos ollahypotees pätee, testsuure oudattaa t-akaumaa vapausastella. Krttsks arvoks 5 %: merktsevyystasolla saadaa ±.0. Nollahypotees ää vomaa 5 %: merktsevyystasolla ts. asukastheys a suhteelle rkollsuus evät korrelo. Huomaa, että yhde selttää leaarse regressomall tapauksessa test korrelaatokertomelle a test regressokertomelle yhtyvät. Lsäks yhde selttää leaarse regressomall seltysaste o sama ku otoskorrelaatokertome elö. Perataa 5. lueolla kerrataa älkmmäse välkoealuee asota. Tovomuksa kertauslueolla kästeltävstä ahesta vo lähettää sähköpostlla osotteesee mat090@cc.hut.f. Jälkmmäe välkoe o tstaa 6.. klo 9-. Ilmottautume Topssa o auk. Koealue: Lase kra luvut 4.8-4.9, 5.8, 9.-9.3, 9.5-6.5 (pl. bootstrapluottamusvält), lueot vkolta 43-49 a laskuharotukset 7-. Välkoeuusa 7.. tulokset löytyvät kurss kotsvulta. Sekä välkokee että uustakokee arvosteluu vo tutustua torstaa 4. klo 6.00-7.00 Systeemaalyys laboratoro Rhessä (U9a, päärakeukse Mell-sal puolee pääty, toe kerros).