Mat-.04 Tlastollse aalyys perusteet Mat-.04 Tlastollse aalyys perusteet / Ratkasut Aheet: Avasaat: Yhde selttäjä leaare regressomall Estmaatt, Estmaattor, Estmot, Jääöselösumma, Jääösterm, Jääösvarass, Jääösvarass estmot, Kteät selttäjät, Kokoaselösumma, Leaare regressomall, Mallelösumma, Pemmä elösumma meetelmä, Rakeeosa, Regressokerro, Regressokertome estmot, Regressomall, Regressosuora, Resduaal, Satuae osa, Seltettävä muuttuja, Selttäjä, Selttävä muuttuja, Seltysaste, Sovte, Suora kulmakerro, Systemaatte osa, Vakoselttäjä, Varassaalyyshajotelma, Vrheterm, Yhde selttäjä Leaare regressomall. PARAMETRIEN ESTIMOINTI Usede teollsuustuottede odotettavssa oleva kestokä o ptkä, että tuottee kestokää testataa s. khdytetyllä rastustestllä. Tällö test tehdää testausaja lyhetämseks tavallsta akarammssa olosuhtessa. STATISTIX-tedostoo o talletettu tedot teststä, jossa o tutkttu sähkölämmttme kuumeuskerukode kestokää käyttölämpötla fuktoa. Tedosto muuttujat ovat: (a) (b) (c) (d) TEMP = Käyttölämpötla (Fahrehet-astessa) LIFETIME = Kestoaka (tuessa) Tutustu aestoo prtämällä pstedagramm (TEMP, LIFETIME) ja arvo muuttuje välse korrelaato merkk ja suuruusluokka. Estmo STATISTIX-ohjelma regressoaalyysohjelmalla yhde selttäjä leaare regressomall LIFETIME.= β 0 + β TEMP + ε regressokertomet. Pom (b)-kohda tulostuksesta seuraavat suureet: () () Regressokertome estmaatt. Vertaa regressosuora kulmakertome β estmaatta kohdassa (a) saatuu tuloksee. Kokoaselösumma SST, mallelösumma SSM ja jääöselösumma SSE. Totea, että elösummat toteuttavat varass-aalyyshajotelma SST = SSM + SSE () Jääösvarass σ estmaatt. (v) Seltysaste R. Laske seltysaste myös varassaalyyshajotelmasta ja totea, että tulos o sama. Prrä estmotu regressosuora kohda (a) pstedagramm. TKK Ilkka Mell (005) /8
Mat-.04 Tlastollse aalyys perusteet RATKAISU: (a) PISTEDIAGRAMMI Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = TEMP Y Axs Varables = LIFETIME 80 Scatter Plot of LIFETIME vs TEMP 760 LIFETIME 70 660 60 560 470 560 650 740 830 90 TEMP Muuttujat TEMP ja LIFETIME äyttävät vomakkaast egatvsest korrelotuelta: Mtä korkeamp o käyttölämpötla stä lyhyemmä aja kerukka kestää. (b) REGRESSIOMALLIN ESTIMOINTI Regressomall Estmotava yhde selttäjä leaare regressomall o LIFETIME.= β 0 + β TEMP + ε jossa Seltettävä muuttuja = Depedet Varable = LIFETIME Selttävä muuttuja el selttäjä = Idepedet Varable = TEMP TKK Ilkka Mell (005) /8
Mat-.04 Tlastollse aalyys perusteet Statstcs > Lear Models > Lear Regresso Depedet Varable = LIFETIME Idepedet Varables = TEMP UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF LIFETIME PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P --------- ----------- --------- ----------- ------ CONSTANT 56.00 70.5666 6.38 0.0005 TEMP -0.67600 0.0988-6.84 0.0064 R-SQUARED 0.9398 RESID. MEAN SQUARE (MSE) 976.400 ADJUSTED R-SQUARED 0.997 STANDARD DEVIATION 3.474 SOURCE DF SS MS F P ---------- --- ---------- ---------- ----- ------ REGRESSION 45697.6 45697.6 46.80 0.0064 RESIDUAL 3 99.0 976.400 TOTAL 4 4866.8 CASES INCLUDED 5 MISSING CASES 0 (c) ESTIMOINTITULOSTEN TULKINTA Regressokertome estmaatt PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P --------- ----------- --------- ----------- ------ CONSTANT 56.00 70.5666 6.38 0.0005 TEMP -0.67600 0.0988-6.84 0.0064 Kerro b = TEMP COEFFICIENT = 0.676 Kerro b 0 = CONSTANT COEFFICIENT = 56 Regressosuora yhtälö: LIFETIME.= 56 0.676 TEMP Regressosuora kulmakertome 0.676 merkk vastaa (a)-kohda pstedagramm perusteella arvotua muuttuje TEMP ja LIFETIME suhdetta: Mtä korkeamp o käyttölämpötla stä lyhyemmä aja kerukka kestää. TKK Ilkka Mell (005) 3/8
Mat-.04 Tlastollse aalyys perusteet Regressosuora kulmakertome 0.676 tulkta: Jos keruka A käyttölämpötla o F korkeamp ku keruka B, keruka A käyttökä o (keskmäär) 0.676 h lyhemp ku keruka B. Jos keruka A käyttölämpötla o 0 F korkeamp ku keruka B, keruka A käyttökä o (keskmäär) 6.76 h lyhemp ku keruka B. Jos keruka A käyttölämpötla o 00 F korkeamp ku keruka B, keruka A käyttökä o (keskmäär) 60.76 h lyhemp ku keruka B. Varassaalyyshajotelma SOURCE DF SS MS F P ---------- --- ---------- ---------- ----- ------ REGRESSION 45697.6 45697.6 46.80 0.0064 RESIDUAL 3 99.0 976.400 TOTAL 4 4866.8 Kokoaselösumma SST = TOTAL SS = 4866.8 Mallelösumma SSM = REGRESSION SS = 45697.6 Jääöselösumma SSE = RESIDUAL SS = 99.0 Nelösummat toteuttavat varassaalyyshajotelma: SST = SSM + SSE el 4866.8 = 45697.6 + 99. Jääösvarass harhato estmaatt R-SQUARED 0.9398 RESID. MEAN SQUARE (MSE) 976.400 s = RESID. MEAN SQUARE (MSE) = 976.400 Jääösvarass estmaatt vodaa laskea kaavalla SSE 99. s = 976.4 = 5 = 00 Huomaa, että estmaatt löytyy myös varassaalyystaulukosta. TKK Ilkka Mell (005) 4/8
Mat-.04 Tlastollse aalyys perusteet Seltysaste R-SQUARED 0.9398 RESID. MEAN SQUARE (MSE) 976.400 R = R-SQUARED = 0.9398 Estmotu mall o ste selttäyt 93.98 % seltettävä muuttuja vahtelusta. Seltysaste vodaa laskea varassaalyyshajotelmasta kaavolla R SSE SSM = = SST SST Esmerkks SSM 45697.6 R = = = 0.9398 SST 4866.8 (d) REGRESSIOSUORAN PIIRTÄMINEN PISTEDIAGRAMMIIN Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = TEMP Y Axs Varables = LIFETIME Dsplay Regresso Le 80 Scatter Plot of LIFETIME vs TEMP 760 LIFETIME 70 660 60 560 470 560 650 740 830 90 TEMP TKK Ilkka Mell (005) 5/8
Mat-.04 Tlastollse aalyys perusteet. PARAMETRIEN ESTIMOINTI Jatkoa tehtävälle. (a) (b) RATKAISU: (a) Määrää estmaatt kertomlle β 0 ja β käyttämällä tehtäve lopussa oleva kaavoja ja laskemalla havatoarvoje summat, elösummat ja tulosumma. Käytä apua STATISTIX-ohjelma trasformaatota. Summat saat lasketuks valtsemalla Statstcs > Summary Statstcs > Descrptve Statstcs Vertaa tuloksa tehtävä tuloks. REGRESSIOKERTOIMIEN ESTIMOINTI Trasformaatot Muodostetaa muuttuje TEMP ja LIFETIME arvoje elöt ja tulot. Data > Trasformatos Trasformato Expresso XX = TEMP * TEMP Data > Trasformatos Trasformato Expresso YY = LIFETIME * LIFETIME Data > Trasformatos Trasformato Expresso XY = TEMP * LIFETIME Trasformaatode jälkee tedosto äyttää seuraavalta: CASE TEMP LIFETIME XX YY XY 500 804 50000 64646 40000 600 79 360000 6568 474600 3 700 658 490000 43964 460600 4 800 599 640000 35880 47900 5 900 56 80000 35844 505800 TKK Ilkka Mell (005) 6/8
Mat-.04 Tlastollse aalyys perusteet Muuttuje summat Statstcs > Summary Statstcs > Descrptve Statstcs Descrptve Varables = TEMP, LIFETIME, XX, YY, XY DESCRIPTIVE STATISTICS VARIABLE SUM TEMP 3500 LIFETIME 344 XX 550000 YY 379706 XY 300 x = 3500 y = 344 x = 550000 y = 379706 x y = 300 Otostuusluvut Lasketaa otostuusluvut havatoarvoje summsta, elösummsta ja tulosummasta: 3500 344 x = Σ x = = 700 y = Σ y = = 68.8 5 5 sx = ( Σx x ) = ( 550000 5 700 ) = 5000 4 s x = s = 58. x sy = ( Σy y ) = ( 379706 5 68.8 ) = 56.7 4 s y = s = 0.6 y sxy = ( Σx y x y) = ( 300 5 700 68.8 ) = 6900 4 sxy 6900 rxy = = = 0.9694 ss 58. 0.6 x y TKK Ilkka Mell (005) 7/8
Mat-.04 Tlastollse aalyys perusteet Tarkstetaa tulokset STATISTIX-ohjelmalla: Lasketaa summat, artmeettset keskarvot, otoskeskhajoat ja otosvarasst. Statstcs > Summary Statstcs > Desrptve Statstcs Descrptve Varables = TEMP, LIFETIME DESCRIPTIVE STATISTICS VARIABLE SUM MEAN SD VARIANCE TEMP 3500 700.00 58. 5000 LIFETIME 344 68.80 0.6 57 Lasketaa otosvarasst ja otoskovarass. Statstcs > Lear Models > Varace-Covarace Var-Covar Varables = TEMP, LIFETIME VARIANCE - COVARIANCE MATRIX TEMP LIFETIME TEMP 5000.0 LIFETIME -6900.0 56.7 CASES INCLUDED 5 MISSING CASES 0 Lasketaa otoskorrelaatokerro. Statstcs > Lear Models > Correlatos (Pearso) Correlato Varables = TEMP, LIFETIME CORRELATIONS (PEARSON) TEMP LIFETIME -0.9694 CASES INCLUDED 5 MISSING CASES 0 TKK Ilkka Mell (005) 8/8
Mat-.04 Tlastollse aalyys perusteet Regressokertomet Lasketaa regressokertome PNS-estmaattort korrelaatosta, otoshajoosta ja artmeettssta keskarvosta: sy 0.6 b = rxy = 0.9694 = 0.6760 s 58. x b = y bx = 68.8 + 0.6760 700 = 56 0 (b) VERTAILU TEHTÄVÄN TULOKSIIN Tulokset ovat samat ku tehtävässä saadut tulokset. 3. SOVITE JA RESIDUAALI Jatkoa tehtävälle. (a) Määrää estmodusta mallsta sovtteet yˆ ja resduaalt e STATISTIX-ohjelma regressoaalyysohjelmalla ja tallettamalla e tedostoo muuttujks FIT (= sovte) ja RES (= resduaal). (b) Määrää estmodusta mallsta sovtteet yˆ ja resduaalt e käyttämällä STATISTIXohjelma trasformaatota. Vertaa tulosta (a)-kohda tuloks. (c) RATKAISU: Prrä pstedagrammt (LIFETIME, FIT) ja (FIT, RES). Kuvota käytetää estmodu mall hyvyyde tutkmsessa. (a) SOVITTEET JA RESIDUAALIT Määrätää tehtävä estmodu regressomall sovtteet ja resduaalt. Statstcs > Lear Models > Lear Regresso Depedet Varable = LIFETIME Idepedet Varables = TEMP Results > Save Resduals Ftted Value = FIT Resdual = RES CASE LIFETIME FIT RES 804 88-4 79 750.4 40.6 3 658 68.8-4.8 4 599 65. -6. 5 56 547.6 4.4 TKK Ilkka Mell (005) 9/8
Mat-.04 Tlastollse aalyys perusteet (b) SOVITTEET JA RESIDUAALIT Määrätää tehtävä estmodu regressomall sovtteet ja resduaalt trasformaatode avulla. Data > Trasformatos Trasformato Expresso FIT = 56-0.676 * TEMP Data > Trasformatos Trasformato Expresso RES = LIFETIME - FIT CASE LIFETIME FIT RES 804 88-4 79 750.4 40.6 3 658 68.8-4.8 4 599 65. -6. 5 56 547.6 4.4 Tulokset ovat samat ku (a)-kohdassa saadut tulokset. TKK Ilkka Mell (005) 0/8
Mat-.04 Tlastollse aalyys perusteet (c) PISTEDIAGRAMMIT ESTIMOINTITULOKSISTA Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = LIFETIME Y Axs Varables = FIT 80 Scatter Plot of FIT vs LIFETIME 750 FIT 680 60 540 560 60 660 70 760 80 LIFETIME Estmotu mall o stä paremp mtä lähempää psteet ( y, ˆ y), =,,, ovat suoraa vvaa. Ks. myös tehtävää 4 (d). TKK Ilkka Mell (005) /8
Mat-.04 Tlastollse aalyys perusteet Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = FIT Y Axs Varables = RES 50 Scatter Plot of RES vs FIT 30 RES 0-0 -30 540 60 680 750 80 FIT Tämä pstedagramm ja se muuelmat ovat keskesä työväletä regressomall hyvyyttä tutkttaessa. Dagramm avulla vodaa tutka malla koskeva oletuksa: () () Oko mall rakeeosa okeata muotoa? Ovatko jääöstermt homoskedastsa? () Ovatko jääöstermt korrelomattoma? (v) Oko havatoje joukossa ulkopuolsa havatoja? Ks. esmerkkejä myöhemmssä harjotustehtäväsarjossa. TKK Ilkka Mell (005) /8
Mat-.04 Tlastollse aalyys perusteet 4. VARIANSSINALYYSIHAJOTELMA JA SELITYSASTE Jatkoa tehtävälle. (a) Määrää mallelösumma SSM laskemalla tehtävä tulokssta kokoaselösumma SST ja tehtävässä 3 lasketusta resduaalesta jääöselösumma SSE. (b) Määrää mallelösumma laskemalla sovttede yˆ varass. (c) Määrää seltysaste tehtävässä lasketusta otoskorrelaatokertomesta r xy. (d) RATKAISU: Laske [Cor(LIFETIME, FIT)]. Vertaa tulosta estmodu mall seltysasteesee. (a) MALLINELIÖSUMMAN LASKEMINEN Tehtävä mukaa s = 56.7 y Ste SST = s y = = ( ) 4 56.7 4866.8 mkä yhtyy tehtävässä saatuu tuloksee. Lasketaa tehtävässä 3 määrättyje resduaale elösumma: Data > Trasformatos Trasformato Expresso RESRES = RES * RES Statstcs > Summary Statstcs > Desrptve Statstcs Descrptve Varables = RESRES DESCRIPTIVE STATISTICS VARIABLE SUM RESRES 99. Josta saadaa suoraa SSE = 99. Ste SSM = SST SSE = 4866.8 99. = 45697.6 mkä yhtyy tehtävässä saatuu tuloksee. TKK Ilkka Mell (005) 3/8
Mat-.04 Tlastollse aalyys perusteet (b) MALLINELIÖSUMMAN LASKEMINEN Määrätää sovttede varass tavaomasella otosvarass kaavalla: Statstcs > Summary Statstcs > Desrptve Statstcs Descrptve Varables = FIT DESCRIPTIVE STATISTICS VARIABLE VARIANCE FIT 44 Tästä tuloksesta mallelösumma SSM saadaa seuraavalla laskutomtuksella: SSM = ( ) s y ˆ = 4 44 = 45696 Pe ero tehtävä tuloksee ähde johtuu pyörstysvrhestä. (c) SELITYSASTEEN LASKEMINEN Yhde selttäjä leaarse regressomallssa R = r xy Tehtävä tulokssta saadaa [ ] R = = 0.9694 0.9397 mkä yhtyy tehtävässä saatuu tuloksee. Huomaa, että kaava R = r xy mahdollstaa yhde selttäjä leaarse regressomall seltysastee määräämse lma mall regressokertome estmaatte sekä estmodu mall sovttede ja resduaale määräämstä. TKK Ilkka Mell (005) 4/8
Mat-.04 Tlastollse aalyys perusteet (d) SELITYSASTEEN LASKEMINEN Leaarsessa regressomallssa R = Määrätää Cor( yy, ˆ) : [ Cor( yy, ˆ) ] Statstcs > Lear Models > Correlatos (Pearso) Correlato Varables = LIFETIME, FIT CORRELATIONS (PEARSON) LIFETIME FIT 0.9694 CASES INCLUDED 5 MISSING CASES 0 Tästä saadaa R [ y yˆ ] = Cor(, ) = 0.9694 = 0.9397 mkä yhtyy tehtävässä saatuu tuloksee. TKK Ilkka Mell (005) 5/8
Mat-.04 Tlastollse aalyys perusteet KAAVOJA Olkoo y = β0 + β x + ε, =,,, yhde selttäjä leaare regressomall, jossa y = seltettävä muuttuja satuae ja havattu arvo havatoykskössä x = selttävä muuttuja satuae ja havattu arvo havatoykskössä β 0 = e-satuae ja tutemato vakoselttäjä regressokerro β = e-satuae ja tutemato selttäjä x regressokerro ε = satuae ja e-havattu jääösterm havatoykskössä Oletamme, että jääöstermllä ε o seuraavat stokastset omasuudet: () () () (v) E(ε ) = 0, =,,, Var(ε ) = σ, =,,, Cor(ε, ε j ), j ε N(0, σ ), =,,, Havatoje (x, y ), =,,, tavaomaset otostuusluvut vodaa laskea seuraavlla kaavolla: x = = sx = ( x x) = x x = = y = = sy = ( y y) = y y = = sxy = ( x x)( y y) = x y = xy = sxy rxy = ss Regressokertome β 0 ja β PNS-estmaattort: x y x y s s b = r = y xy xy sx sx b = y bx 0 TKK Ilkka Mell (005) 6/8
Mat-.04 Tlastollse aalyys perusteet Sovte ja resduaal: Huomaa, että yˆ = b + bx 0 e = y yˆ = = = y = e = 0 Varassaalyyshajotelma: Kokoaselösumma: Mallelösumma: jossa Jääöselösumma: yˆ SST = SSM + SSE = SST = ( y y) = ( ) s y (ˆ ) (ˆ ˆ) = = SSM = y y = y y yˆ = yˆ = y = y = = SSE = e = ( r ) SST = xy Jääösvarass σ harhato estmaattor: Seltysaste: Aa pätee: s R R = SSE SSE SSM = = SST SST = [ Cor( yy, )] ˆ Yhde selttäjä leaarsessa regressomallssa pätee lsäks: R = r xy TKK Ilkka Mell (005) 7/8
Mat-.04 Tlastollse aalyys perusteet Huomautus: Jos yhde selttäjä leaare regressomall y = β0 + β x + ε, =,,, regressokertome β ja 0 β PNS-estmaatt b ja 0 b joudutaa laskemaa käs ta laskmella, kaattaa käyttää hyväks stä, että x- ja y-havatoje artmeettset keskarvot x ja y, otosvarasst s x ja s y, otoskovarass sxy ja otoskorrelaato r xy vodaa määrätä laskemalla havatoarvoje summat, elösummat ja tulosumma: Summat: Nelösummat: Tulosumma: x = = y x y = = = x y TKK Ilkka Mell (005) 8/8