1. PARAMETRIEN ESTIMOINTI

Samankaltaiset tiedostot
Mat Koesuunnittelu ja tilastolliset mallit. Yhden selittäjän lineaarinen regressiomalli. Avainsanat:

on tavanomainen yhden selittäjän lineaarinen regressiomalli, jossa jäännöstermit ε i toteuttavat seuraavat oletukset:

Tilastollinen riippuvuus ja korrelaatio

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 6

Generoidaan tiedostoon BINORM satunnaislukuja jakaumasta N(0,1) muuttujiksi U, V: (U, V): N 2 (0, 0, 1, 1, 0)

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Mat Tilastollisen analyysin perusteet, kevät 2007

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

Mat Sovellettu todennäköisyyslasku A

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

Johdatus regressioanalyysiin. Heliövaara 1

Yhden selittäjän lineaarinen regressiomalli

Testaa onko lämpökäsittelyllä vaikutusta tankojen keskimääräiseen vetolujuuteen.

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

7.5. Yleinen lineaarinen malli ja suurimman uskottavuuden menetelmä

= E(Y 2 ) 1 n. = var(y 2 ) = E(Y 4 ) (E(Y 2 )) 2. Materiaalin esimerkin b) nojalla log-uskottavuusfunktio on l(θ; y) = n(y θ)2

Regressioanalyysi. Kuusinen/Heliövaara 1

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio: Esitiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslaskenta B 8. harjoitukset / Ratkaisut Aiheet: Otos ja otosjakaumat Avainsanat:

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastolliset menetelmät: Lineaarinen regressioanalyysi

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Frequencies. Frequency Table

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 7: Lagrangen kertojat. Pienimmän neliösumman menetelmä.

Menestyminen valintakokeissa ja todennäköisyyslaskussa


Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

MS-C2{04 Tilastollisen analyysin perusteet

Ilkka Mellin (2008) 1/24

Varianssianalyysi. Varianssianalyysi. Varianssianalyysi. Varianssianalyysi: Mitä opimme? Varianssianalyysi: Johdanto

MTTTP1 SELITYKSIÄ JA ESIMERKKEJÄ KAAVAKOKOELMAN KAAVOIHIN LIITTYEN

Tilastolliset menetelmät: Lineaarinen regressioanalyysi

Harjoitus 9: Excel - Tilastollinen analyysi

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

Mat Tilastollisen analyysin perusteet, kevät 2007

A B DIFFERENCE

ABHELSINKI UNIVERSITY OF TECHNOLOGY

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4

Tilastolliset menetelmät: Otokset, otosjakaumat ja estimointi. 4. Otokset ja otosjakaumat 5. Estimointi 6. Estimointimenetelmät 7.

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Yhden selittäjän lineaarinen regressiomalli: Lisätiedot. Yhden selittäjän lineaarinen regressiomalli

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli:

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Suoran sovittaminen pistejoukkoon

Harjoitus 6 -- Ratkaisut

Mat Tilastollisen analyysin perusteet, kevät 2007

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 7B Ratkaisuehdotuksia.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1

Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava: Esitiedot

ε i = jäännös- eli virhetermin ε satunnainen ja ei-havaittu arvo havaintoyksikössä i

voidaan hylätä, pienempi vai suurempi kuin 1 %?

MTTTP5, luento Luottamusväli, määritelmä

Mat Koesuunnittelu ja tilastolliset mallit

2-suuntainen vaihtoehtoinen hypoteesi

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Tilastollinen päättely. 3. Piste estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiomallin valinta. TKK (c) Ilkka Mellin (2007) 1

Perusnäkymä yksisuuntaiseen ANOVAaan

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 6

Harha mallin arvioinnissa

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tilastollinen päättely. 3. Piste-estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

5. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Muuttujien välisten riippuvuuksien analysointi

2. Tietokoneharjoitukset

4. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

Sovellettu todennäköisyyslaskenta B

Kvantitatiivinen genetiikka moniste s. 56

1. (Monisteen teht. 5.16) Eräiden kuulalaakereiden kestoa (miljoonaa kierrosta) on totuttu kuvaamaan Weibull-jakaumalla, jonka tiheysfunktio on

3. Datan käsittely lyhyt katsaus

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 5 Aiheet: Tilastolliset testit Avainsanat:

Luento 6 Luotettavuus Koherentit järjestelmät

Kaksisuuntainen varianssianalyysi. Heliövaara 1

E80. Data Uncertainty, Data Fitting, Error Propagation. Jan. 23, 2014 Jon Roberts. Experimental Engineering

Yleinen lineaarinen malli. Yleinen lineaarinen malli. Yleinen lineaarinen malli: Mitä opimme? 2/4. Yleinen lineaarinen malli: Mitä opimme?

2. Teoriaharjoitukset

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Opiskelija viipymisaika pistemäärä

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Transkriptio:

Mat-.04 Tlastollse aalyys perusteet Mat-.04 Tlastollse aalyys perusteet / Ratkasut Aheet: Avasaat: Yhde selttäjä leaare regressomall Estmaatt, Estmaattor, Estmot, Jääöselösumma, Jääösterm, Jääösvarass, Jääösvarass estmot, Kteät selttäjät, Kokoaselösumma, Leaare regressomall, Mallelösumma, Pemmä elösumma meetelmä, Rakeeosa, Regressokerro, Regressokertome estmot, Regressomall, Regressosuora, Resduaal, Satuae osa, Seltettävä muuttuja, Selttäjä, Selttävä muuttuja, Seltysaste, Sovte, Suora kulmakerro, Systemaatte osa, Vakoselttäjä, Varassaalyyshajotelma, Vrheterm, Yhde selttäjä Leaare regressomall. PARAMETRIEN ESTIMOINTI Usede teollsuustuottede odotettavssa oleva kestokä o ptkä, että tuottee kestokää testataa s. khdytetyllä rastustestllä. Tällö test tehdää testausaja lyhetämseks tavallsta akarammssa olosuhtessa. STATISTIX-tedostoo o talletettu tedot teststä, jossa o tutkttu sähkölämmttme kuumeuskerukode kestokää käyttölämpötla fuktoa. Tedosto muuttujat ovat: (a) (b) (c) (d) TEMP = Käyttölämpötla (Fahrehet-astessa) LIFETIME = Kestoaka (tuessa) Tutustu aestoo prtämällä pstedagramm (TEMP, LIFETIME) ja arvo muuttuje välse korrelaato merkk ja suuruusluokka. Estmo STATISTIX-ohjelma regressoaalyysohjelmalla yhde selttäjä leaare regressomall LIFETIME.= β 0 + β TEMP + ε regressokertomet. Pom (b)-kohda tulostuksesta seuraavat suureet: () () Regressokertome estmaatt. Vertaa regressosuora kulmakertome β estmaatta kohdassa (a) saatuu tuloksee. Kokoaselösumma SST, mallelösumma SSM ja jääöselösumma SSE. Totea, että elösummat toteuttavat varass-aalyyshajotelma SST = SSM + SSE () Jääösvarass σ estmaatt. (v) Seltysaste R. Laske seltysaste myös varassaalyyshajotelmasta ja totea, että tulos o sama. Prrä estmotu regressosuora kohda (a) pstedagramm. TKK Ilkka Mell (005) /8

Mat-.04 Tlastollse aalyys perusteet RATKAISU: (a) PISTEDIAGRAMMI Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = TEMP Y Axs Varables = LIFETIME 80 Scatter Plot of LIFETIME vs TEMP 760 LIFETIME 70 660 60 560 470 560 650 740 830 90 TEMP Muuttujat TEMP ja LIFETIME äyttävät vomakkaast egatvsest korrelotuelta: Mtä korkeamp o käyttölämpötla stä lyhyemmä aja kerukka kestää. (b) REGRESSIOMALLIN ESTIMOINTI Regressomall Estmotava yhde selttäjä leaare regressomall o LIFETIME.= β 0 + β TEMP + ε jossa Seltettävä muuttuja = Depedet Varable = LIFETIME Selttävä muuttuja el selttäjä = Idepedet Varable = TEMP TKK Ilkka Mell (005) /8

Mat-.04 Tlastollse aalyys perusteet Statstcs > Lear Models > Lear Regresso Depedet Varable = LIFETIME Idepedet Varables = TEMP UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF LIFETIME PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P --------- ----------- --------- ----------- ------ CONSTANT 56.00 70.5666 6.38 0.0005 TEMP -0.67600 0.0988-6.84 0.0064 R-SQUARED 0.9398 RESID. MEAN SQUARE (MSE) 976.400 ADJUSTED R-SQUARED 0.997 STANDARD DEVIATION 3.474 SOURCE DF SS MS F P ---------- --- ---------- ---------- ----- ------ REGRESSION 45697.6 45697.6 46.80 0.0064 RESIDUAL 3 99.0 976.400 TOTAL 4 4866.8 CASES INCLUDED 5 MISSING CASES 0 (c) ESTIMOINTITULOSTEN TULKINTA Regressokertome estmaatt PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P --------- ----------- --------- ----------- ------ CONSTANT 56.00 70.5666 6.38 0.0005 TEMP -0.67600 0.0988-6.84 0.0064 Kerro b = TEMP COEFFICIENT = 0.676 Kerro b 0 = CONSTANT COEFFICIENT = 56 Regressosuora yhtälö: LIFETIME.= 56 0.676 TEMP Regressosuora kulmakertome 0.676 merkk vastaa (a)-kohda pstedagramm perusteella arvotua muuttuje TEMP ja LIFETIME suhdetta: Mtä korkeamp o käyttölämpötla stä lyhyemmä aja kerukka kestää. TKK Ilkka Mell (005) 3/8

Mat-.04 Tlastollse aalyys perusteet Regressosuora kulmakertome 0.676 tulkta: Jos keruka A käyttölämpötla o F korkeamp ku keruka B, keruka A käyttökä o (keskmäär) 0.676 h lyhemp ku keruka B. Jos keruka A käyttölämpötla o 0 F korkeamp ku keruka B, keruka A käyttökä o (keskmäär) 6.76 h lyhemp ku keruka B. Jos keruka A käyttölämpötla o 00 F korkeamp ku keruka B, keruka A käyttökä o (keskmäär) 60.76 h lyhemp ku keruka B. Varassaalyyshajotelma SOURCE DF SS MS F P ---------- --- ---------- ---------- ----- ------ REGRESSION 45697.6 45697.6 46.80 0.0064 RESIDUAL 3 99.0 976.400 TOTAL 4 4866.8 Kokoaselösumma SST = TOTAL SS = 4866.8 Mallelösumma SSM = REGRESSION SS = 45697.6 Jääöselösumma SSE = RESIDUAL SS = 99.0 Nelösummat toteuttavat varassaalyyshajotelma: SST = SSM + SSE el 4866.8 = 45697.6 + 99. Jääösvarass harhato estmaatt R-SQUARED 0.9398 RESID. MEAN SQUARE (MSE) 976.400 s = RESID. MEAN SQUARE (MSE) = 976.400 Jääösvarass estmaatt vodaa laskea kaavalla SSE 99. s = 976.4 = 5 = 00 Huomaa, että estmaatt löytyy myös varassaalyystaulukosta. TKK Ilkka Mell (005) 4/8

Mat-.04 Tlastollse aalyys perusteet Seltysaste R-SQUARED 0.9398 RESID. MEAN SQUARE (MSE) 976.400 R = R-SQUARED = 0.9398 Estmotu mall o ste selttäyt 93.98 % seltettävä muuttuja vahtelusta. Seltysaste vodaa laskea varassaalyyshajotelmasta kaavolla R SSE SSM = = SST SST Esmerkks SSM 45697.6 R = = = 0.9398 SST 4866.8 (d) REGRESSIOSUORAN PIIRTÄMINEN PISTEDIAGRAMMIIN Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = TEMP Y Axs Varables = LIFETIME Dsplay Regresso Le 80 Scatter Plot of LIFETIME vs TEMP 760 LIFETIME 70 660 60 560 470 560 650 740 830 90 TEMP TKK Ilkka Mell (005) 5/8

Mat-.04 Tlastollse aalyys perusteet. PARAMETRIEN ESTIMOINTI Jatkoa tehtävälle. (a) (b) RATKAISU: (a) Määrää estmaatt kertomlle β 0 ja β käyttämällä tehtäve lopussa oleva kaavoja ja laskemalla havatoarvoje summat, elösummat ja tulosumma. Käytä apua STATISTIX-ohjelma trasformaatota. Summat saat lasketuks valtsemalla Statstcs > Summary Statstcs > Descrptve Statstcs Vertaa tuloksa tehtävä tuloks. REGRESSIOKERTOIMIEN ESTIMOINTI Trasformaatot Muodostetaa muuttuje TEMP ja LIFETIME arvoje elöt ja tulot. Data > Trasformatos Trasformato Expresso XX = TEMP * TEMP Data > Trasformatos Trasformato Expresso YY = LIFETIME * LIFETIME Data > Trasformatos Trasformato Expresso XY = TEMP * LIFETIME Trasformaatode jälkee tedosto äyttää seuraavalta: CASE TEMP LIFETIME XX YY XY 500 804 50000 64646 40000 600 79 360000 6568 474600 3 700 658 490000 43964 460600 4 800 599 640000 35880 47900 5 900 56 80000 35844 505800 TKK Ilkka Mell (005) 6/8

Mat-.04 Tlastollse aalyys perusteet Muuttuje summat Statstcs > Summary Statstcs > Descrptve Statstcs Descrptve Varables = TEMP, LIFETIME, XX, YY, XY DESCRIPTIVE STATISTICS VARIABLE SUM TEMP 3500 LIFETIME 344 XX 550000 YY 379706 XY 300 x = 3500 y = 344 x = 550000 y = 379706 x y = 300 Otostuusluvut Lasketaa otostuusluvut havatoarvoje summsta, elösummsta ja tulosummasta: 3500 344 x = Σ x = = 700 y = Σ y = = 68.8 5 5 sx = ( Σx x ) = ( 550000 5 700 ) = 5000 4 s x = s = 58. x sy = ( Σy y ) = ( 379706 5 68.8 ) = 56.7 4 s y = s = 0.6 y sxy = ( Σx y x y) = ( 300 5 700 68.8 ) = 6900 4 sxy 6900 rxy = = = 0.9694 ss 58. 0.6 x y TKK Ilkka Mell (005) 7/8

Mat-.04 Tlastollse aalyys perusteet Tarkstetaa tulokset STATISTIX-ohjelmalla: Lasketaa summat, artmeettset keskarvot, otoskeskhajoat ja otosvarasst. Statstcs > Summary Statstcs > Desrptve Statstcs Descrptve Varables = TEMP, LIFETIME DESCRIPTIVE STATISTICS VARIABLE SUM MEAN SD VARIANCE TEMP 3500 700.00 58. 5000 LIFETIME 344 68.80 0.6 57 Lasketaa otosvarasst ja otoskovarass. Statstcs > Lear Models > Varace-Covarace Var-Covar Varables = TEMP, LIFETIME VARIANCE - COVARIANCE MATRIX TEMP LIFETIME TEMP 5000.0 LIFETIME -6900.0 56.7 CASES INCLUDED 5 MISSING CASES 0 Lasketaa otoskorrelaatokerro. Statstcs > Lear Models > Correlatos (Pearso) Correlato Varables = TEMP, LIFETIME CORRELATIONS (PEARSON) TEMP LIFETIME -0.9694 CASES INCLUDED 5 MISSING CASES 0 TKK Ilkka Mell (005) 8/8

Mat-.04 Tlastollse aalyys perusteet Regressokertomet Lasketaa regressokertome PNS-estmaattort korrelaatosta, otoshajoosta ja artmeettssta keskarvosta: sy 0.6 b = rxy = 0.9694 = 0.6760 s 58. x b = y bx = 68.8 + 0.6760 700 = 56 0 (b) VERTAILU TEHTÄVÄN TULOKSIIN Tulokset ovat samat ku tehtävässä saadut tulokset. 3. SOVITE JA RESIDUAALI Jatkoa tehtävälle. (a) Määrää estmodusta mallsta sovtteet yˆ ja resduaalt e STATISTIX-ohjelma regressoaalyysohjelmalla ja tallettamalla e tedostoo muuttujks FIT (= sovte) ja RES (= resduaal). (b) Määrää estmodusta mallsta sovtteet yˆ ja resduaalt e käyttämällä STATISTIXohjelma trasformaatota. Vertaa tulosta (a)-kohda tuloks. (c) RATKAISU: Prrä pstedagrammt (LIFETIME, FIT) ja (FIT, RES). Kuvota käytetää estmodu mall hyvyyde tutkmsessa. (a) SOVITTEET JA RESIDUAALIT Määrätää tehtävä estmodu regressomall sovtteet ja resduaalt. Statstcs > Lear Models > Lear Regresso Depedet Varable = LIFETIME Idepedet Varables = TEMP Results > Save Resduals Ftted Value = FIT Resdual = RES CASE LIFETIME FIT RES 804 88-4 79 750.4 40.6 3 658 68.8-4.8 4 599 65. -6. 5 56 547.6 4.4 TKK Ilkka Mell (005) 9/8

Mat-.04 Tlastollse aalyys perusteet (b) SOVITTEET JA RESIDUAALIT Määrätää tehtävä estmodu regressomall sovtteet ja resduaalt trasformaatode avulla. Data > Trasformatos Trasformato Expresso FIT = 56-0.676 * TEMP Data > Trasformatos Trasformato Expresso RES = LIFETIME - FIT CASE LIFETIME FIT RES 804 88-4 79 750.4 40.6 3 658 68.8-4.8 4 599 65. -6. 5 56 547.6 4.4 Tulokset ovat samat ku (a)-kohdassa saadut tulokset. TKK Ilkka Mell (005) 0/8

Mat-.04 Tlastollse aalyys perusteet (c) PISTEDIAGRAMMIT ESTIMOINTITULOKSISTA Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = LIFETIME Y Axs Varables = FIT 80 Scatter Plot of FIT vs LIFETIME 750 FIT 680 60 540 560 60 660 70 760 80 LIFETIME Estmotu mall o stä paremp mtä lähempää psteet ( y, ˆ y), =,,, ovat suoraa vvaa. Ks. myös tehtävää 4 (d). TKK Ilkka Mell (005) /8

Mat-.04 Tlastollse aalyys perusteet Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = FIT Y Axs Varables = RES 50 Scatter Plot of RES vs FIT 30 RES 0-0 -30 540 60 680 750 80 FIT Tämä pstedagramm ja se muuelmat ovat keskesä työväletä regressomall hyvyyttä tutkttaessa. Dagramm avulla vodaa tutka malla koskeva oletuksa: () () Oko mall rakeeosa okeata muotoa? Ovatko jääöstermt homoskedastsa? () Ovatko jääöstermt korrelomattoma? (v) Oko havatoje joukossa ulkopuolsa havatoja? Ks. esmerkkejä myöhemmssä harjotustehtäväsarjossa. TKK Ilkka Mell (005) /8

Mat-.04 Tlastollse aalyys perusteet 4. VARIANSSINALYYSIHAJOTELMA JA SELITYSASTE Jatkoa tehtävälle. (a) Määrää mallelösumma SSM laskemalla tehtävä tulokssta kokoaselösumma SST ja tehtävässä 3 lasketusta resduaalesta jääöselösumma SSE. (b) Määrää mallelösumma laskemalla sovttede yˆ varass. (c) Määrää seltysaste tehtävässä lasketusta otoskorrelaatokertomesta r xy. (d) RATKAISU: Laske [Cor(LIFETIME, FIT)]. Vertaa tulosta estmodu mall seltysasteesee. (a) MALLINELIÖSUMMAN LASKEMINEN Tehtävä mukaa s = 56.7 y Ste SST = s y = = ( ) 4 56.7 4866.8 mkä yhtyy tehtävässä saatuu tuloksee. Lasketaa tehtävässä 3 määrättyje resduaale elösumma: Data > Trasformatos Trasformato Expresso RESRES = RES * RES Statstcs > Summary Statstcs > Desrptve Statstcs Descrptve Varables = RESRES DESCRIPTIVE STATISTICS VARIABLE SUM RESRES 99. Josta saadaa suoraa SSE = 99. Ste SSM = SST SSE = 4866.8 99. = 45697.6 mkä yhtyy tehtävässä saatuu tuloksee. TKK Ilkka Mell (005) 3/8

Mat-.04 Tlastollse aalyys perusteet (b) MALLINELIÖSUMMAN LASKEMINEN Määrätää sovttede varass tavaomasella otosvarass kaavalla: Statstcs > Summary Statstcs > Desrptve Statstcs Descrptve Varables = FIT DESCRIPTIVE STATISTICS VARIABLE VARIANCE FIT 44 Tästä tuloksesta mallelösumma SSM saadaa seuraavalla laskutomtuksella: SSM = ( ) s y ˆ = 4 44 = 45696 Pe ero tehtävä tuloksee ähde johtuu pyörstysvrhestä. (c) SELITYSASTEEN LASKEMINEN Yhde selttäjä leaarse regressomallssa R = r xy Tehtävä tulokssta saadaa [ ] R = = 0.9694 0.9397 mkä yhtyy tehtävässä saatuu tuloksee. Huomaa, että kaava R = r xy mahdollstaa yhde selttäjä leaarse regressomall seltysastee määräämse lma mall regressokertome estmaatte sekä estmodu mall sovttede ja resduaale määräämstä. TKK Ilkka Mell (005) 4/8

Mat-.04 Tlastollse aalyys perusteet (d) SELITYSASTEEN LASKEMINEN Leaarsessa regressomallssa R = Määrätää Cor( yy, ˆ) : [ Cor( yy, ˆ) ] Statstcs > Lear Models > Correlatos (Pearso) Correlato Varables = LIFETIME, FIT CORRELATIONS (PEARSON) LIFETIME FIT 0.9694 CASES INCLUDED 5 MISSING CASES 0 Tästä saadaa R [ y yˆ ] = Cor(, ) = 0.9694 = 0.9397 mkä yhtyy tehtävässä saatuu tuloksee. TKK Ilkka Mell (005) 5/8

Mat-.04 Tlastollse aalyys perusteet KAAVOJA Olkoo y = β0 + β x + ε, =,,, yhde selttäjä leaare regressomall, jossa y = seltettävä muuttuja satuae ja havattu arvo havatoykskössä x = selttävä muuttuja satuae ja havattu arvo havatoykskössä β 0 = e-satuae ja tutemato vakoselttäjä regressokerro β = e-satuae ja tutemato selttäjä x regressokerro ε = satuae ja e-havattu jääösterm havatoykskössä Oletamme, että jääöstermllä ε o seuraavat stokastset omasuudet: () () () (v) E(ε ) = 0, =,,, Var(ε ) = σ, =,,, Cor(ε, ε j ), j ε N(0, σ ), =,,, Havatoje (x, y ), =,,, tavaomaset otostuusluvut vodaa laskea seuraavlla kaavolla: x = = sx = ( x x) = x x = = y = = sy = ( y y) = y y = = sxy = ( x x)( y y) = x y = xy = sxy rxy = ss Regressokertome β 0 ja β PNS-estmaattort: x y x y s s b = r = y xy xy sx sx b = y bx 0 TKK Ilkka Mell (005) 6/8

Mat-.04 Tlastollse aalyys perusteet Sovte ja resduaal: Huomaa, että yˆ = b + bx 0 e = y yˆ = = = y = e = 0 Varassaalyyshajotelma: Kokoaselösumma: Mallelösumma: jossa Jääöselösumma: yˆ SST = SSM + SSE = SST = ( y y) = ( ) s y (ˆ ) (ˆ ˆ) = = SSM = y y = y y yˆ = yˆ = y = y = = SSE = e = ( r ) SST = xy Jääösvarass σ harhato estmaattor: Seltysaste: Aa pätee: s R R = SSE SSE SSM = = SST SST = [ Cor( yy, )] ˆ Yhde selttäjä leaarsessa regressomallssa pätee lsäks: R = r xy TKK Ilkka Mell (005) 7/8

Mat-.04 Tlastollse aalyys perusteet Huomautus: Jos yhde selttäjä leaare regressomall y = β0 + β x + ε, =,,, regressokertome β ja 0 β PNS-estmaatt b ja 0 b joudutaa laskemaa käs ta laskmella, kaattaa käyttää hyväks stä, että x- ja y-havatoje artmeettset keskarvot x ja y, otosvarasst s x ja s y, otoskovarass sxy ja otoskorrelaato r xy vodaa määrätä laskemalla havatoarvoje summat, elösummat ja tulosumma: Summat: Nelösummat: Tulosumma: x = = y x y = = = x y TKK Ilkka Mell (005) 8/8