3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa

Koko: px
Aloita esitys sivulta:

Download "3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa"

Transkriptio

1 3. Useamman selittäajäan regressiomalli p-selittäaväaäa muuttujaa Y i = + 1 X i p X ip + u i i = 1,...,n (> p), missäa n = havaintojen lukumäaäaräa otoksessa. Oletukset kuten aiemmin: (1) E(u i )=0, i (2) Var(u i )=u, 2 i (3) Cov(u i,u j )=0, i = j (4) Cov(X ij,u i )=0, i, j (5) X-muuttujat eiväat saa olla lineaarisesti riippuvia Derivoimalla yhtäaläo X ij :n suhteen saadaan Y i = j, X ij j =1,...,p,joten j :n tulkinta on: Y i muuttuu j :n verran X ij :n muuttuessa yhdelläa yksikäolläa ja muiden muuttujien arvojen pysyessäa ennallaan. Example. In June 1978, California voters approved what is known as Proposition 13 limiting property taxes. This led to substantial and di erential reduction in property taxes, which led to an increase in housing prices. Rosen (1982) (Journal of Political Economy, pp. 191{200) studied the impact of reduction in property taxes on housing prices in San Francisco Bay Area. Besides property taxes, there are other factors that determine housing prices and these have to be taken into account in the study. Rosen therefore included other characteristics of the house. The variables determining the housing prices were speci ed as x 1 = change (decrease) in post-proposition 13 mean house taxes x 2 = (mean) square footage of house x 3 = median income of families in the area x 4 = mean age of house x 5 = transportation time to San Francisco x 6 = housing-quality index as computed by real estate appraisers The dependent variable was y = change in the post-proportion 13 mean house prices n = 64. The estimated model was ^y = x x x x 4 (2.97) (2.32) (1.34) (3.26) x x 6 (2.24) (1.80) R 2 =0.897, tvalues in parentheses

2 All the coe±cients have the expected signs. The coe±cient of x 1 indicates that each $1 decrease in property taxes increases property values of $7. The question is whether this is about the right magnitude. Assuming that the property tax reduction is expected to be at the same level in the future years, the present value of a $1 return per year is 1/r, wherer is the rate of interest (also expected to remain the same). This is equalto $7ifr = 14.29%. The interest rates at that time were around this level and Rosen concludes: The capitalization rate implied by this equation is about 7 which is precisely the magnitude that one would expect with an interest rate of 12{15%. Esimointi tapahtuu OLS:llÄa, jossa minimoidaan residuaalien neliäosumma SSE = n i=1 ^e 2 i = n i=1 kertoimien ^, ^ 1,...,^ p suhteen. (Y i ^^ 1 X i1 ^ p X ip ) 2 Asettamalla osittaisderivaatat nolliksi ja ratkaisemalla saadaan normaaliyhtäaläot. Yi = n^ + ^ 1 Xi1 + + ^ p Xip Yi X i1 = ^ X i1 + ^ 1 X 2 i1 + + ^ p Xi1 X ip. Yi X ip = ^ X ip + ^ 1 Xi1 X ip + + ^ p X 2 ip jossa on p +1 yhtäaläoäa jap + 1 tuntematonta (regressiokertoimet)

3 Esitys saadaan huomattavasti kompaktimpaan muotoon kun otetaan käayttäoäon matriisilaskennan merkinnäat Y 1 = + 1 X p X 1p + u 1 Y 2 = + 1 X p X 2p + u 2. Y n = + 1 X n1 + + p X np + u n, joka voidaan koota matriisiesitykseksi eli Y 1 Y 2. Y n = 1 X 11 X X 1p 1. X 21. X X 2p. 1 X n1 X n2... X np 1. p + u 1 u 2. u n NormaaliyhtÄalÄot: X y =(X X)ˆ josta :n OLS-estimaattoriksi saadaan jossa ˆ =(X X) 1 X y, ^ = ^ ^ 1 ^ 2. ^ p on p + 1 komponentin vektori. y = X + u

4 3.1 Standardoidut regressiokertoimet RegressioyhtÄalÄossÄa Y i = + 1 X i1 + + p X ip + u i kerroin j edustaa muuttujan X j marginaaliefektiäa. YleensÄa muuttujat ovat erilaisissa mittayksikäoissäa, joten regressiokertoimet eiväat ole suoraan vertailukelpoisia keskenäaäan. Jotta vertailua voitaisiin tehdäa, on kertoimet standardoitava. Standardoimalla muuttujat ensin y i = Y i ¹Y s y x ij = X ij ¹X j, s j jossa s y on Y :n keskihajonta ja s j on X j :n keskihajonta (j = 1,...,p). Estimoimalla kertoimet standardoitujen muuttujien yhtäaläostäa y i = 1 x i1 + 2 x i2 + + px ip + u i, jossa siis j = s j s y j saadaan standardodut kertoimet joita kutsutaan beeta-kertoimiksi. NÄamÄa ovat vertailukelpoisia keskenäaäan

5 Esim. Price ($ 1 000) SQFT BEDRMS BATHS i (Y ) (X 1 ) (X 2 ) (X 3 ) Standardoimattomaton regressiomalli P i = SQ i BE i BA i. Standardoitu regressiomalli p i = sq i be i ba i. Excel tulostus SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Standard E Observatio 14 ANOVA df SS MS F P-value Regression Residual Total Coeff Std Err t Stat P-value Intercept SQFT BEDRMS Ei tilastollisesti merkitsevä! BATHS Ei tilastollisesti merkitsevä! Coefficients SQFT BEDRMS BATHS DATA Price Price SQFT BEDRMS BATHS i ($1000) SQFTEDRMSBATHS Mean Standard E Median Mode Standard D Kurtosis Skewness Range Minimum Maximum Sum Count

6 3.2 Yhteensopivuus 3.3 Hypoteesien testaus Y i = + 1 X i1 + + p X ip + u i R 2 = SSR SST =1 SSE SST. R 2 :n kasvaa tai ei ainakaan pienene, kun malliin lisäatäaäan muuttujia, on niilläa todellista merkitystäa taiei. Haluttaessa "rangaista" turhien muuttujien lisäaäamistäa malliin voidaan käaytäaäa niin sanottuakorjattuaselitysastetta(adjustedr-square, ¹R 2 ) ¹R 2 SSE/(n p 1) =1 SST/(n 1) eli =1 n 1 n p 1 (1R2 ) YksittÄaisten kertoimien testaus t-testisuure: t j = missäa j =1,...,p ja j 0 (usein j 0 =0). Hypoteesit: tai ^ j 0 j s^ j, H 0 : j = j 0 H 1 : j = j 0. on jokin annettu luku jossa s 2 u = 1 n p 1 Esim. (Housing data) ¹R 2 =1 s2 u s 2, y (Yi ^Y i ) 2 ja s 2 y = 1 n 1 (Yi ¹Y ) 2. tai H 0 : j 0 j H 1 : j > 0 j. H 0 : j 0 j H 1 : j < 0 j

7 Esim. (Jatkoa) H 0 : 3 0 H 1 : 3 > 0 t = < = t.05 (10), joten H 0 jäaäa voimaan ja päaäattelemme, ettäa kylpyhuoneiden lukumäaäaräalläa ei ainakaan täamäan aineiston perusteella ole tilastollisesti merkitseväaäa vaikutusta asunnon hintaan. Samoin on makuuhuoneiden lukumäaäaräan kanssa (etumerkkikin on vastoin oletusta!). Useamman kertoimen samanaikainen testaus (R) Y = + 1 X p X p + u (U) Y = + 1 X p X p + p+1 X p p+m X p+m + v H 0 : p+1 = = p+m =0 H 1 :jokin p+k =0(k =1,...m) Testisuure: F = (SSE R SSE U )/m SSE U /(n p m 1) = SSE R SSE U n p m 1, SSE U m joka noudattaa F -jakaumaa vapausasteilla f 1 = m ja f 2 = n p m 1, jos H 0 on tosi. Huom. Erikoistapauksena on ANOVA-taulun F -testi, joka siis testaa onko milläaäan X-muuttujalla vaikutusta Y -muuttujaan

8 Kertoimien lineaarikombinaatioiden testaus Usein mallin parametrien väalille voidaan mielekkäaäalläa tavalla asettaa rajoitteita. Esim. Kulutusfunktio (makrotalous) C t = W t + 2 P t + u t, jossa C on kokonaiskulutus, W palkkatulot ja P muut tulot (päaäaomatulot etc). Parametri 1 on palkkatulojen rajakulutusalttius ja 2 muiden tulojen rajakulutusalttius. Samoja? ErÄas tapa: (R) C t = (W t + P t )+u t = Y t + u t (U) C t = W t + 2 P t + u t, jossa Y t = W t + P t. Testisuure F = (SSE R SSE U )/(df R df U ), SSE U /df U joka on nollahypoteesin vallitessa F -jakautunut vapausasteilla df R df U ja df U. H 0 : 1 = 2 H 1 : 1 = 2 Testaus voidaan toteuttaa useammalla eri tavalla, jotka kuitenkin johtavat samaan lopputulokseen

9 Esim. USA Data. CONS (C t ): Real consumption expenditures in billions of 1982 dollars GNP (Y t ): Real gross national product in billions of 1982 dollars WAGES: Total compensation of employees (wages, salaries, and supplements) in billions of current dollars. PRDEFL: Implicit price de ator for consumption, 1982 = 100 (this is a price index for consumption goods) Reaalipalkat ja muut tulot: W t = 100 WAGES t PRDEFL t P t = Y t W t. USA Consumption Data Annual Data on Consumption, GNP, Wage Bill, and Prices Ramu Ramanathan (1992). Introductory Econometrics with Applications, 2nd Edition, pp Year CONS GNP WAGES PRDEFL W P

10 Scatter Plots Regression Results Scatter plotofconsum ption vs W Consum ption (C) UNRESTRICTED MODEL Regression Statistics Multiple R R Square Adjusted R Square Standard Error 36.8 Observations 42 ANOVA df SS MS F Significance F Regression Residual Total Coefficients Standard Error t Stat P-value Intercept W P Consum ption (C) Wage (W ) Scatter PlotofConsum ption on P RESTRICTED MODEL Regression Statistics Multiple R R Square Adjusted R Square Standard Error 36.7 Observations 42 ANOVA df SS MS F Significance F Regression E-50 Residual Total Coefficients Standard Error t Stat P-value Intercept E-10 GNP E-50 Test for H 0 : 1 = 2 F df p-value , Ei ole tilastollisesti merkitsevä, täten H 0 jää voimaan eli kulutusalttiudet eivät poikkea toisistaan Other incom e (P)

11 Regressioestimaatit: (R) (U) ^C t = Y t ^C t = W t P t SSE R = SSE U = ( )/1 F = /39 F -jakauman taulukosta F 1,39 (.05) = 4.09 > 0.88 = F, joten H 0 : 1 = 2 (samat rajakulutusalttiudet) hyväaksytäaäan. TÄaten päaäadymme tulokseen, ettäa päaäaomatulojen ja palkkatuilojen rajakulutusalttiudet ovat samat. Sama SAS-ohjelman Reg-proceduurilla SAS-Ajojono options ls = 80 ps = 80; data usacons; infile d:\rawdata\usaconsu.dat firstobs=5; input Year CONS GNP WAGES PRDEFL W P; proc reg; model cons = w p; equality: test w-p=0; run; Tulokset: Model: MODEL1 Dependent Variable: CONS Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model Error C Total Root MSE R-square Dep Mean Adj R-sq C.V Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > T INTERCEP W P Test: EQUALITY Numerator: DF: 1 F value: Denominator: DF: 39 Prob>F:

12 Yleistys: y = X + u. Parametrien väalille asetetut (lineaariset) rajoitteet voidaan esittäaäa yleisessäa muodossa H 0 : C =0, jossa C on r (p +1) matriisi, missäa r on rajoitteiden lukumäaäaräa. Esim. EdellÄa Huom. df 1 = r =0. Esim. Cobb-Douglas tuotantofunktio Q t = ckt L t, jossa Q on tuotanto, K päaäaoma käayttäotunteina ja L tyäovoima tyäotunteina. Logaritmoimalla ja lisäaäamäalläa residuaalitermi saadaan lineaarinen ekonometrinen malli ln Q t = 0 + ln K t + ln L t + u t. Parametrit ja voidaan osoittautuvat joustoiksi, silläa = K Q ln Q = Q K ln K ja = L Q Q L = ln Q ln L

13 Havaitaan, esim. jos K 2K ja L 2L, niin Q 1 = c(2k) (2L) =2 + Q. (a) + =1 vakiot skaalatutot + < 1 laskevat skaalatutot + > 1 kasvavat skaalatuotot (b) = sama rajattuottavuus päaäaomallajatyäovoimalla. Vakioiden skaalatuottojen ( + = 1) testaamiseksi malli voidaan kirjoittaa muotoon ln Q t = 0 + (ln K t ln L t )+( + )lnl t + u t eli merkitsemäalläa Y t =lnq t, X 1t =lnk t ln L t, X 2t = ln L t ja 2 = +, saadaan Y t = 0 + X 1t + 2 X 2t + u 2. Vakioiden skaalatuottojen testaamiseksi testataan siis hypoteesia H 0 : 2 = 1 (vastahypoteesina H 1 : 2 =1). Testaus t-testilläa t = ^ 2 1 t(n 3), s^ 2 kun H 0 on tosi

14 Yhdysvaikutus 3.4 Mallin täasmennysvirhe (Spesi ointivirhe) Esim. Kulutusfunktio C t = + Y t + u t. Joskus oletetaan, ettäa rajakulutusalttius riippuu varallisuudesta. Esimerkiksi, jos riippuvuus on lineaarista, siten ettäa = A, jossa A ilmaisee varallisuutta. Silloin C t = + Y t + u t = + 1 Y t + 2 (Y t A t )+u t Testattava hypoteesi täalläoin on Mallin täasmennysvirheen syitäa voivatolla: muuttujien valinta funktion muoto jäaäannäostermin jakaumaominaisuudet H 0 : 2 =0. Jos H 0 hyläatäaäan on saatu evidenssiäa, ettäa varallisuus vaikuttaa rajakulutusalttiuteen

15 Tarkastellaan täassäa vain muuttujien valintaa Oletetaan, ettäa oikea malli on muotoa Y i = X i1 + 2 X i2 + u i, mutta estimoidaankin "liian lyhyt" malli Y i = X i1 + v i, jossa itse asiassa v i = u i + 2 X i2 (i =1,...,n). TÄallÄoin voidaan helposti osoittaa, ettäa jossa ja s 12 = 1 n 1 s E(^ 1 )= s 2, 2 s 2 2 = 1 n 1 n (X i1 ¹X 1 )(X i2 ¹X 2 ) i=1 n (X i2 ¹X 2 ) 2. i=1 TÄaten, jos s 12 =0on ^ 1 harhainen, eikäa se enäaäa kuvaax 1 :n marginaaliefektiäa, vaan X 1 suoraajaepäasuoraa vaikutusta (X 2 :n kautta). Jos taas estimoidaan "liian pitkäa" malli Y i = X i1 + 2 X i2 + 3 X i3 + u i, jossa siis todellisuudessa 3 = 0, niin E (^ 1 )= 1, E(^ 2 )= 2 ja E (^ 3 ) = 0. Estimaattorit ovat siis harhattomia, mutta voidaan kuitenkin osoittaa, ettäa estimaattoreiden varianssit ovat suurempia kuin oikein täasmennetyn mallin. SiispÄa estimoinnin tarkkuus käarsii

16 3.5 ViivÄastetyt muuttujat 3.6 Dummy muuttujat Taloudessa vaikutukset näakyväat usein viipeelläa Kaksi luokkaa Esim. Y t = + 1 G t + 2 G t1 + 3 M t + 4 M t1 + 5 T t + 6 T t1 + 7 X t + 8 X t1 + u t jossa Y on kansantulo, G julkinen kulutus, T verot, M rahan tarjonta ja X vienti. Estimointivaiheessa käaytettäavissäa on havainnot t =2, 3,... Viivemalleissa selittäajäanäa voi olla myäos selitetty muuttuja viiväastettynäa, esim. Y t = + 1 Y t1 + 2 X t + u t. Dummy- eli keinomuuttujien avulla voidaan selittäaviksi muutujiksi valita myäos kvalitatiivisia tekijäoitäa. Esim. Housing Data 1, asunnossa on uima-allas D = 0, asunnossa ei ole uima-allasta. Aiemmin esitimoitu parhaiten sopiva malli oli muotoa PRICE = + ln(sqft) + u. Jos uima-allas vaikuttaa vain hintatasoon, niin = D. TÄallÄoin PRICE = D + ln(sqft) + u

17 Jos altaallisten hinnan ja pinta-alan suhde on erilainen kuin altaattomien, niin = D,jolloin PRICE = + 1 ln(sqft)+ 1 (D ln(sqft))+u. Kolmas vaihtoehto on, ettäa se vaikuttaa molempiin, jolloin = D ja = D. PRICE = D + 1 ln(sqft) + 2 (D ln(sqft)) + u. Huom. Viimeinen malli on itse asiassa kaksi erillistäa regressiota. SillÄa erotuksella kuitenkin, ettäa jäaäannäostermienvarianssitovatsamat! Esim. House price data. Price ($1 000) SQFT BEDRMS BATHS POOL i (Y ) (X 1 ) (X 2 ) (X 3 ) (X 4 )

18 Tarkastellaan malleja Estimointitulokset PRICE = D + SQFT + u ja PRICE = D + ln(sqft) + u. Saadaan PRICE = D SQFT + u (0.898) (2.486) (3.951) R 2 =0.720 s = F (2, 11) = PRICE = D LNSQFT + u (3.388) (2.480) (4.854) R 2 =0.731 s = F (2, 11) = Price i ($1000) POOL SQFT DSQFT SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Squ Standard Error Observations 14 ANOVA df SS MS F P-Value Regression Residual Total Coefficients Standard Error t Stat P-value Intercept POOL SQFT SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Squ Standard Error Observations 14 ANOVA df SS MS F P-Value Regression Residual Total Coefficients Standard Error t Stat P-value Intercept SQFT DSQFT

19 Havaitaan Useampiluokkaiset kvalitatiiviset muuttujat Selitysaste paranee molemmissa tapauksissa huomattavasti Dummy muuttujat ovat tilastollisesti merkitseviäa Perusmallissa tarkoittaa, ettäa uimaallas nostaa asunnon hintaa keskimäaäarin $ (kallis!!) Log-mallissa tilanne on likipitäain sama, eli uima-allas nostaa asunnon hintaa keskimäaäarin $ Kotitalouksien säaäastäamiskäayttäaytyminen S = + X + u, jossa S =säaäastäaminen ja X = tulot. Ilmeisesti kotitalouden ikäa vaikuttaa myäos. Oletetaan, ettäa käaytettäavissäa onperheenpäaäan ikäaluokka alle 25, 25{55 ja yli 55. IkÄa korvataan täalläoin dummy-muuttujilla siten, ettäa yksi luokista otetaan referenssiluokaksi ja mäaäaritelläaäan dummy muuttujat kahdelle muulle luokalle

20 Esimerkiksi 1 Jos ikäaluokka on 25{55 D 1 = 0 muuten 1 Jos ikäaluokka on yli 55 D 2 = 0 muuten KontrolliryhmÄassÄa ovat kaikki alle 25 vuotiaat, jolloin siis D 1 = D 2 = 0. Malli on tulee muotoon S = D D 2 + X + u. Struktuurimuutoksen testaus SelitettÄavÄan ja selittäaväan muuttujan väalisessäa riippuvuudessa voi tapahtua tietylläa hetkelläa muutos Esim. Autojen polttoaineen kulutus. ÄOljykriisit 1974 ja Muuttuiko kulutusrakenne? Perusmalli ln C = + ln P + ln Y + u, jossa C on polttoaineen kulutus, P hinta ja Y tulot neljäanneksestäa alkaen D 1 = 0 muuten neljäanneksestäa alkaen D 2 = 0 muuten

21 Tarkastelussa on siis kolmea periodia: {1973/4, 1974/1{ ja 1979/1{. Jos on eroja, niin = D D 2 = D D 2 = D D 2 Rajoittamaton malli on siis muotoa ln C = D D ln P + 1 Z Z ln Y + 1 Z Z 4 + u jossa Z 1 = D 1 ln P, Z 2 = D 2 ln P, Z 3 = D 1 ln Y ja Z 4 = D 2 ln Y. Testaus: H 0 : 1 = 2 = 1 = 2 = 1 = 2 =0. Testisuureena F -testi kuten aiemmin. MyÄos muita hypoteeseja voidaan helposti johtaa. 125

3. Useamman selittäajäan regressiomalli

3. Useamman selittäajäan regressiomalli 3. Useamman selittäajäan regressiomalli p-selittäaväaäa muuttujaa Y i = α + β 1 X i1 +...+ β p X ip + u i i = 1,...,n (> p), missäa n = havaintojen lukumäaäaräa otoksessa. Oletukset kuten aiemmin: (1)

Lisätiedot

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i1 +...+ p X ip + u i

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i1 +...+ p X ip + u i 3. Useamman selittäajäan regressiomalli p-selittäaväaäa muuttujaa Y i = + 1 X i1 +...+ p X ip + u i i = 1,...,n (> p), missäa n = havaintojen lukumäaäaräa otoksessa. Oletukset kuten aiemmin: (1) E(u i

Lisätiedot

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli:

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli: 2. Yhden selittäajäan lineaarinen regressiomalli Regressio-termi peräaisin Galtonilta. IsÄan ja pojan pituus: PitkÄa isäa lyhyempi poika, lyhyt isäa pidempi poika. Son height (cm) 210 200 190 180 170 160

Lisätiedot

Regressio-termi peräaisin Galtonilta. IsÄan ja pojan pituus: PitkÄa isäa lyhyempi poika, lyhyt isäa pidempi poika.

Regressio-termi peräaisin Galtonilta. IsÄan ja pojan pituus: PitkÄa isäa lyhyempi poika, lyhyt isäa pidempi poika. 2. Yhden selittäajäan lineaarinen regressiomalli Regressio-termi peräaisin Galtonilta. IsÄan ja pojan pituus: PitkÄa isäa lyhyempi poika, lyhyt isäa pidempi poika. 210 200 Son height (cm) 190 180 170 160

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli:

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli: 2. Yhden selittäajäan lineaarinen regressiomalli Regressio-termi peräaisin Galtonilta. IsÄan ja pojan pituus: PitkÄa isäa lyhyempi poika, lyhyt isäa pidempi poika. Son height (cm) 21 2 19 18 17 16 15 15

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

proc glm data = ex61; Title2 Aliasing Structure of the 2_IV^(5-1) design; model y = A B C D E /Aliasing; run; quit; Title "Exercises 6"; Data ex61; input A B C D E y @@; Label A = "Furnance Temperature" B = "Heating Time" C = "Transfer Time" D = "Hold Down Time" E = "Quench of Oil Temperature" y = "Free Height of Leaf

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Capacity Utilization

Capacity Utilization Capacity Utilization Tim Schöneberg 28th November Agenda Introduction Fixed and variable input ressources Technical capacity utilization Price based capacity utilization measure Long run and short run

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Frequencies. Frequency Table

Frequencies. Frequency Table GET FILE='C:\Documents and Settings\haukkala\My Documents\kvanti\kvanti_harjo'+ '_label.sav'. DATASET NAME DataSet WINDOW=FRONT. FREQUENCIES VARIABLES=koulv paino /ORDER= ANALYSIS. Frequencies [DataSet]

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,

Lisätiedot

4. Poikkeamat regressio-oletuksista. 4.1 Heteroskedastisuus. Heteroskedastinen: Var(u i )= i kaikilla i. ei ole sama. Y i = + 1 X i1 + + p X ip + u i

4. Poikkeamat regressio-oletuksista. 4.1 Heteroskedastisuus. Heteroskedastinen: Var(u i )= i kaikilla i. ei ole sama. Y i = + 1 X i1 + + p X ip + u i 4. Poikkeamat regressio-oletuksista Y i = + 1 X i1 + + p X ip + u i Oletukset: (1) E(u i )=0 (2) Var(u i )= u 2 i (3) Cov(u i,u j )=0 i = j (4) X-muuttujat eiväat saa olla toistensa lineaarikombinaatioita

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Regressiodiagnostiikka Cooken etäisyys, Funktionaalinen muoto, Diagnostinen grafiikka, Diagnostiset testit, Heteroskedastisuus,

Lisätiedot

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,

Lisätiedot

Efficiency change over time

Efficiency change over time Efficiency change over time Heikki Tikanmäki Optimointiopin seminaari 14.11.2007 Contents Introduction (11.1) Window analysis (11.2) Example, application, analysis Malmquist index (11.3) Dealing with panel

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa: Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede

Lisätiedot

I. Principles of Pointer Year Analysis

I. Principles of Pointer Year Analysis I. Principles of Pointer Year Analysis Fig 1. Maximum (red) and minimum (blue) pointer years. 1 Fig 2. Principle of pointer year calculation. Fig 3. Skeleton plot graph created by Kinsys/Kigraph programme.

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle] Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen

Lisätiedot

4. Poikkeamat regressio-oletuksista. 4.1 Heteroskedastisuus. ei ole sama. Heteroskedastinen: Var(u i )= i kaikilla i. Y i = + 1 X i1 + + p X ip + u i

4. Poikkeamat regressio-oletuksista. 4.1 Heteroskedastisuus. ei ole sama. Heteroskedastinen: Var(u i )= i kaikilla i. Y i = + 1 X i1 + + p X ip + u i 4. Poikkeamat regressio-oletuksista 4.1 Heteroskedastisuus Y i = + 1 X i1 + + p X ip + u i Heteroskedastinen: Var(u i )= i 2 kaikilla i. ei ole sama Oletukset: (1) E(u i )=0 (2) Var(u i )= u 2 i (3) Cov(u

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

Lauri Tarkkonen: Erottelu analyysi

Lauri Tarkkonen: Erottelu analyysi Lauri Tarkkonen: Erottelu analyysi Erotteluanalyysin ongelma on kaksijakoinen:. Mikä havaittujen muuttujien (x i ) lineaarinen yhdistely erottaa mahdollisimman hyvin toisistaan tunnetut ryhmät? Siis selitettävä

Lisätiedot

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat: Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Mallin valinta Painotettu PNS-menetelmä Alaspäin askellus, Askellus, Askeltava valikointi, Diagnostinen grafiikka, Diagnostiset

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? 1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren

Lisätiedot

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

2. Keskiarvojen vartailua

2. Keskiarvojen vartailua 2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

2. Tietokoneharjoitukset

2. Tietokoneharjoitukset 2. Tietokoneharjoitukset Demotehtävät 2.1 Jatkoa kotitehtävälle. a) Piirrä aineistosta pistediagrammi (KULUTUS, SAIRAST) ja siihen estimoitu regressiosuora. KULUTUS on selitettävä muuttuja. b) Määrää estimoidusta

Lisätiedot

Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1

Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1 Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Hierarkkiset koeasetelmat -faktorikokeet Vastepintamenetelmä Aritmeettinen keskiarvo, Estimaatti, Estimaattori, -testi, aktorikokeet,

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

812336A C++ -kielen perusteet, 21.8.2010

812336A C++ -kielen perusteet, 21.8.2010 812336A C++ -kielen perusteet, 21.8.2010 1. Vastaa lyhyesti seuraaviin kysymyksiin (1p kaikista): a) Mitä tarkoittaa funktion ylikuormittaminen (overloading)? b) Mitä tarkoittaa jäsenfunktion ylimääritys

Lisätiedot

Harha mallin arvioinnissa

Harha mallin arvioinnissa Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,

Lisätiedot

Other approaches to restrict multipliers

Other approaches to restrict multipliers Other approaches to restrict multipliers Heikki Tikanmäki Optimointiopin seminaari 10.10.2007 Contents Short revision (6.2) Another Assurance Region Model (6.3) Cone-Ratio Method (6.4) An Application of

Lisätiedot

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6) Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista

Lisätiedot

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

Perhevapaiden palkkavaikutukset

Perhevapaiden palkkavaikutukset Perhevapaiden palkkavaikutukset Perhe ja ura tasa-arvon haasteena seminaari, Helsinki 20.11.2007 Jenni Kellokumpu Esityksen runko 1. Tutkimuksen tavoite 2. Teoria 3. Aineisto, tutkimusasetelma ja otos

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

19. Statistical Approaches to. Data Variations Tuomas Koivunen S ysteemianalyysin. Laboratorio. Optimointiopin seminaari - Syksy 2007

19. Statistical Approaches to. Data Variations Tuomas Koivunen S ysteemianalyysin. Laboratorio. Optimointiopin seminaari - Syksy 2007 19. Statistical Approaches to Data Variations Tuomas Koivunen 24.10.2007 Contents 1. Production Function 2. Stochastic Frontier Regressions 3. Example: Study of Texas Schools 4. Example Continued: Simulation

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Korrelaatiokertoinen määrittely 165

Korrelaatiokertoinen määrittely 165 kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x

Lisätiedot

Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen.

Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen. Ekonometria: Tavoite: PerehdyttÄaÄa (empiirisen) ekonometrisen tutkimuksen periaatteisiin, mallintamiseen, tekniikkaan ja käaytäannäon toteuttamiseen. Ekonometria (STAT.2020) Syksy 2005 Seppo PynnÄonen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Logistinen regressioanalyysi Vastemuuttuja Y on luokiteltu muuttuja Pyritään mallittamaan havaintoyksikön todennäköisyyttä kuulua

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot