1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Koko: px
Aloita esitys sivulta:

Download "1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA"

Transkriptio

1 Mat Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi, Jäännösvarianssin estimointi, Regressiokertoimen t- arvo, Kokonaisneliösumma, Lineaarinen regressiomalli, Mallineliösumma, Merkitsevyystaso, p-arvo, Pienimmän neliösumman menetelmä, Regressiokerroin, Regressio-kertoimen hajonta, Regressiokertoimen luottamusväli, Regressiokertoimen t-arvo, Regressiokertoimen estimointi, Residuaali, Satunnainen osa, Selitettävä muuttuja, Selittäjä, Selittävä muuttuja, Selitysaste, Sovite, Suoran kulmakerroin, Testi regressiokertoimelle, Testi selitysasteelle, Vakioselittäjä, Varianssianalyysihajotelma, Yhden selittäjän lineaarinen regressiomalli 1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA STATISTIX-tiedostossa TUPAKKA on annettu seuraavat tiedot 11 maasta: KULUTUS = Savukkeiden kulutus per capita 1930 SAIRAST = Keuhkosyöpätapausten lukumäärä per henkilöä 1950 Aineistoa on käsitelty 5. luentoviikon harjoitustehtävässä 2. (a) (b) (c) (d) (e) (d) Formuloi yhden selittäjän lineaarinen regressiomalli, jossa muuttujaa SAIRAST selitetään muuttujalla KULUTUS ja jossa on mukana vakio. Esitä tulkinnat mallin regressiokertoimille. Estimoi mallin regressiokertoimet PNS-menetelmällä ja esitä tulkinnat estimoiduille regressiokertoimille. Määrää kertoimien hajonnat sekä muodosta regressiosuoran kulmakertoimelle 95 %:n luottamusväli. Määrää estimoidun mallin selityaste. Onko regressiosuoran kulmakerroin tilastollisesti merkitsevä? Käytä testissä 1 %:n merkitsevyystasoa. Testaa nollahypoteesia, jonka mukaan muuttujan KULUTUS regressiokerroin on nolla estimoidun mallin selitysasteeseen perustuvalla F-testillä 1 %:n merkitsevyystasoa käyttäen. Ota saamastasi testisuureen arvosta neliöjuuri ja vertaa sitä kohdassa (e) käyttämäsi testisuureen arvoon. Onko tulos sattuma? TKK/SAL Ilkka Mellin (2005) 1/28

2 RATKAISU: (a) MALLIN FORMULOINTI Formuloidaan yhden selittäjän lineaarinen regressiomalli: Mallissa ja yi = β0 + β1 xi + εi, i = 1,2,, n y t = SAIRAST = Selitettävä muuttuja x t = KULUTUS = Selittävä muuttuja ε t = Jäännöstermi β 0 = Regressiokerroin, vakio β 1 = Selittävän muuttujan KULUTUS regressiokerroin Regressiokertoimien tulkinta: β 0 : Jos maassa ei ole poltettu tupakkaa (KULUTUS = 0) vuonna 1930, kerroin β 0 kertoo keuhkosyöpään sairastuneiden lukumäärän per henkilöä vuonna β 1 : Jos maassa A on vuonna 1930 poltettu 1 savuke enemmän per capita kuin maassa B, niin kerroin β 1 kertoo kuinka monta keuhkosyöpätapausta per henkilöä enemmän tai vähemmän maassa A on tavattu maahan B verrattuna vuonna TKK/SAL Ilkka Mellin (2005) 2/28

3 (b) REGRESSIOKERTOIMIEN ESTIMOINTI Käytämme kertoimien estimointiin pienimmän neliösumman menetelmää. Selitettävä muuttuja (Dependent Variable) = SAIRAST Selittävä muuttuja eli selittäjä (Independent Variable) = KULUTUS Statistics > Linear Models > Linear Regression Dependent Variable = SAIRAST Independent Variables = KULUTUS STATISTIX FOR WINDOWS TUPAKKA UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF SAIRAST PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P CONSTANT KULUTUS R-SQUARED RESID. MEAN SQUARE (MSE) ADJUSTED R-SQUARED STANDARD DEVIATION SOURCE DF SS MS F P REGRESSION RESIDUAL TOTAL CASES INCLUDED 11 MISSING CASES 0 Regressiokertoimet COEFFICIENT CONSTANT b 0 = Jos maassa ei ole poltettu tupakkaa (KULUTUS = 0) vuonna 1930, keuhkosyöpään sairastuneiden lukumäärä on ollut n. 66 per henkilöä vuonna COEFFICIENT KULUTUS b 1 = Jos maassa A on poltettu 1 savuke enemmän per capita kuin maassa B vuonna 1930, vuonna 1950 maassa A on tavattu n keuhkosyöpätapausta per henkilöä enemmän kuin maassa B. TKK/SAL Ilkka Mellin (2005) 3/28

4 (c) Kertoimien hajonnat ja luottamusvälit Kertoimien hajonnat STD ERROR CONSTANT ˆD( b 0) = KULUTUS ˆD( b 1) = Luottamusväli Määrätään ensin 95 %:n luottamusväliin liittyvät luottamuskertoimet. Statistics > Probability Functions Function =T Inverse (p, df) P = DF = 9 Results T Inverse(0.975, 9) = 2.26 Regressiosuoran kulmakertoimen β 1 95 %:n luottamusväli: b ± t ˆD( b) = ± = ± α /2 1 eli n. ( 0.07, 0.39) Huomaa, että luottamusväli on huomattavan leveä, koska havaintoja oli vain 11. (d) Estimoidun mallin selitysaste Selitysaste R-SQUARED R 2 = Estimoitu malli on selittänyt n. 55 % selitettävän muuttujan SAIRAST arvojen vaihtelusta. TKK/SAL Ilkka Mellin (2005) 4/28

5 (e) Kulmakertoimen tilastollinen merkitsevyys t-testi Nollahypoteesi: H 01 : β 1 = 0 t-testisuureen arvo STUDENT S T: t b Vastaava p-arvo P: = = = D( ˆ b1 ) p = Koska p < 0.01, nollahypoteesi H 01 voidaan hylätä 1 %:n merkitsevyystasolla. Johtopäätös: Suurempi tupakanpolton määrä lisää tilastollisesti merkitsevästi keuhkosyöpätapausten suhteellista lukumäärää. (f) Mallin tilastollinen merkitsevyys F-testi Nollahypoteesi: H 01 : β 1 = 0 F-testisuureen arvo F: Vastaava p-arvo P: 2 R F = ( n 2) = R p = Koska p < 0.01, nollahypoteesi H 01 voidaan hylätä 1 %:n merkitsevyystasolla. Selvästi F = t 1 Yhden selittäjän regressiomallissa tavanomainen t-testi ja tässä käsitelty F-testi nollahypoteesille H 01 ovat ekvivalentteja. TKK/SAL Ilkka Mellin (2005) 5/28

6 2. REGRESSIOANALYYSIN TULOSTEN GRAAFINEN ANALYYSI Jatkoa tehtävälle 1. (a) Piirrä aineistosta pistediagrammi (KULUTUS, SAIRAST) ja siihen estimoitu regressiosuora. (b) Määrää estimoidusta mallista sovitteet yˆi ja residuaalit ei STATISTIX-ohjelman regressioanalyysiohjelmalla ja tallettamalla ne tiedostoon TUPAKKA muuttujiksi FIT (= sovite) ja RES (= residuaali). (c) (d) RATKAISU: (a) Piirrä pistediagrammit (SAIRAST, FIT) ja (FIT, RES). Tutki USA:n sijaintia kuviossa. Onko USA poikkeava havainto? PISTEDIAGRAMMI JA REGRESSIOSUORA Piirretään selitettävän muuttujan SAIRAST arvot selittäjän KULUTUS arvoja vastaan. Statistics > Summary Statistics > Scatter Plot X Axis Variables = KULUTUS Y Axis Variables = SAIRAST Display Regession Line 490 Scatter Plot of SAIRAST vs KULUTUS 400 SAIRAST USA KULUTUS TKK/SAL Ilkka Mellin (2005) 6/28

7 (b) SOVITTEET JA RESIDUAALIT Talletetaan sovitteet yˆi (Fitted Value) ja residuaalit ei (Residual). Linear Regression Coefficient Table Results > Save Residuals Fitted Value = FIT Residual = RES STATISTIX FOR WINDOWS TUPAKKA CASE MAA KULUTUS SAIRAST FIT RES 1 Islanti Norja Ruotsi Kanada Tanska Itavalta USA Hollanti Sveitsi Suomi GB (c) Pistediagrammit (Selitettävä, Sovite) ja (Sovite, Residuaali) Pistediagrammi (Selitettävä, Sovite) Piirretään sovitteet y selitettävän muuttujan SAIRAST arvoja vastaan. ˆi Statistics > Summary Statistics > Scatter Plot X Axis Variables = SAIRAST Y Axis Variables = FIT TKK/SAL Ilkka Mellin (2005) 7/28

8 Scatter Plot of FIT vs SAIRAST USA 260 FIT SAIRAST Diagrammi kuvaa mallin hyvyyttä: Malli on sitä parempi, mitä lähempänä pisteet ( y, yˆ ), i = 1, 2,, n ovat suoraa viivaa. Myös poikkeavat havainnot erottuvat usein selvästi. Huomaa, että pisteistä ( y, ˆ i yi), i = 1, 2,, n määrätty Pearsonin tulomomenttikorrelaatiokertoimen neliö on sama kuin selitysaste: Tarkista tämä! [ ] 2 2 Cor( yy, ˆ) = R i i Pistediagrammi (Sovite, Residuaali) Piirretään residuaalit e i sovitteita yˆi vastaan. Statistics > Summary Statistics > Scatter Plot X Axis Variables = FIT Y Axis Variables = RES TKK/SAL Ilkka Mellin (2005) 8/28

9 Scatter Plot of RES vs FIT RES 0-60 USA FIT Diagrammi kuvaa mallin hyvyyttä: Malli on sitä parempi, mitä lähempänä pisteet ( yˆ, e), i = 1, 2,, n ovat suoraa e = 0. Myös poikkeavat havainnot erottuvat usein selvästi. i i (d) Poikkeavat havainnot Kaikissa kohtien (a)-(c) diagrammeissa USA erottuu aika selvästi poikkeavana havaintona. 3. ENNUSTAMINEN YHDEN SELITTÄJÄN LINEAARISELLA REGRESSIOMALLILLA Jatkoa tehtävälle 1. (a) (b) (c) Määrää ennusteet ja luottamusvälit muuttujan SAIRAST arvolle, kun muuttuja KULUTUS saa arvot 600 ja Vertaa luottamusvälien pituuksia. Määrää ennusteet ja muuttujan SAIRAST odotettavissa olevalle arvolle, kun muuttuja KULUTUS saa arvot 600 ja Vertaa luottamusvälien pituuksia toisiinsa ja kohdan (a)-luottamusväleihin. Piirrä estimoidun regressioanalyysin tuloksien pohjalta luottamusvyöt muuttujan SAIRAST arvoille ja odotettavissa oleville arvoille. TKK/SAL Ilkka Mellin (2005) 9/28

10 RATKAISU: (a)&(b) Ennusteet selitettävän muuttujan arvoille ja odotettavissa oleville arvoille Ennuste 1 Ennustetaan keuhkosyöpätapausten lukumäärä ja odotettavissa oleva lukumäärä per henkilöä vuonna 1950 maassa, jossa tupakan kulutus on ollut 600 savuketta per capita vuonna Linear Regression Coefficient Table Results > Prediction Specification Method = Values Method Independent Variables = KULUTUS Predictor Values = 600 STATISTIX FOR WINDOWS TUPAKKA PREDICTED/FITTED VALUES OF SAIRAST LOWER PREDICTED BOUND LOWER FITTED BOUND PREDICTED VALUE FITTED VALUE UPPER PREDICTED BOUND UPPER FITTED BOUND SE (PREDICTED VALUE) SE (FITTED VALUE) UNUSUALNESS (LEVERAGE) PERCENT COVERAGE 95.0 CORRESPONDING T 2.26 PREDICTOR VALUES: KULUTUS = Ennuste selitettävän muuttujan SAIRAST arvolle PREDICTED VALUE ( yx= ˆ " 600) = Luottamusväli selitettävän muuttujan SAIRAST arvolle luottamustasolla 0.95 LOWER PREDICTED BOUND = UPPER PREDICTED BOUND = SE (PREDICTED VALUE) = (4.4396, ) = ± = ± TKK/SAL Ilkka Mellin (2005) 10/28

11 Ennuste selitettävän muuttujan SAIRAST odotettavissa olevalle arvolle FITTED VALUE ( yx= ˆ " 600) = Luottamusväli selitettävän muuttujan SAIRAST odotettavissa olevalle arvolle luottamustasolla 0.95 LOWER FITTED BOUND = UPPER FITTED BOUND = SE (FITTED VALUE) = (145.83, ) = ± = ± Luottamusväli selitettävän muuttujan SAIRAST arvolle on leveämpi kuin selitettävän muuttujan odotettavissa olevalle arvolle. Ennuste 2 Ennustetaan keuhkosyöpätapausten lukumäärä ja odotettavissa oleva lukumäärä per henkilöä vuonna 1950 maassa, jossa tupakan kulutus on ollut 1400 savuketta per capita vuonna Linear Regression Coefficient Table Results > Prediction Specification Method = Values Method Independent Variables = KULUTUS Predictor Values = 1400 STATISTIX FOR WINDOWS TUPAKKA PREDICTED/FITTED VALUES OF SAIRAST LOWER PREDICTED BOUND LOWER FITTED BOUND PREDICTED VALUE FITTED VALUE UPPER PREDICTED BOUND UPPER FITTED BOUND SE (PREDICTED VALUE) SE (FITTED VALUE) UNUSUALNESS (LEVERAGE) PERCENT COVERAGE 95.0 CORRESPONDING T 2.26 PREDICTOR VALUES: KULUTUS = TKK/SAL Ilkka Mellin (2005) 11/28

12 Ennuste selitettävän muuttujan SAIRAST arvolle PREDICTED VALUE ( yx= ˆ " 1400) = Luottamusväli selitettävän muuttujan SAIRAST arvolle luottamustasolla 0.95 LOWER PREDICTED BOUND = UPPER PREDICTED BOUND = SE (PREDICTED VALUE) = ± = ± = (151.97, ) Luottamusväli selitettävän muuttujan SAIRAST arvolle on leveämpi kuin selitettävän muuttujan odotettavissa olevalle arvolle. Lisäksi luottamusväli selitettävän muuttuja SAIRAST arvolle on pisteessä 1400 leveämpi kuin pisteessä 600, koska piste 1400 on kauempana selittäjän KULUTUS havaittujen arvojen aritmeettisesta keskiarvosta kuin piste 600. (c) Luottamusvyöt Piirretään selitettävän muuttujan SAIRAST arvot selittäjän KULUTUS arvoja vastaan samaan kuvaan regressiosuoran ja selitettävän muuttujan arvojen ja odotettavissa olevien arvojen luottamusvöiden kanssa. Linear Regression Coefficient Table Results > Plots Simple Regression Plot TKK/SAL Ilkka Mellin (2005) 12/28

13 Simple Regression Plot SAIRAST KULUTUS SAIRAST = * KULUTUS 95% conf and pred intervals Luottamusvöistä leveämpi on selitettävän muuttujan SAIRAST arvon luottamusvyö ja kapeampi on selitettävän muuttujan SAIRAST odotettavissa olevan arvon luottamusvyö. 4. POIKKEAVIEN HAVAINTOJEN VAIKUTUS Jatkoa tehtäville 1 ja 3. Tehtävän 5.2. ratkaisussa esitettiin syitä, miksi USA voidaan sulkea analysoitavan aineiston ulkopuolelle. (a) (b) (c) Estimoi regressiomallin parametrit uudelleen jättämällä USA pois. Piirrä aineistosta pistediagrammi (KULUTUS, SAIRAST) ja siihen estimoitu regressiosuora sekä luottamusvyöt muuttujan SAIRAST arvoille ja odotettavissa oleville arvoille. Vertaa tuloksia tehtävissä 1 ja 3 saamiisi tuloksiin. Mitä on tapahtunut estimoidulle kulmakertoimelle, estimoidun mallin selitysasteelle ja ennusteiden luottamusvöille? TKK/SAL Ilkka Mellin (2005) 13/28

14 RATKAISU: (a) Parametrien estimointi Suljetaan USA estimoinnista pois. Data > Omit / Select / Restore Cases Omit / Select / Restore Expression Omit Case = 7 Estimoidaan mallin parametrit. Statistics > Linear Models > Linear Regression Dependent Variable = SAIRAST Independent Variables = KULUTUS STATISTIX FOR WINDOWS TUPAKKA UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF SAIRAST PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P CONSTANT KULUTUS R-SQUARED RESID. MEAN SQUARE (MSE) ADJUSTED R-SQUARED STANDARD DEVIATION SOURCE DF SS MS F P REGRESSION RESIDUAL TOTAL CASES INCLUDED 10 MISSING CASES 0 TKK/SAL Ilkka Mellin (2005) 14/28

15 (b) Luottamusvyöt Piirretään selitettävän muuttujan SAIRAST arvot selittäjän KULUTUS arvoja vastaan samaan kuvaan regressiosuoran ja selitettävän muuttujan arvojen ja odotettavissa olevien arvojen luottamusvöiden kanssa. Linear Regression Coefficient Table Results > Plots Simple Regression Plot 470 Simple Regression Plot SAIRAST KULUTUS SAIRAST = * KULUTUS 95% conf and pred intervals (c) Poikkeavan havainnon vaikutus USA Regressiosuoran kulmakerroin Estimoidun mallin selitysaste Mukana Poistettu Havainnon USA poistaminen on kasvattanut estimoidun regressiosuoran kulmakerrointa ja selitysastetta. USA kääntää mukana ollessaan estimoitua regressiosuoraa puoleensa ja pois muiden havaintojen muodostamasta lineaarisesta trendistä. Luottamusvyöt ovat ilman USA:ta selvästi kapeampia. TKK/SAL Ilkka Mellin (2005) 15/28

16 Johtopäätös: Malli todistaa tupakanpolton ja keuhkosyövän riippuvuudesta voimakkaammin, jos USA ei ole mukana estimoinnissa. 5. HYPOTEESIEN TESTAUS JA POIKKEAVIEN HAVAINTOJEN VAIKUTUS Ostovoimapariteetti-periaatteen mukaan muutokset kahden maan valuuttojen vaihtokurssissa tasapainottavat ennen pitkää maiden inflaatiovauhtien erot niin, että tehokkaassa kansainvälisessä taloudessa vaihtokurssit antavat kummallekin valuutalle omassa taloudessaan saman ostovoiman. Haluamme testata empiirisesti oletusta ostovoimapariteetti-periatteesta. Periaatetta voidaan testata estimoimalla eri maiden valuuttojen vaihtokurssien muutoksia ja inflaatiovauhtien erotuksia koskevista tiedoista regressioyhtälö jossa CEXCR = β 0 + β 1 CINFR + ε CEXCR = Keskimääräinen vuosimuutos vaihtokurssissa CINFR = Keskimääräisten vuotuisten inflaatiovauhtien erotus Ostovoimapariteetti-periaate vastaa tilastollisia hypoteeseja: H 00 : β 0 = 0 H 01 : β 1 = 1 STATISTIX-tiedostossa PPP on annettu seuraavat tiedot 44 maasta: CEXCR = Keskimääräinen vaihtokurssin vuosimuutos USA:n dollariin nähden CINFR = Keskimääräinen inflaatiovauhdin erotus USA:han verrattuna Tiedot on annettu kahdelta ajanjaksolta: (a) (b) (c) (d) (e) : CEXCR75, CINFR : CEXCR85, CINFR85 Estimoi regressiomallin parametrit ajanjakson tiedoista. Testaa ym. hypoteeseja. Analysoi estimoituloksia graafisesti piirtämällä seuraavat kuviot: Selitettävä vastaan selittäjä plus regressiosuora luottamusväleineen Sovite vastaan selitettävä Residuaali vastaan sovite Rankit Plot residuaaleista Identifioi ulkopuolinen havainto. Toista kohdat (a)-(c) ilman kohdassa (d) identifioitua ulkopuolista havaintoa ja vertaa tuloksia. TKK/SAL Ilkka Mellin (2005) 16/28

17 (f) Toista kohdat (a)-(b) ilman kohdassa (d) identifioitua ulkopuolista havaintoa ajanjakson tiedoista. Testitulosten mukaan ostovoimapariteetti-periaate pätee pitkällä aikavälillä, mutta ei lyhyellä! Tämä on myös talousteorian mukainen tulos. RATKAISU: (a) Mallin estimointi ajanjakson tiedoista Selitettävä muuttuja (Dependent Variable) = CEXCR75 Selittävä muuttuja eli selittäjä (Independent Variable) = CINFR75 Statistics > Linear Models > Linear Regression Dependent Variable = CEXCR75 Independent Variables = CINFR75 STATISTIX FOR WINDOWS PPP UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF CEXCR75 PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P CONSTANT CINFR R-SQUARED RESID. MEAN SQUARE (MSE) ADJUSTED R-SQUARED STANDARD DEVIATION SOURCE DF SS MS F P REGRESSION RESIDUAL TOTAL CASES INCLUDED 44 MISSING CASES 0 (b) Hypoteesien testaus Olkoon nollahypoteesina H 00 : β 0 = 0 Koska kertoimen β 0 (= CONSTANT) t-testisuureen arvoa 0.02 vastaava p-arvo on , voidaan nollahypoteesi H 00 jättää voimaan. Olkoon nollahypoteesina H 01 : β 1 = 1 TKK/SAL Ilkka Mellin (2005) 17/28

18 Testisuureen arvo on t b β = = = D( ˆ b1 ) Koska t-testisuureen arvoa vastaava p-arvo on , voidaan nollahypoteesi H 01 jättää voimaan. Johtopäätös: Aineisto on sopusoinnussa ostovoimapariteetti-periaatteen kanssa. (c) Regressiografiikkaa Pistediagrammi (Selittäjä, Selitettävä) Piirretään selitettävän muuttujan CEXCR75 arvot selittäjän CINFR75 arvoja vastaan samaan kuvaan regressiosuoran ja selitettävän muuttujan arvojen ja odotettavissa olevien arvojen luottamusvöiden kanssa. Linear Regression Coefficient Table Results > Plots Simple Regression Plot 60 Simple Regression Plot 40 CEXCR CINFR75 CEXCR75 = -9.28E * CINFR75 95% conf and pred intervals TKK/SAL Ilkka Mellin (2005) 18/28

19 Pistediagrammi (Selitettävä, Sovite) Talletetaan sovitteet y ˆi ja residuaalit ei. Linear Regression Coefficient Table Results > Save Residuals Fitted Value = FIT Residual = RES Piirretään sovitteet y ˆi selitettävän muuttujan arvoja yi vastaan. Statistics > Summary Statistics > Scatter Plot X Axis Variables = CEXCR75 Y Axis Variables = FIT 70 Scatter Plot of FIT vs CEXCR75 50 FIT CEXCR75 TKK/SAL Ilkka Mellin (2005) 19/28

20 Pistediagrammi (Sovite, Residuaali) Piirretään residuaalit e i sovitteita yˆi vastaan. Linear Regression Coefficient Table Results > Plots Std Resids by Fitted Values 5 Regression Residual Plot Standardized Residuals Fitted values TKK/SAL Ilkka Mellin (2005) 20/28

21 Rankit plot -kuvio Linear Regression Coefficient Table Results > Plots Wilk-Shapiro/Rankit Plot 3 Wilk-Shapiro / Rankit Plot Standardized Residuals Rankits Approximate Wilk-Shapiro cases Wilkin ja Shapiron testisuureen arvo on %:n merkitsevyystasoa vastaava kriittinen arvo on 0.944, joten nollahypoteesi normaalisuudesta joudutaan hylkäämään. (d) Poikkeavan havainnon identifiointi Nuolella yo. kuvioihin merkitty poikkeava havainto on havainto numero 21: Iran. TKK/SAL Ilkka Mellin (2005) 21/28

22 (e) Poikkeavan havainnon vaikutus Suljetaan IRAN estimoinnista pois. Data > Omit / Select / Restore Cases Omit / Select / Restore Expression Omit Case = 21 Estimoidaan mallin parametrit. Statistics > Linear Models > Linear Regression Dependent Variable = CEXCR75 Independent Variables = CINFR75 STATISTIX FOR WINDOWS PPP UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF CEXCR75 PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P CONSTANT CINFR R-SQUARED RESID. MEAN SQUARE (MSE) ADJUSTED R-SQUARED STANDARD DEVIATION SOURCE DF SS MS F P REGRESSION RESIDUAL TOTAL CASES INCLUDED 43 MISSING CASES 0 Hypoteesien testaus Olkoon nollahypoteesina H 00 : β 0 = 0 Koska kertoimen β 0 (= CONSTANT) t-testisuureen arvoa 0.78 vastaava p-arvo on , voidaan nollahypoteesi H 00 jättää voimaan. TKK/SAL Ilkka Mellin (2005) 22/28

23 Olkoon nollahypoteesina H 01 : β 1 = 1 Testisuureen arvo on t b β = = = D( ˆ b1 ) Koska t-testisuureen arvoa 1.19 vastaava p-arvo on , voidaan nollahypoteesi H 01 jättää voimaan. Johtopäätös: Aineisto on sopusoinnussa ostovoimapariteetti-periaatteen kanssa. Pistediagrammi (Selittäjä, Selitettävä) Piirretään selitettävän muuttujan CEXCR75 arvot selittäjän CINFR75 arvoja vastaan samaan kuvaan regressiosuoran ja selitettävän muuttujan arvojen ja odotettavissa olevien arvojen luottamusvöiden kanssa. Linear Regression Coefficient Table Results > Plots Simple Regression Plot 60 Simple Regression Plot 40 CEXCR CINFR75 CEXCR75 = * CINFR75 95% conf and pred intervals TKK/SAL Ilkka Mellin (2005) 23/28

24 Pistediagrammi (Selitettävä, Sovite) Talletetaan sovitteet y ˆi ja residuaalit ei. Linear Regression Coefficient Table Results > Save Residuals Fitted Value = FIT Residual = RES Piirretään sovitteet y ˆi selitettävän muuttujan arvoja yi vastaan. Statistics > Summary Statistics > Scatter Plot X Axis Variables = CEXCR75 Y Axis Variables = FIT 70 Scatter Plot of FIT vs CEXCR75 50 FIT CEXCR75 TKK/SAL Ilkka Mellin (2005) 24/28

25 Pistediagrammi (Sovite, Residuaali) Piirretään residuaalit e i sovitteita yˆi vastaan. Linear Regression Coefficient Table Results > Plots Std Resids by Fitted Values 2.7 Regression Residual Plot 1.8 Standardized Residuals Fitted values TKK/SAL Ilkka Mellin (2005) 25/28

26 Rankit plot -kuvio Linear Regression Coefficient Table Results > Plots Wilk-Shapiro/Rankit Plot 2.8 Wilk-Shapiro / Rankit Plot Standardized Residuals Rankits Approximate Wilk-Shapiro cases Wilkin ja Shapiron testisuureen arvo on %:n merkitsevyystasoa vastaava kriittinen arvo on 0.943, joten nollahypoteesi normaalisuudesta joudutaan hylkäämään, mutta ei niin voimakkaasti kuin silloin, kun Iran oli estimoitaessa mukana. Kun saatuja estimointituloksia ja tuloksia havainnollistavia diagrammeja verrataan niihin tuloksiin ja diagrammeihin, jotka on saatu, kun Iran on ollut estimoinnissa mukana, nähdään kuinka poikkeava havainto vaikuttaa selvästi estimointituloksiin ja digarammeihin. Iranin poikkeuksellisuus havaintona johtunee siitä, että ko. vuosina Iranissa tapahtui suuria mullistuksia: Shaahin kukistuminen ja fundamentalistisen hallituksen nousu valtaan. TKK/SAL Ilkka Mellin (2005) 26/28

27 (f) Mallin estimointi ajanjakson tiedoista Selitettävä muuttuja (Dependent Variable) = CEXCR85 Selittävä muuttuja eli selittäjä (Independent Variable) = CINFR85 Statistics > Linear Models > Linear Regression Dependent Variable = CEXCR85 Independent Variables = CINFR85 STATISTIX FOR WINDOWS PPP UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF CEXCR85 PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T P CONSTANT CINFR R-SQUARED RESID. MEAN SQUARE (MSE) ADJUSTED R-SQUARED STANDARD DEVIATION SOURCE DF SS MS F P REGRESSION RESIDUAL TOTAL CASES INCLUDED 43 MISSING CASES 0 Hypoteesien testaus Olkoon nollahypoteesina H 00 : β 0 = 0 Koska kertoimen β 0 (= CONSTANT) t-testisuureen arvoa 5.24 vastaava p-arvo on neljällä desimaalilla , voidaan nollahypoteesi H 00 hylätä. Olkoon nollahypoteesina H 01 : β 1 = 1 Testisuureen arvo on t b β = = = D( ˆ b1 ) Koska t-testisuureen arvoa 3.12 vastaava p-arvo on , voidaan nollahypoteesi H 01 hylätä. Johtopäätös: Aineisto ei ole sopusoinnussa ostovoimapariteetti-periaatteen kanssa. TKK/SAL Ilkka Mellin (2005) 27/28

28 (f)-kohdassa saatu tulos ei liene ristiriidassa kohdassa (c) saatujen testitulosten kanssa, koska ostovoimapariteetin pitäisikin tulla esille vasta pitkällä aikavälillä. TKK/SAL Ilkka Mellin (2005) 28/28

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli TKK (c) Ilkka Melli (2005) Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää

Lisätiedot

MS-C2{04 Tilastollisen analyysin perusteet

MS-C2{04 Tilastollisen analyysin perusteet MS-C2{04 Tilastollisen analyysin perusteet Tentti 7.4.20 4A/irtanen Kirjoita selvästi jokaiseen koepaperiin alla mainitussa järjestyksessä: OHlprrn (i) (ii) MS-C204 TAP 7.4.204 opiskelijanumero + kirjain

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli

Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli MS-C2128 Ennustaminen ja aikasarja-analyysi 1. harjoitukset / Tehtävät Kotitehtävät: 2 Aiheet: Aluksi Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli Tällä kurssilla käytetään

Lisätiedot

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen

Lisätiedot

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat: Mat-.04 Tilastollise aalyysi perusteet / Ratkaisut Aiheet: Avaisaat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahde riippumattoma otokse t-testit, Nollahypoteesi, p-arvo, Päätössäätö, Testi,

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli:

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli: 2. Yhden selittäajäan lineaarinen regressiomalli Regressio-termi peräaisin Galtonilta. IsÄan ja pojan pituus: PitkÄa isäa lyhyempi poika, lyhyt isäa pidempi poika. Son height (cm) 21 2 19 18 17 16 15 15

Lisätiedot

SELVITTÄJÄN KOMPETENSSISTA

SELVITTÄJÄN KOMPETENSSISTA OTM, KTM, Mikko Hakola, Vaasan yliopisto, Laskentatoimen ja rahoituksen laitos Helsinki 20.11.200, Helsingin kauppakorkeakoulu Projekti: Yrityksen maksukyky ja strateginen johtaminen SELVITTÄJÄN KOMPETENSSISTA

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1

Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1 Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Hierarkkiset koeasetelmat -faktorikokeet Vastepintamenetelmä Aritmeettinen keskiarvo, Estimaatti, Estimaattori, -testi, aktorikokeet,

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli

Yhden selittäjän lineaarinen regressiomalli Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli

Lisätiedot

Empiirinen projekti. Olli-Matti Laine Kauppatieteet

Empiirinen projekti. Olli-Matti Laine Kauppatieteet Empiirinen projekti Olli-Matti Laine Kauppatieteet 1 Contents 1. Johdanto... 3 2. Kuvaileva osa... 4 3. Analyysiosa... 17 4. Yhteenveto... 35 2 1. Johdanto Tutkin projektissa tilastollisin menetelmin kansantaloudellisia

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i1 +...+ p X ip + u i

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i1 +...+ p X ip + u i 3. Useamman selittäajäan regressiomalli p-selittäaväaäa muuttujaa Y i = + 1 X i1 +...+ p X ip + u i i = 1,...,n (> p), missäa n = havaintojen lukumäaäaräa otoksessa. Oletukset kuten aiemmin: (1) E(u i

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

SEM1, työpaja 2 (12.10.2011)

SEM1, työpaja 2 (12.10.2011) SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):

Lisätiedot

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä: 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

Altistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72

Altistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72 Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut iheet: vainsanat: Kaksisuuntainen varianssianalsi Lohkoasetelmat Latinalaiset neliöt ritmeettinen

Lisätiedot

SPSS OPAS. Metropolia Liiketalous

SPSS OPAS. Metropolia Liiketalous 1 Metropolia Liiketalous SPSS OPAS Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio 8 8.Korrelaatio

Lisätiedot

Usean selittävän muuttujan regressioanalyysi

Usean selittävän muuttujan regressioanalyysi Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Pientalojen radonpitoisuuksien tilastollinen analyysi

Pientalojen radonpitoisuuksien tilastollinen analyysi Pientalojen radonpitoisuuksien tilastollinen analyysi (Valmiin työn esittely) 11.4.2011 Ohjaaja: DI Jirka Poropudas Valvoja: Prof. Raimo Hämäläinen Sisältö 1. Tausta 2. Tavoitteet 3. Menetelmät 4. Tulokset

Lisätiedot

5 Osa 5: Ohjelmointikielen perusteita

5 Osa 5: Ohjelmointikielen perusteita 5 Osa 5: Ohjelmointikielen perusteita 5.1 Omat funktiot R on lausekekieli: Kaikki komennot kuten funktiokutsut ja sijoitusoperaatiot ovat lausekkeita. Lausekkeet palauttavat jonkin arvon. Lausekkeita voidaan

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 2. Tehtävät 2-4 sekä 6 10 liittyvät keväällä 2002 suoritettuun ammattikorkeakoulusta

Lisätiedot

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 3

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 3 Christina Gustafsson Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 3 Kevät 2014 SISÄLLYSLUETTELO 9. REGRESSIOSTA... 2 10. EPÄPARAMETRISIA TESTEJÄ... 7 10.1. Kahden riippumattoman

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011 Opetus talteen ja jakoon oppilaille Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011 Aurajoen lukio ISOverstaan jäsen syksystä 2010 lähtien ISOverstas on maksullinen verkko-oppimisen

Lisätiedot

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa

Lisätiedot

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011

Lisätiedot

Lapsen pituuden selittäminen lineaarisella regressiomallilla

Lapsen pituuden selittäminen lineaarisella regressiomallilla Lapsen pituuden selittäminen lineaarisella regressiomallilla Tuomas Reiterä 013759335 Helsingin yliopisto Matemaattis-luonnontieteellinen tiedekunta Matematiikan ja tilastotieteen laitos Tilastotiede Kandidaatintutkielma

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä. Tilastollinen tietojenkäsittely / SPSS Harjoitus 3 Tällä harjoituskerralla tarkastellaan harjoituksissa 2 tehtyjä SPSS-havaintoaineistoja KUNNAT, kyselya ja kyselyb. Aineistoihin tutustutaan mm. erilaisten

Lisätiedot

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 2) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 2005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy

Lisätiedot

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä. Tilastollinen tietojenkäsittely / SPSS Harjoitus 3 Tällä harjoituskerralla tarkastellaan harjoituksissa 2 tehtyjä SPSS-havaintoaineistoja KUNNAT, kyselya ja kyselyb. Jos epäilet, että aineistosi eivät

Lisätiedot

Aki Taanila LINEAARISET REGRESSIOMALLIT

Aki Taanila LINEAARISET REGRESSIOMALLIT Aki Taanila LINEAARISET REGRESSIOMALLIT 17.6.2010 SISÄLLYSLUETTELO 0 Johdanto... 1 1 Keskiarvo ennustemallina... 2 2 Yhden selittävän muuttujan malli... 3 3 Useamman selittävän muuttujan malli... 6 4 Excel

Lisätiedot

Prospektiteoreettinen näkökulma

Prospektiteoreettinen näkökulma Miten paljon saneerausohjelmien onnistumiseen vaikuttaa yrittäjän kannustimet? Prospektiteoreettinen näkökulma Tapio Laakso 29.1.2010 Onnistumisen hyöty yrittäjälle vs. keskeytymisriski (Selvittäjän rooli?

Lisätiedot

Erikoistyö: Alkoholin kulutusmenojen ennustaminen

Erikoistyö: Alkoholin kulutusmenojen ennustaminen Erikoistyö: Alkoholin kulutusmenojen ennustaminen Tekijä: Mikko Nordlund 49857B mikko.nordlund@hut.fi Ohjaaja: Ilkka Mellin Jätetty: 11.12.2003 Sisällysluettelo 1. JOHDANTO... 3 2. MALLIEN TUTKIMINEN...

Lisätiedot

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka Kemometriasta Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka Mistä puhutaan? Määritelmiä Määritys, rinnakkaismääritys Mittaustuloksen luotettavuus Kalibrointi Mittausten

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

KAHDEN RYHMÄN VERTAILU

KAHDEN RYHMÄN VERTAILU 10.3.2015 KAHDEN RYHMÄN VERTAILU Jouko Miettunen Center for Life-Course and Systems Epidemiology jouko.miettunen@oulu.fi Luennon sisältö Luokitellut muuttujat Ristiintaulukko, prosentit Khiin neliötesti

Lisätiedot

Laskuharjoitus 9, tehtävä 6

Laskuharjoitus 9, tehtävä 6 Aalto-yliopiston perustieteiden korkeakoulu Jouni Pousi Systeemianalyysin laboratorio Mat-2.4129 Systeemien identifiointi Laskuharjoitus 9, tehtävä 6 Tämä ohje sisältää vaihtoehtoisen tavan laskuharjoituksen

Lisätiedot

Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007

Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007 EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET L2 kevät 2007 mittaaminen Biostatistiikan näkökulmasta Janne Pitkäniemi VTM, MSc (biometry) HY, Kansanterveystieteen laitos 1 Perusjoukon ja otoksen käsitteet

Lisätiedot

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.

Lisätiedot

Maatalouden tutkimuskeskuksen julkaisuja

Maatalouden tutkimuskeskuksen julkaisuja Maatalouden tutkimuskeskuksen julkaisuja S A RJ A Lauri Jauhiainen Virallisten lajikekokeiden tulosten laskentaperusteet lir>, Maatalouden 100 tutkimuskeskus Lauri Jauhiainen Virallisten lajikekokeiden

Lisätiedot

Tilastotieteellisiä malleja välimatka- ja suhdeasteikollisten preferenssien mittaamiseen. Pekka Leskinen ja Tuomo Kainulainen Metla

Tilastotieteellisiä malleja välimatka- ja suhdeasteikollisten preferenssien mittaamiseen. Pekka Leskinen ja Tuomo Kainulainen Metla \esitelm\hki0506.ppt 18.5.2006 Tilastotieteellisiä malleja välimatka- ja suhdeasteikollisten preferenssien mittaamiseen Pekka Leskinen ja Tuomo Kainulainen Metla FORS-iltapäiväseminaari 24.5.2006: Operaatiotutkimus

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Lisätehtäviä (siis vanhoja tenttikysymyksiä) 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15,

Lisätiedot

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl.

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl. Health 2000/2011 Surveys Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013 Esa Virtala etunimi.sukunimi@thl.fi Terveyden ja hyvinvoinnin laitos (THL) PL 30 00271 Helsinki Puhelin:

Lisätiedot

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON? SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?...7 TILASTO...7 TILASTOTIEDE...8 HISTORIAA...9 TILASTOTIETEEN NYKYINEN ASEMA...9 TILASTOLLISTEN MENETELMIEN ROOLIT ERI TYYPPISET AINEISTOT JA ONGELMAT...10

Lisätiedot

Aikasarjamallit. Pekka Hjelt

Aikasarjamallit. Pekka Hjelt Pekka Hjelt Aikasarjamallit Aikasarja koostuu järjestyksessä olevista havainnoista, ja yleensä se on tasavälinen ja diskreetti eli havaintopisteet ovat erillisiä. Lisäksi aikasarjassa on yleensä autokorrelaatiota

Lisätiedot

Tilastolliset menetelmät: Lineaarinen regressioanalyysi

Tilastolliset menetelmät: Lineaarinen regressioanalyysi Tlastollset meetelmät Leaare regressoaalyys Tlastollset meetelmät: Leaare regressoaalyys 3. Tlastolle rppuvuus ja korrelaato 4. Johdatus regressoaalyys 5. Yhde selttäjä leaare regressomall 6. Ylee leaare

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman

8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman 8. Osittaiset 2 k faktorikokeet Faktoreiden lukumäärän k kasvaessa 2 k koeasetelmassa kasvaa koetoistojen (runs) määrää nopeasti täydessä toteutuksessa (complete replicate). Esimerkiksi 2 6 asetelman täysi

Lisätiedot

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute.

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute. COMPUTE x=rv.ormal(0,0.04). COMPUTE y=rv.ormal(0,0.04). execute. compute hplib_man_r = hplib_man + x. compute arvokons_man_r = arvokons_man + y. GRAPH /SCATTERPLOT(BIVAR)=hplib_man_r WITH arvokons_man_r

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Aki Taanila AIKASARJAENNUSTAMINEN

Aki Taanila AIKASARJAENNUSTAMINEN Aki Taanila AIKASARJAENNUSTAMINEN 26.4.2011 SISÄLLYS JOHDANTO... 1 1 AIKASARJA ILMAN SYSTEMAATTISTA VAIHTELUA... 2 1.1 Liukuvan keskiarvon menetelmä... 2 1.2 Eksponentiaalinen tasoitus... 3 2 AIKASARJASSA

Lisätiedot

Ennustajien tappiofunktiot ja BKT-ennusteiden rationaalisuus

Ennustajien tappiofunktiot ja BKT-ennusteiden rationaalisuus Kansantaloudellinen aikakauskirja 105. vsk. 4/2009 Ennustajien tappiofunktiot ja BKT-ennusteiden rationaalisuus Markku Lanne Professori Helsingin yliopisto Suomen kansantaloutta koskevia ennusteita julkaistaan

Lisätiedot

c) Määritä paraabelin yhtälö, kun tiedetään, että sen huippu on y-akselilla korkeudella 6 ja sen nollakohdat ovat x-akselin kohdissa x=-2 ja x=2.

c) Määritä paraabelin yhtälö, kun tiedetään, että sen huippu on y-akselilla korkeudella 6 ja sen nollakohdat ovat x-akselin kohdissa x=-2 ja x=2. MAA4 Koe 5.5.01 Jussi Tyni Kaikkiin tehtäviin ratkaisujen välivaiheet näkyviin! Ota kokeesta poistuessasi tämä paperi mukaasi! Tee konseptiin pisteytysruudukko! Muista kirjata nimesi ja ryhmäsi. Valitse

Lisätiedot

Ferratum-ryhmän Euroopan ja Kansainyhteisön maiden Joulubarometri 2015

Ferratum-ryhmän Euroopan ja Kansainyhteisön maiden Joulubarometri 2015 Ferratum-ryhmän Euroopan ja Kansainyhteisön maiden Joulubarometri 2015 Sivu 2 Joulun rahankulutus suhteessa kotitalouden käytössä oleviin tuloihin Euroopan ja kansainyhteisön maiden kulutus jouluna 2015:

Lisätiedot

Muuttujien väliset riippuvuudet esimerkkejä

Muuttujien väliset riippuvuudet esimerkkejä Tarja Heikkilä Muuttujien väliset riippuvuudet esimerkkejä Sisältö MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN TILASTOLLINEN TESTAUS MERKITSEVYYSTASO MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN SPSS-OHJELMALLA

Lisätiedot

TKK @ Ilkka Mellin (2008) 1/5

TKK @ Ilkka Mellin (2008) 1/5 Mat-1.2620 Sovellettu todennäköisyyslaskenta B / Tehtävät Demo-tehtävät: 1, 3, 6, 7 Pistetehtävät: 2, 4, 5, 9 Ylimääräiset tehtävät: 8, 10, 11 Aiheet: Moniulotteiset jakaumat Avainsanat: Diskreetti jakauma,

Lisätiedot

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa

Lisätiedot

Ilkka Mellin Aikasarja-analyysi ARMA-mallit

Ilkka Mellin Aikasarja-analyysi ARMA-mallit Ilkka Mellin Aikasarja-analyysi ARMA-mallit TKK (c) Ilkka Mellin (007) 1 ARMA-mallit >> ARMA-mallit ja niiden ominaisuudet ARMA-mallien auto- ja osittaisautokorrelaatiofunktiot ARMA-mallien spektri ARMA-mallien

Lisätiedot

Henkilöstön työkyky ja yrityksen menestyminen 13.2.2009

Henkilöstön työkyky ja yrityksen menestyminen 13.2.2009 Henkilöstön työkyky ja yrityksen menestyminen 13.2.29 TUTKIMUSONGELMA Yritykset ovat kiinnittäneet huomiota sairauspoissaolojen aiheuttamiin kustannuksiin ja tuotannonmenetyksiin. Vähäisemmälle huomiolle

Lisätiedot

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus:

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus: 1. Tietyllä koeella valmistettavie tiivisterekaide halkaisija keskihajoa tiedetää oleva 0.04 tuumaa. Kyseisellä koeella valmistettuje 100 rekaa halkaisijoide keskiarvo oli 0.60 tuumaa. Määrää 95%: ja 99%:

Lisätiedot

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten.

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten. Tilastollinen tietojenkäsittely / SPSS Harjoitus 1 VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten. 1. Avaa SPSS-ohjelma. Tarkoitus olisi muodostaa tämän sivun

Lisätiedot

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 5.-7.11.2008. 1 Tällä viikolla Sisältösuunnitelma: Ennustamisstrategioista Koneoppimismenetelmiä: k-nn (luokittelu

Lisätiedot

Aineistokoko ja voima-analyysi

Aineistokoko ja voima-analyysi TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

SPSS-ohjeita. Metropolia Pertti Vilpas

SPSS-ohjeita. Metropolia Pertti Vilpas 1 Metropolia Pertti Vilpas SPSS-ohjeita Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio

Lisätiedot

LASKENTATOIMEN OSAAMINEN vs. LIIKETALOUDELLINEN ENNUSTETARKKUUS

LASKENTATOIMEN OSAAMINEN vs. LIIKETALOUDELLINEN ENNUSTETARKKUUS LASKENTATOIMEN OSAAMINEN vs. LIIKETALOUDELLINEN ENNUSTETARKKUUS Helsinki 26..200 4 2 5 Seminaari 26..200 Mikko Hakola Laskentatoimen osaaminen Testatut tahot Selvittäjiä Yrittäjiä KLT-kirjanpitäjiä Virallisen

Lisätiedot

Ohjeita SAS-ohjelmiston käyttöön

Ohjeita SAS-ohjelmiston käyttöön Kokoelma @CSC- ja SuperMenu-lehdissä ilmestyneitä artikkeleita Esa Lammi E-mail: Esa.Lammi@csc.fi CSC Tieteellinen laskenta Oy Versio 1.00 (23.2.2001) Saatteeksi T ämä kirjanen on tarkoitettu johdatukseksi

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

13.11. Tulosten arviointi. tulosten arviointi. voimmeko luottaa saamiimme tuloksiin?

13.11. Tulosten arviointi. tulosten arviointi. voimmeko luottaa saamiimme tuloksiin? 13.11. tulosten arviointi Tulosten arviointi voimmeko luottaa saamiimme tuloksiin? onko osa saaduista tuloksista sattumanvaraisia? mitkä OSAT puusta ovat luotettavimpia? 1 KONSENSUSDIAGRAMMI Useita yhtä

Lisätiedot

Tiina Hakanen. Aerobisen ja anaerobisen kynnyssykkeen mallintaminen MARSmenetelmällä sekä liikunnan määrän ja laadun vaikutus kuntoarvioihin

Tiina Hakanen. Aerobisen ja anaerobisen kynnyssykkeen mallintaminen MARSmenetelmällä sekä liikunnan määrän ja laadun vaikutus kuntoarvioihin PRO GRADU -TUTKIELMA Tiina Hakanen Aerobisen ja anaerobisen kynnyssykkeen mallintaminen MARSmenetelmällä sekä liikunnan määrän ja laadun vaikutus kuntoarvioihin TAMPEREEN YLIOPISTO Informaatiotieteiden

Lisätiedot

Tilastolliset menetelmät: Varianssianalyysi

Tilastolliset menetelmät: Varianssianalyysi Variassiaalsi Tilastolliset meetelmät: Variassiaalsi 0. Ysisuutaie variassiaalsi. asisuutaie variassiaalsi. olmi a useampisuutaie variassiaalsi T @ Ila Melli (006) 433 Variassiaalsi T @ Ila Melli (006)

Lisätiedot