Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Koko: px
Aloita esitys sivulta:

Download "Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501"

Transkriptio

1 Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, , 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, , 51 SS 3 = (n 3 1)s 2 3 = (10 1)4, , 33 SSW = SS 1 + SS 2 + SS 3 638, 36 SSB = 10(251, , 76) (261, , 76) (269, , 76) , 17 MSB = SSB/(I 1) = 1744, 17/(3 1) 872, 08 MSW = SSW/(n I) = 638, 36/(30 3) 23, 64 F = MSB/MSE = 872, 08/23, 64 36, 87 F 0.01;2,27 = 5, 49 1

2 Esim Menetelmä 1: 6, 4, 6, 4 y 1 = 5, n 1 = n 2 = n 3 = 4, Menetelmä 2: 14, 9, 10, 11 y 2 = 11, y = 8, n = 12 Menetelmä 3: 5, 11, 8, 8 y 3 = 8 n SST = (y i y) 2 i=1 = (6 8) (8 8) 2 = SSB = n i (y i y) 2 i=1 = 4(5 8) 2 + 4(11 8) 2 + 4(8 8) 2 = 72 3 n i SSW = (y ij y i ) 2 i=1 j=1 = (6 5) 2 + (4 5) 2 + (6 5) 2 + (4 5) 2 + (14 11) 2 + (9 11) 2 + (10 11) 2 + (11 11) 2 + (5 8) 2 + (11 8) 2 + (8 8) 2 + (8 8) 2 = 36 MSB = SSB/(I 1) = 72/(3 1) = 36 MSW = SSW/(n I) = 36/(12 3) = 4 F = MSB/MSE = 36/4 = 9 F 0.01;2,9 = 8.02 Figure 1: Esimerkin tulos SPSS-ohjelmalla 2

3 Figure 1: Esimerkin tulos SPSS-ohjelmalla 1

4 Esimerkki Tampereella myynnissä olleita kerrostalohuoneistoja (Aamulehti ). Hinnat euroina, aineisto a) Asuntojen neliöhinnat keskustassa ja ei-keskustassa (t-testi ja 1-VA) NELIOHIN N = 26 ei 30 kyll Onko asunto keskustassa? NELIOHIN Onko asunto keskustassa? ei kyll Group Statistics Std. Error N Mean Std. Deviation Mean Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means NELIOHIN Equal variances assumed Equal variances not assumed F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference ANOVA NELIOHIN Between Groups Within Groups Total Sum of Squares df Mean Square F Sig

5 b) Asuntojen neliöhinnat keskusta/länsi/itä (1-VA) NELIOHIN N = keskusta lansi it Asunnon sijainti Descriptives NELIOHIN keskusta lansi it Total 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum Test of Homogeneity of Variances NELIOHIN Levene Statistic df1 df2 Sig ANOVA NELIOHIN Between Groups Within Groups Total Sum of Squares df Mean Square F Sig

6 Multiple Comparisons Dependent Variable: NELIOHIN Bonferroni (I) Asunnon sijainti keskusta lansi it (J) Asunnon sijainti lansi it keskusta it keskusta lansi *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound * * * *

7 Esim Aineisto Ehdolliset keskiarvot Report PISTEET Sukupuoli Nainen Mies Opetustapa Tavallinen TV Total Tavallinen TV Total Mean N Std. Deviation 14, , , , , , , , , , , ,86560 Kaksisuuntainen varianssianalyysi Dependent Variable: PISTE Source Corrected Model Intercept SUKUPUOL OPETUST SUKUPUOL * OPETUST Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 213,754 a 3 71,251,483, , , ,674,000 5, ,417,037, , ,901 1,117,294 6, ,217,042, , , , , a. R Squared =,019 (Adjusted R Squared = -,021) Yksisuuntainen varianssianalyysi, selittäjänä opetustapa ANOVA PISTE Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 203, ,417 1,414, , , , Yksisuuntainen varianssianalyysi, selittäjänä sukupuoli ANOVA PISTE Between Groups Within Groups Total Sum of Squares df Mean Square F Sig.,275 1,275,002, , , ,014 77

8 Esim Lasketaan χ 2 -yhteensopivuustestisuure. f i e i 287 0,8 400 = ,1 400 = , = , = H 0 : ei muutosta. 4 χ 2 (f i e i ) 2 = i=1 e i ( )2 (49 40)2 = , 58 > χ 2 0,05;3 = 12, 84 + (30 24) (34 16)2 16 Voidaan siis päätellä, että on tapahtunut muutosta.

9 Esim H 0 : otos peräisin N(50, 100):sta Luokan(40, 50) teoreettinen frekvenssi saadaan laskemalla H 0 :n mukaisessa tilanteessa vastaava todennäköisyys P(40 X 50) = Φ( joten e i = 0, , ) Φ( ) = = 0,

10 Esim H 0 : otos peräisin T asd(1, 6):sta Jos H 0 on tosi, niin kaikkia silmälukuja tulisi olla saman verran eli 122/6 = 20, 3. χ 2 = 6 (f i e i ) 2 i=1 e i (8 20, 3)2 (39 20, 3)2 = , 3 20, 3 40, 6 > χ 2 0,005;5 = 16, 75 joten nopanheitto ei ole tapahtunut satunnaisesti.

11 Esim Yhteensopivuustestistä, painoindeksi Tutkitaan voisiko painoindeksi olla normaalisti jakautunut. H 0 : otos peräisin N(25,58;4, 66 2 ) Lasketaan χ 2 -yhteensopivuustestisuure. Painoindeksi frekv. odotettu frek. alle 20,1 9 11,5 20,1-21,4 15 6,3 21,4-25, ,0 25,5-28, ,6 28,5-32, ,1 eli 32,2 9 7, ,0 Esimerkiksi 1. luokan teoreettinen frekvenssi saadaan laskemalla H 0 :n mukaisessa tilanteessa vastaava todennäköisyys P(X 20,1) = Φ( joten e 1 = 0, ,5 20, 1 25,58 ) = 1 Φ(1,18) = 0,119 4,66 χ 2 = 6 (f i e i ) 2 i=1 e i = (9 11, 5)2 11, (9 7,5)2 7, 5 13,94 Koska on estimoitu 2 parametria (odotusarvo ja varianssi), niin vapausasteet ovat = 3. Koska χ ;3 = 12,84 ja χ ;3 = 16,27 niin 0,001 < p < 0,005. Päättelemme, että otos ei ole peräisin normaalijakaumasta. 1

12 Figure 1: Esimerkin painoindeksi jakauma ja tunnuslukuja. 2

13 Esim Onko pääaineella vaikutusta siiten, kuinka vaikeana piti opintojaksoa? kansant mat. ja til. tko vaikea (1-2) 23 (16,5) 15 (21,4) 13 (13.,2) sopiva (3) 6 (10,0) 15 (13,0) 10 (8,0) helppo (4-5) 1 (3,5) 9 (4,6) 1 (2,8) Koska odotetuista frekvensseistä 33 % on alle 5, eivät testin oletukset ole voimassa. Muodostetaan uusi ristiintaulukkoa: kansant mat. ja til. tko vaikea (1-2) 23 (16,5) 15 (21,4) 13 (13,2) sopiva tai helppo (3-5) 7 (13,5) 24 (17,6) 11 (10,8) Lasketaan χ 2 -riippumattomuuustestisuure. χ 2 = (23 16, 5)2 16, (11 10, 8)2 10, 8 9, 94 > χ 2 0,01;2 = 9, 21 H 0 : ei riippuvuutta, hylätään 1%:n riskitasolla (mutta ei 0,5%). Voidaan päätellä, että eri koulutusohjelmien opiskelijoiden mielipiteet kurssin vaikeudesta ovat erilaiset. Kansantalousteiteilijöistä 76,7 % piti kurssia vaikeana, kun taas vastaava luku matematiikan ja tilastotieteen koulutusohjelmassa oli 38,5 %.

14 Esim Erään tilastotieteen tentin tulos pääaineen mukaan (odotetut frekvenssit suluissa). kansant mat. ja til. tko yht. Hylätty 13 (14,8) 22 (22,0) 14 (12,2) 49 Hyväksytty 26 (24,2) 36 (36,0) 18 (19,8) 80 yht Lasketaan χ 2 -riippumattomuuustestisuure. χ 2 = (13 14, 8)2 14, (18 19, 88)2 19, 8 0, 81 < χ 2 0,05;2 = 5, 99 H 0 : ei riippuvuutta, hyväksytään.

15 Esim Erään tilastotieteen tentin tulos, esimerkki nelikentästä. Miehet Naiset Yhteensä Hylätty Hyväksytty Yht χ 2 = ( ) , = 0, = z 2 ks. TILTP2 kaava (5.7). p 2(1 Φ(0, 31284) = 2(1 0, 6217) = 0, 7566

16

17

18 Esim x i y i x i y i x 2 i ŷ i e i = y i ŷ i ,64 0, ,43-1, ,21-3, ,00 5, ,79 3, ,57-3, ,36-0, ȳ = 60 x = 400 xi y i ( x i )( y i )/7 ˆβ 1 = x 2 i ( /7 = x i ) 2 / /7 ˆβ 0 = ȳ ˆβ 1 x = 420/7 0, /7 32, 857 0, ŷ i = ˆβ 0 + ˆβ 1 x i = 32, , 06786x i, i = 1,... 7, e i = y i ŷ i = y i (32, , 06786x i ), i = 1,... 7, SSE = e 2 i = (y i ŷ i ) 2 60, 7 SST = (y i ȳ) 2 = 1350, 0 SSR = (ŷ i ȳ) , 286 R 2 = SSR/SST = 0, 955, MSR = SSR/1, MSE = SSE/(7 2) = 12, 143 F = MSR/MSE = 106, 176 > F 0,01;1,5 = 16, 26

19 Esimerkkejä regressioanalyysistä Esim Sadon (y) riippuvuus lannoitemäärästä (x), aineisto esimerkissä y x Pisteparven perusteella lineaarista riippuvuutta. Suoritetaan regressioanalyysi selittäen satoa lannoitemäärällä ja saadaan seuraavat tulokset.: Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate.977 a a. Predictors: (Constant), X Selitysprosentti 100x(R Square) = 95,5 %. Yhden selittäjän tilanteessa sama kuin 100r 2 Model 1 Regression Residual Total a. Predictors: (Constant), X b. Dependent Variable: Y ANOVA b Sum of Squares df Mean Square F Sig a Taulukossa neliösummat ja niiden vapausasteet, keskineliösummat ja F- testisuure (H 0 : β 1 = 0). Ks. laskukaavat kaavakokoelmassa kaavat (3.8), (3.12), (3.13), (3.15)

20 Model 1 (Constant) X a. Dependent Variable: Y Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig E Estimoitu lisäaineen regressiokerroin 0,06786 ja vakiokerroin 32,857. Lisäaine on merkittävä selittäjä, koska testattaessa hypoteesia H 0 : β 1 = 0 päädytään sen hylkäämiseen (joko F-testin tai t-testin (t=10,304) perusteella). x y estimoitu y residuaalit Esim a) Lapsen syntymäpainon riippuvuus pituudesta PAINO PITUUS Paino näyttäisi riippuvan lineaarisesti pituudesta, r = Ks. korrelaatiokertoimen testaus kaavakokoelmassa kaava (1.4).

21 PAINO PITUUS Correlations Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N **. Correlation is significant at the 0.01 level PAINO PITUUS 1.720** ** Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate.720 a a. Predictors: (Constant), PITUUS Selitysprosentti 100x(R Square) = 51,8 %. Yhden selittäjän tilanteessa sama kuin 100r 2 =100x0,72 2 Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig a a. Predictors: (Constant), PITUUS b. Dependent Variable: PAINO Model 1 (Constant) PITUUS a. Dependent Variable: PAINO Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig Estimoitu pituuden regressiokerroin 173,142 ja vakiokerroin 5211,574. Pituus on merkittävä selittäjä, koska testattaessa hypoteesia H 0 : β 1 = 0 päädytään sen hylkäämiseen (joko F-testin (F=126,711) tai t-testin (t=11,257) perusteella). Yhden sentin lisäys pituudessa kohottaa painoa keskimäärin 173,142 g.

22 b) Veden pehmeysarvon riippuvuus lisäaineesta Harj. 3 teht. 8. Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate.909 a a. Predictors: (Constant), Lisäaine Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig a a. Predictors: (Constant), Lisäaine b. Dependent Variable: Veden pehmeys Model 1 (Constant) Lisäaine Unstandardized Coefficients a. Dependent Variable: Veden pehmeys Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig c) Matematiikan ja tilastotieteen valintakoe 2001, tehtävä 2. Mittayksikön vaikutus kertoimiin Malli Y = β 0 + β 1 x + ε. ˆ β 1 = x i y i ( x i ) y i ( x i ) 2 / n x i 2 ( )/n = SS xy SS x = r xy s y s x Jos yhden selittäjän regressioanalyysissä tehdään muunnokset z = ax + b ja w = cy + d, niin r zw = r xy,jos ac>0 ja r zw = - r xy jos ac< 0, s z = a s x ja s w = c s y. Regressiokerroin on siis riippuvainen muuttujien mittayksiköistä. Kokeile esim. SAID IT aineistossa muuttamalla esimerkin a) mittayksiköt kiloiksi ja metreiksi.

23 Esim Esimerkin tilanteessa korrelaatiokertoimen testaus. t = H 0 : ρ = 0 r (1 r2 )/(n 2) t n 2, kun H 0 tosi Lasketaan aluksi korrelaatiokerroin ja sitten testisuure. r = SP xy / xi y i ( x i )( y i )/7 SS x SS y = ( x 2 i ( x i ) 2 /7)( yi 2 ( y i ) 2 /7) = t = /7 0, 977 ( /7)( /7) 0, 977 (1 0, 9772 )/(7 2) 10, 304 > t 0,005;5 = 4, 032

24 Esimerkki Regressioanalyysi, logaritmointi ja residuaalitarkasteluja. Aineisto Draper & Smith, Applied Regression Analysis (1981), s. 191, myös Liikennekuolemat (y) Liikennemäärä (x) Linear Fit Linear Fit Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , ,76 50 Analysis of Variance Source Model Error C Total DF Sum of Squares Mean Square ,08 F Ratio 508,4744 Prob>F 0,0000 Parameter Estimates Term Intercept Liikennemäärä (x) Estimate 107, , Std Error 52, , t Ratio 2,05 22,55 Prob> t 0,0454 0,0000

25 Tässä malli näyttää ihan hyvältä, jos tarkastellaan asiaa parametrien testauksen perusteella. Liikennemäärän kerroin on merkittävä ja selitysprosenttikin korkea 91 %. Mallin parametrien testauksen lisäksi mallin sopivuutta tutkitaan myös residuaalien avulla. Tällöin tutkitaan mallin riittävyyttä ja oletusten voimassa olemista. Mallissa Y = β 0 + β 1 x + ε tehdään oletukset, että ε i ~ N(0, σ 2 ) sekä ε i :t toisistaan riippumattomia. Tehdään siis normaalijakaumaoletus, riippumattomuusoletus sekä vakiovarianssisuusoletus ε:sta. Jos malli oikea, niin residuaalien, jotka ovat ε:n estimaatteja, tulisi käyttäytyä ε:n oletusten mukaisesti. Käyttäytymistä voidaan tutkia esim. piirtämällä pisteparvi residuaaleista ja estimoiduista y:n arvoista. Tässä esimerkissä pisteparvi näyttää hajaantuvan y:n estimoitujen arvojen kasvaessa. 750 Residuals Liikennekuolemat (y) Predicted Liikennekuolemat (y) Hajaantuminen on merkki siitä, että ei voida olettaa jokaisella ε i :lla olevan samaa varianssia. Sama asia näkyy kyllä jo alkuperäisessä pisteparvessa, joka ihan selvästi hajoaa x:n kasvaessa. Nyt voidaan menetellä siten, että logaritmoidaan molemmat muuttujat ja suoritetaan regressioanalyysi logaritmoiduilla arvoilla. Näin saadaan seuraavat tulokset:

26 8 7 log(y) log(x) Linear Fit Linear Fit Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , , Analysis of Variance Source Model Error C Total DF Sum of Squares 45, , , Mean Square 45,6387 0,0946 F Ratio 482,4705 Prob>F 0,0000 Parameter Estimates Term Intercept log(x) Estimate 1, , Std Error 0, , t Ratio 9,10 21,97 Prob> t 0,0000 0,0000 Tuloksista nähdään, että mallin parametrit ovat merkittäviä ja selitysprosenttikin 91. Tässä mallissa residuaalit (alla) käyttäytyvät eri tavalla kuin edellä. Voidaan ajatella, että pisteparvi on x akselin suuntainen nauha, joka kertoisi oletusten

27 voimassa olemisesta sekä mallin riittävyydestä. Jos pisteparvessa olisi havaittavissa jotain muuta kuin nauhanomaista käyttäytymistä, niin se kertoisi, että tehdyt oletuksen malliin liittyen eivät pidä paikkaansa. 0,5 Residuals log(y) 0,0-0,5-1,0 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 Predicted log(y) Katsotaan vielä residuaalien jakauma, joka pitäisi olla normaalinen. Residuals log(y) -1,0-0,5 0,0 0,5 Quantiles Moments Mean Std Dev Std Err Mean upper 95% Mean lower 95% Mean N Sum Wgts -0, , , , , , ,00000 Jos tässä testataan normaalisuutta, niin päädytään kyllä tulokseen, että otos ei ole peräisin normaalijakaumasta!

28 Esimerkki Autoregressio. Aineisto Newbold, P., Statistics for Business and Economics. Prentice Hall, 1995 s Twenty-eight quarterly observations from the United Kingdom on quantity of money in million pounds (y), income in million pounds (x 1 ) and the local authority interest rate (x 2 ) (aineisto myös t y t y t-1 x 1 x , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,1263 Estimoidaan malli Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 y t-1 + ε.

29 Response: y Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , ,38 27 Parameter Estimates Term Intercept x1 x2 y(t-1) Estimate -2297,819 0, ,30 1, Std Error 1875,241 0, ,172 0, t Ratio -1,23 0,70-2,23 8,42 Prob> t 0,2328 0,4934 0,0361 0,0000 Analysis of Variance Source Model Error C Total DF Sum of Squares Mean Square ,7 F Ratio 311,5323 Prob>F 0,0000 Nyt x 1 näyttää olevan tarpeeton (t = 0,70 ja p = 0,4934), joten jätetään tämä selittäjä pois mallista ja estimoidaan uusi malli Y = β 0 + β 1 x 2 + β 2 y t-1 + ε, joka tuottaa 97,5 %:n selitysasteen ja mallin kertoimet ovat merkittäviä vakiokerrointa lukuun ottamatta (p arvot 0,1574; 0,0035; 0,000). Lisäksi H 0 : β 1 = β 2 = 0, hylätään (F = 477,3098; p = 0,000). Malli on siis näiltä osin kaikin puolin kunnossa. Response: y Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , ,38 27 Parameter Estimates Term Intercept x2 y(t-1) Estimate -1106, ,87 1, Std Error 758, ,272 0, t Ratio -1,46-3,24 21,09 Prob> t 0,1574 0,0035 0,0000

30 Analysis of Variance Source Model Error C Total DF Sum of Squares Mean Square F Ratio 477,3098 Prob>F 0,0000 Tutkitaan vielä residuaalien käyttäytymistä Residual y Predicted Pisteparvi antaa kyllä viitteitä suuntaan, että vakiovarianssisuusoletus ei olisi ehkä voimassa. Toisaalta havaintoja on kovin vähän, joten pidemmän aikasarjan käyttö voisi olla jatkotoimenpiteenä aiheellinen.

31 Esimerkki Dummy -muuttuja selittäjänä regressioanalyysissä. Palkan riippuvuutta palveluvuosista ja sukupuolesta. Aineisto: Younger (1985), A First Course in Linear Regression Salary Years Salary Years Sex (1=mies) Palkan näyttää siis riippuvan paitsi palveluvuosista niin myös sukupuolesta. Voitaisiin tehdä yhden selittäjän regressioanalyysit miehillä ja naisilla erikseen. Yksi tapa olisi myös estimoida kahden selittäjän malli Salary = β 0 + β 1 Years + β 2 Sex + ε, jolloin saadaan estimoiduksi kaksi samansuuntaista suoraa

32 E(Salary) = β 0 + β 1 Years (Naiset, Sex=0), E(Salary) = β 0 + β 1 Years + β 2 (Miehet Sex=1). Estimointitulokset: Response: Salary Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , ,92 25 Parameter Estimates Term Intercept Years Sex Estimate 13, , , Std Error 0, , , t Ratio 22,28 21,19 16,33 Prob> t 0,0000 0,0000 0,0000 Analysis of Variance Source Model Error C Total DF Sum of Squares 1421, , ,8400 Mean Square 710,982 1,994 F Ratio 356,4975 Prob>F 0,0000 Estimoinnin tulos: Naiset : Salary (estimoitu) = 13, , xYears Miehet: Salary (estimoitu) = 13, , xYears + 9, Testaukset tehdään tavanomaiseen tapaan. Selitysprosentti 97.

33 4.4. Varianssianalyysimalli Oletukset yksisuuntaisessa varianssianalyysissä: Y 11,Y 12,...,Y 1n1 satunnaisotos N(µ 1,σ 2 ):sta, Y 21,Y 22,...,Y 2n2 satunnaisotos N(µ 2,σ 2 ):sta,... Y I1,Y I2,...,Y InI satunnaisotos N(µ I,σ 2 ):sta. Halutaan tutkia ovatko jakaumien odotusarvot yhtä suuret, jolloin H 0 : µ 1 = µ 2 =... = µ I H 1 : kaikki odotusarvot eivät ole samoja. Oletuksista seuraa, että varianssianalyysi voidaan ajatella mallina Y ij = µ i + ε ij, missä ε ij ~ N(0,,σ 2 ) µ 1, µ 2,..., µ I ovat mallin parametrit Vaihtoehtoisesti myös Y ij = µ + τ i + ε ij

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017 11.1.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 11.1.2018 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017 11.1.2018/2

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

4.2 Useampi selittävä muuttuja (kertausta)

4.2 Useampi selittävä muuttuja (kertausta) 14.2.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 14.2.2019 4.2 Useampi selittävä muuttuja (kertausta) Selittäjien lukumäärä k (k-ra) = + + + + Malliin liittyvät oletukset i ~ N(0, 2 ) ja i:t ovat

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Kvantitatiivinen genetiikka moniste s. 56

Kvantitatiivinen genetiikka moniste s. 56 Kvantitatiivinen genetiikka moniste s. 56 - määrällisten ominaisuuksien periytymisen hallinta - mendelismi oli aluksi vastatuulessa siksi että darwinistit, joilla oli paljon valtaa Britanniassa, olivat

Lisätiedot

Frequencies. Frequency Table

Frequencies. Frequency Table GET FILE='C:\Documents and Settings\haukkala\My Documents\kvanti\kvanti_harjo'+ '_label.sav'. DATASET NAME DataSet WINDOW=FRONT. FREQUENCIES VARIABLES=koulv paino /ORDER= ANALYSIS. Frequencies [DataSet]

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004 Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004 Esimerkkien ratkaisut http://mtl.uta.fi/tilasto/tiltp3/kevat2004/kaikki_esimerkit.pdf Raija Leppälä 19. joulukuuta 2003 Sisältö 1

Lisätiedot

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle] Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen

Lisätiedot

Tampereen yliopisto Matematiikan, tilastotieteen ja filosofian laitos Raija Leppälä puh , sähköposti

Tampereen yliopisto Matematiikan, tilastotieteen ja filosofian laitos Raija Leppälä puh , sähköposti Tampereen yliopisto Matematiikan, tilastotieteen ja filosofian laitos Raija Leppälä puh. 03-2156301, sähköposti raija.leppala@uta.fi 3.2.01 Tilastollisten menetelmien perusteet II,TILTP3 Luentorunko, kevät

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

Teema 10: Regressio- ja varianssianalyysi

Teema 10: Regressio- ja varianssianalyysi Teema 1: Regressio- ja varianssianalyysi Regressioanalyysi lienee t-testin ohella maailman eniten käytetty tilastollinen menetelmä. Sitä sivuttiin jo alustavasti Teemassa 4. Varianssianalyysi liittyy useallakin

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS

Lisätiedot

Harjoittele tulkintoja

Harjoittele tulkintoja Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen

Lisätiedot

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla Raija Leppälä Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla TAMPEREEN YLIOPISTO INFORMAATIOTIETEIDEN YKSIKÖN RAPORTTEJA 55/2017 TAMPERE 2017 TAMPEREEN YLIOPISTO

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla

Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla 1 Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla Raija Leppälä Opetusmoniste B 53 3. uudistettu painos Matematiikan, tilastotieteen ja filosofian laitos Toukokuu

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta 22.1.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 22.1.2019 Luku 3 2 -yhteensopivuus- ja riippumattomuustestit 3.1 2 -yhteensopivuustesti H0: otos peräisin tietystä jakaumasta H1: otos ei peräisin

Lisätiedot

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa: Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Teema 9: Tilastollinen merkitsevyystestaus

Teema 9: Tilastollinen merkitsevyystestaus Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan

Lisätiedot

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i1 +...+ p X ip + u i

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i1 +...+ p X ip + u i 3. Useamman selittäajäan regressiomalli p-selittäaväaäa muuttujaa Y i = + 1 X i1 +...+ p X ip + u i i = 1,...,n (> p), missäa n = havaintojen lukumäaäaräa otoksessa. Oletukset kuten aiemmin: (1) E(u i

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45. Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien

Lisätiedot

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen! 8069 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2013 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOLLA 9! Ilmoittaudu Weboodissa 4.3.2013 klo

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

Korrelaatiokertoinen määrittely 165

Korrelaatiokertoinen määrittely 165 kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x

Lisätiedot

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Regressiodiagnostiikka Cooken etäisyys, Funktionaalinen muoto, Diagnostinen grafiikka, Diagnostiset testit, Heteroskedastisuus,

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut). KÄSITTEITÄ POPULAATIO Joukko, jota tutkitaan (äärellinen, ääretön). Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut). Näiden välillä ei aina tehdä eroa, kun puhutaan

Lisätiedot

2. Keskiarvojen vartailua

2. Keskiarvojen vartailua 2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

1 Johdatus varianssianalyysiin

1 Johdatus varianssianalyysiin Tilastollisia malleja 1 & 2: Varianssianalyysi Jarkko Isotalo Y131A & Y132A 15.1.2013 1 Johdatus varianssianalyysiin 1.1 Milloin varianssianalyysiä käytetään? Varianssianalyysi on tilastotieteellinen menetelmä,

Lisätiedot

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011 Opetus talteen ja jakoon oppilaille Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011 Aurajoen lukio ISOverstaan jäsen syksystä 2010 lähtien ISOverstas on maksullinen verkko-oppimisen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Opiskelija viipymisaika pistemäärä

Opiskelija viipymisaika pistemäärä 806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2012 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Jatkoa harjoituksen 5 tehtävään

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin 30.11.2017/1 MTTTP5, luento 30.11.2017 Kertausta H 0 : µ = µ 0 Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin = / ~ 0,1. Kaava 5.1 30.11.2017/2 Esim. Tutkija

Lisätiedot