Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501
|
|
- Jarkko Halttunen
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, , 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, , 51 SS 3 = (n 3 1)s 2 3 = (10 1)4, , 33 SSW = SS 1 + SS 2 + SS 3 638, 36 SSB = 10(251, , 76) (261, , 76) (269, , 76) , 17 MSB = SSB/(I 1) = 1744, 17/(3 1) 872, 08 MSW = SSW/(n I) = 638, 36/(30 3) 23, 64 F = MSB/MSE = 872, 08/23, 64 36, 87 F 0.01;2,27 = 5, 49 1
2 Esim Menetelmä 1: 6, 4, 6, 4 y 1 = 5, n 1 = n 2 = n 3 = 4, Menetelmä 2: 14, 9, 10, 11 y 2 = 11, y = 8, n = 12 Menetelmä 3: 5, 11, 8, 8 y 3 = 8 n SST = (y i y) 2 i=1 = (6 8) (8 8) 2 = SSB = n i (y i y) 2 i=1 = 4(5 8) 2 + 4(11 8) 2 + 4(8 8) 2 = 72 3 n i SSW = (y ij y i ) 2 i=1 j=1 = (6 5) 2 + (4 5) 2 + (6 5) 2 + (4 5) 2 + (14 11) 2 + (9 11) 2 + (10 11) 2 + (11 11) 2 + (5 8) 2 + (11 8) 2 + (8 8) 2 + (8 8) 2 = 36 MSB = SSB/(I 1) = 72/(3 1) = 36 MSW = SSW/(n I) = 36/(12 3) = 4 F = MSB/MSE = 36/4 = 9 F 0.01;2,9 = 8.02 Figure 1: Esimerkin tulos SPSS-ohjelmalla 2
3 Figure 1: Esimerkin tulos SPSS-ohjelmalla 1
4 Esimerkki Tampereella myynnissä olleita kerrostalohuoneistoja (Aamulehti ). Hinnat euroina, aineisto a) Asuntojen neliöhinnat keskustassa ja ei-keskustassa (t-testi ja 1-VA) NELIOHIN N = 26 ei 30 kyll Onko asunto keskustassa? NELIOHIN Onko asunto keskustassa? ei kyll Group Statistics Std. Error N Mean Std. Deviation Mean Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means NELIOHIN Equal variances assumed Equal variances not assumed F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference ANOVA NELIOHIN Between Groups Within Groups Total Sum of Squares df Mean Square F Sig
5 b) Asuntojen neliöhinnat keskusta/länsi/itä (1-VA) NELIOHIN N = keskusta lansi it Asunnon sijainti Descriptives NELIOHIN keskusta lansi it Total 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum Test of Homogeneity of Variances NELIOHIN Levene Statistic df1 df2 Sig ANOVA NELIOHIN Between Groups Within Groups Total Sum of Squares df Mean Square F Sig
6 Multiple Comparisons Dependent Variable: NELIOHIN Bonferroni (I) Asunnon sijainti keskusta lansi it (J) Asunnon sijainti lansi it keskusta it keskusta lansi *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound * * * *
7 Esim Aineisto Ehdolliset keskiarvot Report PISTEET Sukupuoli Nainen Mies Opetustapa Tavallinen TV Total Tavallinen TV Total Mean N Std. Deviation 14, , , , , , , , , , , ,86560 Kaksisuuntainen varianssianalyysi Dependent Variable: PISTE Source Corrected Model Intercept SUKUPUOL OPETUST SUKUPUOL * OPETUST Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 213,754 a 3 71,251,483, , , ,674,000 5, ,417,037, , ,901 1,117,294 6, ,217,042, , , , , a. R Squared =,019 (Adjusted R Squared = -,021) Yksisuuntainen varianssianalyysi, selittäjänä opetustapa ANOVA PISTE Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 203, ,417 1,414, , , , Yksisuuntainen varianssianalyysi, selittäjänä sukupuoli ANOVA PISTE Between Groups Within Groups Total Sum of Squares df Mean Square F Sig.,275 1,275,002, , , ,014 77
8 Esim Lasketaan χ 2 -yhteensopivuustestisuure. f i e i 287 0,8 400 = ,1 400 = , = , = H 0 : ei muutosta. 4 χ 2 (f i e i ) 2 = i=1 e i ( )2 (49 40)2 = , 58 > χ 2 0,05;3 = 12, 84 + (30 24) (34 16)2 16 Voidaan siis päätellä, että on tapahtunut muutosta.
9 Esim H 0 : otos peräisin N(50, 100):sta Luokan(40, 50) teoreettinen frekvenssi saadaan laskemalla H 0 :n mukaisessa tilanteessa vastaava todennäköisyys P(40 X 50) = Φ( joten e i = 0, , ) Φ( ) = = 0,
10 Esim H 0 : otos peräisin T asd(1, 6):sta Jos H 0 on tosi, niin kaikkia silmälukuja tulisi olla saman verran eli 122/6 = 20, 3. χ 2 = 6 (f i e i ) 2 i=1 e i (8 20, 3)2 (39 20, 3)2 = , 3 20, 3 40, 6 > χ 2 0,005;5 = 16, 75 joten nopanheitto ei ole tapahtunut satunnaisesti.
11 Esim Yhteensopivuustestistä, painoindeksi Tutkitaan voisiko painoindeksi olla normaalisti jakautunut. H 0 : otos peräisin N(25,58;4, 66 2 ) Lasketaan χ 2 -yhteensopivuustestisuure. Painoindeksi frekv. odotettu frek. alle 20,1 9 11,5 20,1-21,4 15 6,3 21,4-25, ,0 25,5-28, ,6 28,5-32, ,1 eli 32,2 9 7, ,0 Esimerkiksi 1. luokan teoreettinen frekvenssi saadaan laskemalla H 0 :n mukaisessa tilanteessa vastaava todennäköisyys P(X 20,1) = Φ( joten e 1 = 0, ,5 20, 1 25,58 ) = 1 Φ(1,18) = 0,119 4,66 χ 2 = 6 (f i e i ) 2 i=1 e i = (9 11, 5)2 11, (9 7,5)2 7, 5 13,94 Koska on estimoitu 2 parametria (odotusarvo ja varianssi), niin vapausasteet ovat = 3. Koska χ ;3 = 12,84 ja χ ;3 = 16,27 niin 0,001 < p < 0,005. Päättelemme, että otos ei ole peräisin normaalijakaumasta. 1
12 Figure 1: Esimerkin painoindeksi jakauma ja tunnuslukuja. 2
13 Esim Onko pääaineella vaikutusta siiten, kuinka vaikeana piti opintojaksoa? kansant mat. ja til. tko vaikea (1-2) 23 (16,5) 15 (21,4) 13 (13.,2) sopiva (3) 6 (10,0) 15 (13,0) 10 (8,0) helppo (4-5) 1 (3,5) 9 (4,6) 1 (2,8) Koska odotetuista frekvensseistä 33 % on alle 5, eivät testin oletukset ole voimassa. Muodostetaan uusi ristiintaulukkoa: kansant mat. ja til. tko vaikea (1-2) 23 (16,5) 15 (21,4) 13 (13,2) sopiva tai helppo (3-5) 7 (13,5) 24 (17,6) 11 (10,8) Lasketaan χ 2 -riippumattomuuustestisuure. χ 2 = (23 16, 5)2 16, (11 10, 8)2 10, 8 9, 94 > χ 2 0,01;2 = 9, 21 H 0 : ei riippuvuutta, hylätään 1%:n riskitasolla (mutta ei 0,5%). Voidaan päätellä, että eri koulutusohjelmien opiskelijoiden mielipiteet kurssin vaikeudesta ovat erilaiset. Kansantalousteiteilijöistä 76,7 % piti kurssia vaikeana, kun taas vastaava luku matematiikan ja tilastotieteen koulutusohjelmassa oli 38,5 %.
14 Esim Erään tilastotieteen tentin tulos pääaineen mukaan (odotetut frekvenssit suluissa). kansant mat. ja til. tko yht. Hylätty 13 (14,8) 22 (22,0) 14 (12,2) 49 Hyväksytty 26 (24,2) 36 (36,0) 18 (19,8) 80 yht Lasketaan χ 2 -riippumattomuuustestisuure. χ 2 = (13 14, 8)2 14, (18 19, 88)2 19, 8 0, 81 < χ 2 0,05;2 = 5, 99 H 0 : ei riippuvuutta, hyväksytään.
15 Esim Erään tilastotieteen tentin tulos, esimerkki nelikentästä. Miehet Naiset Yhteensä Hylätty Hyväksytty Yht χ 2 = ( ) , = 0, = z 2 ks. TILTP2 kaava (5.7). p 2(1 Φ(0, 31284) = 2(1 0, 6217) = 0, 7566
16
17
18 Esim x i y i x i y i x 2 i ŷ i e i = y i ŷ i ,64 0, ,43-1, ,21-3, ,00 5, ,79 3, ,57-3, ,36-0, ȳ = 60 x = 400 xi y i ( x i )( y i )/7 ˆβ 1 = x 2 i ( /7 = x i ) 2 / /7 ˆβ 0 = ȳ ˆβ 1 x = 420/7 0, /7 32, 857 0, ŷ i = ˆβ 0 + ˆβ 1 x i = 32, , 06786x i, i = 1,... 7, e i = y i ŷ i = y i (32, , 06786x i ), i = 1,... 7, SSE = e 2 i = (y i ŷ i ) 2 60, 7 SST = (y i ȳ) 2 = 1350, 0 SSR = (ŷ i ȳ) , 286 R 2 = SSR/SST = 0, 955, MSR = SSR/1, MSE = SSE/(7 2) = 12, 143 F = MSR/MSE = 106, 176 > F 0,01;1,5 = 16, 26
19 Esimerkkejä regressioanalyysistä Esim Sadon (y) riippuvuus lannoitemäärästä (x), aineisto esimerkissä y x Pisteparven perusteella lineaarista riippuvuutta. Suoritetaan regressioanalyysi selittäen satoa lannoitemäärällä ja saadaan seuraavat tulokset.: Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate.977 a a. Predictors: (Constant), X Selitysprosentti 100x(R Square) = 95,5 %. Yhden selittäjän tilanteessa sama kuin 100r 2 Model 1 Regression Residual Total a. Predictors: (Constant), X b. Dependent Variable: Y ANOVA b Sum of Squares df Mean Square F Sig a Taulukossa neliösummat ja niiden vapausasteet, keskineliösummat ja F- testisuure (H 0 : β 1 = 0). Ks. laskukaavat kaavakokoelmassa kaavat (3.8), (3.12), (3.13), (3.15)
20 Model 1 (Constant) X a. Dependent Variable: Y Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig E Estimoitu lisäaineen regressiokerroin 0,06786 ja vakiokerroin 32,857. Lisäaine on merkittävä selittäjä, koska testattaessa hypoteesia H 0 : β 1 = 0 päädytään sen hylkäämiseen (joko F-testin tai t-testin (t=10,304) perusteella). x y estimoitu y residuaalit Esim a) Lapsen syntymäpainon riippuvuus pituudesta PAINO PITUUS Paino näyttäisi riippuvan lineaarisesti pituudesta, r = Ks. korrelaatiokertoimen testaus kaavakokoelmassa kaava (1.4).
21 PAINO PITUUS Correlations Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N **. Correlation is significant at the 0.01 level PAINO PITUUS 1.720** ** Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate.720 a a. Predictors: (Constant), PITUUS Selitysprosentti 100x(R Square) = 51,8 %. Yhden selittäjän tilanteessa sama kuin 100r 2 =100x0,72 2 Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig a a. Predictors: (Constant), PITUUS b. Dependent Variable: PAINO Model 1 (Constant) PITUUS a. Dependent Variable: PAINO Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig Estimoitu pituuden regressiokerroin 173,142 ja vakiokerroin 5211,574. Pituus on merkittävä selittäjä, koska testattaessa hypoteesia H 0 : β 1 = 0 päädytään sen hylkäämiseen (joko F-testin (F=126,711) tai t-testin (t=11,257) perusteella). Yhden sentin lisäys pituudessa kohottaa painoa keskimäärin 173,142 g.
22 b) Veden pehmeysarvon riippuvuus lisäaineesta Harj. 3 teht. 8. Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate.909 a a. Predictors: (Constant), Lisäaine Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig a a. Predictors: (Constant), Lisäaine b. Dependent Variable: Veden pehmeys Model 1 (Constant) Lisäaine Unstandardized Coefficients a. Dependent Variable: Veden pehmeys Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig c) Matematiikan ja tilastotieteen valintakoe 2001, tehtävä 2. Mittayksikön vaikutus kertoimiin Malli Y = β 0 + β 1 x + ε. ˆ β 1 = x i y i ( x i ) y i ( x i ) 2 / n x i 2 ( )/n = SS xy SS x = r xy s y s x Jos yhden selittäjän regressioanalyysissä tehdään muunnokset z = ax + b ja w = cy + d, niin r zw = r xy,jos ac>0 ja r zw = - r xy jos ac< 0, s z = a s x ja s w = c s y. Regressiokerroin on siis riippuvainen muuttujien mittayksiköistä. Kokeile esim. SAID IT aineistossa muuttamalla esimerkin a) mittayksiköt kiloiksi ja metreiksi.
23 Esim Esimerkin tilanteessa korrelaatiokertoimen testaus. t = H 0 : ρ = 0 r (1 r2 )/(n 2) t n 2, kun H 0 tosi Lasketaan aluksi korrelaatiokerroin ja sitten testisuure. r = SP xy / xi y i ( x i )( y i )/7 SS x SS y = ( x 2 i ( x i ) 2 /7)( yi 2 ( y i ) 2 /7) = t = /7 0, 977 ( /7)( /7) 0, 977 (1 0, 9772 )/(7 2) 10, 304 > t 0,005;5 = 4, 032
24 Esimerkki Regressioanalyysi, logaritmointi ja residuaalitarkasteluja. Aineisto Draper & Smith, Applied Regression Analysis (1981), s. 191, myös Liikennekuolemat (y) Liikennemäärä (x) Linear Fit Linear Fit Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , ,76 50 Analysis of Variance Source Model Error C Total DF Sum of Squares Mean Square ,08 F Ratio 508,4744 Prob>F 0,0000 Parameter Estimates Term Intercept Liikennemäärä (x) Estimate 107, , Std Error 52, , t Ratio 2,05 22,55 Prob> t 0,0454 0,0000
25 Tässä malli näyttää ihan hyvältä, jos tarkastellaan asiaa parametrien testauksen perusteella. Liikennemäärän kerroin on merkittävä ja selitysprosenttikin korkea 91 %. Mallin parametrien testauksen lisäksi mallin sopivuutta tutkitaan myös residuaalien avulla. Tällöin tutkitaan mallin riittävyyttä ja oletusten voimassa olemista. Mallissa Y = β 0 + β 1 x + ε tehdään oletukset, että ε i ~ N(0, σ 2 ) sekä ε i :t toisistaan riippumattomia. Tehdään siis normaalijakaumaoletus, riippumattomuusoletus sekä vakiovarianssisuusoletus ε:sta. Jos malli oikea, niin residuaalien, jotka ovat ε:n estimaatteja, tulisi käyttäytyä ε:n oletusten mukaisesti. Käyttäytymistä voidaan tutkia esim. piirtämällä pisteparvi residuaaleista ja estimoiduista y:n arvoista. Tässä esimerkissä pisteparvi näyttää hajaantuvan y:n estimoitujen arvojen kasvaessa. 750 Residuals Liikennekuolemat (y) Predicted Liikennekuolemat (y) Hajaantuminen on merkki siitä, että ei voida olettaa jokaisella ε i :lla olevan samaa varianssia. Sama asia näkyy kyllä jo alkuperäisessä pisteparvessa, joka ihan selvästi hajoaa x:n kasvaessa. Nyt voidaan menetellä siten, että logaritmoidaan molemmat muuttujat ja suoritetaan regressioanalyysi logaritmoiduilla arvoilla. Näin saadaan seuraavat tulokset:
26 8 7 log(y) log(x) Linear Fit Linear Fit Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , , Analysis of Variance Source Model Error C Total DF Sum of Squares 45, , , Mean Square 45,6387 0,0946 F Ratio 482,4705 Prob>F 0,0000 Parameter Estimates Term Intercept log(x) Estimate 1, , Std Error 0, , t Ratio 9,10 21,97 Prob> t 0,0000 0,0000 Tuloksista nähdään, että mallin parametrit ovat merkittäviä ja selitysprosenttikin 91. Tässä mallissa residuaalit (alla) käyttäytyvät eri tavalla kuin edellä. Voidaan ajatella, että pisteparvi on x akselin suuntainen nauha, joka kertoisi oletusten
27 voimassa olemisesta sekä mallin riittävyydestä. Jos pisteparvessa olisi havaittavissa jotain muuta kuin nauhanomaista käyttäytymistä, niin se kertoisi, että tehdyt oletuksen malliin liittyen eivät pidä paikkaansa. 0,5 Residuals log(y) 0,0-0,5-1,0 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 Predicted log(y) Katsotaan vielä residuaalien jakauma, joka pitäisi olla normaalinen. Residuals log(y) -1,0-0,5 0,0 0,5 Quantiles Moments Mean Std Dev Std Err Mean upper 95% Mean lower 95% Mean N Sum Wgts -0, , , , , , ,00000 Jos tässä testataan normaalisuutta, niin päädytään kyllä tulokseen, että otos ei ole peräisin normaalijakaumasta!
28 Esimerkki Autoregressio. Aineisto Newbold, P., Statistics for Business and Economics. Prentice Hall, 1995 s Twenty-eight quarterly observations from the United Kingdom on quantity of money in million pounds (y), income in million pounds (x 1 ) and the local authority interest rate (x 2 ) (aineisto myös t y t y t-1 x 1 x , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,1263 Estimoidaan malli Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 y t-1 + ε.
29 Response: y Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , ,38 27 Parameter Estimates Term Intercept x1 x2 y(t-1) Estimate -2297,819 0, ,30 1, Std Error 1875,241 0, ,172 0, t Ratio -1,23 0,70-2,23 8,42 Prob> t 0,2328 0,4934 0,0361 0,0000 Analysis of Variance Source Model Error C Total DF Sum of Squares Mean Square ,7 F Ratio 311,5323 Prob>F 0,0000 Nyt x 1 näyttää olevan tarpeeton (t = 0,70 ja p = 0,4934), joten jätetään tämä selittäjä pois mallista ja estimoidaan uusi malli Y = β 0 + β 1 x 2 + β 2 y t-1 + ε, joka tuottaa 97,5 %:n selitysasteen ja mallin kertoimet ovat merkittäviä vakiokerrointa lukuun ottamatta (p arvot 0,1574; 0,0035; 0,000). Lisäksi H 0 : β 1 = β 2 = 0, hylätään (F = 477,3098; p = 0,000). Malli on siis näiltä osin kaikin puolin kunnossa. Response: y Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , ,38 27 Parameter Estimates Term Intercept x2 y(t-1) Estimate -1106, ,87 1, Std Error 758, ,272 0, t Ratio -1,46-3,24 21,09 Prob> t 0,1574 0,0035 0,0000
30 Analysis of Variance Source Model Error C Total DF Sum of Squares Mean Square F Ratio 477,3098 Prob>F 0,0000 Tutkitaan vielä residuaalien käyttäytymistä Residual y Predicted Pisteparvi antaa kyllä viitteitä suuntaan, että vakiovarianssisuusoletus ei olisi ehkä voimassa. Toisaalta havaintoja on kovin vähän, joten pidemmän aikasarjan käyttö voisi olla jatkotoimenpiteenä aiheellinen.
31 Esimerkki Dummy -muuttuja selittäjänä regressioanalyysissä. Palkan riippuvuutta palveluvuosista ja sukupuolesta. Aineisto: Younger (1985), A First Course in Linear Regression Salary Years Salary Years Sex (1=mies) Palkan näyttää siis riippuvan paitsi palveluvuosista niin myös sukupuolesta. Voitaisiin tehdä yhden selittäjän regressioanalyysit miehillä ja naisilla erikseen. Yksi tapa olisi myös estimoida kahden selittäjän malli Salary = β 0 + β 1 Years + β 2 Sex + ε, jolloin saadaan estimoiduksi kaksi samansuuntaista suoraa
32 E(Salary) = β 0 + β 1 Years (Naiset, Sex=0), E(Salary) = β 0 + β 1 Years + β 2 (Miehet Sex=1). Estimointitulokset: Response: Salary Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0, , , ,92 25 Parameter Estimates Term Intercept Years Sex Estimate 13, , , Std Error 0, , , t Ratio 22,28 21,19 16,33 Prob> t 0,0000 0,0000 0,0000 Analysis of Variance Source Model Error C Total DF Sum of Squares 1421, , ,8400 Mean Square 710,982 1,994 F Ratio 356,4975 Prob>F 0,0000 Estimoinnin tulos: Naiset : Salary (estimoitu) = 13, , xYears Miehet: Salary (estimoitu) = 13, , xYears + 9, Testaukset tehdään tavanomaiseen tapaan. Selitysprosentti 97.
33 4.4. Varianssianalyysimalli Oletukset yksisuuntaisessa varianssianalyysissä: Y 11,Y 12,...,Y 1n1 satunnaisotos N(µ 1,σ 2 ):sta, Y 21,Y 22,...,Y 2n2 satunnaisotos N(µ 2,σ 2 ):sta,... Y I1,Y I2,...,Y InI satunnaisotos N(µ I,σ 2 ):sta. Halutaan tutkia ovatko jakaumien odotusarvot yhtä suuret, jolloin H 0 : µ 1 = µ 2 =... = µ I H 1 : kaikki odotusarvot eivät ole samoja. Oletuksista seuraa, että varianssianalyysi voidaan ajatella mallina Y ij = µ i + ε ij, missä ε ij ~ N(0,,σ 2 ) µ 1, µ 2,..., µ I ovat mallin parametrit Vaihtoehtoisesti myös Y ij = µ + τ i + ε ij
[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen
LisätiedotTilastollisten menetelmien perusteet II TILTP3 Luentorunko
Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,
LisätiedotLisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
Lisätiedotvoidaan hylätä, pienempi vai suurempi kuin 1 %?
[TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine
LisätiedotVARIANSSIANALYYSI ANALYSIS OF VARIANCE
VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.
LisätiedotMTTTP1, luento KERTAUSTA
25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
Lisätiedothttps://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
11.1.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 11.1.2018 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017 11.1.2018/2
LisätiedotMTTTP1, luento KERTAUSTA
26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
Lisätiedot4.2 Useampi selittävä muuttuja (kertausta)
14.2.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 14.2.2019 4.2 Useampi selittävä muuttuja (kertausta) Selittäjien lukumäärä k (k-ra) = + + + + Malliin liittyvät oletukset i ~ N(0, 2 ) ja i:t ovat
Lisätiedotxi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
LisätiedotMTTTP1, luento KERTAUSTA
19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
LisätiedotPerusnäkymä yksisuuntaiseen ANOVAaan
Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
LisätiedotKvantitatiivinen genetiikka moniste s. 56
Kvantitatiivinen genetiikka moniste s. 56 - määrällisten ominaisuuksien periytymisen hallinta - mendelismi oli aluksi vastatuulessa siksi että darwinistit, joilla oli paljon valtaa Britanniassa, olivat
LisätiedotFrequencies. Frequency Table
GET FILE='C:\Documents and Settings\haukkala\My Documents\kvanti\kvanti_harjo'+ '_label.sav'. DATASET NAME DataSet WINDOW=FRONT. FREQUENCIES VARIABLES=koulv paino /ORDER= ANALYSIS. Frequencies [DataSet]
LisätiedotTilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004
Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004 Esimerkkien ratkaisut http://mtl.uta.fi/tilasto/tiltp3/kevat2004/kaikki_esimerkit.pdf Raija Leppälä 19. joulukuuta 2003 Sisältö 1
LisätiedotData-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]
Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen
LisätiedotTampereen yliopisto Matematiikan, tilastotieteen ja filosofian laitos Raija Leppälä puh , sähköposti
Tampereen yliopisto Matematiikan, tilastotieteen ja filosofian laitos Raija Leppälä puh. 03-2156301, sähköposti raija.leppala@uta.fi 3.2.01 Tilastollisten menetelmien perusteet II,TILTP3 Luentorunko, kevät
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
LisätiedotSPSS-perusteet. Sisältö
SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn
LisätiedotTeema 10: Regressio- ja varianssianalyysi
Teema 1: Regressio- ja varianssianalyysi Regressioanalyysi lienee t-testin ohella maailman eniten käytetty tilastollinen menetelmä. Sitä sivuttiin jo alustavasti Teemassa 4. Varianssianalyysi liittyy useallakin
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
Lisätiedotvoidaan hylätä, pienempi vai suurempi kuin 1 %?
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS
LisätiedotHarjoittele tulkintoja
Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen
LisätiedotRaija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla
Raija Leppälä Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla TAMPEREEN YLIOPISTO INFORMAATIOTIETEIDEN YKSIKÖN RAPORTTEJA 55/2017 TAMPERE 2017 TAMPEREEN YLIOPISTO
LisätiedotMTTTP5, luento Luottamusväli, määritelmä
23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A
LisätiedotVALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
Lisätiedot1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,
Lisätiedot1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,
LisätiedotOhjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla
1 Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla Raija Leppälä Opetusmoniste B 53 3. uudistettu painos Matematiikan, tilastotieteen ja filosofian laitos Toukokuu
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +
LisätiedotH0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta
22.1.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 22.1.2019 Luku 3 2 -yhteensopivuus- ja riippumattomuustestit 3.1 2 -yhteensopivuustesti H0: otos peräisin tietystä jakaumasta H1: otos ei peräisin
LisätiedotResiduaalit. Residuaalit. UK Ger Fra US Austria. Maat
TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede
Lisätiedot806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
LisätiedotTutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotLuento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja
1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotMTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)
MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli
Lisätiedot(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.
2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja
LisätiedotOhjeita kvantitatiiviseen tutkimukseen
1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2
LisätiedotKaksisuuntainen varianssianalyysi. Heliövaara 1
Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =
LisätiedotKaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:
Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,
LisätiedotEstimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio
17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla
LisätiedotHAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
LisätiedotTodennäköisyyden ominaisuuksia
Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
LisätiedotJohdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
Lisätiedotpisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
LisätiedotTeema 9: Tilastollinen merkitsevyystestaus
Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan
LisätiedotA130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala
Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien
LisätiedotTilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
Lisätiedot3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i1 +...+ p X ip + u i
3. Useamman selittäajäan regressiomalli p-selittäaväaäa muuttujaa Y i = + 1 X i1 +...+ p X ip + u i i = 1,...,n (> p), missäa n = havaintojen lukumäaäaräa otoksessa. Oletukset kuten aiemmin: (1) E(u i
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
LisätiedotPylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.
Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien
LisätiedotIlmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!
8069 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2013 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOLLA 9! Ilmoittaudu Weboodissa 4.3.2013 klo
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
Lisätiedot1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla
LisätiedotEstimointi. Otantajakauma
Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin
LisätiedotKaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1
Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
LisätiedotTilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotEstimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1
Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta
LisätiedotOngelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?
Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus
LisätiedotKorrelaatiokertoinen määrittely 165
kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x
Lisätiedot1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Regressiodiagnostiikka Cooken etäisyys, Funktionaalinen muoto, Diagnostinen grafiikka, Diagnostiset testit, Heteroskedastisuus,
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotOdotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotPOPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).
KÄSITTEITÄ POPULAATIO Joukko, jota tutkitaan (äärellinen, ääretön). Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut). Näiden välillä ei aina tehdä eroa, kun puhutaan
Lisätiedot2. Keskiarvojen vartailua
2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena
Lisätiedot3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).
3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,
LisätiedotA250A0050 Ekonometrian perusteet Tentti
A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin
Lisätiedot3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).
3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
Lisätiedot1 Johdatus varianssianalyysiin
Tilastollisia malleja 1 & 2: Varianssianalyysi Jarkko Isotalo Y131A & Y132A 15.1.2013 1 Johdatus varianssianalyysiin 1.1 Milloin varianssianalyysiä käytetään? Varianssianalyysi on tilastotieteellinen menetelmä,
LisätiedotOpetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011
Opetus talteen ja jakoon oppilaille Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011 Aurajoen lukio ISOverstaan jäsen syksystä 2010 lähtien ISOverstas on maksullinen verkko-oppimisen
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen
LisätiedotJohdatus regressioanalyysiin. Heliövaara 1
Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
LisätiedotTilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
LisätiedotOpiskelija viipymisaika pistemäärä
806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2012 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Jatkoa harjoituksen 5 tehtävään
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
Lisätiedot/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin
30.11.2017/1 MTTTP5, luento 30.11.2017 Kertausta H 0 : µ = µ 0 Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin = / ~ 0,1. Kaava 5.1 30.11.2017/2 Esim. Tutkija
Lisätiedot