Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 3

Koko: px
Aloita esitys sivulta:

Download "Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 3"

Transkriptio

1 Christina Gustafsson Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 3 Kevät 2014

2 SISÄLLYSLUETTELO 9. REGRESSIOSTA EPÄPARAMETRISIA TESTEJÄ Kahden riippumattoman otoksen vertailu Usean riippumattoman otoksen vertailu Muita epäparametrisia testejä AINEISTON TIIVISTAMINEN Keskiarvomuuttuja Eksploratiivisestä faktorianalyysistä... 13

3 2 9. REGRESSIOSTA Regressioanalyysiä käytetään pääasiassa silloin, kun yhden muuttujan (selitettävä eli riippuva muuttuja eli vastemuuttuja) vaihtelua halutaan selittää yhden tai useamman muuttujan (selittävä(t) muuttuja(t), selittäjä(t)) vaihtelun avulla. Regressioanalyysityyppejä on useita. Analyze-valikon Regression-valinnan proseduurilla Linear (kuvio 68) voidaan muodostaa lineaarinen regressiomalli. Selitettävä määrällinen muuttuja valitaan kohtaan Dependent (esimerkissä Ansiotyönmäärä ) ja selittävät (yleensä määrällisiä) muuttujat kohtaan Independents (esimerkissä Ikä ja Osallistuminen ). Jos selittäjä on laadullinen, on se esitettävä dummy muuttujien avulla. Dummy-muuttuja on apumuuttuja, jonka arvot ovat luvut 0 ja 1. Lineaarisessa regressiossa oletuksena on, että selitettävän ja selittäjien välinen riippuvuus on lineaarista. Jos selittäjiä on useita, ne eivät saisi korreloida keskenään (ainakaan voimakkaasti). Lisäksi selitettävän muuttujan jakauman pitäisi olla normaalijakauma jokaisella selittävän muuttujan arvolla siten, että varianssi on vakio. Näitä jälkimmäisiä oletuksia tutkitaan kuitenkin jäännösten eli residuaalien avulla vasta sen jälkeen, kun malli on muodostettu: jäännösten jakauman tulisi olla sellainen normaalijakauma, jonka keskiarvo on 0 ja lisäksi jäännösten varianssin tulisi olla vakio (jolloin jäännökset ovat homoskedastiset) Kohdassa Method voidaan valita, miten usean selittäjän mallissa selittäjät valitaan, mm. Enter kaikki Independents-listan muuttujat pakotetaan samaan malliin Forward etenevä regressio, jolloin muodostuu useita malleja: ensin yhden selittäjän malli, sitten kahden selittäjän malli jne. Stepwise askeltava regressio, jolloin muodostuu useita malleja: ensin yhden selittäjän malli, sen jälkeen malliin lisätään uusi muuttuja, mutta mallista voidaan myös poistaa siinä ollut muuttuja jne. Remove ensin muodostuu malli, jossa on mukana kaikki selittäjät, sitten muodostuu malli, jossa kaikki selittäjät on pudotettu pois Backward muodostuu useita malleja: ensin malli, jossa on mukana kaikki selittäjät, sen jälkeen pudotetaan selittäjiä yksi kerrallaan mallista pois. Selection Variable -kohdassa voidaan valita tutkittava osajoukko. Statistics-lisävalinnan avulla valitaan mallista tulostettavat tunnusluvut. Regressiokertoimien (Regression Coeffiecients) estimaatit saadaan valinnalla Estimates, luottamusvälit valinnalla Confidence Intervals ja kovarianssimatriisi valinnalla Covariance Matrix. Model Fit -valinnalla muodostuu mm. selitysaste ja ANOVA-taulukko. R squared change -valinnalla saadaan mallin selitysasteen muutos, kun malliin lisätään tai mallista poistetaan muuttujia. Descriptivesvalinnalla saadaan kuvailevia tunnuslukuja ja korrelaatiomatriisi. Part and partial correlations - valinnalla saadaan mm. osittaiskorrelaatiot. Collinearity diagnostics -valinnalla saadaan usean selittäjän regressionallin multikollineaarisuustarkastelut. Jäännösten (Residuals) autokorreloituneisuutta voidaan selvittää Durbin-Watson testillä ja yksittäisten tilastoyksiköiden residuaaleja voidaan tutkia valinnalla Casewise Diagnostics. Plots-lisävalinnalla voidaan muodostaa pisteparvikuvioita (Scatter) mm. seuraaville arvoille: DEPENDNT selitettävän muuttujan arvot *ZPRED standardoidut ennustearvot *ZRESID standardoidut jäännökset eli residuaalit *DRESID muunnetut residuaalit, jotka esittävät jäännöksiä silloin, kun ko. tilastoyksikköä ei ole otettu mukaan regressiokertoimien estimointiin

4 3 *ADJPRED *SRESID ennustearvot, jotka muodostuvat, kun ko. tilastoyksikköä ei ole otettu mukaan regressiokertoimien estimointiin studentisoidut residuaalit Standardized Residual Plots -valinnoilla voidaan muodostaa residuaaleista frekvenssihistogrammi (Histogram) tai kuvio, jolla voidaan tutkia residuaalien normaalisuutta (Normal probability plot). Kuvio 68. Linear Regression määrittelyikkunoita Save-lisävalinnalla voidaan havaintoaineistoon lisätä muuttujiksi erilaisia versioita mallin ennustearvoista (Predicted), residuaaleista (Residuals) ja etäisyystunnusluvut (Distances). Influence

5 4 Statistics -valinnoilla voidaan muodostaa tunnuslukuja, jotka esittävät mm. yksittäisten tilastoyksiköiden vaikutusta regressiokertoimiin. Prediction Intervals -valinnoilla voidaan muodostaa ennustearvojen keskiarvolle (Mean) tai yksittäisille havainnoille (Individuals) luottamusväli (Confidence Interval). Kuviossa 69 on lineaarisen regression perustuloksia. Selitettävä muuttuja (Dependent Variable) on Ansiotyön määrä viikossa tunteina ja selittävät muuttujat ovat Osallistuminen opetukseen ja Ikä. Model Summary -taulukosta nähdään mallin selitysaste (R Square), joka on 0.288, joten muodostuneella mallilla voidaan selittää Ansiotyön määrän vaihtelusta n. 29 %. ANOVA-taulukon F- testin hypoteesit ovat H 0 : populaatiossa mallin selitysaste on 0 eli mallin kaikki regressiokertoimet i ovat nollia H 1 : populaatiossa mallin selitysaste on suurempi kuin 0 eli mallissa ainakin yksi regressiokerroin on nollasta eroava F-testin arvo on ja sen havaittu merkitsevyystaso (Sig.) on nyt 0.000, joten ainakin jompikumpi selittävistä muuttujista selittää Ansiotyön määrän vaihtelua. Coefficients-taulukossa näkyvät regressiokertoimet (Unstardardized Coefficients B), joten estimoitu malli on nyt = Ikä Osallistuminen opetukseen. Malli tulkintaa: jos Ikä kasvaa yhdellä vuodella, kasvaa Ansiotyön määrä keskimäärin tuntia/vko, kun Osallistuminen opetukseen muuttujan arvo ei muutu. Jos Osallistuminen opetukseen kasvaa yhden tunnin/vko, pienenee Ansiotyön määrä keskimäärin tuntia/vko, kun Ikä-muuttujan arvo ei muutu. Stanrdardoidut regressiokertoimet (Stardardized Coefficients Beta) ovat käyttökelpoisia selittäjien keskinäiseen vertailuun erityisesti silloin, kun selittäjillä on erilaiset mittayksiköt. Koska Ikä-muuttujalla on itseisarvoltaan suurempi stardardoitu regressiokerroin (0.458) kuin Osallistuminen opetukseen - muuttujalla (-0.229), on Ikä-muuttuja merkittävämpi selittäjä Ansiotyön määrälle. Coefficients-taulukossa näkyvät myös regressiokertoimien merkitsevyystestit (t) ja niiden havaitut merkitsevyystasot (Sig.). Ko. testeissä hypoteesit ovat H 0 : populaatiossa selittäjän x i regressiokerroin i = 0 H 1 : populaatiossa ko. muuttujan regressiokerroin i 0 Vakion (Constant) havaittu merkitsevyystaso on 0.988, joten vakio voidaan tulkita nollaksi. Ikä ja Osallistuminen opetukseen muuttujien p-arvot ovat vastaavasti ja 0.029, joten Ikä on tilastollisesti erittäin merkitsevä selittäjä ja Osallistuminen opetukseen tilastollisesti melkein merkitsevä selittäjä tässä lineaarisessa regressiomallissa. Kuviossa 70 on jäännösten histogrammikuvio sekä pisteparvikuvio standardoiduista ennusteista ja jäännöksistä. Ensimmäisen kuvion perusteella jäännösten jakauma vaikuttaa lähes normaalijakaumalta, jonka keskiarvo on nolla. Toisen kuvion perusteella jäännösten varianssi on lähes samanlainen eri ennustearvoilla, joten jäännökset ovat homoskedastiset. Näiden kuvioiden perusteella lineaarisen regression jäännöksiin liittyvät oletukset näyttävät siis toteutuvan.

6 5 Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate,536 a,288,267 8,58 a. Predictors: (Constant), Osallistuminen opetukseen (tuntia v iikossa), Ikä v uosina ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regression 2022, ,059 13,736,000 a Residual 5005, ,604 Total 7027, a. Predictors: (Constant), Osallistuminen opetukseen (tuntia viikossa), Ikä vuosina b. Dependent Variable: Ansiotyön määrä viikossa tunteina Coefficients a Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant),102 6,614,015,988 Ikä vuosina,953,215,458 4,438,000 Osallistuminen opetukseen (tuntia viikossa) -,468,210 -,229-2,225,029 a. Dependent Variable: Ansiotyön määrä viikossa tunteina Kuvio 69. Linear Regression -proseduurin perustulostusta Kuvio 70. Linear Regression -proseduurin kuvioita

7 6 Lineaarisen regression lisäksi regressioproseduurina on mm. Curve Estimation. Curve Estimation - proseduurilla voidaan yhden selittäjän lineaarisen regressionmallin lisäksi/sijasta muodostaa epälineaarisia yhden selittäjän regressiomalleja. Mallissa on aina yksi määrällinen selitettävä muuttuja ja yksi määrällinen selittävä muuttuja tai selittävänä muuttujana on aika (= havainnon järjestysnumero). Malliksi voidaan valita esim. toisen asteen polynomimalli (Quadratic), kolmannen asteen polynomimalli (Qubic) ja eksponentiaalinen malli (Exponential). Tämän proseduurin tulokset esitetään oletusarvoisesti sellaisena pisteparvikuviona, jonka päälle piirtyy valitun mallin estimoitu. Lisäksi saadaan tulostukseen taulukkoesitys mallin selitysasteesta ja mallin regressiokertoimista.

8 7 10. EPÄPARAMETRISIA TESTEJÄ Luvussa 8 käsitellyt keskiarvotestit ovat tyypillisiä parametrisia testejä, joissa tehdään oletuksia muuttujien jakaumien muodosta (esim. että tarkasteltavan muuttujan jakauma on normaalijakauma) ja muuttujien mitta-asteikoista (esim. että tarkasteltava muuttuja on määrällinen). Epäparametriselle (eli parametrittomalle) testille on tyypillistä se, että edellä esitetyn tapaisia oletuksia kevennetään, joten epäparametristen testien käyttömahdollisuudet ovat laajemmat kuin parametristen testien Epäparametriset testit ovat kuitenkin testivoimakkuuksiltaan huonompia kuin parametriset testit, joten parametristä testiä kannattaa käyttää, jos sen oletukset ovat voimassa. Aiemmin käsitellyistä testeistä ristiintaulukosta muodostettu 2 -riippumattomuustesti on epäparametrinen testi. Analyze-valikon kohdassa Nonparametric Tests on kokoelma ns. epäparametrisiä testejä. Valinnan Legacy Dialogs avulla päästään tekemään näitä testejä niin, että testitulosten yhteydessä saadaan tarvittaessa myös esille tilastollisten tunnuslukujen arvoja. Jos käytetään suoraan valintoja One Sample, Indepedent Samples tai Related Samples, voi testejä tehdä puolittain ohjatusti/automaattisesti, mutta tällöin saadaan esille vain testien tulokset: hyväksytäänkö vai hylätäänkö testin nollahypoteesi Kahden riippumattoman otoksen vertailu 2 Independent-Samples -proseduurilla voidaan vertailla kahden ryhmän eroa sellaisen muuttujan suhteen, joka on vähintään järjestysasteikon mittausta. Määrittelyikkunassa (kuvio 71) ruutuun Test Variable List valitaan testattavat muuttujat (esimerkissä Ikä ) ja kohtaan Grouping Variable se muuttuja, jonka perusteella vertailtavat kaksi ryhmää muodostuvat (esimerkissä tdk). Define Groups - valinnalla määritetään ryhmittelevän muuttujan arvoista ne kaksi arvoa, joiden perusteella ryhmät muodostuvat. Kuvio Independent-Samples -proseduurin päämäärittelyikkuna Testiksi voidaan valita (Test Type): Mann-Whitney U, joka on ns. epäparametrinen versio kahden riippumattoman otoksen keskiarvotestistä. Testillä tutkitaan, onko kahden otosta samasta populaatiosta erityisesti sijainnin suhteen. Testiä voi käyttää korvaamaan kahden riippumattoman otoksen keskiarvotesti silloin,

9 8 kun keskiarvotestin normaalijakaumaoletus ei toteudu tai jos otoskoot ovat pieniä. Testin hypoteesit ovat H 0 : populaatioissa ko. muuttujan jakaumasijainnit ovat samanlaiset H 1 : populaatioissa ko. muuttujan jakaumasijainnit ovat erilaiset Moses extreme reactions, jolla voidaan testata, onko koemuuttujan ja kontrollimuuttujan arvojen vaihteluvälit samat. Kolmogorov-Smirnov Z, jolla voidaan tutkia, onko kaksi otosta (ryhmää) samasta populaatiosta. Testi reagoi millaiseen eroon tahansa. Wald-Wolfowitz runs, jolla voidaan tutkia, onko kaksi otosta samasta populaatiosta Testi reagoi millaiseen eroon tahansa. Kuviossa 72 on em. proseduurin tulostusta silloin, kun testityypiksi on valittu Mann-Whitney U. Tulostuksesta Ranks-taulukosta nähdään mm. että humanistisen tiedekunnan opiskelijoiden otoskoko on 219 ja keskimääräinen ikäsijaluku on sekä yhteiskuntatieteellisen tiedekunnan opiskelijoiden otoskoko on 103 ja keskimääräinen ikäsijaluku on Test Statistics -taulukossa on esitetty Mann-Whitney U-testin arvo ja sen havaittu merkitsevyystaso Eri tiedekuntien opiskelijoiden ikäjakaumien sijainneilla ei siis ole tilastollisesti merkitsevää eroa. Ranks Tiedekunta N Mean Rank Sum of Ranks Ikä vuosina humanistinen , ,00 yhteiskuntatieteellinen , ,00 Total 322 Test Statistics a Ikä vuosina Mann-Whitney U 11090,000 Wilcoxon W 16446,000 Z -,245 Asymp. Sig. (2-tailed),807 a. Grouping Variable: Tiedekunta Kuvio Independent-Samples -proseduurin tulostusta Usean riippumattoman otoksen vertailu K Independent Samples -proseduurilla voidaan vertailla kolmen tai useamman ryhmän eroja sellaisen muuttujan suhteen, joka on vähintään järjestysasteikon mittausta. Määrittelyikkunassa (kuvio 73) ruutuun Test Variable List valitaan testattavat muuttujat (esimerkissä Opintojen ) ja kohtaan Grouping Variable se muuttuja, jonka perusteella vertailtavat kaksi ryhmää muodostuvat (esimerkissä paaaine). Define Range -valinnalla määritetään ryhmittelevän muuttujan arvoista ne arvot, joiden perusteella ryhmät muodostuvat.

10 9 Kuvio 73. K Independent-Samples -proseduurin päämäärittelyikkuna Testiksi voidaan valita (Test Type): Kruskal-Wallis H, joka on epäparametrinen versio yksisuuntaisesta varianssianalyysistä. Testillä voidaan tutkia, ovatko otokset peräisin samasta populaatiosta erityisesti sijainnin suhteen. Testi on yleistys Mann-Whitneyn U-testistä. Testiä voi käyttää yksisuuntainen varianssianalyysi silloin, kun varianssianalyysin normaalijakaumaoletus ei toteudu tai jos otoskoot ovat pieniä. Testin hypoteesit ovat H 0 : populaatioissa ko. muuttujan jakaumasijainnit ovat samanlaiset H 1 : populaatioissa ko. muuttujan jakaumasijainnit ovat erilaiset Median, joka on mediaanitesti, joka perustuu ristiintaulukkoon, jossa jokaisesta otoksesta esitetään mediaania suurempien havaintoarvojen frekvenssi sekä niiden havaintojen määrä, jotka ovat pienempiä tai yhtäsuuria kuin mediaani. Testi on voimakkuudeltaan heikompi kuin Kruskal- Wallisin H-testi. Testin hypoteesit ovat H 0 : populaatioissa ko. muuttujan mediaanit ovat yhtä suuret H 1 : populaatioissa ko. muuttujan mediaanit eivät ole yhtä suuret Kuviossa 74 on em. proseduurin tulostusta silloin, kun testityypiksi on valittu Kruskal-Wallis H. Tulostuksesta Ranks-taulukosta nähdään mm. että eri pääaineiden opiskelijoiden otoskoot (14, 33, 66, 48 ja 54) sekä opintojen edistymisen keskimääräiset sijaluvut (129.71, jne). Keskimääräisten sijalukujen perusteella ruotsin opiskelijat näyttävät edistyvän opinnoissaan muita hitaammin (pienin sijalukukeskiarvo). Test Statistics -taulukossa on esitetty Kruskl-Wallisin H-testin arvo on sen havaittu merkitsevyystaso Eri pääaineopiskelijoiden edistymisjakaumien sijainneilla ei siis ole tilastollisesti merkitsevää eroa. Ranks

11 10 Opintojen edistyminen Pääaine N Mean Rank englanti ,71 nykysuomi ,77 ruotsi 66 94,57 saksa ,35 viestintätieteet ,50 Total 215 Test Statistics a,b Opintojen edistyminen Chi-Square 8,680 df 4 Asymp. Sig.,070 a. Kruskal Wallis Test b. Grouping Variable: Pääaine Kuvio 74. K Independent-Samples -proseduurin tulostusta Muita epäparametrisia testejä Proseduurilla Chi-Square Test voidaan tehdä 2 -yhteensopivuustesti, jolla vertaillaan Test Variable List -kohtaan valitun muuttujan luokkien havaittuja frekvenssejä haluttuihin teoreettisiin frekvensseihin. Expected Range -kohdassa valitaan muodostuvien luokkien määrä: Get from data-vaihtoehdolla luokkia muodostuu niin paljon kuin muuttujalla on erilaisia arvoja, ja Use specified range -valinnalla Lower- ja Upper-kokonaislukujen suljettuun väliin jäävät arvot muodostavat luokat. Luokkien frekvenssejä vertaillaan teoreettisiin frekvensseihin, jotka muodostetaan valinnan Expected Values avulla: All categories equal -vaihtoehdolla luokkien teoreettiset frekvenssit asetetaan yhtäsuuriksi (tasajakaumavertailu), kun taas Values-kohdassa voidaan ilmoittaa luokkien teoreettiset frekvenssit tai prosentuaaliset osuudet yksitellen luokkia vastaavassa järjestyksessä. Proseduurilla Runs voidaan testata, onko muuttujan kahden arvon esiintymisjärjestys satunnainen. Cut Point -kohdassa valintaan tunnusluku (Mean, Median, Mode) tai luku (Custom), jonka perusteella muuttujan arvot jaetaan kahteen luokkaan. Ensimmäiseen luokkaan kuuluvat valittua lukua pienemmät havaintoarvot ja toiseen luokkaan valittua lukua suuremmat tai yhtäsuuret havaintoarvot. 2 Related Samples-proseduurilla voidaan vertailla kahden riippuvan muuttujan jakaumia. Testiksi voidaan valita (Test Type): Wilcoxon, jolla voidaan tutkia, onko kahdella riippuvalla muuttujalla sama jakauma. Muuttujien jakaumien muodosta ei tehdä mitään alkuoletuksia. Sign, jolla voidaan tutkia, onko kahdella riippuvalla muuttujalla sama jakauma. McNemar, jolla voidaan tutkia kahta riippuvaa dikotomista muuttujaa. Sopii erityisesti silloin, kun tarkastellaan ennen-jälkeen-kokeiden muutossuuntia. K Related Samples-proseduurilla voidaan vertailla kahden tai useamman riippuvan muuttujan jakaumia. Testiksi voidaan valita (Test Type): Friedman, jolla testataan nollahypoteesia: k riippuvaa muuttujaa ovat samasta populaatiosta. Kendall s W, jolla testataan nollahypoteesia: k otosta on samasta populaatiosta. Testi sopii erityisesti silloin, kun halutaan mitata arvostelijoiden tai tuomareiden samankaltaisuutta annettujen sijalukujen tai -pisteiden suhteen. Cochran s Q, jolla testataan nollahypoteesia: k:lla riippuvalla dikotomisella muuttujalla on jakauman keskikohta sama. Testi on McNemarin testin yleistys.

12 AINEISTON TIIVISTAMINEN Erityisesti kyselytutkimuksissa on muuttujien lukumäärä niin suuri, että yksittäisen muuttujien käsittely on vaivalloista ja aikaa vievää. Samaan asiaan liittyvien muuttujien sisältämää informaatiota voidaan tiivistää yhdeksi muuttujaksi, jota voidaan analysoida tilastomenetelmillä Keskiarvomuuttuja Keskiarvomuuttujalla (joskus käytetään myös nimitystä summamuuttuja) tarkoitetaan sellaista muuttujaa, jonka arvot saadaan laskemalla kahden tai useamman vähintään järjestysasteikollisen muuttujan keskiarvo. Tällaista keskiarvomuuttujaa käytetään paljon kyselytutkimuksissa, jossa tietty kysymysjoukko liittyy samaan asiaan. Keskiarvomuuttujan laatiminen kannattaa aloittaa niin, että käy läpi samaan asiaan liittyvät kysymykset/väitteet ja tarkistaa, että väitteet ovat samansuuntaisia. Jos näin ei ole, täytyy esimerkiksi kielteisesti esitettyjen väitteiden vastaukset muuntaa myönteisiksi. Esim. väite: Tilastotiede on hauskaa on myönteinen, mutta väite Tilastotiede on turhaa on kielteinen. Jos muuttujien arvokoodeina on ollut esim. alun perin 1 = täysin eri mieltä, 5 = täysin samaa mieltä, vaihdetaan kielteisten väittämien muuttuja-arvot (käyttäen esim. Transform-valikon Recode into Different Variables -proseduuria) niin, että luvun 1 tilalle laitetaan 5, luvun 2 paikalle 4, luku 3 säilyy ennallaan, luvun 4 tilalle 2 ja luvun 5 tilalle 1 ja samalla vaihdetaan myös väitteen nimi (esim. Tilastotiede EI ole turhaa ). Seuraavaksi tarkistetaan, ovatko ko. muuttujat yhteismitallisia esim. Cronbachin tunnusluvun avulla. Cronbachin :n arvo riippuu muuttujien korrelaatioista ja lukumäärästä Mitä suurempi on (maksimiarvo 1), sitä enemmän muuttujat ovat yhteismitallisia. Cronbachin saadaan laskettua Analyzevalikon Scale-valinnan proseduurilla Reliablity Analysis. Ko. proseduurin päämärittelyikkunassa (kuvio 75) valitaan mahdollisesti yhdistettävät muuttujat kohtaan Items (esimerkissä k4501, k4502, jne). Model-valinta Alpha tuottaa tulokseksi Cronbachin - tunnusluvun. Statistics-lisävalinnalla Scale if item deleted saadaan tuloksiin Cronbachin -tunnusluvun arvo silloinkin, kun joku tietty valittu muuttuja jätettäisiin yhdistämisestä pois. Kuvio 75. Reliability Analysis -proseduurin määrittelyikkunoita

13 12 Kuviossa 76 on em. proseduurin tuloksia. Reliability Statistics taulukosta Cronbachin :n arvo 0.888, joten valittujen kuuden muuttujan yhteismitallisuus on hyvä. Item-Total Statistics taulukon viimeisessä sarakkeessa olevat Cronbachin :n arvot ovat lukua pienempiä, joten minkään muuttujan poistaminen ei parantaisi jäljelle jäävien 5 muuttujan yhteismitallisuutta. Reliability Statistics Cronbach's Alpha N of Items,888 6 Item-Total Statistics [k4501] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Moottoriajoneuvo varastetaan [k4502] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Moottoriajoneuvoa vahingoitetaan [k4503] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Kotiin murtaudutaan [k4504] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Polkupyörä varastetaan [k4505] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Muuta henkilökohtaista omaisuutta varastetaan [k4506] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Henkilökohtaista omaisuutta vahingoitetaan Scale Mean if Item Deleted Scale Variance if Item Deleted Corrected Item- Total Correlation Cronbach's Alpha if Item Deleted 10,01 7,978,720,865 9,90 7,948,735,863 10,10 8,505,602,884 9,68 8,267,606,884 10,00 7,768,777,856 10,00 7,756,784,855 Kuvio 76. Reliability Analysis -proseduurin tulostusta Nyt on siis vahvat perusteet laskea ko. muuttujista keskiarvomuuttuja, jonka arvot kuvaavat sitä, kuinka huolissaan vastaajat ovat mahdollisuudesta joutua omaisuusrikoksen uhriksi. Keskiarvomuuttuja muodostetaan käyttäen esim. Transform-valikon Compute Variable proseduuria niin, että Target Variable ruutuun tulee keskiarvomuuttujan nimi (esim. huoli_omaisuusrikoksista) ja Numeric Expression -ruutuun kaavaksi (k k k k k k4506)/6. Näin saadun keskiarvomuuttujan pieni arvo tarkoittaa, että vastaaja ei ole huolestunut ja suuri arvo, että

14 13 vastaaja on huolestunut, koska alkuperäisilläkin muuttujilla pieni arvo tarkoitti sitä, ettei ole huolestunut ja suuri arvo sitä, että on huolestunut. Keskiarvomuuttujaa voidaan analysoida kuten muitakin määrällisiä muuttujia (yksittäisten muuttujien sijasta), kun esim. vertaillaan, ovatko miehet ja naiset yhtä huolissaan siitä, että joutuvat jonkinlaisen omaisuusrikoksen uhriksi Eksploratiivisestä faktorianalyysistä Faktorianalyysistä voidaan erottaa kaksi lähestymistapaa, joista eksploratiivinen faktorianalyysi pyrkii löytämään muuttujajoukosta faktoreita (eli latentteja muuttujia), jotka pystyvät selittämään havaittujen muuttujien vaihtelua ilman, että ennalta on vahvoja odotuksia löydettävien määrästä tai tulkinnasta, kun taas konfirmatorisessa faktorianalyysissä on jo ennalta olemassa käsitys aineiston faktorirakenteesta ja analyysin tehtävänä on joko vahvistaa tai kumota tämä käsitys. Eksploratiivinen faktorianalyysi on siis aineistolähtöinen tutkimusmenetelmä. Analyysin tuloksena voidaan löytää yksi tai useampia faktoreita, joita käytetään hyväksi tulosten tulkinnassa. Analyze-valikon Dimension Reduction -valinnan proseduurilla Factor (kuvio 77) voidaan muodostaa faktorimalli. Faktoroitavat muuttujat valitaan kohtaan Variables (esimerkissä k1601, k1602, jne). Faktoroitavien muuttujien tulisi korreloida keskenään (muttei liikaa), muuttujien tulisi olla määrällisiä ( hyvä järjestysasteikkokin käy, nyt kyseessä Likertin asteikko: kaikilla valituilla muuttujilla muuttujaarvokoodit 1 = erittäin tyytymätön,, 5 = erittäin tyytyväinen), muuttujien olisi hyvä olla mittayksiköiltään samankaltaisia sekä normaalijakautuneita. Selection Variable -kohdassa voidaan valita tutkittava osajoukko, jos sen muodostaminen perustuu vain yhteen aineiston muuttujaan. Descriptives-lisävalinnan avulla valitaan tulostukseen tunnuslukuja ja testejä. Statistics kohdan Univariate descriptives valinnalla saadaan muuttujien keskiarvot ja hajonnat sekä Initial solution - valinnalla saadaan kommunaliteetit ja ominaisarvot. Correlation Matrix -kohdan Coefficientsvalinnalla saadaan korrelaatiomatriisi, valinnalla Reproduced saadaan faktoriratkaisun perusteella estimoidut korrelaatiot, valinnalla Significance levels korrelaatioiden merkitsevyystestauksen p-arvot ja esim. KMO and Bartlett s test of Sphericity valinnalla saadaan Kaiser-Meyer-Olkin -indeksin sekä Bartlettin testin tulokset. Extraction-lisävalinnalla voidaan valita faktorilatausten estimointimenetelmä (Method): Principal components valinnalla tehdään pääkomponenttianalyysi (joka ei ole sama asia kuin faktorianalyysi), useimmiten käytetään joko Principal axis factoring (pääakseli-) tai Maximum Likelihood menetelmää. Display-kohdassa valitaan tulostetaanko rotatoimaton faktorilatausmatriisi (Unrotated factor solution) ja Scree Plot kuvio. Faktoreiden määrä voi perustua joko faktoreiden ominaisarvoon (Based on Eigenvalue, oletusrajana 1) tai itse valittuun lukumäärään (Fixed number of factors). Rotation-lisävalinnalla valitaan rotatointimenetelmä (Method). Jos halutaan suorakulmainen rotaatio (korreloimattomat faktorit), valitaan Varimax (tai Quartimax). Jos halutaan vinorotaatio, valitaan esim. Direct Oblimin. Display-kohdassa valitaan tulostetaanko rotatoitu faktorilatausmatriisi (Rotated solution) ja faktoreista muuttujien latausten pisteparvet (Loading plots). Scores-lisävalinnalla voidaan laskea faktoripistemäärät ja tallettaa ne havaintoaineistoon Save as variables valinnalla. Options-lisävalinnalla voidaan mm. estää itseisarvoltaan pienten latausten esittäminen latausmatriisissa valinnalla Suppress small coefficients (usein rajana käytetään lukua 0.3)

15 14 Kuvio 77. Factor-proseduurin määrittelyikkunoita

16 15 Kuviossa 78 on faktorianalyysituloksia. Correlation Matrix taulukko on korrelaatiomatriisi. Muutamien muuttujien välillä on korrelaatiota, joten on luultavaa, että muuttujien korrelaatioiden taustalla on faktoreita. KMO and Bartlett s Test taulukon Kaiser-Meyer-Olkin (=KMO) indeksin arvo on kohtalainen (pitäisi olla ehdottomasti yli 0.5), joten sen perusteella voidaan todeta muuttujajoukon olevan sen verran homogeenisen, että faktorointi on järkevää. Bartlett s Test testin p-arvo 0.000, joka osoittaa, että korrelaatiomatriisi ei ole yksikkömatriisi, joten ainakin joidenkin muuttujien välillä on korrelaatiota, ja siten tämänkin testin perusteella faktorointi on järkevää. KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy.,789 Bartlett's Test of Sphericity Approx. Chi-Square 1012,773 df 78 Sig.,000 Kuvio 78. Factor-proseduurin tulostusta: korrelaatioita, testituloksia ja kommunaliteetteja

17 16 Kuviossa 78 on esillä osa faktoroitujen muuttujien kommunaliteeteista (Communalities). Alkuperäinen kommunaliteetti muuttujalle k1601 on 0.224, eli kaikki faktorit selittävät vain 22.4 % ko. muuttujan vaihtelusta. Faktoroinnin jälkeen (kun mukana on 4 faktoria, tämä tulos myöhemmin) ko. muuttujan kommunaliteetti on Jos muuttujan kommunaliteetti on hyvin alhainen (esim. pienempi kuin 0.2), voidaan harkita sen pudottamista analyysistä pois. Analyysiä on nyt kuitenkin jatkettu niin, että kaikki alun perin mukana olleet muuttujat pidetään analyysissä mukana. Kuvio 79. Factor-proseduurin tulostusta: ominaisarvot ja Scree Plot Kuviossa 79 on esillä faktoreiden ominaisarvot (Eigenvalues) ja Scree Plot kuvio, joiden avulla päätellään faktoreiden määrää. Ominaisarvot kuvaavat, kuinka hyvin faktorit pystyvät selittämään

18 17 analysoitavien muuttujien vaihtelua. Jatkoanalyysiin otetaan (oletusarvoisesti) mukaan ne faktorit, joiden ominaisarvo on suurempi kuin 1. Nämä 4 faktoria selittävät lähes 50 % analysoitavien muuttujien yhteisvaihtelusta. Faktoreiden määrää voi harkita Cattelin scree plot kuvion avulla: sovitetaan silmämääräisesti suora pienten ominaisarvojen faktoreille (itse piirretty kuvion päälle jälkikäteen) ja katsotaan montako alkupään faktoria jää suoran yläpuolelle (nyt myös 4). Seuraavaksi tulostuu Factor Matrix, joka on rotatoimaton faktorimatriisi. Se koostuu faktorilatauksista. Rotatointi kuitenkin tekee faktorirakenteesta yleensä selvemmän, joten kannattaa tulkita rotatoitua faktorimatriisia (Rotated Factor Matrix), joka on esitetty kuviossa 80. Faktorilataus on muuttujan ja faktorin välinen korrelaatio. Ensimmäisellä faktorilla erityisen vahvat lataukset ovat muuttujilla k1610, k1611 ja k1613, joten ko. faktori kuvannee tyytyväisyyttä palveluihin. Toisella faktorilla latautuvat vahvasti muuttujat k1607 ja k1608, joten faktori kuvaa tyytyväisyyttä ympäristöön. Kolmannella faktorilla vahvat lataukset osuvat muuttujiin k1603-k1605, joten faktori kuvaa tyytyväisyyttä liikennejärjestelyihin. Viimeisellä faktorilla isoimmat lataukset ovat muuttujilla k1601 ja k1602, joten faktori kuvannee tyytyväisyyttä asuntoon. Tämän faktorianalyysin tuloksena saatiin 13 muuttujan sisältämä tieto tiivistettyä 4 faktoriin. Rotated Factor Matrix a Factor [k1601] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asunnon koko ja varusteet [k1602] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asumisen kustannukset [k1603] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Työmatkakustannukset [k1604] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Liikenneyhteydet [k1605] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Liikenneturvallisuus [k1606] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Puistojen ja viheralueiden laatu [k1607] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Rauhallisuus ja yleinen järjestys alueella [k1608] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Melutaso ja ilmanlaatu [k1609] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asuinalueen katujen ja teiden hoito [k1610] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Kaupallisten palvelujen sijainti [k16011] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Kaupungin/ kunnan palvelujen sijainti [k16012] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asuinalueen arvostus [k16013] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asuinalueen palvelutason kokonaisuus ,472,762,466,345,658,412,581,484,826,704,429,824,673,390,360,794 Extraction Method: Principal Axis Factoring. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 7 iterations. Kuvio 80. Factor-proseduurin tulostusta: rotatoitu faktorimatriisi Jos faktoripistemäärät muodostetaan Scores-lisävalinnalla, tulevat ne aineistoikkunaan (kuvio 81) esille uusina muuttujina (nyt siis 4 faktoria eli 4 uutta muuttujaa: FAC1_1 FAC4_1). Esimerkiksi vastaaja

19 18 numero 7 on tyytymättömämpi asuinalueensa palveluihin kuin vastaaja numero 2, koska vastaajan numero 7 faktoripistemäärä on selvästi pienempi kuin vastaajan numero 2 faktoripistemäärä Faktoripistemääriä voi käyttää tilastoanalyyseissä määrällisten muuttujien tapaan, esim. voitaisiin tutkia, ovatko nais- ja miesvastaajat keskimäärin yhtä tyytyväisiä asuinalueensa palveluihin. Kuvio 81. Factor-proseduurin muodostamat faktorit aineistoikkunassa

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan

Lisätiedot

, Määrälliset tutkimusmenetelmät 2 4 op

, Määrälliset tutkimusmenetelmät 2 4 op 6206209, Määrälliset tutkimusmenetelmät 2 4 op Jyrki Reunamo, Helsingin yliopisto, Opettajankoulutuslaitos 19.2.2015 1 Varianssianalyysi (Pallant 2007, Tähtinen & Isoaho 2001) Verrataan ryhmien keskiarvoja.

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

KAHDEN RYHMÄN VERTAILU

KAHDEN RYHMÄN VERTAILU 10.3.2015 KAHDEN RYHMÄN VERTAILU Jouko Miettunen Center for Life-Course and Systems Epidemiology jouko.miettunen@oulu.fi Luennon sisältö Luokitellut muuttujat Ristiintaulukko, prosentit Khiin neliötesti

Lisätiedot

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute.

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute. COMPUTE x=rv.ormal(0,0.04). COMPUTE y=rv.ormal(0,0.04). execute. compute hplib_man_r = hplib_man + x. compute arvokons_man_r = arvokons_man + y. GRAPH /SCATTERPLOT(BIVAR)=hplib_man_r WITH arvokons_man_r

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

Frequencies. Frequency Table

Frequencies. Frequency Table GET FILE='C:\Documents and Settings\haukkala\My Documents\kvanti\kvanti_harjo'+ '_label.sav'. DATASET NAME DataSet WINDOW=FRONT. FREQUENCIES VARIABLES=koulv paino /ORDER= ANALYSIS. Frequencies [DataSet]

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle] Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen

Lisätiedot

Sisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

Sisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN MUUTTUJIEN NORMAALISUUS. Statistics

MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN MUUTTUJIEN NORMAALISUUS. Statistics MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN 28.4.2016 MANNE KALLIO 2016 MUUTTUJIEN NORMAALISUUS : Frequencies Statistics Output: Skewness ja kurtosis -1 1 < 2 X std.error Skewnessin ja kurtosiksen

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Faktorianalyysi (Factor analysis) Faktorianalyysi jaetaan perinteisesti kahteen osaan Eksploratiiviseen (explorative factor analysis)

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Harjoittele tulkintoja

Harjoittele tulkintoja Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

Soveltuvan menetelmän valinta. Kvantitatiiviset menetelmät. Faktorianalyysi. Faktorianalyysi. Faktorianalyysin perusidea.

Soveltuvan menetelmän valinta. Kvantitatiiviset menetelmät. Faktorianalyysi. Faktorianalyysi. Faktorianalyysin perusidea. Kvantitatiiviset menetelmät Soveltuvan menetelmän valinta SELITETTÄVÄ MUUTTUJA Pienryhmäkokoontumisissa tarvitaan EK0- aineiston haastattelulomake. Sen voi tulostaa verkosta. Linkki löytyy kurssin kotisivulta:

Lisätiedot

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on? Tilastollinen tietojenkäsittely / SPSS Harjoitus 4 Tarkastellaan ensin aineistoa KUNNAT. Koska kyseessä on kokonaistutkimus, riittää, että tutkit tunnuslukujen arvoja ja teet niiden perusteella päätelmiä.

Lisätiedot

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi

Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 5 Seuraava etappi Datan keruu alkanut 9.2.2005 2.välinäyttönä palautetaan aineisto SPSS-tiedostona 14.2. palaute tiedostosta

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,

Lisätiedot

Muuttujien väliset riippuvuudet esimerkkejä

Muuttujien väliset riippuvuudet esimerkkejä Tarja Heikkilä Muuttujien väliset riippuvuudet esimerkkejä Sisältö MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN TILASTOLLINEN TESTAUS MERKITSEVYYSTASO MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN SPSS-OHJELMALLA

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä. Tilastollinen tietojenkäsittely / SPSS Harjoitus 3 Tällä harjoituskerralla tarkastellaan harjoituksissa 2 tehtyjä SPSS-havaintoaineistoja KUNNAT, kyselya ja kyselyb. Aineistoihin tutustutaan mm. erilaisten

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Aki Taanila VARIANSSIANALYYSI

Aki Taanila VARIANSSIANALYYSI Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä. Tilastollinen tietojenkäsittely / SPSS Harjoitus 3 Tällä harjoituskerralla tarkastellaan harjoituksissa 2 tehtyjä SPSS-havaintoaineistoja KUNNAT, kyselya ja kyselyb. Jos epäilet, että aineistosi eivät

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Aki Taanila TILASTOLLINEN PÄÄTTELY

Aki Taanila TILASTOLLINEN PÄÄTTELY Aki Taanila TILASTOLLINEN PÄÄTTELY 17.6.2010 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 7 2.1 Normaalijakautuneisuuden testaaminen... 7 2.2 Keskiarvon luottamusväli...

Lisätiedot

Faktorianalyysi. Tarja Heikkilä. Esimerkki

Faktorianalyysi. Tarja Heikkilä. Esimerkki Tarja Heikkilä on monimuuttujamenetelmä, jonka avulla pyritään löytämään muuttujajoukosta yhteisiä piirteitä tai ulottuvuuksia. Eksploratiivisen faktorianalyysin avulla etsitään keskenään eniten korreloivat

Lisätiedot

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 Sisällysluettelo ALKUSANAT 4 ALKUSANAT E-KIRJA VERSIOON 5 SISÄLLYSLUETTELO 6 1 PERUSASIOITA JA AINEISTON SYÖTTÖ 8 11 PERUSNÄKYMÄ 8 12 AINEISTON SYÖTTÖ VERSIOSSA 9 8 Muuttujan määrittely versiossa 9 11

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS

Lisätiedot

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten.

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten. Tilastollinen tietojenkäsittely / SPSS Harjoitus 1 VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten. 1. Avaa SPSS-ohjelma. Tarkoitus olisi muodostaa tämän sivun

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Kvantitatiivinen genetiikka moniste s. 56

Kvantitatiivinen genetiikka moniste s. 56 Kvantitatiivinen genetiikka moniste s. 56 - määrällisten ominaisuuksien periytymisen hallinta - mendelismi oli aluksi vastatuulessa siksi että darwinistit, joilla oli paljon valtaa Britanniassa, olivat

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Regressiodiagnostiikka Cooken etäisyys, Funktionaalinen muoto, Diagnostinen grafiikka, Diagnostiset testit, Heteroskedastisuus,

Lisätiedot

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat: Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Mallin valinta Painotettu PNS-menetelmä Alaspäin askellus, Askellus, Askeltava valikointi, Diagnostinen grafiikka, Diagnostiset

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Usean selittävän muuttujan regressioanalyysi

Usean selittävän muuttujan regressioanalyysi Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

4.2 Useampi selittävä muuttuja (kertausta)

4.2 Useampi selittävä muuttuja (kertausta) 14.2.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 14.2.2019 4.2 Useampi selittävä muuttuja (kertausta) Selittäjien lukumäärä k (k-ra) = + + + + Malliin liittyvät oletukset i ~ N(0, 2 ) ja i:t ovat

Lisätiedot

2. Aineiston kuvailua

2. Aineiston kuvailua 2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

IBM SPSS Statistics 21 (= SPSS 21)

IBM SPSS Statistics 21 (= SPSS 21) Tarja Heikkilä IBM SPSS Statistics 21 (= SPSS 21) SPSS = Statistical Package for Social Sciences Ohjelman käynnistys Aloitusikkuna Päävalikot Työkalut Muuttujat (Variables) Tapaukset (Cases) Tyhjä datataulukko

Lisätiedot

Aki Taanila TILASTOLLINEN PÄÄTTELY

Aki Taanila TILASTOLLINEN PÄÄTTELY Aki Taanila TILASTOLLINEN PÄÄTTELY 14.4.2012 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 7 2.1 Normaalijakautuneisuuden testaaminen... 7 2.2 Keskiarvon luottamusväli...

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas f 332 = 3 Kvartiilit(302, 365, 413) Kvartiilit: missä sijaitsee keskimmäinen 50 % aineistosta? Kvartiilit(302, 365, 413) Keskiarvo (362.2) Keskiarvo

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Teema 9: Tilastollinen merkitsevyystestaus

Teema 9: Tilastollinen merkitsevyystestaus Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan

Lisätiedot

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON? SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?...7 TILASTO...7 TILASTOTIEDE...8 HISTORIAA...9 TILASTOTIETEEN NYKYINEN ASEMA...9 TILASTOLLISTEN MENETELMIEN ROOLIT ERI TYYPPISET AINEISTOT JA ONGELMAT...10

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 2

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 2 Christina Gustafsson Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 2 Kevät 2014 SISÄLLYSLUETTELO 5. YKSIULOTTEISET JAKAUMAT... 2 5.1. Frequencies-proseduuri... 2 5.2.

Lisätiedot