Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 3
|
|
- Hannes Aho
- 9 vuotta sitten
- Katselukertoja:
Transkriptio
1 Christina Gustafsson Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 3 Kevät 2014
2 SISÄLLYSLUETTELO 9. REGRESSIOSTA EPÄPARAMETRISIA TESTEJÄ Kahden riippumattoman otoksen vertailu Usean riippumattoman otoksen vertailu Muita epäparametrisia testejä AINEISTON TIIVISTAMINEN Keskiarvomuuttuja Eksploratiivisestä faktorianalyysistä... 13
3 2 9. REGRESSIOSTA Regressioanalyysiä käytetään pääasiassa silloin, kun yhden muuttujan (selitettävä eli riippuva muuttuja eli vastemuuttuja) vaihtelua halutaan selittää yhden tai useamman muuttujan (selittävä(t) muuttuja(t), selittäjä(t)) vaihtelun avulla. Regressioanalyysityyppejä on useita. Analyze-valikon Regression-valinnan proseduurilla Linear (kuvio 68) voidaan muodostaa lineaarinen regressiomalli. Selitettävä määrällinen muuttuja valitaan kohtaan Dependent (esimerkissä Ansiotyönmäärä ) ja selittävät (yleensä määrällisiä) muuttujat kohtaan Independents (esimerkissä Ikä ja Osallistuminen ). Jos selittäjä on laadullinen, on se esitettävä dummy muuttujien avulla. Dummy-muuttuja on apumuuttuja, jonka arvot ovat luvut 0 ja 1. Lineaarisessa regressiossa oletuksena on, että selitettävän ja selittäjien välinen riippuvuus on lineaarista. Jos selittäjiä on useita, ne eivät saisi korreloida keskenään (ainakaan voimakkaasti). Lisäksi selitettävän muuttujan jakauman pitäisi olla normaalijakauma jokaisella selittävän muuttujan arvolla siten, että varianssi on vakio. Näitä jälkimmäisiä oletuksia tutkitaan kuitenkin jäännösten eli residuaalien avulla vasta sen jälkeen, kun malli on muodostettu: jäännösten jakauman tulisi olla sellainen normaalijakauma, jonka keskiarvo on 0 ja lisäksi jäännösten varianssin tulisi olla vakio (jolloin jäännökset ovat homoskedastiset) Kohdassa Method voidaan valita, miten usean selittäjän mallissa selittäjät valitaan, mm. Enter kaikki Independents-listan muuttujat pakotetaan samaan malliin Forward etenevä regressio, jolloin muodostuu useita malleja: ensin yhden selittäjän malli, sitten kahden selittäjän malli jne. Stepwise askeltava regressio, jolloin muodostuu useita malleja: ensin yhden selittäjän malli, sen jälkeen malliin lisätään uusi muuttuja, mutta mallista voidaan myös poistaa siinä ollut muuttuja jne. Remove ensin muodostuu malli, jossa on mukana kaikki selittäjät, sitten muodostuu malli, jossa kaikki selittäjät on pudotettu pois Backward muodostuu useita malleja: ensin malli, jossa on mukana kaikki selittäjät, sen jälkeen pudotetaan selittäjiä yksi kerrallaan mallista pois. Selection Variable -kohdassa voidaan valita tutkittava osajoukko. Statistics-lisävalinnan avulla valitaan mallista tulostettavat tunnusluvut. Regressiokertoimien (Regression Coeffiecients) estimaatit saadaan valinnalla Estimates, luottamusvälit valinnalla Confidence Intervals ja kovarianssimatriisi valinnalla Covariance Matrix. Model Fit -valinnalla muodostuu mm. selitysaste ja ANOVA-taulukko. R squared change -valinnalla saadaan mallin selitysasteen muutos, kun malliin lisätään tai mallista poistetaan muuttujia. Descriptivesvalinnalla saadaan kuvailevia tunnuslukuja ja korrelaatiomatriisi. Part and partial correlations - valinnalla saadaan mm. osittaiskorrelaatiot. Collinearity diagnostics -valinnalla saadaan usean selittäjän regressionallin multikollineaarisuustarkastelut. Jäännösten (Residuals) autokorreloituneisuutta voidaan selvittää Durbin-Watson testillä ja yksittäisten tilastoyksiköiden residuaaleja voidaan tutkia valinnalla Casewise Diagnostics. Plots-lisävalinnalla voidaan muodostaa pisteparvikuvioita (Scatter) mm. seuraaville arvoille: DEPENDNT selitettävän muuttujan arvot *ZPRED standardoidut ennustearvot *ZRESID standardoidut jäännökset eli residuaalit *DRESID muunnetut residuaalit, jotka esittävät jäännöksiä silloin, kun ko. tilastoyksikköä ei ole otettu mukaan regressiokertoimien estimointiin
4 3 *ADJPRED *SRESID ennustearvot, jotka muodostuvat, kun ko. tilastoyksikköä ei ole otettu mukaan regressiokertoimien estimointiin studentisoidut residuaalit Standardized Residual Plots -valinnoilla voidaan muodostaa residuaaleista frekvenssihistogrammi (Histogram) tai kuvio, jolla voidaan tutkia residuaalien normaalisuutta (Normal probability plot). Kuvio 68. Linear Regression määrittelyikkunoita Save-lisävalinnalla voidaan havaintoaineistoon lisätä muuttujiksi erilaisia versioita mallin ennustearvoista (Predicted), residuaaleista (Residuals) ja etäisyystunnusluvut (Distances). Influence
5 4 Statistics -valinnoilla voidaan muodostaa tunnuslukuja, jotka esittävät mm. yksittäisten tilastoyksiköiden vaikutusta regressiokertoimiin. Prediction Intervals -valinnoilla voidaan muodostaa ennustearvojen keskiarvolle (Mean) tai yksittäisille havainnoille (Individuals) luottamusväli (Confidence Interval). Kuviossa 69 on lineaarisen regression perustuloksia. Selitettävä muuttuja (Dependent Variable) on Ansiotyön määrä viikossa tunteina ja selittävät muuttujat ovat Osallistuminen opetukseen ja Ikä. Model Summary -taulukosta nähdään mallin selitysaste (R Square), joka on 0.288, joten muodostuneella mallilla voidaan selittää Ansiotyön määrän vaihtelusta n. 29 %. ANOVA-taulukon F- testin hypoteesit ovat H 0 : populaatiossa mallin selitysaste on 0 eli mallin kaikki regressiokertoimet i ovat nollia H 1 : populaatiossa mallin selitysaste on suurempi kuin 0 eli mallissa ainakin yksi regressiokerroin on nollasta eroava F-testin arvo on ja sen havaittu merkitsevyystaso (Sig.) on nyt 0.000, joten ainakin jompikumpi selittävistä muuttujista selittää Ansiotyön määrän vaihtelua. Coefficients-taulukossa näkyvät regressiokertoimet (Unstardardized Coefficients B), joten estimoitu malli on nyt = Ikä Osallistuminen opetukseen. Malli tulkintaa: jos Ikä kasvaa yhdellä vuodella, kasvaa Ansiotyön määrä keskimäärin tuntia/vko, kun Osallistuminen opetukseen muuttujan arvo ei muutu. Jos Osallistuminen opetukseen kasvaa yhden tunnin/vko, pienenee Ansiotyön määrä keskimäärin tuntia/vko, kun Ikä-muuttujan arvo ei muutu. Stanrdardoidut regressiokertoimet (Stardardized Coefficients Beta) ovat käyttökelpoisia selittäjien keskinäiseen vertailuun erityisesti silloin, kun selittäjillä on erilaiset mittayksiköt. Koska Ikä-muuttujalla on itseisarvoltaan suurempi stardardoitu regressiokerroin (0.458) kuin Osallistuminen opetukseen - muuttujalla (-0.229), on Ikä-muuttuja merkittävämpi selittäjä Ansiotyön määrälle. Coefficients-taulukossa näkyvät myös regressiokertoimien merkitsevyystestit (t) ja niiden havaitut merkitsevyystasot (Sig.). Ko. testeissä hypoteesit ovat H 0 : populaatiossa selittäjän x i regressiokerroin i = 0 H 1 : populaatiossa ko. muuttujan regressiokerroin i 0 Vakion (Constant) havaittu merkitsevyystaso on 0.988, joten vakio voidaan tulkita nollaksi. Ikä ja Osallistuminen opetukseen muuttujien p-arvot ovat vastaavasti ja 0.029, joten Ikä on tilastollisesti erittäin merkitsevä selittäjä ja Osallistuminen opetukseen tilastollisesti melkein merkitsevä selittäjä tässä lineaarisessa regressiomallissa. Kuviossa 70 on jäännösten histogrammikuvio sekä pisteparvikuvio standardoiduista ennusteista ja jäännöksistä. Ensimmäisen kuvion perusteella jäännösten jakauma vaikuttaa lähes normaalijakaumalta, jonka keskiarvo on nolla. Toisen kuvion perusteella jäännösten varianssi on lähes samanlainen eri ennustearvoilla, joten jäännökset ovat homoskedastiset. Näiden kuvioiden perusteella lineaarisen regression jäännöksiin liittyvät oletukset näyttävät siis toteutuvan.
6 5 Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate,536 a,288,267 8,58 a. Predictors: (Constant), Osallistuminen opetukseen (tuntia v iikossa), Ikä v uosina ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regression 2022, ,059 13,736,000 a Residual 5005, ,604 Total 7027, a. Predictors: (Constant), Osallistuminen opetukseen (tuntia viikossa), Ikä vuosina b. Dependent Variable: Ansiotyön määrä viikossa tunteina Coefficients a Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant),102 6,614,015,988 Ikä vuosina,953,215,458 4,438,000 Osallistuminen opetukseen (tuntia viikossa) -,468,210 -,229-2,225,029 a. Dependent Variable: Ansiotyön määrä viikossa tunteina Kuvio 69. Linear Regression -proseduurin perustulostusta Kuvio 70. Linear Regression -proseduurin kuvioita
7 6 Lineaarisen regression lisäksi regressioproseduurina on mm. Curve Estimation. Curve Estimation - proseduurilla voidaan yhden selittäjän lineaarisen regressionmallin lisäksi/sijasta muodostaa epälineaarisia yhden selittäjän regressiomalleja. Mallissa on aina yksi määrällinen selitettävä muuttuja ja yksi määrällinen selittävä muuttuja tai selittävänä muuttujana on aika (= havainnon järjestysnumero). Malliksi voidaan valita esim. toisen asteen polynomimalli (Quadratic), kolmannen asteen polynomimalli (Qubic) ja eksponentiaalinen malli (Exponential). Tämän proseduurin tulokset esitetään oletusarvoisesti sellaisena pisteparvikuviona, jonka päälle piirtyy valitun mallin estimoitu. Lisäksi saadaan tulostukseen taulukkoesitys mallin selitysasteesta ja mallin regressiokertoimista.
8 7 10. EPÄPARAMETRISIA TESTEJÄ Luvussa 8 käsitellyt keskiarvotestit ovat tyypillisiä parametrisia testejä, joissa tehdään oletuksia muuttujien jakaumien muodosta (esim. että tarkasteltavan muuttujan jakauma on normaalijakauma) ja muuttujien mitta-asteikoista (esim. että tarkasteltava muuttuja on määrällinen). Epäparametriselle (eli parametrittomalle) testille on tyypillistä se, että edellä esitetyn tapaisia oletuksia kevennetään, joten epäparametristen testien käyttömahdollisuudet ovat laajemmat kuin parametristen testien Epäparametriset testit ovat kuitenkin testivoimakkuuksiltaan huonompia kuin parametriset testit, joten parametristä testiä kannattaa käyttää, jos sen oletukset ovat voimassa. Aiemmin käsitellyistä testeistä ristiintaulukosta muodostettu 2 -riippumattomuustesti on epäparametrinen testi. Analyze-valikon kohdassa Nonparametric Tests on kokoelma ns. epäparametrisiä testejä. Valinnan Legacy Dialogs avulla päästään tekemään näitä testejä niin, että testitulosten yhteydessä saadaan tarvittaessa myös esille tilastollisten tunnuslukujen arvoja. Jos käytetään suoraan valintoja One Sample, Indepedent Samples tai Related Samples, voi testejä tehdä puolittain ohjatusti/automaattisesti, mutta tällöin saadaan esille vain testien tulokset: hyväksytäänkö vai hylätäänkö testin nollahypoteesi Kahden riippumattoman otoksen vertailu 2 Independent-Samples -proseduurilla voidaan vertailla kahden ryhmän eroa sellaisen muuttujan suhteen, joka on vähintään järjestysasteikon mittausta. Määrittelyikkunassa (kuvio 71) ruutuun Test Variable List valitaan testattavat muuttujat (esimerkissä Ikä ) ja kohtaan Grouping Variable se muuttuja, jonka perusteella vertailtavat kaksi ryhmää muodostuvat (esimerkissä tdk). Define Groups - valinnalla määritetään ryhmittelevän muuttujan arvoista ne kaksi arvoa, joiden perusteella ryhmät muodostuvat. Kuvio Independent-Samples -proseduurin päämäärittelyikkuna Testiksi voidaan valita (Test Type): Mann-Whitney U, joka on ns. epäparametrinen versio kahden riippumattoman otoksen keskiarvotestistä. Testillä tutkitaan, onko kahden otosta samasta populaatiosta erityisesti sijainnin suhteen. Testiä voi käyttää korvaamaan kahden riippumattoman otoksen keskiarvotesti silloin,
9 8 kun keskiarvotestin normaalijakaumaoletus ei toteudu tai jos otoskoot ovat pieniä. Testin hypoteesit ovat H 0 : populaatioissa ko. muuttujan jakaumasijainnit ovat samanlaiset H 1 : populaatioissa ko. muuttujan jakaumasijainnit ovat erilaiset Moses extreme reactions, jolla voidaan testata, onko koemuuttujan ja kontrollimuuttujan arvojen vaihteluvälit samat. Kolmogorov-Smirnov Z, jolla voidaan tutkia, onko kaksi otosta (ryhmää) samasta populaatiosta. Testi reagoi millaiseen eroon tahansa. Wald-Wolfowitz runs, jolla voidaan tutkia, onko kaksi otosta samasta populaatiosta Testi reagoi millaiseen eroon tahansa. Kuviossa 72 on em. proseduurin tulostusta silloin, kun testityypiksi on valittu Mann-Whitney U. Tulostuksesta Ranks-taulukosta nähdään mm. että humanistisen tiedekunnan opiskelijoiden otoskoko on 219 ja keskimääräinen ikäsijaluku on sekä yhteiskuntatieteellisen tiedekunnan opiskelijoiden otoskoko on 103 ja keskimääräinen ikäsijaluku on Test Statistics -taulukossa on esitetty Mann-Whitney U-testin arvo ja sen havaittu merkitsevyystaso Eri tiedekuntien opiskelijoiden ikäjakaumien sijainneilla ei siis ole tilastollisesti merkitsevää eroa. Ranks Tiedekunta N Mean Rank Sum of Ranks Ikä vuosina humanistinen , ,00 yhteiskuntatieteellinen , ,00 Total 322 Test Statistics a Ikä vuosina Mann-Whitney U 11090,000 Wilcoxon W 16446,000 Z -,245 Asymp. Sig. (2-tailed),807 a. Grouping Variable: Tiedekunta Kuvio Independent-Samples -proseduurin tulostusta Usean riippumattoman otoksen vertailu K Independent Samples -proseduurilla voidaan vertailla kolmen tai useamman ryhmän eroja sellaisen muuttujan suhteen, joka on vähintään järjestysasteikon mittausta. Määrittelyikkunassa (kuvio 73) ruutuun Test Variable List valitaan testattavat muuttujat (esimerkissä Opintojen ) ja kohtaan Grouping Variable se muuttuja, jonka perusteella vertailtavat kaksi ryhmää muodostuvat (esimerkissä paaaine). Define Range -valinnalla määritetään ryhmittelevän muuttujan arvoista ne arvot, joiden perusteella ryhmät muodostuvat.
10 9 Kuvio 73. K Independent-Samples -proseduurin päämäärittelyikkuna Testiksi voidaan valita (Test Type): Kruskal-Wallis H, joka on epäparametrinen versio yksisuuntaisesta varianssianalyysistä. Testillä voidaan tutkia, ovatko otokset peräisin samasta populaatiosta erityisesti sijainnin suhteen. Testi on yleistys Mann-Whitneyn U-testistä. Testiä voi käyttää yksisuuntainen varianssianalyysi silloin, kun varianssianalyysin normaalijakaumaoletus ei toteudu tai jos otoskoot ovat pieniä. Testin hypoteesit ovat H 0 : populaatioissa ko. muuttujan jakaumasijainnit ovat samanlaiset H 1 : populaatioissa ko. muuttujan jakaumasijainnit ovat erilaiset Median, joka on mediaanitesti, joka perustuu ristiintaulukkoon, jossa jokaisesta otoksesta esitetään mediaania suurempien havaintoarvojen frekvenssi sekä niiden havaintojen määrä, jotka ovat pienempiä tai yhtäsuuria kuin mediaani. Testi on voimakkuudeltaan heikompi kuin Kruskal- Wallisin H-testi. Testin hypoteesit ovat H 0 : populaatioissa ko. muuttujan mediaanit ovat yhtä suuret H 1 : populaatioissa ko. muuttujan mediaanit eivät ole yhtä suuret Kuviossa 74 on em. proseduurin tulostusta silloin, kun testityypiksi on valittu Kruskal-Wallis H. Tulostuksesta Ranks-taulukosta nähdään mm. että eri pääaineiden opiskelijoiden otoskoot (14, 33, 66, 48 ja 54) sekä opintojen edistymisen keskimääräiset sijaluvut (129.71, jne). Keskimääräisten sijalukujen perusteella ruotsin opiskelijat näyttävät edistyvän opinnoissaan muita hitaammin (pienin sijalukukeskiarvo). Test Statistics -taulukossa on esitetty Kruskl-Wallisin H-testin arvo on sen havaittu merkitsevyystaso Eri pääaineopiskelijoiden edistymisjakaumien sijainneilla ei siis ole tilastollisesti merkitsevää eroa. Ranks
11 10 Opintojen edistyminen Pääaine N Mean Rank englanti ,71 nykysuomi ,77 ruotsi 66 94,57 saksa ,35 viestintätieteet ,50 Total 215 Test Statistics a,b Opintojen edistyminen Chi-Square 8,680 df 4 Asymp. Sig.,070 a. Kruskal Wallis Test b. Grouping Variable: Pääaine Kuvio 74. K Independent-Samples -proseduurin tulostusta Muita epäparametrisia testejä Proseduurilla Chi-Square Test voidaan tehdä 2 -yhteensopivuustesti, jolla vertaillaan Test Variable List -kohtaan valitun muuttujan luokkien havaittuja frekvenssejä haluttuihin teoreettisiin frekvensseihin. Expected Range -kohdassa valitaan muodostuvien luokkien määrä: Get from data-vaihtoehdolla luokkia muodostuu niin paljon kuin muuttujalla on erilaisia arvoja, ja Use specified range -valinnalla Lower- ja Upper-kokonaislukujen suljettuun väliin jäävät arvot muodostavat luokat. Luokkien frekvenssejä vertaillaan teoreettisiin frekvensseihin, jotka muodostetaan valinnan Expected Values avulla: All categories equal -vaihtoehdolla luokkien teoreettiset frekvenssit asetetaan yhtäsuuriksi (tasajakaumavertailu), kun taas Values-kohdassa voidaan ilmoittaa luokkien teoreettiset frekvenssit tai prosentuaaliset osuudet yksitellen luokkia vastaavassa järjestyksessä. Proseduurilla Runs voidaan testata, onko muuttujan kahden arvon esiintymisjärjestys satunnainen. Cut Point -kohdassa valintaan tunnusluku (Mean, Median, Mode) tai luku (Custom), jonka perusteella muuttujan arvot jaetaan kahteen luokkaan. Ensimmäiseen luokkaan kuuluvat valittua lukua pienemmät havaintoarvot ja toiseen luokkaan valittua lukua suuremmat tai yhtäsuuret havaintoarvot. 2 Related Samples-proseduurilla voidaan vertailla kahden riippuvan muuttujan jakaumia. Testiksi voidaan valita (Test Type): Wilcoxon, jolla voidaan tutkia, onko kahdella riippuvalla muuttujalla sama jakauma. Muuttujien jakaumien muodosta ei tehdä mitään alkuoletuksia. Sign, jolla voidaan tutkia, onko kahdella riippuvalla muuttujalla sama jakauma. McNemar, jolla voidaan tutkia kahta riippuvaa dikotomista muuttujaa. Sopii erityisesti silloin, kun tarkastellaan ennen-jälkeen-kokeiden muutossuuntia. K Related Samples-proseduurilla voidaan vertailla kahden tai useamman riippuvan muuttujan jakaumia. Testiksi voidaan valita (Test Type): Friedman, jolla testataan nollahypoteesia: k riippuvaa muuttujaa ovat samasta populaatiosta. Kendall s W, jolla testataan nollahypoteesia: k otosta on samasta populaatiosta. Testi sopii erityisesti silloin, kun halutaan mitata arvostelijoiden tai tuomareiden samankaltaisuutta annettujen sijalukujen tai -pisteiden suhteen. Cochran s Q, jolla testataan nollahypoteesia: k:lla riippuvalla dikotomisella muuttujalla on jakauman keskikohta sama. Testi on McNemarin testin yleistys.
12 AINEISTON TIIVISTAMINEN Erityisesti kyselytutkimuksissa on muuttujien lukumäärä niin suuri, että yksittäisen muuttujien käsittely on vaivalloista ja aikaa vievää. Samaan asiaan liittyvien muuttujien sisältämää informaatiota voidaan tiivistää yhdeksi muuttujaksi, jota voidaan analysoida tilastomenetelmillä Keskiarvomuuttuja Keskiarvomuuttujalla (joskus käytetään myös nimitystä summamuuttuja) tarkoitetaan sellaista muuttujaa, jonka arvot saadaan laskemalla kahden tai useamman vähintään järjestysasteikollisen muuttujan keskiarvo. Tällaista keskiarvomuuttujaa käytetään paljon kyselytutkimuksissa, jossa tietty kysymysjoukko liittyy samaan asiaan. Keskiarvomuuttujan laatiminen kannattaa aloittaa niin, että käy läpi samaan asiaan liittyvät kysymykset/väitteet ja tarkistaa, että väitteet ovat samansuuntaisia. Jos näin ei ole, täytyy esimerkiksi kielteisesti esitettyjen väitteiden vastaukset muuntaa myönteisiksi. Esim. väite: Tilastotiede on hauskaa on myönteinen, mutta väite Tilastotiede on turhaa on kielteinen. Jos muuttujien arvokoodeina on ollut esim. alun perin 1 = täysin eri mieltä, 5 = täysin samaa mieltä, vaihdetaan kielteisten väittämien muuttuja-arvot (käyttäen esim. Transform-valikon Recode into Different Variables -proseduuria) niin, että luvun 1 tilalle laitetaan 5, luvun 2 paikalle 4, luku 3 säilyy ennallaan, luvun 4 tilalle 2 ja luvun 5 tilalle 1 ja samalla vaihdetaan myös väitteen nimi (esim. Tilastotiede EI ole turhaa ). Seuraavaksi tarkistetaan, ovatko ko. muuttujat yhteismitallisia esim. Cronbachin tunnusluvun avulla. Cronbachin :n arvo riippuu muuttujien korrelaatioista ja lukumäärästä Mitä suurempi on (maksimiarvo 1), sitä enemmän muuttujat ovat yhteismitallisia. Cronbachin saadaan laskettua Analyzevalikon Scale-valinnan proseduurilla Reliablity Analysis. Ko. proseduurin päämärittelyikkunassa (kuvio 75) valitaan mahdollisesti yhdistettävät muuttujat kohtaan Items (esimerkissä k4501, k4502, jne). Model-valinta Alpha tuottaa tulokseksi Cronbachin - tunnusluvun. Statistics-lisävalinnalla Scale if item deleted saadaan tuloksiin Cronbachin -tunnusluvun arvo silloinkin, kun joku tietty valittu muuttuja jätettäisiin yhdistämisestä pois. Kuvio 75. Reliability Analysis -proseduurin määrittelyikkunoita
13 12 Kuviossa 76 on em. proseduurin tuloksia. Reliability Statistics taulukosta Cronbachin :n arvo 0.888, joten valittujen kuuden muuttujan yhteismitallisuus on hyvä. Item-Total Statistics taulukon viimeisessä sarakkeessa olevat Cronbachin :n arvot ovat lukua pienempiä, joten minkään muuttujan poistaminen ei parantaisi jäljelle jäävien 5 muuttujan yhteismitallisuutta. Reliability Statistics Cronbach's Alpha N of Items,888 6 Item-Total Statistics [k4501] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Moottoriajoneuvo varastetaan [k4502] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Moottoriajoneuvoa vahingoitetaan [k4503] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Kotiin murtaudutaan [k4504] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Polkupyörä varastetaan [k4505] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Muuta henkilökohtaista omaisuutta varastetaan [k4506] Kuinka huolissaan mahdollisuudesta joutua seuraavan rikoksen uhriksi asuinkunnassa: Henkilökohtaista omaisuutta vahingoitetaan Scale Mean if Item Deleted Scale Variance if Item Deleted Corrected Item- Total Correlation Cronbach's Alpha if Item Deleted 10,01 7,978,720,865 9,90 7,948,735,863 10,10 8,505,602,884 9,68 8,267,606,884 10,00 7,768,777,856 10,00 7,756,784,855 Kuvio 76. Reliability Analysis -proseduurin tulostusta Nyt on siis vahvat perusteet laskea ko. muuttujista keskiarvomuuttuja, jonka arvot kuvaavat sitä, kuinka huolissaan vastaajat ovat mahdollisuudesta joutua omaisuusrikoksen uhriksi. Keskiarvomuuttuja muodostetaan käyttäen esim. Transform-valikon Compute Variable proseduuria niin, että Target Variable ruutuun tulee keskiarvomuuttujan nimi (esim. huoli_omaisuusrikoksista) ja Numeric Expression -ruutuun kaavaksi (k k k k k k4506)/6. Näin saadun keskiarvomuuttujan pieni arvo tarkoittaa, että vastaaja ei ole huolestunut ja suuri arvo, että
14 13 vastaaja on huolestunut, koska alkuperäisilläkin muuttujilla pieni arvo tarkoitti sitä, ettei ole huolestunut ja suuri arvo sitä, että on huolestunut. Keskiarvomuuttujaa voidaan analysoida kuten muitakin määrällisiä muuttujia (yksittäisten muuttujien sijasta), kun esim. vertaillaan, ovatko miehet ja naiset yhtä huolissaan siitä, että joutuvat jonkinlaisen omaisuusrikoksen uhriksi Eksploratiivisestä faktorianalyysistä Faktorianalyysistä voidaan erottaa kaksi lähestymistapaa, joista eksploratiivinen faktorianalyysi pyrkii löytämään muuttujajoukosta faktoreita (eli latentteja muuttujia), jotka pystyvät selittämään havaittujen muuttujien vaihtelua ilman, että ennalta on vahvoja odotuksia löydettävien määrästä tai tulkinnasta, kun taas konfirmatorisessa faktorianalyysissä on jo ennalta olemassa käsitys aineiston faktorirakenteesta ja analyysin tehtävänä on joko vahvistaa tai kumota tämä käsitys. Eksploratiivinen faktorianalyysi on siis aineistolähtöinen tutkimusmenetelmä. Analyysin tuloksena voidaan löytää yksi tai useampia faktoreita, joita käytetään hyväksi tulosten tulkinnassa. Analyze-valikon Dimension Reduction -valinnan proseduurilla Factor (kuvio 77) voidaan muodostaa faktorimalli. Faktoroitavat muuttujat valitaan kohtaan Variables (esimerkissä k1601, k1602, jne). Faktoroitavien muuttujien tulisi korreloida keskenään (muttei liikaa), muuttujien tulisi olla määrällisiä ( hyvä järjestysasteikkokin käy, nyt kyseessä Likertin asteikko: kaikilla valituilla muuttujilla muuttujaarvokoodit 1 = erittäin tyytymätön,, 5 = erittäin tyytyväinen), muuttujien olisi hyvä olla mittayksiköiltään samankaltaisia sekä normaalijakautuneita. Selection Variable -kohdassa voidaan valita tutkittava osajoukko, jos sen muodostaminen perustuu vain yhteen aineiston muuttujaan. Descriptives-lisävalinnan avulla valitaan tulostukseen tunnuslukuja ja testejä. Statistics kohdan Univariate descriptives valinnalla saadaan muuttujien keskiarvot ja hajonnat sekä Initial solution - valinnalla saadaan kommunaliteetit ja ominaisarvot. Correlation Matrix -kohdan Coefficientsvalinnalla saadaan korrelaatiomatriisi, valinnalla Reproduced saadaan faktoriratkaisun perusteella estimoidut korrelaatiot, valinnalla Significance levels korrelaatioiden merkitsevyystestauksen p-arvot ja esim. KMO and Bartlett s test of Sphericity valinnalla saadaan Kaiser-Meyer-Olkin -indeksin sekä Bartlettin testin tulokset. Extraction-lisävalinnalla voidaan valita faktorilatausten estimointimenetelmä (Method): Principal components valinnalla tehdään pääkomponenttianalyysi (joka ei ole sama asia kuin faktorianalyysi), useimmiten käytetään joko Principal axis factoring (pääakseli-) tai Maximum Likelihood menetelmää. Display-kohdassa valitaan tulostetaanko rotatoimaton faktorilatausmatriisi (Unrotated factor solution) ja Scree Plot kuvio. Faktoreiden määrä voi perustua joko faktoreiden ominaisarvoon (Based on Eigenvalue, oletusrajana 1) tai itse valittuun lukumäärään (Fixed number of factors). Rotation-lisävalinnalla valitaan rotatointimenetelmä (Method). Jos halutaan suorakulmainen rotaatio (korreloimattomat faktorit), valitaan Varimax (tai Quartimax). Jos halutaan vinorotaatio, valitaan esim. Direct Oblimin. Display-kohdassa valitaan tulostetaanko rotatoitu faktorilatausmatriisi (Rotated solution) ja faktoreista muuttujien latausten pisteparvet (Loading plots). Scores-lisävalinnalla voidaan laskea faktoripistemäärät ja tallettaa ne havaintoaineistoon Save as variables valinnalla. Options-lisävalinnalla voidaan mm. estää itseisarvoltaan pienten latausten esittäminen latausmatriisissa valinnalla Suppress small coefficients (usein rajana käytetään lukua 0.3)
15 14 Kuvio 77. Factor-proseduurin määrittelyikkunoita
16 15 Kuviossa 78 on faktorianalyysituloksia. Correlation Matrix taulukko on korrelaatiomatriisi. Muutamien muuttujien välillä on korrelaatiota, joten on luultavaa, että muuttujien korrelaatioiden taustalla on faktoreita. KMO and Bartlett s Test taulukon Kaiser-Meyer-Olkin (=KMO) indeksin arvo on kohtalainen (pitäisi olla ehdottomasti yli 0.5), joten sen perusteella voidaan todeta muuttujajoukon olevan sen verran homogeenisen, että faktorointi on järkevää. Bartlett s Test testin p-arvo 0.000, joka osoittaa, että korrelaatiomatriisi ei ole yksikkömatriisi, joten ainakin joidenkin muuttujien välillä on korrelaatiota, ja siten tämänkin testin perusteella faktorointi on järkevää. KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy.,789 Bartlett's Test of Sphericity Approx. Chi-Square 1012,773 df 78 Sig.,000 Kuvio 78. Factor-proseduurin tulostusta: korrelaatioita, testituloksia ja kommunaliteetteja
17 16 Kuviossa 78 on esillä osa faktoroitujen muuttujien kommunaliteeteista (Communalities). Alkuperäinen kommunaliteetti muuttujalle k1601 on 0.224, eli kaikki faktorit selittävät vain 22.4 % ko. muuttujan vaihtelusta. Faktoroinnin jälkeen (kun mukana on 4 faktoria, tämä tulos myöhemmin) ko. muuttujan kommunaliteetti on Jos muuttujan kommunaliteetti on hyvin alhainen (esim. pienempi kuin 0.2), voidaan harkita sen pudottamista analyysistä pois. Analyysiä on nyt kuitenkin jatkettu niin, että kaikki alun perin mukana olleet muuttujat pidetään analyysissä mukana. Kuvio 79. Factor-proseduurin tulostusta: ominaisarvot ja Scree Plot Kuviossa 79 on esillä faktoreiden ominaisarvot (Eigenvalues) ja Scree Plot kuvio, joiden avulla päätellään faktoreiden määrää. Ominaisarvot kuvaavat, kuinka hyvin faktorit pystyvät selittämään
18 17 analysoitavien muuttujien vaihtelua. Jatkoanalyysiin otetaan (oletusarvoisesti) mukaan ne faktorit, joiden ominaisarvo on suurempi kuin 1. Nämä 4 faktoria selittävät lähes 50 % analysoitavien muuttujien yhteisvaihtelusta. Faktoreiden määrää voi harkita Cattelin scree plot kuvion avulla: sovitetaan silmämääräisesti suora pienten ominaisarvojen faktoreille (itse piirretty kuvion päälle jälkikäteen) ja katsotaan montako alkupään faktoria jää suoran yläpuolelle (nyt myös 4). Seuraavaksi tulostuu Factor Matrix, joka on rotatoimaton faktorimatriisi. Se koostuu faktorilatauksista. Rotatointi kuitenkin tekee faktorirakenteesta yleensä selvemmän, joten kannattaa tulkita rotatoitua faktorimatriisia (Rotated Factor Matrix), joka on esitetty kuviossa 80. Faktorilataus on muuttujan ja faktorin välinen korrelaatio. Ensimmäisellä faktorilla erityisen vahvat lataukset ovat muuttujilla k1610, k1611 ja k1613, joten ko. faktori kuvannee tyytyväisyyttä palveluihin. Toisella faktorilla latautuvat vahvasti muuttujat k1607 ja k1608, joten faktori kuvaa tyytyväisyyttä ympäristöön. Kolmannella faktorilla vahvat lataukset osuvat muuttujiin k1603-k1605, joten faktori kuvaa tyytyväisyyttä liikennejärjestelyihin. Viimeisellä faktorilla isoimmat lataukset ovat muuttujilla k1601 ja k1602, joten faktori kuvannee tyytyväisyyttä asuntoon. Tämän faktorianalyysin tuloksena saatiin 13 muuttujan sisältämä tieto tiivistettyä 4 faktoriin. Rotated Factor Matrix a Factor [k1601] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asunnon koko ja varusteet [k1602] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asumisen kustannukset [k1603] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Työmatkakustannukset [k1604] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Liikenneyhteydet [k1605] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Liikenneturvallisuus [k1606] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Puistojen ja viheralueiden laatu [k1607] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Rauhallisuus ja yleinen järjestys alueella [k1608] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Melutaso ja ilmanlaatu [k1609] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asuinalueen katujen ja teiden hoito [k1610] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Kaupallisten palvelujen sijainti [k16011] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Kaupungin/ kunnan palvelujen sijainti [k16012] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asuinalueen arvostus [k16013] Tyytyväisyys seuraaviin asumiseen ja asuinalueeseen liittyviin asioihin: Asuinalueen palvelutason kokonaisuus ,472,762,466,345,658,412,581,484,826,704,429,824,673,390,360,794 Extraction Method: Principal Axis Factoring. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 7 iterations. Kuvio 80. Factor-proseduurin tulostusta: rotatoitu faktorimatriisi Jos faktoripistemäärät muodostetaan Scores-lisävalinnalla, tulevat ne aineistoikkunaan (kuvio 81) esille uusina muuttujina (nyt siis 4 faktoria eli 4 uutta muuttujaa: FAC1_1 FAC4_1). Esimerkiksi vastaaja
19 18 numero 7 on tyytymättömämpi asuinalueensa palveluihin kuin vastaaja numero 2, koska vastaajan numero 7 faktoripistemäärä on selvästi pienempi kuin vastaajan numero 2 faktoripistemäärä Faktoripistemääriä voi käyttää tilastoanalyyseissä määrällisten muuttujien tapaan, esim. voitaisiin tutkia, ovatko nais- ja miesvastaajat keskimäärin yhtä tyytyväisiä asuinalueensa palveluihin. Kuvio 81. Factor-proseduurin muodostamat faktorit aineistoikkunassa
54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
Lisätiedot1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
LisätiedotKvantitatiiviset menetelmät
Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan
Lisätiedot, Määrälliset tutkimusmenetelmät 2 4 op
6206209, Määrälliset tutkimusmenetelmät 2 4 op Jyrki Reunamo, Helsingin yliopisto, Opettajankoulutuslaitos 19.2.2015 1 Varianssianalyysi (Pallant 2007, Tähtinen & Isoaho 2001) Verrataan ryhmien keskiarvoja.
LisätiedotPerusnäkymä yksisuuntaiseen ANOVAaan
Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja
LisätiedotKAHDEN RYHMÄN VERTAILU
10.3.2015 KAHDEN RYHMÄN VERTAILU Jouko Miettunen Center for Life-Course and Systems Epidemiology jouko.miettunen@oulu.fi Luennon sisältö Luokitellut muuttujat Ristiintaulukko, prosentit Khiin neliötesti
LisätiedotGraph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute.
COMPUTE x=rv.ormal(0,0.04). COMPUTE y=rv.ormal(0,0.04). execute. compute hplib_man_r = hplib_man + x. compute arvokons_man_r = arvokons_man + y. GRAPH /SCATTERPLOT(BIVAR)=hplib_man_r WITH arvokons_man_r
LisätiedotKandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotEsim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501
Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662
Lisätiedot[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen
LisätiedotKvantitatiiviset tutkimusmenetelmät maantieteessä
Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi
LisätiedotSPSS-perusteet. Sisältö
SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn
LisätiedotFrequencies. Frequency Table
GET FILE='C:\Documents and Settings\haukkala\My Documents\kvanti\kvanti_harjo'+ '_label.sav'. DATASET NAME DataSet WINDOW=FRONT. FREQUENCIES VARIABLES=koulv paino /ORDER= ANALYSIS. Frequencies [DataSet]
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotData-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]
Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen
LisätiedotSisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...
Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...
LisätiedotTUTKIMUSOPAS. SPSS-opas
TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien
LisätiedotMTTTP1, luento KERTAUSTA
26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
Lisätiedot1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +
LisätiedotOhjeita kvantitatiiviseen tutkimukseen
1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2
LisätiedotMONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN MUUTTUJIEN NORMAALISUUS. Statistics
MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN 28.4.2016 MANNE KALLIO 2016 MUUTTUJIEN NORMAALISUUS : Frequencies Statistics Output: Skewness ja kurtosis -1 1 < 2 X std.error Skewnessin ja kurtosiksen
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Faktorianalyysi (Factor analysis) Faktorianalyysi jaetaan perinteisesti kahteen osaan Eksploratiiviseen (explorative factor analysis)
LisätiedotMTTTP1, luento KERTAUSTA
25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotHarjoittele tulkintoja
Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen
LisätiedotMTTTP5, luento Luottamusväli, määritelmä
23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A
LisätiedotSoveltuvan menetelmän valinta. Kvantitatiiviset menetelmät. Faktorianalyysi. Faktorianalyysi. Faktorianalyysin perusidea.
Kvantitatiiviset menetelmät Soveltuvan menetelmän valinta SELITETTÄVÄ MUUTTUJA Pienryhmäkokoontumisissa tarvitaan EK0- aineiston haastattelulomake. Sen voi tulostaa verkosta. Linkki löytyy kurssin kotisivulta:
LisätiedotTulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?
Tilastollinen tietojenkäsittely / SPSS Harjoitus 4 Tarkastellaan ensin aineistoa KUNNAT. Koska kyseessä on kokonaistutkimus, riittää, että tutkit tunnuslukujen arvoja ja teet niiden perusteella päätelmiä.
LisätiedotUSEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI
TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotIhminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi
Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 5 Seuraava etappi Datan keruu alkanut 9.2.2005 2.välinäyttönä palautetaan aineisto SPSS-tiedostona 14.2. palaute tiedostosta
LisätiedotTilastollisten menetelmien perusteet II TILTP3 Luentorunko
Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,
Lisätiedot(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.
2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja
Lisätiedot1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,
LisätiedotMuuttujien väliset riippuvuudet esimerkkejä
Tarja Heikkilä Muuttujien väliset riippuvuudet esimerkkejä Sisältö MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN TILASTOLLINEN TESTAUS MERKITSEVYYSTASO MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN SPSS-OHJELMALLA
LisätiedotVARIANSSIANALYYSI ANALYSIS OF VARIANCE
VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
Lisätiedot1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,
LisätiedotHAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
LisätiedotEnnen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.
Tilastollinen tietojenkäsittely / SPSS Harjoitus 3 Tällä harjoituskerralla tarkastellaan harjoituksissa 2 tehtyjä SPSS-havaintoaineistoja KUNNAT, kyselya ja kyselyb. Aineistoihin tutustutaan mm. erilaisten
LisätiedotTilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
LisätiedotLisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
LisätiedotAki Taanila VARIANSSIANALYYSI
Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen
Lisätiedotvoidaan hylätä, pienempi vai suurempi kuin 1 %?
[TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotEnnen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.
Tilastollinen tietojenkäsittely / SPSS Harjoitus 3 Tällä harjoituskerralla tarkastellaan harjoituksissa 2 tehtyjä SPSS-havaintoaineistoja KUNNAT, kyselya ja kyselyb. Jos epäilet, että aineistosi eivät
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
LisätiedotAki Taanila TILASTOLLINEN PÄÄTTELY
Aki Taanila TILASTOLLINEN PÄÄTTELY 17.6.2010 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 7 2.1 Normaalijakautuneisuuden testaaminen... 7 2.2 Keskiarvon luottamusväli...
LisätiedotFaktorianalyysi. Tarja Heikkilä. Esimerkki
Tarja Heikkilä on monimuuttujamenetelmä, jonka avulla pyritään löytämään muuttujajoukosta yhteisiä piirteitä tai ulottuvuuksia. Eksploratiivisen faktorianalyysin avulla etsitään keskenään eniten korreloivat
LisätiedotALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6
Sisällysluettelo ALKUSANAT 4 ALKUSANAT E-KIRJA VERSIOON 5 SISÄLLYSLUETTELO 6 1 PERUSASIOITA JA AINEISTON SYÖTTÖ 8 11 PERUSNÄKYMÄ 8 12 AINEISTON SYÖTTÖ VERSIOSSA 9 8 Muuttujan määrittely versiossa 9 11
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
LisätiedotTavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.
Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotTilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
LisätiedotPienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto
Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja
LisätiedotTilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit
Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli
Lisätiedotvoidaan hylätä, pienempi vai suurempi kuin 1 %?
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS
LisätiedotVIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten.
Tilastollinen tietojenkäsittely / SPSS Harjoitus 1 VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten. 1. Avaa SPSS-ohjelma. Tarkoitus olisi muodostaa tämän sivun
LisätiedotTilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä
Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien
LisätiedotMTTTP1, luento KERTAUSTA
19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
Lisätiedotxi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
LisätiedotKvantitatiivinen genetiikka moniste s. 56
Kvantitatiivinen genetiikka moniste s. 56 - määrällisten ominaisuuksien periytymisen hallinta - mendelismi oli aluksi vastatuulessa siksi että darwinistit, joilla oli paljon valtaa Britanniassa, olivat
LisätiedotOngelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?
Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus
Lisätiedot1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Regressiodiagnostiikka Cooken etäisyys, Funktionaalinen muoto, Diagnostinen grafiikka, Diagnostiset testit, Heteroskedastisuus,
LisätiedotSisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...
Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...
Lisätiedot1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi
Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.
LisätiedotMat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Mallin valinta Painotettu PNS-menetelmä Alaspäin askellus, Askellus, Askeltava valikointi, Diagnostinen grafiikka, Diagnostiset
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
LisätiedotUsean selittävän muuttujan regressioanalyysi
Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen
Lisätiedot1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
LisätiedotTilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle
Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
Lisätiedot4.2 Useampi selittävä muuttuja (kertausta)
14.2.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 14.2.2019 4.2 Useampi selittävä muuttuja (kertausta) Selittäjien lukumäärä k (k-ra) = + + + + Malliin liittyvät oletukset i ~ N(0, 2 ) ja i:t ovat
Lisätiedot2. Aineiston kuvailua
2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien
LisätiedotKURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
LisätiedotIBM SPSS Statistics 21 (= SPSS 21)
Tarja Heikkilä IBM SPSS Statistics 21 (= SPSS 21) SPSS = Statistical Package for Social Sciences Ohjelman käynnistys Aloitusikkuna Päävalikot Työkalut Muuttujat (Variables) Tapaukset (Cases) Tyhjä datataulukko
LisätiedotAki Taanila TILASTOLLINEN PÄÄTTELY
Aki Taanila TILASTOLLINEN PÄÄTTELY 14.4.2012 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 7 2.1 Normaalijakautuneisuuden testaaminen... 7 2.2 Keskiarvon luottamusväli...
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas f 332 = 3 Kvartiilit(302, 365, 413) Kvartiilit: missä sijaitsee keskimmäinen 50 % aineistosta? Kvartiilit(302, 365, 413) Keskiarvo (362.2) Keskiarvo
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
LisätiedotTA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET
TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi
LisätiedotTeema 9: Tilastollinen merkitsevyystestaus
Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan
LisätiedotSISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?
SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?...7 TILASTO...7 TILASTOTIEDE...8 HISTORIAA...9 TILASTOTIETEEN NYKYINEN ASEMA...9 TILASTOLLISTEN MENETELMIEN ROOLIT ERI TYYPPISET AINEISTOT JA ONGELMAT...10
LisätiedotJohdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
LisätiedotChristina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 2
Christina Gustafsson Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 2 Kevät 2014 SISÄLLYSLUETTELO 5. YKSIULOTTEISET JAKAUMAT... 2 5.1. Frequencies-proseduuri... 2 5.2.
Lisätiedot