MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN MUUTTUJIEN NORMAALISUUS. Statistics

Samankaltaiset tiedostot
54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

TUTKIMUSOPAS. SPSS-opas

Kvantitatiiviset menetelmät

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

SPSS ohje. Metropolia Business School/ Pepe Vilpas

AMOS (SPSS) ohjelman käyttöohje (versio SPSS AMOS 22.0)

Frequencies. Frequency Table

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

SEM1, työpaja 2 ( )

Tilastolliset ohjelmistot A. Pinja Pikkuhookana

2. Aineiston kuvailua

Perusnäkymä yksisuuntaiseen ANOVAaan

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla

, Määrälliset tutkimusmenetelmät 2 4 op

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio


ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

Harjoitus 9: Excel - Tilastollinen analyysi

Kaisa Kirves. Tampereen yliopisto, YKY, psykologia

Usean selittävän muuttujan regressioanalyysi

Harjoitustyön suorittaminen - artikkelit Artikkeli 1: Management Capabilities and Environmental Characteristics in the Critical Operational Phase of E

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

805306A Johdatus monimuuttujamenetelmiin, 5 op

I Tilastollisen aineiston ja analyysin edellytysten tarkistaminen. - Muunnokset, uudelleen koodaaminen, summamuuttujien luominen

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi

Yleistetyistä lineaarisista malleista

Kandidaatintutkielman aineistonhankinta ja analyysi

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Sisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

MTTTP5, luento Luottamusväli, määritelmä

SPSS OPAS. Metropolia Liiketalous

SPSS-tuloksista raportiksi (Hotulainen & Waltzer, 2015)

Konfirmatorinen faktorianalyysi. 1. Rakenneyhtälömalli. 1. Rakenneyhtälömalli. Risto Hotulainen Helsingin yliopisto

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

Johdatus regressioanalyysiin. Heliövaara 1

Kvantitatiivinen genetiikka moniste s. 56

TKMS7a-f/LRS20a-f/MAS2/KVS2/TMS82a-f/JOM/TJM/YRM Monimuuttujamenetelmien soveltaminen taloustieteissä. Tentti

SPSS-ohjeita. Metropolia Pertti Vilpas

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 3

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta

Regressioanalyysi. Vilkkumaa / Kuusinen 1

SPSS-perusteet. Sisältö

Soveltuvan menetelmän valinta. Kvantitatiiviset menetelmät. Faktorianalyysi. Faktorianalyysi. Faktorianalyysin perusidea.

Ohjeita kvantitatiiviseen tutkimukseen

Regressioanalyysi. Kuusinen/Heliövaara 1

Harjoittele tulkintoja

HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ

Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Otannasta ja mittaamisesta

Teema 10: Regressio- ja varianssianalyysi

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

MTTTP1, luento KERTAUSTA

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute.

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

ABHELSINKI UNIVERSITY OF TECHNOLOGY

IBM SPSS Statistics 21 (= SPSS 21)

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

II Tilastollisen aineiston ja analyysin edellytysten tarkistaminen

MTTTP1, luento KERTAUSTA

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ ESIPUHE...III ESIPUHE KIRJAN TOISEEN PAINOKSEEN... VIII SISÄLLYSLUETTELO...

vkp 4*(1+0)/(32-3)-1= vkp 2*(1+0)/(32-3)=

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

KAHDEN RYHMÄN VERTAILU

Rakenneyhtälömallit (Structural Equation Models, SEM)

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

Opinnäytetyön ja harjoitustöiden tekijöille

Aki Taanila VARIANSSIANALYYSI

4.2 Useampi selittävä muuttuja (kertausta)

RISTIINTAULUKOINTI JA Χ 2 -TESTI

MTTTP1, luento KERTAUSTA

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

I Keskiarvot ja hajonnat muuttujista 3-26 niin, että luokittelevana muuttujana on muuttuja 2 eli sukupuoli

Mat Tilastollisen analyysin perusteet, kevät 2007

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 2

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Menestyminen valintakokeissa ja todennäköisyyslaskussa

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 4) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

HAVAITUT JA ODOTETUT FREKVENSSIT

Transkriptio:

MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN 28.4.2016 MANNE KALLIO 2016 MUUTTUJIEN NORMAALISUUS : Frequencies Statistics Output: Skewness ja kurtosis -1 <>1 < 2 X std.error Skewnessin ja kurtosiksen arvo ei nyrkkisäännön mukaan saisi olla yli kaksi kertaa niin suuri kuin niiden standard error, jotka aina myös ilmoitetaan outputissa. : Descriptive statistics Explore Dependent list: tutkittavat muuttujat (Factor list: jos halutaan jakaa aineisto lk-muuttujan mukaan) Output: Boxplot, Kolmogorov ja Shaporo-Wilk Kolmogorov (jos n > 50) tai Shapiro-Wilk: normaalisuus on voimassa, jos p>.05 MÄÄRÄLLISET TUTKIMUSMENETELMÄT 1

MUUTTUJIEN VÄLINEN YHTEYS Correlations Pearson normaalinen, parametrinen, välimatka/suhdeasteikko Spearman nonparametrinen Korrelaatiokerroin r < 0,3 ei riippuvuutta 0,3 < r < 0,7 kohtalainen riippuvuus r > 0,7 voimakas riippuvuus Sig.-arvo (merkitsevyys) p 0,05 tilastollisesti melkein merkitsevä (yksi asteriski *) p 0,01 tilastollisesti merkitsevä (kaksi asteriskia **) p 0,001 tilastollisesti erittäin merkitsevä (kolme asteriskia ***) MUUTTUJIEN VÄLINEN YHTEYS Descriptives Crosstabs esim. syntymävuosi vs. suoritetut opintopisteet luokittelumuuttujan rakentaminen ja ristiintaulukointi uudelleen 2

T-TESTI Kaksiluokkainen dikotominen luokittelumuutja ja välimatka/suhdeasteikollinen riippuva muuttuja Compare means independent samples T-test Esim. sukupuoli ja joku summamuuttuja (likert) LEVENEN TESTI: varianssien erisuuruustesti p >.05 varianssit eivät eroa eli yhtä suuret ylärivi p <.05 varianssit eroavat eli erisuuret alarivi VARIANSSIANALYYSI Compare means One Way Anova Selitettävä (dependent) esim. joku summamuuttuja likert Ryhmittelevä joku moniluokkainen esim. koulutusohjelmakoodattuna Options: Test of homogenity, descriptives POST HOC TUKEY / BONFERRONI p <.05 keskiarvot eroavat luokkien välillä p >.05 keskiarvot eivät eroa luokkien välillä 3

varianssianalyysit (kotitehtävä) viriketausta päättelyn, kielten_ka, matematiikan arvosanan ja opintomenestyksen suhteen SUM_SosMK (= sosiaalinen minkäkäsitys) SUM_ulkoMK (= ulkonäöllinen minäkäsitys) Aineisto: Alkukysely Tehtävä 1: Selvitä kaikkien tst-muuttujien normaalisuus ja reliabiliteetit, raportoi ne Tehtävä 2: Muodosta edellisistä summamuuttujat Tehtävä 3: Tarkastele muodostettujen summamuuttujien välisiä yhteyksiä. Raportoi ja tulkitse tulokset. Tehtävä 4: Tutki faktorianalyysin avulla seuraavia väittämäryhmiä: TSTOAHD1-3, YRITSTRAT1-3, TSTEPAV1-3 Tehtävä 5: Jaa matematiikan arvosana kolmeen luokkaan, ja selvitä eroavatko muodostetut tilastomuuttujat ryhmien välillä. Tehtävä 6: OTR 22.11.2016 Sovella mielestäsi mielekkäällä tavalla jotakin taustamuuttujaa muodostettujen tilastomuuttujien tarkasteluun. 4

OTR Aineisto: Alkukysely Tehtävä 1: Selvitä kaikkien tst-muuttujien normaalisuus ja reliabiliteetit, raportoi ne : Descriptive statistics Explore Dependent list: tutkittavat muuttujat (Factor list: jos halutaan jakaa aineisto lk-muuttujan mukaan) Scale reliability analysis Tehtävä 2: Muodosta edellisistä summamuuttujat : Compute variable (Mean) Tehtävä 3: Tarkastele muodostettujen summamuuttujien välisiä yhteyksiä. Raportoi ja tulkitse tulokset. : Correlate Bivariate : Compare Means One-Way ANOVA (esim. Dependent list: SUM_TSTAR, TSTOAHD, TSTOEPAV, Factor: TSTMINAK) Tehtävä 4: Tutki faktorianalyysin avulla seuraavia väittämäryhmiä: TSTOAHD1-3, YRITSTRAT1-3, TSTEPAV1-3 : Dimension reduction Factor (Extraction: Principal Components, Rotation: Promax) YRITSTRAT-väittämät eivät faktoroidu, mutta TSTOAHD ja TSTEPAV toimivat, ks. Myös korrelaatiomatriisi) Tehtävä 5: Jaa matematiikan arvosana kolmeen luokkaan, ja selvitä eroavatko muodostetut tilastomuuttujat luokkien välillä. : Transform Recode into different variable (aseta: Old and New values, Output Variable Name & Label Tehtävä 6: Sovella mielestäsi mielekkäällä tavalla jotakin taustamuuttujaa muodostettujen tilastomuuttujien tarkasteluun. : One-way ANOVA moniluokkainen taustamuuttuja TAI: Independent Samples T-TEST dikotominen taustamuuttuja (tai raja-arvolla kahdeksi jaettu) OTR 5

Faktorianalyysi Eksploratorinen faktorianalyysi konfirmatorinen farktorianalyysi Eksploratorisella faktorianalyysilla etsitään sopivaa faktorirakennetta. Konfirmatorisella faktorianalyysilla varmistetaan tiedetty faktorirakenne. Eksploratorinen faktorianalyysi (EFA) Selvitetään, miten mitatut muuttujat eli manifestit jakautuvat taustalla olevien latenttien piirteiden mukaan. kuinka paljon latentti muuttuja selittää kunkin mitatun muuttujan vaihtelusta. Manifesti = mitattu muuttuja (myös ns. summamuuttuja) Latentti = mitatun muuttujan vaihtelua selittävä piilevä muuttuja Latenttien määrän voi antaa muodostua aineiston perusteella tai lukita teorian perusteella. Latauksia ei voida kiinnittää tietylle latentille, kuten konfirmatorisessa faktorianalyysissa. 6

Eksploratorinen faktorianalyysi Dimension reduction Factor Method: Principal Axis Factoring Rotation: Promax Output: Eksploratorinen faktorianalyysi Kommunaliteetit, vaihteluväli 0-1, tyydyttävä >.3 Kommunaliteetti = osuus yksittäisen muuttujan vaihtelusta, jonka faktoreilla pystytään selittämään. 1 = selittyy kokonaan, 0 = ei selity laisinkaan Total variance explained = kuinka suuri osuus kokonaisvaihtelusta faktoreilla voidaan selittää. Faktorit on järjestetty niiden selitysvoiman mukaiseen järjestykseen. Cumulative = tarkastellaan kuinka suuri osuus vaihtelusta voidaan selittää tietyllä faktorimäärällä Factor correlation matrix = faktorien välinen korrelaatio 7

Eksploratorinen faktorianalyysi Minkälainen on hyvä faktorirakenne? Faktorien sisäinen korrelaatio korkea, faktorien välinen korrelaatio matala. Toisaalta, jos faktorit kuuluvat samaa ilmiötä mittaavaan mittariin, faktorien on korreloitava keskenäänkin. rakennevaliditeetti / faktorivaliditeetti: konvergenssi ja divergenssi Konfirmatorinen faktorianalyysi (CFA) Noudattaako faktorirakenne teoreettista mallia? AMOS 1. File Data files: File name, OK 2. View Variables in Dataset, Variables in Model 3. Analysis properties: Standardized estimates, Correlations of estimates, Modification indices 4. Lisää faktorit ja variablet, muista jäännökset eli residuaalit ( virhetermit ) 5. Yhdistä variablet (Variables in Dataset) 6. Nimeä faktorit, variablet ja residuaalit 7. Tallenna 8. Estimoi 9. Tarkastele tulokset 8

Lisää faktori Lisää havaittu muuttuja (variable) Lisää polku (path) AMOS Lisää faktori ja sille variablet (mittausmalli) Lisää yhteys Poista objekti Valitse objekti Estimoinnin asetukset Siirrä objektia Estimoi rakennemalli RUN Säädä objektin muotoa Siirrä parametrin kohtaa Tallenna rakennemalli SAVE Näytä estimoinnin tulokset AMOS Output Notes for Model & Model Fit: good fit acceptable fit (cut off) Chi-square/df <2, p>.05 CFI, NFI, TLI >.95 >.90 RMSEA <.08 Estimates: Standardized Regression Weights: Kunkin variablen faktorilataus Correlations: Faktorien välinen korrelaatio Modification indices: Tarkastele suurimmasta pienimpään. Teorian salliessa, kokeile tehdä muutoksia malliin yksi kerrallaan. 9

Regressioanalyysin avulla selvitetään, kuinka paljon jo(i)llakin muuttujalla voidaan selittää (ennustaa) toisen muuttujan vaihtelua. Independent REGRESSIOANALYYSI dependent Kun selittäjiä on useita, regressiokertoimen neliö ilmaisee, kuinka paljon nämä yhteensä selittävät selitettävän vaihtelusta. Regressioanalyysin tuloksena on kausaalisia selityssuhteita. Kuitenkin, kausaalisuutta pidetään erittäin ongelmallisena ihmistieteellisessä tutkimuksessa. Kausaalisuuden edellytykset ovat: (i) aikaehto eli A:n vaihtelu aiheuttaa vaihtelua B:ssä, (ii) empiriaehto eli A:n ja B:n vaihtelu todetaan empiirisesti (ei loogisesti) riippumatta toisistaan ja (iii) deduktioehto eli A:n ja B:n riippuvuussuhde on johdettavissa yleisemmästä teoriasta. (Allardt, 1969, ks. Kallio 2014) GLM (General Linear Model) - Regressioanalyysi Yksi selitettävä (jatkuva, intervalliasteikko), monia selitettäviä Linear Regression Monia selittäjiä ja selitettäviä MANOVA General Linear Model 10

Analyze Regression Linear Dependent: opintomenestys Independents: verbaalinen testi, päättelytehtävä, kielten keskiarvo, matematiikan arvosana Method: Enter Statistics Lineaarinen regressioanalyysi Estimates, Model fit OUTPUT: Lineaarinen regressioanalyysi R 2 = selitysaste (adjusted: otoskoko ja selittäjien määrä huomioitu) ANOVA: (H0=kaikki regressiokertoimet nollia sig <.05 = eivät ole) Itse asiassa selitysosuus lasketaan eli mallin selittämä osuus kokonaisvaihtelusta lasketaan ANOVA taulusta: (Regression Sum of Squares) jaettuna kokonaisvaihtelulla (Total Sum of Squares) Coefficients (regressiokertoimet) ja sig. <.05 11

MANOVA Analyze General Linear Model Multivariate Dependent: verbaalinen testi, päättelytesti Fixed Factors: viriketausta, sukupuoli Options Estimates of Effect Size Rakenneyhtälömallinnus Rakenneyhtälömalliin kuuluu mittausmalli (measurement model) ja polkumalli. ns. hybridimalli 12