Perusnäkymä yksisuuntaiseen ANOVAaan



Samankaltaiset tiedostot
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

TKMS7a-f/LRS20a-f/MAS2/KVS2/TMS82a-f/JOM/TJM/YRM Monimuuttujamenetelmien soveltaminen taloustieteissä. Tentti

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

voidaan hylätä, pienempi vai suurempi kuin 1 %?

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT


MTTTP5, luento Luottamusväli, määritelmä

Harjoittele tulkintoja

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

2. Aineiston kuvailua

Kvantitatiivinen genetiikka moniste s. 56

Teema 9: Tilastollinen merkitsevyystestaus

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla

Estimointi. Otantajakauma

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

SPSS-perusteet. Sisältö

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

TUTKIMUSOPAS. SPSS-opas

Teema 10: Regressio- ja varianssianalyysi

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Otoskoon arviointi. Tero Vahlberg

Kandidaatintutkielman aineistonhankinta ja analyysi

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9

Demotehtävä + liitteet (muuttujaluettelo, käytettävät analyysimenetelmät hypoteeseineen, osa SPSS-ohjelman tulostuslistasta)

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi

Frequencies. Frequency Table

Teema 3: Tilastollisia kuvia ja tunnuslukuja

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

Mat Tilastollisen analyysin perusteet

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 22 for Windows Osa 2

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

MS-C2{04 Tilastollisen analyysin perusteet

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

RISTIINTAULUKOINTI JA Χ 2 -TESTI

USEAN RYHMÄN VERTAILU

LIITE 2. PERUSOPETUKSEN OPPIMISYMPÄRISTÖJEN NYKYTILANNE JA OPETTAJIEN VALMIUDET RAPORTTIIN LIITTYVIÄ TAULUKOITA JA KUVIOITA

SPSS OPAS. Metropolia Liiketalous

Kvantitatiiviset menetelmät

Altistusaika 1 kk 2 kk 3 kk

Muuttujien väliset riippuvuudet esimerkkejä

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Aki Taanila TILASTOLLINEN PÄÄTTELY

Aki Taanila TILASTOLLINEN PÄÄTTELY

Aki Taanila VARIANSSIANALYYSI

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 20 for Windows Osa 2

Supplementary Table S1. Material list (a) Parameters Sal to Str

, Määrälliset tutkimusmenetelmät 2 4 op

SPSS ohje. Metropolia Business School/ Pepe Vilpas

Polttoaineen laadun ja poltossa käytetyn ilmamäärän vaikutukset palamisen hallintaan uudenlaista pellettipoltinta käytettäessä

Sisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

Harjoitus 7: NCSS - Tilastollinen analyysi

Ohjeita kvantitatiiviseen tutkimukseen

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

analyysin perusteet Mat Ti lastol I isen Tentti /Mellin

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

SELVITTÄJÄN KOMPETENSSISTA

Ratkaisuja luvun 15 tehtäviin

Matemaatikot ja tilastotieteilijät

SPSS* - tilastoanalyyttinen ohjelma, vrs 9.0

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Aineistokoko ja voima-analyysi

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Terra Preta kasvatuskoe Pilkon pellolla

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

I Keskiarvot ja hajonnat muuttujista 3-26 niin, että luokittelevana muuttujana on muuttuja 2 eli sukupuoli

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

II Tilastollisen aineiston ja analyysin edellytysten tarkistaminen

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN MUUTTUJIEN NORMAALISUUS. Statistics

2. Keskiarvojen vartailua

Toimittaja Erä

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Transkriptio:

Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja (iikuntamotiivit) HARA Harrastusalue 1=urheiluharrastus 2=kuvataideharrastus 3=musiikkiharrastus 4=luontoharrastus 5=käsityöharrastus 6=matematiikkaharrastus 7=kieliharrastus 8=kirjallisuusharrastus Ryhmittelevä muuttuja Perusnäkymä yksisuuntaiseen ANOVAaan SPSS-ympäristössä yksisuuntainen ANOVA alkaa valinnoilla Analyze Compare Means One-Way ANOVA... Yksisuuntaisen ANOVAn perusnäkymä on seuraava: 754

Metsämuuronen 2006. Monimuuttujamenetelmien perusteet SPSS-ympäristössä Valinnat yksisuuntaiseen ANOVAssa ANOVAssa muuttuja, jonka keskiarvoja verrataan, on riippuva muuttuja eli Dependent ja tekijät, joiden suhteen keskiarvoja verrataan toisiinsa, ovat ryhmittelevä tekijä eli Factor. Yksisuuntaisessa ANOVAssa voidaan tehdä kolmenlaisia valintoja: voidaan säädellä mallia kontrasteja (Contrasts), tehdä parittaisvertailuja (Post Hoc) ja kuviin liittyviä valintoja (Options). ontrasteihin emme puutu tässä. ontrasteja voitaisiin käyttää esimerkiksi hyvinkin monimutkaisissa keskiarvojen vertailutilanteissa. Näiden suhteen voi konsultoida esimerkiksi SPSSmanuaalia. Sen sijaan käymme läpi analyysiimme liittyvän post hoc -testatuksen. Post hoc -painikkeen takaa avautuu valintaruutu, jossa valitsemme omaan tilanteeseemme sopivimman parittaisvertailun. Valitsen Tukeyn testin, koska se on konservatiivinen: jos Tukeyn testi huomaa tilastollisen eron ryhmien välille, ero on melko varma. Tosin tulemme huomaamaan, että varianssianalyysin perusoletus ei pidä paikkaansa: ryhmien väliset varianssit ovat erisuuret. Näin ollen olisi ollut parempi valita esimerkiksi Tamhanen testi. Continue-painike johdattaa takaisin alkuperäiseen valintaruutuun. Options-painikkeen takaa valitsen perustunnusluvut (Descriptives), varianssien yhtäsuuruustestin (Homogeneity of variance test) sekä varoiksi myös Brownin-Forsythen testin, joka on F- testin vaihtoehto tilanteessa, jossa ryhmien varianssit osoittautuvat erisuuriksi. isäksi haluaisin nähdä keskiarvojen eroja kuvaavan graafin (Means plot). 755

Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Continue-painikkeen pääsemme taas perusvalikkoon, josta O-painikkeella saamme tuloksen. Tulokset ja niiden tulkinta Tulosten tulkinta alkaa kuvailemalla aineisto: Descriptives N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Minimum Maximum ower Bound pper Bound 1 169 1,2791198,57899042,04453772 1,1911940 1,3670455 -,99149 2,01251 2 110 -,4676375,51763973,04935501 -,5654575 -,3698175-1,16472 1,75898 3 152 -,3997644,56304697,04566914 -,4899974 -,3095313-1,41931 1,81027 4 50,6024245,79222943,11203816,3772754,8275736 -,96298 1,96752 5 121 -,6352868,48960623,04450966 -,7234129 -,5471608-1,86963,84387 6 11 -,4367671,54663812,16481759 -,8040036 -,0695306-1,00297,44869 7 77 -,4709467,64315226,07329400 -,6169244 -,3249691-1,19770 1,08551 8 26 -,5075653,37942272,07441092 -,6608174 -,3543131-1,01777,31603 9 8 -,3693021,51846065,18330352 -,8027461,0641418 -,88701,44319 Total 724,0000000,94935522,03528251 -,0692684,0692684-1,86963 2,01251 Descriptives -taulukko kertoo kunkin 8 harrastusryhmän (+ 9. muu ) ryhmien otoskoot (N), keskiarvot (Mean), keskihajonnat (Std. Deviation), keskiarvon keskivirhe (Std. Error), keskiarvon 95 %:n luottamusvälin (95% Confidence Interval for Mean) ala- ja yläraja (ower Bound ja pper Bound). Otoksen 756

Metsämuuronen 2006. Monimuuttujamenetelmien perusteet SPSS-ympäristössä perusteella laskettu keskiarvo siis sijaitsee populaatiossa jossain mainitulla välillä. isäksi kaksi viimeistä saraketta kertovat muuttujan pienimmän (Minimum) ja suurimman (Maximum) arvon. Test of Homogeneity of Variances evene Statistic df1 df2 Sig. 4,566 8 715,000 Varianssien yhtäsuuruustesti (Test of Homogeneity of Variances) kertoo, että ryhmien varianssit eroavat roisistaan tilastollisesti erittäin merkitsevästi (p<0.001). Tämä on varianssianalyysin kannalta kiusallista, sillä keskeisenä oletuksena on, että ryhmien varianssit olisivat yhtä suuria. F-testi on kuitenkin melko robusti eli vakaa varianssien yhtäsuuruus-oletuksen rikkouduttua. ANOVA Sum of Squares df Mean Square F Sig. Between Groups 418,801 8 52,350 160,769,000 Within Groups 232,821 715,326 Total 651,622 723 ANOVA-taulu kertoo, että keskiarvojen eroista kertova F- testitulos (F=160.77) on korkea ja puhuu keskiarvojen eron puolesta erittäin merkitsevästi (p<0.001). Varmempi tulos saadaan kuitenkin tilanteessa Brownin-Forsythen testillä, joka tulostuu seuraavana. Robust Tests of Equality of Means Statistic(a) df1 df2 Sig. Brown-Forsythe 161,876 8 223,824,000 a Asymptotically F distributed. Päätulos on sama: ryhmien välillä on tilastollisesti erittäin merkitsevä ero. 757

Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Tiedämme siis, että ryhmien välillä on eroa, muttemme tiedä, mitkä ryhmät poikkeavat toisistaan. Tästä syystä olemme pyytäneet Post hoc -testin, joka kertoo tämän. Vain osa taulukosta on otettu tilan säästämiseksi mukaan Multiple Comparisons Dependent Variable: Tukey HSD Mean Difference (I) hara (J) hara (I-J) Std. Error Sig. 95% Confidence Interval ower Bound pper Bound 1 2 1,74675727(*),06990694,000 1,5292553 1,9642593 3 1,67888411(*),06378892,000 1,4804172 1,8773511 4,67669521(*),09186532,000,3908739,9625165 5 1,91440658(*),06795491,000 1,7029780 2,1258352 6 1,71588688(*),17756381,000 1,1634313 2,2683425 7 1,75006646(*),07845791,000 1,5059598 1,9941731 8 1,78668501(*),12021127,000 1,4126708 2,1606992 9 1,64842188(*),20646963,000 1,0060314 2,2908124 2 1-1,74675727(*),06990694,000-1,9642593-1,5292553 3 -,06787316,07143160,990 -,2901188,1543725 4-1,07006205(*),09732772,000-1,3728785 -,7672456 5,16764931,07517525,387 -,0662440,4015426 6 -,03087038,18045042 1,000 -,5923071,5305664 7,00330919,08478851 1,000 -,2604939,2671123 8,03992774,12443551 1,000 -,3472294,4270849 9 -,09833539,20895730 1,000 -,7484658,5517950 3 1-1,67888411(*),06378892,000-1,8773511-1,4804172 2,06787316,07143160,990 -,1543725,2901188 4-1,00218890(*),09303081,000-1,2916363 -,7127415 Parittaisvertailussa (Multiple Comparison) Tukeyn testi vertaa kunkin ryhmän keskiarvoa vuoronperään kaikkiin muihin ryhmiin. Ensimmäisenä verrataan 1. ryhmää (liikunnan harrastajat) 2. ryhmään (kuvataideharrastajat) ja todetaan, että ryhmien välinen ero on 1.746. Tämä on tilastollisesti erittäin merkitsevä ero (p<0.001). Itse asiassa huomataan, että liikunnan harrastajien keskiarvo liikuntamotiivifaktorilla on tilastollisesti erittäin merkitsevästi (p<0.001) korkeampi kuin millään muulla ryhmällä. Seuraavaksi käsitellään 2. ryhmä ja todetaan, että se poikkeaa keskiarvon osalta vain liikunnan harrastajista (ryhmä 1) ja luontoharrastajista (ryhmä 4). Näin edetään ja verrataan lopulta kaikkia ryhmiä toisiinsa. Tukeyn testi tarjoaa toisenkin mahdollisuuden verrata keskiarvoja. Vertailussa ryhmitellään ryhmät erilaisiin luokkiin sen mukaan miten voimakkaasti niiden keskiarvot poikkeavat toisistaan. 758

Metsämuuronen 2006. Monimuuttujamenetelmien perusteet SPSS-ympäristössä Homogenous subsets Tukey HSD hara N Subset for alpha =.05 1 2 3 5 121 -,6352868 8 26 -,5075653 7 77 -,4709467 2 110 -,4676375 6 11 -,4367671 3 152 -,3997644 9 8 -,3693021 4 50,6024245 1 169 1,2791198 Sig.,711 1,000 1,000 Means for groups in homogeneous subsets are displayed. a ses Harmonic Mean Sample Size = 28,372. b The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. Yhtenäisten ryhmien vertailu (Homogenous subsets) kertoo, että liikuntamotiivien suhteen liikunnanharrastajat ovat aivan oma ryhmänsä (ryhmän 1 keskiarvo +1,28). Tämä ryhmä eroaa korkeintaan 5 %:n riskillä luontoharrastajista (ryhmän 4 keskiarvo +0.60), joka taas eroaa korkeintaan 5 % riskillä kaikista muista ryhmistä. Muiden ryhmien välillä ei ole tilastollisesti merkitsevää eroa liikuntamotiivien suhteen. Tämä näkyy selvästi myös pyydetystä Means plotista eli keskiarvoja kuvaavasta graafista: 1,50000 Mean of 1,00000 0,50000 0,00000-0,50000-1,00000 1 2 3 4 5 hara 6 7 8 9 759