SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö



Samankaltaiset tiedostot
TUTKIMUSOPAS. SPSS-opas

Tilastolliset ohjelmistot A. Pinja Pikkuhookana

SPSS OPAS. Metropolia Liiketalous

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

SPSS ohje. Metropolia Business School/ Pepe Vilpas

2. Aineiston kuvailua

SPSS-perusteet. Sisältö

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

SPSS-ohjeita. Metropolia Pertti Vilpas

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Frequencies. Frequency Table

Teema 3: Tilastollisia kuvia ja tunnuslukuja

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Kvantitatiiviset tutkimusmenetelmät maantieteessä

MTTTP5, luento Luottamusväli, määritelmä

IBM SPSS Statistics 21 (= SPSS 21)

Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 6

KAHDEN RYHMÄN VERTAILU

Harjoittele tulkintoja

Perusnäkymä yksisuuntaiseen ANOVAaan

Kandidaatintutkielman aineistonhankinta ja analyysi

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Aki Taanila VARIANSSIANALYYSI

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Ohjeita kvantitatiiviseen tutkimukseen

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

SEM1, työpaja 2 ( )

Kvantitatiiviset menetelmät

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

SPSS* - tilastoanalyyttinen ohjelma, vrs 9.0

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten.

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

Aineistokoko ja voima-analyysi

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Vaikuttamisindeksi

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

(Jos et ollut mukana viime viikolla, niin kopioi myös SPSS-havaintoaineistotiedostot Yritys2 ja neljän kunnan tiedot.)

Muuttujien määrittely

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

Opinnäytetyön ja harjoitustöiden tekijöille

HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET

Sukupuu -ohjelma. Ossi Väre ( ) Joni Virtanen ( )

Määrällisen aineiston esittämistapoja. Aki Taanila

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

SPSS* - tilastoanalyyttinen ohjelma

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Tilastolliset toiminnot

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MASSER Loader V2.00. käyttö- ja asennusohje

I. Ristiintaulukointi Excelillä / Microsoft Office 2010

Webforum. Version 17.2 uudet ominaisuudet. Päivitetty:

Tilastomenetelmien lopputyö

2 Eläinlistan kautta voidaan tallentaa tietoja kuolleille eläimille

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

LABORAATIOSELOSTUSTEN OHJE H. Honkanen

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

HSC-ohje laskuharjoituksen 1 tehtävälle 2

MONISTE 2 Kirjoittanut Elina Katainen

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

RACE-KEEPER COMPARO PC-OHJELMAN PIKAOHJE

Aki Taanila TILASTOLLINEN PÄÄTTELY

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Til.yks. x y z

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

CEM DT-3353 Pihtimittari

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo


HARJOITUS 3: Asennetaan Windows Vista koneeseen Windows 7 Professional upgrade ohjelmisto (Windows 7 käyttöjärjestelmän asennus)

P2P (ALUSTA) RAPORTOINNIN OHJEET (ANALYTICS)

Käyttöohje. Energent MagiCAD plugin

I Keskiarvot ja hajonnat muuttujista 3-26 niin, että luokittelevana muuttujana on muuttuja 2 eli sukupuoli

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Pertti Vilpas Metropolia 1. KVANTITATIIVINEN TUTKIMUS

ATH-koulutus: R ja survey-kirjasto THL ATH-koulutus / Tommi Härkänen 1

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Estimointi. Otantajakauma

MTTTP1, luento KERTAUSTA

Kuksa -jäsenrekisterin käyttöohje ryhmänjohtajille

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Kansionäkymä listasta suuriin kuvakkeisiin

Aki Taanila. PASW Statistics 18

Kvantitatiiviset menetelmät

Transkriptio:

SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin koneissa on myös vanhempi versio 12., se ei kuitenkaan toimi. 1. Tietojen määrittely ja syöttö Ohjelman käynnistyttyä avautuu seuraava näkymä (tähän on jo valmiiksi syötetty esimerkkitapauksen muuttujat): Alhaalla nähdään kaksi välilehteä, Data View ja Variable View. Data View muistuttaa Excelin taulukkoa, johon jokaiseen sarakkeeseen tulee yhden mittaussuureen tiedot. Tilastolliset suureet määritellään Variable View-lehdellä. Esimerkki: Askelmittari Tutkitaan kahden eri askelmittarin kahden eri päivän aikana antamien askelten määriä. Kysymyksenasettelu on, eroavatko mittarien antamat lukemat toisistaan. Mittari 1 on uusi kehitysversio. Mittari 2 on jo kaupallisesti saatavilla oleva ja luotettavaksi tiedetty mittari. Koehenkilöitä on 2, joista 15 miestä ja 5 naista. Jokaiseen koehenkilöön liittyy henkilökohtainen tunnistus- eli ID-numero. Lisätietona on henkilön paino.

Tehdään Variable View-välilehdelle määritykset: Koska yleisimpiä sukupuolia ovat mies ja nainen, voidaan Sukupuoli-muuttujalle määritellä kaksi arvoa siten, että arvo nolla vastaa miestä ja arvo 1 naista (luvut voivat olla muitakin). Klikkaa hiirellä Values-ruutua muuttujan Sukupuoli kohdalla: Toinen asia, joka pitää tässä vaiheessa miettiä, minkälainen muuttuja on kyseessä. Tämä määritellään Measure-kenttään: Scale: Jatkuva asteikko. Muuttuja voi saada mitä tahansa arvoja (esim. askelmäärä) Ordinal: Järjestyslukuasteikko. Muuttujien arvot ovat järjestetty suhteessa toisiinsa. Esimerkiksi opiskelijan arvosanat voivat olla, 1, 2, 3, 4, 5 Nominal: Kategoria-asteikko eli luokitteluasteikko. Esimerkiksi sukupuoli voi olla yleensä vain mies tai nainen. Tässä esimerkissä koehenkilöt ovat kirjanneet muistiin molempien askelmittarien lukemat kahtena eri päivänä. Siksi käytössä on muuttuja Päivä_Nro, joka voi saada arvot 1 tai 2. Henkilöiden painoa ei ole järkevää tarkastella jatkuvana muuttujana, vaan luokitella se muutamaan luokkaan: Tässä SPSS-käyttäjä on luokitellut painot käsin. Luokittelu on mahdollista automatisoida (jos lukuja on paljon), mutta jätetään sen asian opiskelu tässä yhteydessä.

Itse data voidaan siirtää esimerkiksi Excel-taulukosta copy-pastella. Lopullinen taulukko on ohessa: Valmis tuotos kannattaa tallentaa viimeistään tässä vaiheessa. File Save-valikosta. SPSS-tiedoston tarkennin on.sav. Jo olemassa olevan tiedoston avaaminen tapahtuu vastaavasti File Open Data-valikosta. 2. Tilastollisten suureiden laskeminen Tilastoaineiston tarkastelu on yleensä syytä aloittaa yksinkertaisista raporteista, joista käy ilmi mitattujen suureiden keskiarvot, keskihajonnat ja muuttujien jakaumat. Tähän on useita vaihtoehtoja. Erä tapa on käyttää Analyze Reports Case Summaries valintaa. Tässä esimerkissä tarkasteltavia muuttujia (Variables) ovat siis Mittarin 1 ja Mittarin 2 antamat askelmäärät. Ryhmittelymuuttujina (Grouping Variables) määritellään ne ominaisuudet, joiden mukaan aineistoa jaotellaan eri ryhmiin, eli tässä niitä ovat sukupuoli, päivän numero ja paino:

Statistics-napin takaa löytyy lista niistä tilastollisista suureista, joista halutaan yhteenveto: SPSS työntää kaiken ulostuksensa Output-ikkunaan. Ohjelman mukana tulee erillinen Output Viewer-ohjelma, joka käynnistyy automaattisesti kun SPSS saa laskennan loppuun. Tulostuksen voi tallentaa tavalliseen tapaan Viewerin File-valikosta. Tulostus tallentuu.spo-tarkentimella varustettuun tiedostoon.

Tässä tapauksessa yhteenveto on varsin suuri, mutta siitä löytyy paljon hyödyllistä tietoa. Case Processing Summary(a) Mittari_1 * Sukupuoli * Päivä_Nro * Paino Mittari_2 * Sukupuoli * Päivä_Nro * Paino a Limited to first 1 cases. Cases Included Excluded Total N Percent N Percent N Percent 4 1,%,% 4 1,% 39 97,5% 1 2,5% 4 1,% Seuraava tulostus on niin suuri, että se saa Wordin kaatumaan systemaattisesti, jos sitä yrittää liittää tähän, Hienoa, Bill! Laitetaan vähän alkua Eli tässä on luokiteltuna miehet, ensin 1. päivän tulokset ja myöhemmin (ei näy) 2. päivän tulokset. Kolmantena luokitteluperusteena oli paino, josta jokaisesta ryhmästä näkyy tilastolliset suureet. Tässä vielä tulostusta naisten osalta:

Toinen tapa tehdä yhteenveto on valita Analyze -> Compare Means -> Means ja sieltä Dependent List -muuttujiksi mittarit ja Independent List -muuttujiksi muut sukupuoli, päivä ja paino: Tulostus:

Case Processing Summary Cases Included Excluded Total N Percent N Percent N Percent Mittari_1 * Sukupuoli 4 1,%,% 4 1,% Mittari_2 * Sukupuoli 39 97,5% 1 2,5% 4 1,% Mittari_1 * Päivä_Nro 4 1,%,% 4 1,% Mittari_2 * Päivä_Nro 39 97,5% 1 2,5% 4 1,% Mittari_1 * Paino 4 1,%,% 4 1,% Mittari_2 * Paino 39 97,5% 1 2,5% 4 1,% Excluded-arvo tarkoittaa, että yksi arvo puuttuu (yksi koehenkilö unohti nollata mittarin). Mittari_1 Mittari_2 * Sukupuoli Sukupuoli Mittari_1 Mittari_2 mies Mean 815,4 792,689 7 N 3 29 Std. Deviation 3159,241 92 346,81 11 nainen Mean 7855,1 699,6 N 1 1 Std. Deviation 1372,78 83 299,97 31 Total Mean 842,825 7668,82 5 N 4 39 Std. Deviation 285,96 53 3123,389 5 Mittari_1 Mittari_2 * Päivä_Nro Päivä_Nro Mittari_1 Mittari_2 1, Mean 784,55 742,35 N 2 2 Std. Deviation 2645,591 93 2862,48 99 2, Mean 8245,1 7949,315 8 N 2 19 Std. Deviation 31,975 64 3432,8 91 Total Mean 842,825 7668,82 5 N 4 39

Std. Deviation 285,96 53 3123,389 5 Mittari_1 Mittari_2 * Päivä_Nro Päivä_Nro Mittari_1 Mittari_2 1, Mean 784,55 742,35 N 2 2 Std. Deviation 2645,591 93 2862,48 99 2, Mean 8245,1 7949,315 8 N 2 19 Std. Deviation 31,975 64 3432,8 91 Total Mean 842,825 7668,82 5 N 4 39 Std. Deviation 285,96 53 3123,389 5 3. Kuvaajien piirtäminen Yhden muuttujan histogrammi: Graphs -> Histogram:

12 1 Frequency 8 6 4 2 2, 4, 6, 8, 1, 12, 14, 16, Mean =842,825 Std. Dev. =285, 9653 N =4 Mittari_1 Edellä on siis esitetty, miten Mittarin 1 mittaamat askelmäärät askelmäärät jakaantuvat. Jos tietoja halutaan edelleen luokitella ryhmiin, se voidaan tehdä Panel By -asetuksen avulla. Esimerkiksi histogrammit eri painoluokille:

Paino <6 6-7 71-8 5 4 Frequency 3 2 1 2, 4, 6, 8, 1... 12... 14... 16... 2, 4, 6, 8, 1... 12... Mittari_1 14... 16... 2, 4, 6, 8, 1... 12... 14... 16... Vaaka-akselin numerot vaatisivat vähän muotoilua. Sen voi tehdä kaksoiklikkaamalla tätä kuvaa, jolloin käynnistyy Chart Editor. Tässä tilanteessa on muutettava vaakaakselin teksti verticaliksi.

4. Tilastollinen testaus Testataan, eroavatko tietyn henkilön kahden mittarin askelmäärien keskiarvot tilastollisesti merkittävästi toisistaan. Tähän voidaan käyttää Paired Samples T-Testiä. Tulosteessa tärkein luku on oikeassa alakulmassa oleva merkitsevyysarvo (Sig (2- tailed)). Tämä on ns. p-arvo, joka on sitä lähempänä nollaa, mitä merkitsevämmin kahden muuttujan arvot eroavat toisistaan. Yleensä p-arvot luokitellaan niin, että p >.1: Ero ei ole merkitsevä.1 > p >.5 : Ero on melkein merkitsevä

.5 > p >.1: Ero on merkitsevä p <.1: Ero on erittäin merkitsevä Tässä esimerkissä siis mittarien askelmäärien ero ei ole tilastollisesti merkisevä (p=.157) Toinen tapa on tarkastella aineistoja kahtena kokonaisuutena eikä verrata tuloksia koehenkilökohtaisesti pareittain. Silloin verrataan kaikkia Mittarin 1 askelmääriä Mittarin 2 askelmääriin. Luokitellaan aineisto vielä sukupuolen mukaan: Haetaan jälleen taulukosta Sig, ja todetaan että askelmäärissä ei ole tilastollisesti merkitsevää eroa sukupuolten välillä.