SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin koneissa on myös vanhempi versio 12., se ei kuitenkaan toimi. 1. Tietojen määrittely ja syöttö Ohjelman käynnistyttyä avautuu seuraava näkymä (tähän on jo valmiiksi syötetty esimerkkitapauksen muuttujat): Alhaalla nähdään kaksi välilehteä, Data View ja Variable View. Data View muistuttaa Excelin taulukkoa, johon jokaiseen sarakkeeseen tulee yhden mittaussuureen tiedot. Tilastolliset suureet määritellään Variable View-lehdellä. Esimerkki: Askelmittari Tutkitaan kahden eri askelmittarin kahden eri päivän aikana antamien askelten määriä. Kysymyksenasettelu on, eroavatko mittarien antamat lukemat toisistaan. Mittari 1 on uusi kehitysversio. Mittari 2 on jo kaupallisesti saatavilla oleva ja luotettavaksi tiedetty mittari. Koehenkilöitä on 2, joista 15 miestä ja 5 naista. Jokaiseen koehenkilöön liittyy henkilökohtainen tunnistus- eli ID-numero. Lisätietona on henkilön paino.
Tehdään Variable View-välilehdelle määritykset: Koska yleisimpiä sukupuolia ovat mies ja nainen, voidaan Sukupuoli-muuttujalle määritellä kaksi arvoa siten, että arvo nolla vastaa miestä ja arvo 1 naista (luvut voivat olla muitakin). Klikkaa hiirellä Values-ruutua muuttujan Sukupuoli kohdalla: Toinen asia, joka pitää tässä vaiheessa miettiä, minkälainen muuttuja on kyseessä. Tämä määritellään Measure-kenttään: Scale: Jatkuva asteikko. Muuttuja voi saada mitä tahansa arvoja (esim. askelmäärä) Ordinal: Järjestyslukuasteikko. Muuttujien arvot ovat järjestetty suhteessa toisiinsa. Esimerkiksi opiskelijan arvosanat voivat olla, 1, 2, 3, 4, 5 Nominal: Kategoria-asteikko eli luokitteluasteikko. Esimerkiksi sukupuoli voi olla yleensä vain mies tai nainen. Tässä esimerkissä koehenkilöt ovat kirjanneet muistiin molempien askelmittarien lukemat kahtena eri päivänä. Siksi käytössä on muuttuja Päivä_Nro, joka voi saada arvot 1 tai 2. Henkilöiden painoa ei ole järkevää tarkastella jatkuvana muuttujana, vaan luokitella se muutamaan luokkaan: Tässä SPSS-käyttäjä on luokitellut painot käsin. Luokittelu on mahdollista automatisoida (jos lukuja on paljon), mutta jätetään sen asian opiskelu tässä yhteydessä.
Itse data voidaan siirtää esimerkiksi Excel-taulukosta copy-pastella. Lopullinen taulukko on ohessa: Valmis tuotos kannattaa tallentaa viimeistään tässä vaiheessa. File Save-valikosta. SPSS-tiedoston tarkennin on.sav. Jo olemassa olevan tiedoston avaaminen tapahtuu vastaavasti File Open Data-valikosta. 2. Tilastollisten suureiden laskeminen Tilastoaineiston tarkastelu on yleensä syytä aloittaa yksinkertaisista raporteista, joista käy ilmi mitattujen suureiden keskiarvot, keskihajonnat ja muuttujien jakaumat. Tähän on useita vaihtoehtoja. Erä tapa on käyttää Analyze Reports Case Summaries valintaa. Tässä esimerkissä tarkasteltavia muuttujia (Variables) ovat siis Mittarin 1 ja Mittarin 2 antamat askelmäärät. Ryhmittelymuuttujina (Grouping Variables) määritellään ne ominaisuudet, joiden mukaan aineistoa jaotellaan eri ryhmiin, eli tässä niitä ovat sukupuoli, päivän numero ja paino:
Statistics-napin takaa löytyy lista niistä tilastollisista suureista, joista halutaan yhteenveto: SPSS työntää kaiken ulostuksensa Output-ikkunaan. Ohjelman mukana tulee erillinen Output Viewer-ohjelma, joka käynnistyy automaattisesti kun SPSS saa laskennan loppuun. Tulostuksen voi tallentaa tavalliseen tapaan Viewerin File-valikosta. Tulostus tallentuu.spo-tarkentimella varustettuun tiedostoon.
Tässä tapauksessa yhteenveto on varsin suuri, mutta siitä löytyy paljon hyödyllistä tietoa. Case Processing Summary(a) Mittari_1 * Sukupuoli * Päivä_Nro * Paino Mittari_2 * Sukupuoli * Päivä_Nro * Paino a Limited to first 1 cases. Cases Included Excluded Total N Percent N Percent N Percent 4 1,%,% 4 1,% 39 97,5% 1 2,5% 4 1,% Seuraava tulostus on niin suuri, että se saa Wordin kaatumaan systemaattisesti, jos sitä yrittää liittää tähän, Hienoa, Bill! Laitetaan vähän alkua Eli tässä on luokiteltuna miehet, ensin 1. päivän tulokset ja myöhemmin (ei näy) 2. päivän tulokset. Kolmantena luokitteluperusteena oli paino, josta jokaisesta ryhmästä näkyy tilastolliset suureet. Tässä vielä tulostusta naisten osalta:
Toinen tapa tehdä yhteenveto on valita Analyze -> Compare Means -> Means ja sieltä Dependent List -muuttujiksi mittarit ja Independent List -muuttujiksi muut sukupuoli, päivä ja paino: Tulostus:
Case Processing Summary Cases Included Excluded Total N Percent N Percent N Percent Mittari_1 * Sukupuoli 4 1,%,% 4 1,% Mittari_2 * Sukupuoli 39 97,5% 1 2,5% 4 1,% Mittari_1 * Päivä_Nro 4 1,%,% 4 1,% Mittari_2 * Päivä_Nro 39 97,5% 1 2,5% 4 1,% Mittari_1 * Paino 4 1,%,% 4 1,% Mittari_2 * Paino 39 97,5% 1 2,5% 4 1,% Excluded-arvo tarkoittaa, että yksi arvo puuttuu (yksi koehenkilö unohti nollata mittarin). Mittari_1 Mittari_2 * Sukupuoli Sukupuoli Mittari_1 Mittari_2 mies Mean 815,4 792,689 7 N 3 29 Std. Deviation 3159,241 92 346,81 11 nainen Mean 7855,1 699,6 N 1 1 Std. Deviation 1372,78 83 299,97 31 Total Mean 842,825 7668,82 5 N 4 39 Std. Deviation 285,96 53 3123,389 5 Mittari_1 Mittari_2 * Päivä_Nro Päivä_Nro Mittari_1 Mittari_2 1, Mean 784,55 742,35 N 2 2 Std. Deviation 2645,591 93 2862,48 99 2, Mean 8245,1 7949,315 8 N 2 19 Std. Deviation 31,975 64 3432,8 91 Total Mean 842,825 7668,82 5 N 4 39
Std. Deviation 285,96 53 3123,389 5 Mittari_1 Mittari_2 * Päivä_Nro Päivä_Nro Mittari_1 Mittari_2 1, Mean 784,55 742,35 N 2 2 Std. Deviation 2645,591 93 2862,48 99 2, Mean 8245,1 7949,315 8 N 2 19 Std. Deviation 31,975 64 3432,8 91 Total Mean 842,825 7668,82 5 N 4 39 Std. Deviation 285,96 53 3123,389 5 3. Kuvaajien piirtäminen Yhden muuttujan histogrammi: Graphs -> Histogram:
12 1 Frequency 8 6 4 2 2, 4, 6, 8, 1, 12, 14, 16, Mean =842,825 Std. Dev. =285, 9653 N =4 Mittari_1 Edellä on siis esitetty, miten Mittarin 1 mittaamat askelmäärät askelmäärät jakaantuvat. Jos tietoja halutaan edelleen luokitella ryhmiin, se voidaan tehdä Panel By -asetuksen avulla. Esimerkiksi histogrammit eri painoluokille:
Paino <6 6-7 71-8 5 4 Frequency 3 2 1 2, 4, 6, 8, 1... 12... 14... 16... 2, 4, 6, 8, 1... 12... Mittari_1 14... 16... 2, 4, 6, 8, 1... 12... 14... 16... Vaaka-akselin numerot vaatisivat vähän muotoilua. Sen voi tehdä kaksoiklikkaamalla tätä kuvaa, jolloin käynnistyy Chart Editor. Tässä tilanteessa on muutettava vaakaakselin teksti verticaliksi.
4. Tilastollinen testaus Testataan, eroavatko tietyn henkilön kahden mittarin askelmäärien keskiarvot tilastollisesti merkittävästi toisistaan. Tähän voidaan käyttää Paired Samples T-Testiä. Tulosteessa tärkein luku on oikeassa alakulmassa oleva merkitsevyysarvo (Sig (2- tailed)). Tämä on ns. p-arvo, joka on sitä lähempänä nollaa, mitä merkitsevämmin kahden muuttujan arvot eroavat toisistaan. Yleensä p-arvot luokitellaan niin, että p >.1: Ero ei ole merkitsevä.1 > p >.5 : Ero on melkein merkitsevä
.5 > p >.1: Ero on merkitsevä p <.1: Ero on erittäin merkitsevä Tässä esimerkissä siis mittarien askelmäärien ero ei ole tilastollisesti merkisevä (p=.157) Toinen tapa on tarkastella aineistoja kahtena kokonaisuutena eikä verrata tuloksia koehenkilökohtaisesti pareittain. Silloin verrataan kaikkia Mittarin 1 askelmääriä Mittarin 2 askelmääriin. Luokitellaan aineisto vielä sukupuolen mukaan: Haetaan jälleen taulukosta Sig, ja todetaan että askelmäärissä ei ole tilastollisesti merkitsevää eroa sukupuolten välillä.