SPSS* - tilastoanalyyttinen ohjelma = monipuolinen ohjelma, jolla voi tilastollisesti analysoida tieteellistä aineistoa ja se tuottaa myös graafisia tulosteita. Käytettävissä mikroverkossa, versio 10.0, www-ohje: http://www.evamk.fi/koti/%7evuorinen/tilasto/spssopas/kehys.htm SPSS:n oma avustus (help) SPSS:ssä on käyttökelpoinen opasohjelma (tutorial) ja lisäksi Help toiminto, joka opastaa useimmissa tilanteissa. Help-toiminnolla on kaksikin eri käyttötapaa A. Ylävalikon Help, joka avaa ikkunan, jossa voi apua hakea eri tavoin contents index find -sisällysluettelo -hakusanat aakkosellisena listana - haku asettamallasi hakusanalla, tuloksena ko. sana ja muut sanat jotka sopivat asettamaasi ehtoon; compute, Compute, COMPUTE, computer jne. B. Välitön avustus Kesken jotakin SPSS-toimintoa voit ohjelmaikkunan osia klikata hiiren oikealla näppäimellä, mikä avaa keltaisen PopUp-avustuksen: Esimerkiksi haluat selvittää, mitä tarkoittaa termi Variable(s) Frequencies-ikkunassa, klikkaamalla ko. sanaa avautuu avustava popup ruutu. SPSS:n ikkunat Data Editor Tämä ikkuna avautuu kun ohjelma käynnistetään. Se sisältää kaksi näkymää; Data View ja Variable View. Data Editorin Data View näkymässä voi tallentaa, korjata ja täydentää aineiston tietoja. Tietoja tallennettaessa voi milloin tahansa lisätä aineistoa alimmalle vapaalle riville, joka siten muodostuu SPSS-tiedostossa seuraavaksi tutkimushavainnoksi (= havaintotiedot yksittäisen tapauksen osalta, oli se sitten potilas, koe-eläin, mittaushavainto tms). SPSS:ssa analysoitavissa oleva aineisto on tiedosto, jonka tarkenninosa on muotoa sav, esimerkiksi havainnot.sav Output Viewer avautuu kun ohjelma suorittaa jokin aineiston analyysin, kyseisessä ikkunassa ovat nähtävillä SPSS:n tuottamat laskentatulokset taulukkoina ja/tai graafisina tulosteina. Tämän tiedon käyttäjä voi tallentaa SPSS:n tulostiedostoksi, jota käyttäjä voi muokata. Sen tarkenninosa on muotoa spo, esimerkiksi keskiarvotolpat.spo Chart Editor avautuu kun tulosteikkunassa (Output Viewer) halutaan muokata graafista tulostetta (esim. pylväsdiagrammia). Syntax Editor Tässä ikkunassa käyttäjä näkee halutessaan SPSS:n komentojonon, jonka perusteella SPSS suorittaa laskenta-analyysin. Esimerkiksi kunkin muuttujan keskiarvon laskemiseen on olemassa tietty komentojono (tietyn kieliopin mukaan laadittu komentosarja). Syntax editorin sisällön voi tallentaa myöhempää käyttöä varten tiedostoksi, jonka tarkenninosa on muotoa sps, esimerkiksi keskiarvot.sps *SPSS Statistical Product and Service Solutions
Yleisiä ohjeita ohjelman käytöstä. Aineisto-ikkuna, Data Editor Ikkunassa on kaksi eri näkymää Data View ja Variable View. Muuttujien määritteleminen tapahtuu Variable View - näkymässä ja aineiston syöttö Data View -näkymässä. Otsikkopalkki Valikkopalkki Pikanäppäimet Havaintomatriisi koostuu sarakkeista (variable= muuttuja) ja riveistä (tapauksista eli tilastoyksiköistä). Soluosoitin (kehykset solun ympärillä) osoittaa solun, johon havainto voidaan syöttää. Virheellinen luku voidaan korjata kirjoittamalla virheelliseen soluun uusi arvo. Tässä ohjelmaan on avattu (File ja Open) jo aiemmin valmiiksi tallennettu havaintomatriisi. Sama matriisi, mutta nyt näyttöön on valittu myös muuttujien arvojen selitteet (Value labels) View - valikosta. Huomaa myös tämän toiminnon pikanäppäin! Mikä SPSS:ssä on selite? Selite on selväkielinen kuvaus muuttujasta, esim. mitä eri arvoja se voi saada ja mitä numerolla merkitty arvo tarkoittaa. Muuttuja sukupuoli voi saada kaksi eri arvoa, 1 tai 2, ja selitteet ovat 1 = mies ja 2 = nainen Muuttujien selitteet tulee syöttää käsin uuteen tiedostoon, SPSS:n versioiden 9 ja 10 välillä on tässä eroavaisuutta.
Kun ohjelmalle annetaan komento esimerkiksi muuttujan lukumäärien jakaumien (frekvenssien) laskemiseksi, saadaan ensin Windows-ohjelmille tyypillinen lomake: Muuttujaluettelo näkyy vasemmalla olevassa ruudussa. Analyysiin mukaan tulevat muuttujat aktivoidaan näpäyttämällä ja siirretään sitten Variable(s) -ruutuun ruutujen välissä olevalla nuolinäppäimellä. Muuttujan saa takaisin muuttujaluetteloon samanlaisella toimenpiteellä. Nuolinäppäimen suunta vaihtuu, kun muuttuja aktivoidaan Variable(s) -ruudussa. Reset -näppäimellä tyhjennetään koko Variable(s) -ruutu. Muuttujan aktivointi tapahtuu joko muuttuja kerrallaan tai vetämällä hiiren vasen näppäin pohjassa useita muuttujia. Erillisiä muuttujia voi aktivoida, kun Ctrl -näppäin pidetään alhaalla. Lomakkeella on usein myös valinta-ruutuja, joihon voi hiirellä näpäyttää valintamerkin tai poistaa sen uudelleen näpäytyksellä. Lähes kaikissa lomakkeissa on myös lisämääritys-näppäimiä, joista pääsee taas uusiin lomakkeisiin. Näillä lomakkeilla suoritetut valinnat hyväksytään Continue-painikkeella. SPSS Viewer -ikkuna Laskujen tulokset, taulukot ja kuviot tulevat SPSS Viewer -ikkunaan: Ikkunassa on omat valikkonsa ja pikanäppäimensä. Huomaa, että Analyzevalikko löytyy myös Viewer-ikkunasta. Aineisto-ikkunaan ei siis enää tarvitse siirtyä joa suoritetaan laskentaa, tehdään taulukoita tai kuvioita. Kaikki tulokset tulevat samaan Viewer-ikkunaan. Viewer-ikkuna jakautuu kahteen osaan: Vasemmalla on ns. navigointi-ikkuna, joka kertoo kaikki analyysit, otsikot, huomautukset ynnä muut, mitä ohjelmalla on tehty. Oikealla on varsinainen tulosikkuna, jota voi selata ylös- ja alaspäin tai sitten voi näpäyttää Navigointi -ikkunassa jotakin otsikkoa, jolloin siihen liittyvä tuloste kelautuu automaattisesti tulosikkunan yläosaan. Taulukoita ja kuvioita pystyy muokkaamaan ja kopioimaan muihin Windows-ohjelmiin. SPSS:n matriisi-ikkuna (SPSS Data Editor) on myös avoinna ja jää usein tulosikkunan taakse. Matriisi-ikkunaan pääsee esimerkiksi Window -valikosta tai pikanäppäimestä. Myös alareunan Windowsin Tehtäväpalkista pääsee matriisi-ikkunaan. Mitä jos haluat eri analyyseja omiin tulostiedostoihinsa? Tallenna (file > save) sen hetkinen tuloste, tallentuvan tiedoston voit nimetä sisältöä kuvaavaksi, tarkenninosa on.spo. Sitten sulje tiedosto file >close. Kun suoritat SPSS:ssa seuraavan analyysin tms avautuu uusi Viewer-ikkuna, jonka taas voi tallentaa halutessaan jne.
Muuttujien määritteleminen Kun SPSS-ohjelmaan viedään aineistoa ja tallennetaan se, määritellään ensimmäiseksi muuttujat (variables). Tällöin valitaan Variable View -näkymä. Ensimmäiseen sarakkeeseen kirjoitetaan muuttujan nimi (korkeintaan 8 merkkiä, ei välilyöntejä tai skandeja ja kirjain alkuun) ja painetaan enteriä. Tuolloin ohjelma automaattisesti täyttää osan sarakkeista oletusarvoilla ja soluosoitin siirtyyy seuraavaan sarakkeeseen. Seuraavassa kuvassa ensimmäiseksi muuttujaksi on kirjoitettu lomakenumero (lomakenr) ja toiseksi sukupuoli (sp). Ensimmäiseksi muuttujaksi kannattaa laittaa lomakenumero, jotta jälkeenpäin olisi helpompi tarkastaa, mistä lomakkeesta tiedot ovat. Kun soluosoitin viedään esimerkiksi Type-sarakkeeseen (yllä oleva kuva), voidaan muuttujan tyyppi määritellä oletusarvosta poikkeavasti näpäyttämällä harmaata neliötä. Muutos tapahtuu seuraavalla lomakkeella: Lomakkeella voidaan määritellä muuttujan tyyppi, sen vaatima tila (width) eli sarakkeen leveys Data Editorissa ja desimaalien määrä (decimal places). Oletuksena on numeerinen muuttuja, jonka vaatima tila on 8 merkkiä ja desimaalien määrä on nolla. Jos muuttujan arvoina on kokonaislukuja, kannattaa desimaalien määräksi valita 0. Width-kohtaa ei tarvitse välttämättä muuttaa ollenkaan. Huomaa, että muuttujan tyyppi voi olla myös merkkijono (string, eli siis sanallinen arvo). Muuttujan arvoilla ei silloin voi tietenkään suorittaa laskutoimituksia. Näpäytetään sitten OK ja palataan takaisin. Katsotaan seuraavaksi label-sarake. Viedään kohdistin sarakkeeseen ja kirjoitetaan sukupuolimuuttujan selitteeksi "Sukupuoli". Tämä kannattaa tehdä, koska tällöin taulukoihin ja kuvioihin tulee valmiiksi Sukupuoli, eikä pelkästään "sp", joka oli muuttujan nimi. Näpäytetään enteriä ja suraavaan sarakkeeseen (values) voidaan määritellä muuttujan arvojen selitteet (value labels).
Muuttujan arvoille voidaan antaa selitteet. Valueruutuun kirjoitetaan muuttujan arvo ja Value Label -ruutuun muuttujan selite. Add-painikkella selite sitten lisätään muuttujan määrittelyihin. Change- ja Remove-painikkeilla voi suorittaa selitteiden korjauksia ja poistoja. Huom! Kannattaa kirjoittaa selitteet, koska ne tulevat taulukoissa ja kuvioissa automaattisesti silloin näkyviin. Jos matriisissa on useita muuttujia, joilla on samat selitteet (value labels), voidaan selitteet kirjoittaa yhdelle muuttujalle ja kopioida sitten muille. Kirjoita ensin selitteet, anna soluosoittimen olla ko.sarakkeessa, valitse sitten Edit ja Copy. Valitse (maalaa) sitten samanlaisten muuttujien values-sarakkeen solut ja liitä samat muuttujan arvojen selitteet komennolla Edit - Paste. Puuttuvien arvojen määrittely (missing ) Tutkimustarkoitukseen kerätyssä aineistossa useimmiten on tapauksia, joista jonkin muuttujan osalta puuttuu tieto. Tämän tiedon käsittelyn tulee olla asianmukaista, jotta tulokset eivät vääristy. Ilmeinen virhehän seuraisi esim. keskiarvoissa, jos lasten syntypainoja tilastoitaessa puuttuva tieto saisi arvon nolla. SPSS:ssä puuttuvien arvojen tilalle voi jättää matriisiin tyhjän kohdan. Puuttuvan tiedon kohdalla matriisiissa näkyy pilkku tai piste. Tällä lomakkeella puuttuvat arvot voidaan tarvittaessa määritellä myös toisin, esimerkiksi puuttuva tieto on 9999. Oletuksena kuitenkin on no missing values, joka tarkoittaa sitä, että ohjelma kirjaa puttuviksi tiedoiksi tyhjät kohdat. Sarakkeen ulkoasun (Colums) määrittely Sarakkeen oletusleveys on 8 merkkiä ja lukujen (tai tekstin) sijoituminen soluun tapahtuu solun oikeaan reunaan (align-sarake). Jos muuttujan nimi on pitkä (8 merkkiä), ei sarakkeen leveyttä kannata muuttaa, koska silloin osa muuttujan nimestä jää näkymättömiin ja matriisia on ehkä vaikea lukea. Leveys muutetaan näppäimistä, jotka tulevat esille, kun soluosoitin siirretään ko. sarakkeeseen. Muuttujan mitta-asteikon määritelely Tämä tapahtuu measure-sarakkeessa. Näpäytä valikko auki ja valitse sopiva mitta-asteikko. Sukupuoli on luokitteluasteikollinen muuttuja.
Datan (havaintoaineiston) syöttäminen Tässä harjoituksessa analysoidaan aineistoa, joka sisältää tiedot reumapotilaista, joita on hoidettu aurotiomalaattilääkityksellä. Aineistossa selvitetään tekijöitä, joilla voitaisiin ennakoida kyseisen lääkkeen aiheuttamien sivuvaikutusten esiintymistä. Taulukossa neljällä ensimmäisellä sarakkeella ovat potilastiedot niistä tapauksista, joilla ei ole sivuvaikutuksia (without adverse reactions) ja seuraavilla neljällä sarakkeella ovat tapaukset, jotka saivat sivuvaikutuksia. Montako muuttujaa tarvitaan datan analysoimiseksi SPSS:ssa? Anna muuttujille nimet komennoilla Data Editor > Data > Define Variable > Variable name Anna muuttujien saamille arvoille selitteet komennoilla Data Editor > Data > Define Variable > Variable label Selitteet auttavat muistamaan numeeristen arvojen merkityksen. SPSS käyttää tulosteessa samoja selitteitä, jotka siten helpoittavat aineiston analyysituloksiin perehtymistä. Miten erottelet sivuvaikutuksia saaneet potilaat niistä joille ei tullut sivuvaikutuksia? Analysointi Datan ominaisuuksien perusselvittelyssa eli exploraatiossa kunkin muuttujat keskeiset ominaisuudet saadaan esille. Data editor > Analyze > Descriptive Statistics > Explore. Vie Dependent ikkunaan muuttujat Explore toiminto avaa valintaikkunan, jossa on vaihtoehtoja - statistics (tilastolliset tunnusluvut), plots(graafinen jakauma), options (valinnaiset lisätoiminnat) Valitse Plots :sta histogram ja normality tests with plots Valitse statistics:sta percentiles. Tässä valintaikkunassa on vaihtoehtoja Both, Statistics ja Plot. Valitse Both ja siten saadaan tuloksena sekä numeerinen että graafinen kuvaus jakaumasta. Klikkaa OK jolloin saat seuraavat tulosteet: - case processing summary, joka kertoo paljonko on havaintoja ja onko niissä puuttuvia tietoja - Descriptives, johon tulostuu muuttujien tunnuslukuja, joista mielenkiintoisimpia ovat yleensä keskiarvo (mean), keskivirhe (SE, standard error), keskiarvon 95%: luottamusväli (confidence interval), keskiluku/mediaani, keskihajonta (SD, standard deviation), vinous (skewness) ja huipukkuus (kurtosis). - Test of normality: antaa tuloksen testistä, joka vertaa havaintomatriisin muuttujan jakaumaa normaalijakaumaan (tätä tietoa tarvitaan silloin kun pitää valita asianmukainen tilastollinen testausmenetelmä - erityyppisille jakaumille käytetään erilaisia testejä) -Graafiset tarkastelut muuttuja kerrallaan: Histogrammi: pylväskuvio, jossa pylvään koko kuvaa x-akselilla olevien arvojen välille sijoittuvien havaintojen määrää. Normal Q-Q: kuvio jossa histogrammista on tehty ns kumulatiivinen frekvenssikuvio (punaiset pisteet) ja sen kanssa samaan mittakaavaan on piirretty kumulatiivista normaalijakaumaa kuvaava suora (y-akselin asteikko on standardipoikkeamia). Detrended Normal Q-Q plot: vastaa edellistä kuviota. Vino vertailusuora on käännetty vaakasuoraan ja asteikko on hienojakoisempi, jolloin havaintopisteiden poikkeamat vertailusuorasta näyttävät yleensä suuremmilta. Boxplot (laatikko ja viikset kuvio), punainen laatikko esittää havaintoarvoja, jotka ovat sillä alueella, johon sijoittuvat havaintojen pienimmän ja suurimman neljänneksen väliin jäävät arvot. Paksu viiva laatikon keskellä on mediaani. Viikset ovat pienin ja suurin havaintoarvo, elleivät ne poikkea yli puolta laatikon mittaa pääjoukosta. Poikkevan suuret tai pienet arvot näkyvät pampuloina tai tähtinä (ns. outlier eli poikkeavat havainnot).