SPSS* - tilastoanalyyttinen ohjelma, vrs 9.0 = monipuolinen ohjelma, jolla voi tilastollisesti analysoida tieteellistä aineistoa ja se tuottaa myös graafisia tulosteita. SPSS:n oma avustus (help) SPSS:ssä on käyttökelpoinen opasohjelma (tutorial) ja lisäksi Help toiminto, joka opastaa useimmissa tilanteissa. Help-toiminnolla on kaksikin eri käyttötapaa A. Ylävalikon Help, joka avaa ikkunan, jossa voi apua hakea eri tavoin contents index find -sisällysluettelo -hakusanat aakkosellisena listana - haku asettamallasi hakusanalla, tuloksena ko. sana ja muut sanat jotka sopivat asettamaasi ehtoon; compute, Compute, COMPUTE, computer jne. B. Välitön avustus Kesken jotakin SPSS-toimintoa voit ohjelmaikkunan osia klikata hiiren oikealla näppäimellä, mikä avaa keltaisen PopUp-avustuksen: Esimerkiksi haluat selvittää, mitä tarkoittaa termi Variable(s) Frequencies-ikkunassa, klikkaamalla ko. sanaa avautuu avustava popup ruutu. SPSS:n ikkunat Data Editor Tämä ikkuna avautuu kun ohjelma käynnistetään. Data Editorissa voi tallentaa, korjata ja täydentää aineiston tietoja. Tietoja tallennettaessa voi milloin tahansa lisätä aineistoa alimmalle vapaalle riville, joka siten muodostuu SPSStiedostossa seuraavaksi tutkimusahavainnoksi (= havaintotiedot yksittäisen tapauksen osalta, oli se sitten potilas, koeeläin, mittaushavainto tms). SPSS:ssa analysoitavissa oleva aineisto on tiedosto, jonka tarkenninosa on muotoa sav, esimerkiksi havainnot.sav Output Viewer avautuu kun ohjelma suorittaa jokin aineiston analyysin, kyseisessä ikkunassa ovat nähtävillä SPSS:n tuottamat laskentatulokset taulukkoina ja/tai graafisina tulosteina. Tämän tiedon käyttäjä voi tallentaa SPSS:n tulostiedostoksi, jota käyttäjä voi muokata. Sen tarkenninosa on muotoa spo, esimerkiksi keskiarvotolpat.spo Chart Editor avautuu kun tulosteikkunassa (Output Viewer) halutaan muokata graafista tulostetta (esim. pylväsdiagrammia). Syntax Editor Tässä ikkunassa käyttäjä näkee halutessaan SPSS:n komentojonon, jonka perusteella SPSS suorittaa laskenta-analyysin. Esimerkiksi kunkin muuttujan keskiarvon laskemiseen on olemassa tietty komentojono (tietyn kieliopin mukaan laadittu komentosarja). Syntax editorin sisällön voi tallentaa myöhempää käyttöä varten tiedostoksi, jonka tarkenninosa on muotoa sps, esimerkiksi keskiarvot.sps *SPSS Statistical Product and Service Solutions
Yleisiä ohjeita ohjelman käytöstä. Aineisto-ikkuna. Otsikkopalkki Valikkopalkki Pikanäppäimet Havaintomatriisi koostuu sarakkeista (columns), joista kukin on yksi muuttuja (variable) ja riveistä (rows), joista kukin on yksi tapaus (eli tilastoyksikkö). Soluosoitin (kehykset solun ympärillä) osoittaa solun, johon havainto voidaan syöttää. Virheellinen luku voidaan korjata kirjoittamalla virheelliseen soluun uusi arvo. Tässä ensimmäiselle muuttujalle on annettu nimi, SPSS antaa nimeksi sille var00001 se voidaan antaa hiiren oikella näppäimellä muuttujakentää klikkaamalla. Tässä sama matriisi, mutta nyt voidaan valita myös muuttujien arvojen selitteet klikkaamalla muuttuja nimeä jolloin avautuu pudotusvalikko, jossa Define variable toiminto. Tällä voidaan antaa muuttujille selitteet. Mikä SPSS:ssä on selite? Selite on selväkielinen kuvaus muuttujasta, esim. mitä eri arvoja se voi saada ja mitä numerolla merkitty arvo tarkoittaa. Muuttuja sukupuoli voi saada kaksi eri arvoa, 1 tai 2, ja selitteet ovat 1 = mies ja 2 = nainen Huom! Dataan kannattaa kirjoittaa selitteet, koska ne tulevat taulukoissa ja kuvioissa automaattisesti silloin näkyviin.
Define variable vaihtoehto avaa seuraavan valintaikkunan, jolla voidaan määritellä muuttujasta: - sen tyyppi (jatkuva, luokkamuuttuja tms): TYPE - sen saamien arvojen selitteet: LABELS - puuttuvan tiedon määrittely MISSIN VALUES Muuttuja tyyppi (jatkuva, luokkamuuttuja tms): TYPE Huomaa, että muuttujan tyyppi voi olla myös muutakin kuin numeerinen arvo esimerkiksi merkkijono (string, eli siis sanallinen arvo). Muuttujan arvoilla ei silloin voi tietenkään suorittaa laskutoimituksia. Muuttujan saamien arvojen selitteet: LABELS Puuttuvien arvojen määrittely (missing ) Tutkimustarkoitukseen kerätyssä aineistossa useimmiten on tapauksia, joista jonkin muuttujan osalta puuttuu tieto. Tämän tiedon käsittelyn tulee olla asianmukaista, jotta tulokset eivät vääristy. Ilmeinen virhehän seuraisi esim. keskiarvoissa, jos lasten syntypainoja tilastoitaessa puuttuva tieto saisi arvon nolla. SPSS:ssä puuttuvien arvojen tilalle voi jättää matriisiin tyhjän kohdan. Puuttuvan tiedon kohdalla matriisiissa näkyy pilkku tai piste. Tällä lomakkeella puuttuvat arvot voidaan tarvittaessa määritellä myös toisin, esimerkiksi puuttuva tieto on 9999. Oletuksena kuitenkin on no missing values, joka tarkoittaa sitä, että ohjelma kirjaa puttuviksi tiedoiksi tyhjät kohdat. Discrete = tarkka arvo Range = vaihteluväli
SPSS-analyysit Tässä analysoidaan Analyze valikosta Descriptive Statistics > Explore Kun ohjelmalle annetaan komento esimerkiksi muuttujan lukumäärien jakaumien (explore) laskemiseksi, saadaan ensin Windows-ohjelmille tyypillinen lomake: Muuttujaluettelo näkyy vasemmalla olevassa ruudussa. Analyysiin mukaan tulevat muuttujat aktivoidaan näpäyttämällä ja siirretään sitten Variable(s) -ruutuun ruutujen välissä olevalla nuolinäppäimellä. Muuttujan saa takaisin muuttujaluetteloon samanlaisella toimenpiteellä. Nuolinäppäimen suunta vaihtuu, kun muuttuja aktivoidaan Variable(s) -ruudussa. Reset - näppäimellä tyhjennetään koko Variable(s) -ruutu. Muuttujan aktivointi tapahtuu joko muuttuja kerrallaan tai vetämällä hiiren vasen näppäin pohjassa useita muuttujia. Erillisiä muuttujia voi aktivoida, kun Ctrl -näppäin pidetään alhaalla. Lomakkeella on usein myös valinta-ruutuja, joihon voi hiirellä näpäyttää valintamerkin tai poistaa sen uudelleen näpäytyksellä. Lähes kaikissa lomakkeissa on myös lisämääritys-näppäimiä, joista pääsee taas uusiin lomakkeisiin. Näillä lomakkeilla suoritetut valinnat hyväksytään Continue-painikkeella.
SPSS-tulosteet SPSS Viewer -ikkuna Laskujen tulokset, taulukot ja kuviot tulevat SPSS Viewer -ikkunaan: Ikkunassa on omat valikkonsa ja pikanäppäimensä. Huomaa, että Analyzevalikko löytyy myös Viewer-ikkunasta. Aineisto-ikkunaan ei siis enää tarvitse siirtyä joa suoritetaan laskentaa, tehdään taulukoita tai kuvioita. Kaikki tulokset tulevat samaan Viewer-ikkunaan. Viewer-ikkuna jakautuu kahteen osaan: Vasemmalla on ns. navigointi-ikkuna, joka kertoo kaikki analyysit, otsikot, huomautukset ynnä muut, mitä ohjelmalla on tehty. Oikealla on varsinainen tulosikkuna, jota voi selata ylös- ja alaspäin tai sitten voi näpäyttää Navigointi -ikkunassa jotakin otsikkoa, jolloin siihen liittyvä tuloste kelautuu automaattisesti tulosikkunan yläosaan. Taulukoita ja kuvioita pystyy muokkaamaan ja kopioimaan muihin Windows-ohjelmiin. SPSS:n matriisi-ikkuna (SPSS Data Editor) on myös avoinna ja jää usein tulosikkunan taakse. Matriisi-ikkunaan pääsee esimerkiksi Window -valikosta tai pikanäppäimestä. Myös alareunan Windowsin Tehtäväpalkista pääsee matriisi-ikkunaan. Mitä jos haluat eri analyyseja omiin tulostiedostoihinsa? Tallenna (file > save) sen hetkinen tuloste, tallentuvan tiedoston voit nimetä sisältöä kuvaavaksi, tarkenninosa on.spo. Sitten sulje tiedosto file >close. Kun suoritat SPSS:ssa seuraavan analyysin tms avautuu uusi Viewer-ikkuna, jonka taas voi tallentaa halutessaan jne.
Datan (havaintoaineiston) syöttäminen Tässä harjoituksessa analysoidaan aineistoa, joka sisältää tiedot reumapotilaista, joita on hoidettu aurotiomalaattilääkityksellä. Aineistossa selvitetään tekijöitä, joilla voitaisiin ennakoida kyseisen lääkkeen aiheuttamien sivuvaikutusten esiintymistä. Taulukossa neljällä ensimmäisellä sarakkeella ovat potilastiedot niistä tapauksista, joilla ei ole sivuvaikutuksia (without adverse reactions) ja seuraavilla neljällä sarakkeella ovat tapaukset, jotka saivat sivuvaikutuksia. Montako muuttujaa tarvitaan datan analysoimiseksi SPSS:ssa? Anna muuttujille nimet komennoilla Data > Define Variable > Variable name Anna muuttujien saamille arvoille selitteet komennoilla Data > Define Variable > Variable label Selitteet auttavat muistamaan numeeristen arvojen merkityksen. SPSS käyttää tulosteessa samoja selitteitä, jotka siten helpoittavat aineiston analyysituloksiin perehtymistä. Miten erottelet sivuvaikutuksia saaneet potilaat niistä joille ei tullut sivuvaikutuksia? Analysointi Datan ominaisuuksien perusselvittelyssa eli exploraatiossa kunkin muuttujat keskeiset ominaisuudet saadaan esille. Analyze > Descriptive Statistics > Explore. Vie Dependent ikkunaan opettajan ilmoittamat muuttujat Explore toiminto avaa valintaikkunan, jossa on vaihtoehtoja - statistics (tilastolliset tunnusluvut), plots(graafinen jakauma), options (valinnaiset lisätoiminnat) Tässä valintaikkunassa ovat vaihtoehtoina Both, Statistics ja Plot. Valitse Both ja siten saadaan tuloksena sekä numeerinen että graafinen kuvaus jakaumasta. Valitse statistics:sta percentiles. Valitse Plots :sta histogram ja normality tests with plots
Klikkaa OK jolloin saat seuraavat tulosteet: - Case processing summary, joka kertoo paljonko on havaintoja ja onko niissä puuttuvia tietoja - Descriptives, johon tulostuu muuttujien tunnuslukuja, joista mielenkiintoisimpia ovat yleensä keskiarvo (mean), keskivirhe (SE, standard error), keskiarvon 95%: luottamusväli (confidence interval), keskiluku/mediaani, keskihajonta (SD, standard deviation), vinous (skewness) ja huipukkuus (kurtosis). - Test of normality: antaa tuloksenn testistä, joka vertaa havaintomatriisin muuttujan jakaumaa normaalijakaumaan (tätä tietoa tarvitaan silloin kun pitää valita asianmukainen tilastollinen testausmenetelmä - erityyppisille jakaumille käytetään erilaisia testejä) Graafiset tarkastelut muuttuja kerrallaan: Histogrammi: pylväskuvio, jossa pylvään koko kuvaa x-akselilla olevien arvojen välille sijoittuvien havaintojen määrää. Normal Q-Q: kuvio jossa histogrammista on tehty ns kumulatiivinen frekvenssikuvio (punaiset pisteet) ja sen kanssa samaan mittakaavaan on piirretty kumulatiivista normaalijakaumaa kuvaava suora (y-akselin asteikko on stadardipoikkeamia). Detrended Normal Q-Q plot: vastaa edellistä kuviota. Vino vertailusuora on käännetty vaakasuoraan ja asteikko on hienojakoisempi, jolloin havaintopisteiden poikkeamat vertailusuorasta näyttävät yleensä suuremmilta. Boxplot (laatikko ja viikset kuvio), punainen laatikko esittää havaintoarvoja, jotka ovat sillä alueella, johon sijoittuvat havaintojen pienimmän ja suurimman neljänneksen väliin jäävät arvot. Paksu viiva laatikon keskellä on mediaali. Viikset ovat pienin ja suurin havaintoarvo, elleivät ne poikkea yli puolta laatikon mittaa pääjoukosta. Poikkevan suuret tai pienet arvot näkyvät pampuloina tai tähtinä (ns. outlier eli poikkeavat havainnot).