Tilastollinen tietojenkäsittely / SPSS Harjoitus 1 VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten. 1. Avaa SPSS-ohjelma. Tarkoitus olisi muodostaa tämän sivun loppupuolen havainnoista havaintomatriisi SPSS-ohjelman aineisto- eli Data Editor -ikkunan Data View välilehdelle. Muuttujien määrittelyt tehdään Variable View -välilehdellä. Seuraavassa hiukan vinkkejä: Muuttujamäärittelyt kannattaa tehdä ensin silloin, kun syöttää aineiston itse. Anna muuttujille nimet (sarake Name) ja nimikkeet/selitykset (sarake Label). Ensimmäinen muuttuja (eli ensimmäinen sarake) kuvaa yrityksen nimeä, seuraavat muuttujat ovat järjestyksessä: liikevaihto (milj. euroa), henkilöstön määrä, toimiala, kotipaikka, omavaraisuusaste (%), Talouselämä-lehden taloudellisen menestyksen perusteella antama arvosana). Valitse sitten muuttujien tyypit (Type) ja muuttuja-arvojen esittämiseen liittyvä merkkimäärät (Width (tai Characters), Decimals) sopiviksi. (Esim. TE-arvosanalla: Width 3 ja Decimals 1. Mieti miksi!) Muuttujan toimiala arvo 1 vastaa metallia, 2 kuljetusta ja huolintaa, ja 3 metsää. Muuttujan kotipaikka arvo 1 vastaa Espoota ja 2 Helsinkiä. Muodosta muuttujien arvoille sopivat nimikkeet (Values). (Arvojen nimikkeet saat näkyviin Data View - välilehdellä Value Labels -työkalulla, sitten kun olet kirjoittanut havaintojakin.) Valitse muuttujien mitta-asteikot (Measure) oikeiksi, muuta Columns ja Align määrittelyjä mieleiseksesi. Puuttuville arvoille ei ole mitään erityisiä koodeja nyt käytössä, joten Missing-määrittelyjä ei tarvita.tässä yhteydessä kannattaa myös pohtia sitä, mitkä muuttujat ovat jatkuvia, ja mitkä ovat diskreettejä. Talleta (File Save tai Save as) muuttujamäärittelyt tiedostoksi, jolle annat nimeksi Yritys1, ja jonka talletusmuoto on oletusarvo SPSS Statistics (*.sav). Ensimmäisen talletuskerran jälkeen avautuu myös SPSS:n tulosikkuna (Viewer). Siellä näkyy toistaiseksi vain tieto siitä, millä nimellä olet aineistosi tallettanut. Pääset liikkumaan Viewer- ja Data Editor ikkunoiden välillä esim. valitsemalla alapalkista ko. ikkunan. Muuttujien määrittelytietojen lisäksi samaan tiedostoon halutaan Data View välilehdelle kirjoitettavat havainnot. Talleta aineistoa (Data Editor ikkunassa File Save) aika ajoin. Näin varmistat, ettei koko tallennusta tarvitse aloittaa alusta, jos ohjelman suoritus keskeytyy tai jos vahingossa tuhoat itse havainnot. Kirjoita siis Data View korttiin seuraavat havainnot vuodelta 2009: Kone 4744 34276 1 1 47 9,9 Itella 1820 30217 2 2 48 8,4 Metso 5016 27813 1 3 34 7,6 UPM-Kymmene 2719 23618 3 2 49 6,1 Wärtsilä 5260 18830 1 2 40 9,3 Metsäliitto 4837 15230 3 1 24 4,8 Rautaruukki 1950 12664 1 2 60 6,6 VR 1399 12376 2 2 83 7,3
Talleta aineisto lopuksi vielä kerran (Data Editor -ikkunassa) ja sulje SPSS (File - Exit), SPSS tarkistaa tässä vaiheessa, haluatko tallettaa tulosikkunan sisällön (Save contents of output viewer?). Nyt tulosikkunassa ei ole minkään tilastoanalyysin tuloksia, joten tulosten talletusta ei tarvitse tehdä. 2. Käynnistä SPSS uudelleen ja ota käyttöön muodostamasi aineisto avaamalla (File Open Data) ko. havaintotiedosto. Jatka havaintoaineiston käsittelyä ja korjaa aineistoikkunan Data View - ja Variable View -välilehtien sisältöä seuraavasti: neljännen tilastoyksikön liikevaihto 2719 on väärä, oikea luku on 7719 kolmannella tilastoyksiköllä kotipaikka 3 on väärä, oikea on Helsinki lisää TE-arvosana -muuttujan selitykseen tieto siitä, että arvosana on välillä 4-10 lisää vielä seuraavien yritysten tiedot: Fiskars 663 3867 1 2 52 8,7 Stora-Enso 8945 28696 3 1 45 6 lisää uudeksi muuttujaksi liikevaihto vuodelta 2010: muuttujan arvot ovat em. järjestyksessä: 4987, 1842, 5552, 8924, 4553, 5337, 2415, 1423, 716, 10297 talleta kaikki muutokset uuteen havaintoaineistoon, jolle annat nimeksi Yritys2 3. Tutustu seuraavaksi (ainakin selaillen) Data Editor ikkunan valikoihin. Seuraavassa on jätetty hieman tilaa, jos haluat tehdä muistiinpanoja. Tutustu myös työkalupalkkiin ja selvitä, mitä eri työkaluilla voit tehdä.
4. Muistele Tilastotieteen perusteet/johdantokurssilta sitä, milloin muuttujan jakauma kannattaa kuvailla frekvenssitaulukkomuodossa ja milloin tilastollisten tunnuslukujen avulla. Kokeile Analyze-valikon kohdasta Descriptive Statistics (= kuvaileva tilastotiede) proseduureja Frequencies ja Descriptives lisämäärittelyineen eri muuttujille. Frequencies silloin, kun Descriptives silloin, kun Muistele myös, milloin kahden muuttujan riippuvuutta voidaan kuvata lineaarisen korrelaatiokertoimen avulla. Määritä nyt ko. korrelaatio muuttujille liikevaihto ja omavaraisuusaste. Nyt voit käyttää Analyze-valikon kohtaa Correlate ja vielä proseduuria Bivariate. (Lineaarinen korrelaatio on sama kuin Pearsonin korrelaatio.) Pearsonin korrelaatio silloin, kun Muistele vielä, milloin kahden muuttujan riippuvuutta on järkevä kuvata järjestyskorrelaatiokertoimen avulla. Määritä nyt ko. korrelaatio muuttujille omavaraisuusaste ja TE-arvosana. Nytkin voit käyttää Analyze-valikon kohtaa Correlate ja proseduuria Bivariate. (Järjestyskorrelaatiokertoimia ovat mm. Kendallin -b (eli tau-b) ja Spearmanin korrelaatio). Järjestyskorrelaatio silloin, kun Tilastoanalyysien tulokset tulevat tulosikkunaan (Viewer) peräkkäin. Talleta tulosikkunan sisältö tiedostoksi (File - Save tai Save as) nimeltään Tulokset yrityksistä, ja jonka talletusmuoto on oletusarvo Viewer Files (*.spv). Tulkitse tulokset. Jos korrelaatiotulokset tuntuvat vaikeilta tulkittavaksi, tee tehtävä 5 ja yritä pisteparvikuvioiden avulla tehdä tulkinnat korrelaatioista. Älä sulje tätä tulosikkunaa. 5. Muistele Tilastotieteen perusteet/johdantokurssilta sopivaa tapaa esittää muuttujan jakauma kuviona ja kokeile Graphs valikosta (joko käyttäen Chart Builderiä tai Legacy Dialogsia) esim. kuvioita Bar, Pie ja Histogram. Bar ja Pie (eli pylväs- ja piirakkakuviot) silloin, kun Histogram (eli frekvenssihistogrammi) silloin, kun
Milloin on järkeä muodostaa pisteparvikuvio (=Scatterplot)? Tee pisteparvikuvio muuttujille liikevaihto ja omavaraisuusaste. Tee pisteparvi vielä omavaraisuusasteen ja TEarvosanan välille. Talleta tuloksesi. Scatterplot (eli pisteparvi- eli sironta- eli hajontakuvio) silloin, kun 6. Tutustu nyt tulosikkunan valikoihin. Mitä erilaista/samanlaista löytyy aineistoikkunaan verrattuna? Tutustu myös työkalupalkkiin ja selvitä, mitä eri työkaluilla voit tehdä. 7. Avaa uusi aineistoikkuna (File New - Data). Havaintoaineistoja saa olla auki useita, mutta järkevää on pitää avoinna vain yhtä aineistoa. Sulje nyt Yritys2 (File Close tai oikean yläkulman raksi.). Jos olet edellisen talletuskerran jälkeen tehnyt muutoksia aineistoon, avautuu ruutu Save contents of, johon voit vastata Yes, ja silloin tekemäsi muutokset tallettuvat. Sulje myös tulosikkuna, koska sehän sisältää tuloksia, jotka liittyvät Yritys2-aineistoon. Nyt edessäsi on aivan tyhjä aineistoikkuna, johon olisi tarkoitus muodostaa uusi aineisto. Tämän harjoituksen liitesivulla 1 (erillinen tiedosto) on neljän vastaajan vastauksia kuvitteelliseen kyselylomakkeeseen. Muodosta aineistosta SPSS-havaintoaineisto muuttuja-määrittelyineen. Huomioipa erityisesti kysymyksien 4 (= monivastauskysymys = multiple response kysymys) ja 5 kohdalla se, että tilastoyksiköllä voi olla korkeintaan
yksi arvo kullakin tilastollisella muuttujalla. Voit vielä lisätä omat ja kaverin tiedotkin aineistoosi. (P.S. Nyt käsiteltävissä lomakkeissa on paljon parantamisen varaa. Jos teet kyselytutkimusta, kannattaa ensin tehdä pieni pilottikysely, jonka perusteella voi lomakkeita vielä korjailla paremmiksi. Hyviä vinkkejä kyselylomakkeen laadinnasta: http://www.fsd.uta.fi/menetelmaopetus/kyselylomake/laatiminen.html) Talleta aineisto nimellä KyselyOstoksista. Tästä aineistosta ei tehdä tilastoanalyysejä. 8. Avaa uusi aineistoikkuna. Voit sulkea edellisen tehtävän aineisto- ja tulosikkunan. Määrittele liitesivun 2 (erillinen tiedosto) aineiston muuttujat uudeksi havaintoaineistopohjaksi SPSS-ohjelmaan niin tarkasti kuin vain pystyt, sillä tätä aineistoa tarvitaan seuraavilla harjoituskerroillakin. Ko. aineisto kuvaa Suomen kuntien muutamia tietoja 1.1.2007 ja se on osa Tilastokeskuksen Kuntafakta-aineistoa. Tallenna VAIN aineiston neljän ensimmäisen kunnan tiedot. Talleta aineisto nimellä Kuntafakta. Tulosikkunaa ei tarvitse tallettaa. Sulje SPSS-ohjelma.