Tilastollinen tietojenkäsittely / SPSS Harjoitus 2 Kopioi (ÄLÄ SIIS AVAA TIEDOSTOJA VIELÄ!) U-palvelimen hakemiston STAT2100 SPSS kansiosta Aineistoja harjoituksiin 2 tiedosto loputkunnat (SPSS-havaintoaineisto) sekä Excel-tiedostot TILTA ja TILTB johonkin omaan hakemistoosi (siis kansioon). (Jos et ollut mukana viime viikolla, niin kopioi myös SPSS-havaintoaineistotiedostot Yritys2 ja neljän kunnan tiedot.) Seuraavissa tehtävissä talleta aineistot muutoksineen (tarkista ennen tallettamista, onko aineisto kunnossa), tilastoanalyysien tuloksia ei välttämättä tarvitse tallettaa. 9. Tehdään 2 uutta muuttujaa matemaattisten lausekkeiden avulla: Avaa SPSS-ohjelma ja havaintoaineistoksi tehtävässä 2/1 talletettu Yritys2- havaintoaineisto. Muodosta muuttuja lvmuutos (Transform Compute), joka kuvaa kuinka paljon liikevaihto on muuttunut vuodesta 2009 vuoteen 2010. Muodosta myös muuttuja muutospros, joka kuvaa kuinka monta prosenttia liikevaihto on muuttunut vuodesta 2009 vuoteen 2010. Talleta aineisto nimellä Yritys3. Tee uusien muuttujien jakaumista kuvailu sopivaksi kokemallasi tavalla. Tuloksia ei tarvitse tallettaa. Sulje SPSS-ohjelma. 10. Avaa SPSS-ohjelma ja havaintoaineistoksi avaa loputkunnat-aineisto. Huomaa, että Data View -välilehdellä on esitetty 412 kunnan tietoja ja Variable View -välilehdellä on tehty joitakin määrittelyjä muuttujille. Kiinnitä huomiota siihen kuinka montaa merkkiä on käytetty kunnan nimen (jonka tyyppi on String) esittämiseen (siis Width on ). Kiinnitä huomiota myös siihen, millä nimillä muuttujat on esitetty. 11. Yhdistetään 2 SPSS-aineistoa yhdeksi aineistoksi: Avaa havaintoaineistoksi tehtävässä 8/1 talletettu neljän kunnan havaintotiedosto Kuntafakta. (Jos sinulla ei sitä ole, voit käyttää tekemääni aineistoa: neljän kunnan tiedot.) Vaihda kunnan nimi -tiedon merkkimäärä loputkunnat-aineiston mukaiseksi (siis Width on ). Lisää loputkunnat -aineiston tilastoyksiköt omaan kunta-aineistoosi (Data-Merge Files-Add Cases, aktiivisena aineistona pitäisi olla ennen tätä valintaa siis oma Kuntafakta-aineistosi). Jos Unpaired Variables -
nimisessä ruudussa näkyy muuttujien nimiä, niin silloin yhdistyminen ei ole suoraan onnistumassa esim. seuraavista syistä: * kunnan nimi muuttuja voi olla omassa aineistossasi määritelty erimittaiseksi (Width) kuin loputkunnat -aineistossa. Keskeytä silloin yhdistäminen ja käy muuttamassa merkkimäärä omassa aineistossasi loputkunnat-aineistoa vastaavaksi * muuttujien nimet voivat olla erilaisia eri aineistoissa, ja ohjelma ei osaa yhdistää tietoja. Määritä tällöin Data-Merge Files-Add Cases proseduurin Pair-napin avulla sopivat muuttujat pareiksi yhdistettävistä aineistoista. Tarkista, että yhdistämisen jälkeen kuntia on aineistossa 416 kpl ja muuttujia 12 kpl. Talleta tiedosto nimellä KUNNAT Tarkista, että muuttujien merkkimäärät (Width ja Decimals) ovat sopivat. Talleta muutokset. 12. Tutki muutamien muuttujien jakaumia sopivien tilastokuvioiden avulla. Selvitä mm. - missä läänissä on eniten kuntia (esim. Graphs Legacy Dialogs-Bar Simple, valitse laani-muuttuja ruutuun Category Axis) - mikä on tyypillinen tulotaso-muuttujan arvo (Graphs- Legacy Dialogs -Histogram, valitse tulotaso-muuttuja ruutuun Variable) - ja lopuksi sulje ohjelma. 13. Tehdään Excel-aineistosta SPSS-havaintoaineisto: TILTB-nimiseen Excel-tiedostoon on talletettu osa tällä kurssilla aiempina vuosina järjestetyn kyselyn B vastauksista. Avaa Excel ja TILTB. Kyselyn B kysymyslomake on esitetty erillisenä liitteenä. Vertaa Excel-aineistoa ja kysymyksiä. Montako muuttujaa aineistossa on? Montako tilastoyksikköä aineistossa on? Selvitä, ovatko muuttuja-arvot esitetty merkeillä vai numeroilla, ja jos numeroita on käytetty, ovatko muuttuja-arvot kokonaislukuja vai desimaalilukuja. Huomaa, että viimeinen muuttuja kuvaa kyselyvuotta, mutta sen arvot näyttävät kummallisilta. Tätä kysymystä ei ole kyselyssä esitetty, vaan sen on aineiston tallentaja lisännyt. Huomaa myös, että muuttujien nimiä ei Excel-tiedostossa ole. Sulje Excel. Avaa SPSS-ohjelma ja muodosta em. Excel-tiedostosta SPSS-havaintoaineisto (File Open Data). Huomaa, että sukupuoli-muuttujaa ei ole esitetty numeroilla vaan kirjaimilla (Type: String). Tarkista, että muuttujia aineistossa on 9 ja tilastoyksiköitä 484 ja talleta aineisto tiedostoksi nimeltään kyselyb.
Kirjoita muuttujille nimet (Name) ja selitykset (Label) (kts. liitesivun kysymyksiä). Liitä muuttujien arvoihin sopivat selitykset (Values). Muodosta yhdelle mielipidekysymykselle muuttuja-arvojen selitykset ja kopioi ko. määrittely muihin mielipidekysymyksiin. Tarkista, että muuttuja-arvojen esitys- ja talletustyypit (Type, Width, Decimals) ovat sopivia. Määritä muuttujien mitta-asteikot (Measure) ja talleta muutokset samaan tiedostoon. Puuttuvan tiedon koodin määrittely: Huomaa, että sukupuolimuuttujan tyhjä ruutu ei ole SPSS:n mielestä puuttuva arvo, vaan kolmas sukupuoli. Tyhjännäköisessä ruudussa merkkijonomuuttujalla (Type: String) onkin arvona välilyönti, joka on merkki siinä missä muutkin merkit, mutta tarkoituksena olisi esittää kuitenkin puuttuvaa tietoa. Määrittele nyt sukupuolelle puuttuvan tiedon erilliseksi koodiksi (Missing) välilyönti ja lopuksi talleta tekemäsi muutokset. 14. Muuttuja-arvojen vaihtaminen ilman lauseketta: Ko. kysely on suoritettu viidesti 1900-luvun loppupuolella ja myös vuonna 2009. Nyt kyselyvuosiluku näkyy vain korkeintaan kahdella numerolla. Ota selvää esim. Frequencies-proseduurin avulla, mitkä ovat kyselyvuosiluvun arvot. Muodosta uusi kyselyvuositietomuuttuja (Transform Recode Into Different Variables) siten, että vuosiluku on siinä nelinumeroisena (siis esim. 9 2009 ja 84 1984). (Kun teet jotain Transform-valikon valinnoilla, tarkista, että tekemäsi muutos on OK ja talleta tekemäsi muutos vasta tarkistamisen jälkeen.) Kun uusi muuttuja on valmis ja OK, niin voit poistaa alkuperäisen vuosilukutiedon. 15. Muodosta aineistoon kaksi uutta asennemuuttujaa (Transform-Recode Into Different Variables) siten, että muunnat seuraavien kahden mielipide-muuttujan : Suomeen tulisi rakentaa lisää ydinvoimaloita Vihreä liike tuo politiikkaan ihmisen huomioon ottavan lähestymistavan arvot kahden uuden muuttujan arvoiksi seuraavasti: vanha arvo uusi arvo 1 1 2 1 3 2 4 3 5 3
Älä poista vanhoja mielipidekysymyksiä. Talleta muutokset aineistoon kyselyb (muista kuitenkin ensin tarkistaa, että kaikki on kunnossa!). Muodosta yhdelle uudelle muuttujalle muuttuja-arvojen selitykset seuraavasti arvo arvonimike 1 myönteinen 2 puolueeton 3 kielteinen. Kopioi selitykset toisellekin uudelle muuttujalle ja talleta muutokset. 16. Kuvaillaan laadullisten muuttujien jakaumia tilastokuvioiden avulla: Tarkastele kuvioiden (esim. Graphs- Legacy Dialogs Bar/Pie) avulla taustamuuttujien (esim. sukupuoli, kotipaikka, koulutus, kyselyvuosi) jakaumia yksitellen. Kuvaile kuvioista näkemääsi sanallisesti: _ 17. Tarkastele kuvioiden avulla mielipide- ja asennemuuttujien jakaumia yksitellen. Kuvaile parin mielipide/asennemuuttujan jakaumaa sanallisesti:
18. Kuvaillaan laadullisten muuttujien mahdollisia riippuvuussuhteita tilastokuvioiden avulla: Tarkastele kuvioiden (esim. Graphs- Legacy Dialogs Bar Clustered/Stacked) miesten ja naisten mielipiteiden eroavaisuuksia. Kuvaile jonkin mielipideväittämän osalta miesten ja naisten vastauksien eroavaisuuksia sanallisesti: Sulje SPSS. 19. TILTA-nimiseen Excel-tiedostoon on talletettu osa tällä kurssilla aiempina vuosina järjestetyn kyselyn A vastauksista. Kyselyn A kysymykset on esitetty erillisessä liitteessä. Avaa Excel ja avaa siihen TILTA-aineisto. Vertaa kysymyksiä ja aineistoa miettien, millä tavalla kunkin muuttujan arvot on esitetty. Viimeisenä muuttujana aineistossa on jälleen kyselyvuosi. Montako on muuttujaa, entäs tilastoyksiköitä? Sulje Excel. 20. Avaa SPSS-ohjelma ja muodosta edellisessä tehtävässä mainitusta Excel-tiedostosta SPSS-havaintoaineisto. Talleta tämä SPSS-aineisto nimellä kyselya. Nimeä muuttujat, anna selitykset muuttujille ja tarpeen tullen niiden arvoille. Viimeisenä muuttujana on siis nyt vielä kyselyvuosi. Tarkista, että muuttujien tyypit ovat sopivia. Määritä muuttujien mitta-asteikot. Tee kyselyvuodelle vastaavanlainen muutos kuin teit aineistossa kyselyb. Talleta muutokset tiedostoon kyselya. 21. Tehdään määrällisestä muuttujan jakaumasta tilastokuvio: Tee frekvenssihistogrammi kenka-muuttujasta. Mitäs kuviosta ilmenee?
22. Käytetään matemaattista lauseketta muuttujan arvojen yhdenmukaistamiseksi siten, että kenka-muuttujan kaikki arvot (paitsi puuttuva tieto) ovat ranskalaista numerointia: Havaitsit juuri, että kengännumeroa on nyt ilmoitettu eri numerointijärjestelmillä. Ranskalaisessa numeroinnissa yksi numero vastaa 2/3 cm ja englantilaisessa yksi numero vastaa 1/3 tuumaa. Englantilaisen ja ranskalaisen numeroinnin yhteys on seuraava: (25 englanro ) ransknro 3 2 2.54 3 Muuta (Transform-Compute) englantilaisessa järjestelmässä ilmoitetut pienet kengännumerot (< 20) ranskalaisiksi eo. kaavaa soveltaen. Voit tehdä korjaukset suoraan kenka-muuttujan arvoja muuttamalla, kunhan olet huolellinen! Huomaa, että muutos koskee vain osaa tilastoyksiköistä (siis niitä, joilla kenka-muuttujan arvo < 20, ilmoita tämä asia käyttäen IF-ehtoa!). Huom. Kaavoissa desimaalierotin on piste. Tarkista, että muutos onnistui esimerkiksi tekemällä frekvenssihistogrammikuvio uudestaan. Ja jos ei onnistunut, sulje aineisto äläkä talleta muutoksia ja avaa aineisto ja yritä uudestaan. Kun muutos onnistui, talleta muutos tiedostoon kyselya. Sitten pyöristä (Transform-Compute) KAIKKI kengännumerot (nyt IF-ehto pois) kokonaisluvuiksi sopivalla funktiolla, joka on muuten nimeltään RND. Funktiota käytetään niin, että funktion nimen perään tulee kaarisulkujen sisään se muuttuja, lauseke tai arvo, jonka haluat pyöristää kokonaisluvuksi. Muodosta vielä uusi tilastokuvio kengännumerosta ja totea, onnistuiko muutos. Jos muutos onnistui, talleta muutos tiedostoon kyselya. Jos muutos ei onnistunut, sulje aineisto tallettamatta ja avaa kyselya-aineisto uudelleen ja yritä korjausta uudelleen niin kauan, että onnistut. Lopuksi sulje ohjelma.