Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1 Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta I Summamuuttujien muodostus Olemassa olevista muuttujista voidaan laskea uusia muuttujia niin sanottuja summamuuttujia. Esimerkiksi kysyttäessä tyytyväisyyttä useampaan eri asiaan, voidaan tyytyväisyysmuuttujien arvot laskea yhteen, jolloin saadaan mittari kokonaistyytyväisyydelle. Esimerkiksi kysyttäessä syntymävuotta, voidaan syntymävuoden perusteella laskea vastaajan likimääräinen ikä (voi heittää vuodella, riippuen mihin aikaan vuodesta henkilö on syntynyt). 1. Avataan http://users.metropolia.fi/~pasitr/opas/ran17a/data1.sav. 2. Valitaan Transform - Compute, jolloin avautuu valintaikkuna Compute Variable (kuva 1). 3. Kirjoitetaan Target Variable -ruutuun uuden laskettavan muuttujan nimi (kuva 1, kohta 1). 4. Muodostetaan ruutuun Numeric Expression (kuva 1, kohta 2) summamuuttujalauseke, jolla uuden muuttujan arvot lasketaan. 5. Näpäytetään painiketta OK (kuva 1, kohta 3). Kuva 1. Compute Variable valintaikkuna
2 Tilastollinen päättely II Aineiston pilkkominen Esimerkki 1. Erikseen määritettyjen ryhmien vertailu 1. Avataan http://users.metropolia.fi/~pasitr/opas/ran17a/data1.sav. 2. Valitaan Data - Split File, jolloin avautuu valintaikkuna Split File (kuva 2). 3. Valitaan vaihtoehto Compare groups (kuva 2, kohta 1). 4. Valitaan ruutuun Groups Based muuttuja sukup (kuva 2, kohta 2), jonka arvojen mukaan ryhmittely tehdään. 5. Näpäytetään painiketta OK. 6. Valitaan Analyze Descriptive Statistics Frequences. 7. Siirretään muuttuja palkka ruttuu Variables (kuva 3, kohta 1). 8. Poistetaan rasti kohdassa Display Frequence table (kuva 3, kohta 2). 9. Näpäytetään painiketta Charts (kuva 3, kohta 3). 10. Näpäytetään vaihtoehto Histogram (kuva 3, kohta 4). 11. Näpäytetään vaihtoehto Show normal curve on histogram (kuva 3, kohta 5). 12. Näpäytetään painiketta Continue (kuva 3, kohta 6). 13. Näpäytetään painiketta OK (kuva 3, kohta 7) ja nähdään tulokset (kuvat 4 ja 5). Kuva 2. Valintaikkuna Split File Kuva 3. Valintaikkunat Frequencies ja Frequencies: Charts
Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 3 Kuva 4. Eri ryhmien (misten ja naisten) frekvenssit Kuva 5. Miesten ja naisten palkan histogrammit 14. Valitaan Data - Split File, jolloin avautuu valintaikkuna Split File (kuva 6). 15. Valitaan Analyze all cases, do not create groups (kuva 6, kohta 1). 16. Näpäytetään painiketta OK (kuva 6, kohta 2) ja palataan alkuperäisen tilanteeseen, jolloin aineistoa käsitellään taas kokonaisuutena. Kuva 6. Valintaikkuna Split File
4 Tilastollinen päättely Esimerkki 2. Ryhmien käsittely erikseen 1. Avataan http://users.metropolia.fi/~pasitr/opas/ran17a/data1.sav. 2. Valitaan Data - Split File, jolloin avautuu valintaikkuna Split File (kuva 7). 3. Valitaan vaihtoehto Organize output by groups (kuva 7, kohta 1). 4. Valitaan ruutuun Groups Based muuttuja sukup (kuva 7, kohta 2), jonka arvojen mukaan ryhmittely tehdään. 5. Näpäytetään painiketta OK (kuva 7, kohta 3). 6. Valitaan Analyze Descriptive Statistics Frequences. 7. Siirretään muuttuja palkka ruutuun Variables (kuva 8, kohta 1). 8. Poistetaan rasti kohdassa Display Frequence table (kuva 8, kohta 2). 9. Näpäytetään painiketta Charts (kuva 8, kohta 3). 10. Näpäytetään vaihtoehto Histogram (kuva 8, kohta 4). 11. Näpäytetään vaihtoehto Show normal curve on histogram (kuva 8, kohta 5). 12. Näpäytetään painiketta Continue (kuva 8, kohta 6). 13. Näpäytetään painiketta OK (kuva 8, kohta 7) ja nähdään tulokset (kuvat 9 ja 10). Kuva 7. Valintaikkuna Split File Kuva 8. Valintaikkunat Frequencies ja Frequencies: Charts
Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 5 Kuva 9. Miesten frekvenssit ja histogrammi
6 Tilastollinen päättely Kuva 10. Naisten frekvenssit ja histogrammi
Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 7 III Osa-aineiston poimiminen Esimerkki 1. Alle 40-vuotiaiden naisten käsittely 1. Avataan http://users.metropolia.fi/~pasitr/opas/ran17a/data1.sav. 2. Valitaan Data - Select Cases, jolloin avautuu ikkuna Select Cases (kuva 11). 3. Valitaan If condition is satisfied (kuva 11, kohta 1). 4. Näpäytetään painiketta If (kuva 11, kohta 2) 5. Kirjoitetaan ehto, jolla valitaan vain alle 40-vuotiaat naiset (kuva 11, kohta 3). 6. Näpäytetään painiketta Continue (kuva 11, kohta 4). 7. Näpäytetään painiketta OK (kuva 11, kohta 5. 8. Valitaan Analyze Descriptive Statistics Frequences. 9. Siirretään muuttuja palkka ruutuun Variables (kuva 11, kohta 1). 10. Poistetaan rasti kohdassa Display Frequence table (kuva 11, kohta 2). 11. Näpäytetään painiketta Charts (kuva 11, kohta 3). 12. Näpäytetään vaihtoehto Histogram (kuva 11, kohta 4). 13. Näpäytetään vaihtoehto Show normal curve on histogram (kuva 11, kohta 5). 14. Näpäytetään painiketta Continue (kuva 11, kohta 6). 15. Näpäytetään painiketta OK (kuva 11, kohta 7) ja nähdään tulokset (kuvat 13). Kuva 11. Ikkunat Select Cases ja Select Cases: If Kuva 12. Valintaikkunat Frequencies ja Frequencies: Charts
8 Tilastollinen päättely Kuva 13. tulokset vasemmalla ja oikealla tarkistusta varten käsitellyt tilastoyksiöt Ikkunassa Select Cases poissuljetut rivit voidaan valita tuhottaviksi vaihtoehdolla Delete unselected cases (kuva 14, kohta 1) tai suodatettaviksi tilapäisesti pois vaihtoehdolla Filter out unselected cases (kuva 14, kohta 2), joka on oletus. Vaihtoehtoa Filter out unselected cases käytettäessä pois suljetut aineiston osat voidaan haluttaessa palauttaa käyttöön näpäyttämällä painiketta Reset (kuva, kohta 3). Kun käytetään vaihtoehtoa Filter out unselected cases, niin poissuljetut aineiston rivit ovat edelleen näkyvillä, mutta ne eivät ole mukana aineistoa käsiteltäessä. Poissuljettujen rivien rivinumeron päällä on vinoviiva (kuva 14, kohta 4). Kuva 14. Valintaikkuna Select Cases