Tilastomenetelmien lopputyö

Samankaltaiset tiedostot
Monivalintamuuttujien käsittely

IBM SPSS Statistics 21 (= SPSS 21)

2. Aineiston kuvailua

Webropol-kyselyt. Tarja Heikkilä

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Webropol 3.0 tulosten raportointi. Aki Taanila

TUTKIMUSOPAS. SPSS-opas

Muuttujien määrittely

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

SPSS ohje. Metropolia Business School/ Pepe Vilpas

YLEISKUVA - Kysymykset

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

(Jos et ollut mukana viime viikolla, niin kopioi myös SPSS-havaintoaineistotiedostot Yritys2 ja neljän kunnan tiedot.)

Harjoittele tulkintoja

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

Diagrammeja ja tunnuslukuja luokkani oppilaista

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Esimerkki 1: auringonkukan kasvun kuvailu

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Kandidaatintutkielman aineistonhankinta ja analyysi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

SPSS OPAS. Metropolia Liiketalous

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Muuttujien väliset riippuvuudet esimerkkejä

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

5 Lisa materiaali. 5.1 Ristiintaulukointi

Ratkaisuja luvun 15 tehtäviin

Aineiston kuvailu esimerkkejä

pisteet Frekvenssi frekvenssi Yhteensä

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET

Tilastojen tulkintatehtäviä lukion 2. ja 3. vuosikursseille

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TAMPEREEN TEKNILLINEN YLIOPISTO KÄYTTÖOHJE TIETOVARASTON KUUTIOT

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

KUNTALAISTEN ASIAKASTYYTYVÄISYYSKYSELY VUONNA 2008 TEUVAN KUNTA OSA-RAPORTTI. Hannele Laaksonen

Kaupunki- ja kuntapalvelut Espoossa 2014

Tilastolliset toiminnot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Text Mining. Käyttöopas

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Python-ohjelmointi Harjoitus 5

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

SPSS -harjoituksia 1

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

SPSS-perusteet. Sisältö

Tilastolliset ohjelmistot A. Pinja Pikkuhookana

TAULUKKOLASKENTA. Älä tuhoa C-asemalla olevaa kansiota (säilytä varmuuskopiona). Käytettävät tiedostot. excel.xlsx. Case kuvaus

Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 6

Til.yks. x y z

Anna tutki: Naisen asema työelämässä

1 PROSENTTILASKENTAA 7

Excel syventävät harjoitukset

Terveytemme - Atlas-raportin käyttöohje

2. Aineiston kuvaaminen graafisesti 1

I. Ristiintaulukointi Excelillä / Microsoft Office 2010

1 Funktiot, suurin (max), pienin (min) ja keskiarvo

StatCrunch -laskentasovellus

Tuhat Suomalaista Mainonnan neuvottelukunta Joulukuu SFS ISO20252 Sertifioitu

Viitta-itsearvioinnin käyttöohje Vastaajan ohje

Tentti erilaiset kysymystyypit

Vaikuttamisindeksi

KALLIOLAN SETLEMENTTI VAPAAEHTOISTYÖ Tuhat Suomalaista / Maaliskuu Tuhat Suomalaista Kalliolan Setlementti 3/2019

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Aineiston keruun suunnittelu ja toteutus. Tero Vahlberg

Sovellettu todennäköisyyslaskenta B

Mediaani. Keskihajonta

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Teema 3: Tilastollisia kuvia ja tunnuslukuja

15 askelta kohti. Parempia kyselyitä ja tutkimuksia

Opettajan pikaopas Opintojaksopalaute-järjestelmään

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Tilastojen visualisointi Excelillä. PiKe-kehittämiskirjasto Leena Parviainen

OKLV120 Demo 7. Marika Peltonen

Asiakastutkimus Blue Service Partners. Helsinge skolan (ya lukio) - Yläkoulu - ruoka Vastaajamäärä: 277

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja

Tilastoja yleisurheillen

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Suvi Junes Tampereen yliopisto / Tietohallinto 2013

Henkilöliikenteen asiakastyytyväisyystutkimus. Sääntelyelin, Mertti Anttila IROResearch Oy, Tomi Ronkainen

Opinnäytetyön kvantitatiivinen osuus

P5: Kohti Tutkivaa Työtapaa Kesä Aritmeettinen keskiarvo Ka KA. Painopiste Usein teoreettinen tunnusluku Vähintään välimatka-asteikko.

Ystävällistä, selkeää ja ihmisläheistä asiakaspalvelua kehiin. Asiakaspalvelukysely Jyväskylän kaupunki Uusi asiakaspalvelumalli

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen

KVANTITATIIVINEN TUTKIMUS

Asiakastyytyväisyystutkimus Sähkön siirron asiakkaat Tornionlaakson Sähkö

Transkriptio:

Tarja Heikkilä Tilastomenetelmien lopputyö Lopputyössä on esimerkkejä erilaisista tilastomenetelmistä. Datatiedosto Harjoitusdata.sav on muokattu tätä harjoitusta varten, joten se ei vastaa kaikkien muuttujien osalta todellista aineistoa. Harjoitustyö on suunniteltu suoritettavaksi SPSS-ohjelmalla, mutta tehtävät voi tehdä muillakin tilasto-ohjelmilla. Myös Excelohjelmaa voi käyttää, erityisesti kuvioiden piirtäminen onnistuu sillä hyvin. Harjoitustyössä harjoitellaan yleisimpiä yksinkertaisia tilastomenetelmiä. Tehtävät ovat seuraavista aiheista: 1. Muuttujien määrittely lomakkeen kysymyksistä 2. Aineistoon tutustuminen 3. Datatiedoston muuttujien arvojen tarkistus 4. SPSS-tiedostojen tallennus muiden ohjelmien käyttöön 5. Taustatietojen kuvaaminen Frekvenssitaulukot Tunnusluvut Luokittelu Pylväskuviot 6. Samaan kysymykseen kuuluvien vastausten yhdistäminen ja tulosten esittäminen 7. Kertausta edellisten tehtävien tilastomenetelmistä 8. Kysymysryhmien tulosten esittäminen 9. Ristiintaulukointi ja khiin neliö -testi 10. Tunnusluvut kokonaistuloksista 11. Korrelaatiokertoimet 12. Kahden ryhmän keskiarvojen vertailu ja t-testi 13. Usean ryhmän keskiarvojen vertailu ja siihen liittyvät testit 14. Avointen kysymysten vastausten esittäminen 1

Suorita harjoitustyön tehtävät. Kerää tehtävien 5 14 tulokset yhteen ja kirjoita niistä tutkimusraportti. Käytä raportissasi sanallisia otsikoita tehtävänumeroiden sijaan. 1. Määrittele muuttujat lomakkeesta. Katso erillinen tehtävä Muuttujien määrittely. 2. Avaa valmiiksi syötetty datatiedosto Harjoitusdata.sav. Vertaa omia muuttujien määrittelyjäsi tiedoston muuttujiin. Tutustu aineistoon. 3. Tarkista Analyze/Descriptive Statistics/Descriptives -komennolla, ovatko muuttujien arvot oikealla välillä. 4. Tallenna datatiedosto Excel-tiedostoksi File/Save as -komennolla valitsemalla tallennustyyppi Save as type -valikosta. Tallenna Output-tiedosto Word- tai Excel-tiedostoksi komennolla File/Export valitsemalla haluamasi tiedostotyyppi kohdasta Type ja tallennuskansio Browsepainikkeella. Ennen tallennusta kannattaa ikkunan ylälaidasta valita kohta All visible, jolloin vain Output-tiedostossa olevat tiedot tallentuvat. 5. Raportoi vastaajien taustatiedot. Tulosta frekvenssijakaumat vastaajien taustatiedoista (kysymykset 1 3) Analyze/Descriptive Statistics/Frequencies -komennolla. Kuvaile vastaajien taustatietoja ja kirjoita tärkeimmät tulokset tekstiksi. Seuraavassa on ohjeita taustatietojen esittämiseen. a) Selvitä, kuinka monta prosenttia vastaajista oli naisia ja kuinka monta miehiä. Tähän riittää sanallinen selitys; ei tarvita kuviota tai taulukkoa. Ilmoita sekä lukumäärät että prosenttiluvut. Jos haluat havainnollistaa tuloksia kuviolla, valitse piirakkakuvio. b) Tutki vastaajien ikäjakaumaa. Laske sopivia tunnuslukuja alkuperäisestä ikämuuttujasta. Käytä Analyze/Descriptive Statistics/Frequencies -komentoa ja tee tunnuslukuvalinnat Statistics-ikkunassa. Luokittele ikä Transform/Visual Binning - komennolla ikäluokkiin: 2

20, 21 30, 31 40, 41 50, 51 +. Esitä ikäjakauma pylväskuviona kuten seuraavassa kuvassa. Lisää prosenttiluvut pylväisiin ja pyöristä kokonaisen prosenttiyksikön tarkkuudelle. Lisää kuvioon prosenttilukujen perusarvo ja halutessasi iän keskiarvo ja vaihteluväli. Siirrä kuvio raporttiin ja analysoi vastanneiden ikäjakaumaa kuvion ja tunnuslukujen perusteella. Kuvio 1. Vastaajien ikäjakauma c) Muokkaa asemaa työmarkkinoilla esittävä taulukko raporttia varten. Kuvaa vastaajien asemaa myös palkkikuvion avulla. Muokkaa kuvio selkeäksi. Valitse raporttiin joko taulukko tai kuvio ja kerro tulos myös sanallisesti tekstinä. Tutki myös, mitä vastauksia tuli avoimeen kohtaan Jokin muu ja kerro tulos lukijallekin. 6. Esitä tulokset paikallismedioita koskevasta kysymyksestä (lomakkeen kysymys 4) palkkikuviona (prosentteina kysymykseen vastanneista). Huomaa, että kysymys on monivalintakysymys, josta on määritelty useita muuttujia. Yhdistä kysymyksen 4 muuttujat Analyze/Multiple Response/Define Variable Sets - komennolla ja tulosta sen jälkeen frekvenssijakauma Analyze/Multiple Response/Frequencies -komennolla. Muokkaa taulukko ja luo kuvio taulukon viimeisen sarakkeen prosenttiluvuista pikavalikon Create Graph/Bar -komennolla. Prosenttiluvut tulee olla valittuna ennen komentoa. Muokkaa kuvio. Lisää prosenttilukujen perusarvo eli kysymykseen vastanneiden määrä. 3

Kuvio 2. Vastaajien säännöllisesti seuraamat paikallismediat. Kuvaile tärkeimpiä tuloksia tekstissä. Selvitä myös, minkälaisia vastauksia tuli kohtaan Jokin muu. 7. Esitä kysymysten 5 7 tulokset selkeästi ja havainnollisesti. Kirjoita tulokset tekstiksi. Selvitä ensin, kuinka monta prosenttia vastaajista oli järjestänyt juhlia kodin ulkopuolella. Saat avoimeen kohtaan tulleet vastaukset juhlapaikoista Analyze/Frequnencies-komennolla muuttujasta Missä kodin ulkopuolella. Esitä myös avointen vastausten tulos raportissa sanallisesti. Esitä kysymyksen 6 ("Mistä saa tietoa juhlapaikoista?") tulokset taulukkona tai kuviona. Huomaa, että kysymyksestä on määritelty kolme muuttujaa. Yhdistä muuttujat samalla tavalla kuin edellisessä tehtävässä Analyze/Multiple Response/Define Variable Sets - komennolla ennen frekvenssijakauman tulostamista. Muokkaa frekvenssitaulukko raporttia varten tai piirrä kuvio. Käytä tuloksissa Percent of cases -prosenttilukuja (ei siis vastausten yhteismäärästä laskettuja). Järjestä taulukko tai kuvio prosenttilukujen mukaiseen järjestykseen. Selitä tärkeimmät tulokset tekstinä. Esitä kysymyksen 7 ("sopiva hinta juhlaruokailulle") tulokset vaikkapa pylväs- tai palkkikuviona. Kohtaan muu hinta tulleet vastaukset saat Analyze/Frequencies -komennolla. 8. Esitä kysymyksen 8 väittämien tulokset. Esitä tulokset kahtena ryhmänä: henkilökuntaa koskevat ja ruokaa koskevat. Harjoittele tulosten esittämistä sekä taulukkona että kuviona. Esitä Rinneravintolan henkilökuntaa koskevien väittämien tulokset yhtenä taulukkona ja ruokaan liittyvien väittämien tulokset kuviona (katso malleja seuraavassa). Kommentoi tuloksia myös sanallisesti. 4

Käytä Analyze/Tables/Custom Tables -komentoa taulukoiden tekemiseen, jos käyttämässäsi ohjelmassa on lisämoduuli. Taulukon tekemisestä on erillinen ohje (SPSS\Kysymysryhmät). Jos Tables-komentoa ei ole käytettävissä, saa vastaavan taulukon keräämällä yksittäisten väittämien frekvenssitaulukoista Valid Percent -arvot samaan taulukkoon. Taulukko 1. Vastaajien mielipiteet Rinneravintolan henkilökuntaan liittyvistä väittämistä. Täysin Lähes Jonkin Täysin En osaa n=120 samaa samaa verran eri eri sanoa mieltä mieltä mieltä mieltä Rinneravintolan palvelu on mielestäni ystävällistä 67 % 28 % 3 % 1 % 2 % Henkilökunta on ammattitaitoista 60 % 28 % 1 % 0 % 11 % Henkilökunta on palvelualtista 63 % 29 % 3 % 1 % 5 % Kuvion piirtämistä varten taulukko viedään Exceliin ja piirretään kuvio Excelin pinottuna palkkikuviona. Kuvio 3. Vastaajien mielipiteet ruokaa koskevista väittämistä. 9. Vertaile miesten ja naisten vastausten prosenttijakaumia kysymysryhmän 8 väittämiin. Ristiintaulukoi kysymyksen 8 väittämät sukupuolen kanssa (Analyze/Descriptive Statistics/Crosstabs). Testaa khiin neliö -testillä, riippuvatko mielipiteet sukupuolesta tilastollisesti merkitsevästi. 5

Valitse raporttiin ainakin sellaiset tulokset, joissa naisten ja miesten välillä on tilastollisesti merkitseviä eroja. Kommentoi myös muita vertailuja. Kirjoita tulokset raporttiin omaksi luvuksi tai lisää ne edellisen tehtävien tulosten perään sopivin alaotsikoin. Jos Sig.-arvo viittaa tilastollisesti merkitsevään riippuvuuteen, tarkista testin edellytysten voimassa olo. Jos pieniä odotettuja frekvenssejä on liikaa, kokeile auttaisiko uudelleen luokittelu. 10. Esitä kysymyksen 9 kokonaisarvosanoja koskevat tulokset. Käytä frkevenssi- tai prosenttijakaumia ja laske tunnuslukuja kokonaisarvosanoista. Valitse tunnusluvuiksi minimi, maksimi, moodi, mediaani, keskiarvo ja keskihajonta Analyze/Frequencies-komennon Statistics-ikkunassa. Halutessasi voit valita muitakin tunnuslukuja. Esitä tulokset mahdollisimman havainnollisesti. 11. Tutki korrelaatiokertoimien avulla (Analyze/Correlate), vaikuttaako ikä rinneravintolasta ja rinnepalveluista annettuihin kokonaisarvosanoihin. Käytä alkuperäistä ikä-muuttujaa. Korreloivatko rinneravintola- ja rinnepalveluarvosanat keskenään? Kommentoi tuloksia. Jos haluat tutkia korrelaatiokertoimen avulla, onko vastaajien iällä vaikutusta kysymyksen 8 väittämien vastauksiin, on kysymyksen 8 muuttujille määriteltävä 0 = en osaa sanoa puuttuvaksi tiedoksi. Tämä tehdään Variable View -näkymän 6

kohdassa Missing. Näin on tehtävä myös, jos haluaa laskea keskiarvoja kysymyksen 8 mielipiteistä. Vasta tämän jälkeen valitaan korrelaatiokertoimien tai tunnuslukujen laskemista koskeva komento. 12. Vertaa miesten ja naisten rinneravintolalle ja rinnepalveluille antamien kokonaisarvosanojen keskiarvoja. Testaa t-testillä, ovatko erot tilastollisesti merkitseviä (Analyze/Compare Means/Independet-Samples T Test). Vertaa myös miesten ja naisten keskimääräisiä mielipiteitä kysymyksen 8 väittämiin. Huomaa, että ennen keskiarvojen vertaamista, on 0 määriteltävä puuttuvaksi tiedoksi, kuten edellisessä tehtävässä neuvottiin. Tarkista vielä t-testin antamat tilastollisesti merkitsevät tulokset ei-parametrisellä Mann-Whitneyn U- testillä (Analyze/Nonparametric Tests/Legacy Dialogs/2 Independent Samples). 13. Vertaa eri ikäryhmien kokonaisarvosanojen keskiarvoja Analyze/Compare Means/Means -komennolla. Testaa erojen tilastollinen merkitsevyys varianssianalyysilla ja tarkista ei-parametrisella Kruskal-Wallisin testillä. 14. Esitä raportissa viimeisen avoimen kysymyksen kehittämisehdotuksia koskevat tulokset. Saat tulostettua kaikki vastaukset frekvenssikomennon avulla. Kirjoita vastauksista yhteenveto raporttiin. Suorat lainaukset voit laittaa raportin liitteeksi. 7