Tilastollinen tietojenkäsittely / SPSS Harjoitus 4 Tarkastellaan ensin aineistoa KUNNAT. Koska kyseessä on kokonaistutkimus, riittää, että tutkit tunnuslukujen arvoja ja teet niiden perusteella päätelmiä. 41. Etsi (esim. Analyze Descriptive Statistics Explore) aineistosta yksi jakaumaltaan a) symmetrinen b) oikealle loiveneva eli positiivisesti vino määrällinen muuttuja ja raportoi siitä sopivasti keskimääräisyyttä ja hajaantumista osoittavia tunnuslukuja. 42. Etsi aineistosta korrelaatiokertoimien (Analyze Correlate Bivariate) avulla yksi määrällinen muuttujapari, joiden välillä a) ei ole lineaarista riippuvuutta tai on vain heikkoa lineaarista riippuvuutta b) on negatiivista lineaarista riippuvuutta. Tee myös pisteparvikuviot em. muuttujapareista. 43. Tehdään ristiintaulukko kahdesta laadullisesta muuttujasta ja lasketaan myös RIIPPUVUUSUNNUSLUKUJEN arvoja, koska halutaan selvittää: Kuinka voimasta riippuvuus on? : Muodosta muuttujien lääni ja kuntamuoto välinen ristiintaulukko (Analyze-Descriptive Statistics-Crosstabs, esim laani kohtaan Columns ja kuntamuoto kohtaan Rows) ja tulosta näkyviin myös sopiva riippuvuustunnusluku (Statistics lisävalinta: Contingency coefficient ja/tai Phi and Cramer s V). Tulosta näkyviin myös prosentuaaliset ehdolliset jakaumat sopivassa suunnassa (Cells-lisävalinta, kohta Percentages, joko Row tai Column). Voit myös tulostaa näkyviin pylväsryhmäkuvion valinnalla Display clustered bar charts. Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on? (Kontingenssikertoimella C (= contingency coefficient) tai Cramerin V:llä voidaan kuvata riippuvuuden voimakkuutta mm. silloin, kun molemmat ristiintaulukoitavista muuttujista ovat nominaaliasteikollisia. Kontingenssikertoimen (ja myös Cramerin V:n) arvo 0 tarkoittaa riippumattomuutta. Riippuvuus on sitä voimakkaampaa, mitä lähempänä kontingenssikerroin on maksimiarvoaan C max k 1 k, missä k on pienempi luku rivien ja sarakkeiden lukumääristä tai mitä lähempänä Cramerin V on lukua 1.) 44. Tutki, onko muuttujien kuntamuoto ja asunnot välillä riippuvuutta. Voit käyttää sopivaa kuviota tai vaikkapa tehtävässä 43 esillä ollutta menetelmää. Jos käytät tehtävässä 43 esillä ollutta menetelmää, asunnot-muuttujan arvot on luokiteltava ensin vaikkapa seuraavasti:
Alle 800 1 800-949 2 950-1099 3 1100-1499 4 1500 tai yli 5 Sitten tarkastellaan aineistoa kyselyb. Nyt oletetaan, että tutkimuksen eri vuosina kyselyyn vastanneet opiskelijat ovat otos kaikista Vaasan yliopiston silloisista opiskelijoista. Kyseessä on siis otantatutkimus, joten tilastollisen päättelyn menetelmät (tilastolliset merkitsevyystarkastelut ja testit) voidaan ottaa käyttöön tarpeen tullen. HUOM. Testin havaittu merkitsevyystaso eli p-arvo (Significance tai Asymp. Sig.) on pienin merkitsevyystaso, jolla testin nollahypoteesi H 0 voidaan hylätä. Havaittua merkitsevyystasoa verrataan itse valittuun testin merkitsevyystasoon (usein 0.05, 0.01, ). PÄÄTÖSSÄÄNTÖ: Jos p, niin hyväksy nollahypoteesi H 0 merkitsevyystasolla. Jos p <, niin hyväksy vastahypoteesi H 1 merkitsevyystasolla. Usein p-arvoa tulkitaan seuraavasti: - jos p 0.05, sanotaan, että saatu tulos ei ole tilastollisesti merkitsevä. Tällöin nollahypoteesi hyväksytään (5 %:n merkitsevyystasolla) - jos 0.01 p < 0.05, sanotaan tuloksen olevan tilastollisesti melkein merkitsevä. Nyt nollahypoteesi hylätään 5 %:n merkitsevyystasolla, muttei enää 1 %:n merkitsevyystasolla. (Raporteissa testisuureen tai tunnusluvun arvon perään merkitään usein tässä tilanteessa yksi tähti.) - jos 0.001 p < 0.01, sanotaan tuloksen olevan tilastollisesti merkitsevä. Nyt nollahypoteesi hylätään 1 %:n merkitsevyystasolla, muttei enää 0.1 %:n merkitsevyystasolla. (Testisuureen tai tunnusluvun arvon perään merkitään usein tässä tilanteessa kaksi tähteä.) - jos p < 0.001, sanotaan, että saatu tulos on tilastollisesti erittäin merkitsevä. Tällöin nollahypoteesi hylätään 0.1 %:n merkitsevyystasolla. (Testisuureen tai tunnusluvun arvon perään merkitään usein tässä tilanteessa kolme tähteä.) 45. Kuvaile sopivaa tilastollista menetelmää käyttäen feministiliike-muuttujan jakaumaa. 46. Ristiintaulukoinnin lisäksi halutaan selvittää TILASTOLLISEN PÄÄTTELYN avulla riippuvuustilanne populaatiossa kahdesta laadullisesta muuttujasta: Tee ristiintaulukko muuttujista kotipaikka (nominaaliasteikko) ja feministiliike (järjestysasteikko). Olet tutkimassa siis, suhtautuvatko eri kotipaikkojen opiskelijat samalla tavoin feministiliikkeeseen. Havainnollista tilannetta sopivalla tilastokuviolla. Nyt tehdään päätelmiä mahdollisesti riippuvuudesta otoksen lisäksi myös populaatiossa, joten tee Statistics-lisävalinta: Chi-Square.
Nollahypoteesi H 0 : muuttujat ovat riippumattomia populaatiossa, joka tarkoittaa nyt: Vastahypoteesi H 1 : muuttujien välillä on riippuvuutta populaatiossa, joka tarkoittaa nyt: (Pearsonin) 2 = ja p-arvo =, joten H 0 hyväksytään/hylätään :n merkitsevyystasolla, eli 47. Tutki sopivalla tilastollisella testillä, onko sukupuolen ja vihreä liike-asennemuuttujan (eli harjoituksissa 2 tehtävässä 15 muodostettu 3-arvoinen vihreä liike muuttuja) välillä riippuvuutta eri vuosien (Layer-kohtaan tai ennen analyysiä Data-Split File) opiskelijapopulaatioissa. Jos on, niin millaista? Tulkitse tuloksesi. Testihypoteesini ovat H 0 : H 1 : Vuosi 1984: 2 -arvo on ja sen p-arvo on, joten H 0 Vuosi 1985: 2 -arvo on ja sen p-arvo on, joten H 0 Vuosi 1993: 2 -arvo on ja sen p-arvo on, joten H 0 Vuosi 1994: 2 -arvo on ja sen p-arvo on, joten H 0 Vuosi 1995: 2 -arvo on ja sen p-arvo on, joten H 0 Vuosi 2009: 2 -arvo on ja sen p-arvo on, joten H 0 Ja tulosten yhteenveto tähän:
48. Lasketaan järjestyskorrelaatioita, jotta voidaan selvittää, onko kahden järjestysasteikollisen muuttujan välillä monotonista riippuvuutta otoksessa ja tehdään tilastollista päättelyä populaatiosta Tutki sopivalla järjestyskorrelaatiokertoimella (joko Spearmanin järjestyskorrelaatio tai Kendallin tau-b) mielipidemuuttujien (ei asennemuuttujien) välisiä riippuvuuksia populaatiossa. Havainnollista jonkin muuttujaparin riippuvuutta sopivalla tilastokuviolla. Tulkitse tuloksesi. (Spearmanin järjestyskorrelaatiokerroin (ja Kendallin tau-b) mittaa monotonisen riippuvuuden voimakkuutta, eli sitä, onko tilastoyksiköiden järjestyksillä yhteyttä kahdella eri muuttujalla. Järjestyskorrelaation arvot ovat välillä (-1, +1). Arvo -1 tarkoittaa täydellistä negatiivista monotonista riippuvuutta, jolloin tilastoyksiköiden järjestykset ovat päinvastaiset. Arvo +1 tarkoittaa täydellistä positiivista monotonista riippuvuutta, jolloin tilastoyksiköiden järjestykset ovat täysin samanlaiset. Arvo 0 tarkoittaa monotonista riippumattomuutta, jolloin tilastoyksiköiden järjestykset ovat aivan satunnaiset. Järjestyskorrelaation positiivinen arvo kuvastaa sitä, että x-muuttujan arvojen kasvaessa y-muuttujan arvotkin kasvavat; negatiivinen arvo kuvastaa sitä, että x- muuttujan arvojen kasvaessa y-muuttujan arvot pienevät. Järjestyskorrelaatiokerroin sopii käyttöön, kun tilastollinen mitta-asteikko on ainakin järjestysasteikko.) Hypoteesit järjestyskorrelaatiotestauksessa ovat H 0 : muuttujat ovat monotonisesti riippumattomia H 1 : muuttujien välillä on monotonista riippuvuutta korrelaatio testin p-arvo johtopäätös riippuvuudesta lisäydinvoima toimiluparajoitus lisäydinvoima vihreäliike lisäydinvoima feministiliike toimiluparajoitus vihreäliike toimiluparajoitus feministiliike vihreäliike feministiliike
49. Tutki em. korrelaatioita erikseen miesten ryhmässä ja naisten ryhmässä. Tulkitse tulokset. korrelaatio korrelaatio p-arvo p-arvo miesten naisten (miehet) (naiset) ryhmässä ryhmässä lisäydinvoima toimiluparajoitus lisäydinvoima vihreäliike lisäydinvoima feministiliike toimiluparajoitus vihreäliike toimiluparajoitus feministiliike vihreäliike feministiliike Tarkastellaan viimeiseksi aineistoa kyselya. Myös tässä on kyseessä otanta-aineisto. 50. Testataan, ovatko määrälliset muuttajat normaalijakautuneita: Testaa sopivalla testillä, ovatko muuttujat pituus, paino, kengännumero ja vaaksa normaalijakautuneita. Tulkitse tuloksesi. (Analyze-Descriptive Statistics-Explore (Plots-lisävalinta, valinta: Normality Plots with Tests, käytä myös Options-lisävalintaa Exclude cases pairwise.) (Normaalijakaumatesteissä: H 0 : Muuttujan jakauma on normaalijakauma H 1 : Muuttujan jakauma ei ole normaalijakauma) Pituuden jakauma on/ei ole normaalijakauma, koska testin p-arvo on. Painon jakauma on/ei ole normaalijakauma, koska testin p-arvo on. Kengännumero on/ei ole normaalijakautunut, koska p-arvo on. Vaaksan jakauma on/ei ole normaalijakauma, testin p-arvo on. 51. Selvitetään, miten määrällisen muuttujan jakauma eroaa normaalijakaumasta. (HUOM. Normaalijakauma on mm. yksihuippuinen, mesokurtinen ja symmetrinen.) Tutki sopivien tilastollisten tunnuslukujen avulla, millä tavalla muuttujat pituus, paino, kengännumero ja vaaksa poikkeavat normaalijakaumasta.
Voit hyödyntää tehtävän 32 tuloksiasi. Jos sinulla ei ole niitä tallella, niin tutki esim. vinoutta ja huipukkuutta ja huippujen lukumäärää. Pituuden jakauma Painon jakauma Kengännumeron jakauma Vaaksan jakauma 52. Selvitetään tilastollisen päättelyn avulla, onko määrällisten muuttujien välillä lineaarista riippuvuutta populaatiossakin: Tehtävässä 36 käytit korrelaatiokertoimia selvittääksesi, onko määrällisten muuttujien välillä lineaarista riippuvuutta otoksessa. Tutki nyt korrelaatioiden tilastollinen merkitsevyys ensin koko opiskelijapopulaatiossa. (Korrelaatiomerkitsevyystestauksessa pitäisi kahden muuttujan yhteisjakauman olla kaksiulotteinen normaalijakauma. Tätä voi tutkia esim. tarkastelemalla, onko muuttujien välinen pisteparvi ellipsinmuotoinen.) Tutki eo. korrelaatioita vielä erikseen vuoden 2009 opiskelijapopulaatiossa (ensin Data- Select Cases). Eroavatko tulokset koko joukon tuloksista? Pearsonin korrelaation testauksessa H 0 : Muuttujat ovat lineaarisesti riippumattomia (Jos H 0 hyväksytään, niin selvitä vielä, onko muunlaista riippuvuutta käyttäen vaikkapa pisteparvikuviota) H 1 : Muuttujien välillä on lineaarista riippuvuutta (Jos H 1 hyväksytään, niin kuvailepa vielä riippuvuuden voimakkuus ja suunta käyttäen vaikkapa korrelaation arvoa) korrelaatio p-arvo korrelaatio p-arvo v. 2009 v. 2009 pituus paino pituus kengännumero pituus vaaksa
paino kengännumero paino vaaksa kengännumero vaaksa 53. Tehdään selvitys siitä, onko yhden otoksen keskiarvotestin oletukset kunnossa. Tehdään yhden otoksen keskiarvotesti. Suomalaisten akateemisten miesten keskipituuden on arvioitu olevan 180 cm. Tarkoitus olisi testata, tukeeko tämän havaintoaineiston miesopiskelijoiden (=otos akateemisesta miehistä) keskipituus esitettyä arviota. 1) Valitse tarkasteltavaksi osajoukoksi aineiston miesopiskelijat. 2) Testaa, onko miesten joukossa pituuden jakauma normaalijakauma. Jos ei ole, tutki miten jakauma eroaa normaalijakaumasta. 3) Ja koska yhden otoksen keskiarvotestin oletukset ovat kunnossa, niin testaa sitten, tukeeko tämän havaintoaineiston miesopiskelijoiden keskipituus esitettyä arviota. (Analyze-Compare Means-One Sample T Test) Otoksen keskiarvo on, tilastoyksiköitä on kpl, ja keskihajonta on. Testin nollahypoteesi H 0 : µ = 180 ja vastahypoteesi H 1 :. Testisuureen arvo t = ja sen p-arvo on, joten H 0 hyväksytään/hylätään :n merkitsevyystasolla, ja siten keskipituudesta esitetty arvio pitää/ei pidä paikkansa.