Kaisa Kirves. Tampereen yliopisto, YKY, psykologia

Koko: px
Aloita esitys sivulta:

Download "Kaisa Kirves. kaisa.kirves@uta.fi. Tampereen yliopisto, YKY, psykologia"

Transkriptio

1 Ma a ra lliseen aineistoon perustuvien tutkielmien menetelma opas Kaisa Kirves kaisa.kirves@uta.fi Tampereen yliopisto, YKY, psykologia

2 Esipuhe Ohjasin kevään 2013 aikana Tampereen yliopiston psykologian opiskelijoita heidän pro gradu - töiden menetelmäosioiden työstämisessä. Ohjauksen aikana kokosin erillisiä ohjeistuksia niihin tilastollisiin menetelmiin, joista opiskelijoilla heräsi kysymyksiä. Tämä opetusmoniste kerää yhteen näin syntyneen materiaalin. Opetusmonisteen tarkoitus on opastaa ja auttaa määrällisiin opinnäytetöihin liittyvissä tilastollisissa analyyseissa. Moniste antaa apuja oikean tilastollisen menetelmän valintaan, muuttujamuunnoksien tekemiseen sekä yleisimmin käytettyjen tilastollisten menetelmien suorittamisen SPSS-ohjelmalla. Koska psykologian oppiaineessa on jo käytössä erinomainen opas tutkielmien ja tieteellisten raporttien laadintaan (Kinnunen ym., 2004), niin tässä monisteessa ei käydä läpi yksityiskohtaisesti tulosten raportointia. Tampereella elokuussa 2013 Kaisa Kirves 2

3 Sisältö OIKEAN MENETELMÄN VALINTA... 4 MUUTTUJAMUUNNOKSET... 6 Uuden muuttujan laskeminen matemaattisella kaavalla... 6 Vanhan muuttujan uudelleenluokittelu... 7 RELIABILITEETTI RISTIINTAULUKOINTI JA KHIIN NELIÖ -TESTAUS REGRESSIOANALYYSI Erikoistapaukset Pitkittäisaineisto Interaktiot (eli moderaatio-vaikutus) Polynomiset termit VARIANSSIANALYYSI ELI ANOVA Yksisuuntainen varianssianalyysi Kaksisuuntainen varianssianalyysi Kovarianssianalyysi Monen y-muuttujan varianssianalyysi Toistomittausten varianssianalyysi LOGISTINEN REGRESSIOANALYYSI Binaarinen logistinen regressioanalyysi Multinomiaalinen logistinen regressioanalyysi KATOANALYYSI

4 OIKEAN MENETELMÄN VALINTA Kun tutkimuskysymykset on määritelty tarkasti, voidaan siirtyä etsimään vastauksia aineistosta. Kannattaa ottaa työn alle aina yksi tutkimuskysymys kerrallaan. Jokaisen kohdalla seuraavan listan läpikäyminen varmistaa oikean tilastollisen menetelmän valinnan. 1. Määrittele tutkimuskysymyksesi riippuva/selitettävä/y ja riippumaton/selittävä/x -muuttuja. Sekä riippuvia että riippumattomia muuttujia voi myös olla useita samassa tutkimuskysymyksessä. Lisäksi saatat haluta kontrolloida joitakin muuttujia (usein esim. ikä tai sukupuoli). Listaa kaikki muuttujat omiin sarakkeisiin. 2. Määritä listassa olevien muuttujien mitta-asteikot. Tämä vaihe on erittäin oleellinen oikean menetelmän valinnassa. Onko kyseessä 1) Kategorinen/kvalitatiivinen muuttuja eli - luokittelu/laatueroasteikko (esim. sukupuoli, koulutusaste) - järjestysasteikko (esim. kilpailun kolme parasta, Likert-asteikko) 2) Jatkuva/kvantitatiivinen muuttuja eli - välimatka-asteikko (esim. Celsius-aste) - suhdeasteikko (esim. pituus senttimetreinä, Likert-asteikollisesta muuttujasta muodostettu summamuuttuja) 3. Käytä menetelmän valinnassa seuraavaa taulukkoa: Riippuva / selitettävä / y Kategorinen Jatkuva Riippumaton / selittävä / x Kategorinen Jatkuva Ristiintaulukointi Varianssianalyysi Logistinen regressioanalyysi Regressioanalyysi 4

5 Huom! Useampi x-muuttujia ja kontrollimuuttujia on mahdollista ottaa mukaan varianssianalyysiin ja regressioanalyyseihin. Lisäksi varianssianalyysi on mahdollista toteuttaa niin, että samassa analyysissa on mukana useampi y-muuttuja. Muiden menetelmien kohdalla pitää tehdä niin monta analyysia kuin y-muuttujia on. 5

6 MUUTTUJAMUUNNOKSET Uuden muuttujan laskeminen matemaattisella kaavalla Joskus eteen tulee tilanteita, joissa on tarpeen laskea uusi muuttuja alkuperäisiä aineistossa olevia muuttujia käyttäen muodostamalla matemaattinen kaava. Yleisimpiä tällaisia tilanteita ovat summamuuttujan ja iän laskeminen, jos ikä on ilmoitettu syntymävuoden eikä ikävuosien avulla alkuperäisessä aineistossa. SPSS: Uusi muuttuja päästään laskemaan valitsemalla Transform Compute Variable Tähän nimetään uusi muuttuja. Huom! Nimessä ei saa käyttää välilyöntejä Tähän muodostetaan matemaattinen kaava. Tässä esimerkissä lasketaan ikää, kun aineistosta löytyy vain syntymävuosi. Aineisto on kerätty vuonna 2008, joten kaava on 2008-syntymävuosi. Syntymävuosi-muuttuja valitaan vasemmanpuoleisesta muuttujalistasta. OK:ta klikkaamalla uusi muuttuja lasketaan ja se ilmestyy aineistoon viimeiseksi muuttujaksi. 6

7 Summamuuttujan voi laskea kahdella eri tavalla: TAPA 1 Lasketaan väittämät yhteen ja jaetaan väittämien lukumäärällä eli Numeric Expression -kohtaan kirjoitetaan (mja1 + mja2 + mja3 + mja4)/4 Summamuuttuja lasketaan kaikille niille henkilöille, jotka ovat vastanneet kaikkiin neljään väittämään. TAPA 2 Lasketaan summamuuttuja MEAN-komennon avulla eli Numeric Expression -kohtaan kirjoitetaan MEAN(mja1,mja2,mja3,mja4) Summamuuttuja lasketaan kaikille niille henkilöille, jotka ovat vastanneet vähintään yhteen näistä väittämistä. Jos alkuperäisissä väittämissä on vain muutamia puuttuvia havaintoja (tämä selviää muodostamalla frekvenssitaulukot näistä väittämistä), niin suosittelen muodostamaan summamuuttujat MEANkomennon avulla, jotta käytettävissä olevan aineiston koko ei suotta pienene. Vanhan muuttujan uudelleenluokittelu Hyvin usein tulee eteen tilanne, jossa vanha muuttuja halutaan luokitella uudestaan. Vanha muuttuja voi olla joko kategorinen tai jatkuva muuttuja. SPSS: Vanha muuttuja päästään luokittelemaan uudestaan valitsemalla Transform Recode into Different Variables Seuraavilla sivuilla käydään yksityiskohtaisesti läpi muuttujan uudelleenluokittelun vaiheet. 7

8 Valitaan listasta muuttuja, joka halutaan luokitella uudelleen Syötetään uuden muuttujan nimi ja klikataan Changepainiketta Tehdään luokittelu klikkaamalla Old and New Values -painiketta 8

9 Vasemmalla puolella määritellään mikä vanhan muuttujan osa luokitellaan uudelleen Oikealla puolella annetaan uusi arvo vasemmalle puolelle tehdylle valinnalle Vaihtoehdot: Value = Yksittäinen luku Range = Lukujen väli, määritetään ala- ja yläarvo Range, LOWEST through value: Kaikki tämän luvun alla olevat luvut ja myös tämä luku Range, value through HIGHEST: Kaikki tämän luvun yllä olevat luvut ja myös tämä luku Uuden muuttujan arvo. Koska tässä muodostetaan kategorista muuttujaa, niin yleensä numerointi aloitetaan ykkösestä ja jatketaan siitä eteenpäin. Tässä esimerkissä ikä on luokiteltu kolmeen luokkaan: alle 35-vuotiaat vuotiaat 2 yli 49-vuotiaat 3 Jos on tarvetta esimerkiksi muuttaa aineistossa oleva puuttuvan havainnon arvo 99 sellaiseksi puuttuvaksi havainnoksi minkä SPSS tajuaa, niin vasemmalle kirjoitetaan 99 ja oikealta valitaan System-missing 9

10 Klikkaamalla Continue ja OK uusi muuttuja ilmestyy aineiston loppuun. Kannattaa vielä nimetä uuden muuttujan luokkien selitykset Variable View -välilehdellä ko. muuttujan kohdalla Valuessarakkeeseen: 10

11 RELIABILITEETTI Psykologisessa tutkimuksessa mittareiden reliabiliteettia on totuttu tutkimaan Cronbachin alfalla, joka merkitään α. Näin halutaan varmistaa, että mittarin muodostavat väittämät ovat mitanneet riittävän vahvasti samaa ilmiötä. Yleisesti ottaen hyväksyttävä raja α:lle on.60, mutta mieluiten α >.70. SPSS: 1. Analyze Scale Reliability Analysis 2. Items: valitaan ne väittämät, jotka ovat muodostaneet kyseisen mittarin eli summamuuttujan. Tähän ei siis laiteta itse summamuuttujaa vaan ne väittämät, joista ko. summa muodostuu. 3. Scale label: tähän voidaan kirjoittaa mittarin nimi, jotta muistetaan paremmin outputikkunaa lukiessa, että minkä mittarin reliabiliteettia tulikaan laskettua. 4. OK Esimerkki: Lasketaan uupumusasteisen väsymykselle Cronbachin alfa. Uupumusasteinen väsymys muodostuu tässä aineistossa kolmesta väittämästä. Tulokset näyttävät tältä: Nyt ylemmästä taulukosta nähdään, että otoskoko on ollut Cronbachin alfa on.88 eli oikein hyvä (yli.70). 11

12 Raportointi: Tässä esimerkki siitä, miten reliabiliteetit usein raportoidaan tekstissä (Kirves, 2009). Palautumisen mekanismeista on ilmoitettu kaksi alfaa, joista ensimmäinen on ajasta 1 ja jälkimmäinen ajasta 2 (kyseessä siis pitkittäisaineisto). Huomaa, ettei itsearvioidusta terveydestä ole laskettu alfaa, sillä kyseessä on vain yhden väittämän mittari. Jos mittarissa on kaksi väittämää, niin alfan sijasta voi raportoida näiden kahden väittämän korrelaation. 12

13 RISTIINTAULUKOINTI JA KHIIN NELIÖ -TESTAUS Ristiintaulukointi ja Khiin neliö -testaus (merkitään χ 2 ) on sopiva menetelmä silloin, kun tutkitaan kahden kategorisen muuttujan välistä yhteyttä. Periaatteessa näissä kahdessa kategorisessa muuttujassa voi olla luokkia miten paljon tahansa, mutta käytännössä ristiintaulukkoa on vaikea lukea, jos luokkia on valtavasti (esim. molemmissa muuttujissa yli neljä luokkaa). Lisäksi χ 2 -testi on luotettava vain, jos tietyt oletukset toteutuvat (näistä jäljempänä) ja yleensä nämä ehdot eivät toteudu, jos muuttujissa on luokkia valtavasti. Kannattaa siis jo ennen ristiintaulukon muodostamista miettiä, onko muuttujissa sopivasti luokkia vai pitäisi joitakin luokkia ehkä yhdistää. χ 2 -testaus perustuu siihen, että vertaillaan ristiintaulukossa näkyviä havaittuja frekvenssejä (eli lukumääriä) ja laskennallisesti muodostettavia odotettuja frekvenssejä. Nämä odotetut frekvenssit lasketaan sillä periaatteella, että ristiintaulukossa olevien kahden muuttujan välillä ei ole mitään riippuvuutta. Tästä seuraa se, että mitä suurempi havaittujen ja oletettujen frekvenssien välinen ero on, sitä todennäköisemmin taulukossa olevat muuttujat ovat toisistaan riippuvia. χ 2 -testiin liittyvät oletukset koskevat odotettuja frekvenssejä ja ne ovat: 1) korkeintaan 20 % odotetuista frekvensseistä saa olla alle 5 2) pienimmän odotetun frekvenssin pitää olla vähintään 1 Näiden oletuksien pitää ehdottomasti täyttyä, jotta analyysi on luotettava. Huom! Jos kummassakin muuttujassa on vain kaksi luokkaa, niin näitä oletuksia ei tarvitse tarkistaa. SPSS: 1. Analyze Descriptive Statistics Crosstabs 2. Row: riippuva/selitettävä/y-muuttuja 3. Column: riippumaton/selittäjä/x-muuttuja 4. Statistics-välilehti: valitaan Chi-square (antaa χ 2 -testauksen) 5. Cells-välilehti: valitaan Percentages-kohdasta Columns (laskee ristiintaulukkoon prosenttiluvut); valitaan lisäksi Residuals-kohdasta Adjusted standardized (laskee luvut, joiden avulla voidaan arvioida, miten mahdollinen muuttujien välinen riippuvuus esiintyy) 6. OK 13

14 Esimerkki: Tässä esimerkissä tarkastellaan kysymystä Onko ikä yhteydessä koulutustasoon?. Jotta voidaan käyttää ristiintaulukointia ja χ 2 -testausta, pitää molempien muuttujien olla kategorisia. Niinpä ikä on luokiteltu seuraavasti: 1 = alle 35-vuotiaat, 2 = vuotiaat, 3 = yli 49-vuotiaat. Koulutus onkin jo valmiiksi luokiteltu näin: 1 = peruskoulu, 2 = lukio/ammattikoulu, 3 = ammattikorkeakoulu, 4 = maisterin tutkinto, 5 = lisensiaatin tai tohtorin tutkinto. Tässä analyysissa ajatellaan, että ikä on x- muuttuja ja koulutus on y-muuttuja, sillä on todennäköisempää että ikä vaikuttaa koulutukseen kuin että koulutus vaikuttaa ikään. Seuraavassa käydään läpi SPSS-tulosteet ja vastataan tutkimuskysymykseen. Tässä on siis ristiintaulukointi. Taulukkoa ei laiteta tällaisenaan graduun. Tässä alla esimerkki siitä, millaisen taulukon voi tehdä: TAULUKKO 1. Koulutustaso ikäluokittain Alle 35-vuotias vuotias Yli 49-vuotias Yhteensä n % n % n % N % Peruskoulu 0 0,0 A 2 0,4 A 17 4,6 T 19 1,6 Lukio/Ammattikoulu 38 10,4 36 8,0 25 6,8 99 8,3 Ammattikorkeakoulu 16 4,4 A 57 12, ,9 T ,1 Maisterin tutkinto ,4 T ,4 A ,0 A ,0 Lis. tai tohtorin tutkinto 54 14,8 A ,6 T ,7 T ,9 Yhteensä , , , ,0 A = odotettua pienempi osuus, mukautettu standardoitu jäännös -2, T = odotettua suurempi osuus, mukautettu standardoitu jäännös 2. 14

15 Taulukosta voi nähdä useita eri asioita ja tutkijan on valittava, mitä hän haluaa nostaa taulukosta esiin. Esimerkiksi taulukosta nähdään, että alle 35-vuotiaiden keskuudessa maisterin tutkinnon suorittaneiden osuus on korostunut. Lisäksi nähdään, että peruskoulutasoinen koulutus keskittyy yli 49-vuotialle. Nähdään myös, että vaikka lisensiaatin ja tohtorin tutkinnon suorittaneita on myös nuorimmassa ikäryhmässä, niin silti tässä yliopistoaineistossa nämä korkeammat tutkinnot ovat pääasiassa yli 35-vuotiaiden saavutus. Tässä taulukossa on χ 2 -testauksen tulos. Katsotaan ensin taulukon alta, toteutuvatko testauksen ehdot. Prosenttiluku on 0 % ja se on alle 20 % eli ensimmäinen ehto toteutuu. Minimiluku on 5,84 ja se on suurempi kuin 1 eli myös toinen ehto toteutuu. Näin ollen testaus on luotettava. Testin tulosta luetaan taulukon ensimmäiseltä riviltä ja se raportoidaan näin: χ 2 (8, N = 1187) = , p <.001 Tämä puolestaan tarkoittaa, että iän ja koulutuksen välillä on tilastollisesti merkitsevä yhteys. Toisin sanoen ristiintaulukossa nähdyt erot ovat tilastollisesti merkitseviä eli eivät johdu sattumasta. 15

16 REGRESSIOANALYYSI Regressioanalyysiin liittyvät seuraavat vaatimukset: Selitettävän (y) muuttujan tulee olla jatkuva muuttuja ja normaalijakautunut Selittäjien (x-muuttujat) tulee olla joko jatkuvia muuttujia tai kaksiluokkaisia (esim. sukupuoli) muuttujia Selittäjät eivät saisi korreloida vahvasti keskenään (r >.50) SPSS: 1. Analyze -> Regression -> Linear 2. Valitaan Dependent -kenttään y-muuttuja 3. Valitaan Independent(s) -kenttään ensimmäisellä askeleella mahdolliset taustamuuttujat 4. Painetaan Next -näppäintä saadaan seuraava askel 5. Valitaan Independent(s) -kenttään toisella askeleella x-muuttujat 6. Statistics-välilehden alta valitaan jo olemassa olevien valintojen lisäksi R squared change, Collinearity diagnostics. 7. OK Esimerkki: Tämä esimerkki näyttää hierarkkisen regressioanalyysin poikkileikkausaineistossa. Esimerkissä on mukana taustamuuttujat sukupuoli (kaksiluokkainen, 1 = nainen, 2 = mies) ja ikä (jatkuva) sekä - x-muuttuja työllistymisusko (jatkuva summamuuttuja) - y-muuttuja työn epävarmuus (jatkuva summamuuttuja) Tulkintaan tarvitaan taulukoita Model Summary, ANOVA ja Coefficients ; muut ovat turhia. Seuraavilla sivuilla käydään nämä taulukot yksityiskohtaisesti läpi. 16

17 R Square = Mallin selitysaste: Ensimmäisen askeleen jälkeen mallin selitysaste on.03 ja toisen askeleen jälkeen.09 R Square Change = Selitysasteen muutos: Ensimmäinen askel lisäsi.03 ja toinen askel.06 Sig. F Change = Tilastollinen merkitsevyys selitysasteen muutokselle: Kummatkin askeleet lisäsivät merkitsevästi mallin selitysvoimaa (p <.05) Sig. = Mallin selittäjien merkitsevyys: Sekä ensimmäinen että toisen askeleen jälkeen mallilla on tilastollisesti merkitsevää selitysvoimaa. Eli edellisen taulukon selitysasteet.03 ja.09 ovat tilastollisesti merkitseviä (p <.05). 17

18 Unstandardized B = Standardoimaton regressiokerroin; eli kertoimeen vaikuttaa se, millä asteikolla muuttuja on mitattu; ei raportoida Standardized Beta = Standardoitu regressiokerroin; eli eri muuttujien kertoimien suuruuksia voidaan nyt vertailla keskenään, koska muuttujan asteikko ei enää vaikuta; nämä raportoidaan taulukossa: Nyt sukupuolella on positiivinen yhteys työn epävarmuuteen eli miehet kokevat enemmän työn epävarmuutta kuin naiset. Korkeampi ikä ja korkeampi työllistymisusko puolestaan ovat yhteydessä matalampaan työn epävarmuuteen. Sig. = Regressiokertoimen tilastollinen merkitsevyys, luetaan normaalisti viimeiseltä askeleelta: Nyt kaikki selittäjät ovat tilastollisesti merkitseviä (p <.05). Tolerance = Toleranssi, kertoo siitä, onko aihetta huolestua muuttujien multikolineaarisuudesta, luku voi olla välillä 0-1, mitä lähempänä ollaan nollaa, sitä enemmän on huolta, tarkkaa huolestumisen rajaa ei ole olemassa mutta esim. 50 alkaa jo olla hälyttävää. Tosin joidenkin lähteiden mukaan toleranssin tulee olla niinkin pieni kuin.10 ennen kuin on syytä toimenpiteisiin (eli x-muuttujien poistamiseen). Nyt viimeisellä askeleella toleranssit ovat välillä eli ei varmasti syytä huoleen. Erikoistapaukset Regressioanalyysi taipuu monenlaisiin tilanteisiin. Yleisimpiä ovat pitkittäisaineiston analysointi, moderaatio-analyysit ja polynomisten termien käyttö. Nämä analyysit noudattavat samoja periaatteita kuin ns. tavallinen regressioanalyysi ja siksi seuraavassa käydään läpi analyysit vain niiltä osin kun ne poikkeavat edellä esitetystä. 18

19 Pitkittäisaineisto Muuten menetellään kuten edellä, mutta nyt y-muuttuja on jälkimmäiseltä mittauskerralta (T2) kun kaikki x-muuttujat ovat ensimmäiseltä mittauskerralta (T1). Tämän lisäksi analyysiin lisätään vielä viimeiseksi uusi askel, jolla otetaan mukaan y-muuttuja ensimmäiseltä mittauskerralta (T1). Näin katsotaan, säilyvätkö aikaisemmalla askeleella olevat yhteydet vielä senkin jälkeen kun y-muuttujan perustaso kontrolloidaan. Interaktiot (eli moderaatio-vaikutus) Regressioanalyysin vaiheet ovat nyt seuraavat: 1. Interaktioon tulevat jatkuvat muuttujat standardoidaan, sillä näin vähennetään multikolineaarisuutta.jos interaktioon tulevista muuttujista toinen on kaksiluokkainen, muutetaan tämän luokan arvot siten, että toinen luokka saa arvon 0 ja toinen 1. a. Standardointi tapahtuu helpoiten seuraavasti: Analyze -> Descriptive Statistics -> Descriptives -> Laatikkoon valitaan standardoitavat muuttujat -> Laitetaan rasti alalaidan ruutuun, jolloin standardoidut arvot tallentuvat aineiston loppuun -> OK b. Muuttujien uudelleen luokittelu tapahtuu valikosta Transform -> Recode into different variables 2. Interaktio-termi lasketaan käyttäen edellisessä vaiheessa saatuja muuttujia. Transform -> Compute variable -> Target variable = uuden interaktiotermin nimi (muista, ei välilyöntejä nimeen) -> Numeric expression = kerrotaan *-mekkiä käyttäen interaktiotermin muodostavat kaksi muuttujaa. 3. Regressioanalyysin askeleet ovat seuraavat: Askel 1: Taustamuuttujat Askel 2: Moderaattori Askel 3: X-muuttuja Askel 4: Interaktiotermi 4. Muuten regressioanalyysin asetukset valitaan samalla tavalla kuin edellä mainittiin. Myös tulkittavat taulukot ovat samat. 5. Jos interaktiotermi on tilastollisesti merkitsevä, pitää interaktio vielä purkaa auki piirtämällä tilanteesta kuva ja laskemalla ns. simple slopet a. Kuvan piirtämiseen on olemassa excel-tiedosto (saa pyynnöstä ohjaajalta tai minulta) b. Simple slopien laskemiseen käytetään valmista syntaxia, joka saadaan osoitteesta: 19

20 Polynomiset termit Edellä esitetyt regressiomallit mallintavat muuttujien välisiä lineaarisia suhteita. On kuitenkin mahdollista, että muuttujat ovatkin epälineaarisesti eli käyräviivaisesti yhteydessä toisiinsa. Tällaisten yhteyksien tutkimiseen käytetään polynomisia termejä. Jos halutaan tutkia, onko muuttujien välinen yhteys U:n muotoista tai käännetyn U:n muotoista, niin tällöin käytetään toisen asteen termejä. Toisin sanoen, mallinnetaan sellainen käyrä, joka vastaa termeiltään toisen asteen käyrän yhtälöä (y = a + b 1 *x + b 2 *x 2 ). Myös tässä tilanteessa käytetään standardoituja muuttujia (ks. edellinen osio), jotta multikolineaarisuus olisi mahdollisimman pientä. Polynomisia termejä laskettaessa kerrotaan muuttuja itsensä kanssa eli x*x = x 2 (mikä on siis toisen asteen polynominen termi). Regressioanalyysin askeleet ovat seuraavat: Askel 1: Taustamuuttujat (tarvittaessa) Askel 2: X-muuttuja(t) Askel 3: Toisen asteen polynomiset termit Askel 4: Kolmannen asteen polynomiset termit (tarvittaessa, jos tutkitaan vielä monimutkaisempaa muuttujien välistä yhteyttä) 20

21 VARIANSSIANALYYSI ELI ANOVA Varianssianalyysi on yleisnimitys menetelmäperheelle, jossa yleiset vaatimukset ovat: Selitettävän (y) muuttujan tulee olla jatkuva muuttuja Selittäjien (x-muuttujat) tulee olla vähintään 2-luokkaisia kategorisia muuttujia Tämä kappale pitää sisällään yleisimmät varianssianalyysin versiot, mutta on mahdollista, että näitä perusmuotoja tarvitsee yhdistellä, jotta omaan tutkimuskysymykseen on mahdollista vastata. Yksisuuntainen varianssianalyysi Yksisuuntaisen varianssianalyysin avulla tutkitaan sitä, ovatko selitettävän muuttujan keskiarvot tilastollisesti merkitsevästi erisuuruisia selittävän muuttujan luokissa. Eli sekä y- että x-muuttujia on vain yksi. SPSS: 1. Analyze -> General Linear Model -> Univariate 2. Dependent Variable: y-muuttuja 3. Fixed Factor: x-muuttuja 4. Kun x-muuttujassa on enemmän kuin kaksi luokkaa, tarvitsee Post Hoc -välilehdeltä pyytää testaus: siirretään x-muuttuja oikeanpuoleiseen lokeroon ja valitaan testit -> Bonferroni ja Dunnett s T3 5. Options-välilehti: valitaan descriptive statistics, estimates of effect size ja homogeneity tests 6. OK Esimerkki: Tässä käydään läpi esimerkki iän (luokiteltu kolmeen luokkaan) ja työtyytyväisyyden välisestä yhteydestä. Kaikki tulosteen taulukot ovat tarpeellisia ja ne käydään seuraavaksi yksityiskohtaisesti läpi. 21

22 Tämä taulukko esittelee x-muuttujan luokat ja niiden koot. Tämä taulukko puolestaan näyttää y- muuttujan keskiarvot ja hajonnat x- muuttujan luokissa. Eli tässä työtyytyväisyyden keskiarvon kolmessa ikäluokassa. Näyttäisi siltä, että työtyytyväisyys kasvaa iän myötä. Tässä taulukossa on Levenen testi varianssien yhtäsuuruudelle. Tämän perusteella valitaan myöhemmin tarvittaessa post hoc -testi. Jos p >.05, niin taulukosta luetaan Bonferroni. Jos p <.05 luetaan Dunnett s T3. Nyt p =.334 >.05 Jos ikä osoittautuu merkitseväksi selittäjäksi, luetaan parivertailujen taulukosta vain Bonferroni-testauksen tulokset. 22

23 Tässä taulukossa on varsinaisen testaukset tulokset. Nyt iän vaikutuksen testaus on seuraava: F(2, 1174) = 11.77, p <.001, η 2 =.02. Toisin sanoen ikäryhmät erosivat toisistaan tilastollisesti merkitsevästi, mutta toisaalta ikä selitti vain 2 % työtyytyväisyyden vaihtelusta. Nyt tiedetään, että ikäryhmät erosivat toisistaan työtyytyväisyyden mukaan, mutta vielä ei tiedetä, miten ryhmät erosivat toisistaan. On mahdollista, että kaikki ryhmät erosivat toisistaan, mutta on yhtä hyvin mahdollista että vain kaksi ryhmää erosivat toisistaan. Tämä selviää parivertailuista eli post hoc -testeistä. Tässä taulukossa ovat parivertailut eli post hoc -testit. Vasemmasta reunasta nähdään, että testejä tehtiin kaksi erilaista: Bonferroni ja Dunnett T3. Kuten aikaisemmin jo selitettiin, Levenen testin tulos ratkaisee sen, kumpaa näistä luetaan. Tässä tapauksessa Levenen testi siis osoitti ryhmien varianssien olevan yhtä suuret (p >.05) ja siksi tästä taulukosta tarvitaan vain Bonferroni-tulokset. Taulukosta nähdään, että alle 35-vuotiaat ja vuotiaat p =.054 >.05 ei til. merk. eroa alle 35-vuotiaat ja yli 49-vuotiaat p =.000 <.05 til. merk. ero vuotiaat ja yli 49-vuotiaat p =.020 <.05 til. merk. ero 23

24 Johtopäätöksenä voimme siis todeta, että aineistossamme ikä oli yhteydessä raportoituun työtyytyväisyyteen siten, että alle 35-vuotiaiden ja vuotiaiden ryhmät arvioivat työtyytyväisyytensä matalammaksi kuin yli 49-vuotiaat. Kaksisuuntainen varianssianalyysi Kaksisuuntaisen varianssianalyysin avulla tutkitaan sitä, ovatko selitettävän muuttujan keskiarvot tilastollisesti merkitsevästi erisuuruisia kahden selittävän muuttujan luokissa. Eli analyysissa on mukana yksi y-muuttuja ja kaksi x-muuttujaa. Nyt voidaan myös tutkia, onko x-muuttujilla yhteisvaikutusta (eli interaktiota) suhteessa y-muuttujaan. Periaatteessa varianssianalyysissa voidaan käyttää useampaakin kuin kahta x-muuttujaa, mutta silloin mahdollisten yhteisvaikutusten määrä kuitenkin kasvaa suureksi, mikä tekee tulkinnan monimutkaisemmaksi. SPSS: 1. Analyze -> General Linear Model -> Univariate 2. Dependent Variable: y-muuttuja 3. Fixed Factor: x-muuttujat 4. Plots-välilehti: valitaan horizontal axis -kohtaan se muuttuja, jossa on enemmän luokkia; valitaan separate lines -kohtaan jäljelle jäänyt muuttuja; lisätään kuvio add-painikkeella 5. Kun jommassakummassa tai molemmissa x-muuttujissa on enemmän kuin kaksi luokkaa, tarvitsee Post Hoc -välilehdeltä pyytää testaus: siirretään x-muuttuja(t) oikeanpuoleiseen lokeroon ja valitaan testi -> Bonferroni 6. Options-välilehti: valitaan descriptive statistics, estimates of effect size ja homogeneity tests 7. OK Esimerkki: Tässä käydään läpi esimerkki iän (luokiteltu kolmeen luokkaan) ja sukupuolen yhteydestä työtyytyväisyyteen. Jälleen kaikki taulukot ovat tarpeellisia. 24

25 Nyt tämä taulukko näyttää luokat molempiin x-muuttujiin ja näiden luokkien koot. Tässä taulukossa on esitetty samaan aikaan kummatkin x-muuttujat. Eli alle 35-vuotiaat naiset, alle 35-vuotiaat miehet, vuotiaat naiset jne. Taulukossa on keskiarvot, hajonnat ja ryhmäkoot. Tässä kuvassa on edellisen taulukon keskiarvot havainnollisemmassa muodossa. Näyttäisi siltä, että iän ja sukupuolen välillä saattaisi olla interaktiovaikutus, sillä nuoremmissa luokissa naisten työtyytyväisyys on korkeampaa, mutta vanhimmassa ikäluokassa tilanne kääntyy toisin päin ja miehet ovat tyytyväisimpiä. 25

26 Tässä on Levenen testi varianssien yhtä suuruudelle edellisen kuvan kuudelle ryhmälle. Nyt p =.086 >.05 eli varianssit ovat yhtä suuria. Toisaalta, vaikka varianssit eivät olisi yhtä suuria, niin asia ei vaikuta mihinkään, koska post hoc -testiä ei voi suorittaa Dunnett T3:lla kuten 1-ANOVAssa oli mahdollista. Tästä taulukosta nähdään, että iän vaikutus on tilastollisesti merkitsevä, F(2, 1171) = 11.77, p <.001, η 2 =.02, mutta sen sijaan sukupuolen ei, F(1, 1171) = 0.26, p =.610, η 2 =.00. Myöskään yhdysvaikutus ei ole tilastollisesti merkitsevä, F(2, 1171) = 1.68, p =.186, η 2 =.00. Eli vaikka kuvio näytti, että yhdysvaikutus voisi olla olemassa, ei erot sitten kuitenkaan olleet riittävän suuria, jotta tilastollinen merkitsevyys olisi saavutettu. Iän parivertailut antavat samat tulokset kuin 1-ANOVAssakin. 26

27 Kovarianssianalyysi Kovarianssianalyysissa halutaan vakioida tai poistaa jonkin tai joidenkin muiden tekijöiden mahdollinen vaikutus tutkittuun ilmiöön (y-muuttujaan). Vakioitavan muuttujan tulee olla asteikoltaan kaksiluokkainen (esim. sukupuoli), järjestysasteikollinen (esim. koulutus) tai jatkuva (esim. ikä vuosina). SPSS: 1. Analyze -> General Linear Model -> Univariate 2. Dependent Variable: y-muuttuja 3. Fixed Factor: x-muuttujat 4. Covariate: kovariaatti 5. Plots-välilehti: valitaan horizontal axis -kohtaan se muuttuja, jossa on enemmän luokkia; valitaan separate lines -kohtaan jäljelle jäänyt muuttuja; lisätään kuvio add-painikkeella 6. Options-välilehti: 1. valitaan kaikki muuttujat vasemman puoleisesta laatikosta oikean puoleiseen laatikkoon, laitetaan ruksi kohtaan compare main effects ja pudotusvalikosta valitaan Bonferroni (tästä lisää ohjauksessa) 2. valitaan descriptive statistics, estimates of effect size ja homogeneity tests 7. OK Esimerkki: Jatketaan edellistä esimerkkiä. Edelleen ollaan siis kiinnostuneita siitä, miten ikä ja sukupuoli ovat yhteydessä työtyytyväisyyteen. Nyt kuitenkin halutaan vakioida/ottaa huomioon vastaajan taipumus optimistiseen ajatteluun. Taulukot Between-Subjects Factors, Descriptive Statistics ja Levene s Test of Equality of Error Variances tulkitaan kuten kaksisuuntaisen varianssianalyysin kohdalla. 27

28 Tästä taulukosta nähdään, että analyysissa kontrolloitu optimismi oli tilastollisesti merkitsevästi yhteydessä työtyytyväisyyteen, F(1, 1170) = , p <.001, η 2 =.11. Nyt ei sinällään olla kiinnostuneita siitä, miten yhteys näyttäytyi (esim. positiivinen vai negatiivinen yhteys) vaan nyt halutaan katsoa, miltä tulokset iän ja sukupuolen suhteen näyttävät, kun optimismi on vakioitu. Ikä on edelleen til. merk. selittäjä, joskin selitysaste putosi 1 %:iin. Sukupuoli ei ole vieläkään merkitsevä selittäjä. Sen sijaan interaktion (ikä * sukupuoli) kohdalla on tapahtunut muutos: nyt interaktio on til. merk., F(2, 1170) = 3.22, p =.041, η 2 =.01. Seuraavaksi katsotaan, miten erot ikäryhmissä esiintyivät ja millainen interaktio oli. Estimated Marginal Mean -otsikon alta löytyy tämä taulukko, jossa on laskettu työtyytyväisyyden keskiarvot ikäryhmittäin kun optimismi on otettu huomioon. Eli kyseessä ei ole enää sama raaka keskiarvo, jota analysoitiin edellisissä kahdessa esimerkissä. 28

29 Tässä seuraavassa taulukossa on Bonferroni-parivertailut ikäryhmien välillä. Taulukkoa tulkitaan samalla tavalla kuin 1-ANOVAssa. Myös lopputulos on sama: kaksi nuorempaa ikäryhmää eroaa vanhimmasta ikäryhmästä siten, että vanhemmat työntekijät raportoivat korkeampaa työtyytyväisyyttä kun optimismi on kontrolloitu. Tässä taulukossa on keskiarvot iän ja sukupuolen interaktiolle kun optimismi on otettu huomioon. Ja tässä sama kuvion muodossa: 29

30 Tämä kuvio osoittaa selvästi, miten tilastollisesti merkitsevä interaktio aineistossa esiintyy. Naisilla ikäryhmien väliset erot ovat hyvin pieniä, mutta sen sijaan miehillä erot ovat suuria: mitä vanhempi mies, sitä tyytyväisempi on omaan työhönsä. Nyt on huomattava, että valitettavasti SPSS ei tarjoa suoraan tämän enempää tietoa interaktiosta. Se ei siis laske, mitkä kuviossa havaittavat erot ovat tilastollisesti merkitseviä ja mitkä ei. Analyysia pitää siis vielä jatkaa. Vielä pitää selvittää 1 Miten ikäluokat eroavat naisten keskuudessa? 2 Miten ikäluokat eroavat miesten keskuudessa? 3 Miten naiset ja miehet eroavat alle 35-vuotiaiden keskuudessa? 4 Miten naiset ja miehet eroavat vuotiaiden keskuudessa? 5 Miten naiset ja miehet eroavat yli 49 -vuotiaiden keskuudessa? Ja koska tämä interaktio havaittiin vain, kun optimismi oli vakioitu, niin myös näissä jatkoanalyyseissa pitää vakioida optimismi. 30

31 Tehdään siis seuraavat kovarianssianalyysit: Selvitettävä Y-muuttuja X-muuttuja Kovariaatti Select cases kysymys 1 työtyytyväisyys ikäryhmät optimismi valitaan vain naiset 2 työtyytyväisyys ikäryhmät optimismi valitaan vain miehet 3 työtyytyväisyys sukupuoli optimismi valitaan vain alle 35-vuotiaat 4 työtyytyväisyys sukupuoli optimismi valitaan vain vuotiaat 5 työtyytyväisyys sukupuoli optimismi valitaan vain yli 49-vuotiaat Huom! Koska nyt tehdään monta analyysia samasta kuvasta, pitää saaduille p-arvoille tehdä vielä Bonferroni-korjaus eli kertoa p-arvot tehtyjen analyysien lukumäärällä (joka siis on tässä esimerkissä viisi). Select cases -valinta pitää tehdä aina ennen kovarianssianalyysiin menoa. Select cases tehdää seuraavasti: 1. Data -> Select cases 2. Valitaan If condition is satisfied 3. Painetaan If-painiketta 4. Valitaan laatikkoon aina kulloinenkin muuttuja ja määritetään oikea ehto: valitaan vain naiset -> gender3 = 1 valitaan vain miehet -> gender3 = 2 valitaan vain alle 35-vuotiaat -> age_classes = 1 valitaan vain alle vuotiaat -> age_classes = 2 valitaan vain yli 49-vuotiaat -> age_classes = 3 5. Continue ja ok 6. Suoritetaan kovarianssianalyysi. Nyt x-muuttujia on vain yksi, joten ei tarvita kuvaajaa eikä tietenkään mitään interaktioita enää tule. 7. Tulokset tulkitaan kuten edellä on opetettu. Esimerkissä saadut p-arvot pitää kertoa viidellä ja tällöin tehdystä viidestä tarkastelusta vain yksi p- arvo oli <.05. Toisin sanoen, miehien keskuudessa kaikki kolme ikäryhmää erosivat toisistaan tilastollisesti merkitsevästi. Muita eroja ei ilmennyt. 31

32 Monen y-muuttujan varianssianalyysi Jos tarkoituksena on tutkia useampaa riippuvaa muuttujaa ja nämä muuttujat ovat korreloituneita keskenään, on syytä valita analyysimenetelmäksi monen y-muuttujan varianssianalyysi, MANOVA. Analyysissa on siis useampi kuin yksi y-muuttuja. Selittäjiä voi olla yksi tai useampia. Lisäksi analyysiin on mahdollista lisätä kovariaatti/kovariaatteja. SPSS: 1. Analyze General Linear Model Multivariate 2. Dependent variables: y-muuttujat; Fixed factors: x-muuttuja(t); Covariates: kovariaatit, jos sellaisia on 3. Post hoc-testit ja Options-välilehden valinnat tehdään aivan kuten 1-ANOVAssa. (Jos sinun mallissa on useampi x-muuttuja, katso ohjeet 2-ANOVAsta. Jos sinulla on kovariaatteja, katso ohjeet kovarianssianalyysista.) 4. OK Esimerkki: Tässä esimerkki siitä, miten ikä (luokiteltu kolmeen luokkaan) on yhteydessä työtyytyväisyyteen, tarmokkuuteen ja uupumusasteiseen väsymykseen. Eli analyysissa on yksi x-muuttuja ja kolme y- muuttujaa. Useamman x-muuttujan ja kovariaattien tapauksessa yhdistetään tämän ohje aikaisempiin ohjeisiin. Tämä taulukko kertoo ryhmien koot. 32

33 Ja tässä taulukossa näkyy keskiarvot ja keskihajonnat kaikille kolmelle y-muuttujalle: työtyytyväisyys, tarmokkuus ja uupumusasteinen väsymys. Tämä taulukko kertoo, onko luokiteltu ikä yhteydessä näihin kolmeen y-muuttujaan kun niitä tarkastellaan yhtenäisenä könttinä. Luetaan age_class-osastoa ja sieltä riviä Pillai s Trace. Nyt siis MANOVAn tulos on: F(6, 2346) = 17.04, p <.001, η 2 =.04. Tästä nähdään, että ikäluokat selittävät yhteensä 4 prosenttia näiden kolmen selitettävän muuttujan vaihtelusta ja tämä on tilastollisesti merkitsevä tulos. Seuraavissa tulosteissa tarkastellaankin sitten jokaista y-muuttujaa erikseen eli siirrytään 1- ANOVAn tulosten tulkintaan. 33

34 Tässä Levenen testien tulokset. Kaikkien kolmen muuttujan kohdalla ryhmien varianssit ovat yhtä suuret, joten jatkossa luetaan Bonferroni-parivertailut. (Katso tarkemmat ohjeet 1-ANOVAn ohjeista.) Age_class-osastosta nähdään tulokset: Työtyytyväisyys, F(2, 1174) = 11.77, p <.001, η 2 =.02 34

35 Tarmokkuus, F(2, 1174) = 41.27, p <.001, η 2 =.07 Uupumusasteinen väsymys, F(2, 1174) = 4.50, p =.011, η 2 =.01 Toisin sanoen, ikäryhmät erosivat toisistaan arvioissaan työtyytyväisyydestä, tarmokkuudesta ja väsymyksestä. Selitysaste oli korkein tarmokkuuden kohdalla, 7 %. Työtyytyväisyydestä ikäryhmät selittivät vain 2 %:ia ja väsymyksestä 1 %:n. Mutta miten erot ilmenivät ikäryhmien välillä? Katsotaan tämä käyttäen apuna alun keskiarvo-taulukkoa ja alla olevaa parivertailut sisältävää taulukkoa. 35

36 Nyt siis luetaan vain Bonferroni-tulokset, koska ikäryhmien varianssit näissä ko. muuttujissa voitiin todeta yhtä suuriksi. Tulokset ovat: Alle 35-vuotiaat ja vuotiaat arvioivat työtyytyväisyytensä heikommaksi kuin yli 49-vuotiaat. Tarmokkuus kasvaa, mitä vanhemmasta ikäryhmästä on kyse eli kaikki kolme ikäryhmää eroavat toisistaan. Nuorin ikäryhmä raportoi enemmän väsymystä kuin vanhin ikäryhmä. MANOVAlla oli siis mahdollista tarkastella useampaa y-muuttujaa samaan aikaan ja varmistaa, että vaikka y-muuttujat ovat keskenään korreloituneita, niin silti x-muuttuja on niihin kaikkiin yhteydessä. Toistomittausten varianssianalyysi Toistomittausten varianssianalyysissa on kyse pitkittäisaineiston analysoinnista eli samoja henkilöitä on tutkittu vähintään kahtena eri ajankohtana tai erilaisissa tilanteissa. Yksinkertaisimmillaan tutkitaan vain yhtä muuttujaa kahtena ajankohtana/kahdessa eri tilanteessa. Analyysi muuttuu monimutkaisemmaksi, jos lisätään a) mittauskertoja, b) useampia tarkastelun kohteena olevia muuttujia, c) ryhmitteleviä muuttujia, d) kaikkia edellä mainittuja. Tarkastelun kohteena oleva muuttuja on asteikoltaan jatkuva. Ryhmittelevät tai luokittelevat muuttujat ovat kaksi- tai useampiluokkaisia kategorisia muuttujia. Kovariaatit ovat joko jatkuvia tai kaksiluokkaisia muuttujia. SPSS: 1. Analyze Genreal Linear Model Repeated Measures 2. Within-Subject Factor Name: nimeä within-tekijä, tässä aika Number of Levels: kuinka monta toistoa aineistossa on, tässä kolme Measure Name: nimeä halutessasi tarkastelun kohteena oleva ilmiö, tässä työtyytyväisyys Klikataan Define 3. Within-Subjects Variables: kiinnostuksen kohteena oleva muuttuja eri ajankohtina Between-Subjects Factor(s): mahdolliset luokittelevat muuttujat, esim. sukupuoli Covariates: mahdolliset kovariaatit 4. Plots: jos mukana on ryhmittelevä muuttuja, niin kuvan piirtäminen selkiyttää tilannetta Post Hoc: lasketaan, jos mukana on vähintään kolmiluokkainen ryhmittelevä muuttuja 36

37 Options: siirretään vasemassa laatikossa oleva(t) muuttuja(t) oikeanpuoleiseen laatikkoon, klikataan compare mean effects ja valitaan pudotusvalikosta bonferroni ; lisäksi valitaan Descriptive statistics, Estimates of effect size. Homogeneity tests valitaan jos mukana on ryhmittelevä muuttuja. 5. OK Esimerkki: Tässä esitellään nyt yksinkertainen tapaus, jossa työtyytyväisyyttä on tutkittu kolmena ajankohtana. Tässä analyysissa tulee paljon taulukoita, joista osaa ei tarvita lainkaan ja suurimmassa osassa on myös turhaa tietoa. Tässä käydään läpi ne taulukot, jotka ovat tarpeellisia esimerkin kaltaisessa tilanteessa. Tässä taulukossa on tarkastelun kohteena olevan muuttujan keskiarvot ja hajonnat kolmena eri ajankohtana. 37

38 Ylemmästä taulukosta nähdään ensin, että ns. sfäärisyysehto toteutuu kun p =.156 >.05. Tämän vuoksi alemmasta taulukosta luetaan nyt riviä Sphericity Assumed. Jos ylemmässä taulukossa p <.05, niin sitten alemmasta taulukosta luetaan riviä Greenhouse-Geisser. Alemmassa taulukossa on siis tulos kysymykseen Muuttuiko työtyytyväisyyden taso kolmen mittauskerran aikana?. Vastaus on ei, F(2, 988) = 2.15, p =.117, η 2 =.00. Nyt, koska vastaus on ei, analyysia ei ole enää tarvetta jatkaa. Jos muutosta olisi ollut, niin alla olevasta parivertailutaulukosta olisi nähty, minkä mittauskertoja välillä eroja oli. 38

39 LOGISTINEN REGRESSIOANALYYSI Logistinen regressioanalyysi soveltuu tilateisiin, joissa selitettävä muuttuja on luokiteltu. Jos muuttujan luokkia on kaksi, otetaan käyttöön binaarinen logistinen regressioanalyysi. Jos luokkia on enemmän kuin kaksi, niin käytetään multinomiaalista logistista regressioanalyysia. Lisäksi: Selittäjien (x-muuttujat) tulee olla kaksiluokkaisia, järjestysasteikollisia tai jatkuvia muuttujia Selittäjät eivät saisi korreloida vahvasti keskenään (r >.50) Binaarinen logistinen regressioanalyysi SPSS: 1. Analyze Regression Binary Logistic 2. Dependent: kaksiluokkainen y-muuttuja; Covariates: x-muuttujat (jatkuvia ja/tai kaksiluokkaisia); Huom! Voit laittaa x-muuttujia malliin mukaan askeltaen, aivan kuten lineaarisessa regressiossa. Jos mallissasi on taustamuuttujia (esim. sukupuoli, ikä), laita ne ensimmäisellä askeleella ja sitten toisella askeleella ns. varsinaiset selittäjät. 3. Categorical-välilehdelle pitää määritellä, mitkä x-muuttujista ovat kategorisia. Lisäksi tällä välilehdellä määritellään, kumpi kyseisen x-muuttujan luokista on ns. referenssikategoria. Oletusasetuksena on, että x-muuttujan jälkimmäistä luokkaa käytetään referenssikategoriana ja yleisesti ottaen tämä oletusasetus on ok. Tulosten tulkinnan yhteydessä käydään läpi, mitä tämä referenssikategoria tarkoittaa. 4. OK Esimerki: Esimerkkinä tällä kertaa toimii tutkimuskysymys Ovatko sukupuoli, ikä ja uupumusasteisen väsymyksen määrä yhteydessä työttömyysjaksojen puuttumiseen?. Muuttujat tässä analyysissa ovat siis seuraavat: 39

40 Y: Onko ollut työttömänä viimeisen viiden vuoden aikana? 1 = kyllä, 2 = ei X: Sukupuoli 1 = nainen, 2 = mies; Ikä (jatkuva); Väsymys (jatkuva) Ensimmäisellä askeleella malliin laitetaan sukupuoli ja ikä, ja toisella askeleella väsymys. SPSS tulostaa paljon taulukoita, joista tulosten ymmärtämiseen ja raportoimiseen tarvitaan vain muutamia. Nämä taulukot esitellään nyt. Tästä taulukosta voi vielä kerran tarkistaa, mitä malli oikein ennustaa, sillä malli ennustaa aina sitä luokkaa, joka saa tässä taulukossa arvon 1. Tässä esimerkissä siis malli ennustaa kuulumista luokkaan Ei ole kokenut työttömyyttä. Otsikon Block 1: Method = Enter alla on tuloksen analyysin ensimmäiselle askeleelle, jolla lisättiin sukupuoli ja ikä malliin mukaan. Tämä taulukko kertoo, onko rakennettu malli tilastollisesti merkitsevä. Step kuvaa tämän kyseisen askeleen merkitsevyyttä ja Model koko mallin merkitsevyyttä. Block-riviä tarvitaan, jos muuttujien lisäysmenetelmänä on ollut jokin muu kuin enter (mutta psykologiassa käytetään aina entermenetelmää). Nyt tämä lisätty askel on tilastollisesti merkitsevä, p <

41 Tämän taulukon Nagelkerke R Square kertoo mallin selitysasteen. Nyt ikä ja sukupuoli selittävät 8,7 %:ia siitä, miksei henkilö ole kokenut työttömyyttä. Ja tästä taulukosta nähdään, miten sukupuoli ja ikä sitten ovat yhteydessä siihen, miksei työttömyyttä ole koettu. Havaitaan ensimmäiseksi, että sekä sukupuolen että iän kohdalla p <.001 eli molemmat selittäjät ovat tilastollisesti merkitseviä. Sarake Exp(B) kertoo yhteyden suunnan; tätä lukua kutsutaan riskikertoimeksi. Muistetaan, että sukupuolen referenssikategoria oli jälkimmäinen luokka eli miehet ja riskikerroin sukupuolelle on 0,520. Tämä tarkoittaa, että naisten riski kuulua ryhmään ei ole kokenut työttömyyttä on 0,520-kertaa pienempi kuin miesten. Suomeksi sanottuna tämähän tarkoittaa, että miehillä on suurempi riski kuulua niihin, jotka eivät ole kokeneet työttömyyttä. Tulos olisi ollut helpompi lukea, jos sukupuolen referenssikategoriaksi olisikin valittu naiset. Tässä taulukko tämän muutoksen jälkeen: Nyt sukupuolen kohdalla riskikerroin on 1,923 ja tulkinta on suoraviivaisempi: miehillä on 1,923- kertainen riski kuulua niihin työntekijöihin, jotka eivät ole kokeneet työttömyyttä. Eli miehet ovat kokeneet vähemmän työttömyyttä kuin naiset. Iän kohdalla tulkinta on helpompaa, koska kyseessä on jatkuva muuttuja. Nyt iän riskikerroin on 1,056 ja tulkinta on: vuotta vanhemmalla työntekijällä on 1,056-kertainen riski kuulua heihin, 41

42 jotka eivät ole kokeneet työttömyyttä. Eli yleistäen vanhemmilla työntekijöillä on vähemmän työttömyyden kokemuksia kuin nuoremmilla. Seuraavalla askeleella (Block 2) lisättiin uupumusasteinen väsymys ja tulosteet näyttävät tältä: Ensimmäisestä taulukosta nähdään, että tämä askel ei ollut tilastollisesti merkitsevä, p =.531. Mallin selitysastekaan ei juuri muuttunut edellisestä askeleesta, nyt 8,8 %. Viimeinen taulukko puolestaan kertoo, että sukupuoli ja ikä ovat edelleen merkitseviä selittäjiä, mutta väsymys sen sijaan ei ole, p =.532. Tämän analyysin tuloksia raportoidessa kerrotaan yleensä selityaste, mallin merkitsevyys, selittäjien merkitsevyys ja riskikertoimet. Nämä raportoidaan siis jokaiselta askeleelta. Jos selittäjiä ei ole paljoa, taulukkoa ei tarvita. 42

43 Multinomiaalinen logistinen regressioanalyysi SPSS: 1. Analyze Regression Multinomial Logistic 2. Dependent: vähintään kolmiluokkainen y-muuttuja valitaan referenssikategoriaksi joku y-muuttujan luokista. Multinomiaalinen logistinen regressio (multinomial logistic regression) on tavallisen logistisen regressioanalyysin laajennus, jossa selitettävä muuttuja voi saada useampia kuin pelkästään kaksi vaihtoehtoa. Kuvitellaan esimerkiksi tilanne, jossa luokitteluasteikolla mitattu selitettävä muuttuja voi saada kolme eri vaihtoehtoa: A, B ja C. Multinomiaalisessa logistisessa regressioanalyysissa tutkitaan, mitkä tekijät vaikuttavat siihen, että vastaaja on valinnut tietyn vaihtoehdon suhteessa muihin vaihtoehtoihin. Käytännössä tämä tarkoittaa sitä, että tässä esimerkkitapauksessa tuloksena saadaan kolme erilaista mallia. Yhdessä verrataan vaihtoehdon A valintaa suhteessa vaihtoehtoon B, toisessa A:n valintaa suhteessa C:hen ja kolmannessa B:n valintaa suhteessa C:hen. ( 3. Factor(s): kaksi-luokkaiset selittävät muuttujat; Covariate(s): jatkuvat selittävät muuttujat; Huomaa että tässä analyysissa laitetaan yleensä kaikki selittäjät samalla askeleella. 4. OK Esimerkki: Esimerkkinä tällä kertaa toimii tutkimuskysymys Ovatko sukupuoli ja ikä ovat yhteydessä ammattiryhmään?. Muuttujat tässä analyysissa ovat siis seuraavat: Y: Ammattiryhmä? 1 = opetus ja tutkimus, 2 = tutkimus, 3 = avustava henkilökunta X: Sukupuoli 1 = nainen, 2 = mies; Ikä (jatkuva) Y-muuttujan referenssikategoriaksi on valittu opetus ja tutkimus. Jälleen SPSS tulostaa myös taulukoita, joita ei tarvita. Tässä esitellään tarvittavat taulukot. 43

44 Tästä taulukosta nähdään vielä y-muuttujan ja kategoristen x-muuttujien jakaumat. Tämä taulukko kertoo, onko nyt muodostettu malli tilastollisesti parempi kuin sellainen malli, jossa ei ole lainkaan selittäjiä. Nyt p <.001 eli nyt muodostettu malli selittää y-muuttujan vaihtelusta enemmän kuin malli ilman selittäjiä. Tämä taulukko kertoo mallin selitysasteen. Luetaan riviä Nagelkerke. Eli nyt muodostettu malli selittää 18,3 %:ia siitä, mihin ammattiryhmään vastaaja kuuluu. 44

45 Tämä taulukko kertoo sen, miten ikä ja sukupuoli ovat yhteydessä ammattiryhmään. Muistetaan, että opetusta ja tutkimusta tekevät ovat nyt referenssikategoriana. Nyt siis taulukossa verrataan aluksi pelkkää tutkimusta tekeviä tähän referenssikategoriaan. Huomataan, että ikä on merkitsevä selittäjä (p <.001) ja riskikerroin on 0,911 pelkkää tutkimusta tekevät ovat nuorempia kuin ne, joilla on sekä opetus että tutkimustehtäviä. Sukupuoli ei ole merkitsevä selittäjä (p =.126). Sitten taulukossa verrataan avustavaa henkilökuntaa ja referenssikategoriaa. Huomataan, että ikä ei ole merkitsevä selittäjä (p =.112). Sen sijaan sukupuoli on merkitsevä (p <.001) ja riskikerroin on 1,763 naiset kuuluvat miehiä todennäköisemmin avustavaan henkilökuntaan kun verrataan miesten ja naisten jakaumaa opetusta ja tutkimusta tekevään henkilöstöön. Tämä analyysi ei paljasta nyt mitään tutkimushenkilöstön ja avustavan henkilöstön välisestä suhteesta. Tätä varten pitäisi tehdä uusi analyysi, jossa y-muuttujan referenssikategoriaksi valittaisiin avustava henkilöstö. Ja tässä ko. analyysin tulos: 45

46 Mallin merkitsevyys ja selitysaste pysyvät siis samoina, joten niitä ei ole enää tarpeen raportoida toista kertaa. Tämän taulukon alemmasta osasta nähdään, että ikä on merkitsevä selittäjä kun verrataan tutkimushenkilöstä ja avustavaa henkilökuntaa (p <.001) ja riskikerroin on 0,921 tutkimushenkilöstö on nuorempaa. Myös sukupuoli on merkitsevä selittäjä (p =.040) ja riskikerroin on 0,720 naisia on vähemmän tutkimushenkilöstössä verrattuna avustavaan henkilökuntaan. 46

47 KATOANALYYSI Kun samoja vastaajia on seurattu kahden tai useamman ajankohdan verran, pitää tälle pitkittäisaineistolle tehdä katoanalyysi. Tällöin arvioidaan, voidaanko jollakin oman analyysin keskeisellä muuttujalla selittää sitä, mikseivät jotkut osallistuneet tutkimukseen kuin ensimmäisellä tutkimuskerralla. Katoanalyysia varten tarvitaan aineisto, jossa on mukana sekä ne, jotka vastasivat vain ensimmäisessä ajankohdassa ja ne, jotka vastasivat molemmissa ajankohdissa (tai useammassa, riippuen aineiston mittauskertojen määrästä). Katoanalyysiin otetaan mukaan ne muuttujat, joita on käyttänyt muissa gradun analyyseissa. Yleensä tämä tarkoittaa, että mukana on joitakin taustamuuttujia (esim. sukupuoli, ikä jne.) ja tutkimuksen ns. varsinaiset muuttujat (esim. työtyytyväisyys, tarmokkuus jne.). Katoanalyysi voidaan tehdä kahdella eri tavalla: 1) Jokainen muuttuja tarkastellaan erikseen suhteessa vastaajaryhmään (1 = vain eka mittauskerta, 2 = molemmat mittauskerrat) käyttämällä Khiin neliö -testiä tai riippumattomien otosten t-testiä riippuen muuttujan mittaustasosta. 2) Käytetään binaarista logistista regressioanalyysia, jossa ensimmäisellä askeleella malliin laitetaan taustamuuttujat ja toisella askeleella ns. varsinaiset muuttujat. Binaarisen logistisen regressioanalyysin ohjeet löytyvät learning-alustalta. Omassa gradussani toteutin katoanalyysin tuon ensimmäisen vaihtoehdon mukaisesti. Ja näin kirjoitin tulososioon: 47

48 Käsittääkseni kuitenkin nykyisin yleisempi ja suositellumpi tapa on käyttää binaarista logistista regressioanalyysia. Tässä näyte eräästä artikkelista (De Cuyper et al., 2012, s. 778): We first inspected the pattern of dropout between Time 1 and Time 2. From the 2137 respondents who participated at Time 1, 1314 participated also at T2. Hence, 823 respondents dropped out. We performed a logistic regression analysis to test whether participation at both times versus drop out after Time 1 (participation at Time 1 and Time 2 was 0; dropout between Time 1 and Time 2 was 1) was predicted by (i) organizational membership, occupational position, gender, contract type, and age in step 1; and (ii) PEE, job insecurity, and exhaustion at Time 1 in step 2. Chi-square for step 1 was significant, χ 2 (5) = 56.91, p <.001. Dropout was higher among respondents from University 1 than among respondents from University 2, OR = 1.73, p <.001, and lower among permanent compared with temporary workers, OR = 0.68, p <.001. Step 2 did not significantly contribute to the prediction of participation at Time 2 versus dropout, χ 2 (3) = 3.31, p =.35. This suggests that dropout was not significantly predicted by the core study variables. (Lähde: De Cuyper, N., Mäkikangas, A., Kinnunen, U., Mauno, S., & De Witte, H. (2012). Cross-lagged associations between perceived external employability, job insecurity, and exhaustion: Testing gain and loss spirals according to the Conservation of Resources Theory. Journal of Organizational Behavior, 33, doi: /job.1800) 48

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Usean selittävän muuttujan regressioanalyysi

Usean selittävän muuttujan regressioanalyysi Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen

Lisätiedot

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 Sisällysluettelo ALKUSANAT 4 ALKUSANAT E-KIRJA VERSIOON 5 SISÄLLYSLUETTELO 6 1 PERUSASIOITA JA AINEISTON SYÖTTÖ 8 11 PERUSNÄKYMÄ 8 12 AINEISTON SYÖTTÖ VERSIOSSA 9 8 Muuttujan määrittely versiossa 9 11

Lisätiedot

Tilastolliset ohjelmistot 805340A. Pinja Pikkuhookana

Tilastolliset ohjelmistot 805340A. Pinja Pikkuhookana Tilastolliset ohjelmistot 805340A Pinja Pikkuhookana Sisältö 1 SPSS 1.1 Yleistä 1.2 Aineiston syöttäminen 1.3 Aineistoon tutustuminen 1.4 Kuvien piirtäminen 1.5 Kuvien muokkaaminen 1.6 Aineistojen muokkaaminen

Lisätiedot

SPSS ohje. Metropolia Business School/ Pepe Vilpas

SPSS ohje. Metropolia Business School/ Pepe Vilpas 1 SPSS ohje Page 1. Perusteita 2 2. Frekvenssijakaumat 3 3. Muuttujan luokittelu 4 4. Kaaviot 5 5. Tunnusluvut 6 6. Tunnuslukujen vertailu ryhmissä 7 9. Ristiintaulukointi ja Chi-testi 8 10. Hajontakaavio

Lisätiedot

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla 4 Aineiston kuvaaminen numeerisesti 1 4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla Tarkastellaan lasten syntymäpainon frekvenssijakauman (kuva 1, oikea sarake) muodostamista Excel- ja SPSS-ohjelmalla.

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

, Määrälliset tutkimusmenetelmät 2 4 op

, Määrälliset tutkimusmenetelmät 2 4 op 6206209, Määrälliset tutkimusmenetelmät 2 4 op Jyrki Reunamo, Helsingin yliopisto, Opettajankoulutuslaitos 19.2.2015 1 Varianssianalyysi (Pallant 2007, Tähtinen & Isoaho 2001) Verrataan ryhmien keskiarvoja.

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle] Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen

Lisätiedot

Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1

Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1 Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1 Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta I Summamuuttujien muodostus Olemassa olevista muuttujista voidaan laskea

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...

Lisätiedot

HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET

HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET OHJELMAN KÄYNNISTÄMINEN Käynnistääksesi ohjelman valitse All Programs > > IBM SPSS Statistics 2x, tai käynnistä ohjelma työpöydän kuvakkeesta.

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta 4 Riippuvuus 1 Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta x 2 = sisaruksien luku- Tarkastellaan äidin ja lapsen pituuden välistä riippuvuutta havaintomatriisilla, joka on

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila Määrällisen aineiston esittämistapoja Aki Taanila 24.4.2017 1 Kategoriset muuttujat Lukumääriä Prosentteja (muista n-arvot) Pylväitä 2 Yhteenvetotaulukko (frekvenssitaulukko) TAULUKKO 1. Asunnon tyyppi

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. TEHTÄVÄ 1 Taulukko 1 Kuvailevat tunnusluvut pääkaupunkiseudun terveystutkimuksesta vuonna 2007 (n=941) Keskiarvo (keskihajonta) Ikä

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

Aki Taanila VARIANSSIANALYYSI

Aki Taanila VARIANSSIANALYYSI Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen

Lisätiedot

Tilastomenetelmien lopputyö

Tilastomenetelmien lopputyö Tarja Heikkilä Tilastomenetelmien lopputyö Lopputyössä on esimerkkejä erilaisista tilastomenetelmistä. Datatiedosto Harjoitusdata.sav on muokattu tätä harjoitusta varten, joten se ei vastaa kaikkien muuttujien

Lisätiedot

MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN MUUTTUJIEN NORMAALISUUS. Statistics

MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN MUUTTUJIEN NORMAALISUUS. Statistics MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN 28.4.2016 MANNE KALLIO 2016 MUUTTUJIEN NORMAALISUUS : Frequencies Statistics Output: Skewness ja kurtosis -1 1 < 2 X std.error Skewnessin ja kurtosiksen

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

2. Aineiston kuvailua

2. Aineiston kuvailua 2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat: Yleistä Tilastoapu on Excelin sisällä toimiva apuohjelma, jonka avulla voit analysoida tilastoaineistoja. Tilastoapu toimii Excelin Windows-versioissa Excel 2007, Excel 2010 ja Excel 2013. Kun avaat Tilastoavun,

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Muuttujien määrittely

Muuttujien määrittely Tarja Heikkilä Muuttujien määrittely Määrittele muuttujat SPSS-ohjelmaan lomakkeen kysymyksistä. Harjoitusta varten lomakkeeseen on muokattu kysymyksiä kahdesta opiskelijoiden tekemästä Joupiskan rinneravintolaa

Lisätiedot

Frequencies. Frequency Table

Frequencies. Frequency Table GET FILE='C:\Documents and Settings\haukkala\My Documents\kvanti\kvanti_harjo'+ '_label.sav'. DATASET NAME DataSet WINDOW=FRONT. FREQUENCIES VARIABLES=koulv paino /ORDER= ANALYSIS. Frequencies [DataSet]

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

Aineistokoko ja voima-analyysi

Aineistokoko ja voima-analyysi TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Sisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

Sisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...

Lisätiedot

Lähijohtajuus ja työntekijän työuupumusja depressio-oireet selittävätkö johtajuuden piirteet myöhempää oireilua?

Lähijohtajuus ja työntekijän työuupumusja depressio-oireet selittävätkö johtajuuden piirteet myöhempää oireilua? Lähijohtajuus ja työntekijän työuupumusja depressio-oireet selittävätkö johtajuuden piirteet myöhempää oireilua? Kaisa Perko & Ulla Kinnunen Tampereen yliopisto Yhteiskunta- ja kulttuuritieteiden yksikkö

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Yhdessä vai erillään?

Yhdessä vai erillään? Yhdessä vai erillään? Parisuhteet elämänkulun ja Ikihyvä-hankkeen kymmenvuotisseurannan näkökulmasta Tiina Koskimäki Lahden Tutkijapraktikum, Palmenia, Helsingin yliopisto Lahden Tiedepäivä 27.11.2012

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi

Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi Ihminen ja tekniikka seminaari Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 5 Seuraava etappi Datan keruu alkanut 9.2.2005 2.välinäyttönä palautetaan aineisto SPSS-tiedostona 14.2. palaute tiedostosta

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

YLEISKUVA - Kysymykset

YLEISKUVA - Kysymykset INSIGHT Käyttöopas YLEISKUVA - Kysymykset 1. Insight - analysointityökalun käytön mahdollistamiseksi täytyy kyselyn raportti avata Beta - raportointityökalulla 1. Klikkaa Insight välilehteä raportilla

Lisätiedot

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Harjoitukset 2 : Monimuuttujaregressio (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 2 : Monimuuttujaregressio (Palautus 24.1.2017) Tämän harjoituskerran tarkoitus

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

SPSS OPAS. Metropolia Liiketalous

SPSS OPAS. Metropolia Liiketalous 1 Metropolia Liiketalous SPSS OPAS Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio 8 8.Korrelaatio

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Harjoitukset 4 : Paneelidata (Palautus )

Harjoitukset 4 : Paneelidata (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Teema 5: Ristiintaulukointi

Teema 5: Ristiintaulukointi Teema 5: Ristiintaulukointi Kahden (tai useamman) muuttujan ristiintaulukointi: aineiston analysoinnin ja tulosten esittämisen perusmenetelmä usein samat tiedot esitetään sekä taulukkona että kuvana mahdollisen

Lisätiedot

(Jos et ollut mukana viime viikolla, niin kopioi myös SPSS-havaintoaineistotiedostot Yritys2 ja neljän kunnan tiedot.)

(Jos et ollut mukana viime viikolla, niin kopioi myös SPSS-havaintoaineistotiedostot Yritys2 ja neljän kunnan tiedot.) Tilastollinen tietojenkäsittely / SPSS Harjoitus 2 Kopioi (ÄLÄ SIIS AVAA TIEDOSTOJA VIELÄ!) U-palvelimen hakemiston STAT2100 SPSS kansiosta Aineistoja harjoituksiin 2 tiedosto loputkunnat (SPSS-havaintoaineisto)

Lisätiedot

Sukupuolistereotypiat opettajien kokemina

Sukupuolistereotypiat opettajien kokemina Erilaiset oppijat yhteinen koulu -projekti Aulikki Etelälahti 23.8.6 Sukupuolistereotypiat opettajien kokemina Taustaa... 1 Arvioinnin kohderyhmä... 1 Arvioinnin mittaristo ja aineiston analysointi...

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Monivalintamuuttujien käsittely

Monivalintamuuttujien käsittely Tarja Heikkilä Monivalintamuuttujien käsittely Datatiedosto: Yhdistä.sav Yhdistetään SPSS-ohjelmalla samaan kysymykseen kuuluvat muuttujat. Esimerkkiin liittyvä kysymys ja muita vastaavia kysymyksiä on

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

Opinnäytetyön ja harjoitustöiden tekijöille

Opinnäytetyön ja harjoitustöiden tekijöille SPSS-OPAS Opinnäytetyön ja harjoitustöiden tekijöille Petri Kainulainen 15.5.2008 Iisalmen tulosalue Opas SISÄLTÖ 1 YLEISTÄ... 3 2 AINEISTON TALLENNUS... 3 3 MUUTTUJIEN MITTA-ASTEIKOT... 7 4 MUUTTUJIEN

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa

Lisätiedot

SEM1, työpaja 2 (12.10.2011)

SEM1, työpaja 2 (12.10.2011) SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):

Lisätiedot

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 Luento 2 Kuvailevat tilastolliset menetelmät Käytetyimmät tilastolliset menetelmät käyttäjäkokemuksen

Lisätiedot

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset) LIITE Vinkkejä lopputyön raportin laadintaan Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset) 1. Johdanto Kerro johdannossa lukijalle, mitä jatkossa

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5

Lisätiedot

4.2 Useampi selittävä muuttuja (kertausta)

4.2 Useampi selittävä muuttuja (kertausta) 14.2.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 14.2.2019 4.2 Useampi selittävä muuttuja (kertausta) Selittäjien lukumäärä k (k-ra) = + + + + Malliin liittyvät oletukset i ~ N(0, 2 ) ja i:t ovat

Lisätiedot

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä. Tehtävä 1 Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä Ei Hypoteesi ei ole hyvä tutkimushypoteesi, koska se on liian epämääräinen.

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

IBM SPSS Statistics 21 (= SPSS 21)

IBM SPSS Statistics 21 (= SPSS 21) Tarja Heikkilä IBM SPSS Statistics 21 (= SPSS 21) SPSS = Statistical Package for Social Sciences Ohjelman käynnistys Aloitusikkuna Päävalikot Työkalut Muuttujat (Variables) Tapaukset (Cases) Tyhjä datataulukko

Lisätiedot

Aki Taanila TILASTOLLINEN PÄÄTTELY

Aki Taanila TILASTOLLINEN PÄÄTTELY Aki Taanila TILASTOLLINEN PÄÄTTELY 17.6.2010 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 7 2.1 Normaalijakautuneisuuden testaaminen... 7 2.2 Keskiarvon luottamusväli...

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot