TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

Samankaltaiset tiedostot
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Luentotesti 3. Kun tutkimuksen kävelynopeustietoja analysoidaan, onko näiden tutkittavien aiheuttama kato

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastollisten aineistojen kerääminen ja mittaaminen

Sovellettu todennäköisyyslaskenta B

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI. LTKY012 Timo Törmäkangas Gerontologian tutkimuskeskus

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Sovellettu todennäköisyyslaskenta B

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Otannasta ja mittaamisesta

Osa 2: Otokset, otosjakaumat ja estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

tilastotieteen kertaus

Harjoitus 7: NCSS - Tilastollinen analyysi

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Väliestimointi (jatkoa) Heliövaara 1

Tilastollisen tutkimuksen vaiheet

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Teema 8: Parametrien estimointi ja luottamusvälit

pitkittäisaineistoissa

Tilastollinen aineisto Luottamusväli

pitkittäisaineistoissa

Sovellettu todennäköisyyslaskenta B

Estimointi. Vilkkumaa / Kuusinen 1

Testejä suhdeasteikollisille muuttujille

Ohjeita kvantitatiiviseen tutkimukseen

MTTTP1, luento KERTAUSTA

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Kvantitatiivisen aineiston analyysi

MTTTP1, luento KERTAUSTA

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Monitasomallit koulututkimuksessa

Parametrin estimointi ja bootstrap-otanta

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Kandidaatintutkielman aineistonhankinta ja analyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Testit laatueroasteikollisille muuttujille

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MONISTE 2 Kirjoittanut Elina Katainen

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

pisteet Frekvenssi frekvenssi Yhteensä

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

805306A Johdatus monimuuttujamenetelmiin, 5 op

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

HAVAITUT JA ODOTETUT FREKVENSSIT

Testit järjestysasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Mat Tilastollisen analyysin perusteet, kevät 2007

HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET

Tutkimustiedonhallinnan peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Kvantitatiiviset menetelmät

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Lohkoasetelmat. Kuusinen/Heliövaara 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Regressioanalyysi. Kuusinen/Heliövaara 1

Muuttujien määrittely

Matemaatikot ja tilastotieteilijät

Transkriptio:

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas

AINEISTON KERÄÄMINEN Tärkein vaihe tutkimuksen tekemisessä, koska mitatessa tulleita virheitä ei välttämättä voi huomata eikä niitä usein voi korjata analyysivaiheessa. Mittaajan tulisi pyrkiä siihen, että mittaluvut saadaan selville ilman vääristymiä. Jos käytetään useampaa mittaajaa, pitäisi pyrkiä siihen, että mittaustulokset eivät riipu siitä, kuka on mittaajana. Poikkeavat havainnot: pyritään jo mitattaessa selvittämään syitä sellaisille mittauksille, joissa havaittu mittaluku poikkeaa selkeästi muiden tutkittavien mittaluvuista.

OTANTA Kokonaistutkimus kuluttaa usein liikkaa resursseja (aikaa ja rahaa) ja on tehotonta, jos samoihin tuloksiin päästäisiin tutkimalla pienempi osa perusjoukkoa (otos). Tällöin voidaan harkita otantatutkimuksen tekemistä. Tavoitteena on, että otantatutkimuksella saadut tulokset olisivat samansuuntaiset kuin tulokset, jotka olisi saatu tutkimalla koko perusjoukko. Kun tutkittavat on poimittu otokseen otantamenetelmällä, tulokset ovat yleistettävissä perusjoukkoon. Satunnaistamisella pyritään siihen, että suhteellisen homogeenisen perusjoukon kaikilla alkioilla olisi yhtä suuri mahdollisuus päätyä otokseen kun satunnaisuus onnistuu, perusjoukon alkiot ovat oikeassa suhteessa edustettuina otoksessa ja matemaattisten menetelmien käyttö analyysissä on järkevää

Ei ole perusjoukon määrittävää ominaisuutta On perusjoukon määrittävä ominaisuus Alkio Havaintoyksikkö Perusjoukko Otanta Valikointi Otos Näyte Kokonaistutkimus: tutkimus kattaa koko perusjoukon Otantatutkimus: tutkimus kattaa (edustavan) osan perusjoukkoa

OTANTA Sopiva otantamenetelmä valitaan perusjoukon homogeenisuuden mukaan Suhteellisen homogeeninen perusjoukko: yksinkertainen satunnaisotanta tai systemaattinen otanta Perusjoukossa on homogeenisia alaryhmiä: ositettu otanta tai ryväsotanta Käytännössä otantaa varten muodostetaan otantakehys (engl. sampling frame), josta otos poimitaan jotain otantamenetelmää käyttäen. Kehyksen voi muodostaa esim. jokin rekisteri tai luettelo. Tässä käsittelemme aineistoja, joissa oletetaan käytetyn yksinkertaista satunnaisotantaa

OTOSKOKO Otoskoon määrittämiselle ei yksiselitteistä ohjetta, koska muuttujien informaatio, perusjoukot ja tutkimustilanteet ovat erilaisia. Vaaligallupit (Suomi): n = 1000 Yrityksen imagotutkimus (tietty alue): n = 150 300 Lääketieteellinen koe (koe-/kontrolliryhmä): n = 20 30 Jos tutkittavasta ilmiöstä on aikaisempaa tutkimustietoa, sopiva otoskoko voidaan määrittää matemaattisesti (eri menetelmille erilaiset laskukaavat) Vaikutuksen koko (effect size) Muuttujiin liittyvä hajontainformaatio (dispersion, variance) Merkitsevyystaso (significance level) Tehokkuus (power) Kokeellisessa asetelmassa testattaessa useampaa muuttujaa samanaikaisesti pitää muuttujien lukumäärä ottaa huomioon Jotta tulokset olisivat luotettavia, pitää otoskoon olla sitä suurempi, mitä heterogeenisempi perusjoukko on.

Marko: Aineisto: Kaksi ryhmää (koe ja kontrolli), liikuntainterventio Kolme muuttujaa: Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) Tutkimuskysymys: 1)Onko ryhmien keskiarvoissa eroa perusjoukossa? 2)Onko keskiarvoeroja itse arvioidun terveyden suhteen (hyvä / keskinkertainen / huono). Sari: Aineisto: Ryhmä naisia, tutkimus on osa geneettistä analyysia Kolme muuttujaa: Kehon painoindeksi (kg/m 2 ) Fyysinen aktiivisuus (MET, energiankulutus suhteessa lepotilaan) Kävelynopeus (m/s) Tutkimuskysymys: Onko painoindeksi riippuvainen fyysisen aktiivisuuden määrästä ja / tai kävelynopeudesta? Elina: Aineisto: Ryhmä satunnaisesti valittuja viidesluokkalaisia kolmesta koulusta Kaksi muuttujaa: Ruokavalio (vähärasvainen, vähälaktoosinen, normaali) Itse arvioitu terveys (hyvä / keskinkertainen / huono). Tutkimuskysymys: Riippuuko oma arvio terveyden tilasta ruokavaliosta? Mikä voisi olla sopiva otoskoko kullekin tutkimukselle?

YKSINKERTAINEN SATUNNAISOTANTA (YSO) 1. Määritetään otantakehys (N = 10) 1 2 3 4 5 6 7 8 9 10 2. Määritetään otoskoko n = 3 3. Valitaan otoskoon edellyttämä määrä satunnaislukuja 2 5 8 4. Poimitaan otokseen satunnaislukujen edustamat tutkittavat. 2 5 8

OTOSTAMISEEN LIITTYVIÄ ONGELMIA Otostamisen ongelmat liittyvä satunnaistamisen epäonnistumiseen Suurimpia ongelmia ovat kato ja harha Kadon ja harhan vaikutukset voivat olla haitallisia analyysitulosten kannalta

KATO (MISSING DATA, ATTRITION) Kun otostetuista havaintoyksiköistä saavutetaan (mitataan) vain osa, tarkoittaa kato sitä osaa tutkittavista tai mittauksista, jota ei saavutettu (mitattu). Teknisestä syystä kato on ongelmallista, koska se usein johtaa siihen, että havaintoyksikön muu mitattu aineisto joudutaan jättämään huomioimatta tai puuttuvien havaintoarvojen tilalle joudutaan tuottamaan arvioita näistä arvoista (imputointi) Jos puuttuvia havaintoja esiintyy satunnaisesti aineistossa, otoksesta saatavien tulosten ei pitäisi oleellisesti vääristyä käytössä on vain pienempi otos Tässä tapauksessa informaation puuttumisen sanotaan olevan vaikutuksetonta (non-informative) tutkimuksen tulosten suhteen. Jos kato on vaikutuksellista (informative), puuttuu aineistosta tällöin sellaisia havaintoja, joilla olisi vaikutusta tuloksiin. Tällöin puuttuvien havaintojen vaikutusta tuloksiin on yleensä vaikeampi arvioida.

KATO Katoa voidaan pyrkiä estämään erilaisin keinoin, esim. kyselyä suunniteltaessa: kysely laaditaan sopivan mittaiseksi: liian pitkä kysely ei motivoi tutkittavia kyselyyn osallistuvia voidaan motivoida sopivin keinoin (mm. luvataan palautetta tutkimuksen valmistuttua) valvotussa tilanteessa tulee antaa tarpeeksi aikaa vastata Jos kato on suurta ja resurssit sen sallivat, voi harkita uusintakyselyn suorittamista Tarkastellaan kadon vaikutusta tuloksiin myöhemmin tilastollisten tunnuslukujen yhteydessä

HARHA (BIAS) Tutkimuksen tulokset ovat harhaisia silloin, kun otoksesta saatavat tiedon ovat systemaattisesti vääristyneitä suhteessa perusjoukon tuloksiin Harhaa esiintyy yleensä kadon suhteen, jos kato johtaa satunnaistamisen epäonnistumiseen Valikointi Otoksesta puuttuu oleellisia ryhmiä Tärkeiden muuttujien puuttuminen Esim. kun tarkastellaan polvenojennusvoiman ja kehon rasvattoman painon välistä suhdetta ilman, että tunnetaan tutkittavien sukupuolta, tulokset kertovat usein enemmän sukupuolten eroista kuin em. muuttujien välisestä suhteesta Harhan tilanteessa kaikilla tutkittavilla ei ole ollut samaa todennäköisyyttä päätyä tutkimukseen Havaittua harhaa voi korjata esim. käyttämällä painokertoimia Jos harha johtuu kadosta, voi käyttää puuttuvan tiedon huomioivia analyysimenetelmiä

TUTKITTAVIEN LUKUMÄÄRIÄ KOSKEVIA RAPORTOITAVIA TUNNUSLUKUJA Tutkimuksen kannalta keskeisiä kokoja ovat Perusjoukon koko Äärellinen / pieni; ääretön / suuri Määritetään tutkimuskysymyksen pohjalta Otoksen koko pyritään optimaaliseen kokoon suhteessa perusjoukkoon ja tutkimuskysymykseen Vastausprosentti / osallistumisaste pyritään mahdollisimman pieneen katoon

MATEMAATTISISTA MERKINNÖISTÄ TILASTOTIETEESSÄ Tilastollisissa kaavoissa käytetään erilaisia symboleja, joilla voi olla eri asiayhteydessä erilainen merkitys. Kiinnostuksen kohteena ovat yleensä parametrit, joiden arvoja estimoidaan otostiedon pohjalta Parametri on otosinformaatiota tiivistävä tunnusluku (esim. keskiarvo) Kaavoissa periaatteena on, että yksittäisiin lukuarvoihin viittaavilla symboleilla käytetään kursiivia. Parametrin yleissymboli theta: θ

MATEMAATTISISTA MERKINNÖISTÄ TILASTOTIETEESSÄ Muuttujat Mitattavaa muuttujaa merkitään isolla kirjaimella, esim. X Muuttujan saamia arvoja merkitään pienellä kirjaimella, esim. x Indeksien avulla viitataan muuttujan arvoihin otoksen eri havaintoyksiköillä, esim. muuttujan X havaintoarvo tapauksella viisi voidaan kuvata mm. näillä kahdella tavalla: x 5 tai x i, i = 5. Suurten aineistojen yhteydessä on helpompi kuvata tarvittavia laskutoimituksia symbolien avulla Tilastolliset tunnusluvut Perusjoukkoa koskevia tilastollisia tunnuslukuja merkitään kreikkalaisilla kirjaimilla (esim. perusjoukon keskiarvo: μ ) Otoksen tunnuslukuja merkitään pienillä länsimaisilla aakkosilla (esim. otoskeskiarvo: ) x

MATEMAATTISISTA MERKINNÖISTÄ TILASTOTIETEESSÄ Summaoperaattori Tilastollisissa kaavoissa yhteenlaskua merkitään kreikkalaisella isolla sigma-kirjaimella: Σ. Esim. Aineistossa on 10 henkilöä, joilta on mitattu muuttuja X (esim. kuukausipalkka). Perinteisesti muuttujan arvojen summaa merkitään: x 1 + x 2 + x 3 + x 4 + x 5 + x 6 + x 7 + x 8 + x 9 + x 10 Käyttämällä summaoperaattoria: 10 x i i= 1 Kaavaa luetaan niin, että sigma viittaa muuttujan arvojen, x, yhteenlaskua ja indeksillä i viitataan aineiston yksittäisiin tapauksiin. Sigman alla i = 1 tarkoittaa, että indeksi ensimmäiseksi arvoksi asetetaan 1. Tästä arvosta edetään kokonaislukuja (1,2,3, ) lisäten sigman päällä esitettyyn arvon 10 asti.

MATEMAATTISISTA MERKINNÖISTÄ TILASTOTIETEESSÄ Sulkujen käyttö: Ø Œº 10 i= 1 10 i= 1 Osasummat: 10 ( x /10) ø i + 5 = 1 2 10 œß x x = 5 x + 10 i i i= 1 i= 1 i= 6 5 i= 1 ( x /10 + x /10 +... + x /10) + 5 /( 10 + 5) = ( x1 + x2 +... x10) /15 i + 10 x ( x i + 5) + ( x i= 6 i i + 10)

MATEMAATTISISTA MERKINNÖISTÄ TILASTOTIETEESSÄ Lukujen esitystapoja Mm. SPSS-ohjelma antaa joskus tulosteissa lukuarvoja eksponenttimuodossa, jolloin esim. lukuarvo: 0,00000001304 tulostetaan muodossa: 1,304E-8, joka vastaa laskutoimitusta: 1,304 10-8. Englanninkielisessä kirjallisuudessa desimaalierottimena on piste, suomalaisessa tekstissä on tapana ollut käyttää pilkkua.

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

AINEISTON ESITTÄMINEN JA DATA- ANALYYSI Aineiston keruun jälkeen aineisto tallennetaan tietokoneelle esim. optisella lukijalla tai käsin syöttämällä Käsin syötettäessä koodaaja muuttaa lomakkeen tiedot sovittuun numeeriseen muotoon Diskreeteillä muuttujilla esim. kysymysten vastausvaihtoehdot numeroidaan järkevästi Jatkuvilla muuttujilla käytetään yleensä mittareiden tuottamia mittalukuja Puuttuva tieto merkitään jollain sovitulla puuttuvan tiedon koodilla, esim. -9, -1 tai jättämällä tyhjä kohta ko. arvon kenttään tiedostossa Puuttuvan tiedon koodina on arvo, jollaista muuttujalle ei ole muutoin määritelty Jos tiedetään syy, miksi tieto puuttuu voidaan käyttää eri koodeja: esim. sukupuolimuuttujalla 9: kieltäytyi osallistumasta, 8: ei tavoitettu, 7: kuollut

HAVAINTOMATRIISI Havaintoaineistojen esitysmuoto p kappaletta muuttujia (X 1,, X p ) n kappaletta havaintoyksiköitä (a 1,, a n ) Yleensä havaintoyksiköitä tulisi olla suurempi määrä kuin muuttujia (n > p) Matriisista nähdään jokaisen yksikön muuttujan arvot Muuttujat X 1 X 2 X p Havainto- a 1 x 11 x 12 x 1p yksiköt a 2 x 21 x 22 x 2p : : :. : : : :. : a n x n1 x n2 x np

HAVAINTOMATRIISI ESIMERKKI Asetelmapohjainen informaatio sisältyy usein koehenkilötunnukseen (ID) Esim. ensimmäinen numero: koulu, toinen numero: luokka, kolme seuraavaa: oppilas Muuttujat ID Ikä Pituus Paino Sukupuoli Havainto- 1 11001 62 165 74 1 yksiköt 2 11002 65 171 82 2 3 11003 72 162 65 1 4 12001-1 999 9 5 12002 58 172 68 2 6 25001 32 169 70 1

HAVAINTOMATRIISI Havaintomatriisin rivi sisältää yhden havaintoyksikön muuttujien arvot havaintoyksikön profiili (profile) Havaintomatriisin sarake sisältää yhden muuttujan saamat arvot havaintoyksiköillä muuttujan jakauma (distribution) Havaintomatriisin havainnollisuutta voidaan parantaa lajittelemalla aineisto nousevaan tai laskevaan järjestykseen (sort) tai ryhmittelemällä aineisto (split)

HAVAINTOMATRIISI SPSS-OHJELMASSA

HAVAINTOMATRIISI SPSS-OHJELMASSA

AINEISTON TARKASTELU JA MUOKKAUS AINA ennen varsinaista analyysia suoritetaan aineiston tarkastelu ja muokkaus, data-analyysi Tavoitteena: Aineiston laadun toteaminen ja valvonta Aineiston rakenteen tarkastelu ja muokkaus Muuttujien jakauman muoto Apua mallin ja hypoteesien määrittämiseen Tarkastuksia: Puuttuvien tietojen tarkistus (paikkaus) Loogisuuskorjaukset Virheellisten arvojen korjaus

TARKASTUKSIA Tarkastelua voidaan suorittaa ajamalla muuttujien jakaumat jakauman muoto poikkeavat tapaukset virheelliset arvot Voi käyttää myös tunnuslukuja Pienimmät ja suurimmat arvot (ovatko järkeviä) Keskiarvo (onko oikean tuntuinen) Korrelaatiokerroin (onko yhteys oikeansuuntainen) Jakaumaa kuvaavat graafit ovat hyödyllisiä: jatkuvat muuttujat: esim. histogrammi, diskreetit muuttujat: esim. pylväskuvio Kuviosta näkee suoraa mm. poikkeavat havainnot sekä myös havaintojen keskittymisen jonkun arvon ympärille

MUOKKAUKSIA Esim. diskreetti muuttuja, jossa on viisi luokkaa voidaan joutua teoreettisista tai käytännön syistä uudelleen luokittelemaan kolmeen luokkaan Lasketaan erilaisia summia Asteikot Esim. kroonisten sairauksien lukumäärä Lasketaan erilaisia kestoja (time-to-event) Muokataan muuttujan / muuttujien arvoja jonkun laskennallisen kaavan mukaan, esim. kehon painoindeksi (BMI)

VIRHELÄHTEITÄ TUTKIMUKSEN KULUESSA Suunnittelu -Valittiinko tutkimuksen kannalta oikeat mittarit? Koodaus - Koodattiinko vastaukset oikein? Aineiston muokkaus - Olivatko käytetyt muunnokset perusteltuja? Data-analyysi - Havaittiinko tärkeimmät ongelmat aineistossa? Analyysi - Valittiinko asianmukainen menetelmä?